RAG / 检索增强生成

2606.19396 2026-06-19 q-bio.QM 新提交专题 90

BioHarness: Substrate-Aware Evidence Assembly for Biomedical Question Answering across Literature, Knowledge Bases, and Biological Atlases

BioHarness：面向生物医学问答的底物感知证据组装——跨文献、知识库和生物图谱

Meng Xiao, Chuan Qin, Jinmiao Chen, Yihang Cheng, Yuanchun Zhou, Hengshu Zhu

专题命中知识库问答：生物医学问答中跨文献、知识库和生物图谱的证据组装

AI总结提出BioHarness，通过级联控制机制在文献检索、知识库和生物图谱间选择性组装证据，提升生物医学问答准确率，在19,302个问答项上得分从65.9提升至71.0。

Comments 14 Pages, 11 Figures, Keywords: biomedical question answering; retrieval-augmented generation; large language models; evidence assembly; biomedical knowledge bases; biological atlases

URL PDF HTML

2606.20359 2026-06-19 cs.LG 新提交专题 90

Train, Retrieve, or Both? A Four-Arm Head-to-Head for Correct Statutory Citation on the Ontario Residential Tenancies Act

训练、检索，还是两者兼用？针对安大略省住宅租赁法的正确法定引用的四组头对头比较

Ali Asaria, Tony Salomone, Deep Gandhi

专题命中知识库问答：SFT+RAG混合模型用于法律条文引用

AI总结研究自诉租户、房东和帮助台工作人员如何获得正确的法定引用，通过四组实验比较微调、检索及混合方法，发现SFT+RAG混合模型在精确匹配上得分最高且无幻觉引用。

URL PDF HTML

2606.19602 2026-06-19 cs.AI 新提交专题 90

Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why

可配置的临床信息提取与智能体RAG：什么有效、什么失效及原因

Osman Alperen Çinar-Koraş, Marie Bauer, Sameh Khattab, Merlin Engelke, Moon Kim, Stephan Settelmeier, Shigeyasu Sugawara, Fabian Freisleben, Felix Nensa, Jens Kleesiek

专题命中知识库问答：提出ACIE系统，基于智能体RAG进行临床信息提取

AI总结针对临床文档元数据缺失问题，提出基于智能体RAG的ACIE系统，在埃森大学医学中心部署，通过完整患者上下文推理和源引用验证，在7326次临床判断中实现96.5%的提取接受率。

URL PDF HTML

2606.20041 2026-06-19 econ.GN cs.AI cs.LG q-fin.EC q-fin.GN 新提交专题 80

AI Economist Agent: An Agentic Framework for Model-Grounded Economic Analysis with RAG, Knowledge Graphs, and Large Language Models

AI经济学家代理：一种基于模型的经济分析代理框架，结合RAG、知识图谱和大语言模型

Masahiro Kato

专题命中知识库问答：基于RAG的经济分析，检索证据并生成报告

AI总结提出一种基于RAG的AI经济学家代理框架，利用知识图谱和大语言模型进行经济情景分析，通过代理规划、检索证据、选择模型并生成报告，提高经济叙事的连贯性和可追溯性。

URL PDF HTML

2606.20369 2026-06-19 cs.CL 新提交专题 80

CATCH-ME if you RAG: a dataset of Contextually Annotated multi-Turn Counterspeech against Hate and Misinformation Exchanges

CATCH-ME if you RAG：针对仇恨与虚假信息交流的上下文注释多轮对抗言论数据集

Helena Bonaldi, Genoveffa Martone, Marco Guerini

专题命中知识库问答：数据集用于RAG系统训练对抗言论模型

AI总结提出首个大规模、专家策划的多语言对话数据集，覆盖仇恨与虚假信息重叠问题，包含事实核查锚定和跨度标注，支持RAG系统训练更可信的对抗言论模型。

URL PDF HTML

2606.19598 2026-06-19 cs.RO 新提交专题 80

Fail-RAG : A Retrieval Augmented Generation Informed Framework for Robot Failure Identification

Fail-RAG：一种基于检索增强生成的机器人故障识别框架

Ameya Salvi, Jie Hu

专题命中知识库问答：提出Fail-RAG框架，利用RAG检测机器人故障

AI总结提出Fail-RAG框架，利用检索增强生成和视觉语言模型，通过嵌入故障图像和上下文信息并查询数据库，实现机器人操作故障的高效检测，在仓库自动化任务中平均检测准确率提升25个百分点。

URL PDF HTML

2606.19847 2026-06-19 cs.CL 新提交专题 70

AtomMem: Building Simple and Effective Memory System for LLM Agents via Atomic Facts

AtomMem: 通过原子事实构建简单有效的LLM智能体记忆系统

Yanyu Yao, Shangze Li, Zhi Zheng, Hui Zheng, Qi Liu, Tong Xu, Enhong Chen

专题命中知识库问答：涉及事实提取和层次化事件结构，用于记忆检索。

AI总结针对现有记忆系统存储粗粒度、更新不稳定的问题，提出AtomMem，通过事实执行器提取高价值原子事实作为高效记忆表示，并组织为层次化事件结构和时间档案，实现价值密集存储和稳定演化，在LoCoMo基准上取得最优性能。

Comments 19 pages, 10 figures, 5 tables

URL PDF HTML

2606.19700 2026-06-19 cs.CL 新提交专题 70

TerraMARS: A Domain-Adapted Small-Language-Model Pipeline for Mars Terraforming Literature

TerraMARS: 用于火星地球化改造文献的领域自适应小语言模型管道

Jyotsna Singh, Ash Black, Jeff Larsen, Scott R. Saleska

专题命中知识库问答：结合检索和分块框架进行信息提取。

AI总结提出TerraMARS管道，结合领域自适应小语言模型，从火星科学文献中提取结构化信息，支持地球化改造研究。

Comments 16 pages, 1 figure, 4 tables

URL PDF HTML

2606.19960 2026-06-19 cs.IR 新提交专题 90

Stellar: Scalable Multimodal Document Retrieval for Natural Language Queries

Stellar：面向自然语言查询的可扩展多模态文档检索

Yuxiang Guo, Zhonghao Hu, Yuren Mao, Yuhang Liu, Congcong Ge, Xiaolu Zhang, Jun Zhou, Yunjun Gao

专题命中检索器：提出Stellar框架实现可扩展多模态文档检索

AI总结提出Stellar框架，通过磁盘存储令牌级文档嵌入并动态加载候选嵌入，结合词汇表示过滤和高效磁盘支持的后交互，在保持检索效果的同时将内存开销和查询延迟降低1-2个数量级。

URL PDF HTML

2606.19719 2026-06-19 cs.IR cs.CL cs.LG 新提交专题 90

Closing the Calibration Gap in Semantic Caching

缩小语义缓存中的校准差距

Aditeya Baral, Radoslav Ralev, Iliya Sotirov Zhechev, Srijith Rajamohan, Jen Agarwal

专题命中检索器：研究语义缓存系统的校准问题，提出新指标。

AI总结针对语义缓存系统中离线指标与部署性能的差距，提出P-CHR AUC和CRR指标，发现校准差距由训练目标主导，模型选择本质是校准问题。

Comments 23 pages, 2 figures. Source code: https://github.com/aditeyabaral/calibration-gap-semantic-caching ; Models and Datasets: https://huggingface.co/redis

URL PDF HTML

2606.20113 2026-06-19 cs.CL cs.IR 新提交专题 85

When Does Streaming Tool Use Help? Characterizing Tool-Intent Stabilization in Streaming Retrieval-Augmented Generation

流式工具使用何时有帮助？表征流式检索增强生成中的工具意图稳定化

Elroy Galbraith

专题命中检索器：流式RAG中工具意图稳定化分析。

AI总结通过测量工具意图稳定化（即推测查询收敛到答案的时间点），在CRAG基准上分析流式RAG的延迟隐藏效果，发现73.9%的查询可实现显著延迟隐藏，并识别早期与晚期稳定化的预测因素。

URL PDF HTML

2606.20065 2026-06-19 cs.IR cs.CL cs.CY 新提交专题 85

Generative Engine Optimization at Scale: Measuring Brand Visibility Across AI Search Engines

生成式引擎优化规模化：衡量AI搜索引擎中的品牌可见性

Pratyush Kumar

专题命中检索器：研究AI搜索引擎中品牌可见性，涉及检索和引用机制。

AI总结本研究通过分析10万+提示响应，提出衡量AI搜索引擎中品牌可见性的方法，发现品牌成熟度形成三级阶梯，并识别出最受引用的内容格式和情感不稳定性。

Comments 14 pages, 4 tables; v1.0 preprint

URL PDF HTML

2606.19898 2026-06-19 cs.DB cs.IR 新提交专题 85

Query-aware Routing for Filtered Approximate Nearest Neighbors Search

面向过滤近似最近邻搜索的查询感知路由

Qianqian Xiong, Mengxuan Zhang

专题命中检索器：过滤近似最近邻搜索，核心RAG技术。

AI总结提出查询感知路由框架，通过轻量级ML模型预测各候选方法的召回率，结合离线基准表选择最佳召回-QPS权衡，在五个未见数据集上达到SOTA性能。

Comments 12 pages

URL PDF HTML

2606.19667 2026-06-19 cs.CL 新提交专题 85

CacheWeaver: Cache-Aware Evidence Ordering for Efficient Grounded RAG Inference

CacheWeaver：面向高效接地RAG推理的缓存感知证据排序

Kaizhen Tan, Rong Gu, Mingyuan Li

专题命中检索器：缓存感知证据排序降低RAG推理首令牌延迟

AI总结提出CacheWeaver，一种轻量级提示层方法，通过缓存感知的证据排序降低RAG推理的首令牌延迟，无需修改服务引擎或证据集。

URL PDF HTML

2606.20047 2026-06-19 cs.IR 新提交专题 80

PACMS: Submodular Context Selection as a Pluggable Engine for LLM Agents

PACMS: 作为LLM代理可插拔引擎的子模上下文选择

Manu Ghulyani, Arunabh Singh, Karan Bharadwaj, Ankit Nath, Suranjan Goswami

专题命中检索器：提出子模上下文选择方法，优化LLM代理的上下文。

AI总结提出PACMS，一种基于子模函数最大化的上下文选择方法，在提示组装时按相关性从会话、记忆和工具输出中挑选内容，替代截断机制，提升长对话中的信息保持能力。

URL PDF HTML

2606.19911 2026-06-19 cs.AI cs.CL cs.IR 新提交专题 75

Multi-Agent Transactive Memory

多智能体交互记忆

To Eun Kim, Xuhong He, Dishank Jain, Ambuj Agrawal, Negar Arabzadeh, Fernando Diaz

专题命中检索器：扩展RAG到智能体生成轨迹的检索与复用。

AI总结提出MATM框架，通过共享存储和检索智能体轨迹，实现异构智能体群体间的知识复用，提升下游任务性能并减少交互步骤。

URL PDF HTML

2606.17041 2026-06-19 cs.CL cs.IR 新提交专题 75

Benchmarking LLM Agents on Meta-Analysis Articles from Nature Portfolio

对Nature Portfolio元分析文章进行LLM代理基准测试

Anzhe Xie, Weihang Su, Yujia Zhou, Yiqun Liu, Qingyao Ai

专题命中检索器：包含检索和RAG变体的基准测试

AI总结提出MetaSyn数据集，包含442篇专家策划的元分析，用于评估LLM代理在检索-筛选-综合全流程中的表现，发现当前系统在筛选阶段存在严重瓶颈。

Comments 13 pages, 7 figures, preprint for arXiv, dataset and code available at https://github.com/BFTree/MetaSyn

URL PDF HTML

2606.20235 2026-06-19 cs.IR cs.AI 新提交专题 70

ScholarQuest: A Taxonomy-Guided Benchmark for Agentic Academic Paper Search in Open Literature Environments

ScholarQuest：开放文献环境中智能学术论文搜索的基于分类法的基准测试

Tingyue Pan, Mingyue Cheng, Daoyu Wang, Yitong Zhou, Jie Ouyang, Qi Liu, Enhong Chen

专题命中检索器：学术论文搜索基准，涉及检索

AI总结提出ScholarQuest基准，基于1000多个计算机科学主题和四种研究意图，构建可扩展的答案和共享检索后端，评估LLM智能体在开放文献环境中的学术论文搜索能力。

URL PDF HTML

2606.20554 2026-06-19 cs.IR cs.AI 新提交专题 55

Structuring and Tokenizing Distributed User Interest Context for Generative Recommendation

结构化与分词化分布式用户兴趣上下文以支持生成式推荐

Ruizhong Qiu, Yinglong Xia, Dongqi Fu, Hanqing Zeng, Ren Chen, Xiangjun Fan, Hong Li, Hong Yan, Hanghang Tong

专题命中检索器：使用图建模和语义分词进行上下文建模。

AI总结提出G2Rec框架，通过统一图建模与语义分词，实现工业级生成式推荐中用户兴趣上下文的全面准确建模。

URL PDF HTML

2606.19692 2026-06-19 cs.CR cs.DB cs.IR 新提交专题 90

When Global Gating Is Enough: Admission-Time Hubness Control in Anisotropic Vector Retrieval Systems

当全局门控足够：各向异性向量检索系统中的准入时间枢纽性控制

Prashant Kumar Pathak, Tarun Kumar Sharma

专题命中向量检索：针对RAG中向量枢纽性投毒风险提出准入时间控制方法

AI总结针对检索增强生成中向量枢纽性引发的投毒风险，提出准入时间控制方法，通过哨兵查询评分隔离枢纽文档，全局门控在多个数据集上达到高召回率和低误报率。

URL PDF HTML

2606.19803 2026-06-19 cs.DB cs.AI cs.LG 新提交专题 85

Policy-aware Vector Search: A Vision for Fine Grained Access Control in Vector Databases

策略感知向量搜索：向量数据库中细粒度访问控制的愿景

Lakshmi Sahithi Yalamarthi, Primal Pappachan

专题命中向量检索：讨论向量数据库中的细粒度访问控制，与RAG系统相关。

AI总结本文提出策略感知向量搜索的愿景，形式化向量数据库中的细粒度访问控制（FGAC）策略模型与实施问题，比较不同实施策略并指出未来挑战。

Comments Accepted at SeQureDB 26, Sigmod 2026

URL PDF HTML

2606.19458 2026-06-19 cs.IR 新提交专题 85

MonaVec: A Training-Free Embedded Vector Search Kernel for Edge and Offline AI Systems

MonaVec: 一种面向边缘和离线AI系统的免训练嵌入式向量搜索内核

Oğuzhan Yenen

专题命中向量检索：免训练嵌入式向量搜索内核，适用于边缘AI。

AI总结提出MonaVec，一种无需训练、数据无关的嵌入式向量搜索内核，通过随机哈达玛变换和预计算Lloyd-Max量化实现4位压缩，在边缘和离线场景下提供确定性结果，支持单文件部署。

Comments 27 pages, 11 figures. Code and artifacts: https://github.com/mona-hq/monavec (PyPI: monavec; crates.io: monavec-core). Zenodo: doi:10.5281/zenodo.20559587

URL PDF HTML

1. 知识库问答 8 篇

BioHarness: Substrate-Aware Evidence Assembly for Biomedical Question Answering across Literature, Knowledge Bases, and Biological Atlases

Train, Retrieve, or Both? A Four-Arm Head-to-Head for Correct Statutory Citation on the Ontario Residential Tenancies Act

Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why

AI Economist Agent: An Agentic Framework for Model-Grounded Economic Analysis with RAG, Knowledge Graphs, and Large Language Models

CATCH-ME if you RAG: a dataset of Contextually Annotated multi-Turn Counterspeech against Hate and Misinformation Exchanges

Fail-RAG : A Retrieval Augmented Generation Informed Framework for Robot Failure Identification

AtomMem: Building Simple and Effective Memory System for LLM Agents via Atomic Facts

TerraMARS: A Domain-Adapted Small-Language-Model Pipeline for Mars Terraforming Literature

2. 检索器 11 篇

Stellar: Scalable Multimodal Document Retrieval for Natural Language Queries

Closing the Calibration Gap in Semantic Caching

When Does Streaming Tool Use Help? Characterizing Tool-Intent Stabilization in Streaming Retrieval-Augmented Generation

Generative Engine Optimization at Scale: Measuring Brand Visibility Across AI Search Engines

Query-aware Routing for Filtered Approximate Nearest Neighbors Search

CacheWeaver: Cache-Aware Evidence Ordering for Efficient Grounded RAG Inference

PACMS: Submodular Context Selection as a Pluggable Engine for LLM Agents

Multi-Agent Transactive Memory

Benchmarking LLM Agents on Meta-Analysis Articles from Nature Portfolio

ScholarQuest: A Taxonomy-Guided Benchmark for Agentic Academic Paper Search in Open Literature Environments

Structuring and Tokenizing Distributed User Interest Context for Generative Recommendation

3. 向量检索 3 篇

When Global Gating Is Enough: Admission-Time Hubness Control in Anisotropic Vector Retrieval Systems

Policy-aware Vector Search: A Vision for Fine Grained Access Control in Vector Databases

MonaVec: A Training-Free Embedded Vector Search Kernel for Edge and Offline AI Systems