arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

RAG / 检索增强生成

检索增强生成、向量检索、知识库问答和面向大模型的搜索系统。

今日/当前日期收录 21 信号源:cs.IR, cs.CL, cs.AI, cs.DB

1. 检索器 13 篇

2606.18508 2026-06-18 cs.CL cs.IR 新提交 专题 95

MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval

MCompassRAG:主题元数据作为段落级检索的语义指南针

Amirhossein Abaskohi, Raymond Li, Gaetano Cimino, Peter West, Giuseppe Carenini, Issam H. Laradji

专题命中 检索器 :提出主题元数据增强段落检索的RAG框架

AI总结 提出MCompassRAG框架,通过主题元数据增强段落表示,利用LLM蒸馏训练轻量检索器,实现主题感知检索,在六个基准上平均信息效率提升8.24%,延迟降低5倍以上。

2606.18781 2026-06-18 cs.CL 新提交 专题 90

Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation

迷失在单一向量中:通过分块证据聚合改进长文档检索

Shanshan Lyu, Yiwei Wang, Yujun Cai, Jiafeng Guo, Shenghua Liu

专题命中 检索器 :改进长文档检索,提出分块证据聚合策略。

AI总结 针对长文档检索中单向量编码削弱关键片段证据的问题,提出无训练的分块证据聚合策略DICE,通过独立编码分块并聚合为单一向量,在保持标准接口的同时显著提升检索性能。

Comments Code is available at https://github.com/PunchlineAAAA/DICE

2606.19037 2026-06-18 cs.IR 新提交 专题 85

Querit-Reranker: Training Compact Multilingual Rerankers via Efficient Label-Free Distribution Adaptation

Querit-Reranker: 通过高效无标签分布适应训练紧凑型多语言重排序器

Yunfei Zhong, Jun Yang, Wei Huang, Yinqiong Cai, Haosheng Qian, Yixing Fan, Ruqing Zhang, Lixin Su, Daiting Shi, Jiafeng Guo

专题命中 检索器 :多语言重排序器,用于检索增强。

AI总结 提出Querit-Reranker系列多语言交叉编码器重排序模型,采用数据驱动的无标签适应管道,通过合成查询挖掘和教师软标签进行分布适应,并利用球面线性插值合并检查点,在BEIR和MIRACL上显著提升nDCG@10,在MTEB多语言重排序上达到最优性能。

2606.18947 2026-06-18 cs.AI cs.CL cs.IR cs.MA 新提交 专题 85

Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents

将搜索与推理解耦:面向LLM Agent的供应商无关的接地架构

Emmanuel Aboah Boateng, Kyle MacDonald, Amardeep Kumar, Siddharth Kodwani, Sudeep Das

专题命中 检索器 :实现搜索接地与推理解耦,优化检索增强生成

AI总结 提出解耦搜索接地(DSG)架构,将搜索接地从推理模型中分离,通过MCP兼容网关实现供应商路由、缓存等控制,在降低成本和延迟的同时保持或提升准确性。

Comments 15 pages, Figure 8

2606.18811 2026-06-18 cs.IR cs.AI 新提交 专题 85

Rescaling MLM-Head for Neural Sparse Retrieval

重新缩放MLM头部用于神经稀疏检索

Youngjoon Jang, Seongtae Hong, Jonah Turner, Heuiseok Lim

专题命中 检索器 :改进SPLADE神经稀疏检索,属于检索器

AI总结 针对SPLADE中MLM头部尺度不匹配导致训练不稳定和性能下降的问题,提出初始化时对MLM头部投影进行常数因子重缩放,零成本提升训练稳定性,使大范数骨干网络成为有竞争力的稀疏检索器。

2606.18406 2026-06-18 cs.CL 新提交 专题 85

CoreMem: Riemannian Retrieval and Fisher-Guided Distillation for Long-Term Memory in Dialogue Agents

CoreMem: 对话代理中长期记忆的黎曼检索与Fisher引导蒸馏

Jiaqi Chen, Yongqin Zeng, Shaoshen Chen, Yijian Zhang, Hai-Tao Zheng, Chunxia Ma, XiuTeng Zhou

专题命中 检索器 :提出黎曼检索方法用于对话长期记忆

AI总结 提出CoreMem架构,用黎曼检索替代余弦相似度解决高维检索枢纽问题,通过Fisher引导离散令牌蒸馏实现原则性压缩,在8GB显存边缘设备上实现长期记忆对话代理。

Comments 15 pages, 5 figures

2606.18310 2026-06-18 cs.CR cs.AI 新提交 专题 85

Conflict-Aware Retriever Editing for Knowledge Injection Attacks on LLM-Based RAG Systems

冲突感知检索器编辑:针对基于LLM的RAG系统的知识注入攻击

Xinru Liu, Xianglong Zhang, Di Cai, Zhumin Chen, Pengfei Hu, Xin Xin

专题命中 检索器 :提出冲突感知检索器编辑攻击,注入恶意知识到RAG。

AI总结 提出冲突感知检索器编辑框架CAREATTACK,通过模型中心攻击将恶意知识注入RAG系统,利用图检测和参数编辑投影解决冲突,并轻量校准保持攻击效果。

2606.15345 2026-06-18 cs.CL cs.IR 新提交 专题 85

Beyond Monolingual Deep Research: Evaluating Agents and Retrievers with Cross-Lingual BrowseComp-Plus

超越单语言深度研究:用跨语言 BrowseComp-Plus 评估智能体和检索器

Yuheng Lu, Qingcheng Zeng, Heli Qi, Puxuan Yu, Fuheng Zhao, Rui Yang, Hitomi Yanaka, Naoto Yokoya, Weihao Xuan

专题命中 检索器 :评估跨语言检索和智能体性能

AI总结 提出跨语言基准 XBCP,评估深度研究智能体在证据语言与查询不同时的表现,发现检索和智能体端均存在显著性能下降。

Comments Preprint

2606.18801 2026-06-18 cs.IR cs.AI 新提交 专题 80

SHIFT: Semantic Harmonization via Index-side Feature Transformation for Multilingual Information Retrieval

SHIFT: 通过索引侧特征变换实现多语言信息检索的语义对齐

Youngjoon Jang, Seongtae Hong, Hyeonseok Moon, Heuiseok Lim

专题命中 检索器 :多语言密集检索,缓解语言偏差

AI总结 提出SHIFT方法,在索引阶段通过平行翻译对估计相对语言向量并修正文档嵌入,以缓解多语言密集检索中的语言偏差,无需训练即可提升检索性能。

2606.12837 2026-06-18 cs.CL 新提交 专题 75

LoHoSearch: Benchmarking Long-Horizon Search Agents Beyond the Human Difficulty Ceiling

LoHoSearch: 超越人类难度上限的长时域搜索代理基准测试

Jiarui Zhao, Rongzhi Zhang, Lingchuan Liu, Hao Yang, Xunliang Cai, Xi Su

专题命中 检索器 :基于知识图谱构建复杂搜索问题

AI总结 提出LoHoSearch基准,基于700万维基实体知识图谱自动构建544个复杂问题,评估显示最强模型仅34.74%准确率,远超人类难度上限。

2606.18814 2026-06-18 cs.IR 新提交 专题 70

LensKit-Auto

LensKit-Auto的改进与增强

Max Breit, Anass Amezian El Idrissi, Rishikesh Giriraj Kulkarni, Luca Quade

专题命中 检索器 :自动推荐系统框架,与检索相关但非RAG核心

AI总结 本文改进了LensKit-Auto框架,使其能自动寻找适合数据集的推荐算法和超参数组合,增强了易用性和可视化功能,并适配了最新版本的LensKit框架。

2606.18878 2026-06-18 cs.DS cs.DB cs.FL 新提交 专题 60

Tractable Gap-Constraint Languages for Complex Event Recognition

复杂事件识别的可处理间隙约束语言

Antoine Amarilli, Florin Manea, Tina Ringleb, Markus L. Schmid

专题命中 检索器 :研究子序列匹配与间隙约束,与复杂事件识别相关,但非核心RAG内容。

AI总结 研究带间隙约束的子序列匹配问题,提出左凸语言类,可在O(|D|(|u|+|C|))时间内求解,并用于复杂事件识别中的高效枚举。

Comments 50 pages

2606.18530 2026-06-18 cs.CR cs.CL cs.LG 新提交 专题 60

Evaluating Prompting-Based Defenses Against Domain-Camouflaged Injection Attacks

评估基于提示的防御策略对抗领域伪装注入攻击

Aaditya Pai

专题命中 检索器 :防御检索内容中的注入

AI总结 针对领域伪装注入攻击,评估五种基于提示的防御方法(如释义、重点标记等)在三个模型家族和三个部署领域中的有效性,发现释义法最有效,可将伪装攻击成功率降低55-84%。

Comments 9 pages, 4 figures, 4 tables; under review at the AdvML-Frontiers x CoTMA workshop, COLM 2026

2. 知识库问答 4 篇

2506.20869 2026-06-18 cs.SE cs.AI cs.IR 专题 95

Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation

为现实应用工程化RAG系统:设计、开发与评估

Md Toufique Hasan, Muhammad Waseem, Kai-Kristian Kemell, Ayman Asad Khan, Mika Saari, Pekka Abrahamsson

专题命中 知识库问答 :五个领域特定RAG系统的工程化实践

AI总结 本文介绍了五个领域特定的RAG应用,涵盖治理、网络安全、农业、工业研究和医疗诊断,通过多语言OCR、语义向量检索和领域适应LLM,评估六个维度并总结十二项关键经验教训。

Comments Published in the Proceedings of the 51st Euromicro Conference on Software Engineering and Advanced Applications, SEAA 2025. Lecture Notes in Computer Science, volume 16082, pages 143-158. Springer, 2026

Journal ref LNCS 16082, 143-158, 2026

2602.20135 2026-06-18 cs.CL cs.AI cs.IR 专题 80

KNIGHT: Knowledge Graph-Driven Multiple-Choice Question Generation with Adaptive Hardness Calibration

KNIGHT: 基于知识图谱的多选题生成与自适应难度校准

Mohammad Amanlou, Erfan Shafiee Moghaddam, Yasaman Amou Jafari, Mahdi Noori, Farhan Farsi, Behnam Bahrak

专题命中 知识库问答 :基于知识图谱生成多选题用于RAG评估

AI总结 KNIGHT通过构建领域特定知识图谱,实现高效生成多选题数据集,支持自适应难度控制,提升生成效率与质量,验证了其在多个领域内的有效性。

Comments Accepted at the Third Conference on Parsimony and Learning (CPAL 2026). 36 pages, 12 figures. (Equal contribution: Yasaman Amou Jafari and Mahdi Noori.)

Journal ref Conference on Parsimony and Learning, Proceedings of Machine Learning Research, 328:989-1024, 2026

2606.18385 2026-06-18 cs.AI 新提交 专题 70

CaVe-VLM-CoT: An Interpretable Vision-Language Model Framework

CaVe-VLM-CoT:一种可解释的视觉-语言模型框架

Sneha Rao, Shaina Raza, Dhanesh Ramachandram

专题命中 知识库问答 :采用检索增强生成实现证据推理

AI总结 提出CaVe-VLM-CoT框架,通过五阶段闭环流水线(提取器、检索器、求解器、引用注入器、验证器)实现证据推理,并引入CaVeScore复合指标评估检索质量、引用忠实度和跨模态基础,在ScienceQA和MMMU上取得性能提升。

2606.18850 2026-06-18 cs.CL cs.IR 新提交 专题 60

ScholarSum: Student-Teacher Abstractive Summarization via Knowledge Graph Reasoning and Reflective Refinement

ScholarSum:基于知识图谱推理与反思性精炼的师生式抽象摘要生成

Bohou Zhang, Xiaoyu Tao, Mingyue Cheng, Huijie Liu, Qi Liu

专题命中 知识库问答 :使用知识图谱推理,非传统RAG。

AI总结 提出ScholarSum框架,通过构建层次知识图谱引导学生生成初稿,并利用教师式审阅者迭代检查与修正,实现科学文献摘要的流畅性与事实一致性。

3. 长文档RAG 1 篇

2606.18381 2026-06-18 cs.CL cs.IR 新提交 专题 92

SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG

SproutRAG: 基于注意力引导的树搜索与渐进嵌入的长文档RAG

Amirhossein Abaskohi, Issam H. Laradji, Peter West, Giuseppe Carenini

专题命中 长文档RAG :提出注意力引导的层次化RAG框架,解决长文档检索粒度与上下文连贯性权衡。

AI总结 提出SproutRAG,通过注意力引导构建句子级分块树,实现多粒度检索,无需额外LLM调用,平均信息效率提升6.1%。

4. 向量检索 2 篇

2606.18497 2026-06-18 cs.CR 新提交 专题 85

Ghost Vectors: Soft-Deleted Embeddings Remain Reconstructible in HNSW Vector Databases

幽灵向量:HNSW向量数据库中软删除的嵌入仍然可重构

Chandranil Chakraborttii, Jackeline García Alvarado, Sitora Abdulofizova, Shivanshu Dwivedi

专题命中 向量检索 :HNSW向量数据库软删除的安全漏洞

AI总结 研究揭示HNSW向量数据库的软删除机制存在安全漏洞,被标记删除的向量仍可通过存储层恢复,并提出基于加密密钥轮换的防护方案。

Comments 13 pages, 5 figures, 12 tables. Prepared for submission

2606.18897 2026-06-18 cs.IR cs.AI 新提交 专题 70

SAERec: Constructing Fine-grained Interpretable Intents Priors via Sparse Autoencoders for Recommendation

SAERec:通过稀疏自编码器为推荐构建细粒度可解释意图先验

Jiangnan Xia, Xuansheng Wu, Yu Yang, Xin Wang, Ninghao Liu

专题命中 向量检索 :利用稀疏自编码器构建意图先验用于推荐

AI总结 提出SAERec模型,利用稀疏自编码器从大型语言模型文本嵌入中解耦出细粒度可解释意图,作为先验指导推荐,并通过多分支注意力机制融合个人与公共意图,提升推荐性能与可解释性。

5. 其他RAG 1 篇

2606.13681 2026-06-18 cs.CL 新提交 专题 70

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

EvoArena: 追踪记忆演化以构建动态环境中的鲁棒LLM智能体

Jundong Xu, Qingchuan Li, Jiaying Wu, Yihuai Lan, Shuyue Stella Li, Huichi Zhou, Bowen Jiang, Lei Wang, Jun Wang, Anh Tuan Luu, Caiming Xiong, Hae Won Park, Bryan Hooi, Zhiyuan Hu

专题命中 其他RAG :基于补丁的记忆范式用于环境演化推理

AI总结 提出EvoArena基准套件模拟终端、软件和社交领域的渐进环境变化,并设计基于补丁的记忆范式EvoMem记录结构化更新历史,使智能体能通过记忆变化推理环境演化,实验表明当前智能体在动态环境中表现不佳,EvoMem可稳定提升性能。