arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

RAG / 检索增强生成

检索增强生成、向量检索、知识库问答和面向大模型的搜索系统。

今日/当前日期收录 8 信号源:cs.IR, cs.CL, cs.AI, cs.DB

1. 检索器 3 篇

2605.29517 2026-06-18 cs.IR 版本更新 专题 95

FLASH-MAXSIM: IO-Aware Fused Kernels for Late-Interaction Retrieval

FLASH-MAXSIM: 面向IO感知的融合内核用于晚期交互评分

Roi Pony, Daniel Ezer, Adi Raz Goldfarb, Idan Friedman, Oshri Naparstek, Udi Barzelay

专题命中 检索器 :提出Flash-MaxSim内核加速晚期交互检索,核心是检索器优化。

AI总结 提出Flash-MaxSim,一种IO感知的融合GPU内核,通过流式分块和片上SRAM折叠行最大规约,避免物化完整相似度张量,显著降低内存占用并加速晚期交互检索(如ColBERT、ColPali)的MaxSim评分。

2606.01697 2026-06-18 cs.CL 版本更新 专题 90

RCEM: Robust Conversational Search EMbedder in Distributional Shift

RCEM:配备查询重写技能的嵌入器,用于分布偏移下的鲁棒对话搜索

Kilho Son, Paul Hsu, Cha Zhang, Dinei Florencio

专题命中 检索器 :对话搜索嵌入器,结合LLM查询重写与检索

AI总结 提出RCEM模型,通过将LLM的查询重写能力蒸馏到嵌入模型中,实现无需显式重写的上下文感知检索,在分布偏移下提升鲁棒性。

2601.08554 2026-06-18 cs.SI cs.DB cs.GR 版本更新 专题 60

Maintaining Leiden Communities in Large Dynamic Graphs

维护大规模动态图中的 Leiden 社区

Chunxu Lin, Yumao Xie, Yixiang Fang, Yongmin Hu, Yingqian Hu, Cheng Chen

专题命中 检索器 :社区检测用于RAG的层次索引,但非核心

AI总结 针对现有动态 Leiden 算法在频繁更新下效率低的问题,提出 HIT-Leiden 算法,通过维护连通分量和层次社区结构减少受影响顶点范围,实现高达五个数量级的加速。

2. 知识库问答 5 篇

2602.06495 2026-06-18 cs.CR 版本更新 专题 85

Graphs Don't Stay Secret: Practical Subgraph Reconstruction Attacks on Defended Graph RAG

图并非保密:对防御图RAG的实用子图重构攻击

Minkyoo Song, Jaehan Kim, Myungchul Kang, Hanna Kim, Seungwon Shin, Sooel Son

专题命中 知识库问答 :图RAG子图重构攻击

AI总结 提出GRASP攻击,通过多轮查询从防御的图RAG系统中重构子图,达到82.9 F1,并评估防御措施。

2604.06967 2026-06-18 cs.CR cs.DB 版本更新 专题 70

VulLink: A Dynamic Open-Access Vulnerability Graph Database for Cybersecurity Data Mining

VulLink: 用于网络安全数据挖掘的动态开放访问漏洞图数据库

Luat Do, Jiao Yin, Jinli Cao, Hua Wang

专题命中 知识库问答 :漏洞图数据库,可视为知识库,与RAG弱相关

AI总结 提出VulLink,一种通过自动化ETL管道集成多源漏洞数据、提供图数据库、Web接口和API的动态开放平台,支持漏洞利用性预测等下游挖掘任务。

2603.29247 2026-06-18 cs.CL cs.AI cs.LG 版本更新 专题 70

MemRerank: Preference Memory for Personalized Product Reranking

MemRerank:用于个性化产品重排序的偏好记忆

Zhiyuan Peng, Xuyang Wu, Huaixiao Tou, Yi Fang, Yu Gong

专题命中 知识库问答 :偏好记忆用于LLM购物代理重排序,含检索

AI总结 提出MemRerank框架,通过强化学习将用户购买历史提炼为查询无关的偏好记忆,用于LLM购物代理的个性化重排序,在1-in-5选择任务中准确率提升高达10.61个百分点。

Comments correct author name in metadata

2603.00026 2026-06-18 cs.CL cs.AI cs.IR 版本更新 专题 70

ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents

ActMem:弥合LLM代理中记忆检索与推理之间的差距

Xiaohui Zhang, Zequn Sun, Chengyuan Yang, Yaqin Jin, Yazhong Zhang, Wei Hu

专题命中 知识库问答 :记忆管理涉及检索,但侧重推理

AI总结 提出ActMem框架,通过将非结构化对话历史转化为结构化因果语义图,结合反事实推理和常识补全,实现主动因果推理,显著提升LLM代理在复杂记忆依赖任务中的表现。

2601.14288 2026-06-18 astro-ph.CO cs.AI cs.CE gr-qc hep-th 版本更新 专题 60

DeepInflation: an AI agent for research and model discovery of inflation

DeepInflation:用于暴胀研究与模型发现的AI智能体

Ze-Yu Peng, Hao-Shi Yuan, Qi Lai, Jun-Qian Jiang, Gen Ye, Jun Zhang, Yun-Song Piao

专题命中 知识库问答 :集成RAG知识库提供理论背景

AI总结 提出基于多智能体架构的AI智能体DeepInflation,集成大语言模型、符号回归引擎和检索增强生成知识库,自动发现与最新观测一致的单场慢滚暴胀势,并解释理论背景。