Stellar: Scalable Multimodal Document Retrieval for Natural Language Queries
Stellar:面向自然语言查询的可扩展多模态文档检索
专题命中 检索器 :提出Stellar框架实现可扩展多模态文档检索
AI总结 提出Stellar框架,通过磁盘存储令牌级文档嵌入并动态加载候选嵌入,结合词汇表示过滤和高效磁盘支持的后交互,在保持检索效果的同时将内存开销和查询延迟降低1-2个数量级。
AI 大模型
检索增强生成、向量检索、知识库问答和面向大模型的搜索系统。
Stellar:面向自然语言查询的可扩展多模态文档检索
专题命中 检索器 :提出Stellar框架实现可扩展多模态文档检索
AI总结 提出Stellar框架,通过磁盘存储令牌级文档嵌入并动态加载候选嵌入,结合词汇表示过滤和高效磁盘支持的后交互,在保持检索效果的同时将内存开销和查询延迟降低1-2个数量级。
缩小语义缓存中的校准差距
发表机构 * New York University(纽约大学) ; Redis(Redis公司)
专题命中 检索器 :研究语义缓存系统的校准问题,提出新指标。
AI总结 针对语义缓存系统中离线指标与部署性能的差距,提出P-CHR AUC和CRR指标,发现校准差距由训练目标主导,模型选择本质是校准问题。
Comments 23 pages, 2 figures. Source code: https://github.com/aditeyabaral/calibration-gap-semantic-caching ; Models and Datasets: https://huggingface.co/redis
流式工具使用何时有帮助?表征流式检索增强生成中的工具意图稳定化
发表机构 * SMG Labs(SMG实验室)
专题命中 检索器 :流式RAG中工具意图稳定化分析。
AI总结 通过测量工具意图稳定化(即推测查询收敛到答案的时间点),在CRAG基准上分析流式RAG的延迟隐藏效果,发现73.9%的查询可实现显著延迟隐藏,并识别早期与晚期稳定化的预测因素。
生成式引擎优化规模化:衡量AI搜索引擎中的品牌可见性
发表机构 * Ranqo
专题命中 检索器 :研究AI搜索引擎中品牌可见性,涉及检索和引用机制。
AI总结 本研究通过分析10万+提示响应,提出衡量AI搜索引擎中品牌可见性的方法,发现品牌成熟度形成三级阶梯,并识别出最受引用的内容格式和情感不稳定性。
Comments 14 pages, 4 tables; v1.0 preprint
面向过滤近似最近邻搜索的查询感知路由
专题命中 检索器 :过滤近似最近邻搜索,核心RAG技术。
AI总结 提出查询感知路由框架,通过轻量级ML模型预测各候选方法的召回率,结合离线基准表选择最佳召回-QPS权衡,在五个未见数据集上达到SOTA性能。
Comments 12 pages
CacheWeaver:面向高效接地RAG推理的缓存感知证据排序
发表机构 * Heinz College of Information Systems and Public Policy, Carnegie Mellon University(卡内基梅隆大学海因茨信息系统与公共政策学院)
专题命中 检索器 :缓存感知证据排序降低RAG推理首令牌延迟
AI总结 提出CacheWeaver,一种轻量级提示层方法,通过缓存感知的证据排序降低RAG推理的首令牌延迟,无需修改服务引擎或证据集。
PACMS: 作为LLM代理可插拔引擎的子模上下文选择
专题命中 检索器 :提出子模上下文选择方法,优化LLM代理的上下文。
AI总结 提出PACMS,一种基于子模函数最大化的上下文选择方法,在提示组装时按相关性从会话、记忆和工具输出中挑选内容,替代截断机制,提升长对话中的信息保持能力。
多智能体交互记忆
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; University of California, Berkeley(加州大学伯克利分校)
专题命中 检索器 :扩展RAG到智能体生成轨迹的检索与复用。
AI总结 提出MATM框架,通过共享存储和检索智能体轨迹,实现异构智能体群体间的知识复用,提升下游任务性能并减少交互步骤。
对Nature Portfolio元分析文章进行LLM代理基准测试
发表机构 * Tsinghua University(清华大学)
专题命中 检索器 :包含检索和RAG变体的基准测试
AI总结 提出MetaSyn数据集,包含442篇专家策划的元分析,用于评估LLM代理在检索-筛选-综合全流程中的表现,发现当前系统在筛选阶段存在严重瓶颈。
Comments 13 pages, 7 figures, preprint for arXiv, dataset and code available at https://github.com/BFTree/MetaSyn
ScholarQuest:开放文献环境中智能学术论文搜索的基于分类法的基准测试
发表机构 * State Key Lab of Cognitive Intelligence, University of Science and Technology of China(中国科学技术大学认知智能国家重点实验室)
专题命中 检索器 :学术论文搜索基准,涉及检索
AI总结 提出ScholarQuest基准,基于1000多个计算机科学主题和四种研究意图,构建可扩展的答案和共享检索后端,评估LLM智能体在开放文献环境中的学术论文搜索能力。
结构化与分词化分布式用户兴趣上下文以支持生成式推荐
发表机构 * University of Illinois Urbana--Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Meta MRS
专题命中 检索器 :使用图建模和语义分词进行上下文建模。
AI总结 提出G2Rec框架,通过统一图建模与语义分词,实现工业级生成式推荐中用户兴趣上下文的全面准确建模。