AI 大模型

RAG / 检索增强生成

检索增强生成、向量检索、知识库问答和面向大模型的搜索系统。

今日/当前日期收录 5 篇信号源：cs.IR, cs.CL, cs.AI, cs.DB

1. 知识库问答 4 篇

2606.03367 2026-06-19 cs.IR 版本更新专题 85

自动化信息提取与检索用于工业备件池化

Dyuman Bulloni, Rocco Felici, Oliver Avram, Anna Valente

专题命中知识库问答：提出PhRAG混合检索增强生成框架用于备件检索。

AI总结提出PhRAG混合检索增强生成框架，通过命名实体识别结构化异构备件描述并构建虚拟库存池，结合生成式语言模型处理数据稀缺和查询变异性，实现可解释的备件检索。

URL PDF HTML

2605.26891 2026-06-19 cs.CL 版本更新专题 80

Telenor Nordics 客户服务自助语料库

Mike Riess

专题命中知识库问答：构建多语言客户服务语料库，支持RAG。

AI总结本文构建了一个包含芬兰语、丹麦语、挪威语和瑞典语的多语言客户服务自助语料库，共1122篇文档，用于支持北欧NLP和信息检索研究。

Comments 8 pages, 2 figures, 5 tables. Submitted to Nordic Machine Intelligence. Dataset: https://zenodo.org/records/19493152

URL PDF HTML

2605.27864 2026-06-19 cs.AI 版本更新专题 70

FundaPod: 一个具有知识图谱记忆的多角色智能体平台，用于AI辅助的基础投资研究

Di Zhu, Lei Nico Zheng, Zihan Chen

专题命中知识库问答：知识图谱记忆用于投资研究

AI总结提出FundaPod平台，通过多角色独立研究、知识图谱记忆和事后裁决机制，支持人类投资经理进行透明、可验证的基础投资决策。

Comments 32 pages; 12 figures

URL PDF HTML

2507.00875 2026-06-19 cs.CL cs.HC cs.MA 版本更新专题 70

TransLaw：模拟香港判例法专业翻译的大规模数据集与多智能体基准

Xi Xuan, Chunyu Kit

专题命中知识库问答：集成法律词汇库和检索增强生成

AI总结针对香港判例法英译中资源匮乏、法律术语和格式要求严格的问题，构建了首个大规模句对齐平行语料库HKCFA Judgment 97-22，并提出多智能体框架TransLaw，通过分解翻译任务、集成法律词汇库和检索增强生成，显著提升翻译质量，但仍未达到人类专家的风格自然度。

Comments Accepted at ICML 2026 - AI for Law

URL PDF HTML

2606.09824 2026-06-19 cs.DB 版本更新专题 60

TSseek: 基于正则表达式的分布式时间序列数据集相似性搜索

Xiaoshuai Li, Khalid Alnuaim, Mohamed Y. Eltabakh, Elke A. Rundensteiner

专题命中向量检索：时间序列相似性搜索，非传统RAG但涉及检索

AI总结提出TSseek框架，通过正则表达式查询语言支持趋势、值范围和通配符模式搜索，并构建分布式空间索引TSseek-X实现高效精确匹配。

Comments Extended version with full ablation studies and additional experiments. v3 corrects bibliographic metadata for several references

URL PDF HTML