arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

RAG / 检索增强生成

检索增强生成、向量检索、知识库问答和面向大模型的搜索系统。

今日/当前日期收录 4 信号源:cs.IR, cs.CL, cs.AI, cs.DB
2606.19692 2026-06-19 cs.CR cs.DB cs.IR 新提交 专题 90

When Global Gating Is Enough: Admission-Time Hubness Control in Anisotropic Vector Retrieval Systems

当全局门控足够:各向异性向量检索系统中的准入时间枢纽性控制

Prashant Kumar Pathak, Tarun Kumar Sharma

专题命中 向量检索 :针对RAG中向量枢纽性投毒风险提出准入时间控制方法

AI总结 针对检索增强生成中向量枢纽性引发的投毒风险,提出准入时间控制方法,通过哨兵查询评分隔离枢纽文档,全局门控在多个数据集上达到高召回率和低误报率。

2606.19803 2026-06-19 cs.DB cs.AI cs.LG 新提交 专题 85

Policy-aware Vector Search: A Vision for Fine Grained Access Control in Vector Databases

策略感知向量搜索:向量数据库中细粒度访问控制的愿景

Lakshmi Sahithi Yalamarthi, Primal Pappachan

专题命中 向量检索 :讨论向量数据库中的细粒度访问控制,与RAG系统相关。

AI总结 本文提出策略感知向量搜索的愿景,形式化向量数据库中的细粒度访问控制(FGAC)策略模型与实施问题,比较不同实施策略并指出未来挑战。

Comments Accepted at SeQureDB 26, Sigmod 2026

2606.19458 2026-06-19 cs.IR 新提交 专题 85

MonaVec: A Training-Free Embedded Vector Search Kernel for Edge and Offline AI Systems

MonaVec: 一种面向边缘和离线AI系统的免训练嵌入式向量搜索内核

Oğuzhan Yenen

专题命中 向量检索 :免训练嵌入式向量搜索内核,适用于边缘AI。

AI总结 提出MonaVec,一种无需训练、数据无关的嵌入式向量搜索内核,通过随机哈达玛变换和预计算Lloyd-Max量化实现4位压缩,在边缘和离线场景下提供确定性结果,支持单文件部署。

Comments 27 pages, 11 figures. Code and artifacts: https://github.com/mona-hq/monavec (PyPI: monavec; crates.io: monavec-core). Zenodo: doi:10.5281/zenodo.20559587

2606.09824 2026-06-19 cs.DB 版本更新 专题 60

TSseek: Regular Expression-Based Similarity Search for Distributed Time Series Datasets

TSseek: 基于正则表达式的分布式时间序列数据集相似性搜索

Xiaoshuai Li, Khalid Alnuaim, Mohamed Y. Eltabakh, Elke A. Rundensteiner

专题命中 向量检索 :时间序列相似性搜索,非传统RAG但涉及检索

AI总结 提出TSseek框架,通过正则表达式查询语言支持趋势、值范围和通配符模式搜索,并构建分布式空间索引TSseek-X实现高效精确匹配。

Comments Extended version with full ablation studies and additional experiments. v3 corrects bibliographic metadata for several references