arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.14290 2026-05-15 cs.CR cs.AI cs.CL cs.SE

Web Agents Should Adopt the Plan-Then-Execute Paradigm

Julien Piet, Annabella Chow, Yiwei Hou, Muxi Lyu, Sylvie Venuto, Jinhao Zhu, Raluca Ada Popa, David Wagner

发表机构 * UC Berkeley（加州大学伯克利分校）

AI总结本文指出，当前基于ReAct架构的大型语言模型代理在处理网页任务时存在安全隐患，因为其在决策过程中直接使用未验证的网页内容，容易受到提示注入攻击。作者主张网页代理应采用“先规划后执行”的范式，即在观察网页内容前制定任务特定的执行计划，从而隔离不可信数据对控制流的影响。研究分析了WebArena基准，发现大多数任务可通过纯程序化规划完成，而无需运行时调用LLM子程序，并指出实现该范式的关键在于构建类型化、可审计的网页API接口，而非改进模型本身。

2605.14283 2026-05-15 cs.GT cs.AI cs.CR

Watermarking Game-Playing Agents in Perfect-Information Extensive-Form Games

Juho Kim, Fei Fang, Tuomas Sandholm

发表机构 * Strategic Machine, Inc.（战略机器公司）； Strategy Robot, Inc.（策略机器人公司）； Optimized Markets, Inc.（优化市场公司）

AI总结本文研究了在完全信息的扩展式博弈中对博弈策略进行水印的技术，旨在检测游戏代理是否未经授权地使用了AI工具。作者借鉴了大型语言模型的KGW水印方法，提出了一种适用于博弈代理的水印方案，并通过统计检验实现水印的检测。实验表明，水印对策略质量的影响可以忽略不计，且仅需少量对局即可有效检测水印。

2605.14276 2026-05-15 stat.ML cs.LG

Training-Free Generative Sampling via Moment-Matched Score Smoothing

Zhenyu Yao, Daniel Paulin

发表机构 * College of Computing and Data Science（计算与数据科学学院）； Nanyang Technological University（南洋理工大学）

AI总结本文提出了一种无需训练的生成采样方法MM-SOLD，通过矩匹配的得分平滑技术，直接从训练数据中估计目标分布的统计特性，并在采样过程中保持这些矩不变。该方法基于过阻尼朗之万动力学，能够在不训练神经网络的情况下实现高质量的样本生成，实验表明其在二维分布和图像生成任务中表现优异，具有计算高效、鲁棒性强的特点。

Comments 35 pages

2605.14228 2026-05-15 cs.HC cs.LG

Self-Regulated Learning in Essay Writing: Consistency of Strategies and Impact on Outcomes

Gloria Fernández-Nieto, Kiyoshige Garcés, Mladen Raković, Tongguang Li, Xinyu Li, Linxuan Zhao, Dragan Gašević

发表机构 * Department of Data Science & AI（数据科学与人工智能系）； Monash University（墨尔本大学）

AI总结本研究探讨了中学生在在线作文写作过程中如何运用自我调节学习（SRL）策略，以及这些策略随时间的变化和对学习成果的影响。研究通过分析哥伦比亚两所中学学生在两周内的在线写作过程数据，结合过程挖掘和无监督机器学习方法，识别出三种主要的SRL策略，并发现这些策略的使用存在显著差异，其中“先阅读后写作”的策略较为普遍，而“密集写作、选择性阅读”策略虽较少见，却与更好的学习成果相关。研究结果为在线学习支持系统的优化提供了重要参考。

Comments 16 pages, 4 figures, submitted to Journal of Computer Assisted Learning (JCAL) [Under Review]

2605.14224 2026-05-15 math.NA cs.AI cs.NA math.DS math.FA

Wavelet-Based Observables for Koopman Analysis: An Extended Dynamic Mode Decomposition Framework

Cankat Tilki, Serkan Gugercin

发表机构 * Department of Mathematics, Virginia Tech（弗吉尼亚理工大学数学系）

AI总结本文提出了一种基于小波变换的Koopman算子分析方法，通过引入小波基观测函数，证明其在特定Banach空间下是Koopman半群的特征函数。在此基础上，构建了Koopman半群及其预解算子的闭式表达，并结合扩展动态模态分解（EDMD）提出了一种新的小波动态模态分解算法（cWDMD），用于数值近似Koopman算子的作用。该方法在两个数值例子中得到了验证，展示了其理论有效性与应用潜力。

2605.14202 2026-05-15 cs.SE cs.AI

LLM-Based Robustness Testing of Microservice Applications: An Empirical Study

Hrushitha Goud Tigulla, Marco Vieira

发表机构 * College of Computing（计算学院）； Informatics University of North Carolina at Charlotte（北卡罗来纳大学夏洛特分校信息学院）； Charlotte, USA（美国夏洛特）

AI总结本文通过实证研究探讨了基于大语言模型（LLM）的微服务应用鲁棒性测试方法。研究针对不同架构的微服务系统，应用七种提示策略和三种开源LLM生成测试用例，发现提示策略对测试多样性的影响比模型规模更大。研究提出了两种新策略——Guided和GuidedFewShot，结合领域知识提升测试覆盖效果，其中GuidedFewShot在两个系统中均实现了较高的失败模式覆盖率，且保持了较低的模型间相似性。实验表明，仅依赖分类规则不足以引导LLM生成有效测试，具体示例对模型理解输入突变至关重要。

2605.14195 2026-05-15 cs.DS cs.LG

Stochastic Matching via Local Sparsification

Sara Ahmadian, Edith Cohen, Mohammad Roghani

发表机构 * Google Research（谷歌研究）

AI总结本文研究了在线随机匹配问题中的一种新场景，其中本地通信带宽而非匹配时机成为主要瓶颈。为此，作者提出了一种两阶段的本地稀疏化框架，要求每个请求在全局优化前将其兼容集合缩减到一个固定大小的预算。研究设计了一种基于期望实例分数解的本地选择策略，并理论证明在足够分散度下该方法能够近似保持最大匹配的期望规模。实验表明，即使在严格的本地预算限制下，该方法仍能实现接近最优的全局匹配效果，优于传统在线算法。

2605.13773 2026-05-15 cs.SE cs.AI cs.LO

(How) Do Large Language Models Understand High-Level Message Sequence Charts?

Mohammad Reza Mousavi

发表机构 * Department of Informatics, King's College London（伦敦国王学院信息学院）

AI总结本文研究了大型语言模型（LLMs）对高层消息序列图（HMSCs）形式语义的理解程度。通过让三种主流LLMs完成129项与HMSC语义相关的任务，发现它们对基本语义概念的理解较好，但在涉及抽象、组合以及追踪和标签转换系统等复杂语义推理任务时表现较差。研究揭示了当前LLMs在处理具有严格形式语义的软件设计模型时仍存在显著局限。

2605.13362 2026-05-15 cs.MA cs.AI cs.DC cs.GT econ.TH

Constitutional Governance in Metric Spaces

Ehud Shapiro, Nimrod Talmon

发表机构 * London School of Economics and Weizmann Institute of Science（伦敦经济学院和魏茨曼科学研究院）； Ben-Gurion University（本· Gurion大学）

AI总结本文研究了在度量空间中实现平等自主治理的计算机制，提出了宪法治理框架，将提案、审议、修改和共识等过程整合为一个多项式时间协议。该框架通过为每个可修改的组件分配度量空间、聚合规则和超级多数阈值，支持成员通过理想元素投票并提交获得超级多数支持的公开提案，从而实现宪法共识。研究还展示了该框架在七个典型场景中的应用，并证明了广义中位数在多数阈值下具有良好的激励相容性，为数字社区和组织的宪法治理提供了全面解决方案。

2605.13343 2026-05-15 cs.GR cs.DC cs.LG cs.NA math.NA

Hierarchical Transformer Preconditioning for Interactive Physics Simulation

Carl Osborne, Minghao Guo, Crystal Owens, Wojciech Matusik

发表机构 * MIT CSAIL（麻省理工学院计算机科学与人工智能实验室）

AI总结该研究提出了一种基于分层Transformer的预条件器，用于加速实时物理模拟中的求解过程。通过结合弱可接受H-矩阵划分，该方法在保持计算效率的同时，能够有效捕捉长程耦合关系。核心贡献包括一种新的训练目标函数，提升了预条件器对不规则谱的适应性，并实现了在大规模多相泊松系统中的高效求解，显著优于传统方法。

Comments 10 pages, 7 figures. Includes supplementary video and material

2605.13137 2026-05-15 cs.IR cs.AI

LeanSearch v2: Global Premise Retrieval for Lean 4 Theorem Proving

Guoxiong Gao, Zeming Sun, Jiedong Jiang, Yutong Wang, Jingda Xu, Peihao Wu, Bryan Dai, Bin Dong

发表机构 * School of Mathematical Sciences, Peking University（北京大学数学科学学院）； IQuest Research（IQuest研究院）； Research Institute for Mathematical Sciences, Kyoto University（京都大学数学研究所）； Westlake Institute for Advanced Study, Westlake University（西湖研究所在线高级研究院）； Beijing International Center for Mathematical Research and the New Cornerstone Science Laboratory, Peking University（北京国际数学研究中心和新基石科学实验室，北京大学）； Center for Machine Learning Research, Peking University（北京大学机器学习研究中心）； Center for Intelligent Computing, Great Bay Institute for Advanced Study, Great Bay University（智能计算中心，Great Bay高级研究院，Great Bay大学）； Zhongguancun Academy（中关村学院）

AI总结 LeanSearch v2 是一种用于 Lean 4 定理证明的全局前提检索系统，旨在从数学库中找到能够支持定理证明的多个相关引理。该系统包含两种模式：标准模式通过嵌入-重排序流程实现高精度的单次查询检索，而推理模式则通过迭代的草稿-检索-反思循环实现全局前提的恢复。实验表明，LeanSearch v2 在多个基准测试中显著优于现有系统，有效提升了定理证明的成功率。

2605.13095 2026-05-15 cs.CR cs.AI cs.CY cs.LG

Watermarking Should Be Treated as a Monitoring Primitive

Toluwani Aremu, Nils Lukas, Jie Zhang

发表机构 * MBZUAI（穆扎布伊人工智能研究所）； A*STAR（新加坡科技研究局）

AI总结该论文探讨了生成模型中水印技术在溯源、归因和安全监控中的应用，并指出当前水印评估通常仅针对单个样本的对抗攻击，忽视了观察者通过聚合多个输出信号进行实体级信息推断的能力。研究引入了基于观察者的威胁模型，表明即使零比特水印也能在多密钥环境下实现归因，并揭示了水印设计在外部监控方面的潜在风险与应对策略。论文揭示了归因与监控之间的根本性双重用途矛盾，强调水印评估应超越单样本鲁棒性，考虑聚合分析和观察者能力的影响。

Comments 12 pages, 5 figures

2605.09664 2026-05-15 cs.CR cs.LG

FreeMOCA: Memory-Free Continual Learning for Malicious Code Analysis

Zahra Asadi, Haeseung Jeon, Sohyun Han, Md Mahmuduzzaman Kamol, Se Eun Oh, Mohammad Saidur Rahman

发表机构 * Department of Computer Engineering（计算机工程系）； Amirkabir University of Technology（阿姆irkabir技术大学）； Division of Artificial Intelligence & Software（人工智能与软件系）； Ewha Womans University（成均馆大学）； Department of Computer Science（计算机科学系）； University of Texas at El Paso（德克萨斯理工大学）

AI总结随着每年新发现的恶意软件样本超过2亿个，反病毒系统需要不断适应不断变化的威胁环境。然而，仅使用新样本进行再训练会导致灾难性遗忘和可被利用的检测盲区，而使用整个数据集再训练则计算成本高昂。为此，本文提出FreeMOCA，一种无需存储记忆且计算高效的持续学习框架，通过在任务更新之间进行自适应的逐层插值，保留先前知识，从而有效提升恶意代码分析的持续学习能力。实验表明，FreeMOCA在多个大规模基准数据集上显著优于现有方法，大幅减少了遗忘并提升了检测准确率。

Comments 17 pages, 5 figures, 12 tables

2605.09530 2026-05-15 cs.CR cs.CL

MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents

Yining Chen, Jihao Zhao, Bo Tang, Haofen Wang, Yue Zhang, Fei Huang, Feiyu Xiong, Zhiyu Li

发表机构 * MemTensor (Shanghai) Technology Co., Ltd.（MemTensor（上海）科技有限公司）； HONOR Device Co., Ltd.（HONOR设备有限公司）； Tongji University（同济大学）

AI总结随着基于大语言模型的智能体越来越多地部署在边缘-云环境中，个性化记忆成为实现长期适应和以用户为中心交互的关键。然而，现有的云端辅助记忆管理方式容易暴露敏感用户信息，而现有的隐私保护方法通常依赖于激进的语义抹除，导致记忆效用和个性化质量下降。为此，本文提出 MemPrivacy，通过在边缘设备上识别隐私敏感内容，并用语义结构化的类型感知占位符替代，既保护了隐私，又保留了记忆生成与检索所需的信息。实验表明，MemPrivacy 在隐私信息提取方面表现优异，同时显著降低了推理延迟，有效平衡了隐私保护与个性化记忆效用。

2605.09018 2026-05-15 cs.NE cs.AI cs.LG

Evolutionary Ensemble of Agents

Zongmin Yu, Liu Yang

发表机构 * National University of Singapore（新加坡国立大学）

AI总结本文提出了一种名为EvE的进化集成框架，用于组织现有的高能力编码代理，使其形成一个协同进化的系统，以实现算法发现。该方法固定基础代理结构，专注于进化代理行为的指导与技能，通过两个协同进化的种群（功能代码求解器和代理指导状态）进行同步竞争，并根据其对当前求解状态的边际贡献更新代理的Elo评分。实验表明，EvE在In-Context Operator Networks（ICON）的研究瓶颈中自主发现了可靠的缩放-插值机制，展示了其在复杂代码库中通过自适应代理集成突破性能瓶颈的有效性。

2605.07060 2026-05-15 physics.geo-ph cs.LG physics.comp-ph stat.ML

Functional-prior-based approaches to Bayesian PDE-constrained inversion using physics-informed neural networks

Ryoichiro Agata, Tomohisa Okazaki

发表机构 * Disaster Prevention Research Institute, Kyoto University（京都大学灾害预防研究所）； RIKEN Center for Advanced Intelligence Project（理化学研究所先进智能项目中心）

AI总结本文提出了一种基于函数先验的贝叶斯偏微分方程约束反演方法（fpBPINN），旨在将物理意义明确的函数空间先验有效引入基于物理信息神经网络（PINN）的贝叶斯反演中。研究引入了两种互补方法：一种通过学习神经网络权重先验以符合给定函数先验，另一种则在函数空间中直接进行变分推理。实验表明，这两种方法在地震层析成像和达西流渗透率反演中均能准确估计后验分布，突显了引入物理可解释函数先验在提升反演精度中的重要性。

2604.17954 2026-05-15 math.DG cs.LG

Complex normalizing flows can almost be information Kähler-Ricci flows

Andrew Gracyk

发表机构 * Department of Mathematics, Purdue University（数学系，普渡大学）

AI总结本文探讨了复正规化流与近似凯勒-里奇流之间的联系，将复正规化流中用于密度变换的对数行列式与凯勒流形的里奇曲率联系起来。通过引入增广雅可比矩阵和贝叶斯参数视角，研究揭示了复正规化流的对数密度在连续极限下与费舍尔信息度量相吻合，从而在时间导数和期望的意义下恢复了凯勒-里奇流的变体。该工作建立了复正规化流的统计行为与几何特征之间的桥梁，为理解深度生成模型提供了新的几何视角。

2604.09603 2026-05-15 cs.DC cs.AI cs.LG

ECHO: Elastic Speculative Decoding with Sparse Gating for High-Concurrency Scenarios

Xinyi Hu, Yuhao Shen, Baolin Zhang, Hengxin Zhang, Jun Dai, Shuang Ge, Lei Chen, Yue Li, Mingcheng Wan

发表机构 * Qwen Applications Business Group of Alibaba（阿里巴巴文勤应用业务部）

AI总结 ECHO 是一种面向高并发场景的弹性推测解码框架，旨在提升大语言模型推理效率。该方法通过稀疏置信度门控机制，将推测执行重新建模为预算调度问题，灵活平衡解码深度与宽度，从而减少全局验证步骤并提高每步效率。实验表明，ECHO 在多种模型规模下均优于现有方法，尤其在工业级模型 Qwen3-235B 上实现了最高达 5.35 倍的加速效果。

2603.29097 2026-05-15 eess.AS cs.SD

Asymmetric Encoder-Decoder Based on Time-Frequency Correlation for Speech Separation

Ui-Hyeop Shin, Hyung-Min Park

发表机构 * Department of Electronic Engineering, Sogang University（电子工程系，首尔大学）

AI总结本文研究了在真实声学环境下如何有效分离混叠语音信号的问题，提出了一种基于时频相关性的不对称编码-解码框架SR-CorrNet。该方法通过引入分离-重建策略，结合时频双路径结构，实现了对说话人特征的逐步细化提取，并利用结构化的相关性到滤波估计方法提升分离效果。实验表明，该方法在多种数据集和不同环境条件下均取得了显著的性能提升。

Comments Submitted to IEEE Transactions on Audio, Speech, and Language Processing (TASLPRO) Code: https://github.com/dmlguq456/SR_CorrNet

2603.24586 2026-05-15 cs.SE cs.CL

Comparing Developer and LLM Biases in Code Evaluation

Aditya Mittal, Ryan Shar, Zichu Wu, Shyam Agarwal, Tongshuang Wu, Chris Donahue, Ameet Talwalkar, Wayne Chi, Valerie Chen

发表机构 * Carnegie Mellon University（卡内基梅隆大学）

AI总结随着大语言模型（LLM）在代码评估中被广泛用作评判者，研究其在真实交互场景中的表现变得尤为重要。本文提出TRACE框架，用于评估LLM评判者预测人类偏好和揭示人类与模型在代码质量评价上的系统性偏差的能力。研究发现，在多种代码交互场景中，最佳LLM评判者的表现仍比人类注释者低12%-23%，并识别出35个导致人类与模型评判不一致的关键因素，其中大部分与现有软件工程代码质量标准相关。

2603.24422 2026-05-15 cs.IR cs.AI cs.CL

OneSearch-V2: The Latent Reasoning Enhanced Self-distillation Generative Search Framework

Ben Chen, Siyuan Wang, Yufei Ma, Zihan Liang, Xuxin Zhang, Yue Lv, Ying Yang, Huangyu Dai, Lingtao Mao, Tong Zhao, Zhipeng Qian, Xinyu Sun, Zhixin Zhai, Yang Zhao, Bochao Liu, Jingshan Lv, Xiao Liang, Hui Kong, Jing Chen, Han Li, Chenyi Lei, Wenwu Ou, Kun Gai

发表机构 * Kuaishou Technology（快手科技）

AI总结本文提出了一种名为 OneSearch-V2 的生成式检索框架，旨在解决现有系统在复杂查询理解、用户意图挖掘和偏好过拟合等方面的问题。该方法通过引入潜在推理增强的自蒸馏训练机制，提升了对用户深层需求的理解与匹配能力，并结合行为偏好对齐优化系统，有效缓解了单一转化指标带来的奖励黑客问题。实验表明，OneSearch-V2 在多项指标上均有显著提升，包括点击率、买家数量和订单量，并改善了搜索体验质量。

Comments Codes are available at https://github.com/benchen4395/onesearch-family. Feel free to contact benchen4395@gmail.com

详情

英文摘要

Generative Retrieval (GR) has emerged as a promising paradigm for modern search systems. Compared to multi-stage cascaded architecture, it offers advantages such as end-to-end joint optimization and high computational efficiency. OneSearch, as a representative industrial-scale deployed generative search framework, has brought significant commercial and operational benefits. However, its inadequate understanding of complex queries, inefficient exploitation of latent user intents, and overfitting to narrow historical preferences have limited its further performance improvement. To address these challenges, we propose OneSearch-V2, a latent reasoning enhanced self-distillation generative search framework. It contains three key innovations: (1) a thought-augmented complex query understanding module, which enables deep query understanding and overcomes the shallow semantic matching limitations of direct inference; (2) a reasoning-internalized self-distillation training pipeline, which uncovers users' potential yet precise e-commerce intentions beyond log-fitting through implicit in-context learning; (3) a behavior preference alignment optimization system, which mitigates reward hacking arising from the single conversion metric, and addresses personal preference via direct user feedback. Extensive offline evaluations demonstrate OneSearch-V2's strong query recognition and user profiling capabilities. Online A/B tests further validate its business effectiveness, yielding +3.98\% item CTR, +2.07\% buyer volume, and +2.11\% order volume. Manual evaluation further confirms gains in search experience quality, with +1.37\% in page good rate and +1.65\% in query-item relevance. More importantly, OneSearch-V2 effectively mitigates common search system issues such as information bubbles and long-tail sparsity, without incurring additional inference costs or serving latency.

URL PDF HTML ☆

赞 0 踩 0

2603.00772 2026-05-15 stat.ML cs.LG

Generalizing Score-based generative models for Heavy-tailed Distributions

Tiziano Fassina, Gabriel Cardoso, Sylvan Le Corff, Thomas Romary

发表机构 * STIM, Mines Paris（STIM， Mines巴黎）； LPSM, Sorbonne Université（LPSM，索邦大学）

AI总结本文研究了如何将基于分数的生成模型（SGMs）推广到具有重尾分布的数据。针对现有方法在生成保真度和理论基础方面的不足，作者提出了两个理论贡献：一是证明通过早期停止和适当初始化可以将扩散框架扩展到任意目标分布；二是为归一化流的生成过程推导出新的理论保证。基于这些结果，文章提出了一种统一的生成框架，结合归一化流捕捉重尾特性与SGM细化结构细节，有效提升了生成质量并克服了现有方法的局限。

2602.17407 2026-05-15 eess.SY cs.RO cs.SY

Bluetooth Phased-array Aided Inertial Navigation Using Factor Graphs: Experimental Verification

Glen Hjelmerud Mørkbak Sørensen, Torleiv H. Bryne, Kristoffer Gryte, Tor Arne Johansen

发表机构 * Department of Engineering Cybernetics, Norwegian University of Science and Technology (NTNU)（工程 cybernetics 部，挪威科学技术大学（NTNU））

AI总结本文研究了利用相控阵蓝牙系统辅助惯性导航的问题，提出基于因子图优化的估计方法，并通过多旋翼无人机飞行实验验证其性能。研究对比了不同鲁棒估计策略在GNSS信号丢失场景下的表现，展示了蓝牙角度、距离或气压测量辅助导航的可行性与效果。该工作为低成本、高鲁棒性的室内导航系统提供了实验依据与方法支持。

Comments 6 pages, 5 figures, 2 tables. \c{opyright} 2026 the authors. This work has been accepted to IFAC for publication under a Creative Commons Licence CC-BY-NC-ND

2602.15249 2026-05-15 cs.DL cs.AI

Artificial Intelligence Specialization in the European Union: Underexplored Role of the Periphery at NUTS-3 Level

Victor Herrero-Solana, Carmen Gálvez

发表机构 * SCImago-UGR, Unit for Computational Humanities and Social Sciences (U^CHASS) University of Granada, Spain（SCImago-UGR，计算人文与社会科学单位（U^CHASS）格拉纳达大学，西班牙）

AI总结本研究分析了2015年至2024年间欧洲NUTS-3地区在人工智能领域的研究分布情况，利用引文数据和分类系统，计算了相对专业化指数和相对引用影响力指标。研究发现，尽管巴黎、华沙和马德里等大都市在论文数量上占优，但人工智能领域的相对专业化程度最高的是东欧和西班牙的一些外围地区，如格拉纳达和维尔纽斯地区。研究还揭示了专业化与引用影响力之间关系较弱，不同地区呈现出多样化的发展模式。

Comments 15 pages, 3 figures

2602.14881 2026-05-15 math.OC cs.AI

Numerical exploration of the range of shape functionals using neural networks

Eloi Martinet, Ilias Ftouhi

发表机构 * Institute of Mathematics, University of Würzburg, Germany ； Laboratoire MIPA, N\ imes University, Site des Carmes, Place Gabriel P\'eri, 30000 N\ imes, France

AI总结本文提出了一种基于神经网络的新数值框架，用于探索Blaschke–Santaló图，该图用于描述形状泛函之间的可能不等式关系。通过引入基于规范函数的可逆神经网络结构，实现了对任意维凸集的参数化，并在形状优化过程中保持凸性。为实现图内的均匀采样，作者设计了一种通过自动微分最小化Riesz能量泛函的粒子系统，并在二维和三维凸体的多个几何和偏微分方程型泛函上验证了方法的有效性。

Comments 20 pages, 8 figures

2602.06718 2026-05-15 cs.CR cs.AI

GhostCite: A Large-Scale Analysis of Citation Validity in the Age of Large Language Models

Zuyao Xu, Yuqi Qiu, Lu Sun, Fasheng Miao, Fubin Wu, Xiang Li, Xinyi Wang, Haozhe Lu, Zhengze Zhang, Yuxin Hu, Jialu Li, Luo Jin, Feng Zhang, Rui Luo, Xinran Liu, Yingxian Li, Jiaji Liu

发表机构 * Nankai University（南开大学）； Tsinghua University（清华大学）

AI总结《GhostCite：大语言模型时代引文有效性的大规模分析》研究了大型语言模型（LLMs）在学术写作中广泛使用所引发的引文有效性问题。研究开发了一个开源框架\citeb，用于大规模验证引文，并通过三个实验分析了LLMs生成虚假引文（“幽灵引文”）的现象。研究发现，所有测试的LLMs在不同领域生成引文时都有较高比例的虚构引文，且近年来学术会议论文中的无效引文比例显著上升，同时多数研究者依赖AI工具，但审稿人对引文的审查并不严格，反映出当前学术出版体系在应对这一问题上的不足。

2602.03680 2026-05-15 physics.soc-ph cs.SD

Instantaneous Spectra Analysis of Pulse Series -- Application to Lung Sounds with Abnormalities

Fumihiko Ishiyama

发表机构 * NTT Inc.（日本电通公司）

AI总结本文研究了脉冲序列的瞬时频谱分析方法，并将其应用于异常肺音（如爆裂音和哮鸣音）及正常肺音的分析。传统傅里叶分析的时间频率分辨率受限于周期边界条件假设，作者提出采用线性外推条件替代该假设，从而实现更精确的瞬时频谱分析。该方法能够有效提取脉冲序列中每个脉冲的频谱信息，并生成脉冲序列的时频图，清晰展示其时间频率结构，为异常肺音的识别提供了新的分析工具。

Comments 10 pages, 7 figures. To appear Proc. IEEE CSPA 2026

2512.12772 2026-05-15 cs.MM cs.CV

JointAVBench: A Benchmark for Joint Audio-Visual Reasoning Evaluation

Jianghan Chao, Jianzhang Gao, Wenhui Tan, Yuchong Sun, Ruihua Song, Liyun Ru

发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China（中国人民大学香樟人工智能学院）； Baichuan Inc（百川科技）

AI总结为了全面评估能够处理多模态信息的全大语言模型（Omni-LLMs），本文提出JointAVBench基准，涵盖多模态依赖、多样化的音频信息类型和不同场景跨度三个关键方面。该基准通过自动化流程生成严格依赖音视频联合理解的问题与答案，弥补了现有数据集在多模态评估方面的不足。实验表明，即使表现最好的Omni-LLM在该基准上的平均准确率也仅为65.3%，显示出在跨场景推理等方面仍有较大提升空间。

2511.21247 2026-05-15 eess.AS cs.LG cs.SD

The Spheres Dataset: Multitrack Orchestral Recordings for Music Source Separation and Information Retrieval

Jaime Garcia-Martinez, David Diaz-Guerra, John Anderson, Ricardo Falcon-Perez, Pablo Cabañas-Molero, Tuomas Virtanen, Julio J. Carabias-Orti, Pedro Vera-Candeas

发表机构 * Universidad de Jaén（耶鲁大学）； Odratek BV（Odratek公司）； Tampere University（塔尔库大学）

AI总结本文介绍了《Spheres数据集》，这是一个包含多轨管弦乐录音的数据集，旨在推动经典音乐领域中音乐源分离及相关音乐信息检索任务的机器学习研究。数据集由Colibrì乐团在The Spheres录音棚演奏的超过一小时的音乐作品组成，包括柴可夫斯基《罗密欧与朱丽叶》和莫扎特第四十号交响曲，并附有各乐器的音阶和独奏片段。通过23个麦克风的多角度录制，该数据集提供了真实立体声混音、可控的音轨混入以及独立音轨，适用于源分离模型的训练与评估，并附有各乐器位置的房间脉冲响应，为研究提供了丰富的声学特性信息。

Journal ref in IEEE Transactions on Audio, Speech and Language Processing, vol. 34, pp. 2622-2634, 2026

2511.18820 2026-05-15 physics.flu-dyn cs.LG

Unsupervised simulation of incompressible flows with physics- and equality- constrained artificial neural networks

Qifeng Hu, Inanc Senocak

发表机构 * Department of Mechanical Engineering and Materials Science, University of Pittsburgh, Pittsburgh, PA 15261, USA（机械工程与材料科学系，匹兹堡大学，匹兹堡，PA 15261，USA）

AI总结该研究提出了一种基于物理约束和等式约束的人工神经网络（PECANN）框架，用于无监督模拟不可压缩流体在高雷诺数下的流动。通过引入压力泊松方程目标函数和条件自适应增广拉格朗日乘子法（CA-ALM），严格满足连续性方程和边界条件，有效解决了传统物理信息神经网络在高雷诺数流动中难以保证无散性约束的问题。实验表明，该方法在多个典型流动场景中无需监督预训练或标签数据，即可准确捕捉流动结构，包括高雷诺数下圆柱绕流中涡旋脱落的自发产生。

Comments 33 pages, 19 figures

详情

英文摘要

Physics-informed neural networks (PINNs) have shown promise for solving partial differential equations, yet their success in simulating incompressible flows at high Reynolds numbers remains limited. Existing approaches rely on auxiliary labeled data, supervised pretraining, or reference solutions, and no purely unsupervised method comparable to conventional finite-difference or finite-volume solvers has been demonstrated. We attribute this gap to the absence of a mechanism for enforcing the divergence-free constraint and boundary conditions to strict tolerances. To address this, we adopt the physics- and equality-constrained artificial neural network (PECANN) framework with a conditionally adaptive augmented Lagrangian method (CA-ALM), and introduce a pressure-Poisson-based objective. The residual of the pressure Poisson equation is minimized subject to the momentum and continuity equations and boundary conditions on the primitive variables as equality constraints, with CA-ALM enforcing all constraints tightly. For advection-dominated, high-Reynolds-number flows, we further propose an adaptive vanishing entropy viscosity that stabilizes early training without influencing the converged solution. A baseline that instead uses the momentum residual as the objective proves ineffective under the same machinery, underscoring the critical role of the pressure-Poisson objective. The method is assessed on lid-driven cavity flow up to $Re=7{,}500$, three-dimensional unsteady Beltrami flow, and steady and unsteady flow past a circular cylinder with general inflow-outflow boundary conditions, including an ablation study identifying admissible outlet conditions -- all without labeled data or supervised pretraining. Notably, it captures the spontaneous onset of periodic vortex shedding in unsteady cylinder flow without external perturbations, starting from a randomly initialized network.

URL PDF HTML ☆

赞 0 踩 0

AI 大模型

视觉与机器人

科学与医疗

Web Agents Should Adopt the Plan-Then-Execute Paradigm

Watermarking Game-Playing Agents in Perfect-Information Extensive-Form Games

Training-Free Generative Sampling via Moment-Matched Score Smoothing

Self-Regulated Learning in Essay Writing: Consistency of Strategies and Impact on Outcomes

Wavelet-Based Observables for Koopman Analysis: An Extended Dynamic Mode Decomposition Framework

LLM-Based Robustness Testing of Microservice Applications: An Empirical Study

Stochastic Matching via Local Sparsification

(How) Do Large Language Models Understand High-Level Message Sequence Charts?

Constitutional Governance in Metric Spaces

Hierarchical Transformer Preconditioning for Interactive Physics Simulation

LeanSearch v2: Global Premise Retrieval for Lean 4 Theorem Proving

Watermarking Should Be Treated as a Monitoring Primitive

FreeMOCA: Memory-Free Continual Learning for Malicious Code Analysis

MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents

Evolutionary Ensemble of Agents

Functional-prior-based approaches to Bayesian PDE-constrained inversion using physics-informed neural networks

Complex normalizing flows can almost be information Kähler-Ricci flows

ECHO: Elastic Speculative Decoding with Sparse Gating for High-Concurrency Scenarios

Asymmetric Encoder-Decoder Based on Time-Frequency Correlation for Speech Separation

Comparing Developer and LLM Biases in Code Evaluation

OneSearch-V2: The Latent Reasoning Enhanced Self-distillation Generative Search Framework

Generalizing Score-based generative models for Heavy-tailed Distributions

Bluetooth Phased-array Aided Inertial Navigation Using Factor Graphs: Experimental Verification

Artificial Intelligence Specialization in the European Union: Underexplored Role of the Periphery at NUTS-3 Level

Numerical exploration of the range of shape functionals using neural networks

GhostCite: A Large-Scale Analysis of Citation Validity in the Age of Large Language Models

Instantaneous Spectra Analysis of Pulse Series -- Application to Lung Sounds with Abnormalities

JointAVBench: A Benchmark for Joint Audio-Visual Reasoning Evaluation

The Spheres Dataset: Multitrack Orchestral Recordings for Music Source Separation and Information Retrieval

Unsupervised simulation of incompressible flows with physics- and equality- constrained artificial neural networks