arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.14786 2026-05-15 cs.CR cs.AI cs.HC cs.LG

Known By Their Actions: Fingerprinting LLM Browser Agents via UI Traces

William Lugoloobi, Samuelle Marro, Jabez Magomere, Joss Wright, Chris Russell

发表机构 * Oxford Internet Institute, University of Oxford（牛津互联网研究所，牛津大学）； Department of Engineering Science, University of Oxford（工程科学系，牛津大学）

AI总结随着基于大语言模型（LLM）的智能体越来越多地代表用户浏览网页，一个自然的问题是：网站能否被动识别出驱动该智能体的底层模型？本研究发现，通过被动的JavaScript追踪器捕获智能体的动作和交互时间，可以以高达96%的F1分数识别出使用的模型。研究还表明，基于智能体行为训练的分类器能够跨不同规模和家族的模型泛化，并且仅需少量交互轨迹即可训练出高效的分类器。尽管引入随机时间延迟可以降低分类器性能，但重新训练后仍能恢复识别效果。

2605.14750 2026-05-15 cs.CR cs.AI

EVA: Editing for Versatile Alignment against Jailbreaks

Yi Wang, Hongye Qiu, Yue Xu, Sibei Yang, Zhan Qin, Minlie Huang, Wenjie Wang

发表机构 * ShanghaiTech University（上海科技大学）； Sun Yat-sen University（中山大学）； State Key Laboratory of Blockchain and Data Security（区块链与数据安全国家重点实验室）； Tsinghua University（清华大学）

AI总结大型语言模型（LLMs）和视觉语言模型（VLMs）虽然表现出色，但仍易受越狱攻击的影响，攻击者通过文本或视觉触发器绕过安全防护。为解决现有防御方法带来的计算开销大和性能下降问题，本文提出EVA框架，通过直接模型编辑技术精准修正模型中导致越狱行为的关键神经元，无需大规模重训练，从而在保持模型原有能力的同时有效消除有害行为。实验表明，EVA在多种模型上均优于现有方法，为部署后的安全对齐提供了高效且精确的解决方案。

Comments IEEE TPAMI 2026

2605.14741 2026-05-15 eess.SY cs.AI cs.SY

Addressing Terminal Constraints in Data-Driven Demand Response Scheduling

Maximilian Bloor, Martha White, Ehecatl Antonio del Rio Chanona, Calvin Tsay

发表机构 * Sargent Centre for Process Systems Engineering, Imperial College London, London, SW7 2AZ, UK（过程系统工程中心，伦敦帝国理工学院，伦敦，SW7 2AZ，英国）； Department of Computer Science, University of Alberta, Edmonton, AB, Canada（计算机科学系，阿尔伯塔大学，埃德蒙顿，AB，加拿大）； Department of Computing, Imperial College London, London, SW7 2AZ, UK（计算系，伦敦帝国理工学院，伦敦，SW7 2AZ，英国）

AI总结本文研究了在数据驱动的需求响应调度中如何满足终端约束的问题，提出了一种结合目标空间规划（GSP）与深度确定性策略梯度（DDPG）的方法，通过学习离散子目标的时序抽象模型，有效传递长期价值，提升调度效果。该方法在模拟的空气分离系统中验证了其在提高样本效率和满足终端存储约束方面的优势，缓解了传统方法在长期约束处理上的不足。

Comments Accepted to IFAC World Congress 2026

2605.14731 2026-05-15 cs.GR cs.CV cs.SD

UMo: Unified Sparse Motion Modeling for Real-Time Co-Speech Avatars

Xiaoyu Zhan, Xinyu Fu, Chenghao Yang, Xiaohong Zhang, Dongjie Fu, Pengcheng Fang, Tengjiao Sun, Xiaohao Cai, Hansung Kim, Yuanqi Li, Jie Guo, Yanwen Guo

发表机构 * Nanjing University（南京大学）； Mogo AI Ltd.（Mogo AI有限公司）； University of Southampton（南安普顿大学）

AI总结本文提出了一种统一的稀疏运动建模方法UMo，用于实现高保真、实时的共语义数字人动画生成。UMo通过统一处理文本、音频和运动信息，结合空间稀疏的专家混合框架和时间稀疏的关键帧设计，实现了高效实时的密集重建，能够在保证时间一致性和高保真度的同时提升生成质量。此外，UMo采用多阶段训练策略和针对性的音频增强方法，有效提升了语音-运动对齐的精度和语义一致性，为实时共语义动画提供了实用的解决方案。

2605.14671 2026-05-15 cond-mat.mtrl-sci cs.AI

Agentic Design of Compositional Descriptors via Autoresearch for Materials Science Applications

Matteo Cobelli, Stefano Sanvito

发表机构 * School of Physics（物理系）； CRANN Institute, Trinity College, Dublin 2, Dublin, Ireland（CRANN研究所，三一学院，都柏林2号，都柏林，爱尔兰）

AI总结本文提出了一种基于自研（autoresearch）框架的智能代理系统Automat，用于材料科学中化学成分描述符的设计。该系统利用大型语言模型作为编码代理，自动生成仅基于化学公式的描述符，并通过随机森林进行评估，实现了对无机材料带隙和铁磁化合物居里温度的预测。研究显示，Automat在性能上优于传统基准方法，且生成的描述符具有化学可解释性，展示了无需人工特征工程即可设计任务特定材料描述符的潜力，同时也揭示了当前在描述符冗余和搜索策略等方面存在的挑战。

2605.14662 2026-05-15 math.OC cs.LG

Scalable Solution of the Stochastic Multi-path Traveling Salesman Problem via Neural Networks

Xiaochen Chou, Ludovica Di Marco, Enza Messina

发表机构 * Department of Informatics, Systems and Communication（信息学、系统与通信系）

AI总结本文研究了在智能城市和城市物流中出现的具有随机旅行成本的多路径旅行商问题，旨在寻找一条最小化期望总旅行成本的哈密顿回路。为解决该问题，作者提出了一种两阶段随机规划方法，并引入基于神经网络的代理模型来近似第二阶段的 recourse 问题，从而显著降低计算复杂度。实验表明，该方法在计算效率、解的质量和泛化能力方面表现良好，为处理不确定性下的复杂车辆路径问题提供了可扩展的解决方案。

2605.14629 2026-05-15 eess.IV cs.CV

Efficient Dense Matching for Enhanced Gaussian Splatting Using AV1 Motion Vectors

Julien Zouein, Vibhoothi Vibhoothi, François Pitié, Anil Kokaram

发表机构 * SigMedia

AI总结本文提出了一种基于AV1运动向量的高效密集匹配方法，用于提升高斯泼溅（3DGS）的初始点云质量。该方法利用AV1视频编解码器中的运动向量，避免了传统SfM方法中耗时的穷举匹配，显著降低了计算开销并提高了点云密度。实验表明，该方法生成的点云数量是传统SfM方法的八倍，有效提升了3DGS的重建精度和训练效率。

2605.14612 2026-05-15 cs.SE cs.AI

In-IDE Toolkit for Developers of AI-Based Features

Yaroslav Sokolov, Yury Khudyakov, Lenar Sharipov, Andrei Gasparian, Parth Tiwary, Artem Trofimov

发表机构 * JetBrains

AI总结本文提出了一种集成在JetBrains IDE中的AI Toolkit插件，旨在帮助非机器学习背景的软件工程师更便捷地测试、调试和评估基于大语言模型和智能体工作流的AI功能。该工具通过在运行/调试过程中实现追踪与评估，满足了开发者对可重复评估、实时追踪和简化设置的核心需求。实验表明，该工具能有效降低使用门槛，促进开发者形成规范的AI开发实践。

Comments Published at IDE'26 co-located with ICSE'26

2605.14584 2026-05-15 physics.chem-ph cs.LG

All-atomistic Transferable Neural Potentials for Protein Solvation

Rishabh Dey, Salvina Sharipova, Konstantin Popov

发表机构 * University of North Carolina at Chapel Hill - Eshelman School of Pharmacy（北卡罗来纳大学教堂山分校-埃舍尔曼药学院）

AI总结该研究提出了一种名为PHNN的全原子可迁移神经势能模型，用于蛋白质溶剂化计算。该模型通过学习可迁移的参数修正来改进隐式溶剂模型的准确性，而非对最终能量进行事后调整。PHNN结合物理先验知识以提高数据效率，在传统分析方法基础上显著提升了预测精度，并在超出训练域的蛋白质系统中保持良好的泛化能力。

2605.14567 2026-05-15 stat.ML cs.LG math.PR math.ST stat.TH

Scaling Laws from Sequential Feature Recovery: A Solvable Hierarchical Model

Arie Wortsman-Zurich, Hugo Tabanelli, Yatin Dandi, Florent Krzakala, Bruno Loureiro

发表机构 * Département d’Informatique, Ecole Normale Supérieure, PSL & CNRS（信息学院，巴黎高等师范学院，PSL & CNRS）； Information Learning and Physics Laboratory, École Polytechnique Fédérale de Lausanne (EPFL)（信息学习与物理实验室，瑞士洛桑联邦理工学院（EPFL））； Statistical Physics of Computation Laboratory, École Polytechnique Fédérale de Lausanne (EPFL)（计算统计物理实验室，瑞士洛桑联邦理工学院（EPFL））

AI总结本文提出了一种简单的机制，解释了多层网络中特征学习如何产生缩放定律。研究对象是一个高维的分层目标函数，该函数虽然整体复杂度很高，但可以通过一组权重呈幂律衰减的潜在组合特征来表示。通过设计一种逐层谱算法，能够逐步恢复这些潜在特征，且在样本量较小时就能检测到强特征，而弱特征则需要更多数据。理论分析表明，该方法在预测误差上实现了明确的幂律衰减，并通过数值实验验证了特征逐步恢复的现象和与非分层方法的性能差异。

2605.14563 2026-05-15 cs.SE cs.CL

Remember Your Trace: Memory-Guided Long-Horizon Agentic Framework for Consistent and Hierarchical Repository-Level Code Documentation

Suyoung Bae, Jaehoon Lee, Changkyu Choi, YunSeok Choi, Jee-Hyong Lee

发表机构 * Sungkyunkwan University（成均馆大学）； University of Oslo（奥斯陆大学）

AI总结本文提出了一种名为MemDocAgent的长视野智能代理框架，用于生成一致且层次分明的仓库级代码文档。该方法通过依赖感知的遍历引导和基于记忆的代理交互，实现了对整个代码仓库的集成化文档生成，有效解决了现有方法中冗余检索、描述冲突和结构混乱的问题。实验表明，MemDocAgent在多个评估指标上优于开源和闭源基线方法，具有实际的软件开发应用价值。

2605.14526 2026-05-15 cs.GR cs.DC cs.NA cs.RO math.NA

DiffPhD: A Unified Differentiable Solver for Projective Heterogeneous Materials in Elastodynamics with Contact-Rich GPU-Acceleration

Shih-Yu Lai, Sung-Han Tien, Jui-I Huang, Yen-Chen Tseng, Yi-Ting Chiu, Siyuan Luo, Ziqiu Zeng, Fan Shi, Peter Yichen Chen, Tiantian Liu, Yu-Lun Liu, Bing-Yu Chen

发表机构 * National Taiwan University（国立台湾大学）； MoonShine Animation Studio（MoonShine 动画工作室）； National University of Singapore（新加坡国立大学）； The University of British Columbia（不列颠哥伦比亚大学）； Independent Researcher（独立研究员）； National Yang Ming Chiao Tung University（阳明交通大学）

AI总结 DiffPhD 是一种统一的、基于 GPU 加速的可微分投影动力学框架，旨在解决含异质材料、大变形超弹性以及复杂接触交互的弹性动力学问题。该方法通过引入刚度感知的投影权重、信任域特征值过滤与改进的 Anderson 加速策略，并整合到统一的 GPU 计算流程中，实现了对异质材料的高效且稳定的模拟。DiffPhD 在保持梯度精度的同时显著提升了计算效率，并在大刚度对比场景下仍保持收敛性，为复杂物理系统的端到端优化提供了有力支持。

2605.14524 2026-05-15 stat.ML cs.LG

Large Dimensional Kernel Ridge Regression: Extending to Product Kernels

Yang Zhou, Yicheng Li, Yuqian Cheng, Qian Lin

发表机构 * Department of Statistics and Data Science（统计与数据科学系）； Tsinghua University（清华大学）； Department of Mathematical Science（数学科学系）

AI总结本文研究了高维核岭回归（KRR）中在更广泛核函数下的泛化误差行为，扩展了之前仅针对球面内积核的结果。作者提出了一类新的高维核函数，并推导了其对应的泛化误差收敛速率。研究发现，即使在更一般的核设置下，仍存在最小最大最优性、饱和效应以及收敛速率的周期性平台和样本量相关的多重下降现象，从而拓展了对高维KRR行为的理解。

2605.14512 2026-05-15 cs.IR cs.AI

Asymmetric Generative Recommendation via Multi-Expert Projection and Multi-Faceted Hierarchical Quantization

Bin Huang, Xin Wang, Junwei Pan, Yongqi Zhou, Yifeng Zhou, Zhixiang Feng, Shudong Huang, Haijie Gu, Wenwu Zhu

发表机构 * DCST, Tsinghua University（清华大学直流系统研究所）； DCST, BNRist, Tsinghua University（清华大学直流系统研究所）； Tencent（腾讯）

AI总结该论文针对生成式推荐（GenRec）模型中存在的输入和输出瓶颈问题，提出了一种不对称的连续-离散框架AsymRec。通过多专家语义投影（MSP）和多视角分层量化（MHQ）方法，分别提升了输入表示的语义丰富性和输出目标的结构化精度，有效缓解了流行度偏差和细粒度语义丢失的问题。实验表明，AsymRec在多个数据集上显著优于现有生成式推荐方法，平均性能提升达15.8%。

2605.14502 2026-05-15 eess.SY cs.AI cs.SY

Quantifying Cyber-Vulnerability in Power Electronics Systems via an Impedance-Based Attack Reachable Domain

Hongwei Zhen, Ze Yu, Xin Xiang, Wuhua Li, Mingyang Sun

发表机构 * IEEE

AI总结本文研究了电力电子系统在受到网络攻击时的脆弱性量化问题，提出了一种基于阻抗的攻击可达域（ARD）框架，用于评估在权限受限条件下节点可能被推近不稳定的程度。该方法通过阻抗重塑映射可行的攻击动作到关键特征值迁移，并定义了攻击穿透指数以综合表征系统稳定性裕度的渗透程度和成功攻击的可达性。为应对逆变器模型缺失的情况，还构建了一个实用的灰盒评估流程，结合现有阻抗识别与可微代理工具，实验表明该方法能有效揭示传统电网强度指标无法反映的脆弱性模式。

2605.14501 2026-05-15 eess.SY cs.AI cs.LG cs.SY

Fully Dynamic Rebalancing in Dockless Bike-Sharing Systems via Deep Reinforcement Learning

Edoardo Scarpel, Alberto Pettena, Matteo Cederle, Federico Chiariotti, Marco Fabris, Gian Antonio Susto

发表机构 * University of Padua（帕多瓦大学）

AI总结本文提出了一种基于深度强化学习的全动态再平衡方法，用于解决无桩共享单车系统中的车辆调度问题。该方法通过图模拟器建模服务系统，并将再平衡问题建模为马尔可夫决策过程，利用深度强化学习代理实时调度单车，根据时空关键性评分执行局部的取车、还车和充电操作。实验结果表明，该方法在真实数据上显著减少了车辆可用性失败，同时减少了空间不平等和出行荒漠现象，展示了基于学习的再平衡方法在提升共享微出行系统效率和可靠性方面的价值。

Comments 6 pages, 5 figures, 1 table, accepted at the 23rd IFAC World Congress, Busan, South Korea, Aug. 23-26, 2026. Open invited track 9-131: "Control and Optimization for Smart Cities"

2605.14495 2026-05-15 cs.MM cs.AI

Contestable Multi-Agent Debate with Arena-based Argumentative Computation for Multimedia Verification

Truong Thanh Hung Nguyen, Vo Thanh Khang Nguyen, Hoang-Loc Cao, Phuc Ho, Van Pham, Hung Cao

发表机构 * University of New Brunswick（新 Brunswick大学）； University of Science, VNU-HCM（越南国家大学科学学院（VNU-HCM））

AI总结该研究针对多媒体验证任务中准确性和透明性并重的需求，提出了一种可争议的多智能体框架，结合多模态大语言模型、外部验证工具和基于竞技场的双极论证计算方法。该方法将每个案例分解为以主张为中心的模块，检索针对性证据并生成带有来源和强度评分的支持与攻击论点，通过局部论证图进行冲突解决和不确定性处理，最终生成结构清晰、可编辑且具有实际计算可行性的验证报告。

Comments ACM ICMR 2026 Grand Challenge on Multimedia Verification

2605.14478 2026-05-15 cs.SE cs.AI cs.CL

When Retrieval Hurts Code Completion: A Diagnostic Study of Stale Repository Context

Haojun Weng, Qianqian Yang, Hao Fu, Haobin Pan, Xinwei Lv

发表机构 * Independent Researcher, California, USA（加利福尼亚独立研究员）； Independent Researcher, Beijing, China（北京独立研究员）

AI总结该研究探讨了检索增强代码生成中使用过时代码片段可能对代码补全造成的负面影响。通过在五个Python仓库中对17个生产辅助函数签名变化进行受控实验，研究发现仅使用过时代码片段会显著诱导模型生成与当前状态不兼容的代码，而完全不使用检索则导致生成结果无法通过验证。实验还表明，引入当前有效的代码信息可以有效缓解过时信息带来的问题，揭示了检索内容的时间有效性是评估代码检索增强生成鲁棒性的重要因素。

Comments 31 pages, 2 tables. Submitted to Information and Software Technology (Elsevier)

2605.14434 2026-05-15 cs.IR cs.AI

Efficient Generative Retrieval for E-commerce Search with Semantic Cluster IDs and Expert-Guided RL

Jianbo Zhu, Xing Fang, Jing Wang, Mingmin Jin, Bokang Wang, Guangxin Song, Zhenyu Xie, Junjie Bai

发表机构 * Taobao \& Tmall Group of Alibaba Hangzhou China ； Taobao \& Tmall Group of Alibaba

AI总结该研究针对电商搜索中生成式召回方法的实用化难题，提出了一种高效的生成式召回框架CQ-SID，通过语义聚类ID和专家引导强化学习方法，有效降低了搜索复杂度并提升了召回效果。CQ-SID结合类别和查询约束的对比学习与残差量化VAE，生成分层语义标识符，显著减少束搜索规模；同时提出的EG-GRPO方法通过引入真实样本，优化生成召回与后续排序的一致性。实验表明，该方法在语义点击率和个性化点击率上分别提升26.76%和11.11%，并在实际系统中取得了显著的GMV和转化率提升。

2605.14426 2026-05-15 physics.ao-ph cs.AI

A plug-and-play generative framework for multi-satellite precipitation estimation

Yunfan Yang, Haofei Sun, Xiuyu Sun, Wei Han, Xiaoze Xu, Xingtao Song, Jun Li, Zhiqiu Gao, Wei Huang, Hao Li

发表机构 * State Key Laboratory of Atmospheric Boundary Layer Physics and Atmospheric Chemistry（大气边界层物理与大气化学国家重点实验室）； Institute of Atmospheric Physics, Chinese Academy of Sciences（中国科学院大气物理研究所）； Shanghai Academy of Artificial Intelligence for Science (SAIS)（上海人工智能科学研究院）； CMA Earth System Modeling and Prediction Centre (CEMC)（中国气象局地球系统模拟与预测中心）

AI总结该研究提出了一种名为PRISMA的插件式生成框架，用于多卫星降水估计。该方法通过从IMERG最终场中学习无条件降水先验，并结合独立训练的传感器特定条件分支，实现了无需重新训练生成主干即可灵活集成新传感器数据。实验表明，PRISMA在降水估计精度和效率方面均有显著提升，尤其在融合红外与微波观测数据时，显著提高了关键成功指数并降低了均方根误差。

2605.14421 2026-05-15 cs.CR cs.AI

MemLineage: Lineage-Guided Enforcement for LLM Agent Memory

Ciyan Ouyang, Rui Hou

发表机构 * State Key Laboratory of Cyberspace Security Defense（网络空间安全防御国家重点实验室）； Institute of Information Engineering, CAS（信息工程研究所，中国科学院）； Beijing, China（北京，中国）

AI总结 MemLineage 是一种针对大型语言模型（LLM）代理记忆的防御机制，通过为每条记忆条目附加密码学来源信息和LLM推导链，确保记忆内容的可信性。该方法将记忆管理视为一种“保管链”问题，利用 Merkle 日志和有向无环图（DAG）记录记忆的生成过程，从而在防止恶意内容被用于敏感操作的同时，保留有用的回忆能力。实验表明，MemLineage 在多个记忆污染场景中表现出色，显著降低了误动作率，且性能开销极低。

Comments 24 pages, 8 figures. Rui Hou is the corresponding author

2605.14418 2026-05-15 cs.CR cs.AI

The Great Pretender: A Stochasticity Problem in LLM Jailbreak

Jean-Philippe Monteuuis, Cong Chen, Jonathan Petit

发表机构 * Core contributors（核心贡献者）

AI总结该论文指出，当前大语言模型（LLM）越狱攻击的评估中存在一个关键问题：攻击成功率（ASR）并不稳定，导致不同研究之间的结果难以比较。研究发现，即使某些攻击在封闭模型上表现出高ASR，但在实际测试中却只能以50%的连续成功率通过开放模型，揭示了越狱攻击生成和评估过程中随机性（stochasticity）的影响。为此，作者提出了一种新的评估框架CAS-eval和生成框架CAS-gen，有效提升了攻击的一致性和成功率，为越狱攻击的标准化评估提供了新方法。

2605.14415 2026-05-15 cs.SE cs.AI cs.CL

SWE-Chain: Benchmarking Coding Agents on Chained Release-Level Package Upgrades

Man Ho Lam, Chaozheng Wang, Hange Liu, Jingyu Xiao, Haau-sing Li, Jen-tse Huang, Terry Yue Zhuo, Michael R. Lyu

发表机构 * The Chinese University of Hong Kong（香港中文大学）； Independent（独立）； ELLIS ； Technical University of Darmstadt（达姆施塔特技术大学）； Johns Hopkins University（约翰霍普金斯大学）； Monash University（墨尔本大学）

AI总结 SWE-Chain 是一个用于评估代码智能体在连续版本升级场景下表现的基准，聚焦于包级别的连续发布升级任务。该研究设计了一种基于版本说明与代码差异对齐的合成流程，生成真实可行的升级需求，并构建了包含 9 个真实 Python 包、155 个版本转换和 1660 个升级要求的测试集。实验表明，当前主流代码智能体在连续升级任务中仍面临较大挑战，难以在不破坏现有功能的前提下完成准确的升级操作。

2605.14386 2026-05-15 cs.NE cs.AI

Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning

Taebong Kim, Youngsik Hong, Minsik Kim, Sunyoung Choi, Jaewon Jang, Junghoon Shin, Minseo Kim

发表机构 * VIDRAFT Inc.（VIDRAFT公司）

AI总结本文提出了一种名为 Darwin Family 的框架，通过无训练的进化合并方法提升大语言模型的推理能力。该方法基于梯度-free的权重空间重组，引入了自适应合并基因、MRI-Trust融合机制以及跨架构映射器，实现了对现有模型检查点中潜在能力的重新组织与优化。实验表明，Darwin 模型在多个任务上超越了其原始训练模型，展示了无需额外训练即可提升模型推理性能的有效性。

Comments NeurIPS 2026 submission. 18 pages including appendix

2605.14370 2026-05-15 physics.geo-ph cs.AI physics.comp-ph

Deciphering Neural Reparameterized Full-Waveform Inversion with Neural Sensitivity Kernel and Wave Tangent Kernel

Ruihua Chen, Yisi Luo, Bangyu Wu, Xile Zhao, Deyu Meng

发表机构 * School of Mathematics and Statistics, Xi’an Jiaotong University（西安交通大学数学与统计学院）； School of Mathematical Sciences, University of Electronic Science and Technology of China（电子科技大学数学科学学院）

AI总结本文研究了神经重参数化全波形反演（NeurFWI）的收敛机制，提出了神经灵敏度核（NSK）和波切线核（WTK），揭示了神经表示如何通过调节原始灵敏度核和波切线核的特征结构，影响反演过程中的谱滤波效应、梯度波数调制和波频偏差等关键行为。基于这些理论分析，作者提出了改进的NeurFWI方法，提升了反演性能与效率，并在地震勘探和医学成像中验证了其有效性。

2605.14362 2026-05-15 cs.SE cs.AI

Correctness-Aware Repository Filtering Under Maximum Effective Context Window Constraints

Shweta Mishra

发表机构 * Independent Researcher（独立研究者）

AI总结该研究针对大语言模型在开发工具中面临的上下文窗口效率问题，提出了一种基于文件大小的预执行过滤框架，用于在代码仓库扫描前高效剔除超出上下文限制的非代码文件。该方法仅依赖操作系统级别的元数据，具有极低的计算开销，能够在不进行索引和语义分析的情况下实现快速过滤。实验表明，该方法在多个开源仓库中显著减少了输入令牌数量，同时提升了代码生成的准确性并降低了幻觉发生率。

2605.14360 2026-05-15 cs.HC cs.CL

A Formative Study of Brief Affective Text as a Complement to Wearable Sensing for Longitudinal Student Health Monitoring

Tamunotonye Harry, Johanna Hidalgo, Matthew Price, Yuanyuan Feng, Kathryn Stanton, Connie Tompkins, Peter Sheridan Dodds, Mikaela Irene Fudolig, Laura Bloomfield, Christopher Danforth

发表机构 * University of Vermont（佛罗里达大学）； University of Vermont Department of Computer Science（佛罗里达大学计算机科学系）； University of Vermont Department of Psychological Science（佛罗里达大学心理学科学系）； University of Vermont Vermont Complex Systems Center（佛罗里达大学复杂系统中心）； University of Vermont Department of Rehabilitation（佛罗里达大学康复与运动科学系）； University of Vermont MassMutual Center of Excellence in Complex Systems（佛罗里达大学复杂系统与数据科学卓越中心）； Adelaide University School of Mathematical Sciences（阿德莱德大学数学科学学院）； University of Vermont Department of Mathematics（佛罗里达大学数学系）； Adelaide University（阿德莱德大学）

AI总结该研究探讨了如何通过简短的情绪文本补充可穿戴设备的数据，以更全面地监测大学生的长期健康状况。研究采用开放式问题收集学生关于自身担忧的简短回答，并结合可穿戴设备数据，利用多种自然语言处理方法分析情绪与睡眠、活动等健康指标的关系。结果表明，情绪表达而非具体话题内容对健康指标有显著影响，提示简短情绪反馈可有效提升被动生理数据的心理可解释性。

Comments Submitted to ACM IMWUT

2605.14351 2026-05-15 eess.SY cs.LG cs.SY

Randomized Atomic Feature Models for Physics-Informed Identification of Dynamic Systems

Rajiv Singh, Mario Sznaier, Lennart Ljung

发表机构 * The MathWorks Inc.（MathWorks公司）； ECE Dept., Northeastern University（东北大学电子工程系）

AI总结本文提出了一种基于随机稳定原子特征的物理信息系统识别框架，通过将脉冲响应表示为稳定极点所关联的阻尼复指数的随机叠加，将系统识别转化为带有线性、二阶锥和KYP约束的凸正则化最小二乘问题。该方法推广了随机傅里叶和拉普拉斯特征，适用于工程系统中的阻尼非平稳情形，同时保持模态可解释性和可扩展的有限维计算。研究还从算子理论角度分析了稳定极点正测度生成正定核的特性，并给出了核空间到ℓ₁空间的嵌入、随机特征收敛性以及稀疏恢复的条件保证。

Comments Extended version of the conference paper submitted for IFAC World Congress, 2026

2605.14331 2026-05-15 eess.SP cs.AI cs.ET cs.IT cs.LG math.IT

Analog RF Computing: A New Paradigm for Energy-Efficient Edge AI Over MU-MIMO Systems

Wentao Yu, Vincent W. S. Wong

发表机构 * Department of Electrical and Computer Engineering, The University of British Columbia（电气与计算机工程系，不列颠哥伦比亚大学）

AI总结本文提出了一种基于模拟射频（RF）计算的新范式，用于在多用户多输入多输出（MU-MIMO）无线系统中实现高效节能的边缘人工智能推理。该方法通过基站广播编码的神经网络权重波形，客户端利用无源混频器进行本地输入编码波形的乘法运算，从而在无线接收端高效完成矩阵-向量乘法操作。研究设计了一种面向计算的物理层框架，优化了计算精度与能耗之间的平衡，并提出了一种低复杂度算法解决非凸优化问题，实验表明该方法相比传统数字计算可将客户端能耗降低近两个数量级，为边缘推理提供了高效的无线计算新途径。

Comments 13 pages, 6 figures, 2 tables. This paper proposes analog RF computing as a new paradigm for energy-efficient edge inference over wireless networks and studies the corresponding physical layer design framework

详情

英文摘要

Modern edge devices increasingly rely on neural networks for intelligent applications. However, conventional digital computing-based edge inference requires substantial memory and energy consumption. In analog radio frequency (RF) computing, a base station (BS) encodes the weights of the neural networks and broadcasts the RF waveforms to the clients. Each client reuses its passive mixer to multiply the received weight-encoded waveform with a locally generated input-encoded waveform. This enables wireless receivers to perform the matrix-vector multiplications (MVMs) that account for most of the computation burden in edge inference with ultra-low energy consumption. Unlike conventional downlink transmissions which are optimized for communications, analog RF computing requires a computing-centric physical layer that controls both the analog MVM accuracy and the energy consumption for inference. Motivated by this, in this paper, we propose a physical layer design framework for analog RF computing in MU-MIMO wireless systems. We derive tractable models for computing accuracy and energy consumption for inference, formulate a joint BS beamforming and client-side scaling problem subject to computing accuracy, transmit power, and hardware constraints, and develop a low-complexity algorithm to solve the non-convex problem. The proposed design provides client- and layer-specific accuracy control for both uniform- and mixed-precision inference. Simulations under 3GPP specifications show that analog RF computing can significantly reduce client-side energy consumption by nearly two orders of magnitude compared to digital computing, while mixed-precision inference requires even lower energy consumption than uniform-precision inference. Overall, these results establish analog RF computing over wireless networks as a promising paradigm for energy-efficient edge inference.

URL PDF HTML ☆

赞 0 踩 0

2605.14291 2026-05-15 cs.CR cs.AI cs.CL cs.CV cs.LG

To See is Not to Learn: Protecting Multimodal Data from Unauthorized Fine-Tuning of Large Vision-Language Model

Chengshuai Zhao, Zhen Tan, Dawei Li, Zhiyuan Yu, Huan Liu

发表机构 * School of Computing ； Augmented Intelligence, Arizona State University, Tempe, AZ, USA ； Department of Computer Science ； Engineering, Texas A\&M University, College Station, TX, USA

AI总结随着大型视觉-语言模型（LVLMs）的快速发展，未经授权的数据抓取和微调行为带来了严重的版权和隐私风险。为此，本文提出MMGuard，通过注入人类不可感知的扰动生成“不可学习”的示例，主动防御数据被用于未经授权的LVLM微调。该方法利用模型的学习动态，制造优化捷径，使模型在训练时过度拟合噪声，从而在推理时性能下降。此外，MMGuard引入跨模态关联破坏策略，增强防御效果，并在多种威胁模型下展现出高效、隐蔽且鲁棒的保护能力。

AI 大模型

视觉与机器人

科学与医疗