arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.09378 2026-05-12 cs.CV cs.AI cs.CL

EduStory: A Unified Framework for Pedagogically-Consistent Multi-Shot STEM Instructional Video Generation

Xinyi Wu, Jayant Teotia, Shuai Zhao, Erik Cambria

发表机构 * Nanyang Technological University（南洋理工大学）； Shanghai Jiao Tong University（上海交通大学）

AI总结 EduStory 是一个统一的框架，旨在生成符合教学逻辑的多镜头STEM教学视频。该方法通过整合教学状态建模、脚本引导的结构化控制以及面向学习的评估指标，有效提升了视频在知识一致性和教学叙事连贯性方面的表现。研究还引入了 EduVideoBench 评估基准，支持对生成视频的多粒度分析与评估，实验表明该框架在保持教学意图和知识准确性方面具有显著优势。

2605.09376 2026-05-12 cs.RO

Mismatch-Aware Adaptive Constraint Tightening for Bicycle-Model Trajectory Optimization

Lingxue Lyu, Zihui Liu

发表机构 * School of Engineering and Applied Science, University of Pennsylvania（宾夕法尼亚大学工程与应用科学学院）； Department of Aeronautics & Astronautics, Stanford University（斯坦福大学航空与航天工程系）

AI总结本文针对自动驾驶车辆轨迹优化中因模型与实际动力学不匹配导致的安全约束违反问题，提出了一种基于模型失配特性的自适应约束收紧方法。研究通过理论分析得出了特征速度、偏差与时间平方成正比的规律，并推导出仅依赖车辆参数和规划时域的解析系数，从而构建了状态相关的约束收紧公式。实验表明，该方法在保证安全性的前提下显著减少了冗余安全余量，适用于多种车辆模型并在闭环MPC中表现出优越性能。

2605.09369 2026-05-12 cs.AI

Explainable Knowledge Tracing via Probabilistic Embeddings and Pattern-based Reasoning

Siyu Wu, Cong Xu, Wei Zhang

发表机构 * Shanghai Institute of AI Education, East China Normal University, Shanghai, 200241, China（上海人工智能教育研究院，华东师范大学，上海，200241，中国）； Shool of Computer Sicence and Technology, East China Normal University, Shanghai, 200241, China（计算机科学与技术学院，华东师范大学，上海，200241，中国）

AI总结该论文提出了一种可解释的知识追踪模型PLKT，旨在解决传统深度学习模型在预测学生知识状态时缺乏可解释性的问题。PLKT采用概率嵌入和基于模式的推理方法，将知识状态表示为贝塔分布的随机变量，并通过显式的逻辑运算构建透明的推理路径，从而揭示历史学习行为如何影响预测结果。实验表明，PLKT在保持高预测性能的同时，显著提升了模型的可解释性。

2605.09365 2026-05-12 cs.AI cs.CL

Position: Avoid Overstretching LLMs for every Enterprise Task

Kuldeep Singh, Anson Bastos, Isaiah Onando Mulang'

发表机构 * Eka Labs AI ； Microsoft（微软）； SAP

AI总结本文探讨了在企业任务中过度依赖大语言模型（LLM）可能带来的效率低下和可靠性问题，指出企业任务通常具有确定性、结构化和知识依赖性，且对成本、延迟和可靠性有严格要求。作者主张应将语言模型作为接口而非单一引擎，将知识和计算分离到专用组件中，以提高系统的可靠性、可扩展性和透明度。研究理论证明了有限容量的模型难以全面覆盖企业任务所需的知识范围，并提出应将语言模型主要用于结构化信息提取，而将计算和存储任务委托给知识库和符号处理流程，从而构建更可靠和可持续的企业级AI架构。

2605.09364 2026-05-12 cs.LG

Multi-scale Predictive Representations for Goal-conditioned Reinforcement Learning

Valliappan Chidambaram Adaikkappan, David Meger, Sai Rajeswar, Pietro Mazzaglia

发表机构 * Mila, McGill University（蒙特利尔大学Mila实验室）； ServiceNow Research（ServiceNow研究）； Qualcomm Research（高通研究）

AI总结本文研究了在离线目标条件强化学习（GCRL）中鲁棒表征学习的问题，特别是在稀疏奖励环境下，如何学习对齐状态和目标潜在表示的挑战。为了解决表征漂移问题，作者提出了一种基于多尺度预测监督的框架Ms.PR，使智能体能够从局部物理动态到长期目标结构等多个尺度理解环境，从而在潜在空间中实现目标导向的对齐。实验表明，Ms.PR在视觉和状态任务中均表现出优异的表征质量和性能，并在多种复杂数据条件下展现出强大的鲁棒性。

2605.09363 2026-05-12 cs.LG

Near-Optimal Last-Iterate Convergence for Zero-Sum Games with Bandit Feedback and Opponent Actions

Soumita Hait, Ping Li, Haipeng Luo, Mengxiao Zhang

发表机构 * University of Southern California（南加州大学）； Shanghai University of Finance and Economics（上海财经大学）； University of Iowa（爱荷华大学）

AI总结本文研究了在零和博弈中，当玩家仅能观测到自身损失以及对手动作时，学习动态的最后迭代收敛问题。作者提出了一种高效的算法，通过稀疏更新策略并求解估计的对数障碍正则化博弈，实现了以高概率达到 $t^{-1/2}$ 的最后迭代收敛率。该工作克服了传统多臂老虎机分析在博弈场景中的局限性，实验表明该算法相比现有方法收敛更快，同时其结果也改进了对战老虎机这一特例的已有成果。

2605.09360 2026-05-12 cs.LG cs.AI cs.CL cs.SE

Your Simulation Runs but Solves the Wrong Physics: PDE-Grounded Intent Verification for LLM-Generated Multiphysics Simulation Code

Zhenghan Song, Yulong Liu, Cheng Wan, Chenjun Li, Lingfu Liu, Yunyi Li, Congcong Yuan

发表机构 * Cornell University（康奈尔大学）； Columbia University（哥伦比亚大学）； Harvard University（哈佛大学）； Nanyang Technological University（南洋理工大学）

AI总结该论文研究了大语言模型生成的多物理场仿真代码与用户意图之间的不匹配问题，提出了基于偏微分方程（PDE）的意图验证方法。通过构建意图保真度分数（IFS）并设计基于PDE的修正循环，该方法能够检测并修正生成代码中与用户意图不符的物理方程、边界条件等关键部分。实验表明，该方法在多个基准测试中显著提升了代码的意图一致性，揭示了可执行性与物理正确性应作为两个独立的验证维度。

Comments Preprint

2605.09359 2026-05-12 cs.LG cs.AI

Skill-R1: Agent Skill Evolution via Reinforcement Learning

Yash Vishe, Rohan Surana, Xunyi Jiang, Zihan Huang, Xintong Li, Nikki Lijing Kuang, Tong Yu, Ryan A. Rossi, Jingbo Shang, Julian McAuley, Junda Wu

发表机构 * UC San Diego（UC圣地亚哥大学）； Adobe Research（Adobe研究院）

AI总结该研究提出了一种名为Skill-R1的强化学习框架，用于通过可验证奖励进行实例级别的技能递归优化。与传统依赖提示工程或对任务模型本身进行对齐的方法不同，Skill-R1训练一个轻量级的技能生成器，根据任务上下文、历史执行结果及其验证反馈生成指导冻结任务模型的技能，从而实现低成本且兼容开源与闭源模型的适应。通过引入双层组相对策略优化目标，Skill-R1有效地实现了技能的定向进化，实验表明其在多个基准任务上优于无技能基线和标准GRPO方法，尤其在复杂多步骤任务中表现突出。

详情

英文摘要

Agentic large language models often rely on skills, reusable natural language procedures that guide planning, action, and tool use. In practice, skills are typically improved through prompt engineering or by aligning the task LLM itself, which is costly, model-specific, and often infeasible for closed-source models. Skill optimization is not a one-step problem but a recurrent process with two coupled levels of credit assignment: a useful skill must improve rollout quality under current conditioning, while a useful revision must turn observed outcomes into a better skill for the next round. We propose Skill-R1, a reinforcement learning framework for instance-level recurrent skill optimization from verifiable rewards. Rather than updating the task LLM, Skill-R1 trains a lightweight skill generator that conditions on the task context, prior rollouts, and their verified outcomes to produce skills that steer a frozen task LLM. This preserves black-box compatibility with both open- and closed-source models while making adaptation substantially cheaper than model-level updates. Skill-R1 proceeds over multiple generations: at each step, the current skill induces rollouts whose verified outcomes are fed back to produce the next revision. To optimize this recurrent process, we introduce a bi-level group-relative policy optimization objective combining intra-generation and inter-generation advantages. The intra-generation term compares rollouts under shared skill conditioning, while the inter-generation term rewards revisions that improve behavior across successive generations. Together, these provide a principled objective for directional skill evolution rather than one-shot self-refinement. Empirically, Skill-R1 achieves consistent gains over no-skill baselines and standard GRPO across benchmarks with verifiable rewards, with particularly strong improvements on complex, multi-step tasks.

URL PDF HTML ☆

赞 0 踩 0

2605.09356 2026-05-12 cs.LG cs.NI

Function-Space ADMM for Decentralized Federated Learning: A Control Theoretic Perspective

Akihito Taya, Yuuki Nishiyama, Kaoru Sezaki

发表机构 * Institute of Industrial Science, The University of Tokyo（东京大学工业科学研究所）； Center for Spatial Information Science, The University of Tokyo（东京大学空间信息科学中心）

AI总结本文从控制理论的角度出发，提出了一种基于函数空间的分布式联邦学习算法FedF-ADMM，用于解决在无中心服务器的边缘设备网络中训练机器学习模型时面临的数据非独立同分布问题。该方法通过在函数空间中利用损失泛函的凸性，推导出基于ADMM的更新方向，并通过知识蒸馏将其投影到参数空间，从而提升模型训练的收敛性能和鲁棒性。实验表明，FedF-ADMM在严重非独立同分布场景下具有更快的收敛速度、更高的准确率和更好的设备间一致性。

Comments (c) 2026 IEEE. Personal use of this material is permitted. Permission from IEEE must be obtained for all other uses, in any current or future media, including reprinting/republishing this material for advertising or promotional purposes, creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works

Journal ref IEEE Internet of Things Journal, 2026

2605.09355 2026-05-12 cs.LG

FLAME: Adaptive Mixture-of-Experts for Continual Multimodal Multi-Task Learning

Xing Han, Shravan Chaudhari, Tanvi Ranade, Rama Chellappa, Suchi Saria

发表机构 * Johns Hopkins University（约翰霍普金斯大学）

AI总结本文提出了一种名为FLAME的自适应专家混合模型框架，用于支持多模态多任务的持续学习。该方法结合了多任务预训练与持续适应两种场景，通过模态特定的路由机制实现灵活的模态组合学习，并利用低秩记忆子空间压缩专家知识以提升参数效率并缓解灾难性遗忘。实验表明，该方法在多个医疗多模态基准上表现出优越的性能。

Comments 37 pages, 25 figures, 6 tables

2605.09352 2026-05-12 cs.AI

The Wittgensteinian Representation Hypothesis: Is Language the Attractor of Multimodal Convergence?

Zhaoyang Zhang, Run Shao, Dongyue Wu, Jiajie Teng, Chao Tao, Jingdong Chen, Haifeng Li

发表机构 * Central South University（中南大学）； Huazhong University of Science and Technology（华中科技大学）； Shanghai Jiao Tong University（上海交通大学）； Ant Group（蚂蚁集团）

AI总结本文探讨了为何不同模态的独立训练神经网络会收敛到共享表示，并研究了这一收敛的方向性。作者提出了一种基于循环k近邻的定向收敛分析方法，发现非语言模态更倾向于向语言表示的结构靠拢，这一现象在多种模型和尺度下均成立。研究进一步指出，语言表示在表征空间中占据更紧凑的区域，信息瓶颈理论为此提供了理论解释，最终提出了“维特根斯坦表征假设”：语言的语义结构是多模态表征收敛的渐近吸引子。

Comments 22 pages, 11 figures, 6 tables

2605.09350 2026-05-12 cs.AI

CHAINTRIX: A multi-pipeline LLM-augmented framework for automated smart-contract security auditing

Gabriela Dobrita, Simona-Vasilica Oprea, Adela Bara

发表机构 * Bucharest University of Economic Studies（布加勒斯特经济大学）

AI总结智能合约漏洞已导致数十亿美元的损失，但安全审计仍存在成本高、效率低的问题。为解决这一问题，本文提出 Chaintrix，一个结合多管道和大语言模型的自动化智能合约安全审计框架，其核心在于将所有大模型生成的检测结果与确定性的合约结构表示进行比对，以提升准确性。该框架引入了跨合约交互模型（CCIM）对 Solidity 代码进行结构化解析，并通过多阶段的误报过滤机制与结构化验证引擎，显著提升了检测效果，在多个基准测试中表现出色，高危漏洞召回率达71.7%，优于当前最先进的模型基线。

2605.09348 2026-05-12 cs.CL cs.AI cs.DB cs.MM

HOME-KGQA: A Benchmark Dataset for Multimodal Knowledge Graph Question Answering on Household Daily Activities

Shusaku Egami, Aoi Ohta, Tomoki Tsujimura, Masaki Asada, Tatsuya Ishigaki, Ken Fukuda, Masahiro Hamasaki, Hiroya Takamura

发表机构 * National Institute of Advanced Industrial Science（国家工业科学与技术研究院）

AI总结本文提出HOME-KGQA，一个用于家庭日常活动的多模态知识图谱问答新基准数据集。该数据集基于多模态知识图谱构建，包含复杂的多跳自然语言问题及对应的图数据库查询语言，涵盖了多层级时空推理和多模态对齐等更具挑战性的任务。实验表明，现有基于大语言模型的KGQA方法在该数据集上的表现显著下降，突显了现实场景中KGQA系统仍面临诸多挑战。

Comments 12 pages, 4 figures, 7 tables, accepted at LREC2026

2605.09347 2026-05-12 cs.AI cs.LO

Dsat: A Native SAT Solver for Discrete Logic

Yaofang Zhang, Ken Zhou, Adnan Darwiche

发表机构 * Department of Computer Science, University of California, Los Angeles（加州大学洛杉矶分校计算机科学系）

AI总结本文提出了一种专为离散逻辑设计的原生SAT求解器Dsat，用于处理变量可取任意离散值的逻辑问题，避免了传统将离散变量二值化为布尔变量的方法所带来的计算和语义挑战。该求解器在设计上借鉴了布尔SAT求解器的机制，如单元归结和子句学习，但直接在离散变量上运行，从而更高效地处理离散逻辑公式。实验表明，Dsat在解决离散CNF问题时相比传统方法具有明显优势。

Comments To Appear at The International Conferences on Theory and Applications of Satisfiability Testing (SAT), 2026

2605.09346 2026-05-12 cs.CL cs.AI

RuPLaR : Efficient Latent Compression of LLM Reasoning Chains with Rule-Based Priors From Multi-Step to One-Step

Xiaocheng Luo, Kang Wang, Zaifu Zhan, Yuechi Zhou, Xiangyu Duan

发表机构 * School of Computer Science and Technology（计算机科学与技术学院）； Department of Electrical and Computer Engineering（电气与计算机工程系）

AI总结本文提出了一种名为 RuPLaR 的新型压缩框架，旨在解决潜空间推理（latent CoT）中多步骤或多模型范式带来的结构复杂性问题。该方法通过引入基于规则的先验分布，引导大语言模型在单一训练阶段自主生成潜空间推理标记，从而消除级联过程和模型间依赖。实验表明，RuPLaR 在保持推理质量的同时显著提升了准确率，并大幅减少了所需标记数量，展现出良好的有效性和可扩展性。

Comments 15 pages, 15 figures

2605.09345 2026-05-12 cs.LG

Selection Plateau and a Sparsity-Dependent Hierarchy of Pruning Features

Guangqi Li, Yongxin Li

发表机构 * Zaozhuang University（邹庄大学）

AI总结本文研究了一次性神经网络剪枝中的“选择平台”现象，发现所有单调秩权重评分方法在固定稀疏度下会收敛到相同的准确率，与具体形式无关。作者提出了稀疏度-信息-复杂度光谱（SICS）假说，指出不同稀疏度下需要不同复杂度的特征来突破平台，且特征复杂度需与目标稀疏度匹配。实验表明，非单调特征在中等稀疏度下能显著提升剪枝效果，而仅靠梯度或简单高斯特征则效果有限，说明特征复杂度和秩对齐对剪枝性能至关重要。

Comments 22 pages, 3 figures, 5 tables. Empirical study + framework hypothesis on ViT-Small/CIFAR-10. Cross-domain validation (vision token pruning, KV cache compression, MoE routing) and cross-architecture extensions deferred to follow-up work

2605.09344 2026-05-12 cs.RO cs.MA

PECMAN: Perception-enabled Collaborative Multi-Agent Navigation in Unknown Environments

Tianchonghui Fang, Shaunak Roy, Shalabh Gupta

发表机构 * Department of Electrical and Computer Engineering, University of Connecticut（电子与计算机工程系，康涅狄格大学）

AI总结该研究针对未知动态环境中多智能体协作导航的问题，提出了一种基于感知增强的协同导航方法PECMAN。该方法通过分布式树形结构重构和共享感知策略，使每个智能体能够实时响应环境变化并调整路径，同时将新发现的信息广播给其他智能体，提升整体协同效率。实验表明，PECMAN在多个场景中显著降低了团队完成时间，同时保持了高成功率。

2605.09343 2026-05-12 cs.AI

SKG-VLA: Scene Knowledge Graph Priors for Structured Scene Semantics and Multimodal Reasoning for Decision Making

Zeyu Li, Lei Li

发表机构 * Beijing University of Posts and Telecommunications（北京邮电大学）

AI总结在大规模投诉处理系统中，决策日益依赖于多源异构证据，如投诉叙述、截图、订单元数据等。为解决现有系统对场景结构、规则知识和跨证据依赖利用不足的问题，本文提出SKG-VLA方法，通过构建场景知识图（SKG）来统一表示投诉场景中的实体、证据、政策条款及关系，并基于该图谱设计数据合成流程和三阶段训练策略，以增强模型的结构化语义理解和多模态决策能力。实验表明，SKG-VLA在政策驱动推理、投诉决策准确性及鲁棒性方面均有显著提升。

2605.09339 2026-05-12 cs.CV cs.AI

Perceptual Asymmetry Between Hue Categories: Evidence from Human Color Categorization

Elnara Kadyrgali, Nuray Toganas, Muragul Muratbekova, Pakizar Shamoi

发表机构 * School of Information Technology and Engineering（信息科技与工程学院）； Kazakh-British Technical University（哈萨克-英国技术大学）

AI总结人类颜色类别在感知空间中并非均匀分布，但大多数计算颜色模型仍假设颜色表示是固定且均匀的。本文通过分析大规模人类颜色分类数据，扩展了COLIBRI模糊颜色模型，引入了基于模糊隶属函数的定量指标，揭示了色相类别间的感知不对称性。研究发现，黄色类别在色相空间中占据紧凑且明确的区域，而绿色类别则覆盖更广的区间并具有更长的过渡结构，表明人类颜色类别不仅具有模糊性，其几何组织也高度不均匀，为语言颜色分类和感知驱动的颜色建模提供了新的视角。

Comments The paper has been submitted for consideration to ICICS 2026 (International Conference on Informatics and Computer Science)

2605.09337 2026-05-12 cs.LG math.OC

Adversary-Robust Learning from Fully Asynchronous Directional Derivative Estimates

Anik Kumar Paul, Nibedita Roy, Nagesh Talagani, Swetha Ganesh, Gugan Thoppe, Alexandre Reiffers-Masson

发表机构 * Computer Science and Automation, Indian Institute of Science（印度科学研究院计算机科学与自动化系）； Edwardson School of Industrial Engineering, Purdue University（普渡大学埃德沃兹工业工程学院）； Department of Computer Science, IMT Atlantique（IMT阿登提大学计算机科学系）

AI总结本文提出了一种名为 FAR-SIGN 的异步优化算法，用于在参数服务器-工作节点系统中实现对抗鲁棒学习。该方法通过沿精心设计的方向进行符号梯度更新，并结合双时间尺度机制减少偏差，从而提高鲁棒性。FAR-SIGN 支持一阶和零阶实现，无需服务器端的私有参考数据集，且支持完全异步执行。理论分析表明其几乎必然收敛于光滑非凸目标函数的平稳点，并在实验中表现出优于现有鲁棒聚合方法的准确率和运行效率。

2605.09335 2026-05-12 cs.LG

Functional Graphs for Predicting and Explaining Goal Failure in Sparse Goal-Conditioned RL

Shalley Dash

发表机构 * Institute of Management Technology（管理技术学院）

AI总结该研究探讨了稀疏目标条件强化学习中策略失败的问题，提出通过确定性功能图分析策略行为，揭示出策略中的吸引子和流域结构。研究定义了局部目标支持（LGS）作为衡量策略在局部范围内能否成功达到目标的指标，并发现LGS可以有效诊断目标失败。进一步引入了策略诱导图的分类方法，以识别超出局部支持范围的失败模式，为理解稀疏目标条件强化学习中的失败提供了结构化分析工具。

Comments 9 pages main, 21 pages appendx, 2 figures in main. 8 figures in appendix, Submitted to a conference

2605.09331 2026-05-12 cs.LG

Dimension-Free Saddle-Point Escape in Muon

Yanlin Long, Yufei Gu, Zeke Xie

发表机构 * xLeaF Lab, The Hong Kong University of Science and Technology (Guangzhou)（xLeaF实验室，香港理工大学（广州））

AI总结本文研究了现代大语言模型训练中因高维平坦马鞍点导致的优化瓶颈问题，分析了新兴优化器Muon在逃离马鞍点的动力学特性。通过扩展广义矩阵扰动理论，提出了一种理论框架，证明Muon通过非线性谱塑形机制有效规避了维度诅咒，实现了维度无关的马鞍点逃离。该方法避免了同向噪声假设和Tracy-Widom边缘奇异性，为非凸优化动力学提供了严格的数学分析和逃逸界限。

Comments 33 pages, 5 figures. Preprint

2605.09330 2026-05-12 cs.LG cs.AI

The Trap of Trajectory: Towards Understanding and Mitigating Spurious Correlations in Agentic Memory

Luoxi Tang, Rupali Rajendra Vaje, Yuqiao Meng, Sakshi Sunil Narkar, Weicheng Ma, Zeyu Ding, Dazheng Zhang, Zhaohan Xi

发表机构 * Binghamton University, State University of New York（宾夕法尼亚州立大学）； Oakland University（奥克兰大学）； University of Pennsylvania（宾夕法尼亚大学）

AI总结该论文研究了智能体记忆（Agentic Memory）中因错误关联导致的推理偏差问题，指出在长期记忆中检索到的信息可能包含误导性证据，从而影响后续决策的准确性。为解决这一问题，研究者提出了CAMEL方法，通过在记忆写入和检索阶段进行校准，有效减少了对虚假关联的依赖，同时保持了模型在正常输入上的性能，并在对抗性攻击下仍表现出鲁棒性。这一方法为构建更可靠、更安全的智能体记忆系统提供了实用的解决方案。

2605.09328 2026-05-12 cs.CV

Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement

Wei Zhu, Kai Zhang, Yu Zheng, Lei Luo, Yong Guo, Jian Yang

发表机构 * Nanjing University of Science and Technology（南京理工大学）； Nanjing University（南京大学）； Huawei（华为）

AI总结该研究提出了一种基于扩散模型的单步真实世界图像超分辨率方法SMFSR，旨在解决传统扩散模型在效率与质量之间的矛盾。该方法在保持噪声起始生成过程的基础上，通过LR条件下的SplitMeanFlow实现从噪声到高分辨率图像的直接映射，并引入GAN优化阶段提升细节真实感和图像自然度。实验表明，SMFSR在保持高效单步推理的同时，达到了当前单步扩散模型在真实世界超分辨率任务中的最优感知质量。

2605.09319 2026-05-12 cs.CV cs.LG

PGID: Progressive Guided Inversion and Denoising for Robust Watermark Detection

Minh Quoc Duong, Chun Tong Lei, Chun Pong Lau

发表机构 * City University of Hong Kong（香港城市大学）

AI总结随着AI生成图像的普及，数字水印技术成为保护知识产权和防止恶意利用的重要手段。然而，现有的语义水印方法依赖扩散模型逆过程进行水印检测，容易受到印痕移除和伪造攻击的影响。本文提出了一种名为PGID的渐进引导逆过程与去噪框架，无需训练即可有效防御这些攻击，通过逐步逆过程和去噪循环将扰动的潜在变量投影回其原始区域，从而恢复被移除的水印并识别伪造实例。

2605.09317 2026-05-12 cs.CL cs.CV cs.LG

Mem-W: Latent Memory-Native GUI Agents

Guibin Zhang, Yaohui Ling, Fanci Meng, Kun Wang, Shuicheng Yan

发表机构 * LV-NUS Lab（LV-NUS实验室）

AI总结本文提出了一种名为 Mem-W 的新型 GUI 智能体，其核心在于将记忆作为智能体连续上下文的一部分，而非传统的外部辅助结构。通过一个共享的轨迹到潜空间压缩器，Mem-W 将历史轨迹和当前会话片段编码为紧凑的记忆标记，并将其与当前 GUI 观测融合为连续的嵌入序列，从而实现对任务进展的统一感知与决策。实验表明，Mem-W 在多个网页和移动端导航任务中显著提升了多种基础模型和增强记忆方法的性能，最高提升达 30.0%，展示了潜空间原生记忆在长时程 GUI 操作中的有效性与扩展性。

2605.09315 2026-05-12 cs.AI cs.CL

Do Self-Evolving Agents Forget? Capability Degradation and Preservation in Lifelong LLM Agent Adaptation

Ye Yu, Xiaopeng Yuan, Haibo Jin, Heming Liu, Yaoning Yu, Haohan Wang

发表机构 * University of Illinois Urbana-Champaign（伊利诺伊大学厄巴纳-香槟分校）

AI总结本文研究了大型语言模型代理在持续适应新任务过程中出现的能力退化问题，指出在工作流、技能、模型和记忆等多个进化维度上，自我演化可能导致已习得能力的逐步丧失。为此，作者提出了能力保持演化（CPE）方法，通过约束演化过程中的破坏性能力漂移，在保持适应性能的同时提升已有能力的稳定性。实验表明，CPE在多个任务场景下有效缓解了能力退化，为构建稳定、长期自我演化的智能代理提供了新思路。

2605.09314 2026-05-12 cs.AI

How LLMs Are Persuaded: A Few Attention Heads, Rerouted

Xiangkun Sun, Lingkai Kong, Aoqi Zhang, Liang Zeng, Tonghan Wang

发表机构 * Northeastern University（东北大学）； Harvard University（哈佛大学）； Tsinghua University（清华大学）； Skywork AI

AI总结该研究探讨了大型语言模型如何被说服放弃事实知识的问题，揭示了其内部的因果机制。研究发现，模型的回答主要由少数中间层注意力头决定，这些注意力头将选项编码为低维多面体的顶点，说服过程实际上是一个从正确答案顶点到目标答案顶点的离散跳跃。通过干预实验，研究进一步确认了说服机制依赖于一个可操控的注意力路由特征，并追踪到输入中的说服关键词所构建的浅层注意力头，为监控和防御此类漏洞提供了新思路。

Comments 9 pages, 9 figures

2605.09312 2026-05-12 cs.CV

Low-Cost Neural Radiance Fields

Alice Huang, Prathamesh Sonawane, Yashdeep Thorat, Yug Rao

发表机构 * University of Illinois Urbana Champaign（伊利诺伊大学厄巴纳-香槟分校）

AI总结本文研究了如何在计算资源和数据量受限的情况下加速神经辐射场（NeRF）的训练与推理。作者对比了三种加速版NeRF模型，并针对低算力、低数据场景进行了扩展实验，包括引入深度监督损失、简化特征解码网络以及设计不同架构的HashNeRF。实验结果表明，在同等训练时间下，各改进方法未明显优于现有基线，但揭示了哪些改进更适合受限环境，并为未来研究提供了方向。

Comments 7 pages

2605.09311 2026-05-12 cs.LG cs.AI physics.atom-ph physics.chem-ph physics.comp-ph

Teaching Molecular Dynamics to a Non-Autoregressive Ionic Transport Predictor

Jiyeon Kim, Byungju Lee, Won-Yong Shin

发表机构 * School of Mathematics and Computing (Computational Science and Engineering)（数学与计算学院（计算科学与工程））； Yonsei University（延世大学）； Korea Institute of Science and Technology（韩国科学技术院）； Nanoscience and Technology（纳米科学与技术）

AI总结本文研究了如何快速准确地预测离子传输性质这一动态材料属性的问题，提出了一种基于辅助模态学习的非自回归学习框架，通过在训练过程中引入原子轨迹作为辅助信息，使模型在推理阶段无需依赖轨迹数据即可捕捉动态特性。该方法克服了现有自回归模型计算慢、误差累积以及非自回归模型动态信息利用不足的缺陷，在包含轨迹数据的测试集上实现了比自回归模型快200倍的加速，并显著降低了预测误差。

Comments International Conference on Machine Learning (ICML 2026) (to appear) (Please cite our conference version.)

AI 大模型

视觉与机器人

科学与医疗