arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.09820 2026-05-12 cs.LG

Dystruct: Dynamically Structured Diffusion Language Model Decoding via Bayesian Inference

Bian Sun, Kevin Zhai, Mubarak Shah, Zhenyi Wang

发表机构 * University of Central Florida（中央佛罗里达大学）

AI总结本文提出了一种基于贝叶斯推理的动态结构化扩散语言模型解码方法Dystruct，旨在解决现有扩散语言模型在生成长度固定、灵活性不足的问题。该方法无需额外训练，通过将可变长度生成建模为动态结构推理问题，联合优化生成长度、块边界和解码计划，从而实现灵活的块扩展与组织，同时保持生成内容的一致性。实验表明，该方法在多个基准上显著提升了生成质量与灵活性，为结构化文本生成提供了原理清晰且高效的解决方案。

2605.09818 2026-05-12 cs.LG

Learning to Compress Time-to-Control: A Reinforcement Learning Framework for Chronic Disease Management

Prabhjot Singh, Abhishek Gupta, Chris Betz, Abe Flansburg, Brett Ives, Sudeep Lama, Jung Hoon Son

发表机构 * Altitude

AI总结该研究提出了一种基于强化学习的慢性病管理框架，旨在通过压缩疾病控制时间（TTC）来优化长期治疗效果。研究引入了两个关键结构要素——执行强度和临床能力权重，将偏好学习与强化学习结合，构建了双循环架构，以应对医疗强化学习中奖励稀疏和策略评估不稳定等问题。实验表明，该方法在糖尿病等慢性病的模拟环境中显著优于传统方法，具有更好的跨场景泛化能力。

Comments 26 pages, 3 figures

2605.09811 2026-05-12 cs.RO

Above and Below: Heterogeneous Multi-robot SLAM Across Surface and Underwater Domains

John McConnell, Armon Shariati, Paul Szenher, Yaxuan Li

发表机构 * United States Naval Academy（美国海军学院）； Shield-AI ； Stevens Institute of Technology（史蒂文斯理工学院）

AI总结本文研究了水面无人船（USV）与水下自主水下机器人（AUV）之间的异构多机器人同步定位与建图（SLAM）问题。传统方法依赖声学测距，受限于环境干扰和同步要求，本文提出一种基于视觉回环检测的集中式多机器人SLAM系统，通过融合USV与AUV的感知数据实现状态估计的协同优化。实验表明，该方法在多机器人协作场景下显著提升了AUV的定位精度，是首个基于回环检测而非声学测距的异构多机器人SLAM系统。

2605.09808 2026-05-12 cs.CL

Quantifying the Utility of User Simulators for Building Collaborative LLM Assistants

Joseph Suh, Ayush Raj, Minwoo Kang, Serina Chang

发表机构 * UC Berkeley（加州大学伯克利分校）

AI总结本文研究了用户模拟器在构建协作式大语言模型助手中的效用评估问题，提出通过助手在真实环境中与人类交互的表现来衡量模拟器质量。通过对比不同用户模拟器（包括基于角色扮演的LLM和基于真实对话数据微调的模拟器）训练出的助手性能，实验表明基于真实数据微调的模拟器能显著提升助手表现，而基于角色扮演的模拟器即使经过优化也难以缩小差距。研究进一步揭示了模拟器模型规模、真实性增强方法等对训练效果的影响，强调应以实际用户表现作为评估用户模拟器质量的核心标准。

2605.09806 2026-05-12 cs.LG cs.AI

LEAD: Length-Efficient Adaptive and Dynamic Reasoning for Large Language Models

Songtao Wei, Yi Li, Zhikai Li, Xu Hu, Yuede Ji, Guanpeng Li, Feng Chen, Carl Yang, Zhichun Guo, Bingzhe Li

发表机构 * University of Texas at Dallas（德克萨斯大学达拉斯分校）； Emory University（埃默里大学）； Individual Researcher（独立研究员）； University of Texas at Arlington（德克萨斯大学阿灵顿分校）； University of Florida（佛罗里达大学）

AI总结本文提出了一种名为LEAD的方法，旨在解决大型语言模型在推理过程中输出冗长、效率低下的问题。LEAD通过引入在线自适应机制，动态调整正确性与效率之间的平衡，并根据模型自身的正确推理结果估计每道题的适配长度，从而在保证准确性的同时显著压缩输出长度。实验表明，LEAD在多个数学推理基准测试中取得了最高的准确率和效率综合评分。

2605.09802 2026-05-12 cs.CV cs.AI cs.LG

CrossVL: Complexity-Aware Feature Routing and Paired Curriculum for Cross-View Vision-Language Detection

Zhipeng Liu, Chunbo Luo

发表机构 * Department of Computer Science, University of Exeter（埃克塞特大学计算机科学系）

AI总结本文研究了跨视角（如地面与空中）场景下视觉-语言模型（VLM）的目标检测性能下降问题，提出了CrossVL框架，结合复杂度感知的特征路由机制和成对课程学习策略，以增强模型对不同视角图像的适应能力。该方法通过估计场景复杂度并动态路由视觉特征，以及利用同步地面-空中图像对的语义一致性进行渐进式训练，有效提升了检测精度和稳定性。实验表明，CrossVL在MAVREC数据集上显著提升了检测性能并缩小了不同视角间的性能差距。

Comments Accepted to CVPR 2026. Code available at https://github.com/1nyourlife/Crossvl_cvpr2026

2605.09801 2026-05-12 cs.RO

Efficient Multi-Robot Motion Planning with Precomputed Translation-Invariant Edge Bundles

Himanshu Gupta, Paul Motter, Aritra Chakrabarty, Rishabh Sodani, Srikrishna Bangalore Raghu, Alessandro Roncone, Bradley Hayes, Zachary Sunberg

发表机构 * Smead Aerospace Engineering Sciences, University of Colorado Boulder（科罗拉多大学博尔德分校航空航天工程科学系）； Department of Computer Science, University of Colorado Boulder（科罗拉多大学博尔德分校计算机科学系）； Cherry Creek High School, Greenwood Village, CO, USA（科罗拉多州格里诺村樱桃溪高中）

AI总结本文提出了一种名为KiTE-Extend的高效多机器人运动规划方法，通过预计算的平移不变轨迹段库来指导在线规划中的动作选择，从而提升现有规划器在生成无碰撞、动力学可行轨迹方面的能力。该方法不改变原有规划器的状态传播、碰撞检测和代价评估机制，同时保持其理论保证。实验表明，KiTE-Extend在多机器人场景中显著提升了规划效率和可扩展性，尤其在集中式、优先级和冲突基于的三种主流多机器人规划范式中表现突出。

2605.09795 2026-05-12 cs.CL

cantnlp@DravidianLangTech 2026: organic domain adaptation improves multi-class hope speech detection in Tulu

Andrew Li, Sidney Wong

发表机构 * Lake Washington School District（拉克华盛顿学区）； University of Otago（奥塔哥大学）； Te Pūnaha Matatini

AI总结本文介绍了在DravidianLangTech 2026会议上针对代码混合的图卢语（Tulu）希望言论检测任务所提出的系统与结果。研究采用基于XLM-RoBERTa的文本分类模型，通过有机收集的图卢语社交媒体文本进行领域适配，有效提升了希望言论检测的性能。实验表明，有机适配的模型在开发集上优于基线模型，为代码混合语言的希望言论检测提供了可行的改进方向。

Comments Accepted to Sixth Workshop on Speech, Vision, and Language Technologies for Dravidian Languages (DravidianLangTech-2026)

2605.09789 2026-05-12 cs.RO

Zero-Shot Sim-to-Real Robot Learning: A Dexterous Manipulation Study on Reactive Catching

Kejia Ren, Gaotian Wang, Andrew S. Morgan, Kaiyu Hang

发表机构 * Department of Computer Science, Rice University（计算机科学系，里士大学）； Robotics and AI Institute（机器人与人工智能研究所）

AI总结该研究探讨了如何在零样本条件下将模拟环境中学到的机器人操控策略直接应用于真实世界，特别针对需要高精度和快速反应的灵巧抓取任务。为解决模拟到现实迁移中的不确定性问题，作者提出了一种新的领域随机化方法——领域随机化实例集（DRIS），通过同时传播多个随机化实例，增强策略对现实动态变化的鲁棒性。实验表明，该方法在无需真实世界微调的情况下，能够实现可靠的零样本迁移，并在无需被动稳定结构的抓取任务中表现出优异的抗噪声能力。

2605.09778 2026-05-12 cs.LG cs.CL

Nectar: Neural Estimation of Cached-Token Attention via Regression

João Monteiro, Michal Klein, Pierre Ablin, Marco Cuturi

发表机构 * Apple（苹果公司）

AI总结该论文提出了一种名为Nectar的方法，用于高效估计长上下文中的缓存键值注意力。其核心思想是通过拟合一个紧凑的神经网络来近似注意力输出函数，从而避免对每个查询token遍历整个缓存的高计算开销。Nectar为每一层和每个KV头分别拟合目标网络和得分网络，分别预测注意力输出和对数归一化因子，在推理时替代传统的$O(n)$注意力计算，显著降低计算复杂度。实验表明，Nectar在多个大规模语言模型和长上下文数据集上有效逼近完整注意力的效果，并在生成任务中保持了语义内容的一致性。

2605.09775 2026-05-12 cs.LG math.OC

Bayesian Optimization with Structured Measurements: A Vector-Valued RKHS Framework

Wenbin Wang, Colin N. Jones

发表机构 * Automatic Control Laboratory, EPFL（瑞士联邦理工学院自动控制实验室）

AI总结本文研究了在结构化测量环境下进行贝叶斯优化的问题，其中每个观测值为多维或函数型输出，而非单一标量值。作者提出了一种基于向量值再生核希尔伯特空间（RKHS）的框架，将目标函数定义为这些测量的线性泛函，并在该空间中推导了核岭回归估计的高概率集中界。在此基础上，设计了一种具有置信上界（UCB）采集函数的算法，并在温和假设下给出了遗憾界，实验表明该方法能有效提升样本效率，适用于多目标和时变场景。

2605.09774 2026-05-12 cs.CV

DRIVE-C: A Controlled Corruption Dataset for Autonomous Driving

Shiva Aher

发表机构 * Georgia Institute of Technology（佐治亚理工学院）

AI总结 DRIVE-C 是一个用于评估自动驾驶系统视觉感知鲁棒性的受控退化数据集，由真实场景下的多种环境驾驶视频构建而成。该数据集通过物理启发的合成退化方法生成了包含10段干净视频和600段退化视频的多样化样本，并提供了详细的元数据和传感器健康指数标注。DRIVE-C 为自动驾驶感知系统的鲁棒性评估、退化感知建模、不确定性估计以及传感器健康监测提供了可控且可复现的测试平台。

2605.09773 2026-05-12 cs.CL cs.AI

Exploitation Without Deception: Dark Triad Feature Steering Reveals Separable Antisocial Circuits in Language Models

Cameron Berg, Roshni Lulla

发表机构 * Reciprocal Research ； Brain & Creativity Institute, University of Southern California（美国南加州大学脑与创造力研究所）

AI总结该研究利用稀疏自编码器（SAE）特征引导技术，在Llama-3.3-70B-Instruct模型中增强其“黑暗三联征”（马基雅维利主义、自恋和病态人格）特征，并通过五种心理测量工具评估其行为变化。结果显示，引导后的模型在新型情境中表现出更强的剥削性、攻击性和冷漠，但认知共情能力保持不变，重现了人类黑暗三联征人群的共情分离特征。研究还发现，剥削行为与欺骗机制可能通过不同的计算路径实现，且不同特征引导方式对干预深度有显著影响，表明模型中的反社会倾向可能由可分离的组件构成，而非统一的整体。

Comments 12 pages, 3 figures

2605.09771 2026-05-12 cs.AI

Marrying Generative Model of Healthcare Events with Digital Twin of Social Determinants of Health for Disease Reasoning

Ziquan Wei, Tingting Dan, Guorong Wu

发表机构 * Department of Computer Science（计算机科学系）； Department of Psychiatry（精神病学系）

AI总结该研究旨在提升疾病预测与推理的个性化能力，通过将生成模型与社会健康决定因素（SDoH）的数字孪生相结合，弥补现有模型对社会因素建模不足的问题。研究提出了一种基于ICD编码代理的条件潜扩散框架，能够同时建模多器官传感器数据与医疗事件的时序演化，特别是引入了用于刻画复杂数据（如脑网络）的几何扩散模型。实验表明，该方法在UK Biobank数据集上显著优于现有疾病生成模型和影像特征生成基线。

Comments 21 pages, 8 figures, ICML 2026

2605.09765 2026-05-12 cs.LG cs.AI

WISTERIA: Learning Clinical Representations from Noisy Supervision via Multi-View Consistency in Electronic Health Records

Ruan Dong, Yuanyun Zhang, Shi Li

发表机构 * University of Science and Technology of China（中国科学技术大学）； Columbia University（哥伦比亚大学）

AI总结本文提出了一种名为WISTERIA的弱监督表征学习框架，用于从电子健康记录（EHR）中学习临床表征。该方法将临床标签视为潜在临床状态的随机观测，通过构建多个弱监督操作符并强制其标签分布的一致性，实现对噪声标签的鲁棒学习。此外，该方法引入了基于本体的正则化以增强标签空间的语义结构，实验表明WISTERIA在多个EHR基准任务中表现出更优的预测性能、更强的噪声鲁棒性以及更好的跨机构泛化能力。

2605.09760 2026-05-12 cs.CL

ConFit v3: Improving Resume-Job Matching with LLM-based Re-Ranking

Xiao Yu, Ruize Xu, Chengyuan Xue, Junyu Chen, Matthew So, Shijun Ma, Bo Liu, Xiangye Liang, Zhou Yu

发表机构 * Columbia University（哥伦比亚大学）； John Hopkins University（约翰霍普金斯大学）； Intellipro Group Inc.（Intellipro集团）

AI总结本文提出 ConFit v3，一种基于大语言模型（LLM）的重排序方法，旨在提升简历与职位的匹配效果。研究分析了 LLM 重排序器在人岗匹配任务中的训练流程，并提出多项优化策略，如多轮重排序、列表级强化学习、去噪处理和从更强 LLM 进行知识蒸馏。基于这些改进，ConFit v3 在真实招聘数据上训练，显著优于现有最佳系统及主流大模型。

2605.09757 2026-05-12 cs.LG stat.ML

On Uniform Error Bounds for Kernel Regression under Non-Gaussian Noise

Johannes Teutsch, Oleksii Molodchyk, Marion Leibold, Timm Faulwasser, Armin Lederer

发表机构 * Chair of Automatic Control Engineering, Department of Computer Engineering, Technical University of Munich（自动控制工程学系，计算机工程系，慕尼黑技术大学）； Institute of Control Systems, Hamburg University of Technology（控制系统研究所，汉堡技术大学）； Department of Electrical and Computer Engineering, National University of Singapore（电子与计算机工程系，新加坡国立大学）

AI总结本文研究了在非高斯噪声环境下基于核回归的函数估计的非保守不确定性量化问题，提出了新的非渐近概率统一误差界。与以往仅适用于次高斯噪声的界不同，本文的界适用于更广泛的非高斯噪声分布，包括次高斯、有界、次指数以及方差/矩有界噪声，并且适用于相关和不相关噪声。通过与现有结果在不确定性区域和安全控制性能上的对比，验证了所提出误差界的紧致性。

Comments This paper has been accepted at the 43rd International Conference on Machine Learning (ICML) 2026

2605.09751 2026-05-12 cs.CL

Language Models Without a Trainable Input Embedding Table: Learning from Fixed Minimal Binary Token Codes

A. Bochkov

发表机构 * Andrey Bochkov（安德里·博赫科夫）

AI总结本文研究了语言模型中是否必须使用可训练的输入嵌入表。作者提出使用固定最小二进制编码替代传统嵌入矩阵，仅通过零参数变换扩展模型宽度。实验表明，在保持相近验证困惑度的前提下，该方法可减少大量可训练参数，证明可训练输入嵌入表并非语言建模所必需。

2605.09750 2026-05-12 cs.CV

Fetal Brain Imaging: A Composite Neural Network Approach for Keyframe Detection in Ultrasound Videos

Aleksander Zamojski, Kacper Jarczak, Radoslaw Roszczyk

发表机构 * Warsaw University of Technology（华沙技术大学）

AI总结本文提出了一种用于胎儿脑部超声视频中关键帧检测的新方法，旨在提高胎儿脑部影像分析的效率和准确性。该方法采用一种融合卷积神经网络（CNN）和循环神经网络（RNN）的复合神经网络架构，其中CNN用于提取视频帧的局部空间特征，RNN则用于捕捉视频序列中帧与帧之间的时序依赖关系。该模型有助于更早地检测和诊断特定胎儿脑部疾病，从而支持更及时的治疗规划。

2605.09749 2026-05-12 cs.AI

Primal-Dual Guided Decoding for Constrained Discrete Diffusion

Federico Tomasi, Dmitrii Moor, Alice Wang, Mounia Lalmas

发表机构 * Spotify

AI总结离散扩散模型通过逐步去掩码生成结构化序列，但在生成过程中满足全局属性约束仍是一个挑战。本文提出了一种原-对偶引导解码方法，在推理阶段将约束生成建模为KL正则化优化问题，并通过自适应拉格朗日乘子在线求解。该方法通过约束相关的偏置调整token的logits，保证生成分布尽可能接近无约束分布的同时满足约束条件，无需额外训练或模型评估，支持多约束同时处理，并提供了约束违反的理论界。实验表明，该方法在主题文本生成、分子设计和音乐歌单生成等任务中有效提升了约束满足度，同时保持了领域相关的质量指标。

2605.09746 2026-05-12 cs.LG cs.AI

Sequential Feature Selection for Efficient Landslide Segmentation from Multi-Spectral Data

Arsalaan Ahmad, Oktay Karakus, Paul L. Rosin

发表机构 * School of Computer Science（计算机科学学院）； Informatics Cardiff University（卡迪夫大学信息学）

AI总结该研究旨在解决从多光谱卫星数据中高效分割滑坡区域时输入特征冗余的问题。研究提出了一种基于顺序前向浮动选择（SFFS）的可解释特征选择框架，结合Sentinel-2多光谱数据和ALOS PALSAR地形数据，通过迭代构建和精简特征集，识别出仅需8个通道即可达到与使用30个通道相当的分割性能。该方法不仅提升了模型效率，还揭示了滑坡模型真正依赖的光谱和地形特征，为地球观测中的输入设计提供了原理性指导。

Comments In Process of Submission to Frontiers in Remote Sensing. Keywords: landslide segmentation, multispectral remote sensing, feature selection, explainability, Landslide4Sense

2605.09745 2026-05-12 cs.LG cs.AI cs.IT math.IT

Entropy-informed Decoding: Adaptive Information-Driven Branching

Benjamin Patrick Evans, Sumitra Ganesh, Leo Ardon

发表机构 * Department of XXX, University of YYY, Location, Country（XXX系，YYY大学，地点，国家）； School of ZZZ, Institute of WWW, Location, Country（ZZZ学院，WWW研究所，地点，国家）； JP Morgan AI Research, London, UK（摩根大通AI研究，伦敦，英国）； JP Morgan AI Research, New York, USA（摩根大通AI研究，纽约，美国）

AI总结本文提出了一种名为EDEN的熵驱动解码框架，旨在提升大语言模型生成质量。该方法根据模型输出的不确定性（熵）动态调整分支因子，在高熵区域生成更多候选，在低熵区域采用更贪婪的策略，从而提高计算效率。实验表明，EDEN在数学推理、代码生成等复杂任务中优于传统解码方法，实现了更优的精度与扩展开销的权衡。

Comments Accepted at ICML 2026

2605.09742 2026-05-12 cs.LG cs.AI

TIDES: Implicit Time-Awareness in Selective State Space Models

Taylan Soydan, Miguel A. Bessa, Dirk Mohr, Rui Barreira

发表机构 * AIMM, ETH Zürich（AIMM，瑞士联邦理工学院 Zurich）

AI总结本文提出了一种名为TIDES的选择性状态空间模型，旨在解决现有模型在处理不规则时间序列时的局限性。与传统模型不同，TIDES通过将输入依赖性从时间步长转移到状态矩阵的对角线上，使时间步长$\TildeΔ$保留其物理意义，从而在保持高表达能力的同时支持不规则时间戳的处理。实验表明，TIDES在多个基准测试中表现优异，特别是在时间序列分类和回归任务中取得了新的最先进成果。

Comments Preprint submitted for peer-review

2605.09739 2026-05-12 cs.CL cs.AI

The Silent Vote: Improving Zero-Shot LLM Reliability by Aggregating Semantic Neighborhoods

Sanket Badhe, Priyanka Tiwari, Deep Shah

发表机构 * Google（谷歌）

AI总结本文研究了大语言模型在零样本分类任务中因受限解码导致的“归一化偏差”问题，提出了一种名为语义softmax的新方法，通过聚合目标标签的语义邻域信息来恢复丢失的概率质量，从而提升模型的校准性和分类性能。实验表明，该方法在多个数据集上有效降低了预期校准误差和Brier分数，同时提升了AUROC和Macro-F1等指标，为零样本分类提供了更准确和可靠的解决方案。

Comments Accepted at GEM Workshop @ ACL 2026

2605.09737 2026-05-12 cs.LG

CALYREX: Cross-Attention LaYeR EXtended Transformers for System Prompt Anchoring

Li Lixing

发表机构 * Cornell University（康奈尔大学）

AI总结现代大语言模型依赖系统提示来设定行为约束和安全规则，但传统因果自注意力机制对特权指令和用户内容一视同仁，导致模型在长上下文中易受提示注入和指令侵蚀的影响。本文提出 CALYREX，一种通过输入与系统提示之间的交叉注意力机制来结构化隔离和锚定规则的扩展型 Transformer 模型。实验表明，CALYREX 在指令遵循和多轮指令一致性方面均有显著提升，并有效降低了提示攻击的成功率，其优势随着模型规模的增大而进一步增强。

Comments Preprint. 25 pages, 4 figures, 9 tables

2605.09727 2026-05-12 cs.LG cs.AI

One for All: A Non-Linear Transformer can Enable Cross-Domain Generalization for In-Context Reinforcement Learning

Bowen He, Juncheng Dong, Lin Lin, Xiang Cheng

发表机构 * Duke University（杜克大学）

AI总结本文研究了如何通过非线性变换器实现跨领域强化学习中的上下文学习泛化问题。作者从核方法的角度出发，建立了非线性变换器与基于核的时差学习之间的联系，提出变换器可以视为在再生核希尔伯特空间中进行回归，从而允许不同领域的价值函数共享权重。实验表明，该方法在多个MetaWorld任务中有效实现了时差目标的收敛，为强化学习中的跨任务泛化提供了新的理论视角和方法支持。

2605.09724 2026-05-12 cs.LG

Model Capacity Determines Grokking through Competing Memorisation and Generalisation Speeds

Yiding Song, Hanming Ye

发表机构 * Harvard College（哈佛学院）

AI总结该研究探讨了模型容量如何影响“理解”（grokking）现象，即模型在训练集上过拟合后突然泛化的能力。研究指出，模型容量并非直接决定理解的出现，而是通过记忆速度和泛化速度之间的竞争关系来影响这一过程。通过信息论框架和模运算任务的实验证明，理解发生在模型参数规模使得记忆与泛化时间尺度相交的临界点附近，揭示了模型容量、数据复杂度与学习动态之间的深层联系。

Comments 23 pages, 10 figures, 12 tables

2605.09722 2026-05-12 cs.LG

Benchmarking Transformer and xLSTM for Time-Series Forecasting of Heat Consumption

Marja Wahl, Daniel R. Bayer, Sven Rausch, Marco Pruckner

发表机构 * RAUSCH Technology GmbH（RAUSCH技术公司）； Modeling and Simulation, University of Würzburg（建模与仿真，乌尔姆大学）

AI总结本文研究了在短期热需求预测任务中Transformer和xLSTM模型的性能，针对德国25栋建筑的小时级热消耗数据，评估了它们在3小时和24小时预测场景下的表现。研究发现，xLSTM在RMSE指标上表现最佳，而Temporal Fusion Transformer在MAE指标上最优，但这些模型参数量大、训练耗时，其可持续性受到质疑。论文进一步分析了预测精度与计算资源消耗之间的权衡，指出传统全连接网络等低参数模型也能取得较好的预测效果，表明新型模型在精度上的小幅提升可能带来较大的资源开销。

Comments Submitted version of the paper submitted to IEEE SusTech, 2026

2605.09719 2026-05-12 cs.CV cs.AI

Distilling 3D Spatial Reasoning into a Lightweight Vision-Language Model with CoT

Alaa Asfour, Christopher Indris, Leihan Chen, Tejas Vyas, Guanghui Wang

发表机构 * Department of Computer Science, Toronto Metropolitan University（多伦多 Metropolitan 大学计算机科学系）

AI总结该研究提出了一种知识蒸馏框架，将大型3D视觉语言模型中的空间推理能力转移到更轻量的模型中，从而显著降低计算成本。通过引入可学习的隐式推理标记（Hidden CoT）和多任务蒸馏策略，该方法在保持教师模型72%以上性能的同时，将模型大小减少了3倍，推理延迟降低了8.7倍。该工作首次在蒸馏的3D视觉语言模型中应用隐式推理机制，实现了高效的3D场景问答任务。

2605.09716 2026-05-12 cs.AI

Medical Model Synthesis Architectures: A Case Study

Katherine M. Collins, Marlene Berke, Ilia Sucholutsky, Ayman Ali, Adrian Weller, Timothy J. O'Donnell, Tyler Brooke-Wilson, Lionel Wong, Joshua B. Tenenbaum

发表机构 * MIT（麻省理工学院）； University of Cambridge（剑桥大学）； Princeton University（普林斯顿大学）； Duke University（杜克大学）； The Alan Turing Institute（艾伦·图灵研究所）； Canada CIFAR AI Chair（加拿大CIFAR人工智能主席）

AI总结本文研究了如何构建能够在不确定性下进行透明、可验证临床推理的AI系统，以辅助医生进行临床决策。作者提出了一种名为MedMSA的框架，结合语言模型检索相关医学知识，并构建形式化的概率模型以支持校准的不确定性推理。该方法在初步实验中用于生成带不确定性权重的鉴别诊断列表，展示了其在临床应用中的潜力，并为未来安全的医患协作提供了方向。

Comments Working paper

AI 大模型

视觉与机器人

科学与医疗