arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.10216 2026-05-12 cs.CL

The Impact of Editorial Intervention on Detecting Native Language Traces

Ahmet Yavuz Uluslu, Mark Gales, Kate Knill, Gerold Schneider

发表机构 * University of Cambridge（剑桥大学）； University of Zurich（苏黎世大学）

AI总结本文研究了编辑干预对识别作者母语痕迹的影响，探讨在不同程度的语法纠错和改写处理下，母语识别模型的鲁棒性。研究发现，母语特征不仅依赖于表面语法错误，还涉及词汇语义选择、语用迁移和文化视角等深层因素，而轻微编辑能够保留这些特征，保持较高的识别准确率，而过度改写则会显著削弱模型性能。

2605.10211 2026-05-12 cs.CL cs.AI cs.IR

To Redact, or not to Redact? A Local LLM Approach to Deliberative Process Privilege Classification

Maik Larooij, David Graus

发表机构 * University of Amsterdam（阿姆斯特丹大学）

AI总结该研究针对政府文件中需脱敏发布的“审议过程特权”信息，提出了一种基于本地大语言模型的自动分类方法，以替代依赖第三方云API的处理方式。研究采用Qwen3.5 9B等小型模型，在消费级硬件上实现高精度分类，并通过结合思维链提示和基于错误示例的少样本提示，显著提升了召回率和F2分数，性能接近商业模型Gemini 2.5 Flash。分析表明，审议性内容常包含第一人称和表达意见的动词，这些语言特征是分类的关键依据。

Comments Accepted to The First Workshop on Artificial Intelligence & Open Government at the 21st International Conference on Artificial Intelligence and Law (ICAIL), June 8, 2026, Singapore

2605.10210 2026-05-12 cs.RO cs.CV

Nano-U: Efficient Terrain Segmentation for Tiny Robot Navigation

Federico Pizzolato, Francesco Pasti, Nicola Bellotto

发表机构 * Dept of Information Engineering, University of Padua（信息工程系，帕多瓦大学）

AI总结本文研究了如何在微型机器人上实现高效的地形分割，以支持其在户外非结构化环境中的自主导航。为了解决现有模型在资源受限的微控制器上部署困难的问题，作者提出了一种名为 Nano-U 的轻量二值分割网络，并结合量化感知蒸馏方法进行训练，显著提升了模型性能。该模型在多个数据集上表现优异，并通过改进的编译器工具链成功部署在低成本微控制器上，实现了低功耗、低延迟的实时地形感知。

Comments Code repository: https://github.com/federico-pizz/Nano-U

2605.10205 2026-05-12 cs.LG

Unveiling High-Probability Generalization in Decentralized SGD

Jiahuan Wang, Ping Luo, Ziqing Wen, Dongsheng Li, Tao Sun

发表机构 * College of Computer Science and Technology（计算机科学与技术学院）

AI总结本文研究了去中心化随机梯度下降（D-SGD）在大规模分布式学习中的泛化性能，旨在填补传统SGD与D-SGD在高概率泛化界上的理论差距。作者提出了基于点态均匀稳定性的学习理论，推导出D-SGD在凸、强凸和非凸设置下的高概率泛化界，达到了最优的$\mathcal{O}\left(\frac{1}{\sqrt{mn}}\log (1/δ)\right)$收敛速率，并分析了非凸场景下的梯度基度量和优化误差界。研究还考虑了通信开销，分析了时变框架下本地模型的泛化性能。

2605.10204 2026-05-12 cs.CV

3DReflecNet: A Large-Scale Dataset for 3D Reconstruction of Reflective, Transparent, and Low-Texture Objects

Zhicheng Liang, Haoyi Yu, Boyan Li, Dayou Zhang, Zijian Cao, Tianyi Gong, Junhua Liu, Shuguang Cui, Fangxin Wang

发表机构 * The Chinese University of Hong Kong, Shenzhen（香港中文大学（深圳））； Capital Normal University（首都师范大学）； University of Southern California（南加州大学）

AI总结本文介绍了3DReflecNet，一个专为重建具有反射、透明和低纹理表面物体的3D视觉方法而设计的大规模数据集。该数据集包含超过12万个基于物理渲染的合成样本和1000多个使用消费级设备采集的真实物体，总数据量超过22TB，涵盖了多种材质、复杂光照条件和几何形态。研究还设计了五个核心任务的基准测试，揭示了现有方法在处理这类复杂材料时的性能局限，推动了更鲁棒的3D视觉模型的发展。

Comments This paper has been accepted by CVPR 2026 Oral

2605.10203 2026-05-12 cs.SD eess.AS

Polyphonia: Zero-Shot Timbre Transfer in Polyphonic Music with Acoustic-Informed Attention Calibration

Haowen Li, Tianxiang Li, Yi Yang, Boyu Cao, Qi Liu

发表机构 * School of Future Technology, South China University of Technology, Guangzhou, China.（未来技术学院，华南理工大学，广州，中国）

AI总结该研究提出了一种名为Polyphonia的零样本音色迁移框架，旨在解决多声部音乐中对特定音轨进行音色编辑时背景伴奏易被破坏的问题。其核心方法是引入基于声学信息的注意力校准机制，通过概率声学先验建立粗略边界，从而在保持非目标音轨语义完整性的同时，更精确地定位并修改目标音轨。实验表明，该方法在目标音轨对齐度上比现有方法提升了15.5%，同时保持了较高的音乐保真度和非目标音轨的完整性。

Comments Accepted by ICML 2026

2605.10202 2026-05-12 cs.LG cs.CL

Task-Aware Calibration: Provably Optimal Decoding in LLMs

Tim Tomov, Dominik Fuchsgruber, Rajeev Verma, Stephan Günnemann

发表机构 * School of Computation, Information & Technology, Technical University of Munich（慕尼黑技术大学计算、信息与技术学院）； Munich Data Science Institute（慕尼黑数据科学研究所）； Munich Center for Machine Learning（慕尼黑机器学习中心）； University of Amsterdam（阿姆斯特丹大学）

AI总结本文研究了大语言模型（LLM）解码过程中因模型预测分布与真实生成分布不一致而导致的次优决策问题。作者提出了一种任务感知校准（Task Calibration）方法，通过在任务诱导的潜在空间中对模型预测分布进行校准，从而实现更优的解码策略。该方法基于最小贝叶斯风险（MBR）解码理论，证明了在任务校准后的潜在分布上进行解码能够获得最优的生成效果，并引入任务校准误差（TCE）作为衡量校准质量的指标，实验表明该方法在多个任务上有效提升了生成质量。

2605.10199 2026-05-12 cs.CL eess.AS

How Should LLMs Listen While Speaking? A Study of User-Stream Routing in Full-Duplex Spoken Dialogue

Hui Lu, Xueyuan Chen, Huimeng Wang, Shuhai Peng, Shiyin Kang, Xixin Wu, Zhiyong Wu

发表机构 * The Chinese University of Hong Kong（香港中文大学）； SenseTime Research（商汤研究院）； Tsinghua University（清华大学）

AI总结本文研究了在全双工语音对话中，大语言模型（LLM）如何在生成自身语音响应的同时持续监听用户输入的问题。作者提出用户流在LLM中的路由方式是影响系统性能的关键架构问题，并设计了两种路由策略进行对比：一种是直接将用户流注入模型输入，另一种是通过交叉注意力机制访问外部记忆。实验表明，直接注入方式在语义理解和问答任务中表现更优，但在用户打断等场景下容易导致上下文混乱；而交叉注意力路由虽然问答性能稍逊，但能更好地保持生成上下文的稳定性，更具鲁棒性。研究为全双工语音对话系统的设计提供了重要的指导。

2605.10198 2026-05-12 cs.LG cs.AI

Empty SPACE: Cross-Attention Sparsity for Concept Erasure in Diffusion Models

Nicola Novello, Andrea M. Tonello

发表机构 * University of Klagenfurt（克雷格弗尔特大学）

AI总结本文研究如何从文本到图像的扩散模型中去除特定概念，以避免生成受版权保护或不适当的内容。为了解决现有封闭形式概念去除方法在大模型上效果下降的问题，作者提出了一种基于稀疏交叉注意力的高效概念去除方法SPACE，通过迭代更新模型的交叉注意力参数，同时实现概念去除和参数稀疏化，显著提升了去除效果和模型鲁棒性，并大幅降低了存储需求。

2605.10196 2026-05-12 cs.LG

Many Needles in a Haystack: Active Hit Discovery for Perturbation Experiments

Andrea Rubbi, Arpit Merchant, Samuel Ogden, Amir Akbarnejad, Pietro Liò, Sattar Vakili, Mo Lotfollahi

发表机构 * Wellcome Sanger Institute, Wellcome Genome Campus, Hinxton, UK（韦尔科姆桑格研究所，韦尔科姆基因组校园，英国辛顿）； Cambridge Center for AI in Medicine, University of Cambridge, Cambridge, UK（剑桥人工智能医学中心，剑桥大学，剑桥，英国）； Cambridge Stem Cell Institute, University of Cambridge, Cambridge, UK（剑桥干细胞研究所，剑桥大学，剑桥，英国）； Department of Computer Science and Technology, University of Cambridge, Cambridge, UK（剑桥计算机科学与技术系，剑桥大学，剑桥，英国）； MediaTek Research, Cambridge, UK（联发科研究，剑桥，英国）

AI总结该研究针对高通量基因扰动实验中如何高效发现具有显著表型效应的干预策略这一问题，提出了一种基于概率的主动实验设计方法。核心方法是引入“Probability-of-Hit”获取函数，通过后验概率直接评估候选扰动是否超过预设效应阈值，从而更高效地识别有效干预。该方法在合成数据和真实生物数据上均表现出优越性能，相比基线方法在某些数据集上提升了6.4%的效果。

Comments To be published in International Conference on Machine Learning (ICML) 2026

2605.10194 2026-05-12 cs.AI cs.LG

TRACE: Distilling Where It Matters via Token-Routed Self On-Policy Alignment

Jiaxuan Wang, Xuan Ouyang, Zhiyu Chen, Yulan Hu, Zheng Pan, Xin Li, Lan-Zhe Guo

发表机构 * State Key Laboratory of Novel Software Technology, Nanjing University（南京大学新型软件技术国家重点实验室）； School of Intelligence Science and Technology, Nanjing University（南京大学智能科学与技术学院）； AMAP, Alibaba Group（阿里集团AMAP）； University of Wisconsin–Madison（威斯康星大学麦迪逊分校）； Tsinghua University（清华大学）

AI总结本文提出了一种名为TRACE的新型策略，用于改进基于验证奖励的强化学习中的自蒸馏方法。该方法通过仅在注释者标记的关键推理片段上进行对齐，有效减少了冗余梯度更新和特权信息泄露的问题。TRACE结合了正向KL散度、反向KL散度和GRPO等技术，并在训练初期逐步减少KL通道的影响。实验表明，TRACE在多个数学基准测试中优于现有方法，同时保持了模型在分布外任务上的性能，展示了其在提升推理能力和泛化能力方面的有效性。

Comments work in progress

2605.10190 2026-05-12 cs.CV

DetRefiner: Model-Agnostic Detection Refinement with Feature Fusion Transformer

Soichiro Okazaki, Tatsuya Sasaki, Hiroki Ohashi

发表机构 * Hitachi, Ltd. Research and Development Group（日立株式会社研究开发集团）

AI总结 DetRefiner 是一种用于开放词汇目标检测的模型无关检测优化框架，旨在提升对已见和未见类别的检测性能。该方法通过轻量级的 Transformer 编码器融合全局图像特征和局部图像块特征，生成属性可靠性信息以校准基础检测模型的置信度。DetRefiner 不依赖于基础模型的内部特征或重新训练，仅在推理阶段对检测结果进行辅助校准，显著提升了多个开放词汇检测模型在多个数据集上的性能，尤其在未见类别上取得了最高达 +10.1 AP 的提升。

Comments CVPR 2026 Findings

2605.10189 2026-05-12 cs.LG cs.AI

ProteinOPD: Towards Effective and Efficient Preference Alignment for Protein Design

Yulin Zhang, He Cao, Zihao Jiang, Chenyi Zi, Zhipeng Zhou, Zijing Liu, Yu Li, Jia Li, Ziqi Gao

发表机构 * Tsinghua University（清华大学）； International Digital Economy Academy（国际数字经济学院）； Hong Kong University of Science and Technology (Guangzhou)（香港科学与技术大学（广州））； Nanyang Technological University（南洋理工大学）

AI总结本文提出了一种名为ProteinOPD的多目标偏好对齐框架，旨在解决蛋白质设计中偏好引导与保持模型原始设计能力之间的矛盾。该方法借鉴了On-Policy Distillation（OPD）的思想，通过在学生模型的轨迹上进行标记级的知识蒸馏，将多个偏好目标的教师模型知识整合到一个共享的学生模型中，从而在保持蛋白质语言模型设计能力的同时，有效平衡多个竞争目标。实验表明，ProteinOPD在提升目标偏好性能的同时，显著加快了训练速度，优于基于强化学习的对齐方法。

2605.10186 2026-05-12 cs.CL cs.AI

LegalCiteBench: Evaluating Citation Reliability in Legal Language Models

Sijia Chen, Hang Yin, Shunfan Zhou

发表机构 * Northeastern University（东北大学）； Phala

AI总结该论文提出了一个名为 LegalCiteBench 的基准，用于评估法律语言模型在无外部信息支持下的引用可靠性问题。研究发现，即使是最强大的模型在闭卷设置下也难以准确恢复或生成正确的法律引用，错误率高达94%以上。该基准包含五个以引用为核心的任务，旨在诊断模型在缺乏外部依据时生成错误引用、验证引用准确性以及放弃回答的行为。

Comments Preprint. 23 pages including references and appendices

2605.10184 2026-05-12 cs.CV cs.AI

Developing a foundation model for high-resolution remote sensing data of the Netherlands

Paul Vermeeren, Heysem Kaya

发表机构 * Utrecht University, Department of Information and Computing Sciences（乌得勒支大学信息与计算科学系）

AI总结本文提出了一种基于荷兰高分辨率（1.2米）卫星影像的基座模型，结合卷积神经网络与视觉Transformer，以同时捕捉景观的细纹理、边缘、小物体以及大范围地形结构、高程模式和土地覆盖分布等特征。通过引入时间序列数据，模型能够学习跨时间的上下文信息，提升对地形特征、土地覆盖变化和季节动态等时序依赖关系的建模能力，从而减少特征歧义、增强表征学习并提高小样本下的泛化性能。实验表明，该模型在荷兰植被监测等任务中表现优异，并在多个全球基准数据集上取得了与先进模型相当的性能，展现了在有限数据和参数规模下学习通用表征的能力。

Comments 9 pages, 4 figures, under review in a journal

2605.10183 2026-05-12 cs.LG

Fix the Loss, Not the Radius: Rethinking the Adversarial Perturbation of Sharpness-Aware Minimization

Jinping Wang, Qinhan Liu, Zhiwu Xie, Zhiqiang Gao

发表机构 * CSMT, Wenzhou-Kean University（温州肯恩大学计算机科学与技术学院）； International Frontier Interdisciplinary Research Institute, Wenzhou-Kean University（温州肯恩大学国际前沿交叉学科研究院）

AI总结该论文重新审视了尖锐度感知最小化（SAM）方法中的损失与扰动半径之间的不匹配问题，提出了一种新的方法——损失均衡SAM（LE-SAM），通过固定损失空间预算而非传统固定的参数空间扰动半径，有效削弱梯度模长主导的学习信号，使优化过程更关注曲率主导的平坦极小值。实验表明，LE-SAM在多个基准任务中表现出更强的泛化能力，优于原始SAM及其变体，达到了当前最优性能。

Comments Accepted by ICML2026

2605.10179 2026-05-12 cs.LG cs.AI

One-Step Graph-Structured Neural Flows for Irregular Multivariate Time Series Classification

Mengzhou Gao, Kaiwei Wang, Pengfei Jiao

发表机构 * School of Cyberspace, Hangzhou Dianzi University（杭州电子科技大学信息学院）

AI总结该研究提出了一种名为图结构神经流（GSNF）的一步式模型，用于处理不规则多变量时间序列分类问题。为了解决现有方法在变量间交互建模方面的不足，GSNF引入了两种辅助轨迹自监督策略，通过轨迹发散和逆向时间生成增强图结构学习的效果。实验表明，该方法在多个真实数据集上取得了最先进的分类性能，同时保持了较高的训练效率和较低的内存消耗。

2605.10177 2026-05-12 cs.CV cs.AI cs.RO

MTA-RL: Robust Urban Driving via Multi-modal Transformer-based 3D Affordances and Reinforcement Learning

Guangli Chen, Dianzhao Li, Wenjian Zhong, Bangquan Xie, Ostap Okhrin

发表机构 * Dongguan Key Laboratory of Intelligent Equipment and Smart Industry, School of Advanced Engineering, Great Bay University（东莞智能装备与智能制造重点实验室，先进工程学院，大湾大学）； Chair of Applied Statistics, Technische Universität Dresden（应用统计学教授职位，德累斯顿技术大学）； Center for Scalable Data Analytics and Artificial Intelligence (ScaDS.AI)（可扩展数据解析与人工智能中心（ScaDS.AI））； College of Automation, Guangdong University of Technology（自动化学院，广东技术大学）

AI总结本文提出了一种名为MTA-RL的框架，通过基于多模态Transformer的3D可操作性表示和强化学习，提升城市自动驾驶的鲁棒性。该方法将RGB图像和LiDAR点云融合，生成结构化的几何感知可操作性表示，作为强化学习策略的输入，从而提高决策效率和稳定性。实验表明，MTA-RL在不同密度的交通场景中均优于现有方法，并在未见过的城市环境中表现出优异的零样本泛化能力。

2605.10174 2026-05-12 cs.CV

BathyFacto: Refraction-Aware Two-Media Neural Radiance Fields for Bathymetry

Markus Brezovsky, Anatol Günthner, Frederik Schulte, Lukas Winiwarter, Boris Jutzi, Gottfried Mandlburger

发表机构 * Department of Geodesy and Geoinformation, TU Wien（维也纳技术大学测绘与地理信息系）； Institute of Photogrammetry and Remote Sensing (IPF), Karlsruhe Institute of Technology (KIT)（卡尔斯鲁厄理工学院测绘与遥感研究所）； Unit of Geometry and Surveying, University of Innsbruck（因斯布鲁克大学几何与测绘单位）

AI总结 BathyFacto 是一种针对水下测绘的折射感知双介质神经辐射场方法，旨在解决传统光束法重建在水下场景中因光折射导致的深度偏差问题。该方法通过引入介质条件颜色头和基于哈希网格的密度场，结合斯涅尔定律模拟光线在空气-水界面的折射路径，从而实现更精确的水下点云重建。实验表明，BathyFacto 在模拟场景中显著提升了重建精度和完整性，优于传统方法和未考虑折射的神经辐射场基线。

Comments 16 pages, 8 figures, 3 tables. Submitted to ISPRS Open Journal of Photogrammetry and Remote Sensing, Special Issue "3D Underwater Mapping from Above and Below"

2605.10172 2026-05-12 cs.CV cs.CL

V-ABS: Action-Observer Driven Beam Search for Dynamic Visual Reasoning

Zhiwei Ning, Xuanang Gao, Jiaxi Cao, Gengming Zhang, Shengnan Ma, Wenwen Tong, Hanming Deng, Jie Yang, Wei Liu

发表机构 * School of Automation and Intelligent Sensing, Shanghai Jiao Tong University（上海交通大学自动化与智能感知学院）； Institute of Image Processing and Pattern Recognition, Shanghai Jiao Tong University（上海交通大学图像处理与模式识别研究所）； SenseTime Research（商汤研究院）； Institute of Medical Robotics, Shanghai Jiao Tong University（上海交通大学医学机器人研究所）

AI总结本文提出了一种名为V-ABS的行动观察者驱动的束搜索框架，用于解决动态视觉推理中的多步骤复杂任务。该方法通过引入思考者-行动者-观察者迭代机制，结合基于熵的自适应加权算法，有效缓解了想象-行动-观察者偏差（IAO偏差），提升了推理的稳定性和最优性。实验表明，V-ABS在多个基准测试中均取得领先性能，显著优于现有模型。

2605.10171 2026-05-12 cs.CL cs.AI

When Reviews Disagree: Fine-Grained Contradiction Analysis in Scientific Peer Reviews

Sandeep Kumar, Yash Kamdar, Abid Hossain, Bharti Kumari, Tanik Saikh, Asif Ekbal

发表机构 * Department of Computer Science and Engineering, Indian Institute of Technology Patna, India（印度理工学院帕纳瓦分校计算机科学与工程系）； School of Computer Engineering, KIIT Deemed to be University, Bhubaneswar, India（比哈尔邦布尔萨大学计算机工程学院）

AI总结科学同行评审中常常存在专家意见不一致的现象，随着会议投稿数量的增加，识别和理解这些分歧变得越来越具有挑战性。本文提出了一种细粒度的矛盾分析方法，通过识别完整评审中的矛盾证据片段并赋予分歧强度评分，更准确地刻画评审间的冲突程度。为此，研究者构建了RevCI数据集，并设计了IMPACT框架，结合多智能体推理与证据提取，实现了对矛盾及其严重程度的建模，同时提出了轻量模型TIDE以实现高效推理。

Comments accepted at ACL 2026

2605.10170 2026-05-12 cs.LG

Balancing Efficiency and Fairness in Traffic Light Control through Deep Reinforcement Learning

Matteo Cederle, Giacomo Scatto, Gian Antonio Susto

发表机构 * University of Padova（帕多瓦大学）

AI总结本文研究如何通过深度强化学习在交通信号灯控制中平衡效率与公平性。提出了一种新型的深度强化学习代理，能够在动态交通条件下同时考虑车辆和行人流量的公平性需求，实现两者的动态协调。实验表明，该方法在缓解交通拥堵的同时，有效保障了不同道路使用者的公平服务，为智能城市中的交通管理提供了实用且灵活的解决方案。

Comments Paper accepted to the 2026 IFAC World Congress, held in Busan (KOR), August 23rd-28th, 2026

2605.10169 2026-05-12 cs.AI cs.GT

Automated Approach for Solving Infinite-state Polynomial Reachability Games

Krishnendu Chatterjee, Ehsan Kafshdar Goharshady, Mehrdad Karrabi, Maximilian Seeliger, Đorđe Žikelić

发表机构 * Institute of Science and Technology Austria (ISTA)（奥地利科学与技术研究所）； ETH Zurich（苏黎世联邦理工学院）； Singapore Management University（新加坡管理大学）

AI总结本文研究无限状态图上的回合制可达性博弈，重点在于确定“REACH”玩家是否存在并计算其赢得游戏的策略。作者提出了排名证明（ranking certificates）作为一种完备且可靠的证明规则，并设计了一种针对多项式可达性博弈的全自动算法，能够在子指数时间内计算出赢得策略并生成形式化正确性证明。实验表明，该方法能够解决现有方法难以处理的复杂案例，例如经典“灰姑娘与继母”博弈中首次实现了任意精度参数下的最优策略计算。

2605.10168 2026-05-12 cs.CL cs.IR

ASTRA-QA: A Benchmark for Abstract Question Answering over Documents

Shu Wang, Shansong Zhou, Xinyang Wang, Shiwei Wang, Hulong Wu, Yixiang Fang

发表机构 * The Chinese University of Hong Kong, Shenzhen（香港中文大学（深圳））； Data Science Group（数据科学组）

AI总结本文提出ASTRA-QA，一个用于文档抽象问答的基准数据集，旨在解决现有问答基准在处理需要综合多文档信息的抽象问题时支持不足的问题。该数据集包含869个问答实例，涵盖五类抽象问题和三种可控检索范围，并为每个实例提供了明确的评估标注，如答案主题集、未支持主题和对齐证据。通过直接评分主题覆盖度和未支持内容，ASTRA-QA实现了无需详尽对比的可扩展评估，并在多种检索增强生成方法上验证了其对覆盖性、幻觉和检索鲁棒性的诊断能力。

2605.10164 2026-05-12 cs.LG stat.ML

Hyperparameter Transfer for Dense Associative Memories

Roi Holtzman, Dmitry Krotov, Boris Hanin

发表机构 * Rudolf Peierls Centre for Theoretical Physics, University of Oxford, Oxford OX1 3PU, UK（鲁道夫·皮尔士理论物理中心，牛津大学，牛津 OX1 3PU, 英国）； Dynamical Mind, IBM Research（动态思维，IBM研究）； Princeton ORFE（普林斯顿ORFE）

AI总结该论文研究了如何将超参数迁移方法应用于密集联想记忆（DenseAM）模型，这类模型通过神经网络在能量景观上进行时间动态操作，具有层内和层间权重共享的结构特点。由于DenseAM使用了在传统前馈网络中较少见的快速峰值激活函数，使得现有超参数迁移方法难以直接应用。本文提出了针对DenseAM的超参数迁移方法，推导了从小规模模型迁移至大规模模型的明确超参数设置规则，并通过实验验证了理论分析与实际结果的一致性。

2605.10162 2026-05-12 cs.CV

Active-SAOOD: Active Sparsely Annotated Oriented Object Detection in Remote Sensing Images

Yu Lin, Jianghang Lin, Kai Ye, Shengchuan Zhang, Liujuan Cao

发表机构 * Key Laboratory of Multimedia Trusted Perception（多媒体可信感知关键实验室）； Efficient Computing, Ministry of Education of China, Xiamen University, 361005, P.R. China（高效计算，中国教育部，厦门大学，361005，中华人民共和国）

AI总结本文提出了一种基于主动学习的稀疏标注遥感图像定向目标检测方法Active-SAOOD，旨在降低遥感图像中定向目标检测的标注成本。该方法通过模型状态观测模块，在实例层面综合考虑方向、分类与定位的不确定性以及类间和类内多样性，主动选择对当前模型最有价值的稀疏样本，从而在完全随机初始化的稀疏标注下实现稳定检测。实验表明，Active-SAOOD在多种数据集上显著提升了现有稀疏标注方法的性能与稳定性，尤其在仅1%标注比例下性能提升达9%，进一步增强了其在遥感领域的实用价值。

2605.10161 2026-05-12 cs.LG

OUIDecay: Adaptive Layer-wise Weight Decay for CNNs Using Online Activation Patterns

Alberto Fernández-Hernández, Jose I. Mestre, Cristian Pérez-Corral, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí

发表机构 * Universitat Politècnica de València（瓦伦西亚理工大学）； Universitat Jaume I（Jaime I 大学）； Openchip & Software Technologies S.L.（Openchip 及软件技术公司）

AI总结本文提出了一种名为OUIDecay的自适应层间权重衰减方法，用于卷积神经网络的训练。该方法基于激活模式计算的过拟合-欠拟合指示器（OUI），动态调整各层的权重衰减系数，无需依赖验证数据，且计算轻量，适合在线使用。实验表明，OUIDecay在多个数据集和网络结构上优于固定衰减和基于梯度的自适应方法，有效提升了模型的泛化性能。

2605.10159 2026-05-12 cs.LG cs.NA math.NA physics.comp-ph

jNO: A JAX Library for Neural Operator and Foundation Model Training

Leon Armbruster, Rathan Ramesh, Georg Kruse, Christopher Straub

发表机构 * Fraunhofer Institute for Integrated Systems and Device Technology（弗劳恩霍夫整合系统与器件技术研究所）

AI总结 jNO 是一个基于 JAX 的库，旨在支持神经算子和基础模型的训练，统一支持数据驱动和物理感知两种训练方式。其核心设计采用了一种追踪系统，允许用户用统一的符号语言编写领域、模型调用、残差、监督损失和诊断信息，并将其编译为一个优化流程，从而在不同任务间灵活切换而无需重构代码。jNO 还支持多模型组合、参数级别的精细控制、超参数调优以及适用于偏微分方程基础模型家族的原生 JAX 工作流。

2605.10158 2026-05-12 cs.LG

Unsupervised Process Reward Models

Artyom Gadetsky, Maxim Kodryan, Siba Smarak Panigrahi, Hang Guo, Maria Brbic

发表机构 * Swiss Federal Institute of Technology（瑞士联邦理工学院）

AI总结本文提出了一种无需人工监督的无监督过程奖励模型（uPRM），用于指导大语言模型的推理过程。该方法通过利用大语言模型的下一个词概率定义评分函数，联合评估多个推理轨迹中首个错误步骤的位置，从而实现对推理过程的评估与引导。实验表明，uPRM在错误步骤识别、测试时扩展验证以及强化学习奖励信号应用中均表现出色，为复杂推理任务的可扩展奖励建模提供了新途径。

Comments preprint

2605.10155 2026-05-12 cs.CL

NyayaAI: An AI-Powered Legal Assistant Using Multi-Agent Architecture and Retrieval-Augmented Generation

Deepanshu, Divi Saxena, Deepali Rana, Ayesha Varshney, Sahinur Rahman Laskar

发表机构 * School of Computer Science UPES, Dehradun, India（计算机科学学院 UPES 德里胡迪恩印度）

AI总结本文介绍了NyayaAI，一个基于多智能体架构和检索增强生成技术的AI法律助手，旨在解决印度法律信息因语言复杂和文档量大而难以获取的问题。该系统结合大型语言模型与构建在印度法律知识库上的检索增强生成流程，通过多智能体协调处理法律研究、文档摘要、案例检索和文书起草等任务，并设有合规模块确保输出准确性。实验表明，该系统在领域分类、检索和响应准确率方面均达到较高水平，展示了结构化多智能体LLM系统在提升法律可及性和工作效率方面的潜力。

Comments 3 pages, 1 figure

AI 大模型

视觉与机器人

科学与医疗