Value Functions as Supermartingale Certificates
值函数作为超鞅证书
发表机构 * University of Oxford, UK(英国牛津大学) ; University of Birmingham, UK(英国伯明翰大学)
AI总结 本文通过建立值函数与Streett超鞅证书之间的理论联系,将随机系统的形式化验证方法与强化学习相结合,为ω-正则性质提供了一种基于RL的证书合成方法。
Comments To appear in SAIV'26
值函数作为超鞅证书
发表机构 * University of Oxford, UK(英国牛津大学) ; University of Birmingham, UK(英国伯明翰大学)
AI总结 本文通过建立值函数与Streett超鞅证书之间的理论联系,将随机系统的形式化验证方法与强化学习相结合,为ω-正则性质提供了一种基于RL的证书合成方法。
Comments To appear in SAIV'26
Chem-PerturBridge:小分子扰动转录组效应的协调汇编
发表机构 * Institute of Computational Biology, Helmholtz Center Munich(计算生物学研究所,慕尼黑亥姆霍尔茨中心) ; TUM School of Life Sciences Weihenstephan, Technical University of Munich(慕尼黑技术大学生命科学学院Weihenstephan分校) ; Institut Curie, INSERM U1331, Computational Oncology(curie研究所,INSERM U1331,计算肿瘤学) ; TUM School of Computation, Information and Technology, Technical University of Munich(慕尼黑技术大学计算、信息与技术学院)
AI总结 为解决小分子扰动转录组数据碎片化问题,构建了涵盖37k化合物、136种细胞背景和125万样本的协调资源Chem-PerturBridge,并验证了其在跨数据集签名一致性评估和化合物表示学习预训练中的有效性。
Comments 33 pages, 6 figures, 16 tables
UniAudio-Token: 赋予语义语音分词器通用音频感知能力
发表机构 * State Key Laboratory of Multimedia Information Processing, School of Computer Science, Peking University(信息处理国家重点实验室,计算机学院,北京大学) ; Basic Model Technology Center, WeChat AI, Tencent Inc.(基础模型技术中心,微信AI,腾讯公司)
AI总结 提出UniAudio-Token框架,通过语义-声学基元(SAP)和语义-声学均衡(SAE)机制,在不牺牲语音能力的前提下为语义分词器注入通用音频感知,实现统一音频接口。
Comments 19 pages, 10 figures
关于稀疏自编码器中激活异常值与特征死亡之间关系的研究
发表机构 * Stanford University(斯坦福大学) ; Columbia University(哥伦比亚大学)
AI总结 本文通过理论分析和实验验证,揭示了稀疏自编码器中维度级激活异常值导致特征死亡的机制,并提出均值中心化预处理方法有效消除该问题。
Comments Accepted to ICML 2026 main conference
用上下文提示调优个性化你的大型视觉语言模型
发表机构 * Brown University(布朗大学) ; Columbia University(哥伦比亚大学) ; University of Alabama at Birmingham(阿拉巴马大学伯明翰分校) ; Purdue University(普渡大学) ; Rutgers University(罗格斯大学)
AI总结 提出上下文提示调优(ICPT)方法,通过轻量投影模块从多参考图像中提取细粒度视觉语义并转化为连续提示,结合几何正则化解决环境偏差和跨概念干扰,实现高效个性化。
Comments 27 pages, 10 figures, 5 tables
来自临床叙述的可靠多语言骨科决策支持:语言感知适应与验证引导的延迟
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院) ; School of Software, Nanjing University of Information Science and Technology (NUIST)(南京信息工程大学软件学院) ; Department of Orthopedic, Bahawal Victoria Hospital(巴哈瓦尔维多利亚医院骨科部门)
AI总结 针对低资源医疗环境中的多语言骨科决策支持,提出结合语言感知适配编码器IndicBERT-HPA和确定性选择性验证层的可靠性框架,在英语、印地语和旁遮普语临床文本分类中取得最优性能。
智能体强化学习中的技能重用作为压缩
发表机构 * Arizona State University(亚利桑那州立大学) ; University of Pennsylvania(宾夕法尼亚大学) ; University of Southern California(南加州大学)
AI总结 提出ReuseRL方法,基于最小描述长度原则将成功轨迹压缩为可重用技能字典,并通过分割代价惩罚低效编码行为,在多个环境中提升分布内和分布外成功率。
Comments Work in progress
在没有显式正则化的情况下内化视频目标中心学习中的时间一致性
发表机构 * Department of Electrical Engineering and Automation, Aalto University, Finland(艾尔沃斯大学电气工程与自动化系) ; Department of Computer Science, Aalto University, Finland(艾尔沃斯大学计算机科学系) ; Center for Machine Vision and Signal Analysis, University of Oulu, Finland(奥卢大学机器视觉与信号分析中心)
AI总结 提出一种无需显式时间一致性损失(SSC)的视频目标中心学习方法,通过时序通道分解(CCD)和跨时间重建(CTR)机制隐式学习时间一致性,提升训练效率和性能。
Comments 14 pages
何时多模态预测具有生物学支持?一个诊断性评估框架
发表机构 * Oncology Data Science & AI, R&D(肿瘤数据科学与人工智能,研发)
AI总结 提出DECAT框架,通过五个零参考指标和规则决策,将多模态表示分类为四种诊断场景,以检测模型是否学到共享生物学、单模态生物学或虚假相关性。
通过IO感知层实现实现GNN的高效扩展
发表机构 * HSE University(俄罗斯高等经济大学) ; ITMO University(ITMO大学)
AI总结 针对GNN中稀疏不规则内存访问瓶颈,提出三种GPU内核族(SpMM卷积、归约聚合、注意力层)以减少数据移动并提升局部性,在真实图上实现高达8.5倍加速和76倍内存降低。
Comments International Conference on Machine Learning (ICML) 2026, Spotlight Paper
Assign and Add: 组合算术的机制研究
发表机构 * Yale University(耶鲁大学) ; Flatiron Institute(Flatiron研究所)
AI总结 通过变量赋值和模加法任务,研究Transformer中组合泛化的机制,发现模型利用同一模加法模块处理直接和间接输入,并揭示了三阶段学习动态。
整合奖励扰动用于大语言模型后训练
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心(MCML))
AI总结 提出CoRP方法,通过奖励加权聚合、兼容性重加权和验证门控,将奖励扰动整合为单一模型,无需梯度,在单次推理下平均提升8.1分。
LinTree: 通过显式结构化搜索历史提升LLM推理能力
发表机构 * National University of Singapore(新加坡国立大学) ; University of Oxford(牛津大学)
AI总结 针对LLM推理中隐式搜索树导致性能不佳的问题,提出LinTree方法,通过添加父指针显式表示线性化树结构,在Blocks World、网格导航和Sokoban任务中提升了任务性能和搜索效率。
Comments 16 pages, 3 figures
利用触觉皮肤学习两个手指间小物体的受控分离
发表机构 * Learning AI for Dextrous Robots Lab(灵巧机器人学习人工智能实验室) ; Technical University of Munich(慕尼黑技术大学) ; DLR Institute of Robotics and Mechatronics(德意志航天中心机器人与机电研究所)
AI总结 本文提出并解决了多用途机器人手两个手指间小物体的受控分离任务,通过强化学习训练纯触觉策略,并分析了空间分辨触觉反馈的优势。
Graphical einops: 桥接张量网络与计算图
发表机构 * Laboratory for Human-Centered AI, Department of Philosophy, University of Oxford(人类中心人工智能实验室,哲学系,牛津大学) ; Machine Learning Research Group, Department of Engineering Science, University of Oxford(机器学习研究组,工程科学系,牛津大学)
AI总结 本文提出一种形式化的图形演算,用于einops的张量编程结构片段,通过等级自然性重写实现张量等变性的图解证明,并应用于注意力掩码转换以优化稀疏注意力实现。
平衡LoRA:消除参数不变性以加速收敛
发表机构 * Apple, Paris, France(苹果公司,巴黎,法国) ; CNRS(法国国家科学研究中心)
AI总结 针对LoRA过参数化导致不同低秩因子对条件数差异大而影响收敛速度的问题,提出BaLoRA,通过投影到平衡流形改善损失景观条件,实现更快收敛和更优性能。
Comments Accepted at ICML 2026
Batched Differentiable Rigid Body Dynamics in PyTorch for GPU-Accelerated Robot Learning
发表机构 * University of Southampton(南安普顿大学)
AI总结 提出BARD,一种基于PyTorch的批处理可微刚体动力学库,通过三级缓存、无矩阵乘法的关节变换和层级并行传播,在GPU上实现高达64倍的前向运动学加速,并支持梯度计算。
语言模型可以组合性地解析指代,但这并非其天然优势:以个人关系任务为例
发表机构 * GitHub
AI总结 通过个人关系任务,比较人类与大型语言模型在外延任务(确定指称对象)和内涵任务(结构化表示意义)上的表现,发现人类更擅长外延任务而LLM更擅长内涵任务,表明缺乏指称基础是LLM模拟人类语言理解的关键缺失。
Comments A pre-MIT Press publication version. Paper accepted to Transactions of the Association for Computational Linguistics
IDOL: 逆动力学引导的未来预测用于端到端自动驾驶
发表机构 * Department of Electronic Engineering, Tsinghua University(清华大学电子工程系)
AI总结 提出IDOL框架,通过逆动力学模型将BEV世界模型预测的未来潜在场景状态转化为规划相关的轨迹增量,实现未来预测与轨迹优化的紧密耦合,在NAVSIM基准上达到最优性能。
Comments 20 pages, 5 figures
扩展匈牙利语对话ASR:BEA-Dialogue+语料库
发表机构 * Department of Telecommunications and Artificial Intelligence(电信与人工智能系) ; Budapest University of Technology and Economics(布达佩斯技术与经济大学) ; Speechtex Ltd.(Speechtex公司) ; ELTE Research Centre for Linguistics(ELTE语言学研究中心)
AI总结 针对匈牙利语对话语音识别训练数据不足的问题,本文通过放宽分割标准扩展BEA-Dialogue语料库至200小时,并评估基于Whisper和FastConformer的模型,证明基于序列化输出训练的微调能持续改善识别性能。
AutoSci: 面向完整科学生命周期的以记忆为中心的智能体系统
发表机构 * Peking University(北京大学)
AI总结 提出AutoSci,一个以记忆为中心、支持完整科学生命周期的智能体系统,通过结构化记忆、多阶段流程、有向无环图增强和演化机制实现自动化科研。
VolFill: 基于体素流匹配的单视图非模态3D场景重建
发表机构 * UMass Amherst(马萨诸塞大学阿姆赫斯特分校) ; TU Crete(希腊技术大学)
AI总结 提出VolFill框架,利用混合3D VAE和潜在扩散Transformer从单张RGB图像生成完整3D场景结构,在SCRREAM和NRGB-D数据集上显著优于现有方法。
GPU预测器:语言模型作为内核运行时优化的选择性替代
发表机构 * UNC Chapel Hill(北卡罗来纳大学教堂山分校) ; AI2 ; Johns Hopkins University(约翰霍普金斯大学) ; University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 研究利用语言模型作为GPU内核性能的选择性替代,通过强化学习提高预测准确性和校准度,在有限GPU评估预算下加速内核搜索。
Comments Code: https://github.com/codezakh/gpu-forecasters
PithTrain: 一个紧凑且面向智能体的MoE训练系统
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Xlue ; NVIDIA(英伟达)
AI总结 提出PithTrain,一个基于智能体原生设计原则的紧凑型MoE训练框架,通过引入ATE-Bench评估智能体任务效率,在保持生产框架吞吐量的同时,将智能体任务轮次和活跃GPU时间分别降低62%和64%。
设备端机器人规划:消除推理冗余以实现高效决策
发表机构 * School of Integrated Technology, College of Computing, Yonsei University(延世大学整合技术学院,计算学院) ; Department of Hyperscale AI SoC Research Section, ETRI(ETRI超大规模AI SoC研究部) ; EECS - Electrical and Computer Engineering, University of Michigan(密歇根大学电气与计算机工程学院)
AI总结 提出REIS框架,通过场景门控、KV引导的affordance路由和审慎推理减少推理冗余,在保持语义适应性的同时加速机器人控制。
Comments 19 pages
VisionPulse: 用于高效多模态推理的动态视觉稀疏性
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China, Beijing, China(中国人民大学北京校区人工智能学院)
AI总结 提出VisionPulse框架,通过步骤级视觉令牌剪枝,利用视觉注意力质量估计保留预算,仅保留关键令牌,在几乎不损失准确率的情况下减少推理开销和推理轨迹长度。
Comments Accepted at ICML 2026
DRIFT: 解耦的轨迹采样与重要性加权微调以实现高效的多轮优化
发表机构 * The Hong Kong University of Science(香港科学与技术大学) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 针对多轮交互中在线强化学习成本高而离线监督微调存在分布偏移的问题,提出DRIFT框架,通过将KL正则化强化学习目标等价转化为重要性加权监督学习,实现高效且稳定的多轮优化。
自由译者的翻译分析 II:用于保密翻译工作流的本地大语言模型基准测试
发表机构 * University of Georgia(佐治亚大学)
AI总结 针对自由译者和小型语言服务提供商,开发了实用低门槛的方法,通过基准测试本地可运行的大语言模型在保密敏感领域的离线翻译性能,发现精心选择的本地大语言模型可匹配或超越本地神经机器翻译系统和前沿大语言模型,但落后于顶级商业神经机器翻译系统。
Comments 20 pages. Accepted at EAMT-2026 (Tilburg, Netherlands, June 2026)
面向方面情感三元组抽取的诊断推理监督细粒度验证
发表机构 * The Hong Kong Polytechnic University(香港理工大学) ; Lingnan University(岭南大学) ; Education University of Hong Kong(香港教育大学)
AI总结 提出FiVeD框架,通过诊断推理监督进行细粒度验证,利用质量评分和错误分类等辅助任务提升ASTE三元组抽取的可靠性。
Comments 25 pages, 13 figures, and 6 tables
基于回答集编程的强化学习抽象方法
发表机构 * Siemens AG Österreich(西门子奥地利公司) ; TU Wien (Vienna University of Technology)(维也纳技术大学) ; Jönköping University(约翰·科平大学)
AI总结 本文提出使用回答集编程(ASP)实现CARCASS框架中的抽象,以解决强化学习中状态空间巨大带来的挑战,并通过积木世界和Minigrid两个领域的案例验证了该方法的有效性。
Comments Accepted for publication at the 42nd International Conference on Logic Programming (ICLP 2026). To appear in Theory and Practice of Logic Programming (TPLP)