Value Functions as Supermartingale Certificates
值函数作为超鞅证书
AI总结 本文通过建立值函数与Streett超鞅证书之间的理论联系,将随机系统的形式化验证方法与强化学习相结合,为ω-正则性质提供了一种基于RL的证书合成方法。
Comments To appear in SAIV'26
值函数作为超鞅证书
AI总结 本文通过建立值函数与Streett超鞅证书之间的理论联系,将随机系统的形式化验证方法与强化学习相结合,为ω-正则性质提供了一种基于RL的证书合成方法。
Comments To appear in SAIV'26
Chem-PerturBridge:小分子扰动转录组效应的协调汇编
AI总结 为解决小分子扰动转录组数据碎片化问题,构建了涵盖37k化合物、136种细胞背景和125万样本的协调资源Chem-PerturBridge,并验证了其在跨数据集签名一致性评估和化合物表示学习预训练中的有效性。
Comments 33 pages, 6 figures, 16 tables
UniAudio-Token: 赋予语义语音分词器通用音频感知能力
AI总结 提出UniAudio-Token框架,通过语义-声学基元(SAP)和语义-声学均衡(SAE)机制,在不牺牲语音能力的前提下为语义分词器注入通用音频感知,实现统一音频接口。
Comments 19 pages, 10 figures
关于稀疏自编码器中激活异常值与特征死亡之间关系的研究
AI总结 本文通过理论分析和实验验证,揭示了稀疏自编码器中维度级激活异常值导致特征死亡的机制,并提出均值中心化预处理方法有效消除该问题。
Comments Accepted to ICML 2026 main conference
用上下文提示调优个性化你的大型视觉语言模型
AI总结 提出上下文提示调优(ICPT)方法,通过轻量投影模块从多参考图像中提取细粒度视觉语义并转化为连续提示,结合几何正则化解决环境偏差和跨概念干扰,实现高效个性化。
Comments 27 pages, 10 figures, 5 tables
来自临床叙述的可靠多语言骨科决策支持:语言感知适应与验证引导的延迟
AI总结 针对低资源医疗环境中的多语言骨科决策支持,提出结合语言感知适配编码器IndicBERT-HPA和确定性选择性验证层的可靠性框架,在英语、印地语和旁遮普语临床文本分类中取得最优性能。
智能体强化学习中的技能重用作为压缩
AI总结 提出ReuseRL方法,基于最小描述长度原则将成功轨迹压缩为可重用技能字典,并通过分割代价惩罚低效编码行为,在多个环境中提升分布内和分布外成功率。
Comments Work in progress
在没有显式正则化的情况下内化视频目标中心学习中的时间一致性
AI总结 提出一种无需显式时间一致性损失(SSC)的视频目标中心学习方法,通过时序通道分解(CCD)和跨时间重建(CTR)机制隐式学习时间一致性,提升训练效率和性能。
Comments 14 pages
何时多模态预测具有生物学支持?一个诊断性评估框架
AI总结 提出DECAT框架,通过五个零参考指标和规则决策,将多模态表示分类为四种诊断场景,以检测模型是否学到共享生物学、单模态生物学或虚假相关性。
嵌入模型如何绑定概念?
AI总结 本文研究视觉-语言嵌入模型(如CLIP)在概念绑定上的局限性,发现场景嵌入可加性分解为对象表示,但CLIP的高复杂度绑定函数阻碍了泛化,而通过充分数据训练的Transformer模型能学习低复杂度乘法交互绑定函数实现系统泛化。
Comments ICML 2026
通过IO感知层实现实现GNN的高效扩展
AI总结 针对GNN中稀疏不规则内存访问瓶颈,提出三种GPU内核族(SpMM卷积、归约聚合、注意力层)以减少数据移动并提升局部性,在真实图上实现高达8.5倍加速和76倍内存降低。
Comments International Conference on Machine Learning (ICML) 2026, Spotlight Paper
Assign and Add: 组合算术的机制研究
AI总结 通过变量赋值和模加法任务,研究Transformer中组合泛化的机制,发现模型利用同一模加法模块处理直接和间接输入,并揭示了三阶段学习动态。
整合奖励扰动用于大语言模型后训练
AI总结 提出CoRP方法,通过奖励加权聚合、兼容性重加权和验证门控,将奖励扰动整合为单一模型,无需梯度,在单次推理下平均提升8.1分。
LinTree: 通过显式结构化搜索历史提升LLM推理能力
AI总结 针对LLM推理中隐式搜索树导致性能不佳的问题,提出LinTree方法,通过添加父指针显式表示线性化树结构,在Blocks World、网格导航和Sokoban任务中提升了任务性能和搜索效率。
Comments 16 pages, 3 figures
利用触觉皮肤学习两个手指间小物体的受控分离
AI总结 本文提出并解决了多用途机器人手两个手指间小物体的受控分离任务,通过强化学习训练纯触觉策略,并分析了空间分辨触觉反馈的优势。
Graphical einops: 桥接张量网络与计算图
AI总结 本文提出一种形式化的图形演算,用于einops的张量编程结构片段,通过等级自然性重写实现张量等变性的图解证明,并应用于注意力掩码转换以优化稀疏注意力实现。
平衡LoRA:消除参数不变性以加速收敛
AI总结 针对LoRA过参数化导致不同低秩因子对条件数差异大而影响收敛速度的问题,提出BaLoRA,通过投影到平衡流形改善损失景观条件,实现更快收敛和更优性能。
Comments Accepted at ICML 2026
Batched Differentiable Rigid Body Dynamics in PyTorch for GPU-Accelerated Robot Learning
AI总结 提出BARD,一种基于PyTorch的批处理可微刚体动力学库,通过三级缓存、无矩阵乘法的关节变换和层级并行传播,在GPU上实现高达64倍的前向运动学加速,并支持梯度计算。
语言模型可以组合性地解析指代,但这并非其天然优势:以个人关系任务为例
AI总结 通过个人关系任务,比较人类与大型语言模型在外延任务(确定指称对象)和内涵任务(结构化表示意义)上的表现,发现人类更擅长外延任务而LLM更擅长内涵任务,表明缺乏指称基础是LLM模拟人类语言理解的关键缺失。
Comments A pre-MIT Press publication version. Paper accepted to Transactions of the Association for Computational Linguistics
IDOL: 逆动力学引导的未来预测用于端到端自动驾驶
AI总结 提出IDOL框架,通过逆动力学模型将BEV世界模型预测的未来潜在场景状态转化为规划相关的轨迹增量,实现未来预测与轨迹优化的紧密耦合,在NAVSIM基准上达到最优性能。
Comments 20 pages, 5 figures
扩展匈牙利语对话ASR:BEA-Dialogue+语料库
AI总结 针对匈牙利语对话语音识别训练数据不足的问题,本文通过放宽分割标准扩展BEA-Dialogue语料库至200小时,并评估基于Whisper和FastConformer的模型,证明基于序列化输出训练的微调能持续改善识别性能。
AutoSci: 面向完整科学生命周期的以记忆为中心的智能体系统
AI总结 提出AutoSci,一个以记忆为中心、支持完整科学生命周期的智能体系统,通过结构化记忆、多阶段流程、有向无环图增强和演化机制实现自动化科研。
VolFill: 基于体素流匹配的单视图非模态3D场景重建
AI总结 提出VolFill框架,利用混合3D VAE和潜在扩散Transformer从单张RGB图像生成完整3D场景结构,在SCRREAM和NRGB-D数据集上显著优于现有方法。
GPU预测器:语言模型作为内核运行时优化的选择性替代
AI总结 研究利用语言模型作为GPU内核性能的选择性替代,通过强化学习提高预测准确性和校准度,在有限GPU评估预算下加速内核搜索。
Comments Code: https://github.com/codezakh/gpu-forecasters
PithTrain: 一个紧凑且面向智能体的MoE训练系统
AI总结 提出PithTrain,一个基于智能体原生设计原则的紧凑型MoE训练框架,通过引入ATE-Bench评估智能体任务效率,在保持生产框架吞吐量的同时,将智能体任务轮次和活跃GPU时间分别降低62%和64%。
设备端机器人规划:消除推理冗余以实现高效决策
AI总结 提出REIS框架,通过场景门控、KV引导的affordance路由和审慎推理减少推理冗余,在保持语义适应性的同时加速机器人控制。
Comments 19 pages
VisionPulse: 用于高效多模态推理的动态视觉稀疏性
AI总结 提出VisionPulse框架,通过步骤级视觉令牌剪枝,利用视觉注意力质量估计保留预算,仅保留关键令牌,在几乎不损失准确率的情况下减少推理开销和推理轨迹长度。
Comments Accepted at ICML 2026
DRIFT: 解耦的轨迹采样与重要性加权微调以实现高效的多轮优化
AI总结 针对多轮交互中在线强化学习成本高而离线监督微调存在分布偏移的问题,提出DRIFT框架,通过将KL正则化强化学习目标等价转化为重要性加权监督学习,实现高效且稳定的多轮优化。
自由译者的翻译分析 II:用于保密翻译工作流的本地大语言模型基准测试
AI总结 针对自由译者和小型语言服务提供商,开发了实用低门槛的方法,通过基准测试本地可运行的大语言模型在保密敏感领域的离线翻译性能,发现精心选择的本地大语言模型可匹配或超越本地神经机器翻译系统和前沿大语言模型,但落后于顶级商业神经机器翻译系统。
Comments 20 pages. Accepted at EAMT-2026 (Tilburg, Netherlands, June 2026)
面向方面情感三元组抽取的诊断推理监督细粒度验证
AI总结 提出FiVeD框架,通过诊断推理监督进行细粒度验证,利用质量评分和错误分类等辅助任务提升ASTE三元组抽取的可靠性。
Comments 25 pages, 13 figures, and 6 tables