Low-Resource Safety Failures Are Action Failures, Not Representation Failures
低资源安全失败是行动失败,而非表征失败
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(莫扎伊德大学人工智能学院)
AI总结 本文发现低资源语言的安全对齐失败源于决策校准问题而非表征缺失,通过重校准高资源门控(低秩逻辑回归+阈值重置)显著提升拒绝选择性。
低资源安全失败是行动失败,而非表征失败
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(莫扎伊德大学人工智能学院)
AI总结 本文发现低资源语言的安全对齐失败源于决策校准问题而非表征缺失,通过重校准高资源门控(低秩逻辑回归+阈值重置)显著提升拒绝选择性。
PairedGTA:用于受控光度偏移分析的驾驶数据集生成
发表机构 * Scuola Superiore Sant’Anna(圣安娜高等学院) ; Department of Excellence in Robotics & AI(机器人与人工智能卓越部门) ; University of Pisa(比萨大学)
AI总结 提出基于高保真游戏引擎的PairedGTA框架,通过生成完美配对的图像,实现独立于几何和语义变化的光度偏移分析,并用于评估语义分割模型在恶劣条件下的性能退化。
Comments Under review
模型科学的案例:验证、探索、引导、改进
发表机构 * Center for Credible AI(可信AI中心) ; University of Warsaw(华沙大学) ; Warsaw University of Technology(华沙技术大学) ; University College Cork(科克大学学院) ; University of Technology Sydney(悉尼技术大学) ; Kempner Institute, Harvard University(哈佛大学凯普纳研究所) ; Human-Centered AI Lab(以人为本的人工智能实验室) ; Technical University of Berlin(柏林技术大学) ; Fraunhofer Heinrich Hertz Institute(弗劳恩霍夫海因里希·赫茨研究所) ; Berlin Institute for the Foundations of Learning and Data (BIFOLD)(柏林学习与数据基础研究所(BIFOLD))
AI总结 本文提出AI社区应超越基准测试,建立系统性的模型分析学科——模型科学,通过验证、探索、引导和改进四个功能视角,以及共享基础设施和深度案例研究,来理解复杂AI模型的行为。
Comments Follow up on arXiv:2508.20040
技能问题:湖仓代理的数据中心优化
发表机构 * University of Maryland(马里兰大学) ; Università Milano Bicocca(米兰Bicocca大学) ; Bauplan Labs(Bauplan实验室)
AI总结 针对分支湖仓Bauplan上的编码代理,提出数据中心的优化流程,通过生成任务验证器对、在隔离沙箱中执行候选技能并利用追踪信号和程序化检查评分,将准确率提升31.9%。
CA-BED:对话感知的贝叶斯实验设计
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Washington(华盛顿大学) ; University of Toronto(多伦多大学)
AI总结 提出对话感知的贝叶斯实验设计(CA-BED),一种推理时概率对话规划框架,通过结合贝叶斯实验设计与LLM似然估计,在多个对话轮次中优化问题选择,在结构化实体推断基准上平均成功率提升21.8%,仅增加1.8轮对话。
Comments Reliable Autonomy Workshop at ICLR 2026
异质系统中熵预测的物理信息深度学习:热力学与信息论案例研究
发表机构 * Durham University(杜ham大学) ; Department of Chemical Engineering(化学工程系) ; Veer Surendra Sai University of Technology(维尔·苏雷纳·赛大学)
AI总结 提出统一物理信息深度学习框架,通过微分方程残差和信息论约束,在单一神经网络中同时实现热力学与信息论系统的熵预测,并验证其数据效率和物理一致性。
时序图神经网络的时序模体特征
发表机构 * University of Oxford(牛津大学) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 针对时序图神经网络难以捕捉短时序模体模式的问题,提出一种紧凑的13维模体特征图,可线性嵌入任意静态或时序编码器,并在多种任务上提升性能。
复用融合时频谱可靠性用于RGB-红外目标检测的自适应融合与专家路由
发表机构 * Tsinghua University(清华大学)
AI总结 提出一种无参数的7维频谱可靠性描述符,通过频谱可靠性融合和可靠性条件专家路由,提升RGB-红外目标检测在退化条件下的性能。
经济思维:面向LLM自适应复杂度推理的分层框架
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; The Hong Kong University of Science and Technology(香港科学与技术大学) ; Nanyang Technological University(南洋理工大学) ; Singapore Institute of Manufacturing Technology, A*STAR(新加坡制造技术研究所,A*STAR)
AI总结 针对LLM推理中的“过度思考”问题,提出分层自适应预算器(HAB)框架,通过粗粒度到细粒度的预算分配实现计算资源的高效利用,在GSM8K和MATH500上同时提升准确率和降低token使用量。
Comments 11 pages, 4 figures, 3 tables
迈向交互式视频世界建模:前沿、挑战、基准与未来趋势
发表机构 * Department of Engineering, University of Cambridge, U.K.(剑桥大学工程系) ; Peking University(北京大学) ; University of Twente(埃因霍温理工大学) ; Mechanical Systems Control Laboratory, University of California, Berkeley, USA(加州大学伯克利分校机械系统控制实验室) ; ETH Zurich(苏黎世联邦理工学院) ; Microsoft(微软公司) ; University of Oxford(牛津大学)
AI总结 本文系统综述了交互式世界建模的研究趋势、技术挑战、评估基准,并提出了未来方向,重点在于动作条件可控性、长程交互与记忆以及实时响应性。
Comments Under review. The GitHub repository is publicly available at: https://github.com/liujiuming123/Awesome-Interactive-World-Model
形式数学验证中生成式奖励建模的期望值对齐
发表机构 * GitHub
AI总结 提出期望值对齐(EVA)方法,通过从模型词元分布中提取连续分数,在保持生成式奖励模型离散输出的同时实现连续评分,用于Lean 4形式验证。
带赌博反馈的两人零和博弈中的公平性
发表机构 * LatentForce.ai ; Laboratoire d’Informatique Fondamentale d’Orléans(奥尔良基础信息学实验室) ; University of Orléans(奥尔良大学)
AI总结 研究在公平约束下(每个动作概率至少为α/m)的两人零和博弈,通过重参数化将公平博弈转化为标准零和博弈,提出Fair-ETC-TPZSG算法并证明其遗憾界。
当数据稀缺时:通过重复训练扩展稀疏语言模型
发表机构 * Eindhoven University of Technology(埃因霍温理工大学) ; University of Luxembourg(卢森堡大学) ; University of Twente(埃因霍温大学) ; ETH Zürich(苏黎世联邦理工学院)
AI总结 研究数据受限下稀疏训练的可扩展性,提出包含活跃参数、唯一标记、数据重复和稀疏度的缩放定律,发现稀疏训练可延迟数据饱和并改善资源权衡。
Comments Accepted at ICML2026
拉格朗日扰动扩散引导:用于生成策略的潜在强化学习
发表机构 * University of Michigan(密歇根大学)
AI总结 提出拉格朗日扰动扩散引导(LP-DS),通过学习紧凑的噪声空间扰动来微调冻结的生成策略,利用拉格朗日信任区域目标优化,在保持潜在先验约束的同时提升下游价值,在多个基准上实现样本效率和回报提升。
Comments Accepted as a regular paper at ICML 2026
CoSTL:面向时刻检索与高亮检测的综合时空表征学习
发表机构 * Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院) ; Pengcheng Laboratory(鹏城实验室)
AI总结 提出综合时空表征学习框架CoSTL,通过文本驱动的渐进细粒度图像编码器和多尺度时间感知模块,联合学习空间细节与时间动态,在时刻检索和高亮检测任务上达到最优性能。
Comments 14 pages, 3 figures
并非所有解释都能同等模拟:比较言语化特征归因与自生成理由
发表机构 * Faculty of Computer Science, University of Vienna(维也纳大学计算机科学系) ; UniVie Doctoral School Computer Science, University of Vienna(维也纳大学计算机科学博士学院) ; Faculty of Philological and Cultural Studies, University of Vienna(维也纳大学文学与文化研究系)
AI总结 本研究通过反事实模拟设置,比较了言语化特征归因和自生成理由两种解释来源对问答模型行为可模拟性的影响,发现解释格式和粒度显著影响模拟效果。
Reasoning4Sciences:将推理语言模型桥接到所有科学分支
发表机构 * Poznan University of Technology(波兹南理工大学) ; National Cheng Kung University(国立成功大学) ; Universitas Katolik Musi Charitas Palembang(Palembang 巴厘岛天主教大学)
AI总结 本文首次全面分析推理语言模型在28个科学学科中的采用情况,提出基于领域资源的成熟度评估框架,揭示学科间差距并展望未来方向。
从异常到错误:使用多参考裁决审计巴利语到英语的LLM翻译
发表机构 * Independent Researcher(独立研究者) ; Nibbana Meditation Centre(尼布达冥想中心)
AI总结 针对大语言模型翻译古典语言时误将合理变异标记为错误的问题,提出基于多个人类翻译参考包络和嵌入漂移阈值筛选、再由LLM评审团裁决的审计方法,并应用于巴利语-英语翻译。
Comments Preprint. This manuscript has not yet been peer reviewed
HakushoBench:来自政府白皮书的日语图表VQA基准
发表机构 * Institute of Science Tokyo(东京科学研究所) ; NII(日本学术振兴会) ; NII LLMC(日本学术振兴会LLMC)
AI总结 利用政府白皮书构建日语图表VQA基准HakushoBench,包含2053张图像和人工标注问答对,评估视觉语言模型对图表的深度理解。
Comments 16 pages, 17 figures
Local MixVR:打破分布式学习中通信与样本的依赖关系
发表机构 * Technion Haifa, Israel(技术离子海法分校,以色列) ; EPFL Lausanne, Switzerland(洛桑联邦理工学院,瑞士)
AI总结 提出Local MixVR框架,通过局部更新与方差缩减技术消除通信复杂度对样本总数N的依赖,实现仅与工作节点数M相关的通信复杂度,在M<O(N^{1/4})时优于现有最优方法。
STARFISH: 从内部状态修复中实现剪枝网络的快速精度恢复
发表机构 * Weizmann Institute of Science(魏茨曼科学研究所)
AI总结 提出STARFISH方法,通过少量无标签校准集优化剪枝网络与原始网络内部状态对齐,高效恢复精度,在ViT网络上优于现有方法。
从无奖励表示到偏好:重新思考离线基于偏好的强化学习
发表机构 * GitHub
AI总结 本文提出一种结合无奖励表示学习和对比搜索微调的离线偏好强化学习框架,通过从无奖励离线数据中学习潜在后继度量表示,再利用偏好数据进行对比搜索和微调,显著提升了偏好效率。
Comments Published in ICML 2026
控制依赖 Lévy 跳跃的神经 HJB-PIDE 求解器的逐分量诊断协议
发表机构 * GitHub
AI总结 提出一个五步诊断协议,用于检测残差训练的神经 HJB-PIDE 求解器在控制依赖 Lévy 跳跃下的算子计算错误,并通过 CRRA-Merton-Variance-Gamma 基准案例验证其有效性。
面向无人机影像中运动鲁棒作物分割的秩感知分位数激活
发表机构 * Senior Member, IEEE(IEEE高级会员)
AI总结 针对高速无人机影像中的运动模糊导致语义分割退化的问题,提出秩感知的双分位数激活(QAct)模块,通过实例级秩归一化替代幅度门控,在零样本和模糊监督两种设置下均显著提升mIoU,尤其在稀有纹理依赖类上表现突出,且与模糊域训练互补。
HASTE: 面向大输出空间的硬件感知动态稀疏训练
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 提出组共享固定扇入稀疏性方法,通过半结构化输出层设计结合长尾分解,在极端多标签分类中实现显著加速并保持精度。
Comments Accepted at ICML 2026 Regular
USV-HROV系统的系缆感知动态避碰
发表机构 * Zhejiang University(浙江大学)
AI总结 针对USV跟踪HROV时水下系缆与过往船只刮擦及系缆绷紧风险,提出一种系缆感知的动态避碰方法,通过引入系缆安全感知平面域和系缆绷紧感知速度障碍法,实现安全避碰并降低系缆绷紧可能性。
基于结构化视觉证据的时间证据路由用于TimeLogicQA
发表机构 * Southeast University(东南大学) ; National University of Singapore(新加坡国立大学) ; Independent Researcher(独立研究员) ; Opus AI Research(Opus AI研究院) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出视觉证据路由流水线,分离感知与符号时间推理,通过结构化视觉证据和确定性时间规则在TimeLogicQA上达到81.8 AvgAcc。
自适应密集证据精炼用于视频关系推理:VRR-QA挑战
发表机构 * Southeast University(东南大学) ; National University of Singapore(国立新加坡大学) ; Independent Researcher(独立研究员) ; Opus AI Research(Opus AI研究) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出一种自适应测试时计算系统,通过轻量视图识别不稳定问题并路由到高预算密集证据模块,在VRR-QA测试集上达到90.07%平均准确率。
Soft-NBCE: 基于熵加权分块融合的长上下文处理
发表机构 * Beijing Normal University(北京师范大学) ; Chunjiang Intelligence(春江智能)
AI总结 针对长上下文推理中硬选择策略导致语义碎片化的问题,提出Soft-NBCE,通过熵加权软融合和一致性蒸馏,在保持检索精度的同时提升多跳推理性能。
Comments 7 pages, 3 figures, 2 tables. Preprint
MiCU: 基于大语言模型的端到端智能家居指令理解
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院) ; Xiaomi Corporation(小米公司) ; Institute for Math & AI, Wuhan University(武汉大学数学与人工智能研究院)
AI总结 提出MiCU,一种利用课程学习、强化学习和令牌压缩技术的领域特定大语言模型,用于解决智能家居中模糊指令理解问题,平均准确率提升20.01%。