Diagnosing Live Within-Policy Instruction Conflicts in LLM Agents with Witnessed Resolution Profiles
诊断LLM代理中实时策略内指令冲突的见证解析轮廓
发表机构 * Purdue University(普渡大学)
AI总结 提出WIRE管道,通过提取规则、编码为PyRule子句、检测冲突并生成见证实例,诊断LLM代理单一提示策略内规则对之间的冲突,发现64.6%的见证实例至少违反一条源规则。
诊断LLM代理中实时策略内指令冲突的见证解析轮廓
发表机构 * Purdue University(普渡大学)
AI总结 提出WIRE管道,通过提取规则、编码为PyRule子句、检测冲突并生成见证实例,诊断LLM代理单一提示策略内规则对之间的冲突,发现64.6%的见证实例至少违反一条源规则。
重新审视全同态加密下的机器学习训练:收敛保证、差分隐私与高效算法
发表机构 * University of Maryland, College Park, MD(马里兰大学 College Park 分校) ; AlgoCRYPT CoE(算法密码学中心)
AI总结 本文首次对全同态加密下的机器学习训练进行理论收敛性分析,结合适用于加密计算的差分隐私训练算法,通过多项式近似激活函数和损失函数实现近似梯度下降的收敛,并采用无逐样本梯度裁剪的差分隐私机制提升计算效率。
Transformer中上下文事实回忆的微调动力学
发表机构 * Duke University(杜克大学) ; Princeton University(普林斯顿大学) ; UC Berkeley(加州大学伯克利分校)
AI总结 研究Transformer在上下文学习中如何利用存储的参数化事实知识,通过引入上下文事实回忆任务并分析单层Transformer的微调动力学,证明模型收敛到特定的成对注意力模式,且所需样本量极少。
模型是否知道它们为何改变主意?知识冲突下思维链的可解释性与忠实性
发表机构 * Independent Researcher(独立研究员)
AI总结 通过引入内省忠实性,研究在知识冲突下语言模型的思维链推理是否忠实反映其决策机制,发现CoT高度稳定但置信度携带微弱真实信号。
Comments 12 pages, 8 tables, 3 appendices
音频大语言模型是听还是读?使用VoxParadox分析和缓解副语言失败
发表机构 * Institute for Creative Technologies, University of Southern California, Los Angeles, USA(创意技术研究所,南加州大学,洛杉矶,美国)
AI总结 针对音频大语言模型在副语言理解上的不足,提出对抗性基准VoxParadox和Prompt-Conditioned Layer Mixer方法,显著提升模型对副语言线索的利用能力。
Comments Accepted as a conference paper at ICML 2026. Project page: https://voxparadox.github.io/
具有学习弃权与实时引导的可审计决策模型
发表机构 * Simple Machine Mind(简单机器思维)
AI总结 提出EvaluatorDPT模型,通过Transformer编码器学习YES/NO/TBD三值决策,其中TBD作为延迟输出被学习,并支持推理时阈值控制和辅助语义信号,实现可审计的决策控制。
Comments 21 pages, 5 figures
UniMaia:用语言引导国际象棋策略以实现类人玩法
发表机构 * University of Waterloo(滑铁卢大学) ; Carleton University(卡尔顿大学)
AI总结 提出UniMaia框架,通过参数高效文本编码器和ControlNet风格调节机制,在冻结的Lc0国际象棋策略网络上实现提示条件策略调制,实现语义控制(如开局选择和玩家强度)并保持预训练策略表征,同时构建大规模元数据增强的Lichess数据集和半自动提示生成管道,在多个基准上取得最优或竞争性结果。
Got a Secret? LLM Agents Can't Keep It: Evaluating Privacy in Multi-Agent Systems
发表机构 * Foundation AI USA(Foundation AI美国)
AI总结 本研究通过多智能体模拟平台评估LLM智能体在社交压力下的隐私泄露风险,发现多轮社交交互显著增加隐私泄露,且泄露具有社交传染性,即使有隐私指令也无法完全消除。
恢复甜蜜点:用于LLM推理的通过率加权自蒸馏
发表机构 * College of Information Sciences and Technology(信息科学与技术学院)
AI总结 提出SC-SDPO方法,通过问题通过率加权自蒸馏损失,动态调整训练难度,提升LLM推理性能。
Comments 18 pages, 8 figures
分割模型能理解世界吗?通过视觉思维链实现主动可供性推理
发表机构 * Northwestern University(西北大学) ; Northeastern University(东北大学) ; South China University of Technology(华南理工大学) ; Hong Kong Baptist University(香港 Baptist大学) ; Beijing Normal - Hong Kong Baptist University(北京师范大学-香港 Baptist大学)
AI总结 提出SegWorld框架,通过多级视觉思维链在意图级指令下进行主动场景观察和可供性推理,实现从目标到部件的高效分割。
LLM服务中基于批处理条件的拒绝鲁棒性配对测试协议
发表机构 * Independent Researcher(独立研究者)
AI总结 提出配对测试协议,通过四项研究验证批处理条件对LLM安全标签的影响,发现批处理导致的安全标签翻转率低但存在,建议精确堆栈验证。
Comments 12 pages. Accepted to the ICML 2026 Workshop on Hypothesis Testing
AndroidDaily: 面向真实世界闭源应用的可验证移动GUI智能体基准
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学) ; StepFun ; Waseda University(早稻田大学)
AI总结 针对闭源应用无法获取内部状态导致自动验证困难的问题,提出AndroidDaily基准(350个日常任务)和GRADE评估器(基于可观察外部指南的三层系统),实现无需内部状态的可验证评估,最强模型成功率为62.0%。
Comments 11 pages, 6 figures. Preprint
SkillGrad: 像梯度下降一样优化智能体技能
发表机构 * College of Information Sciences and Technology(信息科学与技术学院) ; The Pennsylvania State University(宾夕法尼亚州立大学) ; University Park, PA, USA
AI总结 提出SkillGrad框架,将技能包视为结构化参数,通过轨迹级损失、文本梯度诊断和动量记忆覆盖进行类梯度下降优化,在表格问答任务上平均提升6.7个百分点。
Colosseum V2:视觉语言动作模型的泛化能力基准测试
发表机构 * Department of Computer Science, University of Southern California(南加州大学计算机科学系) ; Department of Electrical Engineering, Indian Institute of Technology Madras(印度理工学院Madras分校电子工程系) ; Fu Foundation School of Engineering and Applied Science, Columbia University(哥伦比亚大学工程与应用科学学院)
AI总结 提出Colosseum V2大规模仿真基准,通过28个任务和两种机器人形态,系统评估VLA模型在分布偏移下的泛化能力,揭示其在高层次理解与鲁棒行为之间的差距。
基于几何感知算子学习与内存高效低秩注意力的高保真工业碰撞动力学预测
发表机构 * Department of Aerospace and Mechanical Engineering, University of Notre Dame(诺特大学航空航天与机械工程系) ; NVIDIA ; General Motors(通用汽车)
AI总结 本文提出GeoTransolver框架,通过几何感知算子学习和内存高效低秩注意力机制,实现工业级碰撞动力学的高保真预测,在复杂梁和整车碰撞数据集上验证了其准确性和效率。
阅读还是猜测?古希腊版本OCR中视觉语言模型的视觉定位失败
发表机构 * Inria(法国国家信息与自动化研究所)
AI总结 通过对比开放权重视觉语言模型与传统OCR基线在低资源古希腊批判版本上的表现,发现VLM即使错误也能生成流畅文本,表明其依赖语言先验,并引入扰动和标记级定位度量分析视觉证据。
马氏距离 PatchCore:协方差感知与流式兼容的工业异常检测
发表机构 * Department of Engineering, University of Ferrara(费拉拉大学工程学院)
AI总结 提出马氏距离 PatchCore,通过协方差估计和流式处理改进 PatchCore,在保持性能的同时降低峰值内存并提升工业检测精度。
Comments 57 pages, 7 figures
一种面向智能体LLM服务的策略驱动运行时层
发表机构 * University of California, Santa Cruz(加州大学圣克鲁兹分校)
AI总结 针对多智能体LLM系统中跨层策略难以高效实现的问题,提出在框架与引擎之间插入智能体运行时层,通过四个原语支持任意智能体感知策略,并在KV缓存策略CacheSage上验证了有效性。
逃离语言先验:通过模态感知策略优化缓解音频推理中的后期模态崩溃
发表机构 * Johns Hopkins University(约翰霍普金斯大学) ; Tencent Hunyuan(腾讯文言)
AI总结 针对多模态大语言模型在强化学习后训练中因统一策略梯度忽略模态依赖性而导致的后期模态崩溃问题,提出模态感知策略优化(MAPO)框架,通过模态相关性掩码和辅助注意力损失分支动态聚焦梯度并维持跨模态推理,在复杂音频推理基准上取得新最优结果。
UNIQUE: 通用Top-k稀疏注意力,用于免训练推理和稀疏感知训练
发表机构 * Microsoft(微软)
AI总结 提出UNIQUE框架,通过基于键均值和标准差的页面重要性评分和软掩码稀疏感知训练,实现LLM长上下文推理中KV缓存的高效稀疏注意力,在保持任务性能的同时显著加速。
工作者分歧揭示局部SGD中的尖锐方向
发表机构 * New York University(纽约大学)
AI总结 本文通过理论分析和实验证明,局部SGD中的工作者平均间隙协方差能够捕捉Hessian矩阵的尖锐方向,从而提供一种廉价的无Hessian估计方法。
Comments 5 pages main body, 18 pages appendix - Accepted to HiLD 2026, ICML
有界计算多模态回归用于产品评分预测
发表机构 * Snap Inc.
AI总结 针对严格延迟预算下的标量回归任务,提出一种有界计算适配方法,通过替换语言模型头为轻量MLP并固定输入,在LoViF 2026挑战赛中实现高效多模态回归。
Comments Accepted to the LoViF Workshop at CVPR 2026. 8 pages, 2 figures
显式评论家引导的对齐扩散模型
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出一种状态对齐的潜在演员-评论家框架,通过将扩散模型自身作为时间步条件价值函数,实现轨迹级PPO训练和推理时引导,在单/多奖励基准上优于先前方法。
从自身潜在表示而非token学习:样本复杂度理论
发表机构 * Institute of Physics(物理研究所) ; University of Cambridge(剑桥大学) ; Johns Hopkins University(约翰霍普金斯大学) ; EPFL(苏黎世联邦理工学院)
AI总结 本文通过概率上下文无关语法数据,证明潜在预测方法在样本复杂度上相比token级SSL具有指数级优势,并分析了多尺度层次结构的必要性。
Comments 10 pages, 5 figures in main. 28 pages, 14 figures, 1 table in all
逐元素裁剪能否实现随机梯度的谱控制?
发表机构 * Department of Computer Science, Purdue University, West Lafayette, IN, USA(计算机科学系,普渡大学,西拉法塞特,印第安纳州,美国) ; School of Industrial Engineering, Purdue University, West Lafayette, IN, USA(工业工程学院,普渡大学,西拉法塞特,印第安纳州,美国)
AI总结 本文提出一种逐元素裁剪方法,通过分析梯度噪声的局部化特性,在保持矩阵结构的同时实现谱控制,并在Cauchy污染噪声下给出收敛保证,实验表明该方法可节省训练令牌。
异步遥感时间序列融合用于云去除与任意时间重建
发表机构 * School of Computing and Augmented Intelligence, Arizona State University(计算与增强智能学院,亚利桑那州立大学) ; School of Geographical Sciences and Urban Planning, Arizona State University(地理科学与城市规划学院,亚利桑那州立大学) ; Woodwell Climate Research Center(伍德沃德气候研究中心)
AI总结 提出AGFlow模型,通过时间对齐生成流匹配融合异步S1/S2数据,实现云去除、缺失帧重建及任意时间查询。
Comments CVPR 2026 MORSE Workshop
HumanoidMimicGen: 通过全身规划生成行走操作数据
发表机构 * NVIDIA ; The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 提出HumanoidMimicGen方法,通过全身规划自动生成人形机器人行走操作演示数据,在模拟基准上使联合训练的策略性能提升20%。
Comments website: https://humanoidmimicgen.github.io/
NUCLEUS-MoE:池沸腾液冷统一模型
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系) ; University of California, Irvine(加州大学 Irvine 分校)
AI总结 提出混合专家模型NUCLEUS,通过邻域注意力、符号距离场重初始化与专家路由,统一建模不同流体和工况下的池沸腾,实现零样本与小样本泛化。
Comments 12 pages, 9 figurs, KDD AI for Science
UserHarness:利用用户心智增强智能体心理理论
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出UserHarness框架,通过显式重建用户心智状态(信念、意图等)进行心理理论推理,在五个基准上达到95.94%的宏准确率,相对提升超15%。
Comments 19 Pages, 4 Figures, 2 Tables
有限滚动验证下学习型着陆控制器的贝叶斯部署批准
发表机构 * Independent Researcher(独立研究者)
AI总结 针对学习型自主控制器在有限仿真验证下的部署不确定性,提出基于贝叶斯后验推断的部署批准框架,通过后验批准概率和部署风险进行不确定性校准评估。
Comments 16 pages, 4 figures and 4 tables