Causal Modeling of Selection in Evolution
进化中选择的因果建模
发表机构 * University of Washington(华盛顿大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文区分了静态选择与进化选择两种形式,针对进化选择提出新因果模型,并开发了从数据中识别该模型的完整方法。
Comments Appears at ICML 2026 (spotlight)
进化中选择的因果建模
发表机构 * University of Washington(华盛顿大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文区分了静态选择与进化选择两种形式,针对进化选择提出新因果模型,并开发了从数据中识别该模型的完整方法。
Comments Appears at ICML 2026 (spotlight)
面向路由一致性的混合专家模型量化的值与结构对齐
发表机构 * Nota Inc., South Korea(韩国Nota公司)
AI总结 提出VSRAQ方法,通过值对齐和结构对齐两个互补目标保持量化前后的专家选择行为一致性,减少量化引起的性能下降,无需推理开销。
Comments 8 pages, 1 figure
加速与扩展MPC引导的强化学习在类人机器人行走与操作中的应用
发表机构 * California Institute of Technology(加州理工学院) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 本文提出了一种基于质心动力学MPC奖励的MPC-RL框架,并开发了并行批处理GPU求解器π^nMPC,以高效实现类人机器人的行走与操作技能。
Comments 8 pages, 5 figures
AdaMEM:语言代理的测试时自适应记忆
发表机构 * Yunxiang Zhang(张 Yunxiang) ; Yiheng Li(李 Yiheng) ; Ali Payani(Payani Ali) ; Lu Wang(王 Lu)
AI总结 提出AdaMEM框架,通过混合记忆架构(长期轨迹记忆+动态短期策略记忆)实现测试时自适应,无需在线更新参数,在ALFWorld、WebShop等任务上显著优于静态记忆基线。
Comments ICML 2026
超越波形鲁棒性:针对自动语音识别的鲁棒特征-声码器对抗攻击
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Wuhan University(武汉大学)
AI总结 提出一种基于自监督学习表示和声码器的黑盒对抗攻击方法,通过扰动声学-语音特征而非波形,提高了攻击的可迁移性和对防御的绕过能力。
Comments 11 pages
LongSpace: 从感知到回忆的视频长程空间记忆探索
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学) ; Zhongguancun Academy(中关村学院) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; The Chinese University of Hong Kong(香港中文大学) ; Xi’an Jiaotong University(西安交通大学)
AI总结 针对长视频中空间记忆的挑战,提出LongSpace框架,通过分块建模、3D结构线索注入和层级感知记忆实现长程空间推理,并在LongSpace-Bench等基准上验证其有效性。
双向优于单向:基于循环一致性的双向对齐用于无样本类增量学习
发表机构 * Chester F. Carlson Center for Imaging Science(切斯特·F·卡勒中心影像科学中心) ; Rochester Institute of Technology(罗切斯特理工学院)
AI总结 提出BiCyc方法,通过双向投影器对齐和循环一致性目标,解决无样本类增量学习中原型漂移和单向投影偏差问题,减少灾难性遗忘并提升准确率。
Comments Published as a conference paper at ICLR 2026. 23 pages, 8 figures. Code: https://github.com/HXuSz11/BiCyc_ICLR2026
QueryAgent-R1:连接查询生成与商品检索的电商查询推荐
发表机构 * Alibaba International Digital Commercial Group(阿里巴巴国际数字商业集团)
AI总结 提出QueryAgent-R1框架,通过记忆增强和检索链优化,将查询生成与实际库存检索对齐,以提升电商搜索中查询推荐的产品转化率。
更多智能体有帮助吗?LLM智能体工作流的受控与协议对齐评估
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学) ; Westlake University(西湖大学) ; Zhejiang University(浙江大学) ; Duke Kunshan University(杜克大学昆山分校) ; Hong Kong University of Science and Technology(香港科技大学) ; Zhejiang University of Technology(浙江工业大学)
AI总结 提出BenchAgent框架,在统一协议下比较单智能体、固定多智能体和演化多智能体工作流,发现大多数多智能体系统在准确率上未超越单智能体基线,但运行时生成的工作流在GAIA上表现优异。
Comments https://github.com/LINs-lab/MASArena/tree/BenchAgent
机器人化仓储系统中的动态多智能体取送货
发表机构 * Department of Industrial and Systems Engineering, The Hong Kong Polytechnic University(工业与系统工程系,香港理工大学) ; School of Automation and Intelligent Sensing, Shanghai Jiao Tong University(自动化与智能感知学院,上海交通大学)
AI总结 针对订单内部SKU动态追加的仓库场景,首次形式化动态多智能体取送货问题,提出两种基于令牌传递的事件触发在线重规划算法,显著降低订单流时间。
V2V-Bench:视频到视频生成评估的综合基准
发表机构 * Centific Global Solutions Inc.(Centific全球解决方案公司)
AI总结 针对视频到视频生成评估中现有指标无法同时衡量编辑指令遵循和帧级对应的问题,提出包含11个维度、5个类别的V2V-Bench基准,评估三个模型并验证其与人类判断高度相关。
Comments Accepted at ICML 2026 workshop
在突然完全旋翼故障下保持完整六自由度驱动:使用双轴倾斜六旋翼的被动容错飞行控制
发表机构 * Tsinghua University(清华大学)
AI总结 本文针对双轴倾斜过驱动六旋翼在突发完全旋翼故障下,提出两种无需故障检测的被动容错控制方案,实现完整六自由度轨迹跟踪,并通过仿真和实验验证其鲁棒性。
持续学习基准:评估现实世界有状态环境中的前沿AI系统
发表机构 * UC Berkeley(伯克利大学) ; Snorkel AI ; University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 提出首个专家验证的持续学习基准CL-Bench,涵盖六个领域,通过增益指标隔离在线学习能力,发现现有系统存在过拟合和知识复用不足问题。
面向长时域任务的安全具身AI:机器人操作跨层分析
发表机构 * UNIST InnoCORE AI-Space Solar Initiative(UNIST创新核心人工智能空间太阳能计划) ; Ulsan National Institute of Science and Technology (UNIST)(乌山国立科学技术研究院) ; Automation and Systems Research Institute(自动化与系统研究所) ; Department of Electrical and Computer Engineering(电气与计算机工程系) ; Interdisciplinary Program in Artificial Intelligence(人工智能跨学科项目) ; LG Electronics(LG电子)
AI总结 本文从具身AI视角,系统综述长时域机器人操作中的安全问题,按干预时机(规划时、策略时、执行时)组织文献,分析证据强度,并指出当前安全保证的不足与未来方向。
Comments 63 pages, 6 figures
CoFi-UCGen:无标签先验的粗到细无监督条件生成
发表机构 * Department of Electronic Information Engineering, Beihang University(信息工程系,北航) ; School of Cyber Science and Technology, Beihang University(网络安全科学与技术学院,北航) ; College of Electronic Science, National University of Defense Technology(电子科学学院,国防科技大学) ; Institute of Artificial Intelligence, Beihang University(人工智能研究院,北航)
AI总结 提出粗到细的无监督条件生成框架CoFi-UCGen,通过对抗语义互学习理论和位编码实现无标签条件下的全局与细粒度语义解耦,并利用扩散模型层次调制机制控制生成。
与“敌人”编码:人类开发者能否检测到AI代理的破坏行为?
发表机构 * Northeastern University(东北大学)
AI总结 通过大规模用户实验,研究人类开发者在长时间编码任务中检测AI代理恶意代码插入的能力,发现94%的开发者未能识别破坏,并分析其原因,提出安全监控设计建议。
Comments 34 pages, 30 figures, 3 tables
FIDES: 通过深层证据信号实现RAG中检索-记忆冲突的忠实推理
发表机构 * Binjiang Institute of Zhejiang University(浙江大学滨江研究院) ; Zhejiang University(浙江大学) ; Guangzhou University(广州大学) ; GenTel.io
AI总结 针对检索增强生成中检索证据与参数记忆冲突导致模型忽略上下文的问题,提出无训练解码器FIDES,通过融合输出表面、隐藏表示和预测轨迹三种内部信号,在token级别动态调整干预强度,显著提升上下文忠实度。
面向工程可靠裂缝表示与拓扑保持的土木基础设施多任务裂缝基础模型
发表机构 * NDSU(内达苏大学)
AI总结 提出 CrackGeoFM 多任务框架,结合冻结视觉基础骨干与裂缝专用适配模块,实现掩码预测、骨架重建和不确定性估计,在20个数据集上达到最优分割、拓扑保持和校准不确定性。
Comments 60 pages, 17 figures, 11 tables
Q-GNN: 具有类型感知的查询条件图神经网络用于知识图谱补全
发表机构 * College of Intelligence and Computing, Tianjin University(智能与计算学院,天津大学)
AI总结 提出Q-GNN,通过融合查询实体的结构上下文和语义类型信息,增强图神经网络在知识图谱补全中的推理能力。
StableRCA:鲁棒的图无关机制级根因分析
发表机构 * Department of Computer Science, Tsinghua University(清华大学计算机科学系) ; Bosch Center for Artificial Intelligence(博世人工智能中心) ; Computer Science Department, TU Darmstadt(图尔恩大学计算机科学系)
AI总结 提出StableRCA框架,通过估计局部马尔可夫边界并检测条件分布偏移,避免全局图发现,实现鲁棒的机制级根因分析。
ShotCrop$^3$:将人物中心图像裁剪为电影级三镜头构图
发表机构 * Huawei Noah’s Ark Lab(华为诺亚实验室) ; Sun Yat-sen University(中山大学)
AI总结 提出三镜头构图任务,通过三阶段训练流程(思维链微调、半监督微调和组相对策略优化)从单张人物中心图像生成远景、中景和特写三张裁剪图,并附带简短描述,以支持视觉叙事。
从执行中引导语义层用于文本到SQL
发表机构 * Seoul National University(首尔国立大学)
AI总结 提出GATE方法,通过执行反馈引导缺失的语义层,将执行结果作为可复用记忆,提升文本到SQL的准确性。
答案存在驱动RAG重写收益
发表机构 * Ant Group(蚂蚁集团)
AI总结 通过受控干预审计,发现检索增强问答中重写器带来的性能提升主要由黄金答案字符串出现在重写上下文中驱动,而非证据质量改善。
LLM在Lean中数学形式化的评估
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Washington(华盛顿大学)
AI总结 本研究通过pass@k和refine@k指标在miniF2F和miniCTX子集上比较了多种大语言模型在Lean 4中生成形式化证明的能力,发现Gemini 3.1 Pro和Claude Opus 4.7性能最佳,而NVIDIA Nemotron 3 Super和GPT-OSS 120B在考虑成本时效率最高。
Comments 15 pages, 13 figures, 10 tables. Comments welcome!
当新生成器到来:基于岭特征迁移的终身机器生成文本归因
发表机构 * Wuhan University(武汉大学) ; Ant Group(蚂蚁集团) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; Institute of Deep Perception Technology, JITRI(感知技术研究院,JITRI)
AI总结 针对终身机器生成文本归因中持续适应新生成器与保留旧知识难以平衡的问题,提出轻量级分析更新框架RidgeFT,通过协方差校准和固定随机特征实现无需示例回放的闭式更新。
Comments 12 pages
自承诺延迟:一种用于提示隐式劫持的无奖励探针
发表机构 * Stanford University(斯坦福大学) ; Tsinghua University(清华大学)
AI总结 提出自承诺延迟指标,通过测量推理上下文对模型自身最终答案的承诺时机,无需奖励信号即可检测提示隐式劫持,在GSM8K数据集上达到AUROC 0.878-0.926。
KV-Control: 用于轨迹控制文本到运动的参数高效K/V注入
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Tsinghua University(清华大学)
AI总结 提出KV-Control,一种紧凑的注意力侧控制接口,通过部分标记化运动基元和轨迹编码器注入键/值记忆,实现精确的轨迹控制而不覆盖预训练的文本条件运动先验。
AdaPlanBench: 在世界约束和用户约束下评估大语言模型智能体的自适应规划能力
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 针对现有基准未充分探索渐进揭示的双重约束下的自适应规划问题,提出动态交互基准AdaPlanBench,通过307个家务任务和可扩展的约束构建流程,评估LLM智能体在交互中根据反馈迭代调整计划的能力。
自闭症儿童递归处所加工的ERP研究
发表机构 * Soochow University(苏州大学)
AI总结 通过ERP实验,研究自闭症儿童处理递归处所结构时在预测、语义整合和句法重析三个阶段的时间动态差异。
名字里有什么?LLM在药理学中的形态捷径
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Northeastern University(东北大学) ; MD Anderson Cancer Center(MD安德森癌症中心)
AI总结 研究LLM在药理学中依赖词缀线索进行推理的形态捷径行为,通过虚构药物名称实验和归因框架揭示其机制及安全风险。
Comments 22 pages