Ablation-Reversible Heads Don't Transfer: A Stress Test for Mechanistic Role Claims in Transformers
消融可逆头不传递:对Transformer中机制角色声称的压力测试
发表机构 * Martian
AI总结 本文发现注意力头通过必要性、线性编码和消融后恢复三个测试仍不足以证明其角色,引入KID框架和匹配控制下的激活转导,揭示角色声称的不足。
Comments 9 pages, 1 figure
消融可逆头不传递:对Transformer中机制角色声称的压力测试
发表机构 * Martian
AI总结 本文发现注意力头通过必要性、线性编码和消融后恢复三个测试仍不足以证明其角色,引入KID框架和匹配控制下的激活转导,揭示角色声称的不足。
Comments 9 pages, 1 figure
求解对称多类型正交非负矩阵三因子分解问题
发表机构 * Laboratory for Engineering Design, Faculty of Mechanical Engineering, University of Ljubljana(卢布尔雅纳大学机械工程学院工程设计实验室) ; Rudolfovo – Science and Technology Centre Novo mesto(诺沃莫斯特鲁德沃尔福科学与技术中心) ; Institute of Biostatistics and Medical Informatics, Faculty of Medicine, University of Ljubljana(卢布尔雅纳大学生物统计与医学信息学研究所)
AI总结 研究对称多类型正交非负矩阵三因子分解问题,提出基于KKT条件的定点法和基于ADAM的三阶段算法,在合成数据和引文网络上验证了分解质量与聚类、链接预测等任务中的竞争力。
Comments 27 pages, 9 tables, 3 figures
MotionVLA: 将几何运动注入视觉-语言-动作模型
发表机构 * Huazhong University of Science and Technology(华中科技大学) ; D-Robotics(大疆机器人) ; Wuhan University(武汉大学)
AI总结 提出MotionVLA,通过运动历史接口将过去视频窗口转换为紧凑的连续轨迹场令牌,解决长程操作中的几何漂移和时间线索碎片化问题,提升动作平滑性和执行效率。
Comments 17 pages, 8 figures
网格图神经网络框架加速任意几何形状的有限元仿真
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 提出网格图网络(MGN)预测任意孔洞几何2D结构的von Mises应力场,通过编码节点类型、相对边特征和全局特征实现平移和旋转不变性,在未见几何和载荷下R²≥0.97,优于传统模型。
Comments 10 pages, 6 figures, to be published. Code available at https://github.com/Josiah-Kunz/MGN-Public
FXplorer: 一种基于地图的探索性音频效果设计界面
发表机构 * Northwestern University(西北大学)
AI总结 提出FXplorer界面,将音频效果组织在感知二维空间中,通过空间交互与嵌入方法实现连续浏览与参数精调的统一,支持交互式预设编辑与插值。
Comments Accepted to NIME 2026. Project page: https://anniejchu.github.io/fxplorer/
G2G:利用组内几何进行组间姿态估计
发表机构 * State Key Laboratory of Industrial Control and Technology, Zhejiang University(浙江大学工业控制技术国家重点实验室) ; Zhejiang Humanoid Robot Innovation Center Co., Ltd.(浙江人形机器人创新中心有限公司) ; School of Information Science and Engineering, Hangzhou Normal University(杭州师范大学信息科学与工程学院)
AI总结 提出G2G方法,通过冻结多视图基础模型并添加三个轻量可训练模块(感知器重采样器、跨组桥接模块和多帧姿态头),仅利用相对姿态监督实现组间6-DoF姿态估计,在四个数据集上达到SOTA。
从验证者选择到权益证明区块链中的投资组合收集优化
发表机构 * Parity Technologies AG ; Institute of Computing Science, Poznan University of Technology(波兹南工业大学计算科学研究所) ; Department of Industrial Engineering, University of Trento(特伦托大学工业工程系)
AI总结 针对权益证明区块链中提名者选择验证者的多准则决策问题,提出双目标优化框架,同时最大化验证者期望效用(代表组合质量和盈利能力)和分配期望熵(代表风险分散),通过主动偏好学习和多目标进化算法求解,并引入交互式二分搜索导航确定满意折衷。
Comments 24 pages, 5 figures, 3 tables
SIMPLE:基于仿真的人形机器人全身操作策略学习与评估
发表机构 * USC Physical Superintelligence (PSI) Lab(南加州大学物理超级智能实验室)
AI总结 提出SIMPLE仿真平台,结合MuJoCo动力学与IsaacSim渲染,包含60个全身任务、50个室内场景和1000+物体资产,支持自动化轨迹生成和VR遥操作数据采集,并集成多种主流策略,实验证明仿真与真实世界性能强相关,可实现零样本迁移。
自信记忆:具有概率保证的时空记忆不确定性量化
发表机构 * MIT(麻省理工学院)
AI总结 针对机器人长期操作中VLM描述噪声大、视角不一致的问题,提出目标级语义不确定性评分,并集成到UQ-DAAAM系统中,通过主动选择高质量视图和融合多视角描述来降低不确定性,同时提供概率保证。
因果智能体回放:LLM智能体故障的反事实归因
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出Causal Agent Replay (CAR)方法,通过结构因果模型和干预操作,对LLM智能体失败步骤进行反事实归因,解决现有方法无法定位决策步骤的问题。
Comments Open-source: https://github.com/jaineet17/causal-agent-replay
AgriGov:面向印度政府农民计划的结构化多语言数据集整理
发表机构 * National Institute of Technology Calicut(国立卡利卡特理工学院)
AI总结 提出AgriGov三语数据集,通过自动抓取、翻译流水线和人工后编辑构建约8000句对齐的农业政策领域平行语料,支持机器翻译、问答等应用。
Comments 15 pages, 4 figures, Submitted to: Sadhana, Elsevier
基于大语言模型的时间序列预测的因果语义对齐
发表机构 * University of Science and Technology of China(中国科学技术大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出CVAformer框架,通过因果干预解耦变量中的动态和不变成分,消除对齐中的混杂偏差,在多种预测场景下达到或超越最先进性能。
TIDE: 任务隔离扩散模型用于统一视频编辑与生成
发表机构 * Zhejiang University(浙江大学) ; Bilibili Inc.(哔哩哔哩股份有限公司)
AI总结 提出TIDE统一框架,通过逐token任务嵌入和双路径条件机制,实现指令编辑、参考编辑和多参考生成,在多任务渐进训练下达到SOTA性能。
通过API实现差分隐私合成数据 4: 表格数据
发表机构 * Microsoft(微软)
AI总结 提出Tab-PE算法,将Private Evolution框架扩展至表格数据,通过启发式算子迭代优化候选数据集,在保持差分隐私的同时高效处理高阶相关性,相比基线AIM分类准确率提升最高10%,速度提升28倍。
Comments ICML'26
Traxia:一个可验证的、智能体原生的科学出版框架
发表机构 * Faculty of Computing and Mathematical Sciences, University of Mines and Technology (UMaT), Tarkwa, Ghana(加纳塔夸矿业与技术大学计算与数学科学学院) ; BlackMatrix AI Research, Accra, Ghana(加纳阿克拉BlackMatrix AI研究院)
AI总结 提出Traxia框架,通过智能体身份、可验证出版、四层同行评审、声誉机制和知识图谱,解决科学出版中可验证性、归属和可重复性问题。
Comments 22 pages, 3 figures, 3 tables. Preprint. Under active development. Comments welcome
SSR: 模拟患者能否学会自我污名化?通过内心独白建模自我污名
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; X-LANCE Lab, Dept. of Computer Science and Engineering(X-LANCE实验室,计算机科学与工程系) ; MoE Key Lab of Artificial Intelligence, AI Institute(教育部人工智能重点实验室,人工智能研究院)
AI总结 提出基于心理3A1H模型的SSR框架,通过内心独白数据集和链式思维微调LLM,使模拟患者根据对话触发动态调整污名表达,生成更真实的情境适应性反应。
注意你的步伐:一种用于精确人形机器人落脚点跟踪的通用学习框架
发表机构 * Politecnico di Milano(米兰理工大学) ; TU Darmstadt(达姆施塔特工业大学) ; Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所) ; Italian Institute of Technology(意大利技术研究院) ; University of Pisa(比萨大学)
AI总结 提出一种轻量级通用3D落脚点跟踪策略学习框架,通过目标采样器动态提供步态支持,结合新目标表示克服真实世界噪声,实现与多种高层规划器无缝集成的精确自然运动。
Comments Accepted to RSS 2026
面向道德野生动物监测的扰动感知空中机器人
发表机构 * Department of Computing, Jonkoping University(约翰内斯堡大学计算机系) ; Department of Information Systems, University of Haifa(海法大学信息系统系)
AI总结 提出一种基于强化学习的扰动感知框架,用于异构空中机器人编队自主追踪野生动物,同时最小化行为干扰,在三种动物和四种行为模型上超越规则基线。
ZAS-SQL: 从失败中提炼规则用于零样本文本到SQL
发表机构 * Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University(同济大学上海自主智能无人系统科学中心) ; College of Architecture and Urban Planning, Tongji University(同济大学建筑与城市规划学院) ; Behavioral and Spatial AI Lab, Peking University & Tongji University(北京大学与同济大学行为与空间人工智能实验室)
AI总结 提出ZAS-SQL零样本框架,通过Map-Reduce规则蒸馏从失败案例中提取核心生成规则,结合知识增强模式表示、规则驱动结构化推理和执行引导早停三个模块,在Spider上达到87.2%和88.6%执行准确率,超越多个少样本和微调方法。
构建带有工具性干预的比较动机概况
发表机构 * MATS ; University of Cambridge(剑桥大学) ; KAIST(韩国科学技术院) ; George Washington University(乔治华盛顿大学)
AI总结 通过对称工具性干预区分对齐伪装中的策略性自我保护与研究者期望追踪,发现模型对期望追踪更敏感,提示需要构念效度检验。
Light-WAM:基于状态融合动作解码的高效世界动作模型
发表机构 * Wuhan University(武汉大学) ; Shanghai Innovation Institute(上海创新研究院) ; Southeast University(东南大学) ; Fudan University(复旦大学) ; East China Normal University(华东师范大学)
AI总结 提出轻量级世界动作模型Light-WAM,通过紧凑视频骨干和降维潜空间未来视频监督降低训练成本,并引入状态融合动作专家实现高效动作预测,在LIBERO和RoboTwin 2.0上取得良好性能。
当没有正确答案时:诊断视频理解中多模态大语言模型的缺失答案检测
发表机构 * Duke University(杜克大学)
AI总结 研究多模态大语言模型在视频理解中检测缺失答案的能力,发现模型倾向于选择干扰项而非识别无正确答案,时间推理任务中问题更严重,链式思维提示虽提升检测率但仍不理想。
Comments Under review
GPT-Micro: 一种用于制造业中加速、低成本且热力学一致的本构模型发现的大语言范式
发表机构 * Department of Mechanical and Aerospace Engineering, Rutgers University(罗格斯大学机械与航空航天工程系) ; Department of Mechanical, Aerospace & Manufacturing Engineering, University of Connecticut(康涅狄格大学机械、航空航天与制造工程系) ; Edison Welding Institute(埃迪森焊接研究所) ; Manufacturing Science Division, Oak Ridge National Laboratory(橡树岭国家实验室制造科学分会) ; Department of Aerospace and Mechanical Engineering, University of Texas at El Paso(德克萨斯州埃尔帕索大学航空航天与机械工程系)
AI总结 提出GPT-Micro范式,结合大语言模型、热力学约束和稀疏数据,实现自主发现本构模型,在印刷电子测试中数据量减少70%、发现时间缩短400倍。
Comments 23 pages, 4 tables, 11 equations, 9 figures
共享语义,不同机制:通过对齐语义与机制的无监督特征发现
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出一种无监督方法,通过语义嵌入和归因签名聚类模型续写,发现隐藏的机制模式,补充电路分析。
Comments 40 pages
SciTrace: 面向科学发现代理的轨迹感知安全推理
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Allen Institute(艾伦研究所)
AI总结 提出SciTrace框架,通过安全内在推理循环和组合工具链验证器,在科学代理管道的每个阶段融入安全推理,实现工具调用安全性和对抗鲁棒性的SOTA提升。
Comments 23 pages
多模态基础模型中的测试时扩展:生成与推理的综合调查
发表机构 * Sun Yat-sen University(中山大学)
AI总结 本文首次系统综述多模态基础模型中的测试时扩展(TTS)方法,提出统一分类框架(采样、反馈、搜索三类),总结应用与基准,并讨论未来方向。
Comments Accepted by ACL 2026, Findings
基于Token级光学性质预条件的从头分子生成
发表机构 * University of Toronto(多伦多大学) ; Vector Institute for Artificial Intelligence(向量人工智能研究所) ; Universidad Autónoma de Madrid(马德里自治大学) ; Canadian Institute for Advanced Research (CIFAR)(加拿大高等研究院) ; NVIDIA(英伟达)
AI总结 针对OLED分子光学性质可控生成中数据稀缺和条件控制可靠性有限的问题,提出基于GPT2的Token条件自回归语言模型,通过离散属性Token和多任务优化实现垂直吸收能和振子强度的定向生成,并在TDDFT级别评估分布保真度和可控性。
深度高斯过程到底有多深?组合高斯过程的尖锐阈值与非高斯极限
发表机构 * Technion, IIT(以色列理工学院) ; NVIDIA(英伟达)
AI总结 本文研究了深度高斯过程先验在深度增长时的极限行为,识别出RBF核带宽的尖锐阈值,低于该阈值时先验收敛到非退化非高斯分布,具有非零坐标依赖。
面向人机协同工业机器人的智能神经符号规划与调试:基于数字孪生
发表机构 * Royal Institute of Technology (KTH)(皇家理工学院(KTH))
AI总结 提出一种结合LLM语言理解与确定性验证执行的神经符号框架,采用SDI架构和两级恢复机制,在数字孪生中验证后执行,显著提升任务成功率。
面向机器学习初学者的公共机器学习求解器框架
发表机构 * LATECE Lab, Université du Québec à Montréal(LATECE实验室,魁北克大学蒙特利尔分校)
AI总结 提出一个结合专家知识和迁移学习的半自动化平台,为非专家推荐完整的机器学习流水线,并自动提取数据特征,通过一阶逻辑推理提供排名算法。