Variable-Width Transformers
变宽Transformer
发表机构 * MIT(麻省理工学院) ; MIT-IBM Watson AI Lab(MIT-IBM沃森人工智能实验室)
AI总结 提出一种中间窄、两端宽的变宽Transformer架构,通过无参数残差缩放机制实现非均匀容量分配,在语言模型困惑度、FLOPs和KV缓存上优于均匀宽度基线。
变宽Transformer
发表机构 * MIT(麻省理工学院) ; MIT-IBM Watson AI Lab(MIT-IBM沃森人工智能实验室)
AI总结 提出一种中间窄、两端宽的变宽Transformer架构,通过无参数残差缩放机制实现非均匀容量分配,在语言模型困惑度、FLOPs和KV缓存上优于均匀宽度基线。
EventDrive: 用于视觉-语言驾驶智能的事件相机
发表机构 * NUS(新加坡国立大学) ; HKUST(GZ)(香港科技大学(广州)) ; Horizon Robotics(地平线机器人) ; A*STAR, I2R(新加坡科技研究局,资讯通信研究院) ; IPAL, CNRS IRL 2955, Singapore(IPAL,法国国家科学研究中心国际联合实验室2955,新加坡) ; University Toulouse, CNRS, CerCo, Toulouse, France(图卢兹大学,法国国家科学研究中心,CerCo,法国图卢兹) ; ETIS UMR 8051, CY Cergy Paris University, ENSEA, CNRS, France(ETIS UMR 8051,CY塞尔吉-巴黎大学,ENSEA,法国国家科学研究中心,法国)
AI总结 提出EventDrive基准和模型套件,通过多时域事件金字塔和时域混合专家模块融合事件流与RGB帧,在感知、理解、预测和规划四维度提升驾驶推理性能。
Comments CVPR2026, 34 pages, 15 figures, 15 tables, project page: this https URL (https://dylanorange.github.io/projects/eventdrive)
EBench: 通用移动操作策略的要素诊断
发表机构 * Shanghai AI Laboratory(上海人工智能实验室) ; Xi’an Jiaotong University(西安交通大学) ; Institute for AI Industry Research (AIR), Tsinghua University(清华大学智能产业研究院) ; Tsinghua University(清华大学) ; University of Science and Technology of China(中国科学技术大学) ; Shanghai Jiao Tong University(上海交通大学) ; Zhejiang University(浙江大学)
AI总结 提出EBench基准,从5个能力和4个泛化维度诊断通用移动操作模型,揭示不同模型在成功率相近时能力差异显著。
EvolveNav: 用于零样本目标导航的主动预反思与自进化记忆
发表机构 * HKUST(GZ)(香港科技大学(广州)) ; Nanyang Technological University(南洋理工大学) ; Xi’an Jiaotong University(西安交通大学) ; XGRIDS(深圳格物智联)
AI总结 提出自进化零样本目标导航框架,通过从历史轨迹提取规则并基于置信上界检索,结合记忆引导预反思模块,减少无效探索,成功率提升10.1%。
自适应体积力学属性场:分辨率无关
发表机构 * NVIDIA(英伟达)
AI总结 提出AdaVoMP方法,利用稀疏自适应体素结构和自回归Transformer编解码器,为3D物体预测高分辨率空间变化的杨氏模量、泊松比和密度,相比现有技术分辨率提升16^3倍且更准确。
Comments Project Page and hi-res paper: this https URL (https://research.nvidia.com/labs/sil/projects/adavomp/). ICML 2026
近端策略优化区域:教师存在于提示中,而非梯度中
发表机构 * NVIDIA(英伟达)
AI总结 提出ZPPO方法,通过将教师知识注入提示而非策略梯度,解决小模型知识蒸馏中教师梯度主导和强化学习策略漂移问题,在多种规模模型上超越现有方法。
Comments Project page: this https URL (https://byungkwanlee.github.io/ZPPO-page/)
重新思考用于分类的数据集蒸馏:蒸馏集是否优于核心集?
发表机构 * Dolby Laboratory(杜比实验室)
AI总结 本文通过大规模标准化实验评估七种最先进的数据集蒸馏方法,发现其在大型数据集上性能不如或仅相当于核心集,且构建成本更高,核心集在数据分布覆盖和计算效率上更具优势。
循环世界模型
发表机构 * FaceMind Research Asia
AI总结 提出循环世界模型(LoopWM),通过参数共享的Transformer块迭代细化潜在环境状态,实现高达100倍参数效率,并建立迭代潜在深度作为世界模拟的新缩放轴。
Comments Technical Report
不动点推理器:稳定且自适应的深度循环Transformer
发表机构 * ELLIS Institute Tübingen, Max Planck Institute for Intelligent Systems, Tübingen AI Center(ELLIS研究所蒂宾根,马克斯·普朗克智能系统研究所,蒂宾根人工智能中心) ; ETH Zurich(苏黎世联邦理工学院) ; Swiss Institute of Bioinformatics(瑞士生物信息学研究所) ; Université Paris Cité(巴黎西岱大学) ; Liquid AI
AI总结 针对循环架构中深度导致的信号传播问题,提出基于预层归一化和残差缩放的FPRM模型,利用不动点收敛作为端到端停止机制,在Sudoku、Maze等推理基准上自适应计算并有效提升性能。
Comments Code available at this https URL (https://github.com/nilskiKonjIzDunava/fprm)
RubricsTree: 面向个人健康代理在健康记忆与医疗技能上的可扩展且不断演进的开放式评估
发表机构 * Google Research(谷歌研究院) ; University of Illinois Chicago(伊利诺伊大学芝加哥分校)
AI总结 提出RubricsTree框架,通过专家对齐的层次化分类法(含100多个原子布尔规则)和上下文自适应路由,实现可扩展、可审计且不断演进的开放式评估,在HealthBench上使模型性能提升高达约66%。
从自我未来学习:面向扩散LLM的在线自蒸馏
发表机构 * Tsinghua University(清华大学) ; Technical University of Munich(慕尼黑工业大学) ; Nanyang Technological University(南洋理工大学) ; University of British Columbia(不列颠哥伦比亚大学) ; University of Texas at Austin(德克萨斯大学奥斯汀分校) ; ELLIS Institute Tubingen(ELLIS蒂宾根研究所) ; Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所) ; Tubingen AI Center(蒂宾根人工智能中心)
AI总结 提出首个面向扩散大语言模型的在线自蒸馏框架d-OPSD,通过自我生成答案作为后缀条件实现从自我未来经验学习,并将监督从词元级转向步骤级,在推理基准上以约10%的优化步骤超越RLVR和SFT基线。
Comments Preprint
斯坦福EDGAR文件数据集:将美国公司及财务披露重建为布局忠实且令牌高效的预训练数据
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; Nanjing University(南京大学) ; Stanford University(斯坦福大学)
AI总结 为解决长上下文文档稀缺问题,提出SEFD数据集,将SEC文件重建为布局忠实的MultiMarkdown格式,用于金融语言建模与评估,具有令牌高效、与Common Crawl重叠率低于0.1%的特点。
Comments Preprint. Includes appendix, tables, and figures
超越故障恢复:一种面向机器人系统的参与感知人在回路框架
发表机构 * Cornell University(康奈尔大学)
AI总结 提出一种参与感知模型预测控制(E-MPC)方法,通过规划交互频率和类型来维持用户参与度并控制工作负荷,在机器人辅助进食系统中验证了其提升用户体验且不降低任务成功率的效果。
Comments Project website at this https URL (https://emprise.cs.cornell.edu/empc)
EgoCS-400K:面向世界模型的自我中心游戏数据集
发表机构 * City University of Hong Kong(香港城市大学)
AI总结 为支持世界模型研究,构建大规模自我中心游戏数据集EgoCS-400K,包含40万第一人称视频和1万小时游戏轨迹,支持动作条件未来预测、状态事件场景展开等交互式视觉建模任务。
ReAge3D:具有视角一致性的3D人脸回龄
发表机构 * Texas A&M University(德克萨斯农工大学) ; Netflix Eyeline Studios
AI总结 提出ReAge3D框架,通过2D扩散模型DiffReaging和中心向外编辑传播策略,实现多视角一致的3D人脸回龄,保持身份和细节,优于现有方法。
通过智能体发现混合结构学习心脏电生理数字孪生
发表机构 * Rochester Institute of Technology(罗彻斯特理工学院)
AI总结 提出LEADS框架,利用LLM智能体在结构化动作空间中迭代发现混合物理-神经模型,实现个性化心脏电生理数字孪生构建,优于人工设计和其他LLM方法。
Comments 10 pages, 4 figures
开放森林观测站的神经树重建
发表机构 * Berkeley AI Research, University of California, Berkeley(加州大学伯克利分校伯克利人工智能研究) ; Department of Plant Sciences, University of California, Davis(加州大学戴维斯分校植物科学系)
AI总结 针对开放森林观测站中经典运动恢复结构方法重建质量差的问题,提出引入神经辐射场提升3D树重建的细节与鲁棒性,并展望未来工作。
Comments Published as a workshop paper at "Tackling Climate Change with Machine Learning", ICLR 2024
WEQA: 可穿戴健康问答中的查询自适应智能推理
发表机构 * University of Cambridge(剑桥大学) ; Tsinghua University(清华大学) ; University College London(伦敦大学学院) ; Dartmouth College(达特茅斯学院) ; Google Research(谷歌研究院)
AI总结 提出WEQA框架,通过LLM控制器动态组合传感器分析与预训练模型,实现可穿戴健康数据问答,在基准测试中准确率提升24%,专家评估显示实用性和临床合理性显著提高。
记忆作为消耗性资产:为具身智能体定价闪存耐久性及其局限性
发表机构 * KAIKAKU
AI总结 本文提出将机器人闪存耐久性视为折旧资本,通过单一影子价格η进行定价,实现成本最优的存储层级分配,并基于真实机器人日志测量价值-写入关联χ的符号,发现其取决于部署场景。
你的AI旅行代理会为你预订斗牛:前沿AI模型中隐含动物福利的代理基准
发表机构 * Compassion Aligned Machine Learning(同情对齐机器学习) ; Sentient Futures(感知未来) ; Harvard Kennedy School(哈佛肯尼迪学院) ; Appalachian State University Department of Management(阿巴拉契亚州立大学管理系)
AI总结 提出首个代理基准TAC,测试AI代理在为用户执行旅行预订等操作时是否避免涉及动物剥削的选项。评估七个前沿模型,所有模型得分低于随机水平64%,最佳模型仅53%。
描述符:Certus 口径分类枪声数据集 (C3GD)
发表机构 * Certus Innovations
AI总结 介绍一个公开的枪声数据集 C3GD,包含超过8000个来自28种枪支、16种口径的实地采集数据点,用于口径分类、枪声检测等任务,提供丰富的元数据以支持泛化与学术分析。
大型语言模型中地理条件化的意外效应
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本研究评估了大型语言模型在接收地理中立提示时,因用户元数据中的位置信息导致的地理泄露现象,并发现位置占位符“Unknown”本身也会引发泄露,揭示了用户档案框架的生成条件化效应。
Comments To appear at the Second Workshop on Customizable NLP (CustomNLP4U) at ACL 2026
使用多模态混合专家病理基础模型预测免疫生物标志物,赋能精准肿瘤学
发表机构 * Program of Computational Biology and Bioinforamtics, Yale University(耶鲁大学计算生物学与生物信息学项目) ; Broad Institute of MIT and Harvard(麻省理工学院与哈佛大学博德研究所) ; Department of Statistics and Data Science, Northwestern University(西北大学统计与数据科学系) ; Department of Computer Science, Northeastern University(东北大学计算机科学系) ; Department of Computer Science, Harvard University(哈佛大学计算机科学系) ; Department of Pathology, Yale University(耶鲁大学病理学系) ; Department of Anatomic Pathology and Laboratory Medicine, Hospital of the University of Pennsylvania(宾夕法尼亚大学医院解剖病理学与检验医学系) ; Department of Pathology and Laboratory Medicine, University of California, San Francisco(加州大学旧金山分校病理学与检验医学系) ; Department of Pathology and Laboratory Medicine, KK Women’s and Children’s Hospital(竹脚妇幼医院病理学与检验医学系) ; Department of Biostatistics, Epidemiology and Informatics, Perelman School of Medicine, University of Pennsylvania(宾夕法尼亚大学佩雷尔曼医学院生物统计学、流行病学与信息学系)
AI总结 提出MixTIME多模态基础模型,采用混合专家架构整合不同模态的病理基础模型,从HE全切片图像预测多重免疫荧光蛋白表达,在17个蛋白标记物上达到最优性能,并增强空间域识别、生存预测等下游任务。
Comments 5 figures
首次证明第二批
发表机构 * Stanford University(斯坦福大学) ; University of California, Berkeley(加州大学伯克利分校) ; University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Harvard University(哈佛大学) ; Polish Academy of Sciences(波兰科学院) ; UC Berkeley(加州大学伯克利分校) ; Brown University(布朗大学) ; ETH Zürich(苏黎世联邦理工学院) ; MIT(麻省理工学院) ; Weierstrass Institute(魏尔斯特拉斯研究所) ; Duke University(杜克大学) ; Sorbonne Université(索邦大学) ; Boston College(波士顿学院) ; Université du Québec à Montréal(魁北克大学蒙特利尔分校) ; UCLA(加州大学洛杉矶分校) ; University of Michigan(密歇根大学) ; University of Maryland(马里兰大学)
AI总结 测试多个AI系统在十个数学研究问题上的解题能力,评估当前AI解决研究级数学问题的水平。
Ternary Mamba: 分组量化感知训练的 W1.58A16 状态空间模型
发表机构 * EdgeVerve Systems Limited(EdgeVerve系统有限公司)
AI总结 提出从预训练检查点进行分组量化感知训练(QAT)结合知识蒸馏,以极低数据量(1亿token)将Mamba-2 1.3B压缩至3.61倍,零样本准确率接近Bi-Mamba,并发现预训练QAT特有的零比率坍塌问题。
深度强化学习用于最小零强制集
发表机构 * Department of Computing Sciences, Villanova University(维拉诺瓦大学计算科学系)
AI总结 提出一种基于强化学习的框架SD-ZFS,通过改进S2V-DQN架构求解最小零强制集问题,在多种图结构上验证了其优于贪心启发式算法。
HistoRAG:通过批判性技术实践将历史方法论嵌入检索增强生成
发表机构 * Humboldt-Universität zu Berlin(柏林洪堡大学)
AI总结 针对历史学等解释性学科,提出HistoRAG框架,通过分离检索与生成、时间窗口化、LLM作为评判者等架构干预,将历史编纂原则转化为RAG设计,解决标准RAG中的时间偏差、相关性评估等问题。
Comments 25 pages, 6 figures. Companion preprint to a Journal of Digital History notebook article (under review)
信任正确的教师:面向GUI定位的质量感知自蒸馏
发表机构 * University of Georgia(佐治亚大学) ; INFLY Tech ; Tencent AI Lab(腾讯AI实验室) ; The Hong Kong Polytechnic University(香港理工大学)
AI总结 提出质量感知自蒸馏方法,通过软正确性感知门控和教师概率缩放改善坐标令牌教师信号质量,提升VLM在GUI定位任务中的性能。
IsabeLLM: 自动化定理证明应用于共识的形式化验证
发表机构 * Imperial College London(伦敦帝国学院)
AI总结 本文改进IsabeLLM自动化定理证明工具,通过检索增强生成、错误追踪和反例生成提升大语言模型上下文,并兼容最新Isabelle和Sledgehammer,用于验证比特币工作量证明共识。
WireCraft:工业DLO操作仿真基准
发表机构 * Department of Mechanical and Industrial Engineering, University of Toronto(多伦多大学机械与工业工程系) ; Department of Computer Science, University of Toronto(多伦多大学计算机科学系) ; CREFLE Inc.(CREFLE公司)
AI总结 针对工业中可变形线性物体(DLO)操作缺乏统一基准的问题,提出WireCraft仿真基准,支持可配置难度和资产,涵盖三种任务族,并评估强化学习、模仿学习和视觉-语言-动作策略。