BehaviorBench: Modeling Real-World User Decisions from Behavioral Traces
BehaviorBench: 从行为轨迹建模真实用户决策
发表机构 * Salesforce AI Research(Salesforce AI研究院)
AI总结 提出 BehaviorBench 基准,利用真实世界行为轨迹(预测市场与链上记录)评估个性化决策建模,包含信念预测和交易预测两个任务层。
BehaviorBench: 从行为轨迹建模真实用户决策
发表机构 * Salesforce AI Research(Salesforce AI研究院)
AI总结 提出 BehaviorBench 基准,利用真实世界行为轨迹(预测市场与链上记录)评估个性化决策建模,包含信念预测和交易预测两个任务层。
基于测量驱动的数字孪生架构:用于水培系统中植物级生物量估计与生长预测
发表机构 * The Robotics Institute, Carnegie Mellon University(卡内基梅隆大学机器人研究所)
AI总结 提出一种结合传感器数据和模型更新的数字孪生架构,通过RGB-D图像和神经网络实时估计生菜质量,并实现未来1-4天生长预测,误差约2克。
Comments 7 pages, 6 figures
评估 Transformer 和 LSTM 框架在无资料流域预测中的表现
发表机构 * University of Arizona(亚利桑那大学)
AI总结 本研究通过 NOAA 国家水模型回顾模拟,评估仅编码器 Transformer 与 LSTM 在有限水文信息下上游径流推断的优势,发现 LSTM 整体性能更强,且加入下游信息可显著提升预测技能。
Comments 5 pages
QUIVER: 用于大型机器学习模型中增强表示的量子信息视角
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; ETH Zurich(苏黎世联邦理工学院) ; University of Cambridge(剑桥大学)
AI总结 提出QUIVER框架,通过变分量子电路提取量子Fisher信息矩阵作为几何特征,与经典特征融合以提升大型机器学习模型性能,并在QM9和JetClass数据集上验证了有效性。
Comments 9 pages, 1 figure and 2 tables. Accepted as a poster at the AI4Physics Workshop, ICML 2026 (Seoul, South Korea)
AURA: 恒定VRAM下机器人策略的动作门控记忆
发表机构 * KAIKAKU(卡基库)
AI总结 提出AURA-Mem,一种恒定大小、基于动作误差信号门控写入的循环记忆,替代KV缓存,在边缘机器人任务中实现与基线相当的准确率,同时减少5-9倍写入次数。
GeoDrive-Bench:自动驾驶中区域特定多模态推理的基准测试
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 提出GeoDrive-Bench基准,通过5053个跨六国人工验证的多选题,评估视觉语言模型在感知、预测、规划和区域推理四个驾驶任务中基于区域特定交通规则的推理能力,并设计蒸馏算法注入区域知识以提升模型性能。
混合自适应卡尔曼滤波用于数据高效的联合跟踪与分类
发表机构 * Charles Stark Draper Laboratory, Inc.(查尔斯·斯泰克·德帕尔实验室,Inc.) ; Ann and H. J. Smead Department of Aerospace Engineering Sciences(安与H.J.斯梅德航空航天工程科学系)
AI总结 提出一种自监督混合自适应卡尔曼滤波器,通过仅从测量中学习系统动力学和过程噪声协方差的结构化校正,同时保持滤波器的概率结构,实现低数据和大数据场景下的高精度估计与鲁棒分类。
Comments 8 pages, 4 figures
表示能力:Transformer语言模型中特征表示的几何限制
发表机构 * Arizona State University(亚利桑那州立大学)
AI总结 基于线性表示和叠加假设,通过嵌入矩阵的余弦相似度分布估计模型可支持的近正交方向数量,推导出容量公式,并发现容量对偏差ε指数敏感。
Comments 22 pages, 10 figures. Submitted to NeurIPS 2026. This is a condensed version of thesis: https://hdl.handle.net/2286/R.2.N.204857
从局部训练到大规模制图:机器学习与深度学习在可迁移卫星测深中的比较评估
发表机构 * School of Earth Sciences, The Ohio State University(地球科学学院,俄亥俄州立大学)
AI总结 本研究评估了随机森林与四种CNN在0-20米深度范围内基于Sentinel-2影像的可迁移卫星测深性能,通过保持空间连续性的训练策略和引入平滑权重函数损失,实现了跨区域稳健的深度估计。
Comments 42 pages, 13 figures, 15 tables. Supplementary Information provided as ancillary file (anc/SI.pdf). Code and pretrained weights at https://github.com/buckai-observatory/DL_bathy
Journal ref Remote Sens. 18 (2026) 1768
基于生产车辆巡航信号的道路表面二分类机器学习方法
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对巡航工况下传统摩擦估计方法失效的问题,提出基于特征和端到端数据驱动框架,利用车辆动力学信号统计特征对路面抓地力(干/湿)与打滑(雪/冰)进行二分类。
$\Psi$-Bench: 评估说服性对话中人格敏感的影响力
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出 $\Psi$-Bench 基准,通过三个现实场景评估 LLM 利用用户画像进行说服的能力,发现当前模型仍有较大提升空间,且用户画像带来 18.24% 的性能提升。
MetaWorld: 从单视角视频数据扩展多智能体视频世界模型
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Zhejiang University(浙江大学) ; Nanyang Technological University(南洋理工大学)
AI总结 提出MetaWorld框架,通过单目世界状态展开、主体感知世界生成器和世界状态对齐机制,从单视角视频构建多智能体视频世界模型,解决数据稀缺和世界状态对齐问题。
SeeTraceAct: 跨具身演示视频中的可见性感知潜在规划
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Allen Institute for AI(Allen人工智能研究所) ; Johns Hopkins University(约翰霍普金斯大学) ; University of Washington(华盛顿大学)
AI总结 提出SeeTraceAct框架,通过可见性感知的未来末端执行器轨迹预测增强空间定位,实现基于单次跨具身演示视频的机器人策略泛化,在模拟和真实场景中取得最优成功率。
一致但错误:空间视觉-语言模型中的证据不敏感性
发表机构 * The University of Tokyo, Japan(东京大学)
AI总结 通过引入ViewDiag多视图评估协议,发现现代视觉-语言模型在空间推理中表现出跨视角一致但错误的现象,表明其预测主要源于先验驱动而非证据敏感推理。
比人类更绿色?大语言模型中的环境态度
发表机构 * University of Tübingen(图宾根大学)
AI总结 通过构建基准评估31个LLM的环境认知、情感和行为建议,发现多数模型比德国调查受访者更倾向环保态度,但存在语境敏感性和谄媚偏移。
Comments Code can be found at https://gitlab.opencode.de/uba-ki-lab/llm-questionnaire-benchmarking-framework Benchmark data and results can be found at https://zenodo.org/records/20445903
EntangleCodec:通过语义-声学纠缠的统一离散音频分词器
发表机构 * Fudan University(复旦大学)
AI总结 提出EntangleCodec,一种通过将音频与丰富标题对齐学习语义-声学联合表示的统一离散音频分词器,在紧凑令牌流中捕获语言内容、说话人身份、情感、韵律和声学场景,并通过流匹配扩散解码器实现高质量重建,在音频理解和生成任务上均取得领先性能。
Comments 17 pages, 10 figures
AVTrack: 以人为中心的复杂场景中的视听跟踪
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对现有视听跟踪数据集局限于简单场景的问题,提出AVTrack数据集,通过包含相机运动、视觉遮挡和位置变化等复杂动态条件,评估并提升鲁棒的人为中心视听场景理解。
Comments 19 pages, 10 figures, ICML 2026
局部性并不意味着可达性:块稀疏因果注意力中的边界修复
发表机构 * Ocean University of China(中国海洋大学)
AI总结 本文研究块稀疏因果注意力中序列局部性与注意力图可达性之间的不匹配,通过结构依赖集形式化边界伪影,提出相位条件覆盖函数分析可达性,并引入边界桥接注意力作为最小修复方法。
Comments 36 pages, 5 figures, 16 tables
融合之前,先问保留什么:多模态信号的上下文校准
发表机构 * Adelaide University(阿德莱德大学) ; Shandong University(山东大学)
AI总结 提出一种紧凑的校准模块,在融合前对各模态特征进行实例级和维度级调制,抑制不可靠成分并增强上下文支持信号,提升多模态任务性能。
Comments 11 pages, 7 figures, 9 tables
动态环境中的运动规划:从经典到现代方法的综述
发表机构 * College of Information Science and Technology, Jinan University(济南大学信息科学与技术学院) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院) ; Department of Electrical and Computer Engineering, University of Connecticut(康奈尔大学电子与计算机工程系) ; Global College, Shanghai Jiao Tong University(上海交通大学全球学院) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所)
AI总结 本文综述了138篇文献,将动态环境中的运动规划方法分为采样、图搜索、模型预测控制、学习及经典局部规划五类,分析了各方法的原理、优缺点及动态环境特有挑战。
大语言模型中用于结构推理的可视化图脚手架
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出将图结构作为大语言模型的内部推理辅助而非仅外部知识源,通过多跳问答实验发现视觉图引导相比文本化图在无直接答案提示时仍保持有效性,支持图作为组织推理的可视化脚手架。
对齐数据驱动预测器与分配:面向决策的生存分析方法
发表机构 * Department of Computer Science, Carnegie Mellon University, Pittsburgh, PA(计算机科学系,卡内基梅隆大学,匹兹堡,PA) ; Strategy Robot, Inc.(策略机器人公司) ; Strategic Machine, Inc.(战略机器公司) ; Optimized Markets, Inc.(优化市场公司)
AI总结 针对生存分析中预测模型与分配决策目标不一致的问题,提出基于归一化折现累积增益(NDCG)的决策聚焦学习方法,通过优化NDCG提升分配效果,在心脏移植数据上使基线模型NDCG提升50-100%。
AdaWeather: 自适应混合概率天气预报与对数遗憾
发表机构 * Ashoka University(阿什oka大学) ; Western Kentucky University(西方肯塔基大学)
AI总结 提出 AdaWeather 自适应框架,通过结合机器学习和专家混合方法融合多个概率天气预报,实现对数遗憾界,并在温度预测上取得改进。
Comments 36 pages, 16 figures. Submitted to arXiv. Forecast aggregation for probabilistic weather prediction using offline supervised learning and online prediction with expert advice. Includes theoretical regret guarantees and empirical evaluation on temperature forecasting. Submitted to NeurIPS 2026
即兴、适应、克服:一种用于高效机器学习的即时多保真算法
发表机构 * School of Mathematics and Natural Sciences, University of Wuppertal(数学与自然科学学院,乌珀塔尔大学)
AI总结 提出一种自适应即时多保真机器学习框架,通过动态查询不同保真度的训练样本,自动确定数据集组成,在降低数据生成成本的同时提高模型精度。
Comments Supplementary Information added as separate PDF
CL-DMDF:基于对比学习的动态多模态数据融合模型
发表机构 * Tsinghua University(清华大学)
AI总结 针对多模态数据融合中模态缺失和局部交互忽视全局互补线索的问题,提出基于对比学习的动态多模态数据融合模型(CL-DMDF),通过跨特征和模态维度的注意力机制、实体质心对比学习模块和自适应融合模块,提升动态融合的效率和准确性。
Comments 9 pages, 5 figures, 7 tables
基于自适应无迹卡尔曼滤波和非线性模型预测控制的四旋翼飞行器固定时间动态着陆
发表机构 * Autonomous Vehicles Laboratory, Department of Aerospace Engineering, Toronto Metropolitan University(自主车辆实验室,航空航天工程系,多伦多 Metropolitan 大学) ; University of Toronto Institute for Aerospace Studies, University of Toronto(多伦多大学航空航天研究 institute,多伦多大学)
AI总结 提出一种结合非线性模型预测控制与实时最小加加速度轨迹规划器及自适应无迹卡尔曼滤波的估计与控制框架,实现多旋翼无人机在移动平台上的固定时间动态着陆,并通过仿真和硬件实验验证了其可重复着陆能力和优于EKF/UKF的速度预测精度。
Comments Accepted to the Conference on Robots and Vision (CRV 2026), Vancouver, Canada
分布偏移下泛化界中的制度到达不确定性
发表机构 * Independent researcher(独立研究者)
AI总结 针对分布偏移中制度组成不匹配带来的额外风险,提出量化框架,通过精确分解分离制度不匹配与制度敏感性,并扩展至β-混合数据,给出极小极大下界。
Comments 23 pages, 4 tables, 3 Figures
CARVE: 通过包络实现交互驾驶中被否决机动的认证可负担修复
发表机构 * Yifan Wang(王一帆)
AI总结 针对交互驾驶中规则感知堆栈易忽略的硬规则裕度负值问题,提出CARVE认证层,通过有限格点上的自我与代理战术算子,实现被否决机动的可负担修复认证,并证明其合理性。
Comments 8 pages, 3 figures
SegTune:歌曲生成的结构化与细粒度控制
发表机构 * Kling Team, Kuaishou Technology(快手科技 Kling 团队) ; University of Science and Technology of China(中国科学技术大学) ; Peking University(北京大学)
AI总结 提出基于扩散Transformer的SegTune框架,通过用户或LLM指定局部音乐描述实现结构化细粒度控制,并引入LLM时长预测器实现精确歌词-音乐对齐,在音乐性和可控性上超越现有基线。
Comments This paper has been accepted to ACL 2026 as an oral presentation and has been nominated for the Best Paper Award. This work is a revised and extended version of an earlier technical report (arXiv:2510.18416). arXiv admin note: text overlap with arXiv:2510.18416
幻觉可从量化LLM中间层隐藏状态线性解码
发表机构 * University of Macau(澳门大学)
AI总结 研究开源LLM在4位量化下中间层隐藏状态是否编码线性可分的真实性信号,发现单层线性探针AUROC达0.904-1.000,优于采样方法,且信号近似线性。