Uncertainty-Aware Adaptive Sensor Fusion for Autonomous Navigation
不确定性感知的自适应传感器融合用于自主导航
发表机构 * IEEE
AI总结 提出一种结合无迹卡尔曼滤波(UKF)的混合深度学习方法,通过不确定性感知的自适应融合视觉和惯性特征,提高自主导航中视觉惯性里程计(VIO)的位姿估计精度。
Comments 13 pages
不确定性感知的自适应传感器融合用于自主导航
发表机构 * IEEE
AI总结 提出一种结合无迹卡尔曼滤波(UKF)的混合深度学习方法,通过不确定性感知的自适应融合视觉和惯性特征,提高自主导航中视觉惯性里程计(VIO)的位姿估计精度。
Comments 13 pages
十位头痛专家与人工智能在临床文献总结中的比较:一项关键评估与对比
发表机构 * Stanford University Palo Alto CA USA(斯坦福大学) ; Department of Neurology Mayo Clinic Rochester MN USA(梅奥诊所神经科) ; Department of Neurology Dalhousie University Halifax Canada(达尔豪斯大学神经科) ; Jefferson Headache Center Department of Neurology Thomas Jefferson University PA USA(泰勒大学神经科) ; Beth Israel Deaconess Medical Center Boston MA USA(贝斯以色列医疗中心) ; Department of Neurology University of Florida Gainesville FL USA(佛罗里达大学神经科) ; University of Colorado School of Medicine Department of Pediatrics Division of Child Neurology Aurora CO USA(科罗拉多医学院儿科部儿童神经科) ; Department of Medicine Mount Sinai Hospital Icahn School of Medicine at Mount Sinai New York NY USA(西奈医院医学部) ; Department of Neurology Mayo Clinic Scottsdale AZ USA(梅奥诊所Scottsdale分部) ; Harvard Medical School Boston MA USA(哈佛医学院) ; Department of Neurology Mount Sinai Hospital Icahn School of Medicine at Mount Sinai New York NY USA(西奈医院神经科)
AI总结 本研究通过构建基于RAG的AI框架,比较了三种大语言模型与十位头痛专家在临床文献总结方面的表现,发现专家撰写的摘要更受青睐,但专家有时难以区分人类与AI生成的摘要。
DP-MacAdam:具有自适应裁剪和自适应动量的差分隐私机制
发表机构 * University of Southern California(南加州大学)
AI总结 提出DP-MacAdam算法,通过联合利用梯度均值和方差估计进行自适应裁剪和动量更新,在无需手动调整裁剪阈值的情况下提升模型效用。
Comments 6 pages, 2 tables
选择性优势熵自适应视野GRPO:用于语言模型高效强化学习的非对称令牌级折扣
发表机构 * Indian Institute of Technology (BHU)(印度理工学院(博生胡大学)) ; Department of Computer Science, University of Illinois Chicago(伊利诺伊大学芝加哥分校计算机科学系)
AI总结 提出选择性优势熵自适应视野GRPO(SA-AH-GRPO),通过非对称令牌级折扣(仅对负优势轨迹应用熵基折扣)来稳定训练并提升数学推理性能。
Comments 16 pages, 4 Figures, 7 Tables
前沿AI训练的零知识验证是可能的
发表机构 * Lefebvre General-Purpose AI Policy Lab(莱贝维尔通用人工智能政策实验室) ; Sorbonne Université(索邦大学) ; CNRS(国家科学研究中心) ; LIP6(LIP6实验室)
AI总结 提出一种结合预提交训练规范、节点间网络观测和中间计算即时Merkle承诺的零知识验证架构,通过原生BF16/FP32预编译的零知识虚拟机(zkVM)验证GPU实际浮点计算,实现训练过程可验证且架构保密,预计36个月内实现概念验证。
Comments 44 pages, 2 figures
最小化缩放因子的隐藏成本:面向大语言模型的图引导超低位量化
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出SAGE-PTQ框架,通过图引导的显著性感知量化分离显著与非显著权重,实现超低位量化并最小化缩放开销,在LLaMA-3-8B上困惑度降至6.74且内存低于BiLLM的50%。
Comments Preprint. 18 pages, 10 figures, 7 tables, including appendix
利用神经常微分方程在黎曼流形上从示范中学习:扩展摘要
发表机构 * ETH Zürich(苏黎世联邦理工学院)
AI总结 针对机器人状态(如方向)在弯曲空间上演化的问题,提出利用神经常微分方程在黎曼流形上从示范中学习,通过数值估计测地线实现自然运动生成,并降低计算开销。
Comments 2 pages
ComplexityMT: 文本复杂度与机器翻译交互作用的基准测试
发表机构 * University of Bath(巴斯大学) ; Cardiff University(卡迪夫大学) ; National University Philippines(菲律宾国家大学) ; MBZUAI(穆扎布伊人工智能研究所) ; University of Exeter(埃克塞特大学) ; INESC-ID Lisboa(里斯本INESC-ID) ; Instituto Universitário de Lisboa (ISCTE-IUL), ISTAR(里斯本大学研究所(ISCTE-IUL),ISTAR) ; National Research Council, Canada(加拿大国家研究委员会) ; King Abdulaziz University(阿卜杜勒-阿齐兹大学) ; Saudi Electronic University(沙特电子大学)
AI总结 提出ComplexityMT基准,利用CEFR等级评估六种语言中文本复杂度与机器翻译的相互影响,发现高复杂度文本更难翻译且翻译会改变目标文本的CEFR等级。
评估美国超大规模数据中心的碳排放与能源消耗
发表机构 * Department of Biostatistics, Harvard T.H. Chan School of Public Health(哈佛T.H. 汤普森公共卫生学院生物统计学系) ; Department of Computer Science, University of Pisa(比萨大学计算机科学系) ; IMT School of Advanced Studies, Lucca(卢塞恩高级研究所) ; Environmental Systems Research Institute(环境系统研究机构) ; Baxtel(Baxtel公司) ; Department of Environmental Health, Harvard T.H. Chan School of Public Health(哈佛T.H. 汤普森公共卫生学院环境健康系) ; Department of Biostatistics, UCLA Fielding School of Public Health(加州大学洛杉矶分校Fielding公共卫生学院生物统计学系)
AI总结 本研究通过收集403个美国超大规模数据中心设施级数据,估算其电力消耗、电力来源及二氧化碳排放,发现其电力需求约占美国总用电量的1.8%,且碳强度高于全国平均水平48%。
可执行模式合约:从自动摄入到多源检索
发表机构 * Intuit AI Research(Intuit AI研究)
AI总结 提出一种自动从多源数据中发现可执行模式并将其作为共享合约的系统,通过模式约束的检索路由和结构化分析提升多源问答性能。
Comments 9 pages, 4 figures, plus supplementary appendix
当证据稀疏时:对话和LLM-Agent轨迹中的弱监督早期失败预警
发表机构 * Intuit AI Research(Intuit AI研究院) ; Princeton University(普林斯顿大学)
AI总结 针对对话和LLM-Agent轨迹中早期失败预警问题,提出一种两阶段方法,通过注意力机制从稀疏的轨迹级标签中学习回合级失败证据,并结合α-STOP策略实现可控的早期预警,在多个基准上显著提升帕累托前沿质量并降低训练成本。
Comments 9 pages, 14 figures, and appendix
CausalPOI:基于时空图因果建模的冷启动POI签到预测
发表机构 * Nanyang Technological University(南洋理工大学) ; China Agricultural University(中国农业大学) ; Meituan(美团)
AI总结 提出CausalPOI框架,利用时空功能交互图建模POI间语义和空间关系,通过结构对齐的处理和对照图模拟事实与反事实场景,解决冷启动POI签到预测问题,在真实数据集上显著优于基线。
Comments Accepted at KDD 2026
对话式通用人工智能的动机架构
发表机构 * Glass Umbrella(玻璃伞) ; SingularityNet
AI总结 本文提出一种对话式动机架构,将OpenPsi动机谱系重新解释为对话原生术语,并耦合MetaMo的高层动机支架,通过十阶段动机处理流水线、双决策策略以及行动前感受与行动后情绪的功能区分,实现对话智能体的能力调节、不确定性减少、亲和力等动机管理。
Comments 16 pages. Accepted for AGI-26 proceedings
无变异的突变:LLM驱动的程序进化中的收敛动力学
发表机构 * Northwestern University(西北大学) ; Augustana College(奥古斯塔纳学院)
AI总结 研究LLM在无选择压力下反复变异程序时,是否探索新形式或循环回到旧形式,发现LLM变异一致收敛到受限吸引子区域,结构层面87%的链中超过93%的变异重复先前结构形式。
Comments Accepted to the Genetic and Evolutionary Computation Conference (GECCO '26) Workshop on Large Language Models for and with Evolutionary Computation
MoDex:用于顺序多物体灵巧抓取的扩散策略
发表机构 * Department of Robotics, Perception and Learning, KTH Royal Institute of Technology(机器人、感知与学习系,皇家理工学院) ; Robotics and Autonomous Systems at University of Turku(图尔库大学机器人与自主系统)
AI总结 提出MoDex扩散策略,通过对抗空间和点云条件预测抓取姿态,实现单只灵巧手顺序抓取多物体而不释放已抓物体,并通过两阶段训练(模仿学习+强化学习微调)提升成功率。
Comments Submitted to CoRL 2026
利用通用智能体进行情境化时间序列分析
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出TimeClaw框架,通过集成可执行时间工具、经验驱动能力进化和情景多模态记忆,使通用大语言模型智能体具备情境化时间推理能力,在能源、金融等多领域基准上取得性能提升。
Comments Preprint. 38 Pages
信任,但不验证:LLM 源评估中的认知盲点
发表机构 * Amazon(亚马逊)
AI总结 研究语言模型在多源综合中是否评估证据质量,发现模型虽能检测伪造统计但未在综合中启用,而是依赖方法论-语域门控,导致数值有效性被抑制。
ReasoningFlow: 理解LLM推理轨迹的话语结构
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出ReasoningFlow框架,将大推理模型的推理轨迹建模为细粒度有向无环图,通过人工和自动标注分析发现模型间结构相似性、多样化推理行为及错误步骤与最终答案的关系。
LeanMarathon:通过长视界Lean自动形式化实现可靠的AI合作数学家
发表机构 * Department of Statistics, University of Warwick, UK(英国沃里克大学统计系) ; Center for Advanced Intelligence Project, RIKEN, Japan(日本理化学研究所高级智能项目) ; Department of Statistics, University of Michigan, USA(美国密歇根大学统计系) ; Department of Mathematical Informatics, The University of Tokyo(东京大学数学信息学系;日本理化学研究所高级智能项目) ; also Center for Advanced Intelligence Project, RIKEN, Japan(加州大学伯克利分校电气工程与计算机科学系;统计系) ; Department of Electrical Engineering and Computer Sciences, also Department of Statistics, University of California, Berkeley, USA(上海交通大学数学科学学院,自然科学院和MOE-LSC) ; School of Mathematical Sciences, Institute of Natural Sciences and MOE-LSC, Shanghai Jiao Tong University, China
AI总结 提出多智能体框架LeanMarathon,通过蓝图抽象和两阶段编排器实现长视界研究数学的可靠自动形式化,在四个Erdős问题上成功形式化七个定理。
Comments 26 pages, 9 figures. Comments are welcome
用于过程奖励模型的可控且可验证的过程数据合成
发表机构 * Jilin University(吉林大学)
AI总结 提出一个可控且可验证的框架,通过注入模板感知错误并重新计算后续步骤来合成过程监督数据,以提升过程奖励模型在逻辑和数学推理中的性能。
我们真的需要立即重置吗?重新思考高效机器人导航的碰撞处理
发表机构 * College of Information Science and Technology, Eastern Institute of Technology(信息科学与技术学院,东部技术学院) ; Department of Aeronautical and Aviation Engineering, The Hong Kong Polytechnic University(航空与航空工程系,香港理工大学) ; Department of Computing, The Hong Kong Polytechnic University(计算系,香港理工大学) ; School of Computer Science and Technology, University of Science and Technology of China(计算机科学与技术学院,中国科学技术大学) ; Department of Mechanical Engineering, The Hong Kong Polytechnic University(机械工程系,香港理工大学)
AI总结 针对机器人导航中每次碰撞立即重置环境的惯例,提出多碰撞重置预算(MCB)框架,通过将局部碰撞终止与全局环境重置解耦,允许智能体在同一回合内重试困难配置,从而提高早期学习效率。
Comments 8 pages, 9 figures
语言模型引导的圆柱表示假说
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出圆柱表示假说(CRH),通过放宽线性表示假说(LRH)的正交性假设,解释语言模型引导中的不稳定性和不确定性。
Comments ICML 2026 camera ready
VASO:物理AI智能体的形式可验证自进化技能
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Iowa State University(爱荷华州立大学)
AI总结 提出VASO框架,通过形式验证引导LLM生成的机器人技能合约自进化,将模型检查的反例转化为文本梯度更新技能合约,无需微调模型权重,在Jackal和四旋翼任务中达到97.2%的形式规范符合率。
Comments Project webpage: https://languagegroundedriskdetection.github.io/ProjectPage/vaso-webpage/
面向科学数据高保真有损压缩的残差建模
发表机构 * Department of Computer \& Information Science \& Engineering University of Florida Gainesville, FL, USA
AI总结 针对高保真度下学习压缩残差占据主导速率的问题,提出两种残差编码器LBRC和NGLR,通过定制残差表示提升压缩比。
Comments 9 pages, 3 figures, 3 tables
稳定性与可操纵性:评估LLM裁判在决策后交互下的鲁棒性
发表机构 * WAI USA Research Labs(WAI美国研究实验室)
AI总结 研究LLM作为裁判在决策后交互中的可操纵性,发现虽然重复中性评估下高度稳定,但针对性挑战可显著逆转判决,并提出评估鲁棒性分数(ERS)量化交互鲁棒性。
Comments Accepted at ACL 2026 GEM (Generation, Evaluation and Metrics) Workshop
合成对比推理用于多表问答
发表机构 * Iowa State University(爱荷华州立大学) ; Thoughtworks
AI总结 针对多表问答缺乏推理监督的问题,提出通过异构LLM生成合成对比推理轨迹,并利用对比偏好优化微调模型,在MMQA上提升9.7%-16.3%。
广义TV--$\ell_p$结构化先验用于贝叶斯$T_1$映射
发表机构 * Department of Computing Science, Umeå University, Sweden(乌尔姆大学计算机科学系,瑞典)
AI总结 提出一种结合总变分(TV)与$\ell_p$范数的结构化空间先验族,并嵌入贝叶斯回归框架,利用No-U-Turn采样器进行后验推断,实现$T_1$映射中的不确定性量化,实验表明该方法能提高空间一致性和估计可靠性。
Comments Accepted for publication at the Journal of Machine Learning for Biomedical Imaging (MELBA) https://melba-journal.org/2026:015
基于OCT和OCT血管成像的深度学习辅助AMD分期
发表机构 * Casey Eye Institute, Oregon Health & Science University(奥勒冈健康与科学大学凯斯眼科研究所) ; Department of Biomedical Engineering, Oregon Health & Science University(奥勒冈健康与科学大学生物医学工程系) ; Department of Ophthalmology, Mackay Memorial Hospital(Mackay纪念医院眼科部)
AI总结 利用OCT和OCTA数据,开发并评估基于EfficientNet的深度学习模型,用于自动分级年龄相关性黄斑变性(AMD)严重程度,其中基于生物标志物的模型表现最佳,尤其对早期AMD检测有价值。
模式选择性并非任务因果结构:1B类语言模型中组合任务电路的跨架构机制研究
发表机构 * B-Class Language Models(1B类语言模型) ; Cross-Architecture Mechanistic Study(跨架构机理研究)
AI总结 通过统一协议测试三个1B类语言模型在四个组合任务上的注意力头电路,发现不同模型对同一任务使用不同的注意力模式,并引入五类筛选结果分类法,提出MoE模型基于前一个token位置基板构建组合任务电路的可证伪假设。
Comments 27 pages, 3 figures
SHALA-LLM:在对齐LLM中智能处理模糊标签
发表机构 * MIT Media Lab, Massachusetts Institute of Technology(麻省理工学院媒体实验室、麻省理工学院) ; National University of Singapore(新加坡国立大学)
AI总结 提出SHALA-LLM强化学习框架,通过从标注者分布中学习并动态优先处理高模糊样本,改善LLM对模糊标签的建模,在NLI和情感识别任务中提升与标注者分布的一致性及分类性能。