WiCER: Wiki-memory Compile, Evaluate, Refine Iterative Knowledge Compilation for LLM Wiki Systems
WiCER:维基内存编译、评估、细化迭代知识编译用于LLM维基系统
发表机构 * Zinnia Tech Solutions(Zinnia科技解决方案)
AI总结 本文提出WiCER算法,通过迭代编译、评估和细化维基内存,解决LLM维基系统中知识编译的差距问题,显著提升知识检索质量并减少灾难性失败。
WiCER:维基内存编译、评估、细化迭代知识编译用于LLM维基系统
发表机构 * Zinnia Tech Solutions(Zinnia科技解决方案)
AI总结 本文提出WiCER算法,通过迭代编译、评估和细化维基内存,解决LLM维基系统中知识编译的差距问题,显著提升知识检索质量并减少灾难性失败。
PolarAdamW:在矩阵优化中分离谱控制与Schur规范等变性
发表机构 * Department of Mathematics and Statistics(数学与统计学系)
AI总结 PolarAdamW通过分离谱控制与Schur规范等变性,改进了矩阵优化算法,在不同任务中表现出色,优于Muon和AdamW。
从单个自然语言描述中学习实例跟踪
发表机构 * Key Laboratory of Education Blockchain and Intelligent Technology, Ministry of Education Guangxi Normal University(教育区块链与智能技术重点实验室,教育部广西师范大学) ; University Engineering Research Center of Educational Intelligent Technology Guangxi Normal University(教育智能技术大学工程研究中心,广西师范大学) ; University of Southampton(南安普顿大学)
AI总结 本文提出一种自监督视觉-语言跟踪方法,通过动态令牌聚合模块提升语义对齐,无需bounding-box标注即可实现实例跟踪。
Comments CVPR 2026
Dr. Post-Training:一种数据正则化视角下的LLM后训练
发表机构 * University of Illinois Urbana–Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Michigan(密歇根大学)
AI总结 本文提出Dr. Post-Training框架,通过将通用训练数据作为数据诱导正则化器,防止模型过拟合稀缺目标数据,从而提升LLM后训练效果。
MedExAgent:训练LLM代理在嘈杂的临床环境中提问、检查和诊断
发表机构 * University of Southern California(南加州大学) ; Arizona State University(亚利桑那州立大学)
AI总结 本文提出MedExAgent,通过两阶段流程训练医疗诊断代理,结合合成对话和DAPO优化,实现高效诊断与成本控制。
在深度强化学习中整合因果DAG:通过多阶暴露激活最小马尔可夫状态
发表机构 * Cornell Tech(康奈尔科技)
AI总结 本文研究了如何在深度强化学习中构建满足马尔可夫性质的MDP状态,提出MOSE方法通过多阶历史状态提升性能,证明了最小充分性不足,需引入受控冗余以利用因果状态信息。
Pan-FM:一种具有显著性引导掩码的全器官基础模型以实现缺失鲁棒性
发表机构 * Laboratory of AI and Biomedical Science(人工智能与生物医学科学实验室) ; Columbia University(哥伦比亚大学)
AI总结 Pan-FM通过显著性引导掩码技术,解决多模态生物医学数据缺失问题,提升全器官表示学习的鲁棒性,优于单器官和多器官基线模型。
NSMQ谜题:一个科学和数学谜题的基准,用于评估大型语言模型
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; Charité - Universitätsmedizin Berlin(柏林夏里特医学院) ; Kwame AI Inc.(夸梅人工智能公司) ; Ashesi University(阿什西大学)
AI总结 本文提出NSMQ谜题基准,基于加纳国家科学与数学竞赛的谜题,评估大型语言模型的科学和数学推理能力,发现即使是最先进的模型也难以应对。
Comments 15 pages. Accepted at the 27th International Conference on Artificial Intelligence in Education
面向通用函数逼近的差分隐私强化学习
发表机构 * Wayne State University(韦恩州立大学)
AI总结 本文提出首个针对差分隐私在线强化学习与通用函数逼近的理论保证,结合批量策略更新与指数机制,证明在通用函数逼近下,模型自由设置的后悔与线性情况一致,达到O~(K^{3/5}),并揭示线性函数逼近隐私RL结果中的根本差距。
通过双流线图扩散解锁高保真分子生成:从质谱数据
发表机构 * Department of Software and Information Systems, University of North Carolina at Charlotte(北卡罗来纳州立大学软件与信息系统系) ; Department of Bioinformatics and Genomics, University of North Carolina at Charlotte(北卡罗来纳州立大学生物信息学与基因组学系)
AI总结 本文提出双流线图扩散模型,通过交替求解原子和键级推理子问题,提升从质谱数据生成分子的准确性,实验结果显示其在两个基准测试中达到34.37%和23.89%的top-1准确率,优于现有方法。
上下文收集决策过程:一种用于代理搜索的POMDP框架
发表机构 * University of Michigan(密歇根大学) ; Netflix
AI总结 本文提出CGDP框架,通过将LLM行为建模为近似汤普森采样,引入谓词方法分解搜索过程,并设计两种干预措施提升多跳推理能力。
Comments 25 pages
Dr-BA:直接雷达束调整与定位的可分离优化
发表机构 * Robotics Institute, University of Toronto(多伦多大学机器人研究所)
AI总结 本文提出Dr-BA框架,通过直接处理2D旋转雷达强度图像实现雷达束调整与定位,利用雷达抗雨优势,解决稠密地图与传感器姿态联合估计问题,实现最先进的雷达束调整与跨会话定位性能。
Comments Accepted for presentation at RSS 2026
认知代理编译用于显式问题求解器建模
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文提出Cognitive Agent Compilation框架,利用强教师LLM将问题解决知识编译为显式目标代理,旨在提高教育场景中问题解决的可检查性和可编辑性。
Comments Accepted to AIED 2026 Blue Sky
PACEvolve++: 提高进化搜索代理的测试时学习
发表机构 * Google(谷歌) ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; Google DeepMind(谷歌DeepMind)
AI总结 PACEvolve++通过强化学习框架提升进化搜索代理的测试时策略适应能力,采用可训练顾问生成并评估假设,结合前沿模型生成可执行候选,实现更快收敛和更稳定的测试时训练。
学习材料感知的哈密顿风险场以实现安全导航
发表机构 * Department of Computer Science, University of Texas at Austin(德克萨斯大学奥斯汀分校计算机科学系) ; Oden Institute, University of Texas at Austin(德克萨斯大学奥斯汀分校奥登学院)
AI总结 本文提出一种基于材料感知的哈密顿风险场方法,通过引入上下文能量项,实现安全导航中的风险选择性控制,实验验证了其在不同场景下的有效性。
OneViewAll:基于语义先验的单视角6D姿态估计用于新物体
发表机构 * Senior Member, IEEE(IEEE高级会员) ; Member, IEEE(IEEE会员) ; Fellow, IEEE(IEEE会士)
AI总结 OneViewAll提出一种基于语义先验的框架,通过新颖的投影-比较方法实现单视角6D姿态估计,无需CAD模型,实现92.5%的ADD-0.1精度,优于现有方法。
FlashMol:在四步内生成高质量分子构象
发表机构 * Institute for Artificial Intelligence, Peking University(北京大学人工智能研究院) ; Yuanpei College, Peking University(北京大学元培学院) ; School of Intelligence Science and Technology, Peking University(北京大学智能科学与技术学院) ; Department of Electrical Engineering and Computer Science, Massachusetts Institute of Technology(麻省理工学院电气工程与计算机科学系) ; State Key Laboratory of General Artificial Intelligence, Peking University(北京大学通用人工智能国家重点实验室)
AI总结 FlashMol通过改进分布匹配蒸馏方法,在四步内生成高质量分子构象,实验表明其在速度和质量上优于传统模型。
LensVLM:压缩文本视觉表示的选取性上下文扩展
发表机构 * Apple(苹果公司) ; Duke University(杜克大学)
AI总结 LensVLM通过选择性上下文扩展提升压缩视觉表示的准确性,在4.3倍压缩下表现优异,且在多模态任务中表现更佳。
双代理协同训练用于健康教练的隐式对抗偏好优化
发表机构 * Kahlert School of Computing University of Utah(Utah大学计算学院Kahlert学院) ; Department of Health and Kinesiology University of Utah(健康与运动科学系Utah大学)
AI总结 本文提出双代理框架,通过隐式对抗偏好优化提升健康教练质量,改进对话和模拟器训练。
基于GRU门控图注意力的归纳性电力网络级联故障分析
发表机构 * Tianxin Zhou1(周天新1) ; Xiang Li1(李祥1) ; Haibing Lu2(卢海兵2)
AI总结 本文提出一种基于GRU门控图注意力网络的方法,能有效识别电力网络中潜在的脆弱传输线路,适用于多电网跨时间和领域场景。
Comments 10 pages, 10 figures, IEEE format
AirBender: 使用双无人机自适应运输可弯曲物体
发表机构 * Autonomous and Intelligent Robotics Laboratory (AIRLab)(自主与智能机器人实验室) ; Lehigh University(莱斯大学) ; Electrical and Computer Engineering Department(电子与计算机工程系) ; The University of New Mexico(新墨西哥大学)
AI总结 本文提出一种自适应控制器,使双无人机在不依赖显式弹性模型的情况下协同运输可弯曲物体,通过Lyapunov分析证明控制器渐近稳定,通过硬件实验验证了多旋翼无人机处理可弯曲物体的能力。
具有任何时间有效保证的AI系统自适应审计
发表机构 * University of California, San Francisco(加州大学旧金山分校) ; Stanford University(斯坦福大学)
AI总结 本文提出一种自适应审计框架,通过双视角假设检验方法,在有限样本下实现统计严谨的AI系统鲁棒性验证,证明在严格审计下系统可被认证为全局鲁棒。
Echo:无KV缓存的关联回忆与谱Koopman算子
发表机构 * Stanford University(斯坦福大学)
AI总结 Echo通过谱Koopman算子实现无KV缓存的关联回忆,解决了传统Transformer的内存瓶颈问题,在多个基准测试中展现出卓越的检索性能。
部分因果效应识别的最优实验
发表机构 * Technical University of Munich(慕尼黑技术大学)
AI总结 本文研究在有限成本下选择实验以最紧缩目标因果查询的界限,提出max-potency问题并证明其NP难,通过图修剪策略高效筛选实验,实验证明在随机图和基准网络上显著减少候选实验数量。
为何代理安全无法跨任务泛化?
发表机构 * Some Institute(某些研究所)
AI总结 本文探讨了代理安全在多任务场景中泛化失败的原因,指出安全要求使任务与安全执行的关系更为复杂,通过理论和实验表明需新的方法提升安全性能。
TRAJGANR: 通过地理对齐的神经表示进行轨迹导向的城市多模态学习
发表机构 * Google Research, Mountain View, CA(谷歌研究,山景城,加利福尼亚州) ; Google LLC, Mountain View, CA(谷歌公司,山景城,加利福尼亚州) ; Dept. of Computer Science, University of Southern California, Los Angeles, CA(计算机科学系,南加州大学,洛杉矶,加利福尼亚州) ; SEAI Lab, Dept. of Geography and the Environment, The University of Texas at Austin, Austin, TX(SEAI实验室,地理与环境系,德克萨斯大学奥斯汀分校,奥斯汀,德克萨斯州)
AI总结 TRAJGANR提出一种新的多模态自监督学习框架,通过将连续移动模式与静态位置观察对齐,提升城市理解和移动任务的性能,优于现有方法。
响应时间增强异质偏好对齐
发表机构 * Department of Economics, University of California, Berkeley(加州大学伯克利分校经济系) ; Department of Computer Science and Ken Kennedy Institute, Rice University(休斯敦大学计算机科学系和肯尼迪研究所) ; Departments of Electrical Engineering and Computer Sciences, University of California, Berkeley(加州大学伯克利分校电子工程与计算机科学系) ; Departments of Electrical Engineering and Computer Sciences and Statistics, University of California, Berkeley(加州大学伯克利分校电子工程与计算机科学系和统计学系;巴黎Inria) ; Inria Paris
AI总结 本文提出通过引入用户响应时间信号来纠正传统偏好数据中对异质偏好的估计偏差,证明该方法能准确识别群体平均偏好,提升大型语言模型对人类偏好的对齐效果。
FastOmniTMAE:并行子句学习用于可扩展且硬件高效的Tsetlin嵌入
发表机构 * Department of ICT University of Agder(信息与通信技术系阿格德大学) ; School of Engineering Newcastle University(工程学院新castle大学)
AI总结 本文提出FastOmniTMAE,通过并行评估和更新阶段提升训练效率,实现分类任务5倍加速,同时在FPGA和SoC上实现高效逻辑嵌入学习。
PLOT:通过最优传输进行神经因果抽象的渐进定位
发表机构 * Cornell University(康奈尔大学)
AI总结 PLOT通过最优传输框架实现因果变量的定位,能够在不同复杂度的实验中高效定位因果抽象,提升因果解释的效率和准确性。
技能组:面向智能体技能库的分组结构技能检索
发表机构 * School of Science and Engineering, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)科学与工程学院) ; Sun Yat-sen University(孙中山大学) ; University of California, San Diego(加州大学圣地亚哥分校) ; Taiyuan University of Technology(太原理工大学)
AI总结 本文提出GoSkills,一种分组结构技能检索方法,通过构建基于类型技能图的锚点中心技能组,提升智能体在有限技能预算下对可见需求的覆盖能力,改进了传统技能检索方法的性能。
Comments 30 pages, 4 figures, 24 tables