Transfer Learning for Customized Car Racing Environments
迁移学习用于定制化的赛车环境
发表机构 * seas(系统工程与科学学院)
AI总结 本文研究了迁移学习在深度强化学习中的应用,旨在通过在单一赛道上训练智能体,实现零样本迁移或进一步微调以在其他定制化赛车环境中获得更快的圈速,并比较了基于模型和非基于模型方法的性能。
迁移学习用于定制化的赛车环境
发表机构 * seas(系统工程与科学学院)
AI总结 本文研究了迁移学习在深度强化学习中的应用,旨在通过在单一赛道上训练智能体,实现零样本迁移或进一步微调以在其他定制化赛车环境中获得更快的圈速,并比较了基于模型和非基于模型方法的性能。
基于学习的自适应控制用于变形组织手术机器人暴露任务
发表机构 * Huazhong University of Science and Technology(华中科技大学)
AI总结 本文提出了一种基于学习的自适应控制框架,用于解决手术中因覆盖组织的不规则几何形状、非线性生物力学特性及有限视野导致的自动组织牵开挑战,通过在线优化控制输入和深度变形估计模型实现零样本适应。
Comments Accepted to Robotics: Science and Systems (RSS) 2026. 12 pages, 9 figures
通过单个对齐使领域转移变得可识别
发表机构 * School of Electrical Engineering and Computer Science, Oregon State University, Corvallis, Oregon, USA(电气工程与计算机科学系,俄勒冈州立大学,科瓦利斯,俄勒冈,美国)
AI总结 本文提出了一种新的方法,通过结构稀疏性条件和单个配对锚样本实现领域转移的可识别性,减少了对监督信号的依赖,并提出了高效的雅可比稀疏性正则化器以支持高维学习。
SurgLQA: 可扩展的长时程外科视频问答
发表机构 * The Chinese University of Hong Kong(香港中文大学)
AI总结 本文提出SurgLQA框架,通过融合时间一致性巩固和时间接地多策略扩展方法,解决长时程外科视频问答中的长程动态建模问题,提升手术流程中的推理能力。
Comments MICCAI 2026 Early Accept
WorldArena 2.0: 扩展模态、功能和平台的具身世界模型基准测试
发表机构 * Tsinghua University(清华大学) ; Shanghai Jiao Tong University(上海交通大学) ; Zhejiang University(浙江大学) ; Stanford University(斯坦福大学) ; The University of Hong Kong(香港大学) ; Princeton University(普林斯顿大学) ; Chinese Academy of Sciences(中国科学院) ; University of Science and Technology of China(中国科学技术大学) ; Peking University(北京大学) ; National University of Singapore(新加坡国立大学)
AI总结 本文提出WorldArena 2.0,扩展了具身世界模型的评估,涵盖模态、功能和平台三个维度,提供全面的测试平台以评估具身世界模型的进展。
行星探测中自然语言到一阶逻辑翻译的试点基准
发表机构 * Department of Computer Science and Engineering, College of Engineering, The Pennsylvania State University(计算机科学与工程系,工程学院,宾夕法尼亚州立大学)
AI总结 本文提出一个试点基准,用于在行星探测领域将自然语言转换为一阶逻辑,通过NASA PDS的实测文档构建数据集,并手动标注FOL表示,以支持语言理解和形式推理的交叉研究。
一个模型翻译它们所有:面向异构协作感知的通用任意到任意翻译
发表机构 * State Key Laboratory of Networking and Switching Technology(网络与交换技术国家重点实验室)
AI总结 本文提出UniTrans,一种通用任意到任意特征模态翻译模型,通过预训练一组翻译专家参数并学习其组合系数来实现零样本翻译,从而在OPV2V-H和DAIR-V2X数据集上实现了优于现有方法的性能。
Comments 19 pages, accepted at the 43rd International Conference on Machine Learning (ICML 2026)
超越欧几里得原型:基于谱分解和测地匹配的少样本医学图像分割
发表机构 * School of Microelectronics and Communication Engineering, Chongqing University(重庆大学微电子与通信工程学院) ; Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences(中国科学院深圳先进技术研究院)
AI总结 本文提出Spectral-Geodesic Prototype Network (SGP-Net),通过谱原型银行和测地匹配器解决少样本医学图像分割中的原型纠缠和拓扑盲匹配问题,实现对形状、纹理和边界线索的解耦编码。
代理分块与贝叶斯去分块:人工智能生成的模糊认知图的模型:特克西德斯陷阱模型
发表机构 * University of Southern California(美国南加州大学) ; Florida International University(佛罗里达国际大学)
AI总结 本文提出了一种基于代理分块和贝叶斯去分块的方法,用于生成和更新人工智能生成的模糊认知图,通过在文本中生成重叠的文本分块,并利用稀疏因果分块矩阵进行混合,从而构建出代表性的循环模糊认知图知识图谱,以预测特克西德斯陷阱模型中的冲突结果。
Comments 15 pages, 6 figures
LAST-RAG:文献锚定的随机轨迹检索增强生成用于知识条件退化模型选择
发表机构 * Department of Industrial Engineering(工业工程系) ; Pusan National University(釜山国立大学)
AI总结 本文提出LAST-RAG方法,通过结合观测健康指标轨迹和领域特定上下文,利用理论和机械证据从本地证据库中检索,以改进退化模型选择,将模型选择从纯统计拟合问题转变为结合观测数据和领域知识的决策问题。
DuIVRS-2: 基于大语言模型的大型兴趣点属性采集交互语音响应系统
发表机构 * Baidu Inc.(百度公司)
AI总结 本文提出DuIVRS-2,一种基于大语言模型的端到端框架,用于大规模兴趣点属性采集,通过有限状态机引导的数据增强策略、选择生成方案与思维链机制,提高了输出稳定性并有效消除幻觉,最终在生产环境中实现了83.9%的任务成功率。
Comments Accepted to ACL 2026 Industry Track. 14 pages, including appendix
DCFold: 通过单次前向传递高效生成蛋白质结构
发表机构 * Institute for AI Industry Research (AIR)(人工智能产业研究院) ; Department of Computer Science and Technology(计算机科学与技术系) ; School of Computer Science and Technology(计算机科学与技术学院) ; ByteDance Seed(字节跳动种子)
AI总结 本文提出DCFold,一种单步生成模型,实现了与AlphaFold3同等的精度,通过双一致性训练框架和新的时间测地匹配(TGM)调度器,在保持预测保真度的同时将推理速度提升15倍,验证了其在结构预测和结合设计基准上的有效性。
基于C++在Metal和CUDA上的轻量级高斯过程推断
发表机构 * Department of Information Management, National Taiwan University(国立台湾大学信息管理系) ; H. Milton Stewart School of Industrial and Systems Engineering, Georgia Institute of Technology(佐治亚理工学院H. Milton Stewart工业与系统工程学院)
AI总结 本文提出LightGP,一个无需依赖的C++17库,用于高斯过程回归,支持Apple Metal和NVIDIA CUDA后端,以及通过Apple Accelerate和OpenBLAS优化的CPU路径。LightGP提供了四种推断路径,覆盖从N=100到N=500,000的问题规模,并在不同硬件上实现了显著的性能提升。
评估交互式AI代理的认知年龄对齐
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Shenzhen Children's Hospital(深圳儿童医院) ; Peking University(北京大学) ; Hong Kong Polytechnic University(香港理工大学)
AI总结 本文提出ChildAgentEval,首个基于心理测量的交互式基准,用于评估基于多模态大语言模型的代理的认知年龄对齐,通过与年龄特定的人类发展阶段进行系统比较,揭示当前代理在模拟年龄特定认知行为方面的优劣。
注意力沉底与注意力残差中的异常值
发表机构 * Department of Computer Science, Northwestern University(西北大学计算机科学系) ; Department of Computer Science and Engineering, University of Michigan(密歇根大学计算机科学与工程系) ; Department of Statistics and Data Science, University of California Los Angeles(加州大学洛杉矶分校统计与数据科学系) ; Department of Electrical and Computer Engineering, University of California San Diego(加州圣地亚哥大学电气与计算机工程系) ; Department of Computer Science, Rutgers University-New Brunswick(新泽西州立大学鲁特学院计算机科学系) ; Department of Computer Science and Engineering, Texas A&M University(德克萨斯农工大学计算机科学与工程系) ; Department of Computer Science, Columbia University(哥伦比亚大学计算机科学系)
AI总结 本文提出OASIS技术,通过层间空信号来解决注意力残差架构中注意力沉底、激活异常值以及推理稳定性下降的问题,通过双归一化设计和实验验证提升了模型的结构鲁棒性和量化鲁棒性。
多智能体AI系统在创造力上超越人类团队
发表机构 * Microsoft Research Asia(微软亚洲研究院)
AI总结 研究探讨了多智能体AI系统在创造力任务中的表现,发现其在四个多样化问题解决任务中,比单智能体和人类团队更具创造力,核心方法是通过语义空间路径分析生成过程,主要贡献是揭示了AI和人类团队在创造力预测上的不同机制。
PAIR:面向多轮代理优化的前缀感知内部奖励模型
发表机构 * KAIST(韩国科学技术院) ; Yonsei University(延世大学)
AI总结 本文提出PAIR模型,通过结合冻结的隐藏状态探针和轻量级注意力头部,解决多轮任务中内部正确性探针的可靠性问题,从而在不依赖外部模型调用或地面真实依赖的情况下,为GRPO训练提供密集的步骤级奖励信号。
Comments Under Review
HexagonalWarriorMamba: 12导联ECG心脏异常的阈值依赖多标签分类的更优方法
发表机构 * Sungkyunkwan University, Department of Computer Science and Engineering(顺天乡大学计算机科学与工程系) ; Sogang University, Department of Computer Science and Engineering(成均馆大学计算机科学与工程系) ; Gwangju Institute of Science and Technology, Department of Biomedical Science and Engineering(全州科学技术院生物医学科学与工程系) ; Tianjin Normal University, School of Artificial Intelligence(天津师范大学人工智能学院) ; Financial University under the Government of the Russian Federation, Department of Artificial Intelligence(俄罗斯联邦金融大学人工智能系) ; Sungkyunkwan University, Department of Electrical and Computer Engineering(顺天乡大学电气与计算机工程系) ; Queen Mary University of London, School of Electronic Engineering and Computer Science(伦敦皇后玛丽大学电子工程与计算机科学学院)
AI总结 本文提出HexagonalWarriorMamba框架,通过将12导联ECG视为单通道2D图像而非传统1D时间序列,改进了传统深度学习模型在处理ECG信号长程依赖关系方面的不足,实现了对心脏异常的更优多标签分类。
Comments Submitted to Scientific Reports
PySIFT:用于深度学习视觉流水线的GPU驻留确定性SIFT
发表机构 * Indian Institute of Technology Madras(印度理工学院马德拉斯分校)
AI总结 本文研究了经典SIFT在深度学习视觉流水线中的应用,展示了其在准确性和速度上的优势,并提出了PySIFT,一种完全在GPU上驻留的SIFT实现,能够提供确定性的输出和高效的性能。
Comments 9 pages, 6 figures
通过运动诱导采样用消费级LiDAR成像隐藏物体
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; Dartmouth College(达特茅斯学院)
AI总结 本文提出了一种多帧融合策略,利用运动诱导孔径采样模型,在消费级LiDAR上实现了非线视成像,实现了隐藏物体的3D重建、多物体跟踪和相机定位,并展示了消费级硬件无需额外设置即可实现非线视成像的潜力。
f-OPD: 通过新鲜度感知控制稳定长周期在线策略蒸馏
发表机构 * The Hong Kong Polytechnic University(香港理工大学)
AI总结 本文提出f-OPD框架,通过引入样本级新鲜度评分来稳定长周期在线策略蒸馏,实现性能与效率的平衡,为大规模长周期智能体训练奠定基础。
KISS - 地球科学的科学模拟知识基础设施:一种智能体的支架
发表机构 * State Key Laboratory of Water Disaster Prevention, Hohai University, Nanjing(水利灾害预防国家重点实验室,河海大学,南京) ; Yangtze Institute for Conservation and Development, Hohai University, Nanjing(长江保护与发展研究院,河海大学,南京) ; Department of Bioresource Engineering, McGill University, Sainte-Anne-de-Bellevue, Quebec, Canada(生物资源工程系,麦吉尔大学,圣安妮-德-贝尔贝夫,魁北克,加拿大) ; Ottawa Research and Development Centre, Agriculture & Agri-Food Canada, Ottawa, Ontario, K1A 0C6, Canada(渥太华研发中心,加拿大农业与食品部,渥太华,安大略,K1A 0C6,加拿大) ; College of Water Conservancy and Hydropower Engineering, Hohai University, Nanjing(水利水电工程学院,河海大学,南京) ; Meta Platforms Inc.(Meta平台公司) ; Nanjing Hydraulic Research Institute, Nanjing(南京水利研究院)
AI总结 本文提出KISS,一种用于科学模拟的知识基础设施,通过将专业知识外化为经过验证的建模操作符、分阶段的领域协议和诊断恢复机制,使智能体能够生成物理合理且可验证的端到端模拟,从而降低非专业用户与过程模拟之间的接入门槛,并促进建模社区的整合。
通过对比信息传递学习正负边
发表机构 * Department of Computer Science(计算机科学系) ; Stanford University(斯坦福大学)
AI总结 本文研究了在低标签率、高同质性和高边密度设置下,负边信息对图表示学习的价值,并提出对比信息传递机制以同时利用正负边信息提升性能。
一种具有软液压驱动的灵活机械手用于微重力操作
发表机构 * Aerospace Engineering Program, University of California, Berkeley(加州大学伯克利分校航空航天工程系) ; Department of Mechanical Engineering, University of California, Berkeley(加州大学伯克利分校机械工程系) ; Department of Mechanical Engineering, National University of Singapore(新加坡国立大学机械工程系)
AI总结 本文提出将DexCoHand灵活的双指六自由度机械手与Astrobee自由飞行机器人集成,以实现微重力环境下的灵活操作,该机械手在保持稳定接触的同时减少了对自由飞行基底的干扰,提高了操作的连续性和适应性。
Comments Accepted to the IEEE ICRA 2026 Space Robotics Workshop (SRW). 4 pages, 3 figures
从有机数据生成预训练令牌以实现数据驱动的扩展
发表机构 * Language Technologies Institute, Carnegie Mellon University(卡内基梅隆大学语言技术研究所)
AI总结 本文提出SynPro框架,通过重新表述和重新格式化操作,帮助大语言模型更充分地利用有限的有机数据,从而在数据驱动的预训练中实现更高效的扩展。
稳定、扩展与增强MeanFlow用于大规模扩散蒸馏
发表机构 * State Key Laboratory of Integrated Services Networks(信息服务网络国家重点实验室) ; Xidian University(西安电子科技大学) ; Tencent Hunyuan(腾讯文英)
AI总结 本文提出了一种稳定MeanFlow的方法,通过引入暖启动技术并结合轨迹分布对齐,提高了大规模工业模型蒸馏的性能和泛化能力。
Comments 10 pages
高效的元标签校正中的双层优化
发表机构 * Human-Machine Interaction Laboratory, VNU University of Engineering and Technology(人机交互实验室,越南工程与技术大学)
AI总结 本文提出了一种高效的元标签校正方法EBOMLC,通过引入一步内循环更新、混合上界损失和对齐感知的动态障碍物,提高了元模型的训练效率和稳定性,实验表明其在高噪声环境下表现优异。
具有知识蒸馏的代理成本感知查询规划用于大数据分析
发表机构 * Research Division, BrightMind AI(BrightMind AI 研究部) ; Texas Tech University(德克萨斯理工大学) ; University of Texas at Arlington(德克萨斯大学阿灵顿分校)
AI总结 本文提出了一种结合规则基教师规划器、UCB1老虎机探索、成本感知预测和知识蒸馏的轻量级学生规划器,以解决大数据分析中查询优化计算成本高且资源受限环境下的内存和延迟约束问题,实验结果显示在纽约出租车和IMDB数据集上相比默认规划器降低了23%的延迟并保持了94%的约束满足率。
Comments 8 pages, preprint, code at https://github.com/mahdinaser/agentic-kd-planner
记住更多,风险更多:具有记忆能力的LLM代理的纵向安全风险
发表机构 * Virginia Tech(弗吉尼亚理工大学) ; University of California, Berkeley(加州大学伯克利分校) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本研究探讨了具有记忆能力的LLM代理在长期任务中因记忆积累导致的安全风险,提出了一种触发-探测协议来评估记忆污染的影响,并发现记忆安全应被视为一个纵向属性而非单一状态属性。
交互评估需要一种设计科学
发表机构 * University of Texas Austin(德克萨斯大学奥斯汀分校) ; California Institute of Technology(加州理工学院) ; Carnegie Mellon University(卡内基梅隆大学) ; Stanford University(斯坦福大学) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Microsoft Research(微软研究院) ; Northwestern University(西北大学) ; University of Cambridge(剑桥大学)
AI总结 本文探讨了交互评估应被视为一种原则性的评估范式,而非仅仅是新的智能体基准。通过定义评估为证据到判断的自主映射,文章展示了交互评估如何改变这一映射的两方面,并提出双轴分类法,制定设计原则和报告标准,分析了长期评估挑战在轨迹层面的再现。
Comments 10 pages