CORE: Contrastive Reflection Enables Rapid Improvements in Reasoning
CORE: 对比反思实现推理能力的快速提升
发表机构 * Stanford University(斯坦福大学)
AI总结 提出对比反思(CORE)非参数学习算法,通过对比成功与失败的推理轨迹生成自然语言洞察,在少量样本和 rollout 下实现比参数方法(GRPO)和非参数方法(GEPA、情景RAG、MemRL)更快的推理性能提升。
CORE: 对比反思实现推理能力的快速提升
发表机构 * Stanford University(斯坦福大学)
AI总结 提出对比反思(CORE)非参数学习算法,通过对比成功与失败的推理轨迹生成自然语言洞察,在少量样本和 rollout 下实现比参数方法(GRPO)和非参数方法(GEPA、情景RAG、MemRL)更快的推理性能提升。
语言模型需要睡眠吗?用于改进在线推理的离线循环
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; University of Maryland(马里兰大学)
AI总结 本文提出一种类似睡眠的巩固机制,通过离线循环将上下文转换为快速权重,以解决Transformer注意力机制随上下文长度扩展性差的问题,并在合成任务和数学推理任务上验证了其有效性。
使用遗传编程进行可解释生存分析:进化特征 vs 进化整个树
发表机构 * Leiden University Medical Center(莱顿大学医学中心) ; Centrum Wiskunde & Informatica(数学与信息学研究中心)
AI总结 本研究使用遗传编程多目标进化可检查的特征集,并联合优化生存树结构与非线性分裂逻辑,以提高浅层生存树的预测性能和可解释性。
信任、几何与规则:不确定性下安全USV导航的可信感知强化学习框架
发表机构 * School of Information Engineering, Henan University of Science and Technology(河南科技大学信息工程学院) ; Shenzhen Research Institute of Big Data(深圳大数据研究院) ; School of Logistics Engineering, Shanghai Maritime University(上海 Maritime University物流工程学院) ; Shenzhen Technology University(深圳科技大学) ; School of Computer Science, Wuhan University(武汉大学计算机学院) ; School of Software Engineering, Tongji University(同济大学软件工程学院)
AI总结 提出一种集成可信感知学习、几何安全屏蔽和连续规则感知嵌入的强化学习框架,以解决动态海洋环境中USV导航的安全性和COLREGs合规性问题。
从流行文本记忆推断大型语言模型的规模
发表机构 * National University of Singapore(新加坡国立大学)
AI总结 提出一种黑盒方法,通过分析模型对流行文本的记忆准确性,仅从生成文本推断LLM参数规模的下界,并验证了开源和闭源模型。
无自回归的神经算子用于时间相关偏微分方程
发表机构 * School of Computer Science and Engineering, University of Electronic Science and Technology of China(电子科技大学计算机科学与工程学院) ; School of Robotics and Advanced Manufacture, Harbin Institute of Technology(哈尔滨工业大学机器人与先进制造学院) ; School of Mathematical Sciences, Capital Normal University(首都师范大学数学学院) ; College of Information and Control Engineering, Xi’an University of Architecture and Technology(西安建筑科技大学信息与控制工程学院) ; Laboratory of Intelligent Recognition and Image Processing, School of Computer Science and Engineering, Beihang University(北京航空航天大学智能识别与图像处理实验室) ; School of Computer Science and Technology, Tongji University(同济大学计算机科学与技术学院)
AI总结 提出AFNO,通过将PDE时间演化映射到潜空间并利用流匹配学习连续时间向量场,避免自回归展开,实现长期稳定预测。
Comments 23 pages, 18 figures
聚焦女性安全分析:多模态数据集能否增强VAD模型?
发表机构 * Indian Institute of Technology Bhubaneswar(印度理工学院巴特那分校) ; Artificial Intelligence and Robotics Institute, Korea Institute of Science and Technology(人工智能与机器人研究所,韩国科学技术院) ; Yonsei-KIST Convergence Research Institute, Yonsei University(延世大学KIST融合研究中心)
AI总结 针对现有视频异常检测数据集缺乏女性中心异常样本的问题,提出包含1001个视频及文本描述的多模态基准ExtrAnom,覆盖5种犯罪类型,并验证了多模态方法在检测女性中心异常上的有效性。
Comments 7 pages, 6 figures, 4 tables
宽带高光谱3D成像:使用色散结构光
发表机构 * POSTECH South Korea(POSTECH韩国) ; University of Hyogo Japan(日本广岛大学) ; University of Toronto Canada(加拿大多伦多大学)
AI总结 提出一种基于单光谱仪的宽带高光谱3D成像方法,通过可见光和SWIR相机立体设置,利用色散结构光同时重建密集宽带高光谱反射率和精确3D几何,解决了传统方法光谱范围窄、系统复杂的问题。
基于去噪反馈的强化学习
发表机构 * Fudan University(复旦大学) ; Ant Group(蚂蚁集团) ; Hong Kong University of Science and Technology(香港科技大学)
AI总结 提出RLDF方法,利用去噪反馈进行策略损失估计,通过优化中间噪声状态到裁剪干净状态并结合加权时间步采样,在扩散语言模型上提升性能和泛化性。
BigMac: 打破多模态大语言模型训练中的计算与内存帕累托前沿
发表机构 * Peking University(北京大学) ; Independent Researcher(独立研究员) ; Xiaohongshu, Inc(小红书公司)
AI总结 提出BigMac训练流水线,通过嵌套编码器和生成器计算到LLM流水线中,同时优化计算效率和内存使用,打破帕累托前沿。
为AI幽默研究重新定义幽默数据对象
发表机构 * Department of Computer Science and Engineering, University of Notre Dame(诺特大学计算机科学与工程系)
AI总结 本研究将幽默视为具有上下文和解释的社会互动,通过定义幽默推理数据对象并改进提示策略,使LLM生成更高质量的幽默解释,为AI幽默研究的数据合成与增强奠定基础。
Comments Added link to code and data
按需扩展:自适应神经元级混合精度量化感知训练
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; DeepMind(深度思维) ; University of Cambridge(剑桥大学)
AI总结 提出神经元级混合精度量化感知训练(NMP-QAT),通过可微代理和直通估计器让每个神经元独立学习离散精度,实现按需扩展位宽,在MLP和表格基础模型上取得更优的压缩-精度权衡。
Comments Accepted at ICML - GlobalSouthML workshop, 2026
ActQuant: 面向视觉-语言-动作模型的亚4比特动作引导量化
发表机构 * Northeastern University(东北大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出ActQuant框架,通过动作引导的混合精度后训练量化,在亚4比特权重量化下保持VLA模型性能,并引入OmniModel.cpp实现高效部署。
GEM-4D:用于机器人操作的几何增强视频世界模型
发表机构 * Harvard AI and Robotics Lab(哈佛人工智能与机器人实验室) ; Harvard University(哈佛大学) ; Media Lab and EECS(媒体实验室和电子工程与计算机科学系) ; MIT(麻省理工学院) ; Princeton University(普林斯顿大学) ; MIT-IBM Watson AI Lab(麻省理工-IBM沃森人工智能实验室)
AI总结 提出GEM-4D,通过注入从预训练几何基础模型蒸馏的密集4D对应监督,增强视频世界模型的几何一致性,并引入逆动力学模块将视频滚动转换为可执行机器人轨迹,提升操作成功率。
Comments Robotic World Model, Video Generative Model
Insights Generator: LLM代理的系统级语料库追踪诊断
发表机构 * Scale AI, Inc.
AI总结 本文提出Insights Generator,一种多智能体系统,通过在语料库中提出和测试假设来生成基于证据的洞察报告,从而系统性地诊断LLM代理的行为模式。
I-SAFE:基于瓦尔德斯坦一致性度量的科学AI模型结构审计
发表机构 * Department of Economics, University of Pavia(经济学系,帕维亚大学) ; Department of Mathematics, University of Padua(数学系,帕维亚大学)
AI总结 本文提出I-SAFE框架,通过瓦尔德斯坦一致性度量对科学AI模型进行结构审计,揭示模型在分布响应上的差异,为科学AI模型提供更可靠的评估方法。
潜在空间攻击用于语言模型的拒绝规避
发表机构 * University of Cagliari(卡利亚里大学) ; University of Genova(热那亚大学)
AI总结 本文研究了如何通过潜在空间攻击来规避语言模型的拒绝行为,提出了一种受控的潜在空间攻击方法,以提高攻击成功率,优于现有方法。
超越黑箱:代理AI工具使用的可解释性
发表机构 * GitHub
AI总结 本文提出了一种基于稀疏自编码器(SAEs)和线性探针的机制可解释性工具包,旨在提升代理AI在长周期任务中对工具调用的可观测性和可解释性,通过分析模型内部状态来识别工具决策的关键特征,从而揭示代理失败的深层原因。
Comments 12 pages, 4 figures, 17 tables
面向能源系统的领域特定基础模型的具身物理人工智能:以核反应堆控制为例
发表机构 * The Grainger College of Engineering, Nuclear, Plasma & Radiological Engineering, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校格雷格学院工程学院、核等工程学院) ; Department of Nuclear Engineering, Hanyang University(汉阳大学核工程系) ; University of Texas - El Paso(德克萨斯大学埃尔帕索分校) ; National Center for Supercomputing Applications(国家超级计算应用中心) ; Department of Applied Mechanics, Indian Institute of Technology Delhi(印度德里理工学院应用力学系) ; Yardi School of Artificial Intelligence, Indian Institute of Technology Delhi(印度德里理工学院亚里人工智能学院)
AI总结 本研究提出通过紧凑语言模型作为具身物理人工智能,利用基于物理模拟器验证的策略优化替代感知推理,在核反应堆控制任务中实现领域特定基础模型,并展示了规模扩展带来的可靠性提升和策略集中化行为。
聚焦-然后-上下文:面向视觉-语言模型的主体导向渐进视觉标记缩减
发表机构 * Harbin Institute of Technology, Shenzhen, China(哈尔滨工业大学深圳学院) ; ShenZhen Loop Area Institute(深圳环形区研究所)
AI总结 本文提出了一种主体导向的渐进视觉标记缩减方法SPpruner,通过模拟人类视觉感知系统的'聚焦-然后-上下文'机制,有效减少视觉标记数量,提升视觉-语言模型的推理效率,实验表明其在速度和资源消耗上均优于现有方法。
基于物理引导的条件扩散模型的超材料吸收体逆向设计
发表机构 * Centre for Electromagnetics, CSIR-National Aerospace Laboratories(电磁研究中心,国家航空航天实验室) ; Birla Institute of Technology and Science, Pilani(比拉理工学院,皮兰) ; Indian Institute of Technology, Bombay(孟买印度理工学院)
AI总结 本文提出了一种基于物理引导的条件扩散框架,用于设计具有特定电磁响应的超材料吸收体,通过特征线性调制和预训练的替代电磁模拟器,提高了设计效率和条件准确性,实验表明该方法在2-18GHz频率范围内能够快速生成实用的超材料结构。
利用群体回滚中的误差多样性进行强化学习
发表机构 * Peking University(北京大学) ; JD.COM(京东公司) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 本文提出EDAS方法,通过利用群体回滚中的误差多样性来提升强化学习的效果,通过调整错误回滚的优势信号,鼓励模型保持多样化的推理路径,从而提高训练成功率。
Comments Code available at https://github.com/EDAS-jd/EDAS
探究多模态大语言模型在中国短视频虚假信息中的认知偏差
发表机构 * Johns Hopkins University(约翰霍普金斯大学) ; Chinese University of Hong Kong(香港中文大学) ; University of Chicago(芝加哥大学) ; Renmin University of China(中国人民大学)
AI总结 本文通过200个短视频数据集评估8种多模态大语言模型在健康领域虚假信息中的表现,发现Gemini-2.5-Pro表现最佳(信念分数71.5/100),而模型易受权威频道ID等社会线索影响。
Comments Accepted to ACL 2026 (Findings)
CHoE: 基于结构条件专家的跨域异构图提示学习
发表机构 * School of Computer Science and Technology, Tianjin University(天津大学计算机科学与技术学院) ; Department of Health Technology and Informatics, and Department of Data Science and Artificial Intelligence, The Hong Kong Polytechnic University(香港理工大学健康科技与信息学系、数据科学与人工智能系)
AI总结 提出CHoE方法,通过结构条件专家网络和结构感知路由机制,实现跨域异构图提示学习,在少样本跨域任务中优于基线方法。
Comments accepted by IJCAI 2026, 9 pages, 4 figures
可控分子生成基础模型
发表机构 * University of Notre Dame(诺丁汉大学)
AI总结 提出CoMole,一种基于基团感知图扩散的统一框架,结合强化学习优化条件反向策略,在材料与药物设计的九个目标上均实现最优可控性,MAE最高降低48.2%,且无需规则修正。
GradShield: 保持对齐的微调
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; HUMAIN ; King Abdulaziz City for Science and Technology(国王阿卜杜勒阿齐兹科学与技术城) ; University of Washington, Seattle(华盛顿大学(西雅图))
AI总结 提出GradShield过滤方法,通过计算微调隐式危害分数并采用自适应阈值,在微调前移除有害数据,保持LLM安全对齐,攻击成功率低于6%。
你只需一次地标:基于YOLO-World地标热图的轻量级U-Net人脸超分辨率
发表机构 * Università degli Studi di Milano(米兰大学) ; Istituto Italiano di Tecnologia(意大利理工学院)
AI总结 提出轻量级U-Net,利用YOLO-World生成的地标热图作为监督,无需额外训练辅助网络,实现8倍人脸超分辨率重建,提升关键区域细节。
Comments Accepted for publication at IEEE AVSS 2026 (Notification date: June 5, 2026)
面向视觉原生多模态深度搜索智能体的在策略数据演化
发表机构 * Hong Kong University of Science and Technology(香港理工大学) ; Renmin University of China(中国人民大学) ; The Chinese University of Hong Kong(香港中文大学) ; Peking University(北京大学) ; Tsinghua University(清华大学) ; University of Edinburgh(爱丁堡大学)
AI总结 提出在策略数据演化(ODE)框架,通过图像库引用协议和闭环数据生成器,解决多模态深度搜索中视觉证据不可复用和训练数据静态问题,在8个基准上显著提升性能。
超越搜索的潜在几何:在世界模型中摊销规划
发表机构 * Department of Robotics, University of Michigan, Ann Arbor(密歇根大学机器人系,安阿伯)
AI总结 提出在正则化潜在几何下,将规划摊销为潜在逆动力学映射,以轻量级GC-IDM替代在线搜索,在七个环境协议中匹配或超越CEM,决策成本降低100-130倍。
Comments 31 pages
AAAC: 面向4位LLM权重量化的激活感知自适应码本
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 提出AAAC方法,通过每层两个小型学习码本(64字节)替代固定标量码本,以激活加权重建误差最小化选择码本,实现零额外存储开销的4位权重量化,在3-30分钟内完成量化,精度优于现有方法。