Physics-Guided Policy Optimization with Self-Distillation
基于物理引导的自蒸馏策略优化
发表机构 * Amazon(亚马逊)
AI总结 针对自蒸馏策略优化中固定步长导致训练不稳定的问题,提出受粘性流体动力学启发的物理引导策略优化(PGPO),通过互信息估计动态调整步长,在Science-QA数据集上提升性能并保持训练稳定性。
基于物理引导的自蒸馏策略优化
发表机构 * Amazon(亚马逊)
AI总结 针对自蒸馏策略优化中固定步长导致训练不稳定的问题,提出受粘性流体动力学启发的物理引导策略优化(PGPO),通过互信息估计动态调整步长,在Science-QA数据集上提升性能并保持训练稳定性。
跨语言令牌套利:通过本地LLM预处理优化代码智能体上下文窗口
发表机构 * GitHub
AI总结 提出一种预处理的边缘端提示重写中间件,利用本地Llama 3.2模型进行跨语言翻译和结构重写,在保持或提升任务准确率的同时减少34-47%的提示令牌和最高18.8%的总令牌消耗。
Comments Submitted to EMNLP 2026
SkelHCC:一种基于双曲CLIP驱动的缓存自适应框架用于骨架基础的一次动作识别
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出SkelHCC框架,利用双曲几何编码骨架层次结构,结合CLIP和免训练缓存实现一次动作识别,在三个数据集上达到最优。
Comments Accepted by ICML 2026
利用验证-生成差距:基于置信度条件的测试时强化学习
发表机构 * Sun Yat-Sen University(中山大学) ; University of Science and Technology of China(中国科学技术大学) ; National University of Singapore(新加坡国立大学)
AI总结 提出TTRL-CoCoV框架,通过置信度自适应机制解决无标签设置下Pass@k优化中的伪标签错误和多样性崩溃问题,显著提升Pass@1和Pass@k性能。
超越字面:多模态模因理解中的语用意图分解
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; Huawei(华为) ; Central China Normal University(中央师范大学) ; Shenzhen University(深圳大学) ; King’s College London(伦敦国王学院) ; University of International Relations(国际关系大学)
AI总结 针对大型视觉语言模型(LVLMs)在理解模因时倾向于描述字面内容而非语用意图的问题,提出Intent Projection框架,通过表示、输出和目标三层面的字面-语用分解,在六个基准上超越开源模型并缩小与专有模型的差距。
世界模型遇见语言模型:论具体推理与抽象推理的互补性
发表机构 * Nanyang Technological University(南洋理工大学)
AI总结 本文提出受控具体推理框架及PF-OPSD方法,通过结合世界模型的视觉模拟与多模态大语言模型的抽象推理,在空间前瞻和开放域物理预测任务上提升性能与鲁棒性。
CauTion:知道何时信任LLM进行集成因果发现
发表机构 * Shanghai AI Laboratory(上海人工智能实验室) ; Shanghai Innovation Institute(上海创新研究院) ; Shanghai Jiao Tong University(上海交通大学) ; Nanjing University(南京大学) ; Tongji University(同济大学)
AI总结 提出CauTion框架,通过共识过滤和LLM可靠性估计,将LLM领域知识可靠地集成到多个统计因果发现算法中,解决纯统计方法的局限和LLM错误问题。
CANMOT: 自动驾驶中多目标跟踪的类别感知噪声建模
发表机构 * Institute of Control Theory and Systems Engineering, TU Dortmund University(控制理论与系统工程研究所,多特蒙德大学)
AI总结 针对自动驾驶中多目标跟踪任务,提出一种类别感知且目标对齐的噪声建模框架CANMOT,通过引入类别特定的过程与测量噪声协方差矩阵,并在目标坐标系中表达以保持纵向-横向各向异性,从而提升跟踪性能并显著减少身份切换。
Comments submitted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
使用均衡传播在ImageNet上训练预测编码网络
发表机构 * Rain AI
AI总结 提出一种结合中心化均衡传播与新型均衡方案的预测编码网络训练方法,在ImageNet上训练10层卷积PCN,达到13.23% top-5错误率,接近反向传播基线。
UnsOcc:非结构化场景下基于渲染融合的3D语义占用预测
发表机构 * School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; Waytous Inc.(Waytous公司)
AI总结 提出UnsOcc多模态框架,通过渲染融合模块和基于高斯溅射的细节感知辅助监督,解决非结构化场景中跨模态融合困难与长尾分布问题,在露天矿和nuScenes数据集上超越现有方法。
Comments 8 pages
在正确空间中扩散:潜在可扩散性的系统研究
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文系统研究潜在扩散模型中潜在表示的可扩散性,提出速度不可约方差(VIV)作为生成质量的稳定预测指标。
通过宽基线匹配激发多模态大语言模型中的复杂空间推理
发表机构 * State Key Laboratory of CAD & CG, Zhejiang University(浙江大学计算机辅助设计与图形学国家重点实验室) ; Ant Group(蚂蚁集团) ; Westlake University(西湖大学)
AI总结 本文提出ReasonMatch-Bench基准和动态对应强化学习(DCRL)方法,以系统评估和提升多模态大语言模型在宽基线匹配任务中的空间推理能力。
Comments CVPR 2026. Project page: https://aim-uofa.github.io/reasonmatch/ Code: https://github.com/aim-uofa/ReasonMatch
当注意力崩溃时:从结构到语义的阶段性视觉令牌剪枝
发表机构 * Shandong University(山东大学) ; National University of Singapore (Suzhou) Research Institute(新加坡国立大学(苏州)研究院)
AI总结 针对视觉语言模型推理中视觉令牌剪枝因依赖单一注意力分数导致特征多样性下降的问题,提出两阶段剪枝框架STS,先通过排斥采样最大化结构多样性,再通过指令感知交叉注意力过滤语义无关令牌,从而提升保留令牌的结构多样性与细粒度任务对齐。
用于3D目标检测的学习型非极大值抑制
发表机构 * Institute of Control Theory and Systems Engineering, TU Dortmund University(控制理论与系统工程研究所,多特蒙德技术大学)
AI总结 提出两种基于学习的过滤模块(D2D-Rescore和GossipNet3D)替代启发式NMS,通过检测间关系提升3D检测性能,尤其改善小物体和稀有类别的检测精度。
Comments 6 pages, accepted at IEEE Intelligent Vehicles Symposium (IV) 2026
从提示到服务:基于SLM的AI驱动虚拟世界代理编排网关
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文提出一种基于小语言模型的代理编排网关,通过意图驱动的服务路由解耦虚拟世界客户端与异构AI后端,并在虚拟博物馆测试床中验证了其可行性和效率。
部分可观测的对抗性补丁攻击在机器人视觉-语言-动作模型上的应用
发表机构 * Department of Automation, University of Science and Technology of China(自动化系,中国科学技术大学) ; SmartMore Corporation(SmartMore公司) ; Cyberspace Institute of Advanced Technology, Guangzhou University(广西亚技术空间研究所,广州大学) ; th Medical Center of Chinese PLA General Hospital(中国人民解放军总医院第八医学中心) ; Institute of Artificial Intelligence, Hefei Comprehensive National Science Center(合肥综合性国家科学中心人工智能研究院)
AI总结 针对机器人VLA模型,提出部分可观测威胁模型下的两阶段攻击框架,利用注意力图定位关键区域并优化补丁以破坏语义接地和增加动作轨迹曲率,导致长期任务失败。
Comments Accepted by IEEE Robotics and Automation Letters, 2026
NVIDIA Isaac Sim:实现可扩展的GPU加速机器人仿真
发表机构 * School of Computer Science and Engineering, The University of New South Wales(新南威尔士大学计算机科学与工程学院) ; NVIDIA USA(NVIDIA美国公司)
AI总结 本文系统综述了NVIDIA Isaac Sim的架构、应用模式及局限性,重点分析其GPU加速在大规模并行训练、合成数据生成和物理精确建模方面的优势,并探讨了未来方向。
随机森林中需要多少棵树?一种结合平台搜索与Optuna集成的重新审视方法
发表机构 * Sberbank ; Skolkovo Institute of Science and Technology (Skoltech)(Skoltech) ; Federal Research Center "Computer Science and Control" of Russian Academy of Sciences (FRC CSC RAS)(俄罗斯科学院计算机科学与控制联邦研究中心)
AI总结 提出一种基于三元组平台搜索的算法,通过监控袋外分数的相对变化自动确定随机森林的树数量,避免预设搜索范围,并提供了理论分析和实验验证。
基于事件传感器的触觉接触角估计的静态与动态表示
发表机构 * School of Engineering Mathematics and Technology, University of Bristol(布里斯托大学工程数学与科技学院)
AI总结 本文利用事件触觉传感器(NeuroTac)的事件流,比较了三种事件衍生的空间轮廓表示(动态、静态及其组合)用于接触角估计,并验证了其在机器人操作中实现高频、低延迟触觉角度估计的潜力。
Comments 8 pages, 8 figures. Submitted to IEEE Robotics and Automation Letters (RAL), under review
SAGE: 智能体生态中社会化演化的定量评估
发表机构 * Tsinghua University, China(清华大学, 中国) ; Meituan, China(美团, 中国)
AI总结 提出SAGE框架,通过对比社会演化(SocialEvo)与自我演化(SelfEvo)两种计算条件,在三个领域评估共享经验对智能体性能的影响,发现群体历史并非普遍放大器,但能帮助陷入停滞的智能体取得突破,且社会收益依赖于抽象能力而非暴露量。
Comments 13 pages, 5 figures
零空间中知识保留的模型调优用于鲁棒的时空视频定位
发表机构 * School of Computer Science and Engineering, Sun Yat-sen University, China(中山大学计算机科学与工程学院) ; National Information Center of GACC (Guangdong), GuangZhou, China(广东省GACC国家信息中心) ; Guangdong Province Key Laboratory of Information Security Technology, China(广东省信息安全技术重点实验室) ; Key Laboratory of Machine Intelligence and Advanced Computing, Ministry of Education, China(教育部机器智能与高级计算重点实验室)
AI总结 针对低质量视频导致预训练知识被破坏的问题,提出零空间调优(NST)框架,通过将可学习残差限制在冻结权重的零空间内来保留预训练知识,同时利用质量自适应单元和双空间重参数化合成残差,在混合质量基准上达到最优性能。
Comments Accepted by ICME 2026
仿人运动风格迁移用于人形机器人物理可执行全身控制
发表机构 * Institute of Humanoid Robots, Department of Precision Machinery and Precision Instrumentation, University of Science and Technology of China(人形机器人研究院,精密机械与精密仪器系,中国科学技术大学) ; School of Computer Science and Technology, Faculty of Electronic and Information Engineering, Xi’an Jiaotong University(计算机科学与技术学院,电子与信息工程学院,西安交通大学) ; School of Information Science and Engineering, Lanzhou University(信息科学与工程学院,兰州大学)
AI总结 提出一种仿生生成到控制框架,通过物理感知多条件潜扩散模型和预览式全身跟踪策略,将短时人体风格示例迁移到不同运动内容上,实现人形机器人可执行且表达性强的全身运动。
Comments Project page: https://huangtc233.github.io/bionic-style-transfer/
教师何时应该移动?自在线策略蒸馏中的时间耦合与稳定性
发表机构 * Peking University(北京大学) ; University of Chinese Academy of Sciences(中国科学院大学) ; Tsinghua University(清华大学)
AI总结 研究自在线策略蒸馏中教师更新调度对稳定性的影响,提出基于隔离期和门控机制的CGTR方法,实现零崩溃和最佳性能。
基于模型的强化学习的后验鲁棒性
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出一种在推理时利用学习模型和名义策略进行鲁棒策略改进的后验鲁棒化方法,通过对抗性展开的模型预测控制提升鲁棒性,无需额外训练神经网络。
覆盖治理:面向代理型人工智能的委托与范围的组合授权框架
发表机构 * Huawei Heisenberg Research Center(华为海森堡研究所以)
AI总结 针对代理型AI中传统授权框架无法处理递归委托、动态范围等问题,提出一种组合治理框架,通过定义委托类型、权限责任和资源范围衰减,并引入组合算子在不重写现有策略的情况下叠加代理语义,实现可问责的授权。
Comments 12 pages
SPADE: 草图引导的路径规划增强扩散专家
发表机构 * IDEALworks GmbH ; IMT Atlantique ; IDEALworks GmbH & Saint Joseph University of Beirut(IDEALworks GmbH及贝鲁特圣约瑟夫大学)
AI总结 提出一种结合扩散增强的框架,通过改进的标注工具和训练策略,在保持实时性的同时提升路径规划的泛化能力和鲁棒性,显著降低姿态误差和FID。
结构引导混合掩码预训练与空间连续性正则化用于印刷电路板缺陷检测
发表机构 * Ahu.edu.cn(安徽大学)
AI总结 提出两阶段PCB缺陷检测框架,通过结构引导混合掩码预训练学习PCB结构先验,并在微调阶段引入空间连续性正则化提升细长缺陷定位紧凑性,在DsPCBSD+数据集上达到85.5% mAP0.5。
Comments Preprint. 38 pages, 12 figures, 6 tables
AvatarMix: 保持身份特征的跨化身组合用于服装个性化
发表机构 * University of Tsukuba(茨口大学)
AI总结 提出AvatarMix方法,通过直接组合两个高保真高斯化身实现服装迁移,并采用SeamFix和FullbodyFix两级细化策略解决接缝伪影和身体重塑后的外观保真问题。
Comments CVPR 2026 Findings. 16 pages, including supplementary material
表征3DGS投毒中的可检测性:分阶段基准测试
发表机构 * Temasek Laboratories, Singapore University of Technology and Design(新加坡科技与设计大学Temasek实验室) ; Vietnam National University, Ho Chi Minh City(越南国家大学胡志明市分校) ; University of Information Technology, VNU-HCM(越南国家大学胡志明市信息技术大学) ; Agency for Science, Technology, and Research (A*STAR)(科技研究局(A*STAR))
AI总结 针对3DGS易受多种投毒攻击的问题,提出分阶段基准Poison-3DGS,系统研究各阶段可检测性差异,发现不同攻击在不同阶段产生独特取证信号,后期阶段(如训练动态和高斯参数统计)提供早期不可观测的强线索。
揭秘流水线并行:PipeDream 的首个理论
发表机构 * KAUST(卡斯土尼亚大学)
AI总结 本文通过引入随机化 PipeDream (RPD) 抽象,首次为 PipeDream 风格方法提供了非凸收敛保证,并分析了其稳态延迟与阶段数的缩放关系,同时与 LocalSGD 进行了比较。
Comments 40 pages, 4 figures