Be My Tutor: On-Policy Co-Distillation for Mutual LLM Improvement via Peer Feedback
做我的导师:通过同伴反馈实现互惠LLM改进的在策略共蒸馏
发表机构 * KAIST(韩国科学技术院)
AI总结 提出在策略共蒸馏(OPCoD)方法,通过认知门控和反馈锚定实现两个不同领域强模型间的相互教学,达到帕累托改进。
做我的导师:通过同伴反馈实现互惠LLM改进的在策略共蒸馏
发表机构 * KAIST(韩国科学技术院)
AI总结 提出在策略共蒸馏(OPCoD)方法,通过认知门控和反馈锚定实现两个不同领域强模型间的相互教学,达到帕累托改进。
SemPiper:机器学习流水线中语义算子的交互式代码合成
发表机构 * BIFOLD & TU Berlin(BIFOLD 与柏林工业大学)
AI总结 提出SemPipes编程模型,通过声明式语义算子和LLM合成专用实现,结合Python代码,实现可控、可优化的ML流水线开发。
Comments Accepted at VLDB 2026 (Demonstrations track)
基于补丁频率叠加的点云上采样
发表机构 * Friedrich-Alexander-Universität Erlangen-Nürnberg(埃尔朗根-纽伦堡大学)
AI总结 提出一种基于补丁频率叠加的优化方法PUtPFS,通过选择点子集并叠加空间频率估计表面,在稀疏区域放置新点实现均匀上采样,无需训练数据,在点对面距离上超越现有方法。
MUFFLe: 通过广义去重实现联邦学习的高效模型更新压缩
发表机构 * Innovation Foundation Denmark(丹麦创新基金会)
AI总结 提出MUFFLe方案,将广义去重(GD)集成到FedAvg中,通过去重更新向量中的重复模式实现固定速率、可变计数的压缩,在IID MNIST上以38 MB累积上行通信达到92.93%目标精度。
Comments Accepted at IEEE EDGE 2026 (Work-in-Progress track)
深度神经网络能否改善超大规模科学数据的压缩?
发表机构 * King Abdullah University of Science and Technology(阿卜杜拉国王科技大学) ; University of the Peloponnese(伯罗奔尼撒大学)
AI总结 本文提出将深度学习预测器集成到传统误差有界压缩框架中,通过气候数据实验发现,尽管ML预测器能提高预测精度和重建质量,但由于残差空间结构影响熵编码效率,未能提升整体压缩比。
ForceForget: 通过强化概念移除增强文本到图像模型的安全性
发表机构 * Dong Han(董汉) ; Yong Li(李勇)
AI总结 针对文本到图像模型生成不安全内容的问题,提出基于强化学习优化概念擦除奖励的方法,通过安全适配器调节文本嵌入,在消除不安全内容的同时保持模型对安全语义的生成能力。
Comments Accepted to ICML 2026
当语言表示交互时:LLM中的可分离性与跨语言效应
发表机构 * University of Oxford(牛津大学) ; Imperial College London(帝国理工学院) ; University of York(约克大学)
AI总结 通过因果几何分析,研究多语言LLM中语言表示的线性可分离性及跨语言结构依赖,发现语言概念在协方差调整内积下可分离,同语系语言呈现单纯形几何结构。
Comments Trustworthy AI for Good (AI4Good) Workshop @ ICML 2026
挤压-释放:具有精确结构最小化的迭代剪枝
发表机构 * Uppsala University(乌普萨拉大学)
AI总结 提出Squeeze-Release循环,通过精确结构重写将掩码网络转化为更小密集网络,并引入CompensatedLayerNorm扩展至残差流,实现高达39倍压缩。
用更少实现更多——局部场景表示用于触觉成像
发表机构 * Technion - Israel Institute of Technology(以色列理工学院) ; Rambam Health Care Campus(拉姆巴姆医疗中心)
AI总结 提出局部编码器空间感知(LESS)方法,通过局部感受野的循环编码器网格建模触觉场景,实现内部结构的2D/3D重建,在泛化、不确定性估计和手持成像上取得突破。
Comments RSS 2026
黎曼度量匹配:面向分布的可扩展几何建模
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出黎曼度量匹配框架,通过神经网络学习数据的黎曼几何,利用carré du champ算子的条件期望形式实现样本级训练和恒定成本推理,在精度相当或更优下速度提升400倍。
Comments ICML 2026 (Oral)
通过基于知识图谱的数据生成实现精确的文本到Cypher转换
发表机构 * Universitat Politècnica de Catalunya(波兰理工大学)
AI总结 提出一种自动合成数据生成方法,微调小型LLM以提升Text2Cypher性能,使其在本地部署中与大型专有模型竞争,保障数据主权。
基于Wave-U-Net基波增强的瞬时音高估计
发表机构 * CyberAgent, Japan(日本CyberAgent公司)
AI总结 提出将基波滤波视为语音增强问题,利用Wave-U-Net提取基波,再计算瞬时频率,实现准确鲁棒的瞬时音高估计。
Comments Accepted to Interspeech 2026
MaskedFOP:缺失视觉模态下的多语言说话人识别通过级联图标签传播
发表机构 * College of Computing, University Mohammed VI Polytechnic(穆罕默德六世理工大学计算机学院)
AI总结 提出MaskedFOP系统,在测试时人脸完全缺失且语音为未见语言(乌尔都语)的挑战下,通过模态丢弃双头网络、互补嵌入平均和两级级联推理实现闭集多语言说话人识别,在POLY-SIM 2026挑战赛中取得第一。
CausalMotion: 基于关键帧与轨迹引导的结构化物理推理实现免训练视频生成
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; ShanghaiTech University(上海科技大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出CausalMotion框架,利用视觉语言模型将文本提示分解为因果一致的关键帧和物体运动轨迹,作为软约束引导预训练视频扩散模型,无需额外训练即可提升物理合理性和时间连贯性。
Comments Project Page: https://zhuangsh0713.github.io/CausalMotion/
主动式LLM智能体的通信策略演化
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; OPPO Research Institute(OPPO研究院)
AI总结 针对用户与智能体间信息不对称问题,形式化通信策略,提出基于文本和UI的策略,并引入自演化框架CPE,通过提示优化提升任务成功率。
Pano3D:统一的3D重建与全景分割
发表机构 * Google DeepMind(谷歌深度思维) ; LIGM, École des Ponts, IP Paris, Univ Gustave Eiffel, CNRS(LIGM, 巴黎高科桥梁学院, 巴黎理工学院, 古斯塔夫·埃菲尔大学, 法国国家科学研究中心)
AI总结 提出统一框架,在3D前馈重建网络中集成全景分割,通过联合训练几何与语义损失实现互惠提升,在多个数据集上达到最优性能。
Comments Project page: https://victorbbt.github.io/Pano3D/
回顾性进度感知的LLM智能体训练自我精炼
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; OPPO Research Institute(OPPO研究院)
AI总结 提出RePro框架,通过前向-反思滚动范式训练智能体自我生成进度信号,无需持续外部监督,在WebShop等任务上提升Qwen系列性能高达12%。
什么驱动了CLIP的测试时适应?从更新视角进行的受控实证研究
发表机构 * Tsinghua University(清华大学) ; Shenzhen Technology University(深圳技术大学)
AI总结 本文通过受控实证研究,从更新视角分析了CLIP测试时适应方法的驱动因素,揭示了适应增益主要来自测试时证据和可靠代理,而非繁重优化,并指出无单一范式普遍最优。
Pix2Pix-Hybrid: 结构引导的多通道条件与弱属性监督的朝觐人群图像条件合成
发表机构 * King Abdulaziz University(阿卜杜勒阿齐兹国王大学) ; Jouf University(焦夫大学)
AI总结 提出Pix2Pix-Hybrid条件GAN,通过多通道结构线索和上下文属性条件合成朝觐人群图像,用于数据增强,在减少人工标注的同时提升合成质量,并验证了合成数据对人群计数模型的改进效果。
一种受初级视觉皮层启发的鲁棒点云分析框架
发表机构 * School of Information Science and Engineering, Lanzhou University(兰州大学信息科学与工程学院) ; School of Medical Technology, Beijing Institute of Technology(北京理工大学医学技术学院) ; Cloud and AI BU, Huawei(华为云与AI业务部) ; School of Computing, National University of Singapore(新加坡国立大学计算机学院)
AI总结 受初级视觉皮层启发,提出DC-CCNN++框架,通过仿生神经网络替代MLP,结合NRMR模块和CPVT策略,在点云分类和分割中提升鲁棒性,性能媲美SOTA。
Comments 12 pages, 2 figures, 7 tables
层次化常微分方程:学习连续时间物理原型用于早期链路故障检测
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出层次化常微分方程聚类网络,利用神经ODE建模连续潜状态演化,解耦随机噪声与动态趋势,自适应确定原型数量,在不规则采样时间序列的早期链路故障检测中有效提取物理原型。
Comments International Conference on Machine Learning 2026
DIFF-ERO:一种面向过程挖掘的深度学习一致性感知损失函数
发表机构 * KU Leuven(鲁汶大学) ; The University of Melbourne(墨尔本大学) ; Information Systems Engineering Research Group (LIRIS), KU Leuven(鲁汶大学信息系统工程研究组(LIRIS))
AI总结 提出DIFF-ERO,一种可微的随机一致性损失函数,通过构建软边界的批次级随机转移矩阵,在训练中融入控制流信息,提升深度学习模型在过程数据上的结构预测性能。
Comments Accepted at the 24th International Conference on Business Process Management
法官偏爱英语吗?评估LLM作为法官时的语言切换不变性
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室)
AI总结 提出Judge-LS协议,通过语言切换变体评估LLM作为自动法官的可靠性,发现语言切换导致10.7-14.4%偏好翻转,但翻译等价测试未显示系统英语偏好。
一层的垃圾是另一层的宝藏:LVLMs中自适应逐层视觉标记选择
发表机构 * Hikvision Research Institute(海康威视研究院) ; Peking University(北京大学) ; East China Normal University(华东师范大学)
AI总结 提出自适应逐层视觉标记选择(ALVTS),通过轻量级选择器为不同层路由重要标记,实现高效压缩,在89%压缩率下保留96.7%精度。
Comments Accepted by CVPR 2026 (highlight)
无臂双轮足机器人的鲁棒摔倒恢复:基于力引导的学习方法
发表机构 * Beijing Institute of Technology(北京理工大学)
AI总结 针对无臂双轮足机器人无法借助外部支撑恢复站立的问题,提出力引导教师-学生框架FTSR,通过约束强化学习逐步减少外力依赖,实现从摔倒到稳定行走的鲁棒恢复。
Comments 8 pages, 6 figures, accepted by IEEE Robotics and Automation Letters (RA-L)
FloVerse:基于楼层平面图的多模态导航
发表机构 * School of Computer Science & Technology, Beijing Institute of Technology(北京理工大学计算机科学与技术学院)
AI总结 提出FloVerse任务统一PointNav、ObjectNav和ImageNav,构建FloVerse-1.6K数据集,并设计ThreeDiff两阶段模仿学习策略,利用楼层平面图先验提升导航性能。
Comments Accepted at CVPR 2026
超越对Adam与SGD差距的单一解释
发表机构 * University of Luxembourg(卢森堡大学) ; University of Basel(巴塞尔大学) ; MPI for Intelligent Systems(马克斯·普朗克智能系统研究所) ; ELLIS Tübingen(ELLIS蒂宾根) ; Tübingen AI Center(蒂宾根人工智能中心)
AI总结 通过跨视觉、语言、基因组和图形任务的受控实验,发现Adam与SGD的性能差距源于数据和架构的复杂交互,而非单一因素,并观察到随批量大小变化的交叉点。
Comments preprint
ReactVLA: 通过改进的平均流动作生成实现快速轻量级反应式机器人操作
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Technical Aspects of Multimodal Systems (TAMS), Department of Informatics, Universität Hamburg(汉堡大学信息学系多模态系统技术方面(TAMS))
AI总结 提出ReactVLA框架,结合改进的平均流动作生成器和注意力残差机制,实现轻量低延迟的实时机器人操作,在模拟和真实任务中性能提升达1.65倍,推理速度提升4倍以上。
面向自然语言引导的多无人机分配中可扩展QAOA的最优性保持分解
发表机构 * Korea University(高丽大学)
AI总结 提出端到端框架,集成微调大语言模型与量子-经典后端,通过约束保持图分割和动态规划合并,实现自然语言引导下多无人机任务分配的可扩展量子优化。
Comments 10 pages, 2 figures, 3 tables, preprint
HiST:用于跨模态空间转录组建模的分层稀疏Transformer
发表机构 * New Jersey Institute of Technology(新泽西理工学院) ; Stevens Institute of Technology(史蒂文斯理工学院) ; Karolinska Institutet(卡罗林斯卡学院) ; Dartmouth College(达特茅斯学院)
AI总结 提出HiST,一种分层稀疏Transformer,通过稀疏窗口注意力和分辨率变换算子实现高效的多尺度空间转录组推断,显著降低计算开销并提升预测性能。