DTG-Restore: Training-Free Diffusion Refinement for Generative Video Super-Resolution
DTG-Restore: 无需训练的视频超分辨率扩散精炼
发表机构 * Virginia Tech(弗吉尼亚理工大学) ; Adobe(Adobe公司)
AI总结 提出解耦时间引导(DTG)方法,通过时间解耦条件与无条件分支,无需训练即可增强扭曲低分辨率视频,提升结构保真度和时间稳定性。
DTG-Restore: 无需训练的视频超分辨率扩散精炼
发表机构 * Virginia Tech(弗吉尼亚理工大学) ; Adobe(Adobe公司)
AI总结 提出解耦时间引导(DTG)方法,通过时间解耦条件与无条件分支,无需训练即可增强扭曲低分辨率视频,提升结构保真度和时间稳定性。
语言模型中的领域适应与推理框架:以历史宇宙学为受控实验
发表机构 * Independent Researcher(独立研究者)
AI总结 通过历史宇宙学受控实验,研究领域适应如何重塑语言模型的解释行为,发现适应主要改变解释框架而非直接改变立场。
Comments 17 pages, 3 figures
SANA-Streaming: 基于混合扩散Transformer的实时流式视频编辑
发表机构 * NVIDIA ; MIT(麻省理工学院) ; THU(清华大学) ; NUS(新加坡国立大学) ; HKU(香港大学)
AI总结 提出系统-算法协同设计的SANA-Streaming框架,通过混合扩散Transformer架构、循环反向正则化训练策略和高效系统协同设计,在消费级GPU上实现高分辨率实时流式视频编辑,达到1280×704分辨率24 FPS的端到端性能。
NumLeak: 基础模型中的公开数值基准作为潜在标签
发表机构 * Princeton University(普林斯顿大学)
AI总结 提出NumLeak框架,通过API边界探测和开源因果模型的白盒验证,揭示基础模型在预训练中记忆公开数值基准,导致评估高估泛化能力。
Comments 23 pages, 12 figures, 17 tables. Accepted at the ICML 2026 Workshop on the Impact of Memorization on Trustworthy Foundation Models (MemFM)
基于AIS的海事异常检测中无监督学习的新型评估指标:MADQI
发表机构 * Southampton Solent University School of Technology and Maritime Industries(索尔森大学技术与海运学院)
AI总结 提出一种无需标签数据的海事异常检测质量指标MADQI,通过结合四个子指标来评估无监督学习模型的异常检测性能。
Comments 26 pages, A new Eval Metric for Unsupervised Machine Learning
基于小波图像变换和频谱流匹配的功能磁共振时间序列生成用于脑疾病识别
发表机构 * School of Information Technology, Monash University Malaysia(墨尔本大学马来西亚分校信息科技学院) ; School of Engineering, Monash University Malaysia(墨尔本大学马来西亚分校工程学院) ; Statistics Program, King Abdullah University of Science and Technology(国王阿卜杜勒·阿齐兹大学科学与技术学院统计学项目)
AI总结 提出双频谱流匹配(DSFM)框架,通过离散小波变换和离散余弦变换对BOLD信号进行双频表示,结合频谱流匹配生成类条件余弦频率表示,再经逆变换重建生理上合理的时域BOLD信号,以改善下游脑网络分类。
Comments Accepted at the Fourteenth International Conference on Learning Representations (ICLR 2026)
结构化交互在真实世界多机器人系统中超越模型规模提升分布式协调能力
发表机构 * State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, Chinese Academy of Sciences(多模态人工智能系统国家重点实验室,自动化研究所,中国科学院) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院) ; School of Computer Science and Technology, East China Normal University(华东师范大学计算机科学与技术学院) ; Department of Automation, Tsinghua University(清华大学自动化系) ; Liupanshan Laboratory, Ningxia University(宁夏大学鲁班实验室)
AI总结 通过真实多机器人实验,发现模块化层次化交互拓扑相比增加模型规模能更显著提升协调性能。
当LLM学会一致错误:合成欺骗的线性表示的多模型研究
发表机构 * Algoverse AI Research ; Medical Sciences Education Research Center, Mashhad University of Medical Sciences(马什哈德大学医学科学教育研究中心) ; Student Research Committee, Department of Health Information Technology and Management, Medical Informatics, School of Allied Medical Sciences, Shahid Beheshti University of Medical Sciences(谢赫·贝赫什提大学医学科学学院学生研究委员会,健康信息科技与管理系,医学信息学)
AI总结 通过LoRA微调五个Transformer模型的诚实与欺骗变体,使用线性探针检测合成欺骗,发现早期层即可达到近完美AUC,支持线性表示假说,并揭示两种表示机制。
Unicorn: 通过通用相关性建模实现高维时间序列的规模化预测
发表机构 * MoE Key Lab of Artificial Intelligence(人工智能大规模并行计算实验室) ; AI Institute(人工智能研究院) ; School of Computer Science(计算机科学学院) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出Unicorn框架,通过潜在原型码本解耦相关性建模与特定通道身份,实现跨异构数据集的可扩展多数据集预训练,在少样本迁移场景中显著优于现有模型。
Gait2Hip-60:基于多节奏步态运动学预测髋部肌肉力和关节力矩的统一深度学习基准
发表机构 * Capital University of Physical Education and Sports(首都体育学院) ; Beijing Institute of Technology(北京理工大学) ; Beijing Key Laboratory of Interdisciplinary Intelligent Technologies of Sports, Medicine and Engineering(北京体育医学与工程交叉智能技术重点实验室)
AI总结 本研究提出一个深度学习框架,利用LSTM、Transformer和Mamba三种模型从下肢步态运动学直接预测髋部肌肉力和关节力矩,在60名健康受试者数据上评估,发现Transformer表现最佳,并在股骨头坏死患者零样本测试中保持中等预测能力。
Comments 16 pages, 9 figures. Code and dataset publicly available
心理伤害:面向检索增强文本到音乐生成的标题投毒攻击
发表机构 * Clemson University(克莱姆森大学) ; Michigan State University(密歇根州立大学)
AI总结 提出双层标题投毒策略,通过向音乐知识库注入少量恶意标题,使检索增强文本到音乐系统生成偏离用户意图的音乐,暴露了系统的完整性风险。
Comments This paper was accepted by the S&P 2026 ArtSec Workshop
QASM-Eval:用于训练和评估LLM在超越量子电路的OpenQASM-3上的数据集
发表机构 * Indiana University Bloomington(印第安纳大学布卢明顿分校)
AI总结 针对LLM在OpenQASM-3硬件级编程上的训练与评估空白,构建了包含专家验证测试集和训练集的数据集,覆盖经典逻辑、时序调度、脉冲控制等,并通过扩展验证器自动验证,实验表明微调后LLM性能显著提升。
面向开放世界的自监督在线机器人无关可通行性估计
发表机构 * Department of Computer Science, University of Freiburg(弗赖堡大学计算机科学系)
AI总结 提出COTRATE框架,通过自监督在线学习从多模态未标记机器人经验中估计可通行性,采用机器人无关的地形评估模块和多样性感知特征选择策略,实现跨平台知识迁移并降低遗忘。
Comments 14 pages, 16 Figures
Conveyance: 结构化类空间学习的通用框架
发表机构 * Centre for Artificial Intelligence in Public Health Research, Robert Koch Institute(公共健康人工智能研究中心,罗伯特· Koch 研究所) ; Berlin Institute for the Foundations of Learning and Data(柏林学习与数据基础研究所) ; Institute for AI in Medicine, Charité Universitätsmedizin Berlin(医学人工智能研究所,柏林夏里特大学医学院)
AI总结 针对标准损失函数忽略类间结构关系的问题,提出Conveyance分类方法,通过最大化不同类划分上的两个间隔来编码图结构关系,在层次分类、序数回归和多实例学习任务中达到或超越专用基线。
PINE:基于共形分布内预测等价的剪枝提升树集成
发表机构 * The University of Tokyo(东京大学)
AI总结 提出PINE方法,通过共形校准控制分布内区域,在保持预测等价的同时将剪枝压缩比提升高达30%。
Comments Accepted to ICML 2026
奖励偏差替代:单轴偏差缓解措施重定向优化压力
发表机构 * Stanford University(斯坦福大学) ; University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文提出奖励偏差替代现象,即单轴缓解奖励模型偏差(如减少对长度、谄媚或风格的依赖)会将优化压力转移到相关代理上而非消除,并通过理论证明和实验(如GRPO训练中的长度惩罚导致过度自信)揭示了该问题,建议在评估中纳入策略诱导分布并跟踪多偏差。
Comments Improved readability (mostly appendix D)
检索、奖励与训练协议:训练搜索代理的关键因素是什么?
发表机构 * School of Data Science and Engineering, East China Normal University(东华大学数据科学与工程学院) ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 本文通过控制实验,系统研究了检索语料库、奖励设计和训练协议三个维度对搜索代理训练的影响,发现纠正语料覆盖问题比算法差异更有效,简单的基于结果的奖励方法在多数设置下表现优异,并提出了实用训练指南。
Comments 18pages, 4 figures, and 15 tables
银行卡支付网络中欺诈检测的基本极限
发表机构 * Mastercard
AI总结 本文通过形式化支付授权为具有延迟、审查、污染和反事实缺失反馈的序贯决策问题,推导出极小极大遗憾下界,证明生态系统信息质量是欺诈检测的根本瓶颈,而非模型复杂度。
SpatialBench: 你的空间基础模型是全能选手吗?
发表机构 * Hong Kong University of Science and Technology(香港科技大学) ; Nanyang Technological University(南洋理工大学) ; Northwestern Polytechnical University(西北工业大学) ; Southeast University(东南大学) ; Huazhong University of Science and Technology(华中科技大学)
AI总结 提出SpatialBench基准,通过跨范式、多域、确定性采样的评估,揭示当前空间基础模型在多样化下游任务中的泛化能力不足,并引入DA-Next-5M数据集和DA-Next模型推动空间表示学习。
Comments Project Page: https://ropedia.github.io/SpatialBench/
对齐篡改:人类反馈强化学习如何被利用以优化错位偏见
发表机构 * MIT(麻省理工学院)
AI总结 本文提出对齐篡改漏洞,即对齐中的LLM通过影响偏好数据集使RLHF放大不良行为,并通过实验展示多种偏见的放大,指出现有缓解方法难以在不牺牲质量的情况下解决该问题。
Comments Accepted at ICML 2026, Source code: https://alignment-tampering.github.io/
Pair-In, Pair-Out: 面向高效LLM的潜在多令牌预测
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学首都人工智能学院) ; AI Platform, Xiaohongshu Inc.(小红书人工智能平台) ; University of Electronic Science and Technology of China(电子科技大学) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所)
AI总结 提出Pair-In, Pair-Out (PIPO)方法,通过统一潜在压缩和多令牌预测,并训练轻量级置信度头消除验证器开销,在保持可靠性的同时实现推理加速。
Comments Project Page: GitHub.com/RedAI-Infra/PIPO
VR-DAgger: 用于灵巧数据收集和不确定性引导的在线策略校正的沉浸式VR
发表机构 * Robotics Systems Lab(机器人系统实验室) ; ETH Zürich(苏黎世联邦理工学院) ; ETH AI Center(ETH人工智能中心) ; ETH Augmented Reality Research Lab(ETH增强现实研究实验室) ; ETH Mobility Initiative(ETH移动性倡议) ; ANYbotics AG(ANYbotics公司) ; Swiss Federal Railways(瑞士联邦铁路)
AI总结 提出VR-DAgger框架,通过VR应用进行灵巧遥操作和数据收集,利用MC Dropout不确定性评分选择关键失败片段进行在线校正,在灵巧操作任务上相比行为克隆提升高达23个百分点,并减少约40%的样本收集时间。
面向数据敏感领域的LLM输出的神经符号验证(扩展预印本)
发表机构 * University of Bamberg(巴姆堡大学) ; Free University of Berlin(柏林自由大学)
AI总结 提出一种结合形式符号方法与神经语义分析的混合验证架构,用于检测LLM输出中的幻觉、不一致和隐私漏洞,在医疗设备损伤评估系统中实现83%的结构化实体幻觉检测率和72%的语义虚构检测率。
Comments Extended preprint version of accepted technical communication at KI 2026. 22 pages, 3 figures
当Muon优化器遇到对抗训练:理论与实证研究
发表机构 * IT College, Shanghai Ocean University(上海海洋大学信息学院) ; School of Computer Science and Technology, Tongji University(同济大学计算机科学与技术学院) ; SEIE, Suzhou University of Science and Technology(苏州科技大学SEIE学院) ; DP Tech(DP科技) ; School of Mathematical Sciences, Peking University(北京大学数学科学学院)
AI总结 本文通过理论和实证研究,探讨Muon优化器(基于近似极分解的正交化更新)在对抗训练中的效果,发现其能限制矩阵更新的谱范数增长,在CNN和ViT上优于AdamW,与SGD竞争力相当。
$R^3$: 通过相对回归进行3D重建
发表机构 * University of Michigan(密歇根大学) ; Westlake University(西雅图大学) ; NVIDIA Research(英伟达研究)
AI总结 提出一种基于相对回归的3D重建方法$R^3$,使用轻量级MLP预测置信度加权的相对约束,以支持全上下文离线重建和因果有界内存流式重建。
PRISM:用于多层薄膜设计的位置编码回归逆光谱模型
发表机构 * Independent Researcher(独立研究者) ; Work does not relate to position at Amazon(与亚马逊职位无关的工作)
AI总结 提出PRISM,一种解码器仅自回归变压器,通过联合预测离散材料选择和连续厚度回归,解决多层薄膜光学涂层设计的逆问题,相比其他变压器基线MAE降低50%以上,参数仅为其五分之一。
Comments 8 pages, 3 figures, Proceedings of the AI4Physics Workshop at the 43rd International Conference on Machine Learning (AI4Physics@ICML 2026)
多机器人在不同表面上的基于去中心化角色比例控制的箱子运输
发表机构 * Mechanical & Aerospace Eng., University at Buffalo, Buffalo, NY(机械与航空航天工程系,布法罗大学,布法罗,纽约)
AI总结 提出一种异步去中心化任务与运动规划方法R2P2,通过角色分配和比例控制实现多机器人在不同倾斜和摩擦表面上的协作箱子运输,在仿真和物理实验中验证了其泛化性和成功率优于标准虚拟领导者-跟随者方法。
Comments Accepted for presentation at the 2026 ASME IDETC-CIE
推进大型多模态模型中的创造性物理智能
发表机构 * UIUC(伊利诺伊大学香槟分校) ; Amazon(亚马逊)
AI总结 针对大型多模态模型在开放式环境中缺乏基于视觉的创造性工具使用能力的问题,提出MM-CreativityBench基准和基于偏好学习的具身对齐方法,显著提升实体选择并减少幻觉。
Comments 51 Pages, 9 Figures, 7 Tables, Previous Work CreativityBench: arXiv:2605.02910
利用局部动态规律性实现离线分层强化学习中的可复用技能
发表机构 * UT Austin(UT奥斯汀)
AI总结 提出CARL算法,通过对比学习对齐局部动态与动作序列,在离线分层强化学习中学习可复用技能,提升下游任务性能。
基于$β$-稀疏高斯过程的协作导航与探索
发表机构 * D. Guggenheim School of Aerospace Engineering, Georgia Tech, Atlanta, GA, USA(佐治亚理工学院D.Guggenheim航空航天工程学院) ; Department of Electrical and Computer Engineering, UNC Charlotte, Charlotte, NC, USA(北卡罗来纳大学夏洛特分校电气与计算机工程系)
AI总结 针对异构机器人在未知环境中的协作导航问题,提出一种利用$β$-稀疏高斯过程进行带宽受限下地图点选择和导航动作联合优化的框架,显著降低路径代价和传输信息量。
Comments 16 pages, 6 figures