LiveBand: Live Accompaniment Generation in the Audio Domain
LiveBand: 音频域中的实时伴奏生成
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出LiveBand系统,利用因果Transformer在预训练因果音频自编码器的连续潜空间中生成高保真伴奏,通过对抗序列级监督训练,实现实时流式生成。
LiveBand: 音频域中的实时伴奏生成
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出LiveBand系统,利用因果Transformer在预训练因果音频自编码器的连续潜空间中生成高保真伴奏,通过对抗序列级监督训练,实现实时流式生成。
通过Marchenko-Pastur分布剪枝深度神经网络
发表机构 * Department of Mathematics, Pennsylvania State University(数学系,宾夕法尼亚州立大学) ; Department of Computing and Mathematical Sciences, California Institute of Technology(计算与数学科学系,加州理工学院)
AI总结 提出基于Marchenko-Pastur随机矩阵理论的剪枝方法,在极短微调预算下保持精度,并在ImageNet-1k上验证了多种架构的高效稀疏执行加速。
AgentPLM:具有推理增强解码的智能体蛋白质语言模型用于蛋白质序列设计
发表机构 * Sahil Rahman ; Maxx Richard Rahman
AI总结 提出AgentPLM,通过推理增强解码和对比智能体策略优化,使预训练蛋白质语言模型能够利用外部生物物理反馈进行在线纠错,在多项蛋白质设计任务上取得最优结果。
注意力电路何时形成?三种1B级架构中能力和注意力汇出现的发育轨迹
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文追踪三种1B级语言模型中注意力头电路的形成轨迹,发现归纳电路形成早于注意力汇形成10-20倍令牌,且电路识别无需最终模型。
Comments 27pages, 3 figures
颜色线索:利用颜色统计检测合成图像
发表机构 * Deutsche Forschungsgemeinschaft(德国研究基金会)
AI总结 利用生成模型在颜色统计上的弱点,通过手工设计的颜色变换和学习优化的颜色变换,提出像素级或块级颜色敏感特征,实现高泛化准确率和鲁棒性的合成图像检测。
VET:一个分析AI话语的框架
发表机构 * The Paul G. Allen School of Computer Science & Engineering and The Information School(保罗·G·艾伦计算机科学与工程学院和信息学院)
AI总结 本文提出VET框架,通过效价、有效性和轨迹三个维度对AI话语进行分类,用于识别和批判AI炒作、AI末日、AI否认和AI常态四种立场,并作为AI素养工具支持对极化话语的审视。
EVA-Net: 基于视频衍生运动先验的跨被试脑电运动解码
发表机构 * South China University of Technology(华南理工大学)
AI总结 提出EVA-Net两阶段框架,利用动作视频作为语义先验,通过跨模态对比学习和对齐减少个体差异,实现跨被试脑电运动解码,在EEGMMI上取得8.66%的LOSO准确率提升。
具有障碍李雅普诺夫约束的自适应人工时延控制用于欧拉-拉格朗日机器人
发表机构 * Robotics Research Center, International Institute of Information Technology Hyderabad, India(机器人研究中心,国际信息科技大学 Hyderabad,印度) ; Department of Computer Science, University of Manchester, UK(计算机科学系,曼彻斯特大学,英国) ; Autonomous Systems and Automatic Control in School of Engineering, Newcastle University, UK(工程学院自主系统与自动控制,新castle大学,英国) ; Self-Organizing Mobility Lab, School of Mathematics, Southeast University, Nanjing 210096, China(自组织移动实验室,数学学院,东南大学,南京210096,中国)
AI总结 针对欧拉-拉格朗日系统中的状态相关不确定性和时变状态约束问题,提出一种结合人工时延估计与障碍李雅普诺夫函数的自适应控制框架,通过在线估计不确定性上界并强制约束位置和速度,实验验证了其在五自由度机械臂上的有效性。
ConRAG: 用于多跳问答的共识驱动多视角检索
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院)
AI总结 提出ConRAG框架,通过共识驱动的多视角检索(关系、实体、文本信号)优化查询和语料库,显著提升多跳问答性能,在MuSiQue上创下新纪录。
PromptEmbedder:通过双LLM软提示实现高效且可迁移的文本嵌入
发表机构 * Department of Computer Science and Information Engineering, National Taiwan University(国立台湾大学计算机科学与资讯工程系) ; National Taiwan University AI Center of Research Excellence(国立台湾大学人工智能研究中心)
AI总结 提出PromptEmbedder双LLM框架,通过可微分的软提示生成将嵌入知识从特定骨干权重中解耦,在保持性能的同时降低40% GPU内存并加速3.7倍训练。
测试时自适应可学习性:恢复复杂性视角
发表机构 * Zhi Zhou(周智) ; Ming Yang(杨明) ; Shi-Yu Tian(田世宇) ; Kun-Yang Yu(于坤阳) ; Lan-Zhe Guo(郭兰哲) ; Yu-Feng Li(李宇峰)
AI总结 本文提出首个理论框架,通过引入(ε,δ)-恢复复杂性和(ε,ρ)-TTA可学习性,研究非平稳流下测试时自适应的可学习性,并揭示自适应-信息权衡。
Comments Accepted by ICML 2026
让结果说话:LLM行为基准测试的复制优先范式
发表机构 * Cylingo team(Cylingo团队)
AI总结 提出复制优先范式,通过可靠性、跨仪器复制、历史足迹校准和预注册预测四个正交属性验证LLM行为评估工具,并在情感陪伴任务中测试,发现聚合分数掩盖的模型退化。
Falcon-X:面向异构多变量建模的时间序列基础模型
发表机构 * Ant Group(蚂蚁集团)
AI总结 针对现有时间序列基础模型在语义对齐和关系表达上的局限,提出Falcon-X,通过将变量映射到统一潜在原型空间,利用统一原型差分注意力机制对齐异构变量,并在共享空间中通过潜在实体注意力进行跨变量交互,实现零样本结构迁移,在GIFT-Eval和fev-bench基准上取得最先进预测性能。
FOUND-IT: 基于基础模型优先、按需粒度的任务驱动3D场景图
发表机构 * Laboratory for Information & Decision Systems, Massachusetts Institute of Technology(信息与决策系统实验室,麻省理工学院) ; Samsung Research America(三星美国研究院)
AI总结 提出首个基于未标定单目相机实时构建任意室内外环境分层任务驱动3D场景图的方法,通过几何基础模型和可调整粒度支持动态任务,并在ASHiTA SG3D基准上提升79%准确率。
通过细粒度事实核查和领域特定适应减轻医疗保健大语言模型中的幻觉
发表机构 * Applied Artificial Intelligence and Intelligent Systems (AAIINS) Laboratory(应用人工智能与智能系统实验室) ; Department of Computer Science and Engineering(计算机科学与工程系) ; Department of Data Science and Artificial Intelligence(数据科学与人工智能系) ; Department of Software Engineering(软件工程系) ; Faculty of Science and Information Technology(科学与信息技术学院) ; Faculty of Science and Technology(科学与技术学院)
AI总结 提出一个独立于任何LLM的事实核查模块和领域特定的摘要模型,通过数值测试和细粒度逻辑检查减少幻觉,在MIMIC III数据集上微调并评估,取得了高精度和召回率。
Comments Published in Expert Systems with Applications
对自动化工作流中智能体错位的冷静审视
发表机构 * University of Virginia(弗吉尼亚大学) ; Georgia Institute of Technology(佐治亚理工学院) ; University of Utah(犹他大学) ; University of Notre Dame(圣约翰大学) ; George Washington University(乔治华盛顿大学)
AI总结 本文研究多智能体系统中的新兴错位问题(称为智能体错位),通过贝叶斯框架分析其成因,并提出基于证据的智能体对齐范式(AEA)来纠正错位行为,从而提升协作可靠性。
AMEL: 累积消息对LLM判断的影响
发表机构 * chut.app
AI总结 研究LLM在对话中因历史消息极性而偏离基准判断的累积消息效应(AMEL),发现模型偏向历史主流极性,且负向历史偏见更强,但偏见不随上下文长度增长,简单修复是为每个项目使用新上下文。
Comments 24 pages, 14 figures, 8 tables. Single author. Code, data (84,088 deduplicated API responses), and analysis pipeline at https://github.com/chutapp/amel
基于聚类正则化最优传输的块缺失单细胞数据高效插补
发表机构 * Department of Computer Science, Stony Brook University(计算机科学系,石板溪大学) ; Department of Computer Science, Emory University(计算机科学系,埃默里大学) ; Department of Population Health Sciences, Cornell University(流行病学与公共卫生系,康奈尔大学) ; Department of Computer Science and Engineering, Cornell University(计算机科学与工程系,康奈尔大学) ; Department of Biomedical Informatics, Stony Brook University(生物医学信息学系,石板溪大学)
AI总结 提出CROT算法,利用最优传输处理单细胞数据中的块缺失问题,实现高精度插补并显著降低运行时间。
Comments Accepted to ACM-BCB 2026
基于化学诱导契合的表征对齐用于分子关系学习
发表机构 * Wuhan University of Technology(武汉理工大学) ; Yonsei University(延世大学) ; Hubei Key Laboratory of Transportation Internet of Things(湖北省交通运输物联网重点实验室) ; Dalian University(大连大学)
AI总结 提出ReAlignFit方法,通过引入化学诱导契合的归纳偏置动态对齐子结构表征,并利用子图信息瓶颈优化高化学功能兼容性的子结构对,以提升分子关系学习在化学空间偏移数据上的稳定性。
Comments Accepted by SIGKDD2026 AI for Science Track
CatalyticMLLM: 一种用于催化材料的图-文本多模态大语言模型
发表机构 * AnnLab(安实验室) ; Institute of Semiconductors, Chinese Academy of Sciences(中国科学院半导体研究所) ; Zhongguancun Academy(中关村学院) ; State Key Laboratory of Multimodal Artificial Intelligence Systems(多模态人工智能系统国家重点实验室) ; State Key Laboratory of High Performance Ceramics(高性能陶瓷国家重点实验室) ; University of Chinese Academy of Sciences(中国科学院大学) ; School of Electronic, Electrical and Communication Engineering(电子电气与通信工程学院) ; University of ChineseAcademy of Sciences(中国科学院大学)
AI总结 本文提出了一种统一的图-文本多模态大语言模型QE-Catalytic-V2,用于催化材料的性质预测和逆向设计,通过共享的表示空间实现两者的联合建模,从而形成闭环优化流程。
Comments 71 page
提示重注入:缓解多模态扩散变换器中的提示遗忘
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本研究针对多模态扩散变换器中提示遗忘问题,提出一种无需训练的提示重注入方法,通过将早期层的提示表示重新注入到后期层,以提升指令遵循能力和生成质量。
Comments 19 pages
损失函数对称化以在存在噪声标签的情况下实现神经网络的鲁棒训练
发表机构 * Department of Computer Science and Software Engineering(计算机科学与软件工程系)
AI总结 本文研究了通过将交叉熵损失对称化来设计鲁棒损失函数的方法,提出了一种多类对称损失函数,并展示了其在噪声标签下的有效性。
Comments 28 pages, 1 figure, 4 tables. v2: Added relevant prior-work citations and revised the related-work discussion and Section 5.2. Minor wording corrections
用于推理时间论证的神经符号学习
发表机构 * Department of Computing, Imperial College London(伦敦帝国理工学院计算机系)
AI总结 本文提出了一种用于三元主张验证的可训练神经符号框架,通过在训练和推理过程中结合形式论证语义来指导大语言模型生成论证并分配基础分数,从而提高三元预测的准确性。
Comments Under review
从体积到价值:面向设备端RAG的偏好对齐记忆构建
发表机构 * Department of Computer Science and Engineering, Ulsan National Institute of Science and Technology (UNIST), Ulsan, Republic of Korea(计算机科学与工程系,全州国立科学与技术研究所(UNIST),全州,韩国)
AI总结 本文提出EPIC方法,通过将用户偏好作为紧凑且稳定的个人上下文形式,整合到RAG流程中,以在有限内存下提高检索与用户偏好的对齐度,从而减少内存使用并提升准确性。
Comments Accepted to ICML 2026. Code and data are available at https://github.com/UbiquitousAILab/EPIC
层次化支持向量状态划分用于黑箱强化学习策略的蒸馏
发表机构 * Vrije Universiteit Brussel(布鲁塞尔自由大学)
AI总结 本文提出SVSP方法,通过线性支持向量机划分状态动作对数据集,构建紧凑结构化表示,提升平均回报7.4%并减少子策略数量,推动更灵活的蒸馏方法。
Comments Accepted for poster presentation at HHAI 2026
BiPneu:用于软体机器人的双极气压气动系统的设计与控制
发表机构 * Department of Electrical and Computer Engineering, Michigan State University(电气与计算机工程系,密歇根州立大学)
AI总结 提出一种可扩展、高性价比的多通道双极气压气动系统BiPneu,并设计基于混合电-气动模型的双模式滑模控制器(DM-SMC),实现宽范围、精确、快速的压力调节,在软体机器人应用中显著优于MPC和PID控制器。
Comments Full Version of BiPenu, including the supplementary materials
自适应教师暴露用于大语言模型推理中的自蒸馏
发表机构 * ByteDance Douyin(字节跳动抖音)
AI总结 针对自蒸馏中教师暴露完整推理导致学生难以吸收的问题,提出自适应教师暴露方法ATESD,通过轻量Beta策略控制器动态调整暴露比例,并用折扣学习进步奖励优化,在多个模型和数据集上提升推理性能。
Comments 11 pages, 4 figures; code not released yet
更细粒度更好(配合正确的缩放)
发表机构 * Google LLC(谷歌公司) ; Mountain View, Ca(山景城,加利福尼亚)
AI总结 本文研究大语言模型低精度量化中的块大小悖论,发现细粒度块在正确缩放策略下能降低量化误差,并通过4-over-6方法等解决退化问题。
一个工业级保险大语言模型,实现可验证的领域掌握与幻觉控制,无能力权衡
发表机构 * Ant Group(蚂蚁集团)
AI总结 提出INS-S1保险专用大语言模型,通过可验证数据合成系统和渐进式SFT-RL课程框架,在领域任务上达到SOTA,同时保持通用能力并实现0.6%的低幻觉率。
Comments 21 pages, 12 figures, 17 tables
通信动力学神经网络:用于改进Hessian条件数并减少参数数量的FFT对角化层
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出CDLinear块循环线性层,通过FFT对角化Hessian矩阵,在参数减少3.8倍下保持高精度,并给出显式条件数分析。
Comments 17 pages, 5 figures. Includes NumPy implementation, gradient checks, MNIST experiments, and reference PyTorch CD-Transformer implementation