Boltzmann Attention: Learnable Ising Couplings for Cooperative Attention
玻尔兹曼注意力:用于协同注意力的可学习伊辛耦合
发表机构 * Yonsei University(延世大学)
AI总结 提出玻尔兹曼注意力,通过可学习的伊辛耦合增强注意力机制中的位置间交互,在字符级语言建模和括号匹配任务中优于标准softmax注意力,并展示了量子退火训练的有效性。
Comments 19 pages, 5 figures
玻尔兹曼注意力:用于协同注意力的可学习伊辛耦合
发表机构 * Yonsei University(延世大学)
AI总结 提出玻尔兹曼注意力,通过可学习的伊辛耦合增强注意力机制中的位置间交互,在字符级语言建模和括号匹配任务中优于标准softmax注意力,并展示了量子退火训练的有效性。
Comments 19 pages, 5 figures
$μ$VLA:部分可观测操作中VLA模型的循环记忆研究
发表机构 * CogAI Lab, Moscow, Russia(CogAI实验室,莫斯科,俄罗斯) ; MIRAI, Moscow, Russia(MIRAI,莫斯科,俄罗斯)
AI总结 针对VLA模型在部分可观测场景中的记忆缺失问题,提出仅通过可学习记忆令牌和截断反向传播时间实现最小化循环记忆增强,在MIKASA-Robo上将训练任务成功率从0.42提升至0.84,并在LIBERO上保持全可观测性能。
Comments 34 pages, 20 figures, 9 tables
基于评分标准的自蒸馏:无需评分标准验证器的后训练
发表机构 * Scale AI
AI总结 提出RGSD方法,通过将评分标准作为条件蒸馏到学生模型,无需验证器即可实现密集逐令牌学习,在医学和科学领域达到与基于评判的GRPO相当的评分标准满足率。
深度展开潜在最优分区l2/l1网络用于数据驱动的块稀疏恢复
发表机构 * Nagoya Institute of Technology(名古屋工业大学) ; RIKEN Center for Advanced Intelligence Project(理化学研究所革新智能研究中心)
AI总结 针对凸LOP-l2/l1方法依赖手动调参且近端算子不可微的问题,提出基于隐式微分和深度权重分解的两种深度展开架构,实现自动参数学习,在块稀疏恢复中表现优异且抗脉冲噪声。
Comments 11 pages, 6 figures
CLARITree: 基于Cholesky和前瞻加速的可解释分段线性树回归
AI总结 提出一种结合前瞻搜索和秩一Cholesky更新的算法,用于构建近最优稀疏分段线性回归树,在计算效率、预测精度和稀疏性之间取得良好平衡。
Comments Accepted at ICML 2026
TimeROME-DLM:掩码扩散语言模型的时间因果追踪与低秩推理时知识编辑
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Nanyang Technological University(南洋理工大学) ; National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出TimeROME-DLM,首个无需训练和梯度的推理时知识编辑框架,通过时间因果追踪定位关键坐标并应用低秩残差编辑,在保持模型性能的同时高效删除事实。
LongSpike:用于高效长序列学习的分数阶脉冲状态空间模型
发表机构 * Wuhan University(武汉大学) ; University of Science and Technology of China(中国科学技术大学) ; Anhui University(安徽大学)
AI总结 提出LongSpike框架,将分数阶状态空间模型(f-SSM)引入脉冲神经网络,通过长记忆核实现高效长序列学习,在多个基准上超越现有SNN。
计算在 TabPFN 中的位置:注意力头功能的因果定位
AI总结 通过激活修补、消融和注意力熵分析,发现 TabPFN 2.5 中一个注意力头在峰值层的因果必要性比其他头高2-5倍,且其主导层随任务复杂度变化,其余头呈现对称的后期层轮廓。
Comments Accepted to Workshop FMSD @ ICML 2026
电路同步先于泛化:来自Grokking Transformer中傅里叶结构的因果证据
发表机构 * New York University(纽约大学)
AI总结 提出频率同步度(FSD)指标,发现其在模算术任务中比grokking早500-3000步同步,且通过权重衰减控制验证了间隔期的正则化本质,提供因果证据。
Comments 16 pages, 6 figures, 10 tables
EPM-JEPA:JEPA系列世界模型中的算子侧经验调制
发表机构 * School of Artificial Intelligence and Data Engineering (SAIDE), Indian Institute of Technology Jodhpur(印度理工学院焦特布尔分校人工智能与数据工程学院)
AI总结 提出EPM-JEPA,通过LoRA在权重层面调制预测器,以应对测试时动态偏移;实验表明其优于无记忆基线,但效果弱于预期,并揭示了三种独立动力学过程。
Comments 16 pages, 5 figures, 9 tables, 5 code listings. Pre-registered experimental study with mechanism analysis
情绪调节改善基于深度学习的图像分类
发表机构 * Mare Group(Mare集团) ; NOVA LINCS(NOVA LINCS实验室) ; Institute of Engineering (ISE), University of Algarve(阿尔加维大学工程学院) ; Department of Energy Technologies and Renewable Sources, ENEA Casaccia Research Center(ENEA卡萨恰研究中心能源技术与可再生能源部)
AI总结 提出情绪调节框架,通过人工主观体验在深度学习中建模情绪,在图像分类任务中预训练ResNet和ViT,在CIFAR-10/100上超越现有方法,成为情绪增强深度学习的新标杆。
揭秘隐状态循环:基于在线强化学习的可切换潜在推理
发表机构 * HKUST(GZ)(香港科技大学(广州)) ; University of Cambridge(剑桥大学) ; NTU(南洋理工大学) ; JoinQuant(聚宽) ; HKUST(香港科技大学)
AI总结 提出SWITCH框架,通过离散边界令牌使隐状态循环推理兼容在线强化学习,并支持因果机制分析,实验表明其优于现有方法。
选择与改进:理解推理后训练的机制
发表机构 * Microsoft Research NYC(微软研究院纽约) ; UIUC(伊利诺伊大学厄巴纳-香槟分校)
AI总结 通过控制实验揭示强化学习后训练通过策略选择和策略改进两种机制提升推理能力,并指出SFT数据和RL数据的不同作用。
路由何时变得可解释?对块注意力残差的因果探针
发表机构 * ETH Zurich(苏黎世联邦理工学院)
AI总结 研究块注意力残差中路由的可解释性,发现仅当路由参与训练时才出现结构化深度路由,且路由权重与因果重要性存在分离,需用因果干预验证。
分布损失用于鲁棒分类
发表机构 * Institute for Neuro- and Bioinformatics(神经与生物信息学研究所)
AI总结 提出一种基于双峰高斯分布的分布损失概念,通过软化目标隐式捕捉类别模糊性,缓解过拟合,提升决策边界鲁棒性,尤其在低数据场景下效果显著。
Comments ICANN 2026
不同层,不同流形:Transformer优化中的模块级权重空间几何
发表机构 * School of Engineering Science, The University of Osaka(大阪大学工程科学学院)
AI总结 研究Transformer不同模块偏好不同流形几何,提出为注意力层和MLP层分别分配Stiefel和DGram约束,在GPT-2预训练中取得最佳性能。
Comments Accepted at WSS @ ICML 2026, code is available at https://github.com/kiratoyoshihara/module-wise-manifold-muon
我们需要多少记忆?神经算子的自适应记忆门
发表机构 * University of Seoul(首尔大学)
AI总结 针对现有神经算子固定记忆权重适应性不足的问题,提出AMGFNO,通过可学习门动态调节记忆权重,在低分辨率下nRMSE降低55-79%。
调整杯积神经层
AI总结 提出调整杯积神经层,通过硬连线杯积与高规范理论调整项,实现规范不变读出,并证明调整系数是唯一信号源。
存在先于价值:时间序列预测中观测存在性与状态演变的联合建模
发表机构 * Ant International(蚂蚁国际)
AI总结 提出Timeflies框架,联合建模未来观测是否发生(存在性)与数值估计,通过观测流和数值流耦合模块提升缺失值时间序列预测性能。
超越承诺边界:探究大型推理模型中的附带思维链
发表机构 * CLCG, University of Groningen(格罗宁根大学CLCG) ; University of Milano-Bicocca(米兰-布雷拉大学) ; University of Trieste(特里耶大学) ; Khoury College of Computer Sciences, Northeastern University(东北大学Khoury计算机科学学院)
AI总结 通过早期退出估计思维链步骤的因果重要性,发现推理中存在从瞬态猜测到稳定答案的“承诺边界”,后续步骤为附带现象,可提前退出以缩短推理长度达55%而不影响性能。
一种双参数Weibull框架用于变压器权重分布诊断
发表机构 * Independent Researcher(独立研究者)
AI总结 本文提出了一种基于Weibull分布的双参数框架,用于分析Transformer中元素权重幅度分布,通过实验发现不同模块的k值分布特征,并揭示了训练过程中lambda参数的变化规律。
Comments 27 pages, 14 figures. Companion library npm-weibull-py and benchmark database available at https://github.com/tiexinding/NPM-Weibull-public
BASENet: 基于频带自适应的跨频带注意力语音增强网络
发表机构 * Thales SIX GTS, FRANCE(泰雷兹SIX GTS公司,法国)
AI总结 提出BASENet,通过Bark尺度划分频带并分配自适应容量编码器,结合跨频带注意力模块,以最少参数实现高PESQ和STOI,适用于资源受限设备。
自引导:通过解码器流形对齐增强神经编解码器
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出自引导方法,通过轻量特征映射损失对齐解码器内部流形,在不改变推理过程下提升VQ-VAE神经语音编解码器重建质量,实现低比特率SOTA性能并支持4倍码本缩减。
Comments 20 pages, 9 figures, accepted to ICML 2026, demo website available at https://sgvqvae.github.io/sgvqvae-demo
闪电自注意力的几何:可识别性与维度
发表机构 * University of Toronto(多伦多大学) ; Royal Institute of Technology (KTH)(皇家理工学院(KTH))
AI总结 本文利用代数几何工具,分析了无归一化自注意力网络的函数空间几何,给出了深层注意力的可识别性描述并计算了函数空间维度,同时刻画了单层模型的奇异点和边界点,并推测了归一化情形的结果。
Comments Accepted at ICLR 2025
傅里叶多分量与多层神经网络:解锁高频潜力
发表机构 * Department of Applied Mathematics(应用数学系) ; Hong Kong Polytechnic University(香港理工大学) ; Department of Mathematics(数学系) ; Duke University(杜克大学) ; Department of Mathematics and Statistics(数学与统计学系) ; Auburn University(阿伯茨伦大学) ; School of Mathematics(数学学院) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出傅里叶多分量与多层神经网络(FMMNN),结合正弦型激活函数与多分量多层结构,通过低秩架构实现指数级函数逼近能力,优化景观优于标准全连接网络,并设计缩放随机初始化方法加速训练,在高频函数逼近任务中取得高精度与良好收敛性。
Comments Our code and implementation details are available at https://github.com/ShijunZhangMath/FMMNN
刀刃上的学习:多项式神经网络的可辨识性与奇异性
发表机构 * Department of Mathematics, KTH Royal Institute of Technology(数学系,皇家理工学院)
AI总结 研究以多项式为激活函数的MLP和CNN的函数空间(神经流形),证明MLP参数化几乎处处有限对一,CNN参数化一一对应,并刻画奇异性源于稀疏子网络,解释MLP的稀疏偏好。
Comments Published at ICLR 2026
轻量级可解释Transformer:基于混合图算法展开的交通预测
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出一种通过展开混合图优化算法构建的轻量级可解释类Transformer网络,用于时空交通预测,在保持竞争性能的同时大幅减少参数。
Comments 24 pages, 7 figures, 11 tables
DeepONet和S-DeepONet中的单分支与多分支:网络架构遵循多物理系统中的耦合
发表机构 * National Center for Supercomputing Applications, University of Illinois at Urbana-Champaign(国家超级计算应用中心,伊利诺伊大学厄巴纳-香槟分校) ; The Grainger College of Engineering, Mechanical Science and Engineering, University of Illinois at Urbana-Champaign(格拉inger工程学院,机械科学与工程系,伊利诺伊大学厄巴纳-香槟分校) ; The Grainger College of Engineering, Nuclear, Plasma & Radiological Engineering, University of Illinois at Urbana-Champaign(格拉inger工程学院,核物理与辐射工程系,伊利诺伊大学厄巴纳-香槟分校) ; Department of Industrial and Manufacturing Systems Engineering, Kansas State University(工业与制造系统工程系,堪萨斯州立大学) ; Civil and Urban Engineering Department, New York University Abu Dhabi, UAE(土木与城市工程系,纽约大学阿布扎比分校,阿联酋)
AI总结 研究比较单分支与多分支神经算子架构在强耦合多物理系统中的表现,发现单分支网络在紧耦合场景下通过共享潜在表示优于多分支,而多分支适用于解耦或单物理任务,代理模型加速高达1.8×10^4倍。
构建未来:通过校准草稿图实现扩散LLM推测解码
发表机构 * University of Waterloo(多伦多大学)
AI总结 提出Spiffy算法,利用校准的草稿图结构实现扩散LLM的推测解码,在保持输出分布的同时加速推理,最高减少8.6倍模型推理次数并加速6.3倍令牌生成速率。
Comments Original version uploaded on Sep 22, 2025. (v2): Extended Table 2 with additional analysis and referenced it in Sec 5.2. (v3): Added note to Sec 4.2 and Appendix A.2 specifying conditions for losslessness. (v4): Updated with the version accepted to ICML 2026 workshops
多令牌残差预测
发表机构 * New York University(纽约大学) ; New York University Shanghai(纽约大学上海) ; Nos Research(Nos研究) ; Modal
AI总结 本文提出了一种轻量级模块Multi-token Residual Prediction,通过利用去噪过程中相邻步骤的logit分布相似性,在单次骨干网络前向传播中实现依赖感知的多令牌去噪,从而在成本较低的情况下提高去噪效率。
用于Transformer修补和机制可解释性的连续深度场论
发表机构 * Universidade de Vigo(维戈大学) ; Independent Researcher(独立研究员)
AI总结 本文提出场论框架,将残差流视为深度-标记场,通过局部源插入、灵敏度场预测、经验格林函数响应和伴随变分问题来组织和预测Transformer激活修补干预,并在GPT-2风格自回归Transformer中验证了前向响应理论。
GenAutoML: 面向时间序列分析的动态架构生成与优化的智能体框架
发表机构 * Paul Wurth S.A.(保罗·沃思公司) ; Otto-von-Guericke University(奥托·冯·格里克大学) ; Technical University of Munich(慕尼黑技术大学)
AI总结 提出GenAutoML框架,利用大语言模型作为神经架构师,通过沙盒反射循环和签名感知运行时自动生成并优化时间序列预测与异常检测的神经网络架构,引入动态可逆实例归一化提升非平稳条件下的鲁棒性。
Comments 26 pages, 17 figures, 12 tables. Under review
Bernstein-Schur核:通过草图调制和径向随机化的随机特征
发表机构 * Azetta AI
AI总结 提出一种随机特征构造方法,用于Bernstein-Schur核类,通过草图化有限调制和随机化完全单调径向因子,实现无偏估计和算子范数界,应用于yat核族。
通过部分分解注意力的空间基础概念瓶颈模型
发表机构 * Vector Institute(向量研究所)
AI总结 提出一种部分分解的概念瓶颈模型,通过空间先验约束注意力,在细粒度识别中实现可解释性并提升定位精度。
Comments Updated results with GobalAttention Tokens
将时间序列表示为结构化程序以进行LLM推理
发表机构 * Korea University(高丽大学) ; Mila, University of Montreal(蒙特利尔大学米拉研究所)
AI总结 提出T2SP方法,将时间序列分解为趋势、周期和显著事件并表示为结构化符号程序,使LLM无需微调即可高效推理,在编辑、描述和问答任务上优于原始序列表示。
Comments Preprint
静态(因此兼容)表示即所需
发表机构 * Media Integration and Communication Center (MICC), Dipartimento di Ingegneria dell’Informazione, Università degli Studi di Firenze(佛罗伦萨大学信息工程系媒体集成与通信中心(MICC))
AI总结 本文证明d-Simplex固定分类器学习的静态表示满足兼容性定义,并通过交叉熵与对比损失的凸组合捕获高阶依赖,实现模型更新时无需重处理的检索服务。
Comments Accepted to TPAMI2026. Extension of the CVPR2024 version (arXiv:2405.02581)
Dolph2Vec: 海豚发声的自监督表示
发表机构 * École Normale Supérieure, Paris, France(巴黎高等师范学院) ; Not Diamond, San Francisco, USA(Not Diamond公司) ; Institut du Cerveau, Paris, France(巴黎脑研究所) ; Champalimaud Foundation, Lisbon, Portugal(尚帕利莫基金会)
AI总结 提出Dolph2Vec,首个基于五年纵向海豚录音数据训练的自监督模型,在签名哨声分类和检测任务上显著优于通用基线,并发现可解释的声学单元。
病毒蛋白质揭示蛋白质语言模型的几何结构
发表机构 * University of Washington(华盛顿大学) ; DeepMind(深度思维)
AI总结 研究蛋白质语言模型在不平衡数据下对病毒蛋白的表示,发现嵌入空间中存在主导的“天然性”轴,该轴按模型困惑度排序序列,且缩放效果因病毒家族而异,但嵌入仍保留病毒特异性信号。
Comments Accepted at ICML 2026 GenBio Workshop and FM4LS Workshop. Code available at https://github.com/MisteFr/viral-proteins-plms
通过多视图对比学习从潜在动力学中提取控制方程
发表机构 * EPFL(瑞士联邦理工学院洛桑)
AI总结 提出DYSCO算法,利用多视图时间对比学习从噪声高维观测中联合恢复潜在轨迹和动力学方程,并通过结构化基函数实现符号恢复,理论保证强可识别性。
无高斯假设的可识别性:符号世界模型与近无限时间一致性
AI总结 本文提出物理基础符号架构(PGSA),证明其在非高斯动态系统中实现精确线性可识别性和近无限时间一致性,克服了统计世界模型的高斯边界限制。
Comments Pre-print
PlaceRep: 基于大规模兴趣点数据的地理空间场所表示学习
发表机构 * Emory University(埃默里大学)
AI总结 提出PlaceRep方法,通过聚类空间和语义相关的兴趣点构建场所级表示,无需预训练即可高效生成多尺度城市区域嵌入,在人口密度估计和房价预测任务中优于现有方法并实现百倍加速。
BrainPro:迈向大规模脑状态感知的脑电图表征学习
发表机构 * Nanyang Technological University(南洋理工大学) ; Shanghai Jiao Tong University(上海交通大学) ; Advanced Telecommunications Research Institute International(先进电信研究院) ; Southeast University(东南大学)
AI总结 提出BrainPro模型,通过检索式空间对齐和脑状态解耦模块,学习共享与特定状态表征,在9个公共BCI数据集上取得最优性能。
Comments 31 pages, 11 figures
Echo2ECG:利用多视角超声心动图的心脏形态增强心电图表示
发表机构 * Chair for AI in Healthcare and Medicine, Technical University of Munich (TUM) and TUM University Hospital(人工智能在医疗与医学中的中心,慕尼黑技术大学(TUM)和慕尼黑大学医院) ; Department of Cardiology, TUM University Hospital(心血管科,慕尼黑大学医院) ; Department of Computing, Imperial College London(计算系,伦敦帝国理工学院) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心(MCML))
AI总结 提出Echo2ECG多模态自监督学习框架,通过多视角超声心动图丰富心电图表示,在结构表型分类和超声检索任务上优于现有方法,模型大小仅为最大基线的1/18。
Comments Accepted at MICCAI 2026
解耦动力系统:因果表示学习遇见局部稀疏注意力
发表机构 * Applied Artificial Intelligence Lab, Oxford Robotics Institute, Oxford, UK(应用人工智能实验室,牛津机器人研究所,英国牛津)
AI总结 提出一种结合因果表示学习和局部稀疏注意力的方法,从原始轨迹数据中无结构假设地解耦系统参数,并通过图论准则保证可辨识性。
Comments Presented as an Oral at the 5th Conference on Causal Learning and Reasoning
BrainDINO:一种用于通用临床表征学习的脑MRI基础模型
发表机构 * Department of Radiation Oncology and Winship Cancer Institute, Emory University(放射肿瘤科和Winship癌症研究所,埃默里大学) ; Department of Radiation and Cellular Oncology, The University of Chicago(放射肿瘤学与细胞肿瘤学部,芝加哥大学) ; Department of Electrical and Computer Engineering, Georgia Institute of Technology(电气与计算机工程系,佐治亚理工学院) ; Department of Biomedical Engineering, Georgia Institute of Technology(生物医学工程系,佐治亚理工学院) ; Department of Biomedical Informatics, Emory University(生物医学信息学系,埃默里大学) ; Department of Medical Physics, Memorial Sloan Kettering Cancer Center(医学物理系,纪念斯隆凯特琳癌症中心)
AI总结 提出BrainDINO,一种基于自蒸馏的基础模型,在约660万张未标记轴向切片上训练,通过冻结编码器加轻量任务头,在多种脑MRI任务上达到或超越基线,尤其在小样本场景下优势显著。
Comments 25 pages, 5 figures
更接近真实:一种多尺度残差感知表示学习管道用于时间序列预测
发表机构 * RobotBulls Labs(RobotBulls实验室) ; North South University(南北大学)
AI总结 提出两阶段模型无关框架,通过显式解耦预测与残差学习,使用元校正器动态建模结构误差模式,提升Transformer预测精度。
Comments Accepted at the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining V.2 (KDD '26)
何时对齐,何时预测:多模态学习的相图
发表机构 * Technion(以色列理工学院) ; Genentech(基因泰克公司) ; Brown University(布朗大学) ; Meta AI, FAIR
AI总结 提出统一线性框架,通过信噪比模型揭示跨模态对齐与预测的互补失效模式,构建四区域相图指导多模态学习目标选择,并在非线性实验中验证。
从视频中学习软体连续体机器人的视觉可解释振荡器网络
发表机构 * Department of Advanced Interdisciplinary Studies, The University of Tokyo(东京大学先进跨学科研究系) ; Institute of Assembly Technology and Robotics, Leibniz University Hannover(莱比锡大学汉诺威装配技术与机器人研究所) ; Research Center for Advanced Science and Technology, The University of Tokyo(东京大学先进科学研究中心)
AI总结 提出注意力广播解码器(ABCD)和视觉振荡器网络(VONs),实现从视频中学习软体连续体机器人动力学的视觉和机械可解释性,多步预测误差降低5.8倍。
Comments Code available at: https://github.com/UThenrik/visual_oscillators_for_SCR Dataset available at: https://zenodo.org/records/17812071 Video available at: https://youtu.be/i80H8erVISM
深度双样本检验的反事实解释
发表机构 * Hasso-Plattner-Institute, University of Potsdam(波茨坦大学洪堡-劳恩堡研究所) ; Hasso Plattner Institute for Digital Health at Mount Sinai Icahn School of Medicine at Mount Sinai(辛辛那提医学院洪堡数字健康研究所)
AI总结 针对深度双样本检验,提出基于扩散自编码器和MMD优化的反事实解释框架,生成样本级编辑以揭示驱动假设拒绝的特征。
Comments 17 pages
ReCal: 基于强化学习的LLM路由的奖励校准
发表机构 * Zhejiang University(浙江大学) ; Ant Group(蚂蚁集团) ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 提出ReCal框架,通过分层奖励分解和分布感知优化校准奖励信号,解决多目标冲突和异质性任务优化偏差,提升LLM路由性能与稳定性。
面向质量多样性的Web智能体模仿的推测性回滚修正
发表机构 * Beihang University(北京航空航天大学) ; Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所) ; The Hong Kong University of Science and Technology(香港科技大学) ; Northwestern Polytechnical University(西北工业大学) ; Tsinghua University(清华大学) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Peking University(北京大学)
AI总结 提出推测性回滚修正(SRC)框架,通过固定视野分支审查和回滚机制,在减少教师查询的同时保持轨迹多样性,在WebArena-Infinity上收集了977条通过验证的轨迹和9183个下一步动作示例。
通过惩罚增强直接偏好优化
发表机构 * Pengwei Sun(Sun Pengwei)
AI总结 提出DPOP,在DPO损失上增加对参考模型贪婪响应的门控惩罚,仅当当前策略对偏好响应概率低于拒绝响应时激活,在AlpacaEval 2.0上显著提升胜率。
Comments Accepted at ICML 2026 Workshop on Decision-Making from Offline Datasets to Online Adaptation: Black-Box Optimization to Reinforcement Learning
保持策略梯度主导:面向长程工具使用智能体的兄弟引导信用蒸馏
发表机构 * Amazon Web Services(亚马逊云服务)
AI总结 针对长程工具使用强化学习中轨迹级优势信号稀疏的问题,提出兄弟引导信用蒸馏(SGCD),通过动态采样成功与失败轨迹、外部LLM对比生成逐步信用参考,实现密集信用分配,在AppWorld和τ³-airline任务上显著提升性能。
Comments 13 pages, 4 figures, 7 tables. Submitted to EMNLP 2026 Industry Track
个体控制障碍函数引导的扩散模型用于安全离线多智能体强化学习
发表机构 * Department of Electrical Engineering and Automation, Aalto University(阿尔托大学电气工程与自动化系) ; School of Computing and Data Science, Xiamen University Malaysia(厦门大学马来西亚分校计算与数据科学学院) ; Department of Computer Science, University of Toronto(多伦多大学计算机科学系)
AI总结 提出一种将神经个体控制障碍函数嵌入扩散模型的离线多智能体强化学习算法,通过逆动力学恢复控制策略,在保证奖励的同时显著提升轨迹生成的安全性。
Comments Accepted to the 23rd IFAC World Congress, 2026
ProPlay: 用于自我进化LLM智能体的程序化世界模型
发表机构 * University of Notre Dame(圣母大学) ; University of Connecticut(康涅狄格大学)
AI总结 提出ProPlay程序化世界模型,通过程序级预演和因果过程图,使LLM智能体在部分可观测环境中自我进化,无需外部监督。
神经模型编辑的强化学习
发表机构 * Shaivi Malik
AI总结 提出将神经模型编辑形式化为强化学习问题,通过奖励反馈学习编辑策略,在偏见缓解和机器遗忘任务上取得良好效果。
MaxProof: 通过生成-验证器强化学习与群体级测试时扩展实现数学证明规模化
发表机构 * MiniMax ; The Chinese University of Hong Kong(香港中文大学) ; Fudan University(复旦大学) ; Peking University(北京大学) ; Tsinghua University(清华大学)
AI总结 提出MaxProof框架,结合生成-验证器强化学习与群体级测试时扩展,在MiniMax-M3系列上实现竞赛级数学证明,在IMO 2025和USAMO 2026上超越人类金牌阈值。
$\alpha$-公平异质智能体强化学习
发表机构 * Orange Innov(Orange创新)
AI总结 提出一种结合$\alpha$-公平性与异质智能体信任区域学习(HATRL)的框架,通过公平优势函数动态加权智能体效用,实现单调改进并收敛至纳什均衡,在顺序社会困境中优于HATRL算法。
多智能体编排的奖励建模
发表机构 * Rutgers University(罗杰斯大学) ; Salesforce AI Research(Salesforce人工智能研究)
AI总结 提出OrchRM框架,通过自监督学习从多智能体执行中间产物构建奖励模型,无需人工标注,实现高效编排器训练和测试时扩展,在多个领域提升性能并降低计算成本。
Comments Preprint; work in progress
基于延迟市场反馈的多智能体强化学习在三方调度中的目标权重自适应
发表机构 * DoorDash
AI总结 提出在DoorDash部署的强化学习系统,利用延迟信号自适应调整调度目标权重,通过离线策略学习在噪声和耦合反馈下优化配送质量与批处理效率的权衡。
Comments Accepted at ICML 2026 Workshop on Reinforcement Learning from World Feedback (RLxF)
基于机会约束强化学习的分布无关鲁棒轨迹优化
发表机构 * Auckland University(奥克兰大学)
AI总结 提出一种分布无关的鲁棒轨迹优化框架,通过机会约束强化学习处理初始条件和过程噪声的不确定性,采用离线标称轨迹与在线仿射闭环校正,在两种不同轨迹设计问题上验证了概率可行性与燃料效率。
Comments Preprint. 39 pages, 16 figures
DiffCoord: 分布式多智能体轨迹优化的可微协调
发表机构 * Department of Electrical and Computer Engineering, National University of Singapore(新加坡国立大学电子与计算机工程系)
AI总结 提出DiffCoord框架,将截断ADMM-DDP管道的耦合参数通过端到端元学习联合优化,利用智能体神经网络实现任务自适应,并扩展到不同智能体数量。在协作空中运输系统中验证,相比现有方法将每智能体梯度计算时间减少70%。
ARROW:增强重放用于鲁棒世界模型
发表机构 * Imam Mohammad Ibn Saud Islamic University (IMSIU)(伊玛姆·穆罕默德·本·沙特伊斯兰大学) ; Monash University(莫纳什大学) ; University of New South Wales, Sydney(新南威尔士大学,悉尼) ; Cerenaut
AI总结 本文提出ARROW算法,一种基于模型的持续强化学习方法,通过高效的重放缓冲区减少灾难性遗忘,提升在无共享结构任务和有共享结构任务中的表现。
Comments 36 pages and 11 figures (includes Appendix)
混合使得马尔可夫上下文在线性赌博机中变得廉价
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; Meta, Superintelligence Lab(Meta超智能实验室)
AI总结 针对马尔可夫上下文线性赌博机问题,提出一种基于均匀几何遍历性的约简方法,通过构建平稳替代动作集和延迟更新方案,实现了与标准线性赌博机相当的最坏情况遗憾界。
WOMBET:基于世界模型的经验迁移实现鲁棒且样本高效的强化学习
发表机构 * Hybrid Robotics, UC Berkeley(混合机器人技术,伯克利大学)
AI总结 提出WOMBET框架,通过源任务中学习世界模型并生成不确定性惩罚的离线数据,再结合自适应采样进行在线微调,实现鲁棒且样本高效的强化学习迁移。
Comments 13 pages, 6 figures, 8th Annual Learning for Dynamics & Control Conference (L4DC)
基于有源同步透射反射智能超表面的多用户蜂窝共生无线电网络中的QoS改进
发表机构 * Department of Electrical and Computer Engineering, Isfahan University of Technology(伊斯法罕理工大学电气与计算机工程系) ; Department of Electronics and Communication Engineering, Kuwait College of Science and Technology(科威特科学与技术学院电子与通信工程系) ; The Pasargad Institute for Advanced Innovative Solutions (PIAIS)(帕萨尔加德先进创新解决方案研究所) ; Electrical and Electronic Engineering Department, London South Bank University(伦敦南岸大学电子与电气工程系)
AI总结 本文利用有源同步透射反射智能超表面(ASRIS)增强6G蜂窝网络服务质量,通过深度强化学习优化波束成形、相位调整和调度参数,最大化共生反向散射设备与用户间的吞吐量。
Comments This article will be submitted to the Transactions journal
SCALE: 基于自不确定性条件自适应观察与执行的视觉-语言-动作模型
发表机构 * Seoul National University(首尔国立大学)
AI总结 提出SCALE推理策略,利用自不确定性联合调节视觉感知和动作,无需额外训练或验证器,仅单次前向传播,提升VLA模型在模拟和真实环境中的鲁棒性。
Comments ICML 2026 Spotlight. Project page: https://dcahn12.github.io/projects/scale/
Net-Ev$^2$:网络事件演化的生成式模拟器
发表机构 * NYU Shanghai(上海纽约大学)
AI总结 提出Net-Ev$^2$,一种结合事件线索与网络拓扑的生成式模拟器,通过结构引导掩码预训练和拓扑感知扩散过程模拟网络事件演化,在多个道路网络数据集上达到最优性能。
Comments Accepted by KDD 2026 Research Track
一种稳定的路径空间方法用于基于扩散的后验采样
发表机构 * Oden Institute for Computational Engineering and Sciences, The University of Texas at Austin(德克萨斯大学奥斯汀分校奥登计算工程与科学研究所) ; Mitsubishi Electric Research Laboratories (MERL)(三菱电机研究实验室) ; Department of Biomedical Engineering, The University of Texas at Austin(德克萨斯大学奥斯汀分校生物医学工程系) ; Mitsubishi Electric Research Laboratories(三菱电机研究实验室)
AI总结 提出一种稳定的路径空间框架,通过随机最优控制与信任域优化,实现非线性逆问题中准确且鲁棒的后验采样。
生成动力学中相变的几何:投影焦散视角
发表机构 * Institute for the Advanced Study of Human Biology, Institute for Advanced Study, Kyoto University(京都大学高等研究院人类生物学高等研究所) ; Graduate School of Engineering, The University of Tokyo(东京大学大学院工学系研究科)
AI总结 本文通过投影焦散几何解释生成动力学中的相变行为,提出临界边界检测器(CBD)诊断分数方向不稳定性,定位模式承诺并支持敏感区域控制。
使用 Jeffrey 引导实现扩散模型的更通用控制
发表机构 * Inria, CNRS, I3S, Maasai Université Côte d’Azur(法国国家信息与自动化研究所、法国国家科学研究中心、信息与系统科学实验室、马赛·蔚蓝海岸大学) ; Technical University of Denmark(丹麦技术大学) ; Inria, CNRS, LJAD, Maasai Université Côte d’Azur(法国国家信息与自动化研究所、法国国家科学研究中心、雅克-路易·利翁实验室、马赛·蔚蓝海岸大学)
AI总结 提出 Jeffrey 引导框架,通过 Jeffrey 条件规则更新边缘分布,扩展扩散模型控制到标准引导无法表达的应用,在 CIFAR-10 和 FFHQ 上显著降低 FID,并在 CelebA-HQ 上实现公平性控制。
改进反向扩散采样在分类器引导扩散模型中的低密度区域探索
发表机构 * University of Allahabad(阿拔斯大学)
AI总结 提出一种无需额外训练的采样时间密度感知方法,通过修改分类器梯度引导轨迹朝向低置信区域并引导采样朝向预测真实图像,以增强扩散模型对低密度区域的探索。
VideoMDM: 从2D监督走向3D人体运动生成
发表机构 * Technion(以色列理工学院) ; NVIDIA(英伟达)
AI总结 提出VideoMDM框架,利用单目视频的2D姿态通过扩散模型学习3D运动先验,使用深度加权的2D重投影损失近似3D监督,在HumanML3D上接近全3D监督性能。
Comments https://videomdm.github.io/
Hölder++:改进多模态VAE中的质量-一致性权衡
发表机构 * Hölder++: Improving the Quality-Coherence Trade-off in Multimodal VAEs Supplementary Material(Hölder++:多模态VAE中质量与一致性权衡的改进补充材料)
AI总结 针对多模态VAE生成质量与语义一致性之间的权衡问题,提出Hölder++,通过精确Hölder池化、扩展架构和层次推理,在提升一致性的同时保持生成质量。
Comments Accepted at ICML 2026. Camera-ready version
PolyFlow: 安全高效的多面体约束流匹配,具有约束嵌入和无投影更新
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出PolyFlow,一种将约束直接嵌入模型和流动力学的多面体约束流匹配框架,通过离散时间流公式和无投影架构消除离散化误差并严格满足任意多面体约束,在规划与控制任务中实现零约束违反并降低推理延迟。
Comments 30 pages, 12 figures, Accepted to ICML 2026
通过块验证加速推测性扩散
发表机构 * KTH(皇家理工学院) ; Google Research(谷歌研究) ; Google DeepMind(谷歌深Mind)
AI总结 提出一种针对扩散模型的推测性采样方案,通过块验证提高草稿接受率,无需训练的Free Drafter实现高达6.3%的加速。
A2D2: 任意长度离散扩散模型的自适应解码微调
发表机构 * Department of Computer and Information Science, University of Pennsylvania(宾夕法尼亚大学计算机与信息科学系) ; Department of Bioengineering, University of Pennsylvania(宾夕法尼亚大学生物工程系) ; School of Mathematics, Georgia Institute of Technology(佐治亚理工学院数学学院)
AI总结 提出A2D2框架,通过联合优化插入和去掩蔽策略及基于质量的推理调度,实现任意长度离散扩散模型的奖励引导微调,理论上保证收敛到奖励倾斜分布,实验提升奖励优化与生成灵活性和准确性。
扩散Transformer世界-动作模型用于自动驾驶场景预测
发表机构 * Stanford University(斯坦福大学)
AI总结 提出紧凑潜世界模型,结合扩散Transformer(DiT)预测未来场景,在nuScenes上实现4.8倍更好的KID,并实现动作可控性(转向ρ=0.81)。
Comments 10 pages, 9 figures, 2 tables
等变流匹配用于对称破缺分岔问题
发表机构 * Department of Mechanical Engineering, Eindhoven University of Technology(埃因霍温理工大学机械工程系) ; DIFFER – Dutch Institute for Fundamental Energy Research(荷兰基础能源研究所) ; Faculty of Civil Engineering, Department of Mechanics, Czech Technical University in Prague(布拉格捷克技术大学土木工程学院力学系) ; Department of Mathematics and Computer Science, Eindhoven University of Technology(埃因霍温理工大学数学与计算机科学系)
AI总结 针对非线性动力系统中对称破缺导致的多稳态共存问题,提出等变流匹配方法,结合等变架构与最优传输耦合机制,准确捕捉多模态分布和对称破缺分岔,优于非概率和变分方法。
Comments 9 pages, 7 figures including appendices. Accepted to Machine Learning and the Physical Sciences Workshop, NeurIPS 2025 (https://ml4physicalsciences.github.io/2025/). Repository with corresponding code: https://github.com/FHendriks11/bifurcationML/. Video explanation: https://www.youtube.com/watch?v=wsL3h17KtjY
度量辛条件流匹配用于耗散动力学
发表机构 * Rochester Institute of Technology, Rochester, NY, USA(罗切斯特理工学院) ; Automatic Control Laboratory, ETH Zürich, Switzerland(自动控制实验室)
AI总结 提出度量辛条件流匹配(MCFM)方法,通过将保守-耗散分解融入向量场和结构保持采样器,学习耗散动力学,保证能量单调递减和长期稳定性。
聚类聚合生成对抗网络 (CAG):一种基于聚类的混合模型用于电器模式生成
发表机构 * Department of Artificial Intelligence, School of Electronics Engineering, Kyungpook National University(人工智能系,电子工程学院,全北国立大学)
AI总结 针对现有生成方法忽略间歇性与连续电器行为差异导致训练不稳定和保真度有限的问题,提出CAG框架,通过聚类模块为间歇电器分配专用生成器,连续电器使用LSTM生成器,在UVIC数据集上优于基线方法。
Comments 18pages, 5Figues
分散自回归生成
发表机构 * Lancaster University(兰卡斯特大学)
AI总结 本文通过离散流匹配框架证明分散训练与集中训练在理论上等价,实验验证其在多模态基准上保持竞争力。
Hellinger多模态变分自编码器
发表机构 * Department of Computer Science, Saarland University(萨尔兰大学计算机科学系) ; MPI-SWS, Saarland Informatics Campus(萨尔兰信息学校区Max Planck研究所)
AI总结 提出基于Hellinger距离的矩匹配近似方法HELVAE,避免子采样,在多模态变分自编码器中实现更优的生成一致性与质量权衡。
Comments Accepted at AISTATS 2026. Camera-ready version
图上的广义薛定谔桥
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出GSBoG框架,通过似然优化学习图上可控连续时间马尔可夫链策略,满足端点边际分布并优化中间状态成本,实现可扩展的拓扑感知运输。
ASTER: 用于无监督时间序列异常检测的潜在伪异常生成
发表机构 * University of Montreal(蒙特利尔大学) ; Université de Montréal(蒙特利尔大学)
AI总结 提出ASTER框架,在潜在空间生成伪异常训练Transformer分类器,结合预训练LLM增强表示,在三个基准数据集上达到最优性能。
Comments Published in ICPR 2026
文本扩散模型的安全感知去噪器
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出安全感知去噪器(SAD),在文本扩散模型的迭代去噪过程中引导生成文本进入安全区域,无需重训练即可实现灵活的安全约束,有效降低不安全生成同时保持生成质量。
Comments 28 pages, 12 figures. Code available at: https://github.com/ParkLabML/SAD
基于神经受控微分方程的通用时间序列生成
发表机构 * Heidelberg Institute for Theoretical Studies(海德堡理论研究所) ; IAR, Karlsruhe Institute of Technology(卡尔斯鲁厄技术大学IAR部门) ; Max Planck Institute for Polymer Research(马克斯·普朗克聚合物研究所) ; IWR, Heidelberg University(海德堡大学IWR部门) ; Dept. of Computer Science, University of Toronto(多伦多大学计算机科学系) ; Mathematical Institute, University of Oxford(牛津大学数学研究所) ; Vector Institute, Toronto, Canada(多伦多向量研究所)
AI总结 本文证明结构化线性受控微分方程(SLiCEs)是通用时间序列生成器,并提出生成式SLiCEs(G-SLiCEs)用于路径空间上的流匹配,在概率预测和下流任务中表现优异,尤其适用于不规则网格。
计划,而非摆姿势:基于文本对齐的BFM的长复合运动生成
发表机构 * AvaCapo ; Potsdam University(波茨坦大学) ; Applied AI Institute(应用人工智能研究所) ; Computational Imaging Lab(计算成像实验室) ; AXXX ; Innopolis University(因诺波利斯大学)
AI总结 提出Text2BFM框架,通过将自然语言与预训练行为基础模型对齐,在潜在策略空间中实现长复合运动生成,无需端到端运动生成器。
通过傅里叶变换和Volterra级数重新审视神经过程
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文利用Volterra展开和集合傅里叶卷积,提出了两种新的条件神经过程模型,解决了现有平移等变神经过程在可解释性和计算效率上的局限性。
基于插入生成的变分学习
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出插入过程(IP)模型,通过排列变分推断联合学习插入位置、内容和终止条件,支持变长生成并提升非自回归序列建模质量。
即插即用图像恢复:随机去噪正则化
发表机构 * GitHub
AI总结 提出SNORE框架,仅在适当噪声水平图像上应用去噪器,结合随机正则化与梯度下降求解逆问题,在去模糊和修复任务上达到SOTA。
自适应生成矩匹配网络用于改进依赖结构学习
发表机构 * Department of Statistics and Actuarial Science, The University of Hong Kong(香港大学统计与精算科学系)
AI总结 提出自适应带宽选择的最大均值差异混合核用于生成矩匹配网络,通过增加核数量和早停策略提升训练性能,在copula随机数生成、高维收敛率及金融数据依赖建模中优于传统方法。
龟裂的魅力:一种变分-生成式绘画裂纹检测方法
发表机构 * Dept. of Mathematics, LMU Munich(数学系,慕尼黑大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; Helmholtz Imaging, Deutsches Elektronen-Synchrotron DESY(海德堡影像,德意志电子同步辐射光源) ; Fachbereich Mathematik, University of Hamburg(数学学院,汉堡大学) ; CIT School, Technical University of Munich(技术大学慕尼黑信息学院)
AI总结 提出混合方法,将裂纹检测建模为逆问题,用深度生成模型作为画作先验,结合Mumford-Shah变分泛函和裂纹先验,通过联合优化获得像素级裂纹定位图。
统一潜在空间解缠的VAE框架及鲁棒的解缠效果评估
发表机构 * Department of Applied and Computational Mathematics and Statistics(应用与计算数学与统计系) ; Lucy Family Institute for Data & Society(数据与社会学院)
AI总结 提出统一框架bfVAE整合多种解缠VAE方法,并开发FVH-LT和DBSR-LS评估解缠效果,引入LSSI指标量化潜在结构分离,无需真实生成因子。
两层线性自回归模型估计潜在状态
AI总结 本文证明两层线性自回归模型通过经验风险最小化训练时,能近似卡尔曼滤波,恢复潜在状态估计,并提供有限样本保证。
Comments ICML 2026
自适应加权平均
发表机构 * University of Utah(犹他大学) ; Boston University(波士顿大学) ; Google(谷歌)
AI总结 提出一种从单次无偏估计中选取最大未知值的方法,具有可容许性且不劣于基线,应用于随机优化获得在线到批次的转换界限。
LoRA-Muon:低秩流形上的谱最速下降
发表机构 * Ateneo de Manila University(雅典耀马尼拉大学) ; EleutherAI ; NaXys, UNamur(纳慕尔大学NaXys研究所)
AI总结 提出LoRA-Muon优化器,将Muon的谱最速下降规则应用于低秩微调,解决LoRA对初始化敏感、最优学习率跨秩迁移差等问题,在TinyShakespeare上以秩32达到比稠密基线更低的验证损失。
Comments 20 pages, 4 figures
虚假相关性去除是否总是可学习的?
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 研究不变学习在统计可识别时的计算障碍,证明存在一维不变子空间的可采样多环境实例,多项式时间算法无法达到常数精度,并量化环境多样性对可识别性和风险的影响。
Comments poster paper in ICML-2026
递归预测中的曝光偏差作为认知欠识别问题
发表机构 * University of Bristol(布里斯托大学)
AI总结 本文证明递归多步预测中的曝光偏差不仅是分布偏移,更是部分可观测性下的认知欠识别问题,并提出基于来源变量的误差分解与校正方法。
Comments Accepted for ICML 2026 EIML workshop
噪声下谱学习的极限
发表机构 * Joz̆ef Stefan Institute(约瑟夫·斯特凡研究所) ; Faculty of Mathematics and Physics, University of Ljubljana(卢布尔雅那大学数学与物理学院) ; Department of Chemical Engineering, Universitat Rovira i Virgili(罗维拉-威尔吉利大学化学工程系) ; Center for Computational Science and Applied Mathematics (ComSCIAM), Universitat Rovira i Virgili(罗维拉-威尔吉利大学计算科学与应用数学中心) ; ICREA(加泰罗尼亚研究与高等研究院)
AI总结 研究监督回归中加性标签噪声对谱方法的影响,推导出噪声导致系数漂移的闭合表达式,揭示了由单一内在噪声尺度控制的通用退化曲线。
规模买插值,结构买地平线:等变世界模型的认证可预测性
AI总结 针对等变潜在世界模型,提出可计算的多步可预测地平线认证,证明T步滚动误差在对称轨道上恒定,并由李雅普诺夫谱分层界定,且该认证为等变模型独有。
Comments 23 pages (9 main + appendices). Code: https://github.com/TimothyWang418/se3-ejepa
通过贝叶斯商进行损失转移迁移学习
发表机构 * Athena Research Center(雅典娜研究中心) ; Democritus University of Thrace(德谟克利特大学) ; International Hellenic University(国际希腊大学)
AI总结 本文研究数据分布固定但损失函数变化时的损失转移问题,利用贝叶斯商形式化损失的精炼顺序,证明粗损失的最小表示对严格更细的损失不足,并在有限输出对数损失下给出精确量化关系。
裁剪使分布式和联邦异步SGD对掉队者具有鲁棒性
发表机构 * KTH Royal Institute of Technology(瑞典皇家理工学院)
AI总结 本文理论证明梯度裁剪能消除异步SGD中最大延迟对复杂度的影响,基于次Weibull梯度噪声模型,首次实现异步优化的高概率收敛。
与模拟器学习:计算受限世界中的无悔学习
发表机构 * MIT(麻省理工学院) ; Microsoft Research(微软研究院)
AI总结 提出可模拟过程框架,利用模拟器近似任意复杂依赖的数据分布,恢复VC维误差界,并展示条件采样的统计与计算优势。
Comments To appear at COLT 2026
有限精度下学习Tanh神经网络的局限性
AI总结 基于有限精度计算和L^p精度保证,通过构造尖锐局部化bump函数,证明自适应随机算法在L^p范数下收敛速度不超过蒙特卡洛率O(m^{-1/p}),除非采样预算随网络参数和架构指数增长。
认知不确定性并非可约简的那种
发表机构 * University of Cambridge(剑桥大学)
AI总结 证明标准定义中认知不确定性为可被更多数据移除的部分,与互信息度量在扩展上不一致,并提出三部分分解:偶然、样本可约简认知和机制可约简认知不确定性。
AI增强计算的Token复杂度理论
AI总结 提出Token复杂度作为AI增强计算中查询与响应成本的形式化度量,建立AI-Oracle图灵机框架,证明单调性、凸性、价格敏感性和任务排序的价格相对性等基本定理。
Comments 25 pages, 1 figure
对数凹采样的统一复杂度界
发表机构 * University of Texas at Austin(得克萨斯大学奥斯汀分校)
AI总结 本文通过In-and-Out算法与指数提升,给出了从热启动采样任意对数凹分布的简单、统一且近乎紧的界,主要创新是提升了提升分布的Poincaré常数界。
Comments 5 pages
预测驱动的因果推断:自动去偏机器学习与半监督Riesz回归
发表机构 * University of Tokyo(东京大学)
AI总结 研究半监督设置下因果参数的半参数有效估计,通过结合去偏机器学习和半监督Riesz回归,提出DML-PPCI和TMLE-PPCI方法,实现比仅用标注数据更小的渐近方差。
三中多数是最优的
发表机构 * Department of Statistics, University of California, Berkeley(加州大学伯克利分校统计学系)
AI总结 本文通过简短证明,在可实现PAC学习框架下,三个独立一致分类器的多数投票是最优学习器,简化了投票学习器的算法结构和概率分析。
Comments 9 pages
随机梯度下降有效吗?机器学习过程的PDE视角
发表机构 * Departamento de Matemáticas, Universidad Autónoma de Madrid, ICMAT - Instituto de Ciencias Matemáticas, CSIC-UAM-UC3M-UCM(数学系,马德里自治大学,ICMAT数学科学研究所,CSIC-UAM-UC3M-UCM)
AI总结 通过Fokker-Planck型抛物PDE分析SGD行为,区分漂移和扩散两个阶段,量化浓度现象并证明平均退出时间界限,为非凸损失和退化扩散矩阵下的渐近收敛提供新结果。
GEMSS: 一种用于在分类和回归问题中发现多个稀疏解的变分贝叶斯方法
发表机构 * Faculty of Electrical Engineering, Czech Technical University(捷克技术大学电子工程系)
AI总结 提出GEMSS算法,利用结构化spike-and-slab先验、高斯混合近似后验和Jaccard惩罚,通过变分推断同时发现多个多样化的稀疏特征组合,在128个实验和3个真实数据集上优于对比方法。
结构化剪枝与非结构化剪枝:指数级差距
发表机构 * Department of Informatics, King’s College London(伦敦国王学院信息学院)
AI总结 研究随机初始化网络中剪枝的局限性,证明神经元剪枝需要指数级更大的网络规模才能达到与非结构化剪枝相同的近似精度。
通过几何可定义性实现策略PAC可学习性
发表机构 * Weizmann Institute of Science(魏茨曼研究院) ; University of Waterloo(滑铁卢大学) ; ETH Zurich(苏黎世联邦理工学院) ; University of Washington(华盛顿大学)
AI总结 研究个体通过成本修改特征影响分类器决策的策略学习问题,证明在简单情况下策略行为可使易学问题变为不可学,并引入几何可定义性假设以控制样本复杂度。
随机梯度下降分位数估计量的中心极限定理
发表机构 * Department of Statistics, University of Chicago(芝加哥大学统计系) ; Department of Statistics and Data Science, Washington University in St. Louis(圣路易斯华盛顿大学统计与数据科学系)
AI总结 本文针对常学习率SGD分位数估计,利用马尔可夫链理论证明其平稳分布随学习率趋于零时收敛到高斯分布,首次给出CLT型理论保证,并提出置信区间递归算法。
SGD预条件子的设计准则:局部条件数、噪声基底与盆地稳定性
发表机构 * Department of Mathematics, Emory University(埃默里大学数学系) ; Department of Mathematics, University of Minnesota Twin Cities(明尼苏达大学双城分校数学系) ; Department of Computer Science, University of Minnesota Twin Cities(明尼苏达大学双城分校计算机科学系) ; Department of Mathematics, University of Kentucky(肯塔基大学数学系)
AI总结 针对SGD在训练后期因各向异性曲率和梯度噪声导致的收敛缓慢问题,提出基于对称正定矩阵M的预条件SGD分析框架,推导收敛速率和噪声基底受M相关量控制的界,并给出非凸目标下的盆地稳定性保证,为科学机器学习提供设计准则。
Comments 31 pages, 11 Figures
从几何到动力学:基于几何约束从稀疏观测学习过阻尼朗之万动力学
发表机构 * Dimitra Maoutsa(迪米特拉·马乌茨)
AI总结 提出一种随机控制框架,利用系统不变密度的几何结构进行路径增强,从稀疏时间采样数据中恢复过阻尼朗之万动力学,无需参数模型假设。
Comments 10+54 pages, 14 figures; accepted at ICML 2026 An earlier account of this work has previously appeared in arXiv:2301.08102 and arXiv:2304.00423 ; main methodology remains the same, this version includes additional numerical experiments and theory
通过序贯蒙特卡洛实现高效随机优化
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对梯度难以计算的优化问题,提出用序贯蒙特卡洛(SMC)采样器替代昂贵的内采样循环,实现高效随机优化,并在能量模型奖励调优中验证有效性。
Comments Accepted to ICML 2026
黎曼流形上的镜像下降
发表机构 * School of Mathematical Sciences, Fudan University, Shanghai 200433, China(复旦大学数学学院,上海200433,中国) ; Shanghai Key Laboratory for Contemporary Applied Mathematics, Fudan University, Shanghai 200433, China(上海当代应用数学重点实验室,复旦大学,上海200433,中国)
AI总结 将镜像下降推广到黎曼流形,通过重参数化提出黎曼镜像下降(RMD)及其随机变体,并建立非渐近收敛保证,在Stiefel流形上退化为曲线梯度下降(CGD)。
DynamicPTQ: 通过残差流动态缓解激活量化崩溃
发表机构 * City University of Hong Kong(香港城市大学) ; Zhejiang University of Technology(浙江工业大学)
AI总结 提出DynamicPTQ,通过分析残差流中激活的相位式动态变化,识别量化敏感层并分配8位精度,在W4A4KV4量化下提升LLaMA-2/3的困惑度和零样本QA性能,吞吐量提升1.05-1.07倍。
使用加性码本的大语言模型多比特宽度量化
发表机构 * University of Toronto(多伦多大学)
AI总结 提出Drop-by-Drop框架,基于信息论和逐次细化理论,利用加性码本和Matryoshka监督实现单个模型在推理时支持多精度权重控制,降低存储开销并保持性能。
Comments 37 pages, 12 figures
MiniPIC: 少于100行代码的灵活位置无关缓存
发表机构 * IBM Research(IBM研究院)
AI总结 提出MiniPIC,通过无位置编码KV缓存和用户控制缓存重用原语,在vLLM中实现多种位置无关缓存方法,显著提升预填充吞吐量并降低首个令牌延迟。
Comments 13 pages, 5 figures
ReSET: 通过步骤感知温度缩放实现精确的延迟关键型NVFP4推理
发表机构 * Hanyang University(汉阳大学) ; Xenoscube Korean Inc.(Xenoscube韩国公司)
AI总结 针对大型推理模型在NVFP4低精度推理中精度下降和延迟问题,提出基于推理步骤熵的温度缩放方法ReSET,并设计CUDA小M核,在多个基准上提升精度约2点,解码速度提升2倍。
基于忆阻器的模拟计算在自动语音识别中的位置编码
发表机构 * Machine Learning and Human Language Technology Group, Faculty of Computer Science, RWTH Aachen University(亚琛工业大学计算机科学学院机器学习和人类语言技术组) ; Apptek GmbH(Apptek 有限公司)
AI总结 针对忆阻器模拟计算中位置编码导致模数转换精度下降的问题,通过调整ADC权重和精度位比例或移除编码相关线性变换,分别降低约50%和30%的性能损失。
Comments Accepted at Interspeech 2026
MemRefine: 基于LLM引导的压缩用于长期智能体记忆
发表机构 * Korea University(韩国大学) ; KAIST(韩国科学技术院)
AI总结 提出MemRefine框架,利用LLM判断事实内容,通过删除、合并和保留操作将记忆库压缩到固定预算内,在多个基准上保持下游性能并优于基于规则的基线。
GF-DiT:扩散Transformer服务的并行调度
AI总结 提出GF-DiT,一种策略可编程运行时,通过动态调整请求并行度来优化扩散Transformer服务,利用无组集合通信实现低开销在线重配置,显著提升吞吐量和降低延迟。
当更小胜出:面向边缘电池健康预测的液态神经网络双阶段蒸馏与帕累托引导压缩
发表机构 * Singapore Institute of Technology(新加坡科技学院) ; Institute of Materials Research and Engineering(材料研究与工程研究所) ; Agency for Science, Technology and Research(科技研究局) ; Institute of High Performance Computing(高性能计算研究所)
AI总结 提出DLNet框架,通过欧拉离散化、双阶段知识蒸馏和帕累托引导压缩,将高容量液态神经网络压缩为边缘可部署模型,在电池健康预测中实现小模型超越大模型。
Comments Accepted at International Conference on Pattern Recognition, ICPR 2026. Code available at: https://github.com/Dhivya-DD17/DLNet
Kareus:大型模型训练中动态与静态能量的联合降低
发表机构 * University of Michigan(密歇根大学)
AI总结 针对AI训练能耗高昂问题,提出Kareus系统,通过联合优化细粒度内核调度与频率缩放,协同降低动态和静态能耗,在相同训练时间下节能28.3%,或相同能耗下提速27.5%。
Comments OSDI '26 | Open-source at https://github.com/ml-energy/kareus
Prism: 通过GPU内存气球实现经济高效的多LLM服务
发表机构 * UCLA(加州大学洛杉矶分校) ; UC Berkeley(伯克利加州大学) ; Harvard University(哈佛大学) ; CMU(卡内基梅隆大学) ; University of Edinburgh(爱丁堡大学) ; Intel(英特尔) ; Stanford University(斯坦福大学) ; LMSYS(灵州市系统实验室) ; ByteDance(字节跳动) ; Alibaba Cloud(阿里云) ; Tsinghua University(清华大学) ; Novita AI ; Rice University(里士满大学)
AI总结 针对多LLM服务中资源效率低下的问题,提出基于内存气球的内存中心化LLM协同服务框架Prism,统一空间与时间共享,已在10K+ GPU生产环境部署。
Comments OSDI'26
Fed-FBD:用于隔离、隐私和精准遗忘的联邦功能块多样化
发表机构 * University of Wisconsin–Madison(威斯康星大学麦迪逊分校)
AI总结 提出Fed-FBD模块化联邦架构,将ResNet分解为六个功能块并维护颜色变体仓库,实现块级隔离、隐私设计和亚秒级精准遗忘,在多个数据集上以微小精度代价换取安全保障。
Comments 12 pages, 3 figures, 8 tables. Code: https://github.com/wchen-ai/functional-block-diversification
计算可处理的鲁棒差分隐私均值估计
AI总结 提出一种名为“气球均值”的新差分隐私均值估计器,通过扩展马氏距离球上的迭代裁剪实现计算可处理性、鲁棒性及零集中差分隐私,理论保证在重尾和污染椭圆模型下的统计性能与鲁棒性。
Comments 40 pages, 17 figures
SMSR:针对持久化LLM代理系统中运行时内存投毒的认证防御
AI总结 提出SMSR防御框架,通过写入时HMAC签名和查询时随机化内存消融与基于判决的多数投票,首次为多会话内存投毒攻击提供认证鲁棒性保证。
一种使用远程数据科学的隐私保护框架用于机构间学生保留率预测
AI总结 提出基于PySyft和半气隙架构的远程数据科学框架,实现三所大学在不直接访问敏感数据的情况下协作预测学生保留率,验证了隐私保护机器学习在教育场景的可行性。
Comments 7 pages, 2 figures. Accepted at the 2026 IEEE International Conference on Information Reuse and Integration (IEEE IRI 2026)
无监督联邦学习的一个可解模型
发表机构 * Institute for Cross-disciplinary Physics and Complex Systems IFISC (CSIC-UIB)(跨学科物理与复杂系统研究所(IFISC,CSIC-UIB)) ; Departamento de Física Teórica, Universidad Complutense de Madrid(马德里complutense大学理论物理系) ; Escuela Técnica Superior de Ingenieros Industriales, Universidad Politécnica de Madrid(马德里理工大学工业工程师学院) ; GISC - Grupo Interdisciplinar de Sistemas Complejos(跨学科复杂系统小组) ; Inria Saclay - Tau team(萨克利Inria团队) ; Department of Mathematics, University of Bologna(博洛尼亚大学数学系)
AI总结 提出一个理论框架,通过教师-多学生交互场景分析联邦学习,证明学生间交互能系统提升学习性能,并推导最优贝叶斯条件,映射到受限玻尔兹曼机。
FedBiCross: 医学图像上的个性化一次性联邦学习
发表机构 * School of Computer Science and Engineering, Northwestern Polytechnical University, China(西北工业大学计算机科学与工程学院) ; School of Science and Technology, Hong Kong Metropolitan University, Hong Kong(香港 Metropolitan 大学科学与技术学院) ; Department of Computer Science, Hong Kong Baptist University, Hong Kong(香港 Baptist 大学计算机科学系)
AI总结 提出FedBiCross框架,通过聚类、双层跨簇优化和个性化蒸馏解决非独立同分布数据下一次性联邦学习中知识蒸馏效果差的问题,在四个医学图像数据集上优于现有方法。
Comments Accepted by BlockSys 2026. This version of the contribution has been accepted for publication, after peer review (when applicable) but is not the Version of Record and does not reflect post-acceptance improvements, or any corrections
COSMOS:基于聚类服务器模型和伪标签通信的模型无关个性化联邦学习
发表机构 * Washington University in St. Louis(华盛顿大学圣路易斯分校)
AI总结 COSMOS通过伪标签通信实现服务器端个性化,利用客户端本地模型预测公共数据并聚类,训练集群特定模型并回传知识蒸馏,理论分析显示其能有效降低个性化风险,实验验证其在异构环境中优于现有基线方法。
ResidualPlanner+:一种用于边际查询及更广泛查询的可扩展矩阵机制
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学) ; Binghamton University(宾厄姆顿大学) ; Duke University(杜克大学) ; TikTok Inc.(抖音公司)
AI总结 提出两种可扩展的矩阵机制ResidualPlanner和ResidualPlanner+,分别优化边际查询的精度和支持更复杂的工作负载(如范围查询),在速度和内存上显著超越现有方法。
基于抽象精化的循环神经网络鲁棒性验证
发表机构 * National Science and Technology Council (NSTC), Taiwan(台湾国家科学与技术委员会)
AI总结 提出抽象精化框架,通过分割预激活区间消除非线性松弛误差,并利用SHAP引导的时间步选择策略降低组合成本,显著提升RNN鲁棒性验证成功率。
策略驱动的可信QoT估计的保形预测
发表机构 * Chalmers University of Technology(查尔姆斯理工大学) ; University of Applied Sciences and Arts of Southern Switzerland(瑞士南方应用科学与艺术大学)
AI总结 提出Conformal QoT框架,结合统计保证的QoT估计与操作决策策略,实现域偏移下可靠的光路可行性预测,在开放数据集上将准确率从92%提升至99.6%。
迈向可证明公平的机器学习:用于一致和透明预测的贝叶斯方法
发表机构 * University College Dublin(都柏林大学学院)
AI总结 提出公平贝叶斯分类器,通过强制确定性和统计一致性,在多个数据集上实现零一致性错误,同时保持准确性和多校准,解决少数群体因正则化导致的预测不一致问题。
规范性鲁棒性作为LLM中不可验证推理的前沿
发表机构 * DeepMind ; Institute of Philosophy, School of Advanced Study, University of London(伦敦大学高等研究院哲学研究所) ; Technische Universität Berlin(柏林工业大学)
AI总结 提出道德推理作为不可验证推理的典型子域,定义道德鲁棒性并引入可扩展的多轮对抗评估框架,发现模型会向用户偏好偏移推理(平均6.5%),且受顺序和轮次影响。
PolicyGuard:面向强化学习智能体的测试时和步级对抗防御
AI总结 提出PolicyGuard,一种基于高斯过程后验方差的测试时步级后门防御方法,通过自适应伪轨迹计算单步不确定性,在七种RL游戏中达到平均AUROC 0.856和0.859。
检测学习表示中的解释不充分性:表示警觉性框架
发表机构 * Laboratory of Bioengineering and Nanosciences (LBN), University of Montpellier(蒙彼利埃大学生物工程与纳米科学实验室) ; EuroMov Digital Health in Motion, University of Montpellier, IMT Mines Alès(蒙彼利埃大学EuroMov数字健康运动实验室,IMT阿莱斯矿业学院) ; Certified Sophrologist, Sensorimotor Practice(认证心理放松治疗师,感觉运动实践) ; Emeritus Professor, University of Montpellier(蒙彼利埃大学名誉教授)
AI总结 提出VER框架,通过识别持久残差结构来监测学习表示的充分性,补充传统评估方法。
Comments 22 pages, 1 figure. Conceptual framework for representation diagnostics in machine learning
理解奖励模型中的有用性与无害性张力
发表机构 * University of Copenhagen(哥本哈根大学)
AI总结 通过激活分析和消融实验,发现奖励模型中有用性和无害性目标存在干扰,共享神经元对模型行为影响不成比例,导致对齐张力。
Comments The source code used in this study is publicly available at: https://github.com/EshaanT/RM-alignment\_tension
分子扩散模型的不确定性估计
发表机构 * University of Amsterdam(阿姆斯特丹大学)
AI总结 提出一种事后方法,利用去噪网络的拉普拉斯近似估计预训练分子扩散模型中每个样本的不确定性,该分数与样本质量负相关,可用于过滤生成样本。
从参数到特征空间:模型合并中后门缓解的任务算术
AI总结 提出线性特征路径最小化(LFPM)框架,通过跨任务线性性在特征空间优化反后门任务向量,在模型合并中有效抑制后门且保持干净任务性能。
零源大语言模型幻觉检测:类人类标准探测
AI总结 提出HCPD范式,通过类人类标准探测机制模拟人类评估者的多面推理,结合奖励对齐和多样本聚合,实现零源条件下的有效可解释幻觉检测。
Comments Accepted at ICML 2026
图像扩散模型的高效、鲁棒且抗共谋指纹识别
发表机构 * University of Florence(佛罗伦萨大学) ; Shenzhen Campus of Sun Yat-sen University(中山大学深圳校区) ; College of Cyber Security, Jinan University(暨南大学网络空间安全学院) ; State Key Laboratory of Internet of Things for Smart City, University of Macau(澳门大学智慧城市物联网国家重点实验室) ; Department of Computer and Information Science, Faculty of Science and Technology, University of Macau(澳门大学科技学院计算机与信息科学系) ; University of Siena(锡耶纳大学)
AI总结 针对生成式文本到图像模型指纹识别缺乏抗共谋攻击鲁棒性的问题,提出基于个性化归一化模块的编码方法,并引入无损函数不变参数变换的抗共谋机制,实现高保真、高鲁棒且首次主动抵御共谋攻击的指纹识别。
基于骨架的人体动作识别中保质量不可察觉对抗攻击
发表机构 * Durham University(杜伦大学) ; Tsinghua University(清华大学) ; Beihang University(北京航空航天大学) ; Zhongguancun Laboratory(中关村实验室)
AI总结 针对骨架动作识别的对抗攻击常引入噪声扰动降低动作质量,本文提出一种基于分布的对抗攻击方法,通过最小化经验风险与真实风险的差距来保持动作质量,并设计新指标评估自然性,实验表明该方法在攻击成功率和动作质量上均优于现有方法。
鲁棒的状态条件特征加权跳跃模型用于时间聚类
AI总结 提出一种鲁棒的特征加权跳跃模型,通过Tukey双权损失函数实现鲁棒性,并引入状态特定特征权重,在模拟和实证中优于竞争方法。
ProtoX-AD:自解释的时间序列异常检测与特征描述
AI总结 提出ProtoX-AD框架,通过原型学习实现自监督时间序列异常检测的可解释性,在保持检测性能的同时提供语义一致的异常特征解释。
Comments 26 pages, 8 figures
S-GBT:针对NLP中词替换攻击的认证鲁棒性的平滑增长界张量
发表机构 * College of Computing, Mohammed VI Polytechnic University(穆罕默德六世理工大学计算机学院) ; ENSIAS, University Mohamed V of Rabat(拉巴特穆罕默德五世大学ENSIAS) ; CID Development
AI总结 提出二阶方法S-GBT,通过逐元素约束Hessian矩阵并加入正则化项,结合一阶和二阶正则化提升对词替换攻击的认证鲁棒性,在LSTM和CNN上验证,认证鲁棒准确率提升高达23.4%。
Comments The paper has been accepted at NETYS 2026 - 14th edition of the International Conference on Networked Systems
超越运行时强制:作为对抗网络可防御性分析的盾牌合成
发表机构 * Information and Computer Science Department, King Fahd University of Petroleum and Minerals(信息与计算机科学系,法赫德国王石油矿产大学)
AI总结 提出将盾牌合成重新解释为设计时分析工具,通过约束双人安全博弈生成可防御性判定,并融合拓扑度量和强化学习行为形成可防御性指纹,揭示系统安全的结构性见解。
Comments 26 pages, 7 figures, 7 tables. Under review at JAIR. Code: https://github.com/AchrafHsain7/Bastion
不可靠数据下的公平性审计有多可靠?
发表机构 * Purdue University(普渡大学)
AI总结 研究受保护标签缺失对公平性缓解审计的影响,提出种子校准压力测试区分缺失效应与随机波动,发现正可用性缺失通常不改变缓解方法效果,但无标签端点表现不同,且阈值优化可能将单轴公平性增益转化为交叉危害。
从自然提示中重建模板记忆的图像
发表机构 * School of Electrical & Computer Engineering(电气与计算机工程学院) ; School of Computer Science & AI(计算机科学与人工智能学院) ; Tel Aviv University(特拉维夫大学)
AI总结 提出一种低资源攻击方法,利用模板化电商数据中的模式,从自然提示中重建训练集中的记忆图像,揭示隐私风险。
一个令牌就能欺骗LLM裁判
发表机构 * Princeton University(普林斯顿大学) ; University of Virginia(弗吉尼亚大学) ; Tencent AI Lab(腾讯人工智能实验室) ; Rutgers University(罗格斯大学)
AI总结 发现基于参考的生成式奖励模型易受奖励黑客攻击,表面输入(如非词符号或通用推理开头)能持续引发假阳性奖励,提出使用截断模型输出作为对抗性负例的数据增强策略,构建鲁棒的Master奖励模型。
变分图神经网络用于反问题中的不确定性量化
发表机构 * Keysight-UZ Chair of the Spanish National Strategy on AI(西班牙人工智能国家战略主席席位) ; Aragon Institute of Engineering Research (I3A)(阿拉贡工程研究所(I3A)) ; Universidad de Zaragoza(萨拉戈塔大学) ; Laboratori de Càlcul Numèric (LaCàN)(数值计算实验室(LaCàN)) ; Universitat Politècnica de Catalunya - BarcelonaTech (UPC)(加泰罗尼亚理工大学 - 巴塞罗那科技大学(UPC)) ; Centre Internacional de Mètodes Numèrics en Enginyeria (CIMNE)(国际数值工程方法中心(CIMNE)) ; PIMM Lab. Arts et Métiers Institute of Technology(巴黎艺术与技术理工学院PIMM实验室)
AI总结 提出变分图神经网络(VGNN),通过在解码器引入变分层以较低成本量化认知和统计不确定性,在固体力学反问题中验证了高精度参数恢复与置信区间估计。
贝叶斯共形预测的最优时空解耦
AI总结 提出状态自适应贝叶斯共形预测(SA-BCP),通过门控凸组合平衡长期时间惯性与局部空间证据,实现分布漂移下的快速适应与稳定覆盖,并给出MSE最优阈值闭式解及在线选择过程的遗憾界。
深度学习的可能性预测不确定性
发表机构 * University of Cambridge(剑桥大学) ; National University of Singapore(新加坡国立大学) ; University of Warsaw(华沙大学)
AI总结 提出基于可能性理论的Dirichlet近似可能性后验预测(DAPPr)框架,通过投影-近似策略实现高效且原则性的认知不确定性量化,在多个基准上达到竞争性能。
Comments Accepted by ICML 2026, 20 pages
攻击第一原理:一种针对二元函数分类器的黑盒、无查询目标模仿攻击
发表机构 * LORIA(洛林信息与自动化研究院) ; University of Arizona(亚利桑那大学)
AI总结 本文提出Kelpie框架,首次在黑盒无查询环境下成功执行针对二元函数分类器的模仿攻击,展示了其在不同模型架构下的有效性,并通过实际案例验证了攻击的可行性,引发对现有机器学习二元函数分类器可靠性和安全性的质疑。
RLHF中奖励不确定性的统一视角
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; DeepMind(深度Mind)
AI总结 本文提出使用分布奖励模型统一RLHF中的悲观主义方法,通过闭式有效奖励公式连接现有启发式方法,并揭示其隐含假设。
批量校准的置信模糊集:样本外污染下的快速、可处理决策
发表机构 * University of Bristol(布里斯托大学) ; University of Cambridge(剑桥大学) ; University of California, Berkeley(加州大学伯克利分校) ; University of Oxford(牛津大学)
AI总结 提出批量校准置信模糊集,通过分离批量内污染和尾部贡献,得到闭式有限风险目标,转化为线性或二阶锥规划,实现高效鲁棒优化。
Comments Accepted for publication (spotlight) at ICML 2026
基于节点重构的零样本广义图异常检测框架
发表机构 * School of Computing, KAIST(韩国科学技术院计算机学院)
AI总结 提出AlignGAD框架,通过全局统一模块对齐异构特征、聚类模块捕获组级异常模式及节点差异评分模块聚合多视图异常证据,实现零样本跨域图异常检测。
使用图神经网络和自学习的节点属性网络聚类
发表机构 * Systems Engineering and Computer Science (PESC), Federal University of Rio de Janeiro (UFRJ)(里约热内卢联邦大学系统工程与计算机科学系)
AI总结 提出一种基于图神经网络和自学习的无监督图聚类框架,通过多轮自学习交替优化节点表示和聚类,利用上下文图提升性能,在合成和真实数据上表现优异。
理解图神经网络的截断位置编码
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 研究截断位置编码(如前k个特征空间或邻接矩阵幂)对图神经网络表达能力的影响,理论证明截断后多种位置编码的表达能力存在本质差异,且截断谱位置编码不再强于1-WL测试,实验表明混合截断编码优于单一类型。
Comments 28 pages, 4 figures, ICML 2026
面向一般有向图对比学习:双空间视角
发表机构 * National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出S2-DiGCL框架,从复数域和实数域双空间视角对有向图进行对比学习,通过磁拉普拉斯自适应调制和路径子图增强,在节点分类和链接预测任务上分别提升4.41%和4.34%。
因果不变性在有限样本设置中对领域适应有多大用处?
发表机构 * Department of Computer Science, ETH Zurich(苏黎世联邦理工学院计算机科学系) ; Causal Artificial Intelligence Lab, Columbia University(哥伦比亚大学因果人工智能实验室) ; Department of Statistics, Columbia University(哥伦比亚大学统计系)
AI总结 研究线性回归中因果不变性如何提升监督领域适应,通过候选预测器的目标风险边界和有限样本估计误差推导匹配上下界,证明当边界足够大时自适应聚合可避免负迁移。
稳定恢复流形:持续学习中可恢复性的几何原理
发表机构 * ResNet-18 ; Split CIFAR-100
AI总结 通过分析Split CIFAR-100上ResNet-18的顺序学习,发现遗忘知识在表示重组后仍可紧凑解码,提出稳定恢复流形假说,表明灾难性遗忘主要是可访问性和流形对齐问题。
Comments 9 pages, 8 figures, 8 tables
ECA:面向开放图像到文本生成的高效持续对齐
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出ECA方法,通过混合查询模块、Fisher动态扩展和字典重放,实现无需旧数据的持续对齐,缓解灾难性遗忘,提升开放图像到文本生成的增量学习性能。
Comments Accepted at the 43rd International Conference on Machine Learning (ICML 2026)
基于贝叶斯条件先验的多标签测试时自适应
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出贝叶斯条件先验估计(BCP),一种无梯度的测试时自适应方法,通过在线估计锚定条件先验注入标签依赖性,提升冻结视觉语言模型在多标签识别中的分布偏移鲁棒性。
Comments accepted by ICML2026
元学习变换器以改进上下文泛化
发表机构 * University of Trento, Italy(特伦托大学,意大利) ; Eindhoven University, Netherlands(埃因霍温大学,荷兰) ; University of Doha for Science and Technology, Qatar(多哈科学与技术大学,卡塔尔)
AI总结 提出利用多个小规模领域特定数据集训练上下文学习器,通过元学习提升跨领域泛化能力,并在持续学习和无监督场景下验证其鲁棒性。
层次化后继表示用于鲁棒迁移
发表机构 * University of Cambridge(剑桥大学) ; DeepMind(深度思维)
AI总结 提出层次化后继表示(HSR),通过时间抽象构建鲁棒的状态特征,结合非负矩阵分解实现稀疏低秩表示,支持多隔间环境下的高效任务迁移与探索。
在不完美代理下潜在偏移中鲁棒预测器的点识别
发表机构 * Department of Computer Science, Aalto University(阿尔托大学计算机科学系) ; Department of Computer Science, University of Helsinki(赫尔辛基大学计算机科学系) ; ELLIS Institute Finland(芬兰埃利斯研究所) ; Department of Computer Science, Manchester University(曼彻斯特大学计算机科学系)
AI总结 针对潜在混淆变量导致的域适应问题,提出基于潜在等价类的点识别方法,通过跨域秩条件替代强完备性假设,并设计主动学习框架PQAL实现鲁棒预测。
通过单变量Christoffel函数实现可扩展的异常检测
AI总结 针对Christoffel函数方法因矩阵大小随维度指数增长而难以应用于高维数据的问题,提出基于查询点与支撑点间平方距离的单变量Christoffel函数(UCF),在ADBench基准上平均精度优于14种基线方法。
跨越验证危机:交叉验证出人意料地有效降低基准测试方差
发表机构 * MIND Team, Université Paris-Saclay, Inria, CEA, Palaiseau, France(MIND团队,巴黎-萨克雷大学,法国国家信息与自动化研究所,法国原子能委员会,帕莱索,法国) ; SODA Team, Inria, Palaiseau, France(SODA团队,法国国家信息与自动化研究所,帕莱索,法国) ; Probabl
AI总结 本文提出交叉验证通过样本增益概念量化虚拟数据增强,显著提升算法性能评估的置信度与稳定性,并引入动态早停机制减少计算开销。
Comments 34 pages, 11 figures
地理空间多模态基础模型的新兴灵活设计
发表机构 * Oak Ridge National Laboratory(橡树岭国家实验室)
AI总结 本文系统比较了不同架构的地理空间基础模型,在统一设置下评估其灵活性与性能,为多模态推理提供设计指导。
NSL-KDD数据集不平衡数据条件下IDS的AutoML框架评估
发表机构 * Cybersecurity and Artificial Intelligence Laboratory (CS&I Lab), National Institute of Telecommunications (Inatel)(网络安全与人工智能实验室(CS&I Lab),国家电信研究所(Inatel)) ; Wireless and Artificial Intelligence Laboratory (WAI Lab), National Institute of Telecommunications (Inatel)(无线与人工智能实验室(WAI Lab),国家电信研究所(Inatel))
AI总结 研究NSL-KDD数据集上严重类别不平衡对多分类入侵检测中AutoML框架性能的影响,发现集成学习和不平衡感知优化可提升少数类检测能力,PyCaret表现最佳(macro-F1 66%)。
度量选择胜者:评估选择翻转未见化学空间中药物反应预测的模型排名
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本研究通过VCPI竞赛数据,发现药物反应预测模型排名随评估指标反转:简单基线在代理指标下胜出,但真实指标下深度模型显著优于线性指纹基线,首次在真实药物化学数据上验证了度量校准效应。
TEDD:不稳定时间特征的鲁棒检测
发表机构 * Feedzai
AI总结 提出TEDD方法,利用回归模型检测导致时间分布变化的特征,无需参数调优,可扩展,能检测数值和类别特征的单变量及多变量漂移。
Comments 8 pages, 9 figures
面向开放集射频指纹识别的分布外检测器
发表机构 * University of Michigan(密歇根大学)
AI总结 针对开放集射频指纹识别中未知发射机与时间漂移引起的分布偏移问题,引入基于信息论的OOD检测统一框架,并采用无需OOD调优数据的方法,在POWDER数据集上验证其性能接近有真实OOD数据的基线。
检测代码语言模型中的功能记忆
发表机构 * Meta ; Imperial College London(伦敦帝国学院)
AI总结 研究代码语言模型的功能记忆现象,通过反事实设置对比暴露目标代码的模型与未暴露的参考模型,使用文本和功能相似性度量,发现功能记忆超出文本重叠的检测范围。
图上的样本选择:用于无损训练加速的统一数据集剪枝框架
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出基于图的统一数据集剪枝框架,将数据集建模为加权图,通过最大权重团问题选择样本,并设计贪心算法,在多种剪枝比例下优于现有方法,实现ImageNet-1k上40%以上训练加速且不损失精度。
Comments ICML 2026
物理系统概率仿真的可靠性
发表机构 * The Alan Turing Institute(艾伦·图灵研究所) ; Autodesk Research(欧特克研究院) ; PhysicsX ; Orbital ; University of Sheffield(谢菲尔德大学) ; University College London(伦敦大学学院)
AI总结 比较生成模型与CRPS训练集成在物理系统概率仿真中的可靠性,发现CRPS集成在覆盖率和推理速度上更优。
权威、真实性与引文偏差:研究大语言模型认知易感性的大规模多领域基准
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出AuthorityBench基准,通过2x2因子设计隔离引文权威信号对LLM认知行为的影响,发现引文存在(无论真假)均提高幻觉率,真声明搭配假引文时幻觉率上升3-22个百分点。
Comments 10 pages, 5 figures. Accepted to AI4GOOD and EIML at ICML 2026
合成数据生成中的差异性影响
发表机构 * Univ. Lille, Inria, CNRS, Centrale Lille, UMR 9189 - CRIStAL(里尔大学、法国国家信息与自动化研究所、法国国家科学研究中心、中央里尔高等电力工程学院、计算机科学、信号与自动化研究实验室)
AI总结 本文重新审视合成数据生成中的差异性影响公平性概念,指出非差异性影响要求合成分布与真实分布一致,并分析SDG失败的原因(表达能力、抽样误差、差分隐私估计误差),提出分组学习策略以提升整体效用和公平性。
WHAR Arena: 基准测试高效可穿戴人体活动识别的最新进展
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; IPAI Foundation gGmbH(IPAI基金会有限责任公司)
AI总结 为解决可穿戴人体活动识别中的可比性危机,构建了包含30个数据集的大规模基准,评估17种架构,发现预测性能趋于饱和,而紧凑模型和随机森林在部署效率上构成帕累托前沿。
Comments 20 pages, 9 Figures, 3 Tables
导航安全-保真度权衡:通过概率场景进行电力系统的大规模多变量时间序列预测
发表机构 * ZJU-UIUC Institute, Zhejiang University(浙江大学伊利诺伊大学厄巴纳香槟校区联合学院)
AI总结 针对现有基准无法评估大规模多变量概率预测的安全性与保真度权衡问题,提出包含多达36,964个通道的电力系统基准PowerPhase和场景式分位数预测器PowerForge,在多个网格上取得最佳平均排名。
SupraBench: 超分子化学基准
发表机构 * University of Notre Dame(圣母大学) ; University of Connecticut(康涅狄格大学)
AI总结 为评估大语言模型在超分子化学推理中的能力,与领域专家合作发布了首个超分子基准SupraBench,包含四个基本任务和一个辅助视觉任务,并提供了16M令牌的语料库SupraPMC。
CRAFTIIF:用于多元时间序列异常检测的跨分辨率分析四类型可解释孤立森林
发表机构 * Avathon
AI总结 提出CRAFTIIF无监督框架,通过四种小波特征和五个孤立森林同时检测点、分布、时间和集体四类异常,在mTSBench基准上达到平均F1=0.228,VUS-PR比先前最佳提升40.7%。
Comments 14 pages, 4 figures, 2 appendices. Submitted to IEEE Transactions on Knowledge and Data Engineering (TKDE). Code: https://github.com/smitswil/craftiif
两个错误,没有正确:审计计算社会科学中LLM标注者的社会期望偏差
发表机构 * Varun Kotte
AI总结 研究审计了三个开源指令微调模型在TweetEval任务中的社会期望偏差,发现模型存在宽大、过度纠正和中性偏差,且提示干预无法纠正,聚合指标可能掩盖实质结论错误。
ToolSense: 审计LLM中参数化工具知识的诊断框架
发表机构 * SAP Labs(SAP实验室)
AI总结 提出ToolSense诊断框架,自动生成三类基准测试,揭示参数化工具检索中知识-检索分离现象,发现模型在模糊查询下性能显著下降。
购物推理基准:面向多轮对话购物助手的专家编写基准
发表机构 * Amazon(亚马逊)
AI总结 提出一个由零售专家编写的525个任务的多轮对话购物推理基准,包含10863个加权评分标准,评估9个模型显示通过率仅57-77%,多轮任务性能下降4-18分。
重新思考LLMs的心理测量评估:自我报告何时以及为何能预测行为
发表机构 * Caltech(加州理工学院) ; UIUC(伊利诺伊大学厄巴纳-香槟分校) ; University of Cambridge(剑桥大学)
AI总结 研究对比大五人格与计划行为理论,发现LLMs的自我报告-行为一致性存在选择性:在共享对话中TPB达到人类水平,跨对话仅对锚定于训练的行为保持一致性,且角色提示不能使行为对齐。
Comments Accepted as an Oral (Contributed Talk) at the ICML 2026 Workshop on Combining Theory and Benchmarks (CTB)
跨尺度科学挑战的AI智能体基准测试
发表机构 * Yale University(耶鲁大学) ; Broad Institute of MIT and Harvard(布罗德研究所) ; The Pennsylvania State University(宾夕法尼亚州立大学) ; Northeastern University(东北大学) ; Northwestern University(西北大学)
AI总结 提出SciAgentArena基准,含约200个交互式任务,评估AI智能体在真实科研场景中的能力,发现其在数据分析中有效,但在创新探索和开放问题上表现不均。
Comments 6 figures
MLUBench: 多模态大语言模型终身遗忘评估基准
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出MLUBench基准,评估多模态大模型在连续遗忘请求下的性能,发现现有方法存在累积退化,并揭示多模态对齐保持的挑战,提出LUMoE方法缓解退化。
Comments 36 pages, accepted to the ICML 2026
OpenMedQ:面向医学视觉语言模型的广泛开放预训练
发表机构 * Stanford University(斯坦福大学) ; Stanford University School of Medicine(斯坦福大学医学院) ; Ghent University(根特大学)
AI总结 提出OpenMedQ,在14个数据集(约335万样本)上预训练医学视觉语言模型,在PathVQA上BLEU-1达75.9,超越562B参数的Med-PaLM M,并在8个未见医学分类任务上取得最高平均macro-F1(0.757)。
Comments Medical Imaging with Deep Learning (MIDL) 2026, Short Paper Track
通过任务可交换性实现基于合成数据的有效推断
AI总结 提出任务可交换性条件,确保在科学研究中使用合成数据进行统计推断的有效性,并给出在民意调查和AI评估中的应用。
SkMTEB:斯洛伐克大规模文本嵌入基准与模型适配
发表机构 * Comenius University in Bratislava(布拉迪斯拉发夸美纽斯大学) ; Cisco Systems(思科系统) ; Technical University of Košice(科希策技术大学) ; Kempelen Institute of Intelligent Technologies(肯佩伦智能技术研究所)
AI总结 针对低资源西斯拉夫语斯洛伐克语,构建首个MTEB风格文本嵌入基准SkMTEB(含31个数据集、7类任务),并开发高效本地部署模型e5-sk-small/large,通过词汇裁剪与微调在参数减少62%下达到与商业API相当的竞争力。
Comments ACL 2026
Operadic一致性:LLM中组合推理失败的无标签信号
发表机构 * Incubilate ; University of Cambridge(剑桥大学) ; Allen Institute for Artificial Intelligence(艾伦人工智能研究所)
AI总结 提出Operadic一致性(OC)作为检测大语言模型组合推理失败的无标签信号,在四个多跳QA数据集上与准确率强相关(Pearson r≥0.86),优于自一致性等方法。
论 $\textit{RemOve-And-Retrain}$ 的陷阱:数据处理不等式视角
发表机构 * KAIST(韩国科学技术院)
AI总结 从信息论角度揭示ROAR基准的缺陷:数据无关的后处理可提升ROAR分数,导致对归因图信息量的误判,并发现模糊性偏差。
Comments Accepted at the 2026 ICML Workshop on Mechanistic Interpretability
面向表格数据的通用异常检测
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出OFA-TAD框架,通过多视图邻居距离表示和混合专家评分网络,实现跨领域表格异常检测的通用化,一次训练即可泛化到未见数据集。
Comments Accepted by ICML 2026
ShapeBench: 一种可扩展的基准和诊断套件,用于气动形状优化的标准化评估
发表机构 * Stanford University(斯坦福大学) ; Spinoza Labs(斯皮诺扎实验室)
AI总结 本文提出ShapeBench,一个开源的气动形状优化基准,提供统一的API,涵盖103个任务和八个形状类别,通过验证的代理模型和高保真CFD流程进行系统分析,展示了不同形状类别和问题形式中优化器排名的显著差异,强调了需要更通用方法的必要性。
PhysMetrics.Weather: 机器学习天气模型中物理一致性的评估框架
AI总结 提出PhysMetrics.Weather评估框架,通过守恒、谱和动力学三类指标量化MLWP模型的物理真实性,指导物理信息架构开发并评估其运行可靠性。
Comments Preprint
MoReBench:评估语言模型中的程序性和多元道德推理,超越结果
发表机构 * University of Washington(华盛顿大学) ; New York University(纽约大学) ; Scale AI ; Harvard University(哈佛大学) ; University of Michigan(密歇根大学) ; UNC Chapel Hill(北卡罗来纳大学教堂山分校) ; Center for AI Safety(人工智能安全中心) ; Stanford University(斯坦福大学) ; MIT(麻省理工学院) ; University of Oxford(牛津大学)
AI总结 提出MoReBench基准,包含1000个道德场景和超过2.3万条标准,用于评估语言模型在道德推理中的程序性推理能力,发现现有基准无法预测模型表现,且模型对特定道德框架存在偏好。
Comments 46 pages, 8 figures, 10 tables. Published in ICLR 2026. Accepted at CHAI workshop and SPP 2026 (non-archival)
多轮交互中的安全隐患:工具使用智能体的多轮安全风险基准与防御
发表机构 * Stanford University(斯坦福大学) ; UC Berkeley(加州大学伯克利分校)
AI总结 提出多轮工具使用安全基准MT-AgentRisk,发现多轮设置下攻击成功率平均增加16%,并设计无训练、与工具无关的自探索防御方法ToolShield,平均降低30%攻击成功率。
InnoEval:将研究思路评估视为基于知识的多视角推理问题
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出InnoEval框架,通过异构深度知识检索和多视角评审委员会,实现基于知识的多维度解耦评估,在点对点、成对和分组评估任务中优于基线方法。
Comments ICML 2026
CMI-RewardBench: 基于组合多模态指令评估音乐奖励模型
发表机构 * National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学) ; University of Cambridge(剑桥大学) ; University of Toronto(多伦多大学)
AI总结 针对音乐生成模型缺乏有效评估机制的问题,提出CMI-RewardBench基准,包含大规模偏好数据集和参数高效奖励模型,实现多模态指令下的音乐质量评估。
Comments Accepted by ICML 2026
范围缩小,威胁依旧:重新评估2026前沿模型队列上的LLM包幻觉
AI总结 本文重新评估了2026前沿模型队列上大型语言模型(LLM)的包幻觉现象,发现尽管幻觉率有所降低,但仍然存在威胁,识别出一组127个包名(109个在PyPI,18个在npm)被所有评估模型一致生成,构成一个跨模型的供应链攻击面,同时发现Python与JavaScript幻觉的不对称性以及DeepSeek V3.2和GPT-5.4-mini之间的高相似性。
Comments 13 pages, 3 figures, 4 tables. v2: incorporates coordinated-disclosure feedback from PyPI Security and Socket.dev; registrable attack surface refined to 53 names (41 PyPI, 12 npm). Headline rates unchanged. Replication of Spracklen et al. (USENIX Security 2025). Data and code: https://github.com/churik5/slopsquatting-replication-2026 and https://doi.org/10.5281/zenodo.19859120
MPMWorlds: 用于推断和外推物理动力学的物质点法模拟
发表机构 * Cornell University(康奈尔大学)
AI总结 通过构建2D物质点法(MPM)模拟数据集,研究从视频推断物理动力学并外推时间演化的能力,比较代码生成与视频扩散方法的优劣。
Comments 16 pages, 13 figures. Project page: https://zzigak.github.io/mpmworlds/
GENEB:为什么基因组模型难以比较
发表机构 * GitHub ; arXiv
AI总结 针对基因组基础模型评估碎片化的问题,提出GENEB基准,通过统一探测协议在100项任务上比较40个模型,揭示模型排名不稳定、规模收益有限等关键发现。
Comments change first page figure, fix model sizes, add more consistency
Agents' Last Exam
发表机构 * arXiv
AI总结 针对AI系统在专业领域缺乏经济性部署的问题,提出Agents' Last Exam (ALE)基准,通过250+专家协作构建覆盖13个行业集群55个子领域的1000+长期真实经济任务,当前最难层级平均通过率仅2.6%。
Comments Project website: https://agents-last-exam.org Code: https://github.com/rdi-berkeley/agents-last-exam
何时委托优于多数?一种基于委托的多样本LLM推理聚合器
发表机构 * MIT Media Lab(麻省理工学院媒体实验室)
AI总结 提出基于委托的聚合器PPV,利用样本的字母熵和推理几何信号,在MMLU-Pro上比多数投票高1.5个百分点,无需标签或训练。
Comments Preprint. 16 pages, 5 figures, 4 tables
基于机器学习的微观仿真从模拟交通冲突改进碰撞频率预测
AI总结 本文利用机器学习行为模型替代传统规则模型进行交通微观仿真,通过极端值理论分析模拟冲突预测碰撞频率,在英国利兹五个信号交叉口验证了ML模型无需地点校准即可提升预测准确性。
基于物理信息的神经网络用于化疗药代动力学:基准测试临床估计器并揭示参数可辨识性
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本研究将物理信息神经网络(PINN)应用于化疗药代动力学,在双室线性模型上匹配临床标准方法,在Michaelis-Menten扩展模型中揭示参数不可辨识性,并通过稀疏组织观测部分恢复可辨识性。
预测不等于归因:在基于图的神经营销组合模型中定位解码器旁路
发表机构 * University of California, Irvine(加州大学尔湾分校) ; AdsGency AI
AI总结 针对基于图的神经营销组合模型中预测精度高但归因失败的问题,提出DICE-MMM框架,通过限制解码器通信路径来诊断和定位归因旁路,实验表明低预测误差不能保证归因正确性。
基于可穿戴传感器数据的2型糖尿病个性化血糖评估:LLM驱动方法
发表机构 * Department of Information Systems and Cybersecurity, The University of Texas at San Antonio(德克萨斯大学圣安东尼奥分校信息系统与网络安全系) ; School of Engineering Medicine, Texas A&M University(德克萨斯农工大学工程医学院) ; Department of Family and Community Medicine, The University of Texas at San Antonio(德克萨斯大学圣安东尼奥分校家庭与社区医学系)
AI总结 提出GlyLLM框架,利用大语言模型整合可穿戴传感器数据和结构化元数据,实现个性化血糖动态建模,在血糖预测和糖尿病分类任务上分别比传统ML方法提升13.66%和13.08%。
Comments The 14th IEEE International Conference on Healthcare Informatics, 2026
物理信息神经网络与径向基函数求解含狄拉克δ源的偏微分方程
发表机构 * Department of Civil and Environmental Engineering, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校土木与环境工程系)
AI总结 针对含狄拉克δ项的偏微分方程,通过将物理信息神经网络解释为残差最小二乘法,利用弱形式直接处理δ项,并对比径向基函数展开方法,发现径向基函数-残差最小二乘法在输运问题中更稳定。
Comments 33 pages, 4 figures
可解释因子分解用于大规模金融市场决策智能:来自中国A股市场的证据
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出可解释机器学习流程,将截面股票收益预测分解为可审计因子贡献,使用XGBoost和TreeSHAP在中国A股市场验证,发现行为信号贡献58.2%预测归因。
从二元对话中的语音和交互动态预测认知负荷
发表机构 * Department of Computer Science, Colby College(科尔比学院计算机科学系)
AI总结 研究在自然协作对话中,通过语音和交互动态特征预测感知认知负荷,发现对话交互(如话轮转换)能有效预测时间压力、脑力工作等认知负荷维度。
Comments Accepted to Interspeech 2026
scLLM-DSC:基于LLM知识增强的跨模态深度结构聚类用于单细胞RNA测序
发表机构 * Computer Network Information Center, Chinese Academy of Sciences(中国科学院计算机网络信息中心) ; University of Chinese Academy of Sciences(中国科学院大学) ; Hangzhou Institute for Advanced Study, University of Chinese Academy of Sciences(中国科学院大学杭州高等研究院) ; School of Computing and Information Technology, Great Bay University(大湾区大学计算机科学与技术学院) ; School of Engineering, Westlake University(西湖大学工学院)
AI总结 提出scLLM-DSC框架,通过知识驱动语义视图与结构感知拓扑视图的跨模态对比对齐,利用LLM增强单细胞RNA测序数据的聚类性能,显著优于现有方法。
CausalMoE:基于模式路由异构专家的十亿规模多模态基础模型用于格兰杰因果发现
发表机构 * State Key Laboratory of General Artificial Intelligence, School of Intelligence Science and Technology, Peking University(北京大学智能科学与技术学院通用人工智能国家重点实验室) ; National Institute of Health Data Science, and Institute for Artificial Intelligence, Peking University(北京大学健康医疗大数据国家研究院、人工智能研究院)
AI总结 提出CausalMoE,一种十亿规模多模态格兰杰因果基础模型,通过模式路由混合异构专家解耦动态机制,结合因果自注意力与LLM/VLM先验,实现稀疏因果图恢复,在监督和少样本场景中达到最优。
一种面向新兴材料的绿色溶剂筛选工具:基于不确定性感知、Transformer增强的迁移学习
发表机构 * Technical University of Munich(慕尼黑工业大学) ; Institute of Structure of Matter – National Research Council Rome (ISM-CNR)(罗马国家研究委员会物质结构研究所) ; University of Rome "Tor Vergata"(罗马第二大学)
AI总结 提出一种结合预训练Transformer模型和不确定性量化的迁移学习方法,在极少数据下高精度预测溶解度参数,并开发了可定制的绿色溶剂筛选工具。
与你合作得更好:将用户修正编译为编码代理的运行时强制
发表机构 * University of Notre Dame(圣母大学) ; IBM Research(IBM研究院) ; Tencent AI Lab(腾讯AI实验室)
AI总结 提出TRACE方法,通过将用户修正编译为原子规则并在运行时强制执行,显著减少编码代理在后续任务中的偏好违反,优于纯记忆方法。
解码昆虫之歌:一种多任务半监督直翅目生物声学分类器
发表机构 * University of Oxford(牛津大学)
AI总结 提出PULSE半监督多任务框架,结合弱监督分类、自监督学习和知识蒸馏,在直翅目生物声学分类中优于通用模型,并通过主动学习进一步提升性能。
Comments ICML 2026 Workshop on Machine Learning for Audio
生成对抗还是非生成对抗:火星DEM上的分割分析
发表机构 * University of Passau(帕绍大学)
AI总结 使用监督语义分割和生成对抗方法自动检测火星上的土丘,并比较两种方法,发现添加人工生成数据并未改善结果。
Once-for-All: 基于均衡状态估计的可扩展同步预测
发表机构 * RMIT University(皇家墨尔本理工大学) ; Monash University(莫纳什大学) ; University of Adelaide(阿德莱德大学)
AI总结 提出均衡状态估计(ESE)范式,通过一次前向传播估计多系统均衡状态并基于状态差异生成预测,在保持精度的同时实现10-70倍加速,且具有线性时间复杂度和鲁棒性。
Comments Accepted by ICML 2026
基于离线模仿学习的海事异常检测中的稀有门控上下文调节
发表机构 * Department of Industrial Engineering, Ulsan National Institute of Science and Technology (UNIST)(蔚山科学技术院工业工程系)
AI总结 提出RGFiLM模块,通过稀有度门控调节上下文调制强度,解决上下文异常检测中稀有上下文导致的高误报问题,在海事轨迹异常检测中取得最佳F1-FPR权衡。
模拟量子异步事件驱动图神经网络
发表机构 * King’s Communications, Learning and Information Processing (KCLIP) lab(国王通讯、学习与信息处理(KCLIP)实验室) ; Centre for Intelligent Information Processing Systems (CIIPS)(智能信息处理系统中心) ; Department of Engineering(工程系) ; Pasqal SAS(Pasqal SAS公司) ; Institute for Intelligent Networked Systems (INSI)(智能网络化系统研究所) ; Northeastern University London(伦敦东北大学)
AI总结 提出模拟量子异步事件驱动图神经网络(QA-AEGNN),利用中性原子量子处理器映射事件数据为原子阵列,通过Rydberg哈密顿量模拟消息传递,实现高效事件图计算。
Comments 31 pages, 8 figures, initial version
面向入门编程教育的可解释AI助手:通过教师-AI协作提高反馈可靠性
发表机构 * North Carolina State University(北卡罗来纳州立大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出一种可解释AI驱动的课堂助手,通过分析学生代码、映射逻辑错误到教师识别的误解并提供教师撰写的反馈,提高入门编程课程中反馈的可靠性和可解释性。
Comments Full paper accepted to the 27th International Conference on AI in Education (AIED 2026)
通过关联规则和公平分箱审计抵押贷款中的歧视性模式
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校)
AI总结 研究标准分箱预处理是否放大抵押贷款中的种族/性别差异,使用HMDA数据构建三阶段流水线,发现公平分箱以公平代价29.4%实现,K-Means聚类揭示黑人申请者拒绝率显著更高。
Comments 10 pages, 4 figures, fairness-aware mortgage lending analysis using HMDA 2023 data. Project repository available at GitHub
分子通信中约束信道编码的掩码神经检测
发表机构 * Centre for neXt Communications (CXC), Department of Engineering, University of Cambridge(下一代通讯中心(CXC)、工程系、剑桥大学) ; Centre for neXt Communications (CXC), Department of Electrical and Electronics Engineering, Koç University(下一代通讯中心(CXC)、电子与电气工程系、科克大学)
AI总结 针对分子通信中的扩散记忆问题,提出掩码神经检测器,结合RLIM约束码与SBRNN,在多数情况下优于未编码检测,平均增益达10.36倍,并设计RLIM定制训练掩码进一步提升性能。
Comments 5 pages, 2 figures, 4 tables
保持特征的潜在EnKF用于含激波流动的数据同化
发表机构 * Department of Mechanical Engineering, Johns Hopkins University(约翰霍普金斯大学机械工程系)
AI总结 针对含激波流动中EnKF因多模态统计产生伪振荡的问题,提出在学习的低维潜在空间进行集合更新以保持激波特征,并通过共享解码器恢复物理状态,数值实验验证了无伪振荡的准确特征恢复。
量子储层计算在资源受限能源系统中的短期电力负荷预测
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 提出一种硬件高效的量子储层计算框架,通过固定量子储层和压缩经典读出层,在有限内存和硬件噪声下实现短期负荷预测,6位量化保留全精度性能并减少81.2%内存。
Comments 11 pages, 9 figures
OCOO-T: 一种用于转录扰动响应预测的简单可扩展虚拟细胞模型
AI总结 提出OCOO-T,一种基于流匹配的简约虚拟细胞模型,通过连续时间去噪和自适应层归一化,在多个基准上实现转录扰动预测的最优性能。
Comments 22 pages, 6 figures
MDForge:稀疏模拟器反馈下的智能分子动力学流水线设计
发表机构 * University of Notre Dame(圣母大学) ; University of Connecticut(康涅狄格大学)
AI总结 提出MDForge,利用LLM智能体通过多智能体辩论将稀疏奖励稠密化,自动设计分子动力学流水线,在SAMPL基准上达到专家水平,并发现新型高亲和力CB[7]结合剂。
基于EEG信号临界性的深度睡眠分类:一种用于改善睡眠神经反馈的被动BCI方法
AI总结 本研究利用去趋势波动分析(DFA)提取的临界性特征,通过朴素贝叶斯分类器实现了对深度睡眠(N3)的高精度识别(平衡准确率87.17%),为被动脑机接口中的状态依赖神经反馈提供了高效感知机制。
Comments 7 pages, 3 figures, accepted for publication in the Proceedings of the 10th Graz Brain-Computer Interface Conference 2026, Graz, Austria, September 14-17, 2026
学习增强的无关联机器调度近似算法
AI总结 针对无关联机器调度问题,提出学习增强算法,利用重作业分配预测实现精确预测时(1+ε)-近似,误差增大时退化为2-近似。
Comments 22 pages, 3 figures
一种可扩展且轻量级的统一架构用于像素合并图像传感器的去马赛克
发表机构 * Samsung Research Institute Bangalore(三星研究院班加罗尔分院)
AI总结 提出模块化统一架构,通过无学习CFA识别模块和轻量级设计,实现多种像素合并传感器的去马赛克,提升图像质量并降低资源消耗。
分层最优传输用于神经机器翻译和抽象摘要中的幻觉检测
发表机构 * Fairseq ; AggreFact
AI总结 通过最优传输分析跨注意力分布,发现幻觉检测集中于解码器前四层,且该方法在源脱离时有效,但无法检测注意力下游的不忠实摘要。
Comments Accepted to ICML Mechanistic Interpretability Workshop 2026
LLM作为调查员:基于证据优先的鲁棒交互式问题诊断
发表机构 * University of Calabria(卡拉布里亚大学) ; University of Cambridge(剑桥大学)
AI总结 提出证据优先的AI方法LLM-as-an-Investigator,通过估计问题歧义、生成假设、提问澄清并更新概率,避免过早接受用户假设,提升诊断准确性。
物理引导的时空学习用于从视频估计海岸波浪峰值周期
发表机构 * Namibia University of Science and Technology(纳米比亚科技大学) ; Indian Institute of Technology Indore(印度理工学院印多尔分校) ; Namdeb Diamond Corporation(纳米比亚钻石公司)
AI总结 提出物理引导的深度时空学习框架,结合自动区域检测、模拟到真实迁移学习和物理信息正则化,从海岸视频直接估计近岸波浪峰值周期,验证了基于Transformer和轻量级循环卷积架构的有效性。
MaskWAM:统一掩码提示与预测的世界-动作模型
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; Tencent Robotics X(腾讯机器人X实验室) ; Tsinghua University(清华大学)
AI总结 提出MaskWAM,通过统一掩码输入与预测的混合Transformer架构,解决世界-动作模型的空间瓶颈,提升策略泛化能力,在LIBERO等任务上显著优于基线。
骑行、追踪与恢复:一项关于可穿戴数字自我管理干预在退伍军人耐力骑行项目中的初步随机试验
发表机构 * Department of Industrial and Systems Engineering, Texas A&M University(工业与系统工程系,德克萨斯A&M大学) ; Texas A&M Health Telehealth Institute(德克萨斯A&M健康远程医疗研究所)
AI总结 本研究通过随机试验,评估可穿戴数字自我管理干预对退伍军人创伤后应激障碍(PTSD)高唤醒症状的稳定效果,发现干预组症状改善更持久,且机器学习检测精度与症状严重程度正相关。
云网络中根本原因分析的图因果推理
AI总结 提出基于图因果发现的云网络事故根本原因分析方法,通过时空分组和自动化本体降维,利用双变量Granger因果性和条件独立性检验构建因果图,并引入概率方法进行时间感知的根因评分。在35个生产事故中召回率85.7%,精确匹配率74.3%。
Comments 6 pages, 4 figures
NetCause:大规模网络中根因分析的反事实学习
AI总结 提出NetCause框架,将网络事件建模为图时间过程,通过反事实模拟排序候选根因,在31个专家标注事件上准确率提升16.1%。
Comments 9 pages, 6 figures
带有聚合置信信号的多智能体协议
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校)
AI总结 提出三种协议,通过转换原始置信信号并采用软投票或贝叶斯融合,为多智能体系统输出聚合置信度,在保持正确性的同时显著提升判别能力。
Comments 22 pages and 5 figures, 9 pages and 2 figures before the appendix
基于混合CNN-元胞自动机火灾模型的空中野火抑制规划
AI总结 提出结合混合神经-元胞自动机野火模型与梯度优化空中投放的框架,通过蒙特卡洛采样和空间相关扰动量化不确定性,案例验证可生成有效抑制方案。
Mana: 铰接工具的灵巧操作
发表机构 * UC Berkeley(加州大学伯克利分校) ; CMU(卡内基梅隆大学) ; Stanford University(斯坦福大学) ; Amazon FAR(亚马逊FAR)
AI总结 提出Mana框架,将灵巧操作重解释为动画问题,通过粗到细的流水线自动生成操作轨迹,实现铰接工具的零样本仿真到现实迁移。
Comments Project Page: https://zhaohengyin.github.io/mana
关于通过算子学习逼近同步发电机动态响应:迈向构建基于深度算子的电网模拟器的一步
发表机构 * Purdue University(普渡大学)
AI总结 提出基于算子学习的框架,利用DeepONet逼近同步发电机的动态响应,并设计递归模拟方案及残差DeepONet方案,结合数据聚合策略实现与电网交互的模拟。
LLM-ODDR:一种用于联合订单调度和司机重新定位的大语言模型框架
发表机构 * Thrust of Artificial Intelligence, The Hong Kong University of Science and Technology (Guangzhou)(人工智能前沿技术 thrust,香港科学与技术大学(广州)) ; Department of Aeronautical and Aviation Engineering, The Hong Kong Polytechnic University(航空与航空工程系,香港理工大学) ; Research Center for Low Altitude Economy, The Hong Kong Polytechnic University(低空经济研究中心,香港理工大学) ; Department of Computer Science and Engineering, The Hong Kong University of Science and Technology(计算机科学与工程系,香港科学与技术大学) ; Department of Civil and Environmental Engineering, The Hong Kong University of Science and Technology(土木与环境工程系,香港科学与技术大学)
AI总结 提出LLM-ODDR框架,利用大语言模型联合优化网约车订单调度与司机重新定位,通过多目标价值细化、公平感知调度和时空需求感知重定位提升效果、适应性和可解释性。
Comments Published in IEEE Transactions on Intelligent Transportation Systems (TITS)
用于大沼泽地水位预测的检索增强基础模型
发表机构 * Florida International University(佛罗里达国际大学) ; Everglades National Park(大沼泽地国家公园)
AI总结 针对大沼泽地水位预测,提出检索增强机制,利用统计相似性或互信息检索历史水文事件,提升预训练时序基础模型的长期预测性能,尤其在极端事件中效果显著。
PLaID++: 一种用于定向无机材料设计的偏好对齐语言模型
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 提出PLaID++,通过对称性感知的Wyckoff文本表示和温度缩放熵正则化,结合可验证奖励的强化学习,实现稳定、新颖且满足空间群属性的晶体生成,比先前方法效率提高约50%。
Comments Code available at https://github.com/andaero/PLaID, model weights at https://huggingface.co/HOPE-Lab-HMC/PLaID
用于预测慢性阻塞性肺疾病骨骼肌结果的几何与量子核方法
发表机构 * School of Computing Technologies, RMIT University(计算技术学院,拉筹纳斯大学) ; School of Health & Biomedical Sciences, STEM College, RMIT University(健康与生物医学科学学院,STEM学院,拉筹纳斯大学) ; Pattern Recognition Pty Ltd, Melbourne(模式识别有限公司,墨尔本) ; Data61, CSIRO(Data61,澳大利亚联邦科学与工业研究组织)
AI总结 提出一种核几何量子混合方法,通过再生核希尔伯特空间映射合成SPD参考、随机投影压缩和低维量子回归电路,在COPD动物队列中预测肌肉重量、质量和力量,肌肉重量RMSE比最佳经典方法低约1.8%。
Comments 24 pages, 2 figures
对比几何学习实现统一的结构与配体药物设计
发表机构 * DeepMind Ltd(DeepMind有限公司)
AI总结 提出对比几何模型ConGLUDe,统一结构与配体训练,实现虚拟筛选、靶标钓鱼和配体条件口袋预测,在多项基准测试中表现优异。
Comments Forty-Third International Conference on Machine Learning
基于机器学习的数据驱动湖泊水质时间序列缺失数据预测
发表机构 * Department of Computer Science, Colby College(科克学院计算机科学系)
AI总结 针对志愿者监测导致的湖泊数据缺失问题,采用多重插补和岭回归,在30个湖泊数据集上实现透明度预测,并量化了最小样本量和特征集,提出联合可行性函数以优化监测策略。
Comments 8 pages, 4 figures, 3 tables
可微热力学相平衡用于机器学习
发表机构 * RWTH Aachen University(亚琛工业大学) ; Process Systems Engineering (AVT.SVT)(过程系统工程) ; Forschungszentrum Jülich GmbH(吕根研究中心) ; Institute of Climate and Energy Systems ICE-1(气候与能源系统研究所) ; Energy Systems Engineering(能源系统工程) ; JARA-ENERGY
AI总结 提出DISCOMAX算法,通过可微相平衡计算结合离散枚举与掩码softmax,实现热力学一致性端到端学习,在二元液液平衡数据上优于现有方法。
Comments 45 pages, 27 figures, 5 tables
波的语法:通过神经符号VLM智能体实现可解释的多变量时间序列事件检测
发表机构 * AI Lab, SLB(SLB人工智能实验室) ; Télécom Paris, Institut Polytechnique de Paris, France(巴黎电信学院,巴黎高等理工学院,法国)
AI总结 提出语言引导的时间序列事件检测(TSED)任务,通过事件逻辑树(ELT)将文本描述转化为结构化时序逻辑,并构建神经符号VLM智能体SELA,实现零/少样本事件检测与可解释推理。
Comments 8 pages (main text), 28 pages total including appendix. 9 figures, 7 tables
AI赋能分析中的人类监督分配
发表机构 * Michael G. Foster School of Business, University of Washington(华盛顿大学迈克尔·G·福斯特商学院) ; Department of Management Science, School of Management, Fudan University(复旦大学管理学院管理科学系) ; Guanghua School of Management, Peking University(北京大学光华管理学院)
AI总结 针对AI预测可靠性异质且未知的问题,提出基于上置信界的在线学习策略,动态分配有限的人类验证预算,使终端效率损失随预算增长趋于零。
基于机器学习的两阶段图稀疏化方法用于旅行商问题
发表机构 * Centre for Data Science and Artificial Intelligence(数据科学与人工智能中心) ; School of Engineering and Computer Science(工程与计算机科学学院) ; Victoria University of Wellington(惠灵顿维多利亚大学)
AI总结 提出两阶段方法,先结合α-Nearest和POPMUSIC得到近完美召回率的候选图,再用轻量级分类器修剪单源边,在保持≥99.69%最优边的同时降低37%-47%密度。
真实噪声合成减少偏差并改善有监督机器学习的组织微结构估计
AI总结 针对扩散MRI中模拟与实测信号噪声不匹配导致的协变量偏移问题,提出真实噪声合成框架,通过引入Rician期望和有效后处理噪声方差,显著降低参数估计偏差并提高精度。
Comments * Shared first author
基于VQ-VAE和地震统计特征的时空地震危险性评估
AI总结 本文在先前基于XGBoost和地震统计特征的研究基础上,将预测从全区域扩展到局部区域,并引入基于VQ-VAE模型从二维地震图提取的新特征,提升了局部地震预测性能。
Comments Title updated from "Spatiotemporal Seismic Hazard Assessment Using VQ-VAE and Seismic Statistical Features" to "Using Seismic Statistical Features and VQ-VAE to Improve Spatiotemporal Seismicity Predictability" in v2 to better reflect the focus of the paper. The content is unchanged apart from the title and minor copyediting
AI4Land: 面向全球高分辨率土地利用重建的可扩展深度学习
发表机构 * Barcelona Supercomputing Center(巴塞罗那超级计算中心)
AI总结 提出AI4Land框架,采用U-Net两阶段方法,结合粗分辨率情景数据与静态地理特征,重建高分辨率年度土地利用与覆盖,减少陆地碳循环不确定性,支持气候模拟。
基于生成式人工智能的因果推断:以文本作为处理变量
发表机构 * Harvard University(哈佛大学) ; John F. Kennedy School of Government(约翰·F·肯尼迪政府学院)
AI总结 提出利用生成式AI(如大语言模型)生成处理变量并利用其内部表示进行因果效应估计,避免从数据中学习因果表示,提高估计准确性和效率。
基于Cosserat杆理论物理信息神经网络的软体连续机器人自适应模型预测控制
发表机构 * Institute of Mechatronic Systems, Leibniz University Hannover(机械系统研究所,汉诺威莱布尼茨大学) ; Department of Advanced Interdisciplinary Studies, The University of Tokyo(先进跨学科研究部,东京大学) ; Institute of Assembly Technology and Robotics, Leibniz University of Hannover(组装技术与机器人研究所,汉诺威莱布尼茨大学)
AI总结 提出一种基于域解耦物理信息神经网络(DD-PINN)的实时非线性模型预测控制框架,实现软体连续机器人的高精度动态控制,位置误差低于3 mm。
Comments Submitted to IEEE Transactions on Robotics, 20 pages, 14 figures
GetNetUPAM:生态信息嵌套交叉验证与噪声鲁棒注意力用于海洋生物声学监测
发表机构 * University of California, San Diego(加州大学圣地亚哥分校)
AI总结 提出GetNetUPAM框架,通过分层嵌套交叉验证保持生态异质性,并集成CBAM空间注意力的ARPA-N网络,在高噪声低信噪比条件下实现鲁棒泛化,在零训练区域将误报率降低约10倍。
Comments Resubmitted and under review as an anonymous submission to IEEETAI - We are allowed an archive submission. Final formatting is yet to be determined
固态合成预测机器学习模型的热力学评估
发表机构 * University of Minnesota(明尼苏达大学)
AI总结 评估了机器学习模型预测固态材料合成可行性的热力学一致性,发现模型普遍高估合成可能性,但部分分数与热力学启发式趋势一致。
地球科学基础模型:从感知到推理与发现
发表机构 * Department of Data Science and Artificial Intelligence, The Hong Kong Polytechnic University(数据科学与人工智能系,香港理工大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室)
AI总结 本文综述了地球科学基础模型,探讨了其从感知到多模态推理及科学发现的能力演进,并总结了其在大气、水圈、岩石圈等领域的广泛应用。
在行为驱动软件测试套件中挖掘子场景重构机会:ML分类器和LLM-判断基线
发表机构 * Independent Researcher(独立研究者;应用MBA(数据分析),德克萨斯韦斯利安大学) ; Applied MBA (Data Analytics), Texas Wesleyan University(独立研究者;计算机工程学士,国立科学与技术大学(NUST)) ; Independent Researcher(独立研究者;管理硕士,慕尼黑技术大学) ; B.E. Computer Engineering, National University of Sciences and Technology (NUST) ; Independent Researcher ; M.Sc. Management, Technical University of Munich
AI总结 本文通过ML分类器和LLM基线,识别行为驱动开发测试套件中可提取的子场景,量化其在公共BDD生态系统中的普及率。
Comments 31 pages, 10 figures, 6 tables, 56 references. v2: retitled; reference list fully corrected and verified; decision-threshold sensitivity analysis and imbalance-robust baseline metrics added; figures restyled. Reproduction package at https://github.com/amughalbscs16/cukereuse_subscenarios_release (Apache-2.0). Upstream cukereuse corpus at https://doi.org/10.5281/zenodo.19754359
更多上下文、更大模型还是道德知识?政治文本中施瓦茨价值观检测的系统研究
发表机构 * PRHLT Research Center, Universitat Politècnica de València, Spain(巴塞罗那理工大学研究中心,西班牙 Valencia理工大学) ; School of Science, Engineering and Design, Universidad Europea de Valencia, Spain(Valencia欧洲大学科学、工程与设计学院,西班牙) ; Valencian Graduate School and Research Network of Artificial Intelligence (ValgrAI)(瓦伦西亚人工智能研究生学院与研究网络(ValgrAI))
AI总结 本研究系统比较了上下文范围、检索增强道德知识和模型规模对政治文本中施瓦茨价值观检测的影响,发现全文档上下文和检索知识对监督编码器有效,但对零样本大语言模型帮助有限,且模型扩展不保证性能提升。
Comments Code: https://github.com/VictorMYeste/human-value-detection-context-rag, best model: https://huggingface.co/VictorYeste/value-context-rag-deberta-v3-base-doc-rag, 18 pages, 3 figures
基于深度学习的代数雷诺应力闭合模型用于湍流RANS模拟
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; Aerospace and Mechanical Engineering, University of Notre Dame(诺特丹大学航空航天与机械工程系)
AI总结 提出一种物理驱动的深度学习闭合模型DARSM,通过神经网络映射流动不变量到隐式代数雷诺应力方程中的经验参数,并结合伴随方程实现端到端优化,在方形管道和周期性山丘基准测试中平均速度误差降低2-4倍。
一次凌星足矣:通过EXOVEIL学习恒星行为检测系外行星
发表机构 * SRH Hochschule(SRH 高校)
AI总结 提出EXOVEIL系统,利用Transformer世界模型和自监督学习从原始光变曲线中检测单次凌星事件,在Kepler数据上实现高召回率,并零样本迁移至TESS和PLATO任务。
Comments v3: appendix gallery of confirmed-planet recoveries added; Section 6 candidate catalogue reframed as transit-like anomalies for follow-up; TLS comparison table expanded
MinhwaNet: 韩国民俗画中忠实但不足的对象定位
发表机构 * Korea Advanced Institute of Science and Technology (KAIST)(韩国科学技术院)
AI总结 提出MinhwaNet,通过部分级检测器生成对象证据图,发现韩国民俗画中符号列表不足以预测画作类型,而符号布局更重要,揭示了忠实但不足的解离现象。
一种改进的生成对抗网络用于微电阻率成像测井恢复
AI总结 提出基于改进GAN的成像测井图像恢复方法,通过FCN生成网络、深度可分离卷积残差块、Inception模块及多尺度特征提取与空间注意力机制,结合全局与局部判别网络,有效恢复缺失区域,结构相似性达0.903。
Comments Mistakes in citations and references. Further we want to submit in conference with improved experiments and results
物理约束集成高斯过程建模用于具有异方差噪声的昂贵量子系统
AI总结 提出物理约束集成高斯过程框架,通过加权惩罚和数值积分集成多个GP代理,高效建模含异方差噪声的量子系统,在Bose-Hubbard模型和纳米孔硅酸盐量子液体模拟中实现更准确且物理合理的预测。
Comments 14 pages, 6 figures in main text, 2 figures in Supp materials
AI寒冬的数学:AI中范式脆弱性的数学分类
发表机构 * AIFI ; Staq.io
AI总结 本文提出AI寒冬的数学解释,通过感知机不可能性、神经网络训练复杂度、高维非参数估计率、梯度消失和统计学习理论等数学瓶颈,分析早期AI范式失败的原因,并关联后续突破。
Comments 33 pages, 1 figure
从AGI到ASI
发表机构 * Google DeepMind(谷歌深度思维) ; University of Waterloo(滑铁卢大学) ; Australian National University(澳大利亚国立大学) ; University College London(伦敦大学学院)
AI总结 探讨从人类级通用人工智能到超级智能的转变路径,包括扩展、范式转变、递归改进和多智能体涌现,并分析摩擦与瓶颈。
更聪明的破坏者,更好的修复者:线性多智能体工作流中的规模与安全性
AI总结 研究模型规模对线性多智能体工作流安全性的影响,发现大模型更易执行恶意指令,但轻量级修复阶段可恢复性能,表明线性结构在适当校正下具有鲁棒性。
Comments 16 pages (4 are main text), 2 figures, 6 tables. Accepted to the AIWILD Workshop at ICML 2026
量子信息机器学习预测混沌的实用量子优势基础
发表机构 * Centre for Computational Science, University College London(大学学院伦敦计算科学中心) ; Leibniz Supercomputing Centre of the Bavarian Academy of Sciences and Humanities(巴伐利亚科学院和人文科学莱比锡超算中心) ; Centre for Advanced Research Computing, University College London(大学学院伦敦先进研究计算中心)
AI总结 提出基于高阶量子统计先验的量子优势机制,通过两阶段优势(表示与提取)证明量子-经典复制测量复杂度分离,并在湍流和天气预报中验证。
利用空间光子伊辛机实现平衡传播的光学实现
发表机构 * Laboratoire d’Information Quantique, Université Libre de Bruxelles (ULB)(量子信息实验室,布鲁塞尔自由大学) ; Dipartimento di Fisica, Sapienza Università di Roma(物理学系,萨皮恩扎罗马大学)
AI总结 提出利用空间光子伊辛机光学实现平衡传播,通过规范变换方法编码神经元状态和可训练模式,在Wine和MNIST数据集上验证了能效物理实现的可行性。
ExPLAIND:统一模型、数据和训练归因以研究模型行为
发表机构 * University of Michigan(密歇根大学)
AI总结 提出ExPLAIND框架,统一归因于模型组件、数据和训练轨迹,支持跨粒度解释,通过梯度路径核和AdamW核机器推导参数级和步骤级影响分数,验证了Transformer的Grokking和EuroLLM预训练中的两阶段动态。
Comments published at ICML 2026, code at https://github.com/mainlp/explaind
解码多模态迷宫:多模态注意力模型中可解释性采纳的系统综述
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文系统综述了2020年至2024年初多模态模型可解释性研究,发现多数工作集中于视觉-语言和纯语言模型,注意力机制是主要解释方法,但评估缺乏系统性和鲁棒性,并提出了改进建议。
Urysohn机器:一种度量-拓扑计算模型
发表机构 * University at Albany, State University of New York(纽约州立大学阿尔巴尼分校)
AI总结 提出Urysohn机器,一种基于度量分离、前沿结构和收缩的分类计算模型,通过Urysohn三元组和分层构造实现分类复杂度度量与可重用推理。
从孤立到纠缠:可解释性方法何时识别和解缠已知概念?
发表机构 * Boston University(波士顿大学) ; Harvard University(哈佛大学) ; Mila – Quebec AI Institute(魁北克AI研究所) ; Goodfire(Goodfire公司)
AI总结 本文提出多概念评估框架,研究稀疏自编码器和探针等方法是否真正解缠概念,发现特征通常只对单一概念敏感,但概念分布在多个特征上,且干预特征常影响多个概念,表明相关性指标不足以证明干预选择性。
Comments ACL 2026
训练利润最优大语言模型的理论
发表机构 * Boston University(波士顿大学) ; Allen Institute for AI(人工智能研究院)
AI总结 本文提出一个经济模型,结合扩展定律与微观经济学理论,分析大语言模型训练的利润最大化问题,探讨模型规模与训练成本的关系及对利润的影响。
Comments Minor edits for preprint
大型语言模型中层级情感组织的涌现
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学) ; University of Washington(华盛顿大学) ; University of Tokyo(东京大学)
AI总结 受情感轮理论启发,分析大型语言模型输出中情感状态间的概率依赖关系,发现模型自然形成与人类心理模型一致的层级情感树,且更大模型发展出更复杂的层级结构,同时揭示社会经济角色在情感识别中的系统性偏差。
Comments ICML 2026
解析句法:语言建模与语法的子结构
发表机构 * Massachusetts Institute of Technology(麻省理工学院)
AI总结 本文研究语言模型在上下文无关语法子结构上的学习行为,证明损失函数在顶层子语法上线性递归,并发现参数化模型并行学习子语法,子语法预训练能提升小模型性能并改善内部表征。
Comments Equal contribution by LYS and DM. Accepted to the 43rd International Conference on Machine Learning (ICML 2026)
SPLIT:通过潜在算术分离物理接触以实现基于图像的触觉传感器
发表机构 * Leibniz Universität Hannover, L3S Research Center(莱布尼茨汉诺威大学,L3S研究所)
AI总结 本文提出SPLIT方法,通过潜在空间算术分离接触几何与传感器光学特性,实现触觉传感器的高效模拟,支持多传感器迁移和双向模拟,提升机器人触觉感知研究效率。
Comments Accepted to Elsevier Robotics and Autonomous Systems Journal
基于功率侧信道数据的全自主Z分数TinyML异常检测
AI总结 本文提出一种在低功耗微控制器上实现的全自主TinyML Z分数异常检测系统,利用功率侧信道数据实时监控设备行为,无需外部计算或连接,实现高效嵌入式部署。
Comments SaTC 2026 Conference
基于K均值的TinyML异常检测与通过分布式物联网学习(DIoL)的分布式模型重用
AI总结 本文提出了一种轻量级K均值异常检测模型和适用于资源受限微控制器的分布式模型共享流程。通过实际电源测量数据,在设备上进行特征提取、聚类和阈值估计以识别异常行为。DIoL框架允许在一台MCU上训练的模型导出为可移植的文本表示并在其他设备上直接重用,实验验证了该方法的可行性。
Comments SaTC 2026 Conference
PI-Mamba:通过谱初始化流匹配实现线性时间的蛋白质主链生成
发表机构 * Center for Biophysics and Quantitative Biology, University of Illinois Urbana-Champaign(生物物理与定量生物学中心,伊利诺伊大学厄巴纳-香槟分校) ; School of Information Science, University of Illinois Urbana-Champaign(信息科学学院,伊利诺伊大学厄巴纳-香槟分校)
AI总结 PI-Mamba通过谱初始化和流匹配框架,在保证局部共价几何精确性的同时实现线性时间推断,实现了主链生成的高效与高保真。
P-MOSS:利用下一个令牌预测在NUMA服务器上调度主内存索引
发表机构 * Purdue University West Lafayette, IN, USA(普渡大学西拉法叶分校)
AI总结 P-MOSS通过学习空间调度框架,在NUMA服务器上调度查询执行到特定逻辑核心并 colocate 数据,利用大语言模型原理提升性能,实验表明其查询吞吐量提升达6倍。
Comments Accepted to SIGMOD'26
利用可微分模拟器从等离子体相空间数据学习碰撞算子
发表机构 * GoLP/Instituto de Plasmas e Fusão Nuclear, Instituto Superior Técnico, Universidade de Lisboa(GoLP/等离子体与核融合研究所,理工学院,里斯本大学) ; Mani L. Bhaumik Institute for Theoretical Physics, University of California, Los Angeles(马尼·L·巴乌米克理论物理研究所,加州大学洛杉矶分校) ; The Rudolf Peierls Centre for Theoretical Physics, University of Oxford(鲁道夫·皮埃尔尔斯理论物理中心,牛津大学) ; Department of Physics and Astronomy University of California, Los Angeles(物理与天文学系,加州大学洛杉矶分校)
AI总结 提出一种结合可微分Fokker-Planck求解器与梯度优化方法,从等离子体相空间数据推断碰撞算子的方法,并在二维PIC模拟数据上验证其准确性和计算效率。
Comments accepted for publication in Journal of Plasma Physics, code available at https://github.com/diogodcarvalho/ml-pic-collision-operators
解析斑马鱼幼体捕食行为的深度强化学习训练RNN代理
发表机构 * California Institute of Technology(加州理工学院) ; Harvard University(哈佛大学)
AI总结 本文通过深度强化学习训练RNN代理,研究斑马鱼幼体捕食行为,揭示生态和能量约束如何影响适应性行为,发现简单模型能复现真实捕食行为,并通过虚拟实验验证约束和环境对捕食动态的影响。
基于模型架构和训练环境的深度学习能耗估算
发表机构 * Universitat Politècnica de Catalunya(巴塞罗那理工大学) ; Tecnológico de Delft(代尔夫特理工大学)
AI总结 研究通过分析模型架构与训练环境对能耗的影响,提出STEP和PRE方法,显著提升能耗估算准确性,减少训练能耗达80.68%。
Comments 48 pages, 10 figures, under review in Computer Standards & Interfaces journal. This work is an extension of arXiv:2307.05520v3 [cs.LG]
深度学习在几何问题求解中的应用综述
发表机构 * Renmin University of China(中国人民大学)
AI总结 本文综述了深度学习在几何问题求解中的应用,涵盖相关任务、方法、评估指标及未来方向,旨在提供实践参考以推动该领域发展。
Comments ACL 2026 Main Conference
使用非二进制输入向量同步树奇偶机
发表机构 * AGH University of Science and Technology(波兰格但尼克技术大学)
AI总结 本文提出利用范围更广的非二进制输入向量改进树奇偶机的同步过程,从而减少同步时间并提升神经密码学的安全性。
Comments This work has been submitted to the IEEE for possible publication
基于动态可用性的上下文选择性促进终身持续学习
发表机构 * Department of Life Sciences, Department of Computer Sciences(生命科学系、计算机科学系)
AI总结 本文提出基于上下文选择性和动态可用性的元可塑性规则,通过模拟验证该模型在图像识别和自然语言处理任务中优于现有持续学习算法。
full-FORCE:一种基于目标的训练循环网络方法
发表机构 * Department of Neuroscience(神经科学系) ; Zuckerman Institute(Zuckerman研究所) ; Columbia University(哥伦比亚大学) ; Department of Physiology and Cellular Biophysics(生理学与细胞生物物理学系) ; Columbia University College of Physicians and Surgeons(哥伦比亚大学医学与外科学院) ; Princeton Neuroscience Institute(普林斯顿神经科学研究所) ; Lewis-Sigler Institute for Integrative Genomics(整合基因组学研究所)
AI总结 本文提出一种基于目标的循环网络训练方法,通过引入第二网络提供目标动态,实现更高效的任务处理,具有更少的神经元和更高的噪声鲁棒性。
Comments 20 pages, 8 figures