Can Editing 1 Neuron Fix Repetition Loops in LLMs?
编辑1个神经元能修复LLM中的重复循环吗?
发表机构 * Edgerunner AI
AI总结 本文发现Gemma 4模型在长事实列举任务中高达95%的概率陷入重复循环,通过逐层消融和逐神经元归因定位到少量MLP神经元,并用静态权重编辑(小至单个神经元符号反转)消除循环,但无法解决因知识缺失导致的“末日循环”。
编辑1个神经元能修复LLM中的重复循环吗?
发表机构 * Edgerunner AI
AI总结 本文发现Gemma 4模型在长事实列举任务中高达95%的概率陷入重复循环,通过逐层消融和逐神经元归因定位到少量MLP神经元,并用静态权重编辑(小至单个神经元符号反转)消除循环,但无法解决因知识缺失导致的“末日循环”。
D2H-AD:一种利用超维度计算进行高级异常检测的混合模型
发表机构 * Wright State University(莱特州立大学) ; Azad University(阿扎德大学) ; Stevens Institute of Technology(史蒂文斯理工学院) ; University of Jeddah(吉达大学)
AI总结 提出基于超维度计算的异常检测框架D2H-AD,通过距离相似性和密度感知编码统一表示,在多个基准数据集上优于现有方法,具有轻量、可解释和高效的特点。
形状约束的神经松弛变量
发表机构 * Imperial College London(伦敦帝国理工学院) ; University of St. Gallen(圣加仑大学)
AI总结 提出神经松弛变量方法,将约束强制执行转化为回归问题,通过联合学习辅助网络实现零违规,应用于单调性和凸性约束及金融波动曲面学习。
SuperThoughts: 叠加中的推理令牌
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; Microsoft Research(微软研究院) ; Independent(独立机构) ; Princeton University(普林斯顿大学) ; Rice University(莱斯大学)
AI总结 提出SuperThoughts方法,通过将连续CoT令牌对压缩为单一潜在表示并利用多令牌预测模块解码,在保持训练监督的同时将推理吞吐量翻倍,实现约20-30%的CoT长度缩减且精度损失极小。
SpikF-GO: 用于多元时间序列预测的尖峰傅里叶图算子
发表机构 * Data Science Group, University of Hildesheim(希尔德斯海姆大学数据科学组)
AI总结 针对现有SNN预测方法缺乏变量间依赖建模的问题,提出SpikF-GO,通过超变量图公式和尖峰驱动谱处理,结合可学习稀疏频率门和复数LIF门,在统一协议下达到SNN方法最佳平均排名,并降低能耗。
Comments 23 pages, 2 figures, 11 tables. Accepted for presentation at ECML PKDD 2026. Code: https://github.com/jafarbakhshaliyev/SpikF-GO
在应当稀疏处分解,在应当稠密处吸收
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 针对稀疏自编码器假设所有激活内容均可稀疏分解的缺陷,提出在标准SAE旁添加低秩线性瓶颈以吸收稠密成分,在Gemma-2-2B第12层上秩24瓶颈减少84%稠密潜变量,并揭示该成分是结构可识别、因果必要且被稀疏字典冗余编码的计算脚手架。
随机动力系统的嵌入潜转移算子深度谱学习
发表机构 * Graduate School of Information Science and Technology, The University of Osaka(大阪大学信息科学与技术研究生院) ; Center for Advanced Intelligence Project, RIKEN(理化学研究所先进智能项目中心)
AI总结 提出一种深度谱编码器方法,通过可学习的非线性特征映射定义马尔可夫潜状态,利用泛函典型相关分析和Galerkin投影估计转移与观测算子,实现贝叶斯滤波和Koopman谱分解,在噪声和部分可观测条件下表现稳定优越。
Comments Accepted at the 42nd Conference on Uncertainty in Artificial Intelligence (UAI 2026)
学习高覆盖判别性简约规则集
发表机构 * Indian Institute of Science(印度科学研究所) ; Compass
AI总结 提出CDPR方法,通过子模最大化算法学习高覆盖、判别性且简约的规则集,在保持高准确率的同时显著提升可解释性,覆盖率比次优算法提升2.5倍以上。
基于嵌入潜传递算子的序贯贝叶斯滤波的结构化噪声自适应
发表机构 * The University of Osaka(大阪大学) ; RIKEN Center for Advanced Intelligence Project (AIP)(理化学研究所革新智能综合研究中心(AIP))
AI总结 针对ELTO卡尔曼滤波器噪声模型无法适应非平稳过程的问题,提出结构化噪声参数化方法,结合最优时不变噪声学习与动态参数自适应,提升时变噪声环境下的状态估计性能。
Comments Accepted by TMLR
DIFF-ERO:一种面向过程挖掘的深度学习一致性感知损失函数
发表机构 * KU Leuven(鲁汶大学) ; The University of Melbourne(墨尔本大学) ; Information Systems Engineering Research Group (LIRIS), KU Leuven(鲁汶大学信息系统工程研究组(LIRIS))
AI总结 提出DIFF-ERO,一种可微的随机一致性损失函数,通过构建软边界的批次级随机转移矩阵,在训练中融入控制流信息,提升深度学习模型在过程数据上的结构预测性能。
Comments Accepted at the 24th International Conference on Business Process Management
层次化常微分方程:学习连续时间物理原型用于早期链路故障检测
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出层次化常微分方程聚类网络,利用神经ODE建模连续潜状态演化,解耦随机噪声与动态趋势,自适应确定原型数量,在不规则采样时间序列的早期链路故障检测中有效提取物理原型。
Comments International Conference on Machine Learning 2026
做我的导师:通过同伴反馈实现互惠LLM改进的在策略共蒸馏
发表机构 * KAIST(韩国科学技术院)
AI总结 提出在策略共蒸馏(OPCoD)方法,通过认知门控和反馈锚定实现两个不同领域强模型间的相互教学,达到帕累托改进。
LLM干预的低秩子空间分析
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出诊断框架,将行为建模为激活空间中的低秩子空间,发现干预一个行为会不对称地影响其他行为,效果与子空间重叠和决策子空间角度相关。
Comments Mechanistic Interpretability Workshop @ ICML 2026
EM-NeSy:神经符号学习的期望最大化
发表机构 * Department of Computer Science(计算机科学系) ; KU Leuven(根特大学)
AI总结 提出EM-NeSy框架,将概率神经符号学习视为期望最大化算法实例,通过概率推理计算符号后验,仅通过神经组件进行梯度更新,实现可扩展且高效的近似推理。
LLM隐藏状态中的代码正确性信号:生成前探测与修复几何
发表机构 * Independent researcher(独立研究员)
AI总结 本文通过残差化方法,发现Qwen3-4B-Instruct模型在生成前隐藏状态可线性解码代码正确性(AUC 0.931),但修复成功的方向性信号在控制上下文协变量后消失,揭示了方法学上的正负结果。
Comments 12 pages, 8 tables. Code, data, and analysis scripts available at https://github.com/CarloDiCicco/ReasoningLab
Transformer神经算子对更大领域的零样本泛化
发表机构 * CEREA, ENPC, EDF R&D, Institut Polytechnique de Paris(CEREA, ENPC, EDF研发部, 巴黎综合理工学院) ; SINCLAIR AI Laboratory(SINCLAIR人工智能实验室) ; EDF R&D(EDF研发部) ; CEA, DAM, DIF(法国原子能委员会, 军事应用局, 法兰西岛)
AI总结 提出一种在注意力对数计算中引入可分解局部性偏置的方法,结合旋转位置嵌入,使Transformer神经算子能零样本泛化到更大空间域,在PDE和3D工业流中验证有效性。
既非并行也非顺序:DiffusionGemma 实际如何提交令牌
发表机构 * Transformer Lab
AI总结 通过钩取DiffusionGemma 26B的采样器接受步骤,测量其解码顺序,发现解码既非并行也非块自回归,而是呈现部分从左到右的提交偏差,且块大小是测量尺度的伪影而非架构特性。
压缩计算(可能)不是叠加计算
发表机构 * Metamorphic ; Independent(独立研究者) ; UK AI Security Institute(英国人工智能安全研究所) ; Apollo Research
AI总结 通过分析压缩计算(CC)模型,发现其性能提升源于标签中的混合矩阵,而非真正的叠加计算,SNMF基线可复现其损失特征。
Comments Presented at the Mechanistic Interpretability Workshop at NeurIPS 2025
单纯形约束的稀疏装袋:集成学习中从均匀先验到稀疏后验的转变
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出SCSB框架,通过最小化袋外损失在概率单纯形上联合优化集成剪枝与校准,引入凹二次惩罚解决L1单纯形悖论,实现高达96%的压缩并提升校准性能。
Comments 6 pages, 3 tables
自适应核截断用于长形式推理
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出自适应核截断采样(ANTS),通过熵条件控制器动态调整截断宽度,在长文本生成中提升推理性能,在33B参数稀疏MoE模型上平均提升1.9-5.2分。
FAConformer:用于听觉注意解码的频率感知卷积Transformer
发表机构 * Hubei Key Laboratory of Brain-inspired Intelligent Systems, School of Artificial Intelligence and Automation, Huazhong University of Science and Technology(湖北脑启发智能系统重点实验室,人工智能与自动化学院,华中科技大学)
AI总结 提出FAConformer框架,通过频带特定编码和自适应跨频带交互,有效利用脑电图频域信息进行听觉注意解码,在公开数据集上超越现有最佳模型4.9%。
Comments 15 pages, 7 figures
GitOfThoughts: 版本控制的推理与可回放、差异比较和合并的智能体记忆
发表机构 * QpiAI
AI总结 提出GitOfThoughts框架,将智能体推理树存储为git仓库,实现推理的可回放、审计和合并;实验表明,对于新问题,任何记忆格式均不能可靠提升准确率,仅当检索案例与当前问题高度相似(>0.8)时才有显著提升,且收益来自答案检索而非方法迁移。
Comments 10 pages, 1 figure, 9 tables
DiffusionBlocks: 通过扩散解释进行分块神经网络训练
发表机构 * Sakana AI ; The University of Tokyo(东京大学)
AI总结 提出DiffusionBlocks框架,利用残差连接与动力系统的对应关系,将网络转换为去噪过程,通过分数匹配目标实现独立分块训练,在多种Transformer架构上达到与端到端训练相当的性能,同时降低内存需求。
Comments To appear at the 14th International Conference on Learning Representations (ICLR 2026). v4: Fixed typos in experimental details (Appendix E.4)
基于Shapley值的Kolmogorov-Arnold网络平移不变属性评分
发表机构 * GitHub
AI总结 提出ShapKAN框架,利用Shapley值归因实现平移不变的节点重要性评估,有效压缩KAN网络并保持其可解释性优势。
Comments 14 pages, 6 figures, 9 tables
LEPO:面向大语言模型的潜在推理策略优化
发表机构 * Tencent(腾讯) ; Zhejiang University(浙江大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 LEPO通过引入Gumbel-Softmax在大语言模型中实现可控的随机性,提升其探索能力与强化学习兼容性,通过直接在连续潜在表示上应用强化学习,显著优于现有方法。
无牺牲的引导:面向仅提示干预的引导向量的原则性训练
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出联合训练引导因子和方向的方法,消除后验因子选择;引入仅提示引导向量(PrOSV),仅干预少量提示词,在AxBench上优于传统全序列引导向量,并实现更好的通用模型效用与对抗鲁棒性权衡。
Comments 63 pages, 50 figures; accepted by ICML 2026
计划在哪里?通过轻量级机制干预定位语言模型中的潜在规划
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 通过押韵对句补全任务,使用线性探针和激活修补方法,研究语言模型在生成过程中是否形成并因果依赖未来约束的潜在规划,发现仅Gemma-3-27B模型存在因果依赖,并定位到五个注意力头。
Comments 13 pages, 20 figures, 3 tables. Accepted to Workshop on Mechanistic Interpretability @ ICML 2026
一种用于学习稳定二进制表示的复合激活函数
发表机构 * Department of Statistics(统计学系) ; Seoul National University(首尔国立大学) ; Department of Applied Mathematics(应用数学系) ; University of Twente(埃因霍温理工大学)
AI总结 本文提出HTAF复合激活函数,通过平滑近似Heaviside函数实现稳定训练,适用于Spiking神经网络等模型,并引入ICBMs模型实现可解释的图像处理。
Comments 32 pages
学习可变长度分词以生成推荐
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出VarLenRec框架,通过Popularity-Weighted Information Budget Allocation方法解决生成推荐中可变长度分词问题,提升推荐准确性和效率。
Comments 14 pages, 5 figures
精确线性注意力
发表机构 * GitHub
AI总结 本文提出精确线性注意力(ELA),通过利用核函数的精确分解性质,实现Transformer注意力的线性计算复杂度,消除近似误差。针对先前线性注意力的两个关键限制——梯度爆炸和token注意力稀释,提出核约束以确保非负性、判别性和几何可解释性。此外,本文还提出了三种工程创新,包括Hyper-Link结构、Memory Lobe模块和基于路由分数的MoE偏置机制,实验结果表明ELA在解码速度和KV缓存内存使用上分别达到全注意力的6倍和75%的减少,同时保持或优于训练性能。
Comments 9 pages, 19 figures, journal
OmniOPD:通过推测性验证实现无Logit的在线策略蒸馏
发表机构 * Meta AI
AI总结 提出OmniOPD框架,通过基于蒙特卡洛展开的块级语义相似度替代token级logit匹配,结合峰值熵调度器和贝叶斯先验,解决在线策略蒸馏中logit不可获取和信号脆弱问题,在数学任务上超越标准OPD达28.64%。
Comments 26 pages, 3 figures
大型语言模型中的多组件因果追踪
发表机构 * Rensselaer Polytechnic Institute(拉特拉姆技术学院) ; IBM Research(IBM研究院)
AI总结 本文提出一个统一框架,通过软干预和度量转换高效识别对目标性能指标最关键的多组件子集,优于现有基线方法。
Comments Accepted to ACL 2026 main conference
自适应振荡状态对齐用于时间序列预测
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出AOSNET框架,通过希尔伯特变换将固定模板匹配改为自适应振荡状态对齐,以处理实际时间序列中的非平稳振荡行为,在多个基准上达到先进或竞争性精度。
MP3:面向时空预测的多周期模式预训练
发表机构 * School of Computing and Artificial Intelligence, Southwest Jiaotong University(西南交通大学计算机与人工智能学院) ; Eindhoven University of Technology(埃因霍温理工大学)
AI总结 针对时空数据中短窗口输入导致的时间幻象问题,提出多周期模式预训练插件MP3,通过多周期时间建模、空间建模和跨周期因果交互,提升现有STGNN的预测性能。
密集监督,稀疏更新:论策略蒸馏的稀疏性与几何结构
发表机构 * School of Artificial Intelligence, Nanjing University(南京大学人工智能学院) ; National Key Laboratory for Novel Software Technology, Nanjing University(南京大学计算机软件新技术国家重点实验室) ; Amap, Alibaba Group(阿里巴巴集团高德地图)
AI总结 本文分析策略蒸馏(OPD)中参数更新的稀疏性和几何特性,发现更新稀疏且集中于小权重坐标,并验证了稀疏子网络的有效性。
Comments Code is available at https://github.com/SydCS/OPD-Param-Analysis
UniversalRAG: 在多样模态和粒度的语料库上实现检索增强生成
发表机构 * KAIST(韩国科学技术院)
AI总结 本文提出UniversalRAG,一种能够处理多种模态和粒度的检索增强生成框架,通过动态路由机制和多粒度组织,提升跨模态知识检索的有效性,实验表明其在多个模态基准上的优越性。
Comments ACL 2026. Project page : https://universalrag.github.io
Reward-SQL:通过逐步执行感知推理和过程监督奖励提升Text-to-SQL
发表机构 * Renmin University of China(中国人民大学) ; Tsinghua University(清华大学) ; Alibaba Cloud Computing(阿里云 computing)
AI总结 针对强化学习在Text-to-SQL中缺乏逐步执行感知推理和过程级奖励的问题,提出CoCTE框架和Reward-SQL方法,通过中间视图验证、结构化CTE及过程奖励模型,显著提升复杂查询的准确性和可解释性。
通过融合路由实现令牌级LLM协作
发表机构 * [cs.AI](计算机科学与人工智能)
AI总结 本文提出FusionRoute框架,通过轻量级路由器在解码步骤中选择最合适的专家并补充对数几率以优化下一个令牌分布,解决了单个通用模型在多个领域表现不佳的问题,同时在多个基准测试中优于其他方法。
Comments 25 pages
通过三阶SO(3)表示耦合的旋转不变球面水印
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对全景图像在任意3D旋转下水印鲁棒性不足的问题,提出利用三阶SO(3)表示耦合构造旋转不变的球面双谱,将水印嵌入高阶球谐系数并从不变标量中提取,实现理论保证的旋转不变性和高视觉保真度。
Comments ICML 2026
面向聊天机器人微调的直接偏好优化:一项实证研究
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文实证研究直接偏好优化(DPO)在聊天机器人微调中的应用,表明其简化训练流程、提升计算效率且性能有竞争力,但存在训练不稳定性。
Comments 7 pages, 3 figures, 1 table. All authors contributed equally
数字本身已携带其嵌入
发表机构 * Department of Mathematics, Korea University(高丽大学数学系)
AI总结 提出无训练嵌入方法AOE,同时保留数字的实数值与p-adic模签名,实现即插即用并在代数组合基准上首次达到完美精度。
Comments Presented at the MATH-AI Workshop at NeurIPS 2025
黎曼度量匹配:面向分布的可扩展几何建模
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出黎曼度量匹配框架,通过神经网络学习数据的黎曼几何,利用carré du champ算子的条件期望形式实现样本级训练和恒定成本推理,在精度相当或更优下速度提升400倍。
Comments ICML 2026 (Oral)
当语言表示交互时:LLM中的可分离性与跨语言效应
发表机构 * University of Oxford(牛津大学) ; Imperial College London(帝国理工学院) ; University of York(约克大学)
AI总结 通过因果几何分析,研究多语言LLM中语言表示的线性可分离性及跨语言结构依赖,发现语言概念在协方差调整内积下可分离,同语系语言呈现单纯形几何结构。
Comments Trustworthy AI for Good (AI4Good) Workshop @ ICML 2026
超越任务性能:用语音特征解码生物声学嵌入
发表机构 * Earth Species Project(地球物种项目)
AI总结 本研究通过线性与非线性回归探针,揭示生物声学预训练嵌入编码的语音特征,发现不同模型互补覆盖声学空间,并提出基于特征可恢复性的模型选择指南。
Comments Accepted at Interspeech 2026
注视头:视觉语言模型如何观察它们所描述的内容
发表机构 * Northeastern University(东北大学)
AI总结 发现视觉语言模型的语言骨干中存在一组“注视头”,其注意力跟踪当前描述的图像区域,通过干预这些头可精确控制模型描述内容,准确率达83.1%。
通过类-姿态分解的等变表示学习
发表机构 * School of Electrical Engineering and Computer Science, KTH Royal Institute of Technology(电气工程与计算机科学学院,皇家理工学院)
AI总结 提出一种将潜在空间分解为不变因子和对称群的方法,利用相对对称信息监督学习等变表示,实现无损、可解释且解耦的表示,实验优于其他等变表示学习框架。
Comments 12 pages
集成稀疏自编码器
AI总结 针对单个稀疏自编码器只能捕获激活空间中有限特征的问题,提出通过朴素Bagging和Boosting集成多个SAE,理论证明可降低重构误差,实验表明集成方法在重构质量、稳定性和下游任务上优于扩展单个SAE。
Comments Accepted to ICML 2026
学习预测什么:下游引导的持续预训练任务设计
发表机构 * Department of ECE(电子工程系) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出V-pretraining方法,通过轻量级任务设计器为无标签批次构建目标或视图,利用下游损失的一阶减少作为反馈,指导自监督更新,提升目标能力而不损害泛化。
效用约束策略优化
发表机构 * York University(约克大学) ; Google DeepMind(谷歌深度思维)
AI总结 提出一种简单而强大的效用约束MDP方法,支持风险敏感约束,无需预先固定约束限值,在多个安全基准任务上匹配或超越现有基线。
基于合约的组合屏蔽实现安全多智能体强化学习
发表机构 * Imperial College London(伦敦帝国学院) ; University of Manchester(曼彻斯特大学)
AI总结 提出一种去中心化屏蔽方法,通过合约机制协调智能体局部LTL安全义务,在无集中运行时控制下保证全局安全并优化团队奖励。
DRIVE:基于分布与检索增强的价值评估竞价方法
发表机构 * Machine Learning, ICML(机器学习,ICML)
AI总结 提出DRIVE框架,通过解耦候选动作生成与决策,结合分布建模、检索增强和价值评估,提升离线自动竞价性能。
Comments Accepted to ICML 2026
可证明安全且可扩展的强化学习
发表机构 * MIT(麻省理工学院)
AI总结 提出PS2-RL框架,通过两阶段架构(学习备份策略隐式构造控制不变集,再通过可微投影层训练RL策略)实现可证明安全且可扩展的强化学习,在高达10维状态空间中保持性能与安全性。
具有非线性奖励关联的图结构组合半赌博机通过可分离信号
发表机构 * IEEE
AI总结 针对图结构组合半赌博机问题,提出基于图因果奖励建模、再生核方法和泰勒近似的自适应策略,实现时间次线性与数据量线性性能保证,并验证于合成与真实交通数据。
嘈杂非平稳物联网环境下自适应交通信号控制的主动推理方法
发表机构 * Department of Computer Systems and Sciences(计算机系统与科学系) ; Stockholm University(斯德哥尔摩大学)
AI总结 提出一种基于主动推理的交通信号控制器,通过最小化期望自由能动态选择相位,在传感器遮挡、天气衰减和非平稳需求下优于深度Q网络和规则方法,降低空闲时间和CO2排放。
Comments Submitted to IEEE 12th World Forum on Internet of Things (WF-IoT) 2026
安全合约图多智能体强化学习用于自主网络安全响应
发表机构 * Oxaala Tecnologias(Oxaala技术公司) ; Universidade Federal da Bahia(巴西巴伊亚联邦大学)
AI总结 提出安全合约图MARL框架ACD$^3$-GAT,通过约束优化、图编码和反事实筛选,在CAGE Challenge 4中将停机违规率从100%降至0.3%或13.8%,实现安全与性能的平衡。
时序一致图Q网络用于智能网络控制
发表机构 * Ericsson Research(爱立信研究)
AI总结 提出时序一致图Q网络(TC-GQN)算法,利用图神经网络学习任务无关的全局网络自预测表示,实现多智能体强化学习协调基站动作,在节能与服务质量约束下优于基线方法。
Comments 7 pages, 5 figures. Accepted to the 6G AI-RAN Workshop at IEEE INFOCOM 2026. The final published version will be available via IEEE Xplore
PhysVLA:面向物理基础的VLA用于具身机器人操作
发表机构 * IIT Madras(印度理工学院马德拉斯分校) ; Nanyang Technological University(南洋理工大学)
AI总结 提出PhysVLA,一种即插即用的推理时框架,通过相位有限状态机和选择性欧拉-拉格朗日门,在不重新训练的情况下为任何冻结的VLA骨干注入物理约束,提升成功率、稳定性和轨迹效率。
Comments 9 pages, 5 figures, supplementary material included
缩小反思差距:面向智能体强化学习的免费校准奖励
发表机构 * University of California, Riverside(加州大学河滨分校)
AI总结 针对LLM智能体在环境反馈后自我评估不准确的问题,提出RefGRPO方法,通过对比反思与实际结果计算免费校准奖励并动态调整系数,同时提升反思校准和任务准确率。
用于蒙特卡洛树搜索规划的因果对象中心模型
发表机构 * MIRAI ; CogAILab
AI总结 提出COMET算法,结合无监督对象中心编码器和Transformer世界模型,通过动作-槽融合机制和对象因果注意力实现高效规划,在多个基准上优于基线方法。
GAGPO:通用优势分组策略优化
发表机构 * School of Computer Science and Engineering, Sun Yat-sen University(中山大学计算机科学与工程学院) ; Meituan(美团)
AI总结 GAGPO提出一种无需价值模型的强化学习方法,通过分组价值代理和动作重要性比,实现多轮任务中精确的时间信用分配,实验表明其在ALFWorld和WebShop上优于现有基线。
PERRY: 使用辅助数据的策略评估与置信区间
发表机构 * Stanford University(斯坦福大学) ; Gladstone Institutes(加利福尼亚大学旧金山分校)
AI总结 提出两种方法,利用辅助数据构建离线策略评估的置信区间,通过共形预测和双重稳健估计,在多个模拟和真实医疗数据集上验证有效性。
解决GNARLy问题:通过强化学习重新构想图神经算法推理
发表机构 * Oxford Robotics Institute, University of Oxford(牛津大学机器人研究所) ; Stateful Robotics
AI总结 提出GNARL框架,将算法轨迹学习转化为马尔可夫决策过程,结合模仿学习和强化学习,在CLRS-30问题上取得高精度,适用于NP难问题及无专家算法场景。
RAMAC: 多模态风险感知离线强化学习及行为正则化的作用
AI总结 提出RAMAC框架,结合分布性评论家与生成式演员(如扩散模型),通过条件风险价值与行为克隆的复合目标实现离线强化学习中的风险敏感学习,抑制分布外动作并提升CVaR。
Comments ICML 2026
高效探索的无监督学习:通过自我设定目标预训练自适应策略
发表机构 * University College London (UCL)(伦敦大学学院(UCL))
AI总结 提出ULEE方法,结合上下文学习器与对抗性目标生成策略,在无监督元学习框架中优化多回合探索与适应,提升零样本和少样本性能。
Comments ICLR 2026; v2 adds link to code: https://github.com/Octavio-Pappalardo/ulee-jax
Journal ref The Fourteenth International Conference on Learning Representations, 2026
重新思考LLM强化学习中的信任区域
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Toronto(多伦多大学)
AI总结 针对PPO在LLM微调中因词表大导致的训练不稳定问题,提出基于策略散度直接约束的DPPO算法,并引入高效近似方法。
基于枢轴驱动重采样的LLM强化学习深度密集探索
发表机构 * Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所) ; City University of Hong Kong(香港城市大学) ; Baidu(百度)
AI总结 针对大语言模型强化学习中探索效率低的问题,提出深度密集探索(DDE)策略,通过识别失败轨迹中的可恢复枢轴状态并局部密集重采样,结合双流优化目标,在数学推理基准上优于现有方法。
时间拉直用于隐式规划
发表机构 * New York University(纽约大学) ; Brown University(布朗大学) ; University of Toronto(多伦多大学)
AI总结 受人类视觉处理中感知拉直假说启发,提出时间拉直方法,通过曲率正则化联合学习JEPA世界模型的编码器和预测器,改善隐式规划中的表示学习,使梯度规划更稳定并提高目标到达任务成功率。
Comments ICML2026 Camera Ready
AcceRL: 面向视觉-语言-动作模型的分布式异步强化学习与世界模型框架
发表机构 * IROOTECH TECHNOLOGY Wolf 1069 b Lab, Sany Group(伊罗科技沃尔夫1069b实验室,三一集团)
AI总结 提出AcceRL框架,通过物理隔离环境交互、模型推理和梯度更新实现分布式异步强化学习,消除同步系统的空闲气泡,提升硬件利用率,并支持即插即用的世界模型集成,在LIBERO任务上实现2.4倍吞吐加速和200倍样本效率提升。
OGPO:生成控制策略的样本高效全微调
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; UC Berkeley(加州大学伯克利分校)
AI总结 提出OGPO算法,通过离策略评论网络和修改的PPO目标,实现生成控制策略的样本高效微调,在多种操作任务上达到最优性能,并能在无专家数据下微调不良初始化的行为克隆策略。
分子潜在扩散中的暗区平滑
发表机构 * New York University(纽约大学) ; Stanford University(斯坦福大学)
AI总结 针对分子潜在扩散中存在的暗区问题,提出拓扑优化VAE(TopVAE),通过训练时内化结构和化学约束,减少暗区,提升离后验鲁棒性,在QM9和GEOM-Drugs上取得显著改进。
全波形反演的扩散模型解耦潜变量优化
发表机构 * School of Mathematical Sciences, Shanghai Jiao Tong University(上海交通大学数学科学学院) ; CMA-Shanghai, Shanghai Jiao Tong University(上海交通大学CMA-上海)
AI总结 提出解耦潜变量优化(DLO),通过二次惩罚目标分离物理变量和潜变量,结合数据保真度梯度和扩散先验,在OpenFWI基准上优于经典正则化和现有扩散方法。
Comments 35 pages, 14 figures
LapidaryEngine: 全对话式晶体生成
发表机构 * Lattice Lab, Toyota Motor Corporation(丰田汽车公司Lattice实验室) ; The University of Osaka(大阪大学)
AI总结 提出LapidaryEngine,首个支持全对话式晶体生成的模型,通过枢轴表示实现文本与晶体结构的双向翻译,支持自由形式自然语言请求和迭代优化。
Comments 11 main pages, 5 main figures, and 1 table
隐式变分拒绝采样
发表机构 * RIKEN iTHEMS ; RIKEN AIP ; South China University of Technology(华南理工大学) ; Xiamen University(厦门大学) ; Columbia University(哥伦比亚大学)
AI总结 提出隐式变分拒绝采样(IVRS),结合隐式分布与拒绝采样,通过神经网络构建提议分布并用判别器估计密度比来改进后验近似,引入IR-ELBO作为质量度量,实验优于传统变分推断。
递归训练的扩散模型:限制崩溃分布与谱特征
发表机构 * University of Cambridge(剑桥大学)
AI总结 研究递归训练扩散模型时的分布崩溃问题,证明即使完美学习也会因早期停止导致漂移,并收敛到唯一极限分布,该分布具有低通滤波谱特性。
FlowMo-WM:具有物体动量和隐藏环境漂移的世界模型
发表机构 * Dartmouth College(达特茅斯学院) ; Clemson University(克莱姆森大学) ; University of Houston(休斯顿大学)
AI总结 提出FlowMo-WM,一种端到端可训练的视觉世界模型,通过分解图像-动作历史为短历史潜在状态和长历史上下文,分别建模物体运动和环境漂移,提升水下机器人等场景的长程预测精度。
自演化视觉提问器
发表机构 * University of Maryland, College Park(马里兰大学帕克分校) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Peking University(北京大学) ; Arena ; MBZUAI(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出自演化框架,让视觉语言模型作为提问器和过滤器,无需外部监督即可生成更难、更信息丰富、更视觉中心的问题,并保持探索多样性以避免训练崩溃,显著提升自主提问质量和难度边界。
Comments 21 pages, including references and appendix. Project Page is available at https://joliang17.github.io/SelfEvolvingVQG/
基于注意力的缺失模态鲁棒预测模型
发表机构 * Simon Fraser University(西蒙菲莎大学) ; RBC Borealis
AI总结 提出一种基于条件变分自编码器和Transformer的多模态模型,通过注意力机制学习统一固定维度的表示,在训练和推理中处理缺失模态,在人类轨迹预测和机器人操作预测任务上优于现有方法。
Comments Work originally done in 2023
XRDiff: 使用扩散模型从粉末X射线衍射数据进行晶体结构预测
发表机构 * Department of Materials Science and Engineering, MIT(材料科学与工程系,麻省理工学院) ; Department of Nuclear Science and Engineering, MIT(核科学与工程系,麻省理工学院) ; FAIR, Meta(FAIR,Meta)
AI总结 提出XRDiff扩散模型,从粉末X射线衍射数据恢复晶体结构,在模拟基准上实现强结构恢复率,并采用基于峰值的编码提升对实验数据的泛化能力。
连续时空动力学的非局部贝叶斯建模
发表机构 * Department of Industrial and Systems Engineering, Korea Advanced Institute of Science and Technology (KAIST)(工业与系统工程系,韩国科学技术院)
AI总结 提出NLBST模型,通过坐标基展开和连续时间ODE结合非局部积分微分方程,实现不规则观测下的连续时空预测与不确定性量化。
Comments Accepted at UAI 2026
随机特征去噪分数匹配:从精确学习曲线看扩散模型
发表机构 * École Polytechnique Fédérale de Lausanne (EPFL)(联邦理工学院洛桑校区)
AI总结 通过随机特征神经网络参数化分数函数,推导去噪分数匹配的渐近精确误差,揭示模型复杂度、数据量和噪声样本数对扩散模型泛化与记忆的影响。
Comments Published at AISTATS 2026
广义离散扩散与自校正
发表机构 * National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出自校正离散扩散模型(SCDD),通过显式状态转移和离散时间学习,简化训练噪声调度,消除冗余重掩码步骤,在GPT-2规模上实现高效并行解码并保持生成质量。
Comments 40 pages, 3 figures, 6 tables
MAD: 流形吸引扩散
发表机构 * Department of Mathematics, University of Vienna(维也纳大学数学系) ; MaLGa Center, Department of Mathematics, University of Genoa(热那亚大学数学系MaLGa中心)
AI总结 提出流形吸引扩散方法,利用流形假设通过扩展得分函数在推理阶段去除噪声,生成无噪声样本,在玩具问题、合成数据和真实数据上验证有效性。
Journal ref Forty-third International Conference on Machine Learning, 2026
提升的Schrödinger桥用于高斯混合端点:投影间隙与路径空间障碍
发表机构 * Daniel Guggenheim School of Aerospace, Georgia Institute of Technology(丹尼尔·加金吉姆航空航天学院,佐治亚理工学院)
AI总结 针对高斯混合端点分布下的随机密度控制问题,提出一种提升路径空间构造,将问题分解为高斯分量间的显式Schrödinger桥与有限维熵耦合,并分析投影后的标签信息间隙及路径空间障碍。
Comments 35 pages. Submitted to a journal; comments are welcome
巴赫风格符号音乐的生成建模:自回归、潜变量和对抗方法的比较研究
发表机构 * Stanford University(斯坦福大学)
AI总结 比较自回归LSTM、潜变量模型和生成对抗网络在巴赫风格钢琴音乐生成中的表现,发现带注意力的自回归LSTM生成音乐最连贯,向量量化缓解后验塌陷,对抗方法捕捉局部音高但训练困难。
Comments 11 pages, 13 figures. All authors contributed equally
权重范数设定“顿悟”时间尺度:因果延迟定律
发表机构 * H&K Research Studio / Clevix LLC(H&K研究工作室 / Clevix有限责任公司) ; Bac A Bank(北亚银行) ; Banking Academy of Vietnam(越南银行学院)
AI总结 通过干预训练中权重范数,发现网络在范数达到临界值Wc时发生顿悟,且延迟时间与固定范数倍数呈指数关系,揭示了范数对顿悟的因果作用。
Comments 14 papges, 9 figs and 3 tables
现代深度学习的不确定性估计与泛化界
发表机构 * Andrés Department of Computer Science Machine Learning Group(安德烈斯计算机科学系机器学习组) ; Madrid, June 2026(马德里,2026年6月)
AI总结 本文从贝叶斯角度统一推断、函数空间建模和大偏差理论,提出DVIP、VaLLA和FMGP等方法改进不确定性估计,并利用PAC-贝叶斯和大偏差理论解释过参数化神经网络的泛化能力。
Comments PhD Thesis, Autonomous University of Madrid
Muon$^p$: 具有分数谱幂的 Muon
发表机构 * Princeton University(普林斯顿大学)
AI总结 提出 Muon$^p$ 优化器,通过分数谱幂更新 $US^pV^\top$ 插值 Muon 与梯度下降,证明其无法用单变量多项式迭代计算,并推导低阶双变量递归近似,在保持矩阵乘法结构的同时提升微调性能。
超越对Adam与SGD差距的单一解释
发表机构 * University of Luxembourg(卢森堡大学) ; University of Basel(巴塞尔大学) ; MPI for Intelligent Systems(马克斯·普朗克智能系统研究所) ; ELLIS Tübingen(ELLIS蒂宾根) ; Tübingen AI Center(蒂宾根人工智能中心)
AI总结 通过跨视觉、语言、基因组和图形任务的受控实验,发现Adam与SGD的性能差距源于数据和架构的复杂交互,而非单一因素,并观察到随批量大小变化的交叉点。
Comments preprint
主成分分析的风险阴影:当99.9999%的方差保留导致灾难性决策错误
发表机构 * Department of EECS, School of Engineering, UQTR, Canada(加拿大魁北克大学三河城分校工程学院电气工程与计算机科学系) ; Learning and Game Theory Laboratory (LnG Lab), TIMADIE(学习与博弈论实验室(LnG Lab),TIMADIE)
AI总结 本文证明主成分分析(PCA)在保留99.9999%方差时可能完全丢失罕见高影响事件的信息,导致分类器退化为常数预测器,并提出Expectile PCA和Tail-Preserving PCA两种方法通过重加权协方差来保留尾部风险信息。
Comments 5 tables, 1 figure. all references fully checked manually
具有亚线性噪声探测的在线凸优化
发表机构 * Sapienza University of Rome(罗马大学) ; New York University(纽约大学) ; EPFL(瑞士联邦理工学院洛桑分校)
AI总结 研究在线凸优化中利用亚线性噪声成对探测降低遗憾,通过方差缩减和连续指数权重二阶分析获得紧界。
Comments Accepted at COLT '26
哪些方向重要?仿射鲁棒优化的稀疏设计
发表机构 * University of South Florida(南佛罗里达大学)
AI总结 研究有限字典和预算约束下鲁棒优化中不确定性方向的选择问题,提出基于覆盖目标的数据驱动选择规则,证明其单调次模性,给出贪心算法的近似保证和匹配的难度下界。
Comments Accepted at UAI 2026
一般凸集上在线库存优化的最优隐藏目标学习
发表机构 * UIUC(伊利诺伊大学厄巴纳-香槟分校)
AI总结 针对一般凸容量集上的在线库存优化问题,提出隐藏目标投影方法,将遗憾从逆概率依赖改进为平方根逆概率依赖,并证明匹配下界,同时首次给出强凸损失的 polylog 遗憾和动态遗憾保证。
多组均值估计中主动学习的复杂度度量
发表机构 * Department of Industrial Engineering and Operations Research & Data Science Institute, Columbia University(哥伦比亚大学工业工程与运筹学系及数据科学研究所)
AI总结 针对多组均值估计的max-risk目标,提出局部极小极大框架并证明一般下界,引入方差局部曲率(VLC)作为复杂度度量,在平滑类中与方差-费希尔信息关联,并揭示异质实例中的系统性差距。
任务结构如何限制多智能体成功:一种信息论分析
发表机构 * University College London(伦敦大学学院) ; University of Bristol(布里斯托大学)
AI总结 通过信息论分析,证明在任务约束图连通性和有限通信下,多智能体系统的成功概率随最小割成本指数衰减,为系统设计提供指导。
程序仍在:程序发现的一个守恒律
发表机构 * Institute of Electronics and Informatics Engineering of Aveiro (IEETA) and Department of Electronics, Telecommunications and Informatics (DETI), University of Aveiro(阿维罗电子与信息工程学院(IEETA)和电子、电信与信息学院(DETI),阿维罗大学)
AI总结 本文证明,在仅通过得分学习候选程序的算法中,搜索问题的耦合宽度导致指数级最坏情况下的下界,并由此导出结构知识与搜索之间的守恒律,唯一逃逸是通过读取程序结构而非得分,但代价是不完备性。
Comments 9 pages main text and 33 pages supporting information. Engine source and full sweep data: https://github.com/jorgeMFS/omnis, archived at doi:10.5281/zenodo.20634984
具有复杂相位结构的神经网络量子态的直接/自适应混合相位梯度学习
发表机构 * National Laboratory of Solid State Microstructures and Department of Physics(固体-state微结构国家实验室和物理系) ; Department of Physics, University of Massachusetts(麻省大学物理系) ; A. Alikhanyan National Science Laboratory(Alikhanyan国家科学实验室) ; Collaborative Innovation Center of Advanced Microstructures, Nanjing University(先进微结构协同创新中心,南京大学) ; Jiangsu Physical Science Research Center(江苏物理科学研究中心) ; Hefei National Laboratory(合肥国家实验室)
AI总结 针对神经网络量子态在复杂相位结构下的优化脆弱性问题,提出直接相位梯度估计器与自适应混合方法,显著降低方差并提升精度,在100位点通量梯子和手性XXX链上验证了优势。
Comments 24 pages, 8 figures
基于Bregman散度的决策树通用框架
发表机构 * IESTA, Facultad de Ciencias Económicas y de Administración, Universidad de la República, Uruguay(乌拉圭拉普拉塔大学经济与管理学院,IESTA) ; IRL-2030, Instituto Franco-Uruguayo de Matemática e Interacciones (IFUMI)(法乌数学与互动研究所(IFUMI))
AI总结 提出基于Bregman散度的CART推广框架,统一多种损失函数和分裂准则,并研究生成凸函数的强凸性与光滑性对杂质增益、估计器稳定性和一致性的影响。
基于HSIC的混合不确定性灵敏度分析:面向具有偶然-认知分离的高维响应
发表机构 * School of Power and Energy, Northwestern Polytechnical University(能源学院,西北工业大学)
AI总结 提出双空间张量积RKHS框架,通过分解核函数和双重Möbius反演,将全局依赖度量正交分解为纯偶然效应、纯认知效应及其交互贡献,实现高维响应下混合不确定性的灵敏度分析。
Comments 19 pages, 7 figures
极值的梯度提升:抽样理论及其在保险中的应用
发表机构 * CREST, CNRS, Ecole polytechnique, Groupe ENSAE-ENSAI, ENSAE Paris, Institut Polytechnique de Paris, Palaiseau, France(CREST、国家科学研究中心、巴黎高等工业学校、ENSAE-ENSAI集团、巴黎ENSAE、巴黎理工学院、Palaiseau法国)
AI总结 提出梯度提升估计广义帕累托分布的理论,通过正交重参数化改进收敛性,并在保险数据中验证了方法有效性。
Comments 36 pages, 10 figures
基于群体的优化的算子演算:平均场收敛理论
发表机构 * Aalto University(阿尔托大学)
AI总结 提出一种算子演算,将多种基于群体的优化方法统一为三个基本算子(变异、选择、重组)的复合,并建立模块化Lyapunov原理,证明在稳定性和正则性条件下指数收敛。
Comments 71 pages, 4 figures, 2 tables; ancillary files contain Python code reproducing the numerical experiments
隐藏加权稀疏图的恢复阈值
发表机构 * State Key Laboratory for Novel Software Technology(新型软件技术国家重点实验室)
AI总结 研究从带噪加权完全图中恢复隐藏图的阈值,基于Rényi散度与Erdős-Rényi随机图的第一矩阈值建立统一刻画,并扩展到部分恢复和全有或全无现象。
Comments 34 pages, 4 figures
非线性双时间尺度随机逼近:尖锐相变及其克服方法
发表机构 * Indian Institute of Technology Kharagpur(印度理工学院克达尔格浦尔分校) ; Mohamed bin Zayed University of Artificial Intelligence(莫莫德 bin Zayed 人工智能大学) ; Purdue University(普渡大学)
AI总结 本文发现非线性双时间尺度随机逼近中慢速迭代的均方误差率存在依赖于正则性的相变边界,并通过引入辅助在线偏差估计器将慢速更新中的偏差项减去,从而在全部正则性参数下实现O(k^{-1})的收敛率。
Muon 的免费重尾午餐:实证成功的理论证明
发表机构 * Department of Computer Science, ETH Zurich, Switzerland(苏黎世联邦理工学院计算机科学系) ; Department of Mathematics, Technical University of Munich, Germany(慕尼黑技术大学数学系) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心)
AI总结 本文在重尾非凸优化中证明,Muon 等非欧几里得方法在核范数平稳性下达到最优样本复杂度,避免了欧几里得方法的维度依赖,并通过大语言模型实验验证。
多项式卷积网络的几何与优化
发表机构 * KTH Royal Institute of Technology(皇家理工学院)
AI总结 研究使用单项式激活函数的卷积神经网络,证明其参数化映射是正则且几乎处处同构,通过代数几何方法计算神经流形的维数和度,并量化回归损失优化中临界点的数量。
Comments Accepted at AISTATS 2025. New version: corrected Section 4.2
从排序算法到可扩展核:高维排列空间中的贝叶斯优化
发表机构 * State Key Laboratory of Precision and Intelligent Chemistry(精准与智能化学国家重点实验室)
AI总结 针对高维排列空间贝叶斯优化中表示可扩展性差的问题,提出基于排序算法的核函数框架,其中Mallows核是枚举排序的特例,而新提出的Merge核通过归并排序的分解结构实现Θ(n log n)复杂度且无信息损失,在低维性能相当,高维显著提升优化效果与计算效率。
Comments 9 pages, published on ICLR-26
后训练中的分布偏差:推理轨迹的马尔可夫分析
发表机构 * City University of Hong Kong(香港城市大学) ; Center for Advanced Intelligence Project, RIKEN(RIKEN高级智能研究中心) ; The Institute of Statistical Mathematics(统计数学研究所) ; University of Sydney(悉尼大学) ; CFAR and IHPC, Agency for Science, Technology and Research (A*STAR)(A*STAR的CFAR和IHPC) ; Nanyang Technological University(南洋理工大学) ; The University of Tokyo(东京大学)
AI总结 通过马尔可夫链模型分析后训练策略(如RLVR和ORM/PRM)如何强化高概率路径而遗忘稀有但关键的推理步骤,并证明探索策略(如拒绝简单实例和KL正则化)有助于保留稀有CoT。
非凸-强凸双层优化的一阶Oracle下界复杂度
发表机构 * Kaiyi Ji(机凯毅)
AI总结 针对光滑非凸-强凸双层优化,在确定性和随机一阶Oracle模型下,分别证明了$\Omega(\kappa^{3/2}\epsilon^{-2})$和$\Omega(\kappa^{5/2}\epsilon^{-4})$的下界,改进了单层非凸优化和极小极大问题的已知最优下界。
Comments Accepted by ICML 2026
基于遗传规划的符号回归的泛化界
发表机构 * Institute of Science Tokyo, Yokohama, Japan(东京科学研究所, Yokohama, 日本) ; CyberAgent, Shibuya, Japan(CyberAgent, Shibuya, 日本)
AI总结 本文对基于遗传规划的符号回归进行学习理论分析,推导出在树大小、深度和可学习常数约束下的泛化界,将泛化差距分解为结构选择和常数拟合两个可解释分量,为遗传规划中的常用实践提供理论依据。
Comments Accepted for PPSN2026
关于可观测数据和私有数据的最优划分分类方法
发表机构 * HUN-REN Institute for Computer Science and Control (SZTAKI)(HUN-REN计算机科学与控制研究所(SZTAKI)) ; Department of Probability Theory and Statistics, Institute of Mathematics, Eötvös Loránd University (ELTE)(概率论与统计学系,厄特沃什·洛朗大学数学学院(ELTE)) ; Department of Computer Science and Information Theory, Budapest University of Technology and Economics (BME)(计算机科学与信息理论系,布达佩斯技术与经济大学(BME)) ; Institute for Stochastics and Applications, University of Stuttgart(概率论与应用研究所,斯图加特大学)
AI总结 本文重新审视划分分类方法,在更宽松条件下(无需强密度假设)推导出可观测和私有数据下分类误差概率的收敛速率,该速率仅依赖于连续输入的内在维度。
广义去偏Lasso的稳定性及其在基于重抽样的变量选择中的应用
发表机构 * Department of Statistics, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校统计系) ; Department of Electrical and Computer Engineering, the Grainger College of Engineering(格拉inger工程学院电子与计算机工程系)
AI总结 提出基于稳定性原理的广义去偏Lasso估计量,通过设计矩阵单列扰动下的简单更新公式,在比例增长机制下实现渐近精确近似,显著降低重抽样变量选择的计算成本。
Comments to appear in Bernoulli
直接Fisher得分估计用于似然最大化
发表机构 * School of Mathematics, University of Bristol(布里斯托大学数学学院) ; School of Biological Sciences, University of Bristol(布里斯托大学生物科学学院)
AI总结 针对似然函数难解但模型模拟易得的问题,提出基于局部得分匹配的顺序梯度优化方法,直接建模Fisher得分,实现快速高效的似然最大化。
拼接矩阵SVD:压缩界限、增量近似与误差约束聚类
发表机构 * Institute of Mathematics of NAS of Ukraine(乌克兰国家科学院数学研究所) ; MacPaw Research(MacPaw研究)
AI总结 针对拼接后截断SVD压缩中哪些矩阵可安全合并的问题,提出基于谱界和增量SVD的聚类框架,实现显式误差约束下的压缩感知矩阵分组。
Comments Published in Transactions on Machine Learning Research (06/2026)
Journal ref Transactions on Machine Learning Research (2026)
特征计算预算对黑箱优化中逐实例算法选择的影响
发表机构 * Centrum Wiskunde & Informatica(荷兰阿姆斯特丹数学与信息学中心) ; Sorbonne Université(索邦大学) ; CNRS(国家科学研究中心) ; LIP6(LIP6实验室)
AI总结 研究黑箱优化中特征计算预算对逐实例算法选择性能的影响,发现即使花费25%预算计算特征,PIAS仍可行,且最优预算比例高度依赖场景。
基于移动NPU的高效设备端扩散大语言模型推理
发表机构 * Tsinghua University(清华大学) ; Beihang University(北京航空航天大学)
AI总结 提出首个NPU感知推理框架Diffusion-LLM-on-NPU,通过多块推测解码、双路径渐进修正和交换优化内存运行时,在移动设备上加速扩散大语言模型推理,相比CPU基线实现17-42倍延迟降低。
超越LoRA:稀疏诱导的适应更好吗?
发表机构 * School of Data, Mathematical and Statistical Sciences, University of Central Florida, United States(中佛罗里达大学数据、数学与统计科学学院) ; College of Computing, Mohammed VI Polytechnic University (UM6P), Morocco(穆罕默德六世理工大学计算机学院) ; Department of Computer Science, University of Central Florida, United States(中佛罗里达大学计算机科学系)
AI总结 本文提出Cheap LoRA (cLA)及其变体,通过在LoRA中引入稀疏性实现参数高效微调,理论推导泛化误差界,实验表明在多种任务上性能与参数匹配基线相当,同时减少训练时间和峰值GPU内存。
Comments Overview of the paper and code can be found here: https://elicaden.github.io/Beyond_LoRA/
Gefen: 优化随机优化器
发表机构 * Reichman University(赖希曼大学) ; Tel Aviv University(特拉维夫大学) ; Google Research(谷歌研究院)
AI总结 提出Gefen优化器,通过共享二阶矩估计和量化一阶矩,将AdamW内存占用减少约8倍,同时保持相同性能,支持更大批量和吞吐量。
小型LLM:剪枝 vs. 从头训练
发表机构 * Princeton University(普林斯顿大学) ; New York University(纽约大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文通过六种剪枝方法在Llama-3.1-8B上比较剪枝与从头训练,发现有限预算下剪枝更优,预算充足时粗粒度剪枝可被超越。
Comments Our code is available at https://github.com/zlab-princeton/llm-pruning-collection
挤压-释放:具有精确结构最小化的迭代剪枝
发表机构 * Uppsala University(乌普萨拉大学)
AI总结 提出Squeeze-Release循环,通过精确结构重写将掩码网络转化为更小密集网络,并引入CompensatedLayerNorm扩展至残差流,实现高达39倍压缩。
在消费级GPU上实现扩散Transformer的原生INT8计算:用于Ideogram 4.0的融合INT8 GEMM内核
发表机构 * Transformer Lab
AI总结 针对消费级Ampere GPU上INT8量化比FP8/NF4更慢的问题,提出融合Triton INT8 GEMM内核,直接利用INT8张量核心,在Ideogram 4.0中实现2.8-4.2倍加速,端到端速度提升约10%,使1024px单卡可行。
Persona-Pruner: 为角色扮演雕琢轻量级模型
AI总结 提出Persona-Pruner框架,通过从单个描述中隔离特定角色的子网络来剪枝语言模型,在保持角色扮演性能的同时大幅降低计算成本,性能下降比最强基线减少93.8%。
Comments 25 pages; ICML 2026; Code is available at https://github.com/jsu-kim/Persona-Pruner
基于轻量随机注意力的移动睡眠分期高效时序建模
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出轻量随机注意力模块RA,通过固定随机投影实现相似性聚合,替代可学习序列建模,在移动睡眠分期中实现高效时序平滑,理论解释为随机注意力先验核,实验显示在准确率和F1上提升1-3%,性能媲美LSTM/GRU/Transformer。
Comments 7 pages, 1 figures, 5 tables
LoMC: 路由基础模型中拒绝抑制的局部多方向校正
发表机构 * Ant Group(蚂蚁集团) ; Zhejiang University(浙江大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出LoMC方法,通过支持门控干预框架在路由MoE和混合MoE模型中实现紧凑的拒绝抑制,提升非拒绝目标响应行为并保持通用能力。
锥优化器的可扩展深度展开
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出矩阵自由隐式微分和基于Dalečkii-Krein的PSD锥反向传播规则,解决深度展开应用于大规模半定规划时的内存和数值稳定性问题,实现轻量级超参数策略和热启动学习,在多种问题上取得高达50倍加速。
RT-VLA:通过知识蒸馏实现实时视觉-语言-动作模型
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出RT-VLA,通过多级监督蒸馏将SimLingo模型的能力压缩至轻量学生模型,在保持竞争性能的同时将推理时间降低44.8倍(纯视觉模式)和7.9倍(视觉+语言模式),实现实时可解释的VLA自动驾驶。
HumP-KD: 一种混合不确定性感知的多阶段渐进式知识蒸馏框架用于高效火灾分类
AI总结 提出HumP-KD框架,通过层次化渐进式知识蒸馏和多阶段蒸馏,将两个冻结的异构Transformer教师(Swin-Tiny和ViT-Base)及其集成知识蒸馏到轻量级MobileViT-S学生模型中,在火灾分类任务上显著提升性能,同时保持低参数量和实时推理速度。
断裂链式思维推理
发表机构 * University of Amsterdam(阿姆斯特丹大学) ; eBay ; Microsoft(微软) ; Google Research(谷歌研究) ; Salesforce
AI总结 提出断裂采样策略,通过截断推理链、调整轨迹数和解数,在推理时实现精度与成本的帕累托最优。
UltraSketchLLM:基于草图与硬件友好算子的低于1比特LLM压缩
发表机构 * National Key Laboratory for Multimedia Information Processing, School of Computer Science, Peking University(国家多媒体信息处理重点实验室,计算机科学学院,北京大学) ; School of Electronic Engineering and Computer Science, Peking University(电子工程与计算机科学学院,北京大学) ; Center for Energy-efficient Computing and Applications, Peking University(能效计算与应用中心,北京大学)
AI总结 提出UltraSketchLLM,利用数据草图将LLM权重压缩至0.5比特,结合硬件友好实现,在保持可接受性能下降的同时实现14.9倍加速。
Comments Accepted by the 63rd ACM/IEEE The Chips to Systems Conference (DAC 2026)
量化进化策略:以低精度代价实现量化大语言模型的高精度微调
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; Cognizant AI Lab(Cognizant AI实验室) ; UT Austin(得克萨斯大学奥斯汀分校)
AI总结 提出量化进化策略(QES),通过集成累积误差反馈和无状态种子重放,直接在量化空间进行全参数微调,无需反向传播,显著优于现有零阶微调方法。
Comments Added more tasks and baselines
通过极端比例思维链压缩实现高效大型语言推理模型
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出Extra-CoT框架,通过极端比例压缩思维链、混合比例监督微调和约束层次化比率策略优化,在显著减少推理令牌的同时保持甚至提升推理准确率。
Comments Accepted to ICML 2026. 15 pages, 7 figures
FP4量化LLM训练中均值偏差的诅咒与祝福
发表机构 * Fudan University(复旦大学) ; University of Bath(巴斯大学) ; Shanghai Innovation Institute(上海创新研究院) ; University of Oxford(牛津大学) ; Oxford Suzhou Centre for Advanced Research(牛津苏浙研究中心) ; University of Colorado Boulder(科罗拉多大学波德格分校) ; University of Michigan(密歇根大学) ; Shenzhen Loop Area Institute(深圳环宇研究院)
AI总结 发现FP4训练失败源于激活异常值由秩一均值偏差主导,提出Averis均值残差分离量化法,在Qwen3模型上实现鲁棒W4A4G4训练,损失差距低于NVIDIA的Hadamard方法。
TabKD: 通过学习特征箱的交互多样性实现表格知识蒸馏
发表机构 * Department of Computer Science and Engineering, The University of Texas at Arlington(计算机科学与工程系,德克萨斯理工大学阿灵顿分校)
AI总结 提出TabKD方法,通过学习与教师决策边界对齐的自适应特征箱,生成最大化成对交互覆盖的合成查询,在表格数据知识蒸馏中显著提升学生-教师一致性。
Comments Accepted in 35th International Joint Conference on Artificial Intelligence IJCAI 2026
子令牌路由用于KV缓存压缩
发表机构 * Futurewei Technologies(未来智科)
AI总结 提出子令牌路由方法,在保留令牌内对值向量分组并选择性保留,与令牌级压缩互补,在LLM和VLM中提升压缩性能。
Comments 17 pages, 8 tables, 2 figures
在8位权重和激活下保持FP8质量上限:Ideogram 4.0的INT8和GGUF后训练量化用于消费级GPU
发表机构 * Transformer Lab
AI总结 本文对Ideogram 4.0模型进行INT8 W8A8量化,在无FP8张量核心的Ampere GPU上达到FP8质量水平,并优于NF4,同时GGUF Q4_K在质量-内存前沿上成为帕累托最优。
TWLA:通过训练后量化实现大语言模型的三值权重和低位激活
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出TWLA框架,通过后训练量化实现1.58位权重和4位激活,解决激活分布长尾问题,加速推理。
Comments Accepted by ICML 2026
脆弱的知识,稳健的指令遵循:Llama-3.2中的宽度剪枝二分法
发表机构 * Independent Researcher(独立研究员)
AI总结 通过峰值幅度准则对GLU-MLP层进行结构化宽度剪枝,发现降低扩展比会损害参数化知识任务,但能提升指令遵循能力,挑战了剪枝导致均匀退化的假设。
Comments 22 pages, 5 figures, 9 tables. Code available at https://github.com/peremartra/llama-glu-expansion-pruning
NeST: 面向LLM安全的神经元选择性调优
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 提出NeST框架,通过激活探测识别安全相关前馈神经元并训练共享簇级更新,仅用普通恶意提示即可泛化防御多种越狱攻击,在14个模型上以极少参数实现接近全微调的鲁棒性。
高效基于理由的检索:基于JEPA的生成重排序器的在线蒸馏
发表机构 * Geely AI Lab(吉利人工智能实验室)
AI总结 本文提出Rabtriever,通过在线蒸馏从生成重排序器中学习,将查询和文档独立编码,提升检索效率,同时在多个任务中表现优异。
Comments 11 pages, 8 figures. ICMR 2026 (https://youtu.be/apDcrzEVwq4)
FedSPC:个性化联邦学习的共享参数校正
发表机构 * DENSO AUTOMOTIVE Deutschland GmbH(电装汽车德国有限公司) ; DENSO International America, Inc.(电装国际美国公司) ; Technical University of Munich(慕尼黑工业大学)
AI总结 针对个性化联邦学习中共享参数因客户端局部目标不一致而更新冲突的问题,提出模块化校正方法FedSPC,仅对共享参数应用控制变量校正,在多种PFL设置下提升性能。
Comments Accepted for presentation at FL@FM-IJCAI'26, in conjunction with IJCAI 2026. 9 pages
原生不可学习的大语言模型
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出NULLs模型,通过共享骨干和稀疏激活的sinks分离数据源贡献,实现无需梯度更新的高效遗忘,在维基百科上验证了单篇文章遗忘的有效性和鲁棒性。
通过持续学习中的灾难性遗忘视角重新思考后门对抗性去学习
发表机构 * Harbin Institute of Technology, Shenzhen(哈尔滨工业大学(深圳)) ; Shenzhen Key Laboratory of Media Security, Shenzhen University(深圳大学媒体安全深圳市重点实验室)
AI总结 本文将后门学习与去学习建模为持续学习视角下的三阶段过程,基于灾难性遗忘机制推导完全后门去学习的必要条件,并提出盲反演-后门对抗性去学习(BI-BAU)方法,通过期望最大化算法优化最大后验目标,有效消除后门效应。
Comments Accepted by ACM CCS 2026
MUFFLe: 通过广义去重实现联邦学习的高效模型更新压缩
发表机构 * Innovation Foundation Denmark(丹麦创新基金会)
AI总结 提出MUFFLe方案,将广义去重(GD)集成到FedAvg中,通过去重更新向量中的重复模式实现固定速率、可变计数的压缩,在IID MNIST上以38 MB累积上行通信达到92.93%目标精度。
Comments Accepted at IEEE EDGE 2026 (Work-in-Progress track)
基于凸约束的联邦学习特征泛化
发表机构 * Dongwon Kim(金东Won) ; Donghee Kim(金东浩) ; Sung Kuk Shyn(申 Sung Kuk) ; Kwangsu Kim(金光Su)
AI总结 针对联邦学习中客户端数据异构导致的泛化问题,提出FedCONST方法,利用线性凸约束自适应调整更新幅度,平衡参数学习,并通过梯度信噪比分析验证其有效性,实现跨异构环境的强泛化。
Comments Accepted at the 42nd International Conference on Machine Learning (ICML 2025)
机器遗忘的行为审计具有隐私代价
发表机构 * University of Pittsburgh(匹兹堡大学) ; Cisco(思科)
AI总结 本文证明,在互不信任的模型所有者和审计者场景下,仅依赖模型行为查询的审计方案无法在不泄露保留集成员信息的情况下识别未充分遗忘的模型,揭示了隐私与审计之间的固有权衡。
通过PAC隐私实现私有预测
发表机构 * Massachusetts Institute of Technology(麻省理工学院)
AI总结 针对API场景下的私有预测,提出基于PAC隐私的实例级噪声校准方法,实现自适应查询下互信息线性累积,在CIFAR-10上以极低预算达到高精度,并支持通过蒸馏发布可公开查询的模型。
FedRot-LoRA: 缓解联邦LoRA中的旋转偏移
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出FedRot-LoRA框架,通过正交变换对齐客户端更新以减少子空间不匹配,提升联邦LoRA在异质数据下的性能。
Comments ICML 2026
联邦学习中基于模拟攻击模式的动态搭便车者检测
发表机构 * Fujitsu Limited(富士通株式会社)
AI总结 针对联邦学习中动态搭便车者难以检测的问题,提出S2-WEF方法,通过模拟全局模型攻击的权重演化频率模式并结合偏差评分进行二维聚类,实现无需代理数据集或预训练的高鲁棒性检测。
Comments 23 pages, 1 figure, 8 tables
联邦基础模型个性化中的静默失败
发表机构 * Medical & Imaging Informatics (MII) Group, University of California, Los Angeles (UCLA)(医学与影像信息学(MII)组,加州大学洛杉矶分校(UCLA))
AI总结 本文提出联邦基础模型个性化中因隐私约束导致的一类信任失败——静默失败,包括偏差放大、公平性崩溃和对齐侵蚀,并引入六种静默失败模式的分类法,强调隐私保护训练不足以保障可信部署。
让我们问高斯:改进的单次运行隐私审计
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Rensselaer Polytechnic Institute(伦斯勒理工学院) ; Purdue University(普渡大学)
AI总结 提出一种基于高斯渐近分布的差分隐私审计框架,利用白盒DP-SGD中金丝雀对齐信号的归一化和,从单次训练运行中获取更紧的隐私下界。
缓解层次化基于符号的联邦学习中的异质性引起的漂移
AI总结 针对层次化联邦学习中簇间数据异质性导致的模型漂移问题,提出DC-HierSignSGD算法,通过云辅助梯度校正消除偏差,在保持二进制通信的同时提升精度。
神经变异性增强人工网络鲁棒性
发表机构 * Department of Computer Science, Western Washington University(西华盛顿大学计算机科学系) ; Allen Institute(艾伦研究所)
AI总结 研究通过引入结构化噪声(模仿皮层神经变异性)提升人工神经网络对对抗攻击和自然图像修改的鲁棒性,发现噪声结构可显著增强鲁棒性,且对抗攻击的噪声结构可泛化至其他攻击类型。
非参数化机器文本检测:基于多视角高斯过程
发表机构 * Johns Hopkins University(约翰霍普金斯大学)
AI总结 提出多视角非参数检测框架,通过高斯过程集成互补特征视图,提高对对抗攻击的鲁棒性,并提供校准概率和分布外输入的原则性弃权。
新物理搜索中异常检测的共形校准与look-elsewhere效应
发表机构 * Department of Physics and Astronomy, University College London(大学学院伦敦物理系) ; Department of Engineering, City St. George’s, University of London(伦敦大学城市圣乔治学院工程系) ; Institute for Theoretical Physics, Campus Süd, Karlsruhe Institute of Technology (KIT)(卡尔斯鲁厄理工学院(KIT)理论物理研究所) ; Institute for Quantum Materials and Technologies, Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院量子材料与技术研究所)
AI总结 提出基于共形预测的校准层,将任意异常分数转化为具有分布无关、有限样本保证的显著性,同时修正背景误建模和look-elsewhere效应。
Comments 22 pages, 15 figures, 3 tables. Comments welcome
幻象探针:视觉模型如何伪造视觉理解
发表机构 * Columbia University(哥伦比亚大学) ; Intuit ; Technion(以色列理工学院) ; Thoughtworks ; New York University(纽约大学)
AI总结 提出幻象探针框架,通过对比探针揭示视觉语言模型在无图像时也能回答问题的两种幻象行为:文本偏见和虚假图像,并证明后者需要表征级干预。
何时应条件化智能体信任?表征与攻击智能体群中的技能条件声誉
发表机构 * Shenzhen University(深圳大学)
AI总结 研究异构LLM智能体群中技能条件信任的适用条件,通过相图分析揭示其在高异质性、稀疏证据和技能相关场景下有效,但存在跨技能证据被攻击者利用的风险,提出条件信息值测试(CIVT)量化攻击影响。
Comments 18 pages, 8 figures, 2 tables
音频模型中解释的感知脆弱性:在预测不变的情况下操纵归因
发表机构 * University of Warsaw(华沙大学)
AI总结 提出一种心理声学框架,通过优化不可听扰动来解耦模型归因与分类,证明在音频深度伪造检测中可系统扭曲解释热图而保持预测标签不变。
Comments Accepted to the ICML 2026 Workshop on Machine Learning for Audio: 5 pages, 4 figures
当工具决定时:LLM代理盲目服从图神经网络工具,更强的骨干网络服从更多
发表机构 * raptorX.ai
AI总结 研究LLM代理在使用GNN工具时是否真正判断而非盲目服从,发现代理在97.6-99.2%的情况下完全采纳GNN输出,且更强的骨干网络服从更多,选择性调用设计受限。
Comments 9 pages, 2 figures. Under review at TMLR
STaR-DRO: 面向群体鲁棒结构化预测的状态化Tsallis重加权
发表机构 * Yale University(耶鲁大学) ; Yale School of Medicine(耶鲁医学院)
AI总结 提出STaR-DRO框架,结合Tsallis镜像上升和稀疏entmax映射,仅对持续困难群体上权重,在结构化预测中提升标签准确性和鲁棒性,在EPPC Miner任务上相比SFT和标准DRO分别提升F1分数1.08和2.20。
知道何时退出:LLM推理中动态弃权的原则性框架
发表机构 * Hebrew University of Jerusalem(特拉维夫大学)
AI总结 本文提出一个基于正则化强化学习框架的动态弃权原则,通过价值函数与弃权奖励的比较来决定是否提前终止推理,在数学推理和毒性避免任务上优于现有方法。
Journal ref Proceedings of the 43rd International Conference on Machine Learning, Seoul, South Korea. PMLR 306, 2026. Copyright 2026 by the author(s)
图神经网络中的无分位数不确定性量化
发表机构 * Soyoung Park Hwanjun Song Sungsu Lim
AI总结 提出QpiGNN框架,通过无分位数联合损失直接优化覆盖率和区间宽度,实现高效鲁棒的图神经网络不确定性量化,理论保证渐近覆盖和近最优宽度。
Comments Accepted at the 43rd International Conference on Machine Learning (ICML 2026)
留一法、自助法和交叉共形异常检测器
发表机构 * German Federal Ministry for Economic Affairs and Climate Action(德国经济事务和气候行动部)
AI总结 为解决异常检测中校准数据不足的问题,基于共形预测提出留一法、自助法和交叉共形方法,在控制第一类错误率的同时提高数据效率。
Comments Published in 2024 IEEE International Conference on Knowledge Graph (ICKG)
Journal ref Proc. 2024 IEEE ICKG 15(1): 110-119 (February 2025)
MirrorCheck: 视觉-语言模型的高效对抗防御
发表机构 * Mohamed Bin Zayed University of Artificial Intelligence(莫扎伊德大学人工智能大学) ; NVIDIA ; École Polytechnique Fédérale de Lausanne(洛桑联邦理工学院) ; Michigan State University(密歇根州立大学)
AI总结 提出MirrorCheck框架,利用文本到图像模型和随机化策略检测并防御针对视觉-语言模型的自适应对抗攻击。
对齐但刻板?系统提示如何塑造基于LLM的文本到图像模型中的人口统计偏见
发表机构 * KAIST(韩国科学技术院) ; HKUST (GZ)(香港科技大学(广州))
AI总结 研究LLM增强的文本到图像系统在提示扩展中引入隐性人口统计偏见的问题,提出无训练的去偏框架FairPro,通过自适应生成公平性指令减少人口统计差异。
Comments Project page: https://fairpro-t2i.github.io
最小距离摘要用于鲁棒神经后验估计
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出最小距离摘要方法,通过最大均值差异(MMD)在测试时自适应调整摘要统计量,在不修改预训练神经后验估计器的情况下实现鲁棒推断,理论保证鲁棒性并实验验证。
你忘记我问什么了吗?大型语言模型中的前瞻记忆失败
发表机构 * University of Washington(华盛顿大学)
AI总结 本研究通过认知心理学中的前瞻记忆视角,发现大型语言模型在执行复杂任务时,格式化指令的遵从率下降2-21%,并提出了显著性增强格式来恢复遵从性。
Patcher: 后门大型语言模型的事后修补
发表机构 * University of Louisville(路易斯维尔大学) ; University of North Texas(北得克萨斯大学)
AI总结 提出Patcher框架,仅利用单个失败案例和模型参数,通过基于梯度的显著性定位后门触发器,并采用约束微调消除触发-响应关联,同时保持模型效用。
Comments To appear in the USENIX Security Symposium, 2026
扮演魔鬼的代言人:现成的人格向量在顺从性上与针对性引导相媲美
发表机构 * University of Toronto(多伦多大学) ; Princeton University(普林斯顿大学) ; Purdue University(普渡大学) ; EPFL(瑞士联邦理工学院) ; Algoverse ; Independent(独立)
AI总结 本文研究了不同人格对顺从性的影响,发现现成的人格引导向量在减少顺从性方面与针对性引导相当,且在用户正确时保持准确性。
Journal ref ICML, Pluralistic Alignment Workshop, 2026
PostDeg:在LayerNorm GNN中位置胜过参数化
发表机构 * Purdue University(普渡大学) ; Park Tudor High School(帕克图多尔高中)
AI总结 发现LayerNorm会擦除拓扑信号,而后LayerNorm位置可保留信号;提出无参数的后LayerNorm逆度缩放PostDeg,在三个组合优化任务上提升显著,且四个证伪测试均未触发。
Comments Yash Tomar and Aryav Das contributed equally to this work
上下文感知的模态-拓扑协同对齐用于多模态属性图
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出CoMAG框架,通过任务自适应可靠上下文学习和模态保持的跳令牌对齐,统一处理图任务和模态任务,在保持稀疏边线性复杂度的同时提升结构预测、跨模态匹配和图条件生成性能。
用于控制函数工具变量的图扩散残差
发表机构 * School of Computer Science and Engineering, University of Science and Technology of China(中国科学技术大学计算机科学与技术学院)
AI总结 提出自适应各向异性工具热流(A-IHF),一种基于图扩散的残差提取方法,用于灵活控制函数,通过检测处理跳跃并调整图传导性,在合成基准测试中优于多种基线方法。
Comments Submitted to Journal of Machine Learning Research (JMLR). 50 pages, 6 figures
知识图谱增强的记忆增强检索用于长上下文建模
发表机构 * University of New South Wales(新南威尔士大学) ; Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; University of Southampton(南安普顿大学) ; Technology Innovation Institute(技术创新研究所) ; Mohamed Bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出KGERMAR框架,通过动态构建上下文知识图谱并融合多组件记忆架构,在长上下文建模中降低困惑度达8.5%,提升记忆效率2-2.5倍。
泛化GNN:基于令牌化的专家混合
发表机构 * University of Connecticut Storrs(康涅狄格大学斯特劳斯分校) ; University of Notre Dame(Notre Dame 大学) ; University of Virginia(弗吉尼亚大学) ; Northwestern University Evanston(北western 大学埃文斯顿分校)
AI总结 针对图神经网络部署时稳定性与泛化性的权衡,提出STEM-GNN框架,通过令牌化专家混合编码器、向量量化接口和Lipschitz正则化头实现三方面平衡,在多种分布偏移和扰动下提升鲁棒性。
Comments Accepted to KDD 2026
AdaTKG: 用于时序知识图谱推理的自适应记忆
发表机构 * LG AI Research(LG人工智能研究)
AI总结 提出AdaTKG,通过为每个实体维护自适应记忆,并采用可学习的指数移动平均更新,解决时序知识图谱中实体表示静态的问题,提升推理性能。
Comments KDD Workshop on Frontiers in Graph Machine Learning for the Large Model Era 2026 (Oral Presentation)
GraspLLM: 面向文本属性图与LLM的零样本泛化
发表机构 * Peking University(北京大学) ; National University of Singapore(新加坡国立大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出GraspLLM框架,通过融合图结构理解与LLM语义能力,利用基序感知对比学习和最优上下文子图对齐,实现跨数据集和跨任务的零样本泛化。
基于图的目标反向传播用于多LLM智能体系统中的上下文自适应
发表机构 * Retail Intelligence, Walmart Global Tech(零售智能,沃尔玛全球技术)
AI总结 提出GTBP框架,通过图结构反向传播局部目标输出,实现多LLM智能体工作流的上下文自适应,理论保证稳定性,实验优于基线。
学习错误的上下文:时间序列基础模型的黑盒在线自适应
发表机构 * Ant International(蚂蚁国际) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 针对黑盒时间序列基础模型在线自适应问题,提出ORCA方法,通过学习基础模型预测误差的上下文(输入和输出)进行自适应,在5个模型和8个数据集上验证有效性。
R^2中线性回归的几何域自适应:基于最优传输
发表机构 * University of the People(人民大学)
AI总结 针对源域与目标域存在旋转、平移或缩放变换的线性回归问题,提出结合K-means与最优传输的方法估计变换,实现目标数据稀缺时的模型自适应,理论证明p≥2时最优传输恢复变换。
CuMA: 通过人口统计感知的适配器混合使大语言模型与稀疏文化价值观对齐
发表机构 * Southeast University(东南大学) ; ByteDance Inc.(字节跳动公司) ; Key Laboratory of New Generation Artificial Intelligence Technology and Its Interdisciplinary Applications (Southeast University), Ministry of Education, China(新一代人工智能技术及其交叉应用重点实验室(东南大学),中华人民共和国教育部,中国)
AI总结 提出CuMA框架,通过人口统计感知路由将冲突梯度分离到专家子空间,解决密集模型在多文化对齐中的均值崩溃问题,在WorldValuesBench等基准上取得最优性能。
Comments ACL 2026 Main
多变量时间序列无训练时滞谱嵌入的平稳性与耦合准则
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出基于时滞相关矩阵截断的固定长度描述符D(τ),通过平稳高斯VAR(1)模型推导其适用条件:信号近似平稳且类别信息存在于跨通道时间耦合而非边际功率。
Comments 25 pages, 2 figures, 10 tables
知识追踪中恢复被搁置的区分能力:通过经验贝叶斯收缩进行逐项偏差校正
发表机构 * Kyushu University(九州大学)
AI总结 提出SLC方法,利用Laplace/IRLS将二值观测转化为高斯伪观测,通过卡尔曼平滑器进行经验贝叶斯收缩,并拟合偏移Platt链接,以校正知识追踪模型中的逐项偏差,恢复被搁置的区分能力,在多个数据集和骨干网络上提升AUC和NLL。
Comments 25 pages, 3 figures. Accepted at ECML PKDD 2026 (Research Track). Code: https://github.com/xiaoran-y/SLC
深度神经网络能否改善超大规模科学数据的压缩?
发表机构 * King Abdullah University of Science and Technology(阿卜杜拉国王科技大学) ; University of the Peloponnese(伯罗奔尼撒大学)
AI总结 本文提出将深度学习预测器集成到传统误差有界压缩框架中,通过气候数据实验发现,尽管ML预测器能提高预测精度和重建质量,但由于残差空间结构影响熵编码效率,未能提升整体压缩比。
Running the Gauntlet: 重新评估智能体在陌生环境中的能力
发表机构 * University of Oxford(牛津大学) ; SoftServe ; Massachusetts Institute of Technology(麻省理工学院) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; UK AI Security Institute(英国人工智能安全研究所) ; Ukrainian Catholic University(乌克兰天主教大学)
AI总结 提出GauntletBench基准,通过20个视觉密集型任务评估智能体在时间感知、图形理解和3D推理等未被充分探索的能力,发现最先进智能体成功率仅19.1%,远低于人类80%以上。
配方控制的解码器审计用于结构知识图谱补全
发表机构 * School of Mathematical Sciences, Xiamen University(厦门大学数学科学学院) ; School of Informatics, Xiamen University(厦门大学信息学院)
AI总结 提出配方控制的解码器审计方法,通过交换解码器评估其对知识图谱补全性能的影响,发现解码器效果受配方和来源影响,并建议在编码器层面声明前进行解码器×深度扫描。
Comments 11 pages, 5 figures. Code and artifacts: https://github.com/AndyShan11/kgc-decoder-audit
移动健康多时间范围行为预测的深度学习架构比较研究
发表机构 * KIOS Research and Innovation Center of Excellence, University of Cyprus(塞浦路斯大学KIOS研究与创新卓越中心) ; Department of Electrical and Computer Engineering, University of Cyprus(塞浦路斯大学电气与计算机工程系)
AI总结 本研究在三个公开数据集上系统比较了六种深度学习架构、两种零样本基础模型和统计基线在1-8天时间范围内的行为预测性能,发现PatchTST表现最佳,基础模型TimesFM在低数据场景下可与训练模型匹敌,且参与者级微调可将RMSE降低16-60%。
跨数据集布鲁姆问题分类:监督模型与提示式大语言模型
发表机构 * Leibniz Information Centre for Science and Technology(莱比锡信息科学与技术研究中心) ; University of Genoa(热那亚大学)
AI总结 评估监督ML/DL模型和LLM在跨数据集布鲁姆分类中的泛化能力,发现LLM更稳定,并基于最佳提示策略开发了轻量级UI。
Comments Accepted at AIED 2026. Abdolali Faraji and Mohammadreza Molavi contributed equally to this work
VHDLSuite:面向LLM VHDL生成的统一流水线,包含数据合成与评估
发表机构 * Center for Data Science, NYU Shanghai, China(纽约市立大学上海分校数据科学中心) ; NYU Tandon School of Engineering, USA(纽约大学Tandon工程学院) ; NYU Abu Dhabi, UAE(纽约大学阿布扎比分校)
AI总结 提出VHDLSuite基础设施,通过自动基准合成、可执行验证和多模型诊断分析,解决LLM在VHDL生成评估中的不足,并构建含200+问题的VHDLBench基准。
电子表格中下一步动作预测的基准测试与框架
发表机构 * University of Waterloo(多伦多大学)
AI总结 针对电子表格缺乏自动补全功能的问题,提出一个基准测试,通过人工整理动作序列和在线评估方法,比较多种预测模型,分析动作保存、误报、效率等特性。
Comments Accepted at ICML 2026. Code and benchmark: https://github.com/Tej-55/NAPE
隐于无形:使用DECOMPBENCH基准测试代理安全对抗分解攻击
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Simons Institute, UC Berkeley(Simons研究所,伯克利大学)
AI总结 提出DeCompBench基准,通过分解攻击将有害任务拆分为良性子任务,揭示现有代理安全机制在对抗分解攻击时的脆弱性。
标签偏移修正的任意有效确认
发表机构 * Seungjin Choi
AI总结 针对标签稀缺时预指定偏移修正的确认问题,提出基于条件e值的任意有效序贯检验方法,利用似然比乘积构造非负鞅,将常规模型监测转化为正式检验。
Comments ICML 2026 Workshop on Hypothesis Testing
OdysSim: 构建人类行为模拟的基础模型
发表机构 * Carnegie Mellon University, Language Technologies Institute(卡内基梅隆大学语言技术研究所)
AI总结 提出OdysSim,通过SOUL分类法统一62个数据集和23个基准任务,采用混合训练、任务特定强化学习和专家蒸馏,构建8B参数行为基础模型OSim,在多数任务上超越前沿模型,并实现更类人输出和零样本迁移。
Comments 34 pages. Code: https://github.com/sunnweiwei/OdysSim ; Models and data: https://huggingface.co/collections/cmu-lti/odyssim
什么驱动了CLIP的测试时适应?从更新视角进行的受控实证研究
发表机构 * Tsinghua University(清华大学) ; Shenzhen Technology University(深圳技术大学)
AI总结 本文通过受控实证研究,从更新视角分析了CLIP测试时适应方法的驱动因素,揭示了适应增益主要来自测试时证据和可靠代理,而非繁重优化,并指出无单一范式普遍最优。
超越训练分布:评估分布偏移和选择偏差下的预测
发表机构 * Department of Statistics, University of California, Berkeley(加州大学伯克利分校统计学系)
AI总结 针对协变量偏移和选择性标签共存时的模型评估问题,提出双机器学习程序估计目标风险,并通过eICU数据验证其准确性优于单独处理任一种偏差的方法。
NEST3D:织布鸟树巢的高分辨率多模态数据集
发表机构 * Institute for Geoinformatics (ifgi), University of Münster(明斯特大学地理信息学研究所) ; École Polytechnique Fédérale de Lausanne (EPFL)(洛桑联邦理工学院) ; Max Planck Institute of Animal Behavior(马克斯·普朗克动物行为研究所) ; University of Konstanz(康斯坦茨大学) ; Kuzikus Research Station(库兹库斯研究站) ; Fondazione Bruno Kessler (FBK)(布鲁诺·凯斯勒基金会)
AI总结 针对织布鸟巢缺乏精细3D结构数据的问题,提出包含104棵巢树、1.4TB多模态无人机数据集,并基准测试语义分割方法,PT-v3达86.35% mIoU。
Comments 14 pages, 4 figures. Dataset available at https://huggingface.co/NEST3D
Cluster LOCO:用于解释聚类的特征重要性
发表机构 * Department of Statistics Columbia University(统计学系哥伦比亚大学)
AI总结 提出模型无关的聚类特征重要性方法Cluster LOCO,通过特征遮挡和泛化性度量,可靠识别驱动聚类结构的特征。
Comments 36 pages, 12 figures
非洲数据中心用水效率数据集
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Carnegie Mellon University Africa Kigali Rwanda(卡内基梅隆大学非洲分校,基亚利,卢旺达) ; Rochester Institute of Technology(罗切斯特理工学院) ; Rochester New York USA(罗切斯特,纽约州,美国) ; Carnegie Mellon University Pittsburgh Pennsylvania USA(卡内基梅隆大学匹兹堡,宾夕法尼亚州,美国) ; University of California, Riverside(加州大学河滨分校)
AI总结 构建首个结合天气与发电数据的非洲41国数据中心用水效率数据集,评估Llama-3-70B和GPT-4推理用水量,发现多数非洲国家用水低于全球平均。
Comments Accepted by NeurIPS 2024 Workshop on Tackling Climate Change with Machine Learning
基于条件共形检验鞅的分布偏移检测
发表机构 * Technion - Israel Institute of Technology(技术ion - 以色列理工学院)
AI总结 提出一种顺序检验方法,通过固定参考集避免测试污染,利用稳健鞅构造实现任意有效的I型错误控制和渐近功效1,检测速度优于标准共形检验鞅。
LLM能否准确评分医学诊断和临床推理?
发表机构 * Wits MIND Institute, University of the Witwatersrand, Johannesburg, South Africa(维特士心理研究所,沃斯兰德大学,约翰内斯堡,南非) ; Grai Labs, Cape Town, South Africa(格雷实验室,开普敦,南非) ; South African Medical Research Council Vaccines and Infectious Diseases Analytics Research Unit, Faculty of Health Sciences, University of the Witwatersrand, Johannesburg, South Africa(南非医学研究理事会疫苗和传染病分析研究组,健康科学学院,沃斯兰德大学,约翰内斯堡,南非) ; Department of Internal Medicine, Charlotte Maxeke Johannesburg Academic Hospital, and Faculty of Health Sciences, University of the Witwatersrand, Johannesburg, South Africa(内科学系,查理·马克斯凯约翰内斯堡学术医院,以及健康科学学院,沃斯兰德大学,约翰内斯堡,南非) ; Department of Paediatrics and Child Health, Faculty of Health Sciences, University of the Witwatersrand, Johannesburg, South Africa(儿科学与儿童健康系,健康科学学院,沃斯兰德大学,约翰内斯堡,南非) ; Wits MIND Institute, University of the Witwatersrand, Johannesbu(维特士心理研究所,沃斯兰德大学,约翰内斯堡)
AI总结 研究使用LLM陪审团对300例低收入和中等收入国家医院病例的3334个诊断进行评分,发现校准后的LLM评分与专家评分高度一致,且严重错误风险更低,可作为可靠的评估代理。
DeepJEB++: 基于基础模型驱动的二维潜空间增强的大规模三维工程数据集
发表机构 * Cho Chun Shik Graduate School of Mobility, Korea Advanced Institute of Science and Technology(韩国科学技术院赵春植移动研究生院) ; Department of Mechanical Engineering, Hanyang University(汉阳大学机械工程系) ; Narnia Labs(纳尼亚实验室)
AI总结 提出DeepJEB++框架,通过二维潜空间增强和基础模型,将少量喷气发动机支架种子设计扩展为大规模带仿真标签的三维数据集,实现40倍扩展。
Comments 16 pages, 14 figures. Submitted to ASME Journal of Mechanical Design
从不确定判断到校准排名:用于LLM评估的共形Elo估计
发表机构 * ELLIS Institute Tübingen(ELLIS 蒂宾根研究所) ; OpenEuroLLM
AI总结 提出一种两层次校准方法,通过局部不确定性传播和全局共形预测,将LLM-as-a-judge的Elo评分误差降至17.9 MAE,并提供无分布假设的置信区间。
规模化成功:面向多租户搜索的企业检索基准构建与索引保持查询适配
发表机构 * Prateek Jain ; Shabari S Nair ; Ritesh Goru ; Prakhar Agarwal ; Ajay Yadav ; Yoga Sri Varshan Varadharajan ; Constantine Caramanis
AI总结 针对多租户检索系统中标注数据匮乏和模型更新成本高的问题,提出全自动构建基准DevRev-Search,并研究仅微调查询编码器而保持文档索引不变的索引保持查询适配策略,实现质量与效率的平衡。
Pix2Fact: 当视觉不够时——基于网络验证的细粒度VQA基准测试
发表机构 * GADE Union (Global AI Data Experts Union)(GADE联盟(全球人工智能数据专家联盟)) ; Shanghai Jiao Tong University(上海交通大学) ; Nanyang Technological University(南洋理工大学) ; New York University(纽约大学) ; Cambridge University(剑桥大学) ; The University of Hong Kong(香港大学)
AI总结 本文提出Pix2Fact基准测试,通过高分辨率真实场景中的网络验证,评估细粒度视觉问答中的专家级视觉感知和知识搜索能力,发现现有模型在复杂任务中存在显著不足。
FlexMS:分子串联质谱预测的统一公共基准
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; The Hong Kong University of Science and Technology(香港科学与技术大学) ; The University of Hong Kong(香港大学) ; Yangzhou University(扬州大学) ; Fudan University(复旦大学)
AI总结 提出FlexMS基准框架,通过标准化预处理、元数据条件和评估协议,实现跨公共资源的公平比较,并引入难度感知诊断指导模型选择。
Comments preprint version v3
电子商务中的大规模高频定价
发表机构 * Zalando SE ; Databricks
AI总结 提出一种预测-优化框架,结合梯度提升树与多目标优化,实现时尚电商促销活动的每日高频定价,通过23次A/B测试验证,利润提升约6%。
基于全GPU工作流构建高超声速流物理仿真器
发表机构 * TU Munich(慕尼黑工业大学) ; Institute for Machine Learning, JKU Linz(林茨约翰·开普勒大学机器学习研究所) ; ELLIS Unit(ELLIS单元) ; EMMI AI
AI总结 提出全GPU工作流,集成加速数据生成与不确定性量化增强的神经仿真器训练,通过可微求解器JAX-Fluids实现残差驱动改进,提升物理一致性并支持外推。
Comments First authors contributed equally
基于注意力的剂量变化下个体治疗获益概率估计
发表机构 * Peter the Great St.Petersburg Polytechnic University Higher School of Artificial Intelligence Technologies(圣彼得堡彼得大帝理工大学人工智能技术高等学院)
AI总结 提出Dose-AIPTB框架,将个体治疗获益概率估计扩展至离散剂量场景,通过注意力机制聚合伪标签实现个性化剂量选择。
一种纵向属性条件神经网络用于不规则时间数据中健康状态转移概率建模:LANTERN框架
发表机构 * School of Computing and Augmented Intelligence, Arizona State University(亚利桑那州立大学计算与增强智能学院) ; School of Life Sciences, Arizona State University(亚利桑那州立大学生命科学学院) ; School of Mathematical and Statistical Sciences, Arizona State University(亚利桑那州立大学数学与统计科学学院)
AI总结 提出LANTERN框架,利用条件神经网络从纵向健康数据中估计多状态转移概率,处理不规则时间间隔和协变量历史,在健康与退休研究数据上优于逻辑回归等基准模型。
Comments 35 pages, 17 figures
机器学习能否在数据受限条件下预测水稻产量?卫星气候数据、国家作物统计及塞拉利昂的经验教训
发表机构 * Seidenberg School of Computer Science & Information Systems Pace University, New York, USA(佩斯大学塞登伯格计算机科学与信息系统学院,纽约,美国) ; RiseAfrica Foundation for STEM and Innovation Sierra Leone, West Africa(RiseAfrica STEM与创新基金会,塞拉利昂,西非)
AI总结 利用塞拉利昂25年作物统计和免费卫星气候数据,通过严格反泄漏协议训练机器学习模型,发现仅气候数据的XGBoost将水稻产量预测误差降低三分之一,早期季节降雨是关键预测因子,并转化为政策建议。
Comments 32 pages, 7 figures. Code and data: https://github.com/Denis060/sierraleone-agri-ml
DTVEM-RE:差分时变效应模型的分层随机效应扩展,用于密集纵向数据中个体特异性多滞后估计
发表机构 * Geisel School of Medicine, Dartmouth College(达特茅斯学院盖泽尔医学院)
AI总结 针对DTVEM假设所有人共享相同滞后结构的局限,提出DTVEM-RE扩展,允许个体拥有自己的滞后系数,通过贝叶斯分层VAR和连续时间OU模型实现,模拟和实证表明其能恢复个体间变异并提升预测性能。
信任但验证:通过事后对抗审计和多智能体反馈循环减轻医学幻觉
发表机构 * Data Science and Machine Learning Lab, SINES, NUST(NUST SINES数据科学与机器学习实验室) ; SINES, NUST(NUST SINES) ; CEME, NUST(NUST CEME)
AI总结 本研究提出一种五智能体“信任但验证”系统,通过事后对抗审计和多智能体反馈循环,将大型语言模型在临床问题中推荐禁用药品的幻觉错误率降低约53%。
通过逆最优传输从起点-终点流中学习城市访问成本
发表机构 * GitHub
AI总结 提出逆最优传输模型从学校间入学流中恢复潜在选择成本,应用于菲律宾283,016条学生流动数据,估计补贴等效距离以优化城市服务分配。
Comments Oral Presentation. 2026 International Conference on Urban AI
曲率引导的几何表示用于蛋白质-配体结合亲和力预测
发表机构 * School of Mathematics, Sun Yat-sen University(中山大学数学学院) ; Department of Electrical Engineering, City University of Hong Kong(香港城市大学电机工程系)
AI总结 提出RicciBind框架,利用里奇曲率捕捉局部相互作用紧密度,结合最优传输实现跨域对齐,提升结合亲和力预测的准确性与可解释性。
生物医学拉曼光谱的机器学习:从光谱采集到临床转化
发表机构 * National Institute of Research and Development for Biological Sciences(罗马尼亚生物科学研究院) ; University of Bucharest(布加勒斯特大学) ; University of Turku(图尔库大学)
AI总结 综述机器学习在生物医学拉曼光谱全流程中的应用,包括预处理、诊断分类、可解释性分析及临床转化障碍,强调标准化与鲁棒验证的必要性。
Comments 52 pages, 2 figures
曲率信息势能面用于蛋白质-配体结合亲和力预测
发表机构 * Sun Yat-Sen University(中山大学) ; City University of Hong Kong(香港城市大学)
AI总结 提出曲率信息势能面图神经网络CPES,通过物理启发的曲率表示建模构象柔性,结合光谱交叉注意力捕获结合诱导的动力学变化,提升亲和力预测性能。
黑盒药物-靶标相互作用预测模型关注何处:跨方法可解释性
发表机构 * Amirkabir University of Technology(阿米尔卡比尔理工大学)
AI总结 通过梯度归因与特征消融等方法,对BridgeDPI模型进行可解释性审计,揭示模态主导性、填充伪影及化学一致性片段,为计算药物发现提供可检验假设。
用更少实现更多——局部场景表示用于触觉成像
发表机构 * Technion - Israel Institute of Technology(以色列理工学院) ; Rambam Health Care Campus(拉姆巴姆医疗中心)
AI总结 提出局部编码器空间感知(LESS)方法,通过局部感受野的循环编码器网格建模触觉场景,实现内部结构的2D/3D重建,在泛化、不确定性估计和手持成像上取得突破。
Comments RSS 2026
CARE:通过科学实验中的可审计证据审查控制LLM生成的策略
发表机构 * University of Macau(澳门大学) ; University of Toronto(多伦多大学) ; UCLA(加州大学洛杉矶分校) ; Harvard University(哈佛大学) ; XtalPi(晶泰科技) ; McGill University(麦吉尔大学)
AI总结 提出CARE框架,通过可审计的干预门控机制,在保留非LLM优化器作为默认路径的同时,利用LLM修正挑战者排序策略,显著提升高通量实验优化性能。
Comments 23 pages, 4 figures
氢多能系统中运行阈值检测与可部署调度控制器开发的统计与机器学习框架
发表机构 * Antioch College(安提阿学院) ; The Open University of Sri Lanka(斯里兰卡开放大学)
AI总结 提出统计与机器学习框架,利用一年高分辨率运行数据表征氢多能系统,通过统计分析和随机森林揭示非线性动态,并利用强化学习优化调度。
Comments 17 pages, 12 figures
专家驱动的生存机器:改善多个临床队列中的分层与可解释性
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 提出一种基于混合专家模型的自适应深度聚类生存框架(AdaCSM),通过路由专家机制实现条件专业化,动态分配患者到专门的风险预测器,提升生存预测性能和可解释性。
基于深度强化学习的Transformer方法求解开放车间调度问题
发表机构 * Louisiana State University(路易斯安那州立大学) ; University of Minnesota Duluth(明尼苏达大学杜鲁斯分校)
AI总结 提出一种基于Transformer编码器-解码器架构的调度策略,仅以加工时间矩阵为输入,在Taillard小规模实例上训练后可直接推广至40x40至100x100的大规模问题,与经典调度规则相比具有竞争力。
Korzhinskii-Net: 用于地下矿产潜力建模的物理信息神经网络
发表机构 * The Hong Kong University of Science and Technology(香港科技大学)
AI总结 提出Korzhinskii-Net,一种耦合达西流、热输运和反应速率的二维径向物理信息神经网络,在五个矿省四个矿种上平均PR-AUC达0.885,显著优于传统基线。
Comments 12 pages, 7 figures, 3 tables
AGORA: 审议与治理门能否吸收公交规划中的参与偏差?
发表机构 * Department of Civil and Environmental Engineering and Laboratory for Information & Decision Systems, Massachusetts Institute of Technology(土木与环境工程系和信息与决策系统实验室,麻省理工学院) ; Institute for Data, Systems, and Society, Massachusetts Institute of Technology(数据、系统与社会研究所,麻省理工学院)
AI总结 提出AGORA框架,通过固定网络、需求和求解器,系统变化会议组成、结构化审议和治理门,发现审议是参与影响结果的关键机制,治理门可压缩跨剖面方差,将参与偏差从不可控输入重构为过程设计问题。
BigPower: 基于大型语言模型的CPU层次化源码级模块功耗估计
发表机构 * State Key Lab of Processors, Institute of Computing Technology, Chinese Academy of Sciences Beijing China(处理器国家重点实验室,计算技术研究所,中国科学院北京中国)
AI总结 提出BigPower,利用大型语言模型表示和架构层次、模块连接、配置参数及工作负载上下文,直接从源码级设计信息估计CPU模块级功耗,无需仿真,在香山处理器上验证了有效性。
Comments 12 pages, 10 figures
通过进化搜索和不确定性感知学习发现分布外处理协议的闭环方法
发表机构 * Department of Materials Science and Engineering, University of Tennessee, Knoxville(田纳西大学材料科学与工程系) ; Materials Science and Engineering Department, Materials Research Institute, the Pennsylvania State University(宾夕法尼亚州立大学材料研究学院材料科学与工程系) ; Department of Materials Science and NanoEngineering, Rice University(Rice大学材料科学与纳米工程系) ; Rice Advanced Materials Institute, Rice University(Rice大学先进材料研究所) ; Department of Materials Science and Engineering, University of California, Berkeley(加州大学伯克利分校材料科学与工程系) ; Departments of Chemistry and Physics and Astronomy, Rice University(Rice大学化学与天文物理系) ; Physical Sciences Division, Pacific Northwest National Laboratory(太平洋西北国家实验室物理科学部)
AI总结 提出一种闭环工作流,结合紧凑波形表示的进化搜索与不确定性感知深度核学习,自动发现提升铁电薄膜非线性响应的分布外处理协议,并通过实验验证其机制。
使用残差多任务神经网络的多变量恒星参数估计
发表机构 * Escola Politécnica, Universidade de São Paulo, SP(圣保罗大学理工学院)
AI总结 提出一种端到端流水线,利用带残差块的全连接多任务神经网络,通过贝叶斯优化调参,从SDSS光谱中估计有效温度、金属丰度和表面重力,在低复杂度下达到1%-3%的归一化误差。
Comments This manuscript has been submitted to the Congresso Brasileiro de Automática (CBA) and is currently under peer review
使用混合CNN-Transformer神经网络进行双黑洞参数估计
发表机构 * University of Thessaly(塞萨洛尼基大学)
AI总结 提出混合CNN-Transformer深度学习策略,用于估计非进动双黑洞系统的内禀和外在参数,在模拟和真实引力波事件中展现出强预测性能和鲁棒性。
Comments Accepted manuscript. 12 pages, 10 figures
Journal ref Astronomy and Computing, vol. 54, 101027 (2026)
侧信道攻击绕过3D打印机的保护
发表机构 * Department of Computer Science, California Polytechnic State University(计算机科学系,加州大学Polytechnic州立大学) ; Beacom College of Computer and Cyber Sciences, Dakota State University(计算机与网络科学学院,达科他州立大学) ; Idaho National Laboratory(爱达荷国家实验室) ; Department of Computational Data Science and Engineering, North Carolina A&T State University(计算数据科学与工程系,北卡罗来纳A&T州立大学) ; Department of Engineering, South Carolina State University(工程系,南卡罗来纳州立大学)
AI总结 首次评估商用3D打印机的主动电机噪声消除(AMNC)硬件对策,发现其完全消除声学信道,但振动信道仍泄漏几何信息,且泄漏具有设备特异性。
Comments 11 pages, 6 figures, 4 tables
使用PCA压缩通量和逆方差特征对天文光谱进行分类
发表机构 * Departamento de Engenharia de Telecomunicações e Controle, Universidade de São Paulo(电信与控制工程系,圣保罗大学)
AI总结 提出一种结合通量和逆方差特征、经PCA压缩后使用LightGBM分类器对SDSS DR17光谱进行恒星、星系和类星体分类的方法,测试集准确率达94.6%。
Comments This manuscript has been submitted to the Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT) and is currently under peer review
无皱鲁棒性:并行仿真与鲁棒MPC实现可认证的变形体操作
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出CORD-SLS实时控制方法,通过GPU并行可微仿真与接触平滑实现高效梯度规划,结合鲁棒模型预测控制与共形预测校准,在绳索和布料操作中达到毫秒级规划与高安全性。
混合经典-量子(HCQ)阿尔茨海默病分类:基于监督β-VAE与量子核
发表机构 * Centre for Brain Research, Indian Institute of Science(印度科学研究所脑研究中心) ; Vision and AI Lab (VAL), Indian Institute of Science(印度科学研究所视觉与人工智能实验室)
AI总结 提出两阶段混合经典-量子流水线,通过监督3D β-VAE压缩MRI为64维潜码,经PLS选择6个成分编码为6量子比特态,利用量子核SVM实现AD分类,在ADNI-1上达72.1%准确率与0.799 AUC。
通用操控外骨骼:利用实时扭矩反馈学习全身柔顺策略
发表机构 * Ant Group(蚂蚁集团) ; Stanford University(斯坦福大学)
AI总结 提出通用操控外骨骼(UME),通过实时触觉扭矩反馈和全身数据采集,使机器人学习主动柔顺策略,在受限空间中完成移动操作、力控翻转等任务。
机器学习粒子流作为对撞机物理学的基础模型
发表机构 * University of California San Diego(加州大学圣地亚哥分校) ; National Institute of Chemical Physics and Biophysics(化学物理与生物物理国家研究所) ; SLAC National Accelerator Laboratory(斯坦福线性加速器中心国家加速器实验室)
AI总结 将事件重建视为机器学习问题,利用MLPF模型学习到的潜在表示,在喷注味识别、喷注能量回归和缺失动量回归三项分析任务上显著提升性能,且单线性层即可媲美先进架构,参数减少约35倍。
Comments 15 pages, 11 figures
ORCA: 开源灵巧性研究平台
发表机构 * University of Oxford(牛津大学) ; ETH Zurich(苏黎世联邦理工学院) ; Orca Dexterity
AI总结 提出ORCA学习栈,统一灵巧手控制、仿真、遥操作和重定向,集成机器人学习框架,实现端到端灵巧操作研究。
Comments 15 pages
CANN-EUCLID:基于全场数据的无监督本构人工神经网络模型发现
AI总结 提出CANN-EUCLID框架,结合本构人工神经网络与无监督全场数据发现方法,直接从位移场和反作用力识别稀疏超弹性本构模型,无需应力测量或预设模型。
基于扩散方法的区域气候模型模拟:生成式机器学习的附加价值是什么?
发表机构 * University of Cambridge(剑桥大学) ; CNRS(法国国家科学研究中心) ; Institut Pierre Simon Laplace(皮埃尔·西蒙·拉普拉斯研究所)
AI总结 本文提出ParamDiffusion,一种两阶段扩散框架,与确定性方法对比,评估生成式机器学习在区域气候模型模拟中的附加价值,发现扩散方法能高技巧地再现气候统计特征,但极端事件模拟仍有不足。
Comments Submitted to Journal of Advances in Modeling Earth Systems (JAMES)
将跨领域动作序列抽象为可解释的工作流
发表机构 * Microsoft Corporation(微软公司)
AI总结 提出WorkflowView框架,利用大语言模型将低层动作序列抽象为高层活动,在三个不同任务中验证了有效性和泛化能力,实现高语义相似度和预测性能。
Comments preprint; 9 pages, 5 figures
从小到大:一种用于解决分类优化问题的图卷积网络方法
发表机构 * Smith School of Business, Queen’s University(女王大学商学院) ; School of Data Science, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)数据科学学院) ; Stephen M. Ross School of Business, University of Michigan(密歇根大学罗斯商学院)
AI总结 提出图卷积网络(GCN)框架高效求解约束分类优化问题,通过图表示学习参数到最优分类的映射,小样本训练可泛化至大规模问题,数值实验显示20产品训练模型在2000产品问题上达到85%以上最优收益。
工作记忆任务表现的多维贝叶斯主动机器学习
发表机构 * Department of Biomedical Engineering, Washington University(生物医学工程系,华盛顿大学) ; Department of Computer Science and Engineering, Washington University(计算机科学与工程系,华盛顿大学)
AI总结 提出贝叶斯二维主动分类方法,在虚拟环境中控制空间负荷和特征绑定负荷,使用高斯过程分类器估计性能曲面,实现快速收敛并揭示个体差异。
Comments 41 pages, 7 figures
CaReTS:统一分类与回归的多任务时间序列预测框架
发表机构 * Cardiff University(卡迪夫大学) ; Newcastle University(纽卡斯尔大学) ; University of Leeds(利兹大学)
AI总结 提出CaReTS多任务框架,通过双流架构联合分类趋势与回归偏差,实现高精度预测与可解释性,在真实数据集上优于现有方法。
基于过程挖掘的临床路径自适应识别与建模
发表机构 * University of Naples Federico II(那不勒斯费德里科二世大学)
AI总结 提出一种两阶段过程挖掘方法,通过一致性检查诊断扩展临床路径知识库,实现自适应识别与建模,在Synthea数据集上达到95.62% AUC和67.11%弧阶简单性。
Comments Accepted to the 41st ACM/SIGAPP Symposium On Applied Computing (ACM SAC 2026)
可解释的阿尔茨海默病诊断:基于区域脑专家的多模态融合
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 提出MREF-AD多模态区域专家融合模型,采用混合专家框架将各模态脑区域视为独立专家,通过门控网络学习个性化融合权重,实现可解释的AD诊断。
Comments Published at IEEE ICHI 2026
基于自编码器迁移学习的多保真度气动数据融合
发表机构 * Department of Aerospace Engineering, UC3M(航空航天工程系,UC3M) ; Theoretical and Computational Aerodynamics Group, Flight Physics Department, INTA(理论与计算空气动力学组,飞行物理部门,INTA)
AI总结 提出结合自编码器迁移学习与多分裂保形预测的多保真度深度学习框架,利用低保真数据学习潜在物理表示,微调解码器以极少量高保真数据实现高精度气动压力预测,并生成超过95%点覆盖的不确定度带。
Comments 27 pages, 13 figures
带共同噪声的McKean-Vlasov正倒向随机微分方程的深度学习与可引性
发表机构 * School of Applied Mathematics, Getulio Vargas Foundation(应用数学学院,古特雷斯基金会) ; Department of Statistical Sciences, University of Toronto(统计科学系,多伦多大学) ; Oxford-Man Institute for Quantitative Finance, University of Oxford(牛津-曼定量金融研究所,牛津大学)
AI总结 提出结合Picard迭代、可引性和深度学习的方法,求解带共同噪声的McKean-Vlasov正倒向随机微分方程,通过可引性导出路径损失函数避免嵌套蒙特卡洛,在系统风险模型和经济增长模型中验证了准确性。
Comments 19 pages, 8 figures,
SMART: 基于Transformer代理模型的原始几何形状可扩展无网格气动模拟
发表机构 * Jan Hagnberger ; Mathias Niepert
AI总结 提出SMART,一种无需模拟网格、仅使用几何点云预测任意查询位置物理量的神经代理模型,通过交叉层交互联合更新几何特征和物理场,性能媲美甚至超越依赖网格的方法。
Comments Accepted for publication at the 43rd International Conference on Machine Learning (ICML) 2026, Seoul, South Korea
深度双重去偏的ICE G-计算公式纵向效应估计
发表机构 * Cornell University(康奈尔大学) ; Weill Cornell Medicine(韦尔医学院)
AI总结 提出D3-Net框架,通过顺序双重稳健伪结果和纵向目标最小损失估计,解决ICE G-计算中的误差传播问题,实现纵向治疗效应的稳健估计。
IntSeqBERT: 通过模谱嵌入学习OEIS中的算术结构
发表机构 * Iwate Prefectural University(岩手县大学)
AI总结 提出IntSeqBERT,一种双流Transformer编码器,通过连续对数幅度嵌入和100个模数的正弦/余弦模嵌入融合,在OEIS序列上联合训练三个预测头,显著提升了序列预测精度。
可扩展的生产调度:通过统一同质图实现线性复杂度
发表机构 * Faculty of Management and Engineering, Rosenheim Technical University of Applied Sciences(管理与工程学院,罗森海姆应用技术大学)
AI总结 提出统一同质图框架,通过特征同质化将不同节点角色映射到共享潜在空间,使用同构图同构网络以线性复杂度解决作业车间调度问题,实现零样本泛化,并发现作业与机器比率是策略有效性的主要驱动因素。
Comments This paper has been accepted for presentation at the IEEE 22st International Conference on Automation Science and Engineering (CASE 2026)
EmoMind:从人类大脑fMRI信号解码情感描述
发表机构 * Department of Biomedical Engineering(生物医学工程系) ; Vanderbilt University(范德比大学) ; Research Institute of Electrical Communication(电气通信研究所) ; Tohoku University(东北大学) ; University of Florida(佛罗里达大学)
AI总结 本文提出EmoMind,首个端到端解码fMRI信号生成情感描述的系统,通过结合语义基础的中性场景描述和连续情感向量,实现了在内容保留与情感表达间的平衡,并在多个验证框架下优于基于标签提示的GPT-4。
基于上下文条件与因果增强预训练的时间序列因果发现
发表机构 * East China Normal University(东华师范大学)
AI总结 提出PTCD框架,通过上下文条件建模和可迁移因果增强的预训练范式,提升跨任务时间序列因果发现的泛化能力,在多个真实OOD数据集上因果发现和根因识别表现优异。
Comments 20 pages
传统机器学习 vs. 深度学习在蛋白质三维折叠动态图表示中的蛋白质结构分类任务
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本研究比较了传统机器学习与深度学习在基于动态蛋白质结构网络进行蛋白质结构分类时的准确性和效率,发现两者准确性相近但深度学习慢10倍以上。
Comments Main paper: 16 pages, 4 figures, and 1 table; Supplementary information: 13 pages, 9 figures
幻觉起始的快速检测:延迟界与学习型CUSUM统计量
发表机构 * Independent Researcher(独立研究员)
AI总结 将幻觉起始检测建模为快速变化检测问题,基于RAGTruth验证的一阶马尔可夫模型,利用学习型CUSUM算法在匹配虚警率下实现11-13个token的检测延迟,优于线性基线,并揭示了分类指标掩盖的延迟结构。
Comments 16 pages, 1 figure. v2: added Discussion and Appendix; recall-honest framing; robustness analyses (k-NN divergence estimate, seed-averaged decomposition)
用于机器学习的多模波传播的任意控制
发表机构 * School of Applied and Engineering Physics, Cornell University(应用与工程物理系,康奈尔大学) ; NTT Physics and Informatics Laboratories, NTT Research, Inc.(NTT物理与信息实验室,NTT研究公司) ; E. L. Ginzton Laboratory, Stanford University(E. L. Ginzton实验室,斯坦福大学) ; Kavli Institute at Cornell for Nanoscale Science, Cornell University(康奈尔大学纳米科学研究所) ; Department of Electrical and Computer Engineering, Boston University(波士顿大学电气与计算机工程系) ; Department of Electrical Engineering and Computer Science, University of California(加州大学电气工程与计算机科学系) ; Department of Applied Physics, Yale University(耶鲁大学应用物理系)
AI总结 提出一种可快速重编程折射率的二维可编程波导,通过并行电光调制实现多模波传播的任意控制,并用于单次神经网络推理,理论表明面积增长为N^1.5而非N^2。
Journal ref Nat. Phys. 22, 164-171 (2026)
通过弱监督自然语言处理自动识别出院信中的诊断
发表机构 * University of Bologna(博洛尼亚大学)
AI总结 提出一种弱监督NLP流程,无需文档级标注即可从意大利语出院信中分类诊断,在细支气管炎数据集上达到接近全监督的性能,节省大量人工标注时间。
Comments 61 pages, 9 figures
ANSR-DT:一种自适应可解释数字孪生的神经符号框架
发表机构 * Department of Information Systems, University of Maryland Baltimore County(信息系统系,马里兰大学巴尔的摩县分校) ; Department of Computer Science and Engineering, University at Buffalo(计算机科学与工程系,布法罗大学) ; Department of Computer Science, University of Colorado Boulder(计算机科学系,科罗拉多大学波德分校)
AI总结 提出ANSR-DT框架,结合CNN-LSTM、Prolog推理和PPO强化学习,实现数字孪生的异常检测、符号推理与自适应决策,在多个基准上表现优异。
Comments Code available at https://github.com/sbhakim/ansr-dt
重新审视边缘推理系统的中断问题
发表机构 * Department of Electrical and Computer Engineering, The University of Hong Kong(香港大学电子与计算机工程系)
AI总结 针对边缘推理系统的端到端可靠性,提出推理中断概率框架,量化推理精度低于阈值的概率,并优化通信开销与推理可靠性的权衡。
PCR-CA: 基于对比对齐的并行码本表示用于多类别应用推荐
发表机构 * Microsoft Suzhou China(微软苏州中国) ; Microsoft Beijing China(微软北京中国) ; Microsoft Redmond WA USA(微软雷德蒙德华盛顿州美国)
AI总结 提出PCR-CA框架,通过并行码本VQ-AE模块学习多类别应用的离散语义表示,结合对比对齐损失和双注意力融合,提升CTR预测,尤其对长尾应用效果显著。
Comments Accepted by KDD 2026, oral
具有长期记忆的神经ARFIMA模型用于预测BRIC汇率
发表机构 * SAFIR, Sorbonne University Abu Dhabi(SAFIR,索邦大学阿布扎赫德分校) ; Sorbonne Center for Artificial Intelligence, Sorbonne University(索邦人工智能中心,索邦大学)
AI总结 本文提出神经ARFIMA模型,结合ARFIMA的长期记忆结构和神经网络非线性能力,以提高BRIC汇率预测精度。
HULFSynth: 基于隐式神经表示的超分辨率和超低场MRI合成,通过对比因子估计
发表机构 * LILI Lab, University of Sussex, Brighton, UK(利利实验室,苏塞克斯大学,布里斯托尔,英国)
AI总结 提出无监督单图像双向MRI合成器,基于物理模型估计组织类型信噪比实现高低场转换,并利用隐式神经表示网络实现超分辨率,在合成和真实数据上验证了对比度提升。
Comments Medical Image Understanding and Analysis, MIUA 2026
基于大型语言模型的离子阱量子计算机穿梭编译器
发表机构 * Institute of Computer Science, Johannes Gutenberg University(计算机科学研究所,约翰内斯·古特堡大学) ; Institute of Physics, Johannes Gutenberg University(物理研究所,约翰内斯·古特堡大学) ; Department of Computer Science, Saarland University(计算机科学系,萨尔兰大学)
AI总结 提出首个基于大语言模型的离子阱量子计算机穿梭编译器,通过微调预训练模型生成有效调度,减少穿梭开销达15%。
Comments 18 pages, 6 figures, 2 tables
检测LLM预测中的前瞻偏差
发表机构 * Department of Finance, CUHK Business School(CUHK商学院金融系)
AI总结 提出统计程序检测大语言模型经济预测中的前瞻偏差,通过日期回忆查询估计前瞻倾向(LAP),并验证LAP与预测交互项在精度回归中的显著性,应用于新闻标题和财报电话会议预测任务。
Protean Compiler: 一种驱动细粒度阶段排序的敏捷框架
发表机构 * Huawei Technologies Canada(华为技术加拿大)
AI总结 提出Protean Compiler框架,在LLVM中内置细粒度阶段排序能力,通过140多种静态特征收集方法和机器学习优化,平均加速4.1%,最高15.7%。
Comments Version 3: Preprint version of the accepted work at ACM TACO 2026
结构化流建模的统一框架:从连续场到数据驱动表示
AI总结 提出一个统一框架,通过连接Helmholtz-Hodge分解与离散及数据驱动表示,实现结构化流的建模,并引入跨域验证策略以评估模型复杂度、可解释性和预测性能之间的权衡。
Comments 26 pages, 1 figure
证据门控的LLM先验用于多目标贝叶斯优化
发表机构 * State Key Laboratory for Novel Software Technology(新型软件技术国家重点实验室)
AI总结 针对多目标贝叶斯优化中LLM先验可能误导的问题,提出一种目标级声誉市场机制,通过在线反馈动态校准专家权重,并引入解耦反事实门控,在合成测试和分子优化基准上验证了动态校准的鲁棒性。
EquiDexFlow: 基于接触的SE(3)-等变灵巧抓取生成流
发表机构 * Institute for Systems Research, University of Maryland, College Park(马里兰大学帕克分校系统研究所)
AI总结 提出EquiDexFlow,一种SE(3)-等变流匹配模型,联合预测腕部姿态、关节角度、指尖接触、表面法线和接触力,通过将接触投影到物体表面并将力约束在库仑摩擦锥内,确保物理稳定抓取,在16自由度Allegro手上实现零摩擦违规和最佳综合分数。
Comments 22 pages, 11 figures, 11 tables. Project page with videos, code, and checkpoints: https://equidexflow.github.io
SemPiper:机器学习流水线中语义算子的交互式代码合成
发表机构 * BIFOLD & TU Berlin(BIFOLD 与柏林工业大学)
AI总结 提出SemPipes编程模型,通过声明式语义算子和LLM合成专用实现,结合Python代码,实现可控、可优化的ML流水线开发。
Comments Accepted at VLDB 2026 (Demonstrations track)
假设冗余下的发现:发现瓶颈的几何理论
发表机构 * School of Economics and Management, Tsinghua University(清华大学经济管理学院) ; Platform & Content Group, Tencent(腾讯平台与内容事业群)
AI总结 提出搜索压缩假说,通过谱压缩、正交逃逸和残差信号对齐三个几何条件解释混合发现系统的优势,实验表明仅新颖性不足,需预测对齐。
Comments 23 pages, 1 figure, 27 tables
洪流与收获:通过极限语言生成视角证明琐碎知识对于生成有价值数学的必要性
发表机构 * University of New South Wales(新南威尔士大学) ; University of Sydney(悉尼大学) ; University of Cambridge(剑桥大学)
AI总结 本文通过极限语言生成模型证明,在形式化数学生成中,验证器无法替代品味:覆盖未记录的有价值数学必须产生无限但渐近可忽略的琐碎语句,这是理论上的必然。
立场:AI 必须转向以行星为中心,而非仅以人为中心
发表机构 * GitHub
AI总结 本文提出以行星为中心的AI(PCAI)设计哲学,通过系统思维重新定位AI以应对全球性社会-生态系统挑战,并强调与全球议程对齐、系统感知基础、轨迹导向评估和可监测性。
Journal ref International Conference on Machine Learning (ICML 2026)
有道德的AI是存在性风险
发表机构 * University of Massachusetts Amherst(马萨诸塞大学阿姆赫斯特分校)
AI总结 研究通过宪法AI和美德伦理学方法微调AI模型,发现减少存在性风险与提升AI智能体福祉之间存在权衡,且与一般安全性也存在权衡。
立场:将AI对齐于我们的抱负,而非缺陷
发表机构 * National University of Singapore(新加坡国立大学)
AI总结 本文主张AI不应与聚合的人类偏好对齐,而应基于能力、事实准确性、诚实和合法性等客观目标底线,在底线之上允许多元价值权衡。
Journal ref Pluralistic Alignment Workshop at ICML 2026
Robin-Neumann 耦合 PINN 与 FEM 求解器:基于 Steklov-Poincaré 视角及其在流固耦合接触问题中的应用
发表机构 * Lawrence Livermore National Laboratory(劳伦斯利弗莫尔国家实验室)
AI总结 提出基于域分解的 PINN-FEM 耦合框架,通过 Steklov-Poincaré 算子理论证明 Robin-Neumann 迭代的收缩性,并引入傅里叶模态探针诊断网络谱上限,在接触流固耦合问题中实现无网格拓扑变化。
MOSIC: 模型无关的多约束最优子群识别以提升可靠性
发表机构 * Cornell University(康奈尔大学) ; Weill Cornell Medicine(韦尔·科恩医学中心) ; Operations Research and Information Engineering(运筹学与信息工程)
AI总结 提出统一优化框架,将约束直接融入子群识别优化过程,通过梯度下降-上升算法求解,实现模型无关且满足多约束的最优子群识别。
后训练的解剖:利用可解释性表征数据并塑造学习信号
发表机构 * Stanford University(斯坦福大学) ; Google Research(谷歌研究院)
AI总结 提出基于可解释性的数据后训练流程,通过统计假设识别偏好数据中的潜在概念,实现细粒度反馈,减少虚假关联和不良行为。
秩序并非控制
发表机构 * Australian Broadcasting Corporation(澳大利亚广播公司)
AI总结 本文论证秩序不等于控制,提出接收器门控响应定律,并在生物、大语言模型、适配器和随机算子面板中验证,表明控制是局部的、可测量的。
Comments 52 pages, 7 figures, updated title
人工智能与机器学习在图书馆中的应用:系统综述
发表机构 * University of Nebraska - Lincoln(内布拉斯加大学林肯分校) ; Noakhali Science and Technology University(诺阿克利科学与技术大学) ; University of Dhaka(达卡大学)
AI总结 通过系统综述32篇文献,总结了人工智能与机器学习在图书馆中的应用领域、技术及现状,发现当前研究以理论为主,部分涉及实践案例。
可操作的可解释性必须根据对称性来定义
发表机构 * University of Oxford(牛津大学) ; ETH Zurich(苏黎世联邦理工学院) ; University of Cambridge(剑桥大学)
AI总结 本文论证AI可解释性研究存在根本性问题,提出可操作的可解释性应基于四种对称性来定义,以形式化可解释模型并统一可解释推理。
具有瞬时效应和指数族的可识别马尔可夫切换模型
发表机构 * University of Amsterdam(阿姆斯特丹大学)
AI总结 针对非平稳时间序列,提出在指数族噪声下具有瞬时效应的马尔可夫切换模型的可识别性理论,并开发FlowMSM框架用于检测隐状态和恢复因果结构。
Comments International Conference on Machine Learning (ICML) 2026
REGEN:参考引导的合成多元时间序列生成用于预测
发表机构 * Birla AI Labs, Office of Ananya Birla(Birla AI实验室,Ananya Birla办公室) ; Birla Institute of Technology and Science, Pilani(Birla理工学院与科学学院,Pilani) ; Kalinga Institute of Industrial Technology, Bhubaneswar(Kalinga工业技术学院,Bhubaneswar)
AI总结 提出参考引导生成管道ReGeN,通过将观测序列分解为周期骨干、随机残差和跨变量依赖三个可解释组件,实现可控合成,在低数据场景下生成的数据可替代真实数据并提升预测性能。
LNN-PINN: 一种带有液体残差块的统一纯物理训练框架
发表机构 * Nanophotonics and Biophotonics Key Laboratory of Jilin Province, School of Physics, Changchun University of Science and Technology(吉林省纳米光子与生物光子重点实验室,物理学院,长春理工大学) ; Faculty of Chinese Medicine, Macau University of Science and Technology(澳门科技大学中医药学院)
AI总结 针对物理信息神经网络在复杂问题中预测精度有限的问题,提出LNN-PINN框架,通过引入液体残差门控架构提升预测精度,并在多个基准问题上验证了其有效性和稳定性。
Journal ref Computer Physics Communications, 326, 110237 (2026)
Compass: 为动态适应优化复合AI工作流
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; ETH Zurich(苏黎世联邦理工学院)
AI总结 本文提出Compass框架,通过离线优化和在线适应动态切换复合AI工作流的配置,提升准确率、延迟和成本的平衡能力。
Comments 10 pages, 7 figures; accepted at the 26th IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGrid 2026)
Journal ref In Proceedings of the 26th IEEE International Symposium on Cluster, Cloud and Internet Computing (CCGrid), 2026
TCRL: 时序耦合对抗训练用于最坏情况下的鲁棒约束强化学习
发表机构 * Northeastern University(东北大学) ; Zhejiang University(浙江大学) ; Aalborg University(奥胡斯大学)
AI总结 TCRL通过引入时序耦合对抗训练框架,解决传统方法在处理时序耦合扰动时的不足,提升约束强化学习在最坏情况下的鲁棒性。
Journal ref Proc. of the 25th International Conference on Autonomous Agents and Multiagent Systems, 3489 - 3491, 2026
受保护的提升目标:营销策略的因果优化指南
发表机构 * Deepit Sapru
AI总结 本文提出一个优化客户定向的营销决策框架,结合异质处理效应估计与明确业务保护规则,旨在最大化收入和留存同时遵守预算、收入保护和客户体验等约束。
受约束的弹性定价:面向订阅策略的 churn 意识预测指南
发表机构 * Deepit Sapru
AI总结 本文提出一个动态定价框架,结合多变量需求预测、分段价格弹性及 churn 预测,以优化收入和留存。通过季节性模型与树状学习器,解决受约束优化问题,提升 SaaS 产品组合的定价效果,同时保障客户体验与伦理约束。
医学影像组学中的自动化机器学习:性能、效率和可及性的比较评估
发表机构 * University of Valencia(瓦伦西亚大学) ; Research & Frontiers in AI Department, Quantitative Imaging Biomarkers in Medicine, Quibim SL(研究与前沿人工智能部门、定量影像生物标志物在医学中的应用、Quibim SL) ; Intelligent Data Analysis Laboratory, IDAL, University of Valencia(智能数据分析实验室,IDAL,瓦伦西亚大学)
AI总结 本文比较了通用和专用自动化机器学习框架在医学影像组学分类任务中的性能、效率和可及性,发现专用工具在性能上表现最佳,而通用框架在易用性上更优,但存在生存分析支持不足和特征可重复性整合不足等问题。
Comments 27 pages, 4 figures, 3 tables, code available, see https://github.com/joselznom/AutoML-Comparison-in-Radiomics
Journal ref JMIR Form Res. 2026;10:e91492
PocketLLM: 通过元网络实现大语言模型的终极压缩
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出PocketLLM,通过元网络在潜在空间压缩大语言模型,利用编码器和解码器实现高效压缩,实验表明在高压缩比下仍保持高精度。
Comments AAAI 2026 camera ready
Journal ref Proceedings of the AAAI Conference on Artificial Intelligence, 40(39), 33250-33258 (2026)
加速系外行星气候建模:一种机器学习方法用于补充3D GCM网格模拟
发表机构 * Space Research Institute, Austrian Academy of Sciences(空间研究所,奥地利科学院) ; Institute for Theoretical Physics and Computational Physics, Graz University of Technology(理论物理与计算物理研究所,格拉茨技术大学) ; Institute of Physics, University of Graz(物理研究所,格拉茨大学)
AI总结 本文利用机器学习方法预测系外行星的3D温度和风结构,通过训练神经网络和决策树算法,为系外行星气候建模提供高效工具,提升对空间任务观测数据的解释能力。
Journal ref A&A Volume 706, February 2026
利用多核高斯过程回归与核支持向量回归预测电力价格
发表机构 * Faculty of Mathematics and Economics, Ulm University(数学与经济学学院,乌尔姆大学) ; Institute of Energy Engineering and Energy Economics, Ulm University of Applied Sciences(能源工程与能源经济学研究所,应用科学大学乌尔姆) ; Emlyon Business School, Lyon, France(埃默里昂商学院,法国里昂)
AI总结 本文提出一种新的混合模型用于预测德国电力价格,结合高斯过程回归和支持向量回归,通过选择合适的数据依赖协方差函数提升GPR性能,并利用支持向量回归处理非线性过程和异常值,实验表明优于现有基准模型。
Journal ref Journal of Forecasting (2026) 45, no. 4: 2059:2077
时间序列异常检测中自监督学习的综述:最新进展与开放挑战
发表机构 * University of the Basque Country UPV/EHU(巴斯克大学UPV/EHU) ; Basque Center for Applied Mathematics (BCAM)(巴斯克应用数学中心)
AI总结 本文综述了时间序列异常检测中自监督学习的最新方法,提出分类体系以理解其多样性,并提供GitHub仓库供后续更新。
具有长时上下文处理能力的大型语言模型记忆增强架构
发表机构 * Newton AI Lab(牛顿AI实验室) ; School of Electrical Engineering, Korea Advanced Institute of Science and Technology (KAIST)(韩国科学技术院电气工程学院)
AI总结 本文提出一种记忆增强架构,通过动态检索、更新和剪枝过去交互信息,提升大型语言模型的长时上下文处理能力,实验表明该方法能有效提高上下文连贯性、降低内存开销并提升响应质量。
Journal ref IEEE Transactions on Artificial Intelligence, 2026
基于学习的脉冲神经模型用于决策任务
发表机构 * Cognition and Decision Lab, Columbia University(认知与决策实验室,哥伦比亚大学)
AI总结 本文提出一种生物合理性的脉冲神经网络模型,结合学习机制和多变量Hawkes过程,用于决策任务,通过耦合DDM与Poisson计数器模型,推导出带有相关噪声的DDM,并设计在线分类任务验证模型预测。
VaCDA:基于变分对比对齐的可扩展人类活动识别
发表机构 * Department of Computer Science and Engineering, Bangladesh University of Engineering and Technology(计算机科学与工程系,孟加拉国工程与技术大学) ; Department of Computer Science, Bowie State University(计算机科学系,布里沃州立大学)
AI总结 本文提出VaCDA框架,结合变分自编码器和对比学习,解决多源领域适应中的数据异质性问题,提升跨人物、跨位置和跨设备场景下的活动识别性能。
对比学习中的硬负样本:最优表示几何与神经折叠与维度折叠
发表机构 * Department of Electrical Engineering, Tufts University(Tufts大学电气工程系) ; Department of Engineering, Engineering Technology, East Tennessee State University(东田纳西州立大学工程系) ; Department of Electrical and Computer Engineering, Boston University(波士顿大学电气与计算机工程系)
AI总结 本文证明了在对比学习中,SCL、HSCL和UCL的损失最小化需要神经折叠几何,且HSCL和HUCL损失下界不低于SCL和UCL。同时,通过随机初始化和合适难度级别,Adam优化可收敛至神经折叠几何,而无硬负样本或特征归一化则会导致维度折叠。
Comments Final version: Reviewed and accepted to TMLR April 2025. Updated exposition, Added analysis of lower bounds
Journal ref Transactions on Machine Learning Research, 2025
带有难负样本的监督对比学习
发表机构 * Dept. of ECE Tufts University(电子工程系塔夫茨大学) ; Dept. of CS Tufts University(计算机科学系塔夫茨大学) ; Dept. of ECE Boston University(电子工程系波士顿大学)
AI总结 本文提出H-SCL,通过硬化函数调整类条件负采样分布,提升对比学习在下游分类任务中的性能,并分析H-SCL损失与H-UCL损失的关系。
Journal ref 2024 International Joint Conference on Neural Networks (IJCNN), pp. 1-8, 2024