Normal approximations in nonparametric empirical Bayes
非参数经验贝叶斯中的正态近似
AI总结 本文通过理论分析证明,在非参数经验贝叶斯中,非参数最大似然估计和相关筛法的去噪遗憾由精确正态性下的速率加上中心极限定理近似质量项控制,且该近似仅需边际平均成立,无需高维正态近似。
Comments 53 pages
非参数经验贝叶斯中的正态近似
AI总结 本文通过理论分析证明,在非参数经验贝叶斯中,非参数最大似然估计和相关筛法的去噪遗憾由精确正态性下的速率加上中心极限定理近似质量项控制,且该近似仅需边际平均成立,无需高维正态近似。
Comments 53 pages
基于双谱反演的功能性多目标检测
AI总结 针对含未知平移的多目标检测问题,提出基于自相关分析的无初始化恢复算法,通过去偏三阶经验自相关估计双谱,并利用频率推进或Kotlarski反卷积公式恢复信号,证明非渐近恢复保证。
使用广义分层和累积概率模型解决多变量中的错误
AI总结 本研究针对电子健康记录等常规收集数据中的错误,提出使用广义分层结合累积概率模型来校准验证子样本权重,从而减少偏差并提高估计效率。
混沌替代建模中的动态-概率一致性差距
AI总结 针对混沌系统替代建模中动态与概率目标不一致的问题,提出基于可微扩展卡尔曼滤波的KAFFEE框架,通过局部预测残差似然和雅可比协方差传播来缩小差距。
二维角中心高斯分布的闭式线性矩
AI总结 本文推导了二维角中心高斯分布的角度θ在自然域上的线性矩E[θ]和E[θ²]的闭式表达式,其中均值由参数的反正切给出,二阶矩由二重对数的实部表示。
Comments 7 pages, 1 figure
支持医疗决策的贝叶斯非参数聚类:一种变分推断方法
AI总结 提出基于狄利克雷过程混合模型的贝叶斯非参数聚类方法,通过坐标上升变分推断算法高效实现疾病亚型划分,在合成实验中准确聚类且计算成本显著低于MCMC。
何时多模态预测具有生物学支持?一个诊断性评估框架
AI总结 提出DECAT框架,通过五个零参考指标和规则决策,将多模态表示分类为四种诊断场景,以检测模型是否学到共享生物学、单模态生物学或虚假相关性。
Assign and Add: 组合算术的机制研究
AI总结 通过变量赋值和模加法任务,研究Transformer中组合泛化的机制,发现模型利用同一模加法模块处理直接和间接输入,并揭示了三阶段学习动态。
非参数Kiefer-Weiss问题
AI总结 提出并解决非参数Kiefer-Weiss问题,通过将问题简化为最优停止问题并推导出基于二维检验统计量的最优停止策略,以最小化加权错误概率并约束最大期望样本量。
Comments 32 pages, 6 figures, 2 tables. Submitted to the Annals of Statistics
建模协变量转移以高效估计随机实验中的纵向处理效应
AI总结 提出一种回归调整框架,通过建模协变量转移来估计随机实验中的纵向处理效应,并实现渐近正态性和半参数有效性。
Comments Accepted by ICML'26
信息抽样下基于不完整调查数据的合成数据生成
AI总结 提出一种贝叶斯框架,通过自适应加权方案处理信息抽样下的数据合成与插补,解决方差低估问题并提供一致估计和准确的不确定性量化。
Langevin Monte Carlo 的平均光滑性改进保证
AI总结 针对强对数凹情形下的 Langevin Monte Carlo,利用平均坐标光滑常数而非全局光滑常数,改进了 Wasserstein 距离下的非渐近误差界,并推广至变步长、Laplacian-Lipschitz 势及有限和问题。
医疗流动网络的动态潜空间模型:以意大利国家卫生服务为例
AI总结 提出一种贝叶斯动态潜空间模型,用于分析意大利地方卫生机构间髋关节置换手术的患者流动网络,揭示医疗系统结构演化、COVID-19影响及区域不对称性。
单纯形上的对数比传播:成分数据细胞污染的理论
AI总结 本文提出单纯形上细胞污染的理论,通过乘法扰动和传播定理证明单个成分污染导致对数比向量秩一偏移,并揭示欧几里得细胞方法在单纯形上的失效与降维现象。
Comments 50 pages, no figures; 11-page supplement included as an ancillary file. A companion methods paper (cellPcaCoDa: cellwise-robust PCA for compositional data) is forthcoming
BEND:非线性纵向数据贝叶斯估计的R包
AI总结 本文介绍R包BEND,它使用贝叶斯推断方法估计非线性纵向模型,特别是分段模型,并提供多种扩展功能以处理复杂纵向数据。
Comments 38 pages, 7 figures
随机迭代算法的非渐近收敛性:一个李雅普诺夫框架
AI总结 本文综述了基于李雅普诺夫技术的随机迭代算法(随机逼近)的有限时间分析方法,通过广义Moreau包络作为通用李雅普诺夫函数,给出了均方收敛保证,并应用于随机梯度下降、线性SA及Q学习等强化学习算法,最后讨论了马尔可夫噪声、半范数压缩算子等扩展。
Comments 44 pages
贝叶斯分布鲁棒优化中的后验和似然敏感性
AI总结 本文提出最坏情况后验和似然敏感性的概念,用于量化贝叶斯模型对后验和似然扰动的鲁棒性,并证明分布鲁棒优化可实现性能与鲁棒性的近似帕累托最优权衡。
共识水平替代率不同于病毒颗粒水平替代率
AI总结 本文区分了病毒颗粒水平替代率(VLSR)和共识水平替代率(CLSRs),指出两者生物学意义不同且不可互换,并强调共识生成规则应作为常规报告要求。
移动轨迹稀疏性对流行病建模结果的影响
AI总结 通过对比近完整与稀疏GPS轨迹数据,量化轨迹稀疏性对流行病模型关键指标的偏差,并提出基于逆概率加权的校正方法。
Comments 15 pages, 4 figures
跨期选择中的主观时间变形:一种函数型数据分析方法
AI总结 本文提出函数型数据分析框架,从离散跨期等价判断中重建主观时间轨迹,通过导数汇总、函数主成分分析和聚类揭示跨期选择的异质性,发现两个主成分解释97.44%变异,并识别出三个稳定的时间变形轮廓。
Comments 49 pages, 4 tables, 8 figures
为什么线性循环记忆在部分可观测强化学习中有效
AI总结 本文通过构造两种线性滤波器,从理论上证明了线性循环神经网络在部分可观测强化学习中作为记忆单元的有效性,并扩展到动作控制的隐马尔可夫模型。
欺诈类型分解与观测机制分类:支付网络中的类别特定检测极限
AI总结 本文通过引入观测机制分类将欺诈分为五类,证明按类别分别估计欺诈率并聚合优于整体估计,并推导了每类检测的理论约束。
Comments 59 pages
熵投影对齐:估计、解释和改进分布偏移下的模型性能
AI总结 提出熵投影对齐(EPA)方法,通过匹配选定矩并最小化KL散度来对齐源分布与目标分布,从而统一解决分布偏移下的性能估计、解释和改进问题。
Comments Accepted at the 29th International Conference on Artificial Intelligence and Statistics (AISTATS 2026)
通过随时有效推断纠正在线决策树中的分裂选择
AI总结 针对在线决策树分裂选择缺乏有效统计保证的问题,提出基于随时有效推断的方法,实现任意数据流下错误分裂的随时有效控制、预测优势下的有限承诺时间,并在平稳独立同分布数据下保证风险单调递减且每次分裂严格改善。
Comments Accepted as a Spotlight at the Forty-Third International Conference on Machine Learning (ICML 2026)
Probit回归中的强对数凹性
AI总结 本文证明了在没有岭惩罚(即高斯先验)的probit回归似然函数中会出现强对数凹性,并给出了固定设计下的特征刻画以及高斯设计下的条件数分析。
关于度量空间值预测器的公开与私有二分类问题
AI总结 针对度量空间值预测器的二分类问题,提出Proto-NN分类器并推导其收敛率,同时考虑局部差分隐私约束下私有化Proto-NN分类器的通用一致性和收敛率。
Comments 19 pages
双时间尺度马尔可夫随机逼近的收敛性及其在强化学习中的应用
AI总结 本文研究双时间尺度随机逼近在马尔可夫噪声下的稳定性与收敛性,通过用慢时间尺度参数的运行最大值控制快时间尺度参数,首次证明了带资格迹的TDC在离策略线性函数逼近下的几乎必然收敛。
Comments ICML 2026
记忆设计:概率序列层
AI总结 提出设计-模型框架,通过精确贝叶斯滤波推导高效循环序列映射,线性高斯实例中的贝叶斯层传播均值和协方差以跟踪不确定性,统一多种次二次递归,并提升鲁棒性和长上下文检索。
Comments Preprint, in submission
深度ReLU神经网络对各向异性和混合光滑函数的逼近与学习
AI总结 本文研究深度ReLU神经网络对各向异性和混合光滑函数类的逼近率,并证明在平均光滑度条件下可达到接近最优的逼近速率。
生存结局下随机治疗干预的去偏推断
AI总结 针对生存结局的时间依赖性治疗,利用疾病-死亡模型定义随机干预,通过平滑处理解决非路径可微问题,提出去偏一步估计量实现稳健推断。
基于机器学习的模型无关信号发现:弥合理论与实践的鸿沟
AI总结 本文综述了基于AI的模型无关搜索策略,旨在通过广泛探索而非特定假设来增强实验的发现潜力,并讨论了验证与解释方法。
Comments 37 pages, 7 figures. Part of the VERaiPHY initiative
关于动能朗之万扩散的耦合
AI总结 研究动能朗之万扩散及其分裂离散化中耦合与全变差界的关系,通过非马尔可夫耦合实现精确收缩并改进现有结果。
特定地点大气变量阈值超出的预测
AI总结 本研究比较了直接概率法和全分布概率法在预测特定地点大气变量(如温度和风速)阈值超出时的表现,发现全分布方法在极端事件中更优,并指出其优势源于对条件分布整体特征的准确捕捉。
Comments 24 pages, 8 Figures, 4 tables
任意状态空间上的自由能估计
AI总结 提出一种基于广义神经传输学习的框架,将自由能估计推广到任意状态空间,并揭示时间反演与Doob h-变换的群论结构。
Stiefel流形上的路由:自适应子空间选择何时有助于跨域脑电解码?
AI总结 针对跨域脑电解码中协方差矩阵域偏移问题,提出动态Stiefel路由方法,通过Stiefel流形上的专家投影滤波器池和交叉注意力机制实现自适应子空间选择,并引入三种结构性质避免退化为集成平均,在三个数据集上取得一致提升。
$U$-统计量的泛函中心极限定理对于$\beta$-混合数据
AI总结 针对严格平稳的$\beta$-混合随机变量序列,研究部分和过程的收敛性,包括连续函数空间和Hölder空间中的收敛,条件接近最优。
前沿对冲:基于少量样本学习新任务
AI总结 针对新任务样本少的问题,利用弱单调性假设,通过转移学习和模型选择聚合在模型前沿进行对冲,实现可证明的统计增益。
关于多元Liouville分布的加权Poincaré不等式——在全局敏感性分析中的应用
AI总结 本文建立了多元Liouville分布的加权Poincaré不等式,并通过传输论证将其推广到连续椭圆等高分布,最后应用于全局敏感性分析,在洪水模型案例中展示了实际用途。
Comments Comments are welcome
具有1比特通信约束的批量随机线性赌博机
AI总结 研究在批量大小B和每批仅1比特反馈的通信约束下,随机线性赌博机的遗憾最小化问题,提出了两种基于G-最优设计和1比特均值估计的相位消除算法,实现了接近无约束线性赌博机的最优遗憾。
加性矩阵整数值自回归模型
AI总结 针对高维矩阵整数值时间序列,提出加性矩阵整数值自回归(Add-MINAR)模型,通过将响应分解为行效应、列效应和滞后效应,增强了参数可解释性和结构灵活性,并发展了投影估计和迭代条件最小二乘估计两种方法。
Comments 20 pages and 6 figures
无通信协调:超越优化与几何布朗运动
AI总结 提出基于信息受限反馈的物理框架,在部分观测随机动力系统中,通过宏观到微观的反馈实现群体协调,无需直接通信或策略优化。
可检查的神经马尔可夫模型用于非平稳时间序列
AI总结 提出一种神经网络参数化随机矩阵流形的混合方法,用于估计稀疏数据下的非平稳马尔可夫链,以金融市场为测试平台,发现基于已实现波动率的状态变量比基于收益的状态变量更一致,并在9/10资产上降低了5.6%的Chapman-Kolmogorov差异并提高了留出似然。
Comments 9 pages, 5 figures, 2 tables. Presented at The 2026 ASA Midwest Regional Conference in Statistics and Data Science
过参数化高斯混合模型梯度方法的局部线性收敛性
AI总结 针对过参数化高斯混合模型,提出一种交替使用短梯度步和长Polyak步的方法,实现局部线性收敛速率,克服了过参数化导致的慢收敛问题。
Comments 45 pages, 7 figures
具有形状深度非线性MLP的贝叶斯推断
AI总结 本文通过神经协方差SDE分析深度非线性MLP在训练样本数、输入维数、隐藏层宽度和层数均较大时的贝叶斯推断,发现LP/N的一阶准则决定深度对模型证据的益处,并推导出贝叶斯预测后验等价于数据相关核方法。
Comments 35 Pages
微调提升语言模型中的信息传递
AI总结 提出冠层熵(Canopy Entropy)度量,从树结构视角量化生成空间的有效大小,发现微调模型在总熵降低时仍能增强长度-熵率正相关,从而更高效地将不确定性转化为语义多样性。
扩散模型中的遗忘学习:基于KL散度和似然约束的统一框架
AI总结 提出一个约束优化框架,通过最小化与预训练模型的偏差并施加与遗忘分布的分离约束,实现扩散模型中的概念和数据遗忘,并基于KL散度和似然约束推导最优解及原始-对偶算法。
Comments 27 pages, 6 figures, 4 tables; Accepted by ICML 2026
基于脑电图脑机接口中Probit-link分裂合并高斯过程先验的贝叶斯分类
AI总结 提出一种基于Probit-link分裂合并高斯过程先验的贝叶斯生成模型,用于脑电图响应二元分类,实现时空特征选择并降低计算复杂度,同时保持预测精度。
Comments 31 pages, 7 figures, 2 tables
最后一层是否足以进行不确定性量化?
AI总结 通过理论分析和实验评估,比较全网络线性化与最后一层线性化在深度神经网络认知不确定性量化中的性能,发现最后一层近似在保持相当UQ性能的同时显著提升计算效率。
Comments 40 pages, 14 figures, 7 tables
Kalimati蔬菜价格指数预测:基于动量校正的在线堆叠集成方法
AI总结 针对新兴经济体农产品价格高波动性问题,提出动量校正在线堆叠集成模型,通过构建逆波动率加权综合指数和64个因果特征,在90天预测期实现RMSE=1.771、MAPE=0.68%、R²=0.845的优异性能。
Comments 21 pages, 8 figures, 2 tables
基于矩的潜狄利克雷协变量回归推断
AI总结 针对回归前使用主题模型降维导致的推断困难,提出一种基于校正谱矩的方法,直接识别回归系数β,避免估计文档级主题份额,并通过可交换性条件估计未知总浓度α0,实现有效推断。
SAGE: 一种用于智能体大语言模型中高效记忆演化的新颖门控机制
AI总结 提出SAGE门控机制,基于von Mises-Fisher密度估计和自适应阈值,将记忆写入控制建模为新奇性检测问题,在LoCoMo上以更低成本实现最优token-F1。
具有一致性保证的快速近似贝叶斯多维缩放
AI总结 提出Barnes-Hut BMDS算法,通过树形似然近似和吉布斯采样将计算复杂度从O(n^2)降至O(n log n),并证明其稳态分布的一致性。
谱子采样MCMC用于具有昂贵似然贡献的Lévy驱动连续时间ARMA模型
AI总结 针对连续时间过程频谱推断中Whittle似然因混叠需求和移频分量导致计算昂贵的问题,提出谱子采样MCMC方法,通过数据子采样和高效控制变量估计对数似然,有效降低计算成本。
一致贝叶斯局部空间特征选择及其在空间多模态组学中的应用
AI总结 针对空间多模态组学中的高维回归问题,提出一种贝叶斯局部空间特征选择框架,通过随机域划分先验和局部特征选择先验实现域划分与特征选择的一致性理论,并开发高效的可逆跳跃MCMC算法。
张量估计中的自由能普适性:基于通用链式方法
AI总结 本文利用通用链式方法,建立了张量结构数据推断问题中自由能可由高斯比较模型近似的条件,并应用于二元超图模型,证明了在平均度发散的最小假设下自由能的普适性。
学习测度值轨迹的主动时间点选择
AI总结 针对高成本破坏性数据获取场景,提出基于线性化最优传输的主动学习框架,通过高斯过程建模概率路径并迭代选择最优测量时间点以最小化不确定性。
Comments ICML 2026
基于相位对比MRI的主肺动脉速度剖面不确定性感知估计的贝叶斯框架
AI总结 提出一个贝叶斯框架,结合二维相位对比MRI和机理速度剖面公式,生成考虑不确定性的个体化肺动脉速度表示。
从 Best-of-$N$ 偏好数据中学习奖励:目标、权衡与设计原则
AI总结 本文分析了从 Best-of-$N$ 采样构建的成对偏好数据中 Bradley-Terry 奖励学习的目标,揭示了 $N$ 和基础分布对奖励估计的影响,并提出了基于样本效率和连通性权衡的设计原则。
修正线性单元回归
AI总结 提出一种名为修正线性单元(ReLU)回归的方法,通过将ReLU变换后的结果投影到协变量上,直接估计条件结果分布的积分泛函,并建立其渐近分布和推断方法,扩展了经验研究中可用的分布参数集。
用于空间和时空残差风险的正交化核回归:应用于美国本土的校园枪击事件
AI总结 提出一种正交化核回归框架,在二元半参数模型中嵌入残差风险曲面,用于区分背景异质性与超额风险,并应用于2000-2024年美国本土959起校园枪击事件分析,发现学校规模、中学和高中风险更高,且调整协变量后残差风险仍集中在美国中东部走廊。
Comments 31 pages, 4 figures
基于多元混合效应模型的动态共表达网络估计
AI总结 提出一种通过混合效应模型和惩罚算法估计动态共表达网络的方法,在均方误差和平均绝对误差上优于现有方法,并应用于CARDIA研究分析蛋白质共表达网络的时间演化。
真实自回避行走用于加速马尔可夫链蒙特卡洛积分
AI总结 本文提出使用真实自回避行走(TSAW)改进马尔可夫链蒙特卡洛(MCMC)积分估计,通过惩罚过度访问的转移概率,使得经验积分误差达到几乎必然的O(√log t / t)量级,显著优于标准随机游走的t^{-1/2}误差。
使用R中的mets包进行生存和竞争风险数据的限制平均时间损失分析
AI总结 本文介绍mets R包中用于计算限制平均生存时间(RMST)和限制平均时间损失(RMTL)的非参数和回归估计方法,包括特定原因导致的RMTL,并提供影响函数以实现标准误差计算和复杂统计推断。
基于神经和最优传输方法的似然自由推断方法基准测试
AI总结 研究通过模拟评估四种似然自由推断方法(MLE、NBE、EOT和AW-NBE)在重尾或离散数据等结构特征下的性能,强调在极端和离散数据下谨慎选择评估工具的重要性。
在 $\ell_\infty$ 下的改进分布估计
AI总结 本文在 $\ell_\infty$ 范数下改进了离散概率分布的估计,给出了期望极小极大界和高概率尾界,解决了 Kontorovich 和 Painsky (JMLR, 2025) 提出的开放问题,包括最紧风险界的完全经验版本和最坏情况极值分布的形式,并报告了鼓励性的实证结果。
Comments 24 pages, 3 figures
混合接触动力学下的物理信息目标条件强化学习
AI总结 针对接触丰富任务中混合动力学导致现有物理信息目标条件强化学习方法性能下降的问题,提出接触感知和分层公式,选择性应用物理信息归纳偏置,向接触丰富操作扩展。
关于不可识别二项式模型的贝叶斯分析
AI总结 针对不可识别的二项式模型,利用截断Beta分布、有限混合Beta分布和调和数,推导了后验期望和归一化常数的大样本近似。
复杂计算机模型的收缩约束函数校准
AI总结 提出一种新的贝叶斯模型校准方法IBFU,通过将校准参数分解为固定最佳估计和输入空间上的独立高斯过程参数修正,并施加强收缩先验和正交约束,以解决Kennedy-O'Hagan框架在稀疏噪声数据下的正则化不足和混杂问题。
Comments Template for submission to CMAME (Elsevier)
基于e统计量的M估计
AI总结 提出ME估计量,通过最小化e统计量进行点估计,建立其一致性和收敛速度,并在有界均值估计中分析渐近正态性。
一般潜在分布下的多维项目反应理论
AI总结 针对多维项目反应理论中潜在分布被假定为高斯分布的限制,提出基于流的框架以捕捉非高斯潜在分布,并联合学习项目参数、潜在分布和后验近似,改善参数恢复。
校准偏好学习:以标签排序为例
AI总结 针对概率标签排序问题,形式化定义了校准概念并建立层次体系,通过理论证明和实验验证了不同校准概念的关系及现有模型的校准缺陷。
多项式直方图用于长尾系统分布的内存高效表示
AI总结 提出多项式直方图,通过在每个桶中标注矩信息,在相同存储成本下比传统直方图更有效地表示长尾分布,并应用于大规模生产系统的文件系统指标。
Comments 2014 Preprint
银行卡支付网络中欺诈检测的基本极限
AI总结 本文通过形式化支付授权为具有延迟、审查、污染和反事实缺失反馈的序贯决策问题,推导出极小极大遗憾下界,证明生态系统信息质量是欺诈检测的根本瓶颈,而非模型复杂度。
利用大语言模型和三重损失学习研究相似性以探究荟萃分析中的异质性
AI总结 提出一种结合大语言模型与深度度量学习的框架,通过三重损失训练嵌入模型,在研究层面推断相似性并聚类,以在荟萃分析前识别同质子群,减少异质性并提高估计精度。
Comments 17 pages, 4 figures
在线学习延迟决策与变化专家
AI总结 针对动态专家池和流式数据,提出首个在线学习延迟决策算法,利用H-一致性界和在线凸优化实现遗憾界保证。
超越增强动作代理的多专家学习延迟决策
AI总结 针对多专家学习延迟决策问题,提出一种解耦代理损失函数,通过独立sigmoid头与softmax分类器头分离优化,解决了现有方法中的优化病理问题,并首次给出不随专家数量增长的校准常数界。
基于专家条件建议的学习-延迟决策
AI总结 研究在决策时可为专家提供额外信息(建议)的延迟学习问题,提出一种在复合专家-建议动作空间上的增广替代损失,并证明其一致性保证和最优策略恢复能力。
使用鞅检验评估超过阈值的峰值的外推能力
AI总结 针对极端降水事件概率估计问题,提出基于极值理论的单变量阈值峰值模型,并创新性地使用鞅检验评估外推能力以无偏选择高分位数水平。
单阶段学习委托中的对抗鲁棒性
AI总结 针对单阶段学习委托(L2D)中预测器与分配器联合训练的场景,提出首个对抗鲁棒性框架,通过形式化攻击、设计成本敏感的对抗替代损失并建立理论保证(包括H、R/F和贝叶斯一致性),在基准数据集上验证了方法在保持干净性能的同时提升了对无目标和有目标攻击的鲁棒性。
高效基准测试仅是特征选择与多元回归
AI总结 将高效基准测试重新定义为带特征选择的多元回归问题,使用核岭回归预测和mRMR特征选择算法,在降低计算成本的同时提高预测精度和排名相关性。
Comments 36 pages, 27 figures
基于跨维度贝叶斯模型平均的 $^{13}$C 代谢通量分析:结构模型不确定性下的证据驱动通量推断
AI总结 针对 $^{13}$C 代谢通量分析中结构模型不确定性问题,提出一种结合可逆跳转马尔可夫链蒙特卡洛与扩散嵌套抽样的贝叶斯模型集平均方法,实现大规模代谢网络模型空间上的鲁棒通量估计与模型结构恢复。
重新审视格兰杰因果关系:基于因果贝叶斯网络和赖兴巴赫原理
AI总结 本文通过赖兴巴赫原理和因果贝叶斯网络重新解释格兰杰因果关系,提出因果化格兰杰因果关系(c-GC)算法,赋予其稳健的因果解释,并在合成数据上取得满意结果。
下一个词预测何时有用?边缘化、遍历性、混合可识别性、局部充分性、RAG、工具与编程
AI总结 本文通过区分完整条件语言过程、边缘文本过程和模型诱导分布,论证了下一个词预测的有效性依赖于强假设(平稳性、代表性、遍历性)以及观察前缀对潜在上下文的充分性,并解释了RAG和工具使用作为条件充分性机制的作用。
通过切换状态空间模型在非平稳时间序列中的学习-延迟决策
AI总结 提出L2D-SLDS框架,利用因子化切换线性高斯状态空间模型处理非平稳流式数据,通过共享因子持续更新未查询专家的信念,并设计学习感知查询分数平衡即时成本与信息增益,实现在线学习-延迟决策。
无需特征值下界的多任务线性回归:自适应性、鲁棒性与安全性
AI总结 针对存在污染任务的多任务线性回归问题,提出基于矩阵加权范数正则化的估计器,引入相对平衡条件,在弱谱假设下达到与现有方法相当的预测误差界,并具备安全性保证。
Comments Accepted at ICML 2026
基于协变量的非参数贝叶斯强度估计的高斯和贝索-拉普拉斯先验的递增域渐近性
AI总结 研究在递增域渐近性和协变量遍历性假设下,使用高斯先验和贝索-拉普拉斯先验的非参数贝叶斯方法估计协变量驱动点过程强度函数,并证明其达到极小极大最优后验收缩率。
Comments 40 pages (Appendices included), 13 figures, 5 tables, to appear in the Special Issue of Journal of Multivariate Analysis "Statistical Methods for Functional Data Analysis"
使用商业微波链路和扩散模型先验的贝叶斯雨场重建
AI总结 提出将雨场重建视为贝叶斯逆问题,利用扩散模型作为高保真空间先验,通过无需训练的后验采样方法(如即插即用、序贯蒙特卡洛和副本交换)实现优于传统方法的性能。
Comments Added link to source code
预测分歧与线性池的核分数视角
AI总结 本文通过将线性池的结果从平方误差损失推广到所有核分数,揭示了预测分歧(组件分布的平均成对散度)对线性池性能的重要影响,并提出了在给定核评分规则下等权重最优的新条件。
带有Nesterov加速草图的在线牛顿方法的推断
AI总结 针对在线牛顿方法推断计算成本高的问题,提出结合Hessian平均与Nesterov加速草图投影求解器的方法,在保持一阶方法$O(d^2)$复杂度下实现二阶方法的鲁棒性,并建立了全局收敛性、渐近正态性和在线协方差估计器。
Comments 52 pages, 2 tables, 3 figures; accepted at ICML 2026
网络传递性与社区结构之间的相互作用
AI总结 本文通过推导几何块模型(GBM)中全局和平均聚类系数的极限,从理论上研究了网络传递性与社区结构之间的关系,揭示了极限的相变行为和非单调关系。
多流快速变化检测:基础与最新进展
AI总结 本文综述了高维多传感器系统中快速变化检测的最新进展,重点解决结构约束和有限传感资源下的挑战,介绍了利用稀疏性等方法处理高维性、采样约束以及多流检测问题,并讨论了机器学习在未知概率模型或大规模系统中的应用。
Comments Submitted to Entropy
高维两层ReLU神经网络损失景观中局部极小值的精确描述
AI总结 本文通过总结统计量精确刻画了高维两层ReLU神经网络损失景观中的局部极小值,并建立了与单次SGD的关联,揭示了过参数化对极小值稳定性和可达性的影响。
Comments 29 pages, 18 figures. Accepted as a conference paper at ICML 2026
黎曼流形上的无逆自然梯度下降
AI总结 针对参数位于一般黎曼流形上的统计模型,提出一种内在的无逆自然梯度方法,通过流形上逆Fisher信息矩阵的移动近似和低秩更新,避免矩阵求逆,并证明迭代序列的几乎必然收敛率。
Comments 80 pages, 4 figures. Updated empirical examples
协变量能否解释这些群体差异?参考组的选择可能逆转Oaxaca-Blinder分解的结论
AI总结 本文通过理论和实证证明,在Oaxaca-Blinder分解中,参考组的选择可能导致实质性不同的结论,且该问题在复杂回归模型中更为常见,建议研究者报告两种方向的分解结果。
Comments 28 pages, 4 figures
无约束线性赌博机的一种扰动方法
AI总结 本文提出一种基于扰动的框架,将无约束线性赌博机问题简化为标准在线线性优化问题,并实现了静态和动态遗憾的最优高概率保证。
Comments 50 pages; v2: ICML 2026
基于设计的任意有效推断:针对结果延迟和交错进入的随机实验
AI总结 针对在线实验中结果延迟和交错进入的问题,采用基于设计的视角,通过构造臂特定事件时间滤子下的鞅,结合联合界构建处理效应的置信序列,实现连续监测。
变分路由:用于校准混合专家Transformer的可扩展贝叶斯框架
AI总结 提出变分混合专家路由(VMoER),通过将贝叶斯推断限制在专家选择阶段,实现大规模模型的不确定性校准,在微调基础模型上显著提升路由稳定性、降低校准误差并提高分布外检测AUROC,且额外计算开销极小。
Comments 8 pages, 7 figures for main text; 16 pages for Appendix; Accepted by ICML 2026;
离散流匹配中的小批量最优传输与困惑度界估计
AI总结 针对离散流匹配中状态转移过多和概率估计困难的问题,提出基于小批量最优传输的动态优化目标以减少转移次数,并给出两个困惑度上界以支持训练与评估。
按需辅导异质性效应估计的因果框架
AI总结 提出一个可扩展的因果推断框架,结合深度知识追踪和因果森林,估计自适应学习系统中按需人工辅导的即时效果,发现辅导能提升后续题目正确率约4个百分点,且效果存在显著异质性。
量化扩散模型中的误差传播与模型崩溃
AI总结 本文理论分析了基于分数的扩散模型中递归训练导致模型崩溃的误差传播机制,给出了生成分布与目标分布之间累积散度的上下界,并刻画了不同漂移区域。
Comments Accepted at ICML 2026
Softmax的信息几何:探测与引导
AI总结 本文从信息几何角度研究AI系统如何将语义结构编码到表示空间的几何结构中,并提出一种利用线性探针鲁棒引导表示以展现特定概念的“双重引导”方法。
Comments Code is available at https://github.com/KihoPark/dual-steering
记忆是有益还是有害?先验信息设定阈值
AI总结 在过参数化线性模型和贝叶斯框架下,研究先验分布如何决定训练误差与泛化误差的关系,给出记忆必要或过拟合有害的条件。
Comments 33 pages, 3 figures. Accepted to the Conference on Learning Theory (COLT) 2026
PAC-Bayesian 强化学习训练可泛化策略
AI总结 提出一种新的 PAC-Bayesian 泛化界,通过链的混合时间显式考虑数据中的马尔可夫依赖性,并基于此设计 PB-SAC 算法以优化该界指导探索,在连续控制任务中提供有意义的置信度证书且保持竞争性能。
Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026). Camera-ready version
无参数动态遗憾:时变移动成本、延迟反馈和记忆
AI总结 本文提出一种新算法,在具有时变移动成本的在线凸优化中,首次实现了比较器自适应的动态遗憾界,并应用于延迟反馈和时变记忆问题。
Comments 28 pages; v2: ICML 2026
超树预测
AI总结 提出超树框架,通过梯度提升树学习目标时间序列模型(如ARIMA或指数平滑)的参数,结合决策树与经典预测模型,并引入混合架构解决高维参数估计的缩放限制。
Comments Gradient Boosted Trees, Hyper Models, Hybrid Models, Time Series Forecasting, Time-Varying Parameters
理解Grokking:岭回归中可证明的Grokking现象
AI总结 本文在经典岭回归设置中研究grokking现象,证明使用带权重衰减的梯度下降学习过参数化线性回归模型时,存在过拟合、泛化延迟和最终泛化误差任意小的三个阶段,并首次给出泛化延迟(grokking时间)的严格定量界,同时通过实验表明该界也适用于非线性神经网络。
泊松梯度估计的旅行者指南
AI总结 本文系统比较了指数到达时间模拟和Gumbel-SoftMax松弛两种方法,提出改进的EAT方法以降低偏差,并在泊松潜变量模型上验证其优越性能。
Comments Published at ICML2026 --- code: https://github.com/hadivafaii/PoissonGradientEstimation
Shapley 值的一个奇估计器
AI总结 本文证明 Shapley 值仅依赖于集合函数的奇分量,并基于此提出 OddSHAP 估计器,通过在奇子空间上进行多项式回归实现高效近似,在较大采样预算下达到最先进精度。
Comments Accepted to ICML 2026
SCORE: 在线FDR控制中过冲退款的统一框架
AI总结 提出SCORE框架,利用不等式回收超过拒绝阈值的证据,增强基于e值的在线多重假设检验方法的统计功效,并严格保持FDR控制。
物理信息约束、边界约束的高斯过程回归用于流场重建
AI总结 提出一种通用方法,通过边界约束和物理信息核函数,实现无边界观测的不可压缩流场重建。
Comments 29 pages, 16 figures
高斯逼近下的高效集中不等式
AI总结 针对有界随机变量,提出具有渐近最优宽度、有限样本有效性和次高斯衰减的可计算集中不等式,通过零偏耦合和Stein交换对方法紧界非均匀Kolmogorov和Wasserstein距离,构建高效置信区间和经验Berry-Esseen界。
条件覆盖诊断用于共形预测
AI总结 提出将条件覆盖估计转化为分类问题,通过超额风险度量(ERT)来诊断共形预测的条件覆盖偏差,实验表明使用现代分类器比传统指标具有更高的统计功效。
分布聚类问题的分布检验方法
AI总结 研究将k个分布划分为两组的问题,其中每组内分布相同且两组分布总变差距离至少为ε,通过分布检验方法给出样本复杂度的上下界。
面向工具变量回归的结果感知谱特征学习
AI总结 针对存在隐藏混杂因素的非参数工具变量回归问题,提出一种通过最小化基于增广算子的对比损失来学习结果感知谱特征的方法,以缓解谱错位导致的因果函数表示不足问题。
Comments ICML 2026
跨张量并行大小的确定性推理,消除训练-推理不匹配
AI总结 针对不同张量并行大小导致浮点运算非结合性引起的推理非确定性问题,提出基于树的核(TBIK)实现跨TP大小的比特级一致结果,消除RL训练中推理与训练引擎间的精度不匹配。
基于纳什谈判的稀疏混合专家模型专家合并
AI总结 针对稀疏混合专家模型缺乏原则性加权机制的专家合并问题,提出基于纳什谈判的NAMEx框架,实现专家间更平衡高效的协作,在多项任务中优于现有方法。
Comments 10 pages in the main text. ICLR 2026 Poster
强化序贯蒙特卡洛用于摊销采样
AI总结 本文提出一种摊销方法与粒子方法相结合的采样框架,通过最大熵强化学习训练序贯蒙特卡洛采样器,并利用离线策略学习提高目标分布探索效率,在合成多模态目标和丙氨酸二肽构象玻尔兹曼分布上验证了改进的近似精度与训练稳定性。
Comments ICML 2026. Code: https://github.com/hyeok9855/ReinforcedSMC
学习具有隐藏动态过程的通用因果结构用于气候分析
AI总结 提出统一框架CaDRe,联合发现观测变量间的因果关系和隐藏动态过程,在非参数设置下可识别,并在气候数据上验证了有效性和可解释性。
Comments Accepted by ICML 2026
关于通过鞅驱动的Fisher提示进行顺序测试时间自适应的技术说明
AI总结 提出M-FISHER框架,通过指数鞅检测分布漂移并利用Fisher预条件更新实现稳定自适应,提供时间一致的错误控制保证和最优检测延迟。
纵向修正治疗策略(LMTPs)对健康结果变化率影响的估计
AI总结 本文扩展了纵向修正治疗策略(LMTP)方法,利用非参数有效影响函数(EIF)估计器,估计复杂暴露依赖干预对结果随时间变化率的影响,并构建同时置信区间和假设检验框架。
流形上的动态局部Fréchet曲线回归
AI总结 本文在可分离希尔伯特空间中推导了响应和回归变量的最小二乘局部线性Fréchet曲线预测器,并提出了基于加权Fréchet均值的流形内蕴局部线性Fréchet曲线预测器,证明了其渐近最优性。
Comments This paper is currently under journal second revision
结构阈值和平滑转换向量自回归模型中的非高斯性识别
AI总结 通过假设冲击相互独立且至多一个为高斯分布,证明了结构平滑转换向量自回归模型的统计可识别性,并提出了估计方法和混合识别策略。
用于线性统计模型的快速随机草图化序贯最小二乘估计器
AI总结 提出一种融合草图-求解与迭代草图方法的序贯最小二乘估计框架,通过逐步增大草图尺寸迭代求解子问题,高效获得高精度参数估计。
干扰下的随机梯度
AI总结 本文研究目标函数依赖于未知干扰参数的学习问题中随机梯度算法的非渐近收敛性,证明在Neyman正交性等条件下经典算法仍可收敛,并提出近似正交化更新变体以在非正交情形下达到类似收敛率。
Comments Published at NeurIPS 2025
函数型时间序列中相关假设检验的统一理论
AI总结 提出一个统一框架,通过B样条估计和自归一化构造无 nuisance 参数的检验,在任意采样方案下检测单样本、两样本和变点问题,并证明在稀疏到密集相变下仍保持 n^{-1/2} 的检测率。
多标签胸部X光分类中的不确定性及其解缠基准测试
AI总结 本研究使用MIMIC-CXR-JPG数据集,对多标签胸部X光分类任务中的13种不确定性量化方法进行基准测试,评估了卷积和Transformer架构,并扩展了三种方法到多标签设置,揭示了不同方法和架构在不确定性估计和解缠认知与偶然不确定性方面的优缺点。
Conformal C2ST:将弱分类器转化为强双样本检验
AI总结 本文提出基于共形预测的C2ST变体,使任意弱分类器都能产生精确有限样本p值,实现可控第一类错误和温和退化的检验功效,并应用于神经后验估计验证。
稀疏异常的任意时间有效检验
AI总结 针对大量数据流中稀疏异常的在线检测问题,设计并分析了任意时间有效(AV)检验,提出了一种计算高效且参数自适应的AV检验方法,在阈值行为上达到与最优AV检验相同的性能。
Comments 50 pages, 5 figures
立场:量子核机器应超越标量值核以实现其潜力
AI总结 本文主张量子核机器应转向算子值核等更富表达力的框架,以利用纠缠和非交换结构处理复杂结构化预测问题,并通过初步概念验证展示其优势。
从联合数据中学习可解释的因子化随机策略的最小最大方法,附带不确定性量化
AI总结 针对指数级大因子动作空间,提出从随机偏好数据中离线优化策略的方法,利用联合实验估计可解释随机策略,并给出渐近有效的不确定性量化。
Comments ICML 2026
缓慢缩放的每条记录差分隐私
AI总结 针对存在大量异常值的数据(如收入数据),提出隐私保证随记录影响对数级缓慢退化的机制,实现准确无偏的统计发布,并为高影响记录提供有意义的保护。
Comments This version fixes a mistaken variance formula in the first column of Table 3 and updates Figure 1 to use this variance formula
基于最近邻的逻辑斯蒂 Lasso 回归用于基于梯度的降维
AI总结 提出一种结合最近邻和 L1 惩罚的局部逻辑斯蒂回归方法估计条件概率梯度,并利用梯度外积估计中心子空间,实现高维协变量的降维。
Comments 27 pages of the main document and 26 pages of supplement, 5 figures of the main document and 912 figures of the supplement, and 1 table
两阶段量子估计与量子增强透射率传感的渐近性
AI总结 针对量子态中单个未知参数的估计问题,提出一种放宽条件的两阶段方法,在第一阶段使用次优测量获得初步估计,第二阶段利用初步估计构造达到量子Cramér-Rao界的测量,并应用于量子增强透射率传感的渐近分析。
Comments 18 pages, 4 figures (minor changes, added analysis of impact of phase error on transmittance sensing)
信息借用下的多臂临床试验设计与推断:交互式瓮设计
AI总结 本文提出一种基于交互式瓮系统的新型分层比较试验设计方法,通过信息借用增强早期疗效信息交换、自适应调整分配偏向最有效治疗,并随信息增长消除不同疗效层的影响,同时给出理论性质与渐近推断。
预承诺最优选择问题:精确有限n公式
AI总结 研究非自适应预承诺类最优选择问题,推导出一般非递增阈值向量和单重复阈值的精确有限n概率公式,并证明该类严格次优。
Comments v3: major revision. Reframed as the exact finite-n theory of the non-adaptive pre-commitment threshold class; the earlier claim of an error in Gilbert & Mosteller is retracted
关于Wasserstein GANs的正则化
AI总结 本文研究Wasserstein GANs中Lipschitz约束的正则化方法,通过理论分析和实验证明使用较弱的正则化项优于权重裁剪。
Comments Published as a conference paper at ICLR 2018. * Henning Petzka and Asja Fischer contributed equally to this work (11 pages +13 pages appendix)