Kernel Characterisations of Stochastic Orders Within Parametric Density Families
参数密度族中随机序的核刻画
AI总结 本文提出了一种基于核方法的随机序刻画方法,用于参数密度族中的似然比序、危险率序、通常随机序和相对log-concave序,并展示了该方法在复合和等场景中的应用。
Comments 21 pages, 2 tables
参数密度族中随机序的核刻画
AI总结 本文提出了一种基于核方法的随机序刻画方法,用于参数密度族中的似然比序、危险率序、通常随机序和相对log-concave序,并展示了该方法在复合和等场景中的应用。
Comments 21 pages, 2 tables
基于微生物组-代谢物数据整合的贝叶斯稀疏回归
AI总结 本文提出了一种新的贝叶斯回归方法,用于解决微生物组和代谢物数据整合中的缺失值问题和组成学特性,通过模拟数据和真实数据验证了该方法在准确填补代谢物值和选择相关微生物组预测变量方面的有效性。
Comments 28 pages including references
有限总体抽样作为n到N:从推断到准确性的过渡的实证证据
AI总结 本文研究了当抽样比例趋近于1时估计量的行为,探讨了在高覆盖率大规模数据环境中推断假设的重新评估。
Comments 12 pages, 2 Figures, 3 Tables
统计界限与差分隐私联邦学习的高效算法
AI总结 本文研究了差分隐私联邦学习中估计精度、隐私约束和通信成本之间的权衡,提出了FedHybrid和FedNewton两种高效算法,通过减少通信成本提升准确性,并建立了均方误差的上界和下界以评估算法性能。
基于等变自助法的自监督置信区间预测用于图像不确定性量化
AI总结 本文提出了一种基于等变自助法的自监督置信区间预测方法,用于图像不确定性量化,通过利用数据对称性生成启发式覆盖范围,并通过置信预测校准步骤进行细化,避免了对地面真实数据的依赖,特别在弱引力透镜质量映射中展示了其有效性。
Comments 9 pages, 2 figures; submitted conference proceedings for MaxEnt 2025
通过有向无环图聚合实现稳定的因果发现
AI总结 本文提出DAGgr模型平均框架,通过聚合多个候选DAG以获得稳定表示,利用外样本预测似然加权候选图,并通过边重要性评分阈值规则保证聚合图的无环性,通过理论分析和实验验证其有效性。
随机生成树马尔可夫随机场先验用于成像中的贝叶斯反问题
AI总结 本文提出了一种基于随机生成树的马尔可夫随机场先验,用于解决成像中的贝叶斯反问题,通过将连续和离散随机变量结合,改进了图像去噪、去模糊和修复等任务的性能。
深度神经网络中的逐点泛化
AI总结 本文提出了一种深度神经网络逐点泛化的理论框架,通过分析全连接网络的点wise Riemannian 维度,建立了新的表示学习统计基础,提供了更精确的泛化界限。
OSSMM:一个开源的睡眠监测与调节器
AI总结 本文提出OSSMM,一种开源的硬件和软件平台,用于可及的睡眠研究。该平台通过低成本的3D打印和商用现成组件构建了小型可穿戴头带,并配以Android应用程序,无需导电凝胶、一次性电极或专业设备,即可通过无线连接捕获多种生物信号,用于睡眠阶段分类和潜在的睡眠调节。
Comments 8 pages
利用大语言模型作为专家估算项目难度
AI总结 本文研究了如何利用大语言模型估算新任务的难度,通过对比不同配置下的模型表现,发现基于对偶比较的配置在无额外优化时表现更优,而结合token概率和已知难度示例的绝对判断配置也表现出中等至高水平的对齐度。
Comments 24 pages, 2 figures, 9 tables
联邦马尔可夫后验采样
AI总结 本文提出联邦马尔可夫后验采样方法,通过在不共享本地数据集的情况下,利用预测分布恢复参数不确定性,从而在联邦学习中提升模型校准性能。
Comments 5 pages
在叠加中探测表示流形
AI总结 本文提出Manifold Probe方法,用于发现叠加中的表示流形,通过学习可线性预测的特征空间以及编码方向,从而揭示模型行为中因果相关的流形。
Comments 19 pages, 7 figures
连续扩散在语言领域中能与离散扩散竞争性地扩展
AI总结 本文研究了连续扩散模型在语言建模中的扩展能力,通过改进Plaid模型构建RePlaid,证明连续扩散模型在计算效率和性能上可与离散模型竞争,并提供了理论支持。
AI4BayesCode: 从自然语言描述到经过验证的模块化状态性贝叶斯采样器
AI总结 该研究提出AI4BayesCode系统,通过自然语言描述生成可运行且验证过的MCMC采样器,采用模块化设计和递归状态性编码范式,提升了贝叶斯模型的可靠性和扩展性。
流中自信
AI总结 本文提出了一种名为流匹配与自信(FMwC)的方法,通过在选定层注入输入依赖的乘法噪声,传播其方差并通过网络闭式形式传播,从而在标准采样成本下获得每个样本的置信度评分,用于改进图像质量和晶体热力学稳定性、轨迹编辑和自适应步长等应用。
适应性实验设计用于截断生存结果
AI总结 本文提出了一种新的适应性实验框架,用于在右截断情况下估计因果效应,通过推导平均生存效应曲线的半参数效率界限,得到闭合形式的效率最优分配策略,并通过数值实验展示了与均匀随机化和截断无关基线相比的一致效率提升。
固定阶PCA:对高维因子模型中高估因子模型的理论
AI总结 本文研究了在高维因子模型中固定阶PCA的渐近理论,通过引入扩展和压缩映射,证明了估计因子的一致性,并展示了在固定阶下因子增强回归的渐近正态性,为保守的因子数上界提供了理论支持。
从确定性过程生成对抗学习
AI总结 本文研究了生成对抗网络在非独立同分布数据中的成功应用,证明了通过无限维生成对抗学习模型可以从单个确定性时间序列中学习混沌动力系统不变分布,并给出了收敛速率。
Comments 37 pages, 3 figures
广义函数ANOVA的闭式表达:加性解释的统一视角
AI总结 本文提出了一种闭式表达的广义函数ANOVA方法,提供了一种统一的加性解释框架,能够处理依赖输入情况下的模型预测分解问题。
Comments 34 pages, 23 Figures, 101 equations, 8 Tables
Volterra签名的计算方面
AI总结 本文研究了Volterra签名的计算方法,提出了一种高效的算法,通过分解Chen型卷积关系并引入多种高效算法,如二次复杂度O(J²)的近似方案、基于FFT的加速方案以及精确递归方案,解决了Volterra签名计算中的算法挑战。
具有时间一致生存分析的多状态模型用于同质马尔可夫链
AI总结 本文提出了一种基于时间一致生存分析的新方法,用于估计同质马尔可夫链中指定终端状态的首次到达时间分布,并讨论了治愈个体的问题,提出了治愈率估计器,并给出了非渐近的理论保证。
基于贝叶斯空间的组合周期样条近似用于圆密度数据
AI总结 本文提出了一种利用贝叶斯空间中的希尔伯特空间结构,通过组合周期样条对圆密度数据进行近似和分析的新框架,通过中心对数比变换将密度表示为标准L²空间的子空间,从而在保持分布相对性和周期结构的同时应用函数数据分析工具。
《英雄联盟中稳健的玩家条件冠军排名:风格相似性、熟练度先验知识和范式约束发现》
AI总结 本文提出了一种基于玩家条件的稳健冠军排名方法,结合风格相似性、熟练度先验知识和范式约束,以解决《英雄联盟》中的冠军推荐问题。
Comments 11 pages, 3 figures
基于注意力的PCA
AI总结 本文研究了注意力机制在无监督问题PCA中的表现,证明在高斯数据上训练时,softmax和线性注意力层学习的参数与协方差矩阵的主特征向量对齐,建立了与PCA的直接联系,并扩展到上下文设置中。
通过最优传输的几何字典学习动力系统
AI总结 本文提出DOODL框架,通过几何字典学习方法在谱算子空间中学习低维流形,从而实现对复杂动力系统的高效表征和可解释的算子估计。
确定树状结构变系数模型自由度的工具
AI总结 本文提出了一种确定树状结构变系数模型自由度的公式,通过贝叶斯信息准则进行模型选择,并在模拟研究中验证了其比传统方法更准确且预测能力更强。
前向学习离散扩散:学习如何更快地噪声去噪声
AI总结 本文提出前向学习离散扩散(FLDD),通过引入可学习的前向(噪声)过程,减少目标分布与模型分布之间的差距,实现少步生成。该方法采用非马尔可夫形式,利用可学习的边缘和后验分布,使生成过程保持因子化同时匹配噪声过程定义的目标。实验表明,在相同采样步数下,FLDD生成的样本质量优于传统离散扩散模型。
宽特征学习神经网络的规范正则化
AI总结 本文研究了宽特征学习神经网络中梯度流训练所隐含的正则化性质,揭示了在核域中广泛研究的范数正则化在特征学习域中会导致诱导偏差扭曲,并提出了弧范数作为可扩展的替代方案,扩展了范数正则化到特征学习域。
Ringmaster LMO: 异步线性最小化Oracle动量方法
AI总结 本文提出Ringmaster LMO,一种用于无约束随机非凸优化的异步线性最小化Oracle动量方法,通过延迟阈值机制改进传统同步方法,适用于异构分布式系统,实验表明其在系统异构性增强时表现更优。
1-truncated C-vine copula混合模型用于多诊断测试网络元分析
AI总结 本文提出了一种灵活且强大的1-truncated C-vine copula混合模型,用于网络元分析多个诊断测试,以提高对多诊断测试准确性比较的分析能力。
一个用于个性化大脑偏差映射的贝叶斯纵向空间规范模型
AI总结 本文提出了一种贝叶斯纵向空间规范模型,通过统一的分层框架联合捕捉个体内部时间依赖性和空间结构化的个体偏差,从而在多个模拟场景中减少了偏差图重建误差,并在OASIS-3结构MRI数据应用中显著降低了RMSE。
MIST:通过McDiarmid界实现可靠的流决策树用于在线类增量学习
AI总结 本文提出MIST方法,通过三个集成组件解决流决策树在在线类增量学习中的可靠性问题,包括McDiarmid置信半径、贝叶斯继承协议和KLL量化图,以提升在非高斯几何中的鲁棒性。
Comments 9 pages of main text, 5 figures
生成人工智能中的因果偏见检测
AI总结 本文研究了生成人工智能中的因果公平性问题,提出了新的因果分解结果,以量化不同因果路径和现实机制被生成模型替代对公平性的影响,并通过分析大型语言模型中的种族和性别偏见验证了方法的有效性。
近线性时间的广义Sinkhorn算法用于有界亏格图
AI总结 本文提出GenusSink算法,一种用于有界亏格图(如平面图)的近线性时间广义Sinkhorn算法,通过分离基于分解、计算几何技术和快速矩阵向量乘法等方法,解决了传统方法的二次时间复杂度问题,并在有界亏格图上实现了更精确的最优运输计算。
科学同行评审中的锯齿AI:来自POMP数据分析的证据
AI总结 本研究探讨了人工智能在科学同行评审中的表现,发现AI在某些领域表现出色而在其他领域表现不佳,通过分析POMP数据集,发现AI在技术错误检测上优于人类,但在解释性错误和叙述连贯性方面表现不足。
非协作空中联邦学习的资源元素能量差
AI总结 本文提出了一种非协作物理层原始方法,即资源元素能量差(REED),用于连续符号聚合。该方法通过将实值更新的正负部分映射到配对正交的资源元素上的传输能量,并通过减去对应的接收到的能量来估计符号和。REED利用慢时间尺度校准的平均信道功率,但不需要瞬时发射端或接收端CSI或信道反转。对于独立的瑞利衰落,我们推导了单次REED和芯片多样扩展的精确一阶和二阶矩表达式。
Comments Preprint; Under-review; Codes to replicate the results is available at: https://github.com/zavareh1/REED
通过示范多样性从离线数据中识别潜在动作和动态
AI总结 本文研究了在不观察动作的情况下从离线轨迹中恢复潜在动作和环境动态的问题,通过示范多样性假设,证明了在满足特定条件时,潜在转移和示范策略可以被唯一确定,从而为从离线强化学习数据中学习潜在动作和动态提供了新的方法。
当边缘匹配但结构失败:生成模型中的协方差保真度
AI总结 本文提出了一种基于协方差层面的依赖保真度评估标准,以弥补传统边缘分布匹配评估方法的不足,通过实验证明该标准能更准确地区分结构保留与结构丢失的生成模型。
Comments 44 pages, 25 figures. Extended version of paper accepted at MathAI 2026 (International Conference on Mathematics of Artificial Intelligence), March 30 - April 3, 2026
掩盖因果关系与条件依赖
AI总结 本文研究了通过平均约束来强制条件独立性的问题,发现这种约束在监管层面无法满足分层要求,而在优化者层面却能有效隐藏依赖关系,从而指出通过观测决策的平均统计来监管直接依赖是有限的,必须在决策规则层面进行监管。
时间延迟似然的全局结构
AI总结 本文研究了时间延迟推断中似然函数的固有病态,指出标准推断方法面临挑战,并提出通过增加活点数量等方法来确保收敛的实用解决方案。
Comments 21 pages, 8 figures
具有密集权重的神经网络不是通用逼近器
AI总结 研究探讨了密集神经网络的逼近能力,指出在有限的权重约束下,密集连接的神经网络无法逼近任意连续函数,从而揭示了密集层神经网络的固有局限性,推动了稀疏连接在实现真正通用性中的必要性。
有限粒子率的正则化Stein变分梯度下降
AI总结 本文研究了正则化Stein变分梯度下降算法的有限粒子率,通过应用树脂型预条件器来校正SVGD的常数阶偏差,推导了时间平均经验测度的非渐近界,并在目标满足W₁I条件下,证明了对于光滑核函数的大类,W₁收敛。
基于空间广义线性混合模型的近似似然推断
AI总结 本文研究了使用随机牛顿-拉夫森算法进行空间广义线性混合模型的最大似然估计,比较了Spectral Gaussian Process和随机偏微分方程两种高斯过程近似方法,并提出了新的停止准则和固定效应标准误差估计方法。
在分布漂移下学习:预quential可再现性作为内在统计资源
AI总结 本文研究了在分布漂移下学习的问题,提出了一种内在的漂移预算$C_T$,用于量化数据分布沿实际学习者-环境轨迹的累积信息几何运动,以 Fisher-Rao 距离衡量。该预算将外生环境变化与学习者动作引起的反馈分离,从而提供了基于速率的预quential可再现性特征。文章证明了漂移反馈界,并建立了匹配的下界,展示了平均 Fisher-Rao 运动率的依赖性是紧的。此外,还证明了信息论上的不可区分性结果,并通过实验表明适当选择的监控通道可以保留风险相关的漂移信号。
Comments Revised: Added additional experiment. Clarified lower bound
深度序列模型倾向于记忆几何学;不清楚为何
AI总结 研究探讨了深度序列模型中原子事实的存储机制,发现几何记忆能编码全局关系,即使在训练中未共现的实体间也能建立联系,挑战了传统关联记忆的观点。
Comments Forty-third International Conference on Machine Learning (ICML 2026)
稀疏深度加法模型与交互:增强可解释性和预测性
AI总结 本文提出了一种结合稀疏特征选择与深度子网络的稀疏深度加法模型与交互(SDAMI),通过三阶段策略实现高维回归中的可解释性和预测性提升。
通用逆向蒸馏用于匹配模型与真实数据监督(无GANs)
AI总结 本文提出RealUID框架,通过无需GANs的方式将真实数据无缝融入逆向蒸馏过程,为所有匹配模型提供统一的蒸馏方法,涵盖流匹配和扩散模型,并可扩展至其变种。
符号量化回归用于条件量化可解释性预测
AI总结 本文提出了一种符号量化回归方法,用于预测条件量化并解释预测变量对结果的影响,通过在航空燃料使用案例中比较预测极值和中央结果的模型,展示了SQR在高风险应用中的有效性。
可计算的强逼近界及其应用
AI总结 本文提出了一种可计算的KMT不等式,用于有界独立同分布随机变量的部分和,同时给出了在标准差未知时的经验版本,并展示了其在在线突变点检测和首次击中时间概率中的应用。
伯恩斯坦型无维集中不等式用于自归一化鞅
AI总结 本文提出了一种无维的伯恩斯坦型尾界不等式,用于自归一化鞅,其中归一化使用可预测的二次变分,半径取决于观测协方差的信息增益。应用包括为具有自适应选择的希尔伯特值协变量的逻辑回归提供椭球置信序列,以及为希尔伯特臂逻辑带宽提供实例自适应的后悔界。
Stein Diffusion Guidance: Training-Free Posterior Correction for Sampling Beyond High-Density Regions
AI总结 本文提出了一种基于Stein扩散引导的训练自由后验校正方法,用于在高密度区域之外进行采样。该方法结合了随机最优控制和Stein变分推断,通过引入新的理论界和运行成本函数,实现了在低密度区域的有效引导。
Comments Revised version accepted to the ICML 2026 main track; prior version accepted to two ICLR 2026 workshops: ReALM-GEN and DeLTa
基于去卷积的功能多参考对齐
AI总结 本文研究了通过移位和噪声观测估计信号函数的多参考对齐问题,提出了一种利用Kotlarski公式进行去卷积的新方法,从而将MRA与去卷积联系起来,并通过理论和数值实验验证了该方法的有效性。
Comments 48 pages, 9 figures
代数先验用于近似等变网络
AI总结 本文提出了一种无需参数的代数方法,利用群表示理论来构建等变网络的先验,通过实验验证该方法在多个任务中表现优异,甚至在无限群情况下也优于专门设计的模型。
具有随机特征的高维岭回归:非同分布数据的方差轮廓
AI总结 本文研究了在非同分布数据下,使用随机特征的高维岭回归,通过方差轮廓模型分析训练和测试风险的渐近等价,并揭示了异质方差轮廓对泛化性能的影响。
分布变换器:通过实时先验适应实现快速近似贝叶斯推断
AI总结 本文提出分布变换器,一种能够学习任意分布到分布映射的新型架构,通过实时先验适应实现快速近似贝叶斯推断,显著降低计算时间并达到与现有方法相当或更优的对数似然性能。
Comments Spotlight acceptance at ICML 2026
超越测地凸性的Wasserstein近端算法收敛性分析
AI总结 本文提出了一种无需假设目标函数测地凸性的简单自包含分析,证明了Wasserstein近端算法在自然的Wasserstein类欧几里得Polyak-Łojasiewicz不等式下具有无偏线性收敛性,改进了现有在强测地凸性下求解Wasserstein梯度流的近端算法收敛率,并扩展到半测地凸目标的近端算法。
基于折扣函数的功能聚类用于行为投资者画像
AI总结 本文通过功能数据分析研究不同性格类型在时间折扣行为中的异质性,揭示投资者画像的多样性,为金融顾问制定个性化策略提供理论支持。
关于Chatterjee-Spearman检验的扩展
AI总结 本文提出了一种基于秩的联合检验方法,通过结合Chatterjee和Spearman相关性,扩展了检验的适用范围,并探讨了其在多变量情况下的应用。
Comments 46 pages, 8 figures
监督学习问题的腐败:类型与缓解方法
AI总结 本文提出了一种通用的腐败理论,通过马尔可夫核分析底层概率分布的变化,统一了不同类型的腐败模型,并探讨了针对各种腐败类型的缓解方法。
Comments 73 pages. To be published in Journal of Machine Learning Research 27 (2026) 1-73
快速自适应三元分割:一种适用于隐马尔可夫模型的高效解码过程
AI总结 本文提出了一种快速自适应三元分割(QATS)方法,通过分治策略在序列长度上具有多项对数复杂度,在状态空间大小上具有三次复杂度,适用于大规模隐马尔可夫模型。该方法通过自适应搜索近似最大化局部似然得分,实现了比Viterbi和PMAP更快的解码速度和更高的精度。
迭代执行离散和反向离散傅里叶变换及其在信号去噪中的应用
AI总结 本文提出了一种迭代算法家族,通过反复执行离散和反向离散傅里叶变换,利用稀疏化操作在时域和频域数据中实现信号去噪,特别是在高斯噪声中恢复周期性尖峰信号。
核 quadrature 在无界域上的最优采样
AI总结 本文研究了随机 quadrature 方法,旨在提高鲁棒性而非特定核的最优性。提出了一种显式且依赖于 n 的采样分布,能够在不需了解核的情况下实现最小最大误差率,扩展到无界域,提供理论保证和实用的鲁棒最优随机 quadrature 方法。
不确定性功能重新审视:凹性与Jensen不等式
AI总结 本文研究了在一般可测空间上的不确定性功能,探讨了其在实验设计和全局敏感性分析中的应用,指出凹性是Jensen不等式成立的必要条件,但并非充分条件,并提供了可行的充分条件。
通过Föllmer过程研究去噪扩散概率模型的Wasserstein界限
AI总结 本文研究了去噪扩散概率模型(DDPMs)在2-Wasserstein距离下的采样误差界限,提出了三种核心贡献:一是基于一般Lipschitz型条件和广泛方差调度(包括余弦调度),建立了最优的上界;二是证明了相同的Lipschitz型条件蕴含对数Sobolev不等式和二次运输成本不等式;三是展示了对于一般的对数凹目标分布,即使没有二次运输成本不等式,最优的Wasserstein误差界限仍可达到。
Comments 45 pages
关于使用亚二次样本的高效鲁棒回归
AI总结 本文研究了在高斯协变量下,未知条件数为κ的鲁棒线性回归问题,提出了一种近线性时间算法,使用O(d/ε^4)样本,预测误差为O(√(εκ)),并在εκ≈1的条件下改进了先前工作。同时,通过统计查询下限证明了高效SQ算法若要达到o(√(εκ))的误差,需模拟O(d²)样本。最后,证明了低次多项式下限,表明在不假设εκ≈1的情况下,高效算法可能需要O(min{dε²κ², ε²d²})样本才能显著优于始终猜测0的平凡估计器。
Comments Accepted at COLT 2026
关于Föllmer过程与去噪扩散概率模型之间联系的注记
AI总结 本文探讨了Föllmer过程与去噪扩散概率模型(DDPM)之间的联系,指出离散化的Föllmer过程可以作为DDPM采样器的自然超参数设置,并系统地恢复了DDPM采样误差界的结果。
Comments 32 pages
一种用于晶格数据空间各向同性的稳健非参数检验
AI总结 本文提出了一种基于空间数据二维正则网格变异图的稳健检验方法,用于评估各向同性,该方法通过比较不同方向相同距离的变异图估计值,同时采用稳健变异图估计器和块置换重采样方法,以提高对异常值的鲁棒性。
Comments 33 pages, 11 figures, 7 tables
揭示记忆与泛化共存:在带有标签噪声的算术任务中的案例研究
AI总结 本文研究了在高过参数化模型中如何同时记忆噪声标签和泛化,通过模运算任务中的实验发现,适当优化和模型配置下大模型泛化能力更强,噪声标签被更快记忆,而过参数化模型内部形成泛化结构,但输出被拟合噪声标签的需求所抑制。通过频率方法提取内部结构可实现高准确率,提出任务无关方法将网络分为泛化和记忆组件,尽管该子网络提升泛化能力,但相比频率提取方法仍有局限,表明泛化结构分布于神经元中,需要新工具来检索过参数化网络中的可泛化知识。
Comments 27 pages, 32 figures
一种数据驱动的傅里叶-混合神经网络方法用于密度估计
AI总结 本文提出了一种数据驱动的傅里叶训练神经网络方法,用于从经验特征函数信息估计固定期限的概率密度。该估计器是一种具有闭式特征函数的正高斯-拉普拉斯混合分布,可以在傅里叶空间中直接训练,同时保持非负性和单位质量。研究考虑了两种采样设置,并分析了不同情况下误差界和计算复杂性。
Comments 27 pages, 4 figures
域移情况下不确定性可靠性研究:面向光体积脉搏波测记中数据驱动血压估计的探讨
AI总结 本文研究了在域移情况下深度学习用于光体积脉搏波测记信号中血压估计的不确定性可靠性,比较了深度集成和蒙特卡洛滴答方法,并探讨了不确定性校准的重要性。
Comments 23 pages, 2 figures
通过成本敏感回归实现可扩展的决策聚焦学习
AI总结 本文提出了一种基于成本敏感多输出回归的方法,用于解决包含多个不确定参数的组合优化问题,通过引入成本敏感的损失函数组件,提高了决策聚焦学习的效率和可扩展性。
Comments 12 pages, 7 figures
从鞍点走向全局极小值:Wasserstein空间上的牛顿型方法
AI总结 本文研究了在Wasserstein空间上非凸泛函的最小化问题,提出了一种Wasserstein无鞍点牛顿(WSFN)方法,通过正则化的WassersteinHessian平方根预条件Wasserstein梯度,从而克服了标准Wasserstein牛顿动力学倾向于鞍点的倾向,并在多项式时间内达到全局极小值的α-邻域。
Comments 83 pages, 3 figures
通过镜像反学习和噪声一致偏斜训练数据归因
AI总结 本文提出了一种基于镜像反学习和噪声一致偏斜的方法,用于提升扩散模型的训练数据归因的可靠性与鲁棒性,通过在不同数据集上显著优于现有方法,展示了其在生成实例间影响实例重叠和扩散损失比较任务中的潜力。
Comments 21 pages, 5 figures, 9 tables (includes appendix)
具有群对称性的通用结构数据的条件预测推断
AI总结 本文研究了具有群对称性的数据的无分布预测推断,旨在建立超越可交换性的近条件覆盖保证。虽然许多预测推断方法可以达到目标覆盖水平,但大多数只能提供边缘覆盖。在实践中,条件预测推断更受青睐,因为它可以量化给定观察属性的黑盒预测的不确定性,从而适应异质性。尽管许多努力旨在实现高效的条件覆盖,但现有方法通常依赖于i.i.d.或可交换假设,这在结构数据如网络、聚类和成像数据中常常被违反。最近,SymmPI引入了一种在超越可交换性的情况下进行预测推断的统一方法;然而,其保证仍然只是边缘的,并不考虑总体异质性。为了填补这一差距,我们引入了C-SymmPI框架,该框架在具有群对称性的通用数据结构下实现近条件覆盖,超越了可交换性,覆盖网络、聚类级数据及相关结构。受放松多准确性启发,我们的方法将条件覆盖重新公式化为用户指定的功能类上的误覆盖误差。我们在分布不变性和分布转移下建立了理论保证,并推导了线性和RKHS函数类的收敛速率,将最先进结果作为可交换情况的特例恢复。为了计算效率,我们开发了两种变体:一种基于投影的算法用于高维观测,另一种基于采样的算法用于大或无限群。我们在分层和网络数据上展示了有效性。实验证果表明,C-SymmPI相比现有方法提供了更具信息性和稳定性的条件覆盖,精度有所提高。
多变量层级时间序列的重新协调
AI总结 本文提出了一种多变量重新协调方法,用于确保层级时间序列的预测一致性,并考虑变量间的关系。通过数值模拟和实际数据验证,该方法在模拟数据和实际应用中均优于传统方法。
Comments 22 pages, 7 figures, 8 tables
双重/去偏机器学习用于面板数据中持续治疗效应的估计
AI总结 本文提出了一种双重/去偏机器学习框架,用于估计非参数面板模型中平均导数效应,扩展了工具变量方法到面板数据设置,处理连续治疗和各种内生性形式,并引入交叉拟合方案以消除时间固定效应后的独立性。通过惩罚GMM去偏项实现自动去偏机器学习。所提出的估计器在同时效应、动态效应和聚合效应上具有一致性和渐近正态性,具有有效的方差估计器。模拟显示了减少的正则化偏差和准确的置信区间。对ECLS-K数据的应用揭示了家庭社会经济地位对儿童BMI影响的丰富动态。
基于小波的时间序列模型与时间变化阈值
AI总结 本文提出了一种具有时间变化阈值的小波时间序列模型,通过小波级数展开表示阈值,能够更好地捕捉不规则和突发变化以及阈值参数的平滑变化,比傅里叶方法更具灵活性。通过模拟实验和实际数据应用评估了该模型的性能。
通过路径测度的序列蒙特卡洛实现扩散模型的简单近似与无导数推理时间缩放
AI总结 本文提出URGE算法,一种无需梯度的推理时间缩放方法,通过路径重要性重加权提升扩散模型样本质量,同时在合成测试和扩散模型基准中表现出色,且实现简单且无梯度依赖。
Comments accepted by ICML 2026
量化NBA裁判影响:使用ESPN胜率数据的裁判影响指标分析
AI总结 本文提出了一种裁判影响指标(RIM),用于量化NBA比赛中裁判决策对比赛结果的影响,通过整合胜率变化数据,分析裁判表现,并探讨不同因素对裁判影响的异质性。
通过Wasserstein梯度流构建数据免费一步采样的统一框架
AI总结 本文提出了一种基于Wasserstein梯度流的数据免费一步采样的统一理论框架,展示了f-分歧度目标下诱导速度场的通用形式,并通过软欠覆盖功能理论推导了分歧度选择与质量运输几何之间的压缩-弹性恒等式,进一步扩展到Log-Variance分歧度,并通过KDE实现和归一化流路线实现了一步推断。
自蒸馏在带噪协方差模型中的谱收缩估计器中是最优的
AI总结 本文研究了自蒸馏在带噪协方差模型中的表现,证明了在谱收缩估计器中,s步自蒸馏在性能上最优,并展示了其在统计和机器学习中的优势。
Comments 103 pages, 8 figures
多类神经系统疾病预测的张量网络特征工程
AI总结 本文提出了一种结合张量分解与集成分类器的方法,用于多类神经系统疾病预测,通过张量网络表达性提升了模型鲁棒性,并在临床数据集上展示了与最新经典方法相媲美的性能。
静止的生灭过程生成通胀-贬值分布:避免主导问题
AI总结 本文研究了通过修改生灭过程的出生和死亡率来生成通胀-贬值分布的机制,并引入了两种新的此类分布,以解决现有方法中可能出现的主导问题。
比较两种分类Gini相关性及其在分类问题中的应用
AI总结 本文提出了一种用于比较分类问题中预测变量重要性的推断框架,基于Dang等人(2020)提出的分类Gini相关性(CGC),通过测试不同预测变量组之间的CGC差异来评估预测变量的重要性,并通过模拟研究和实际应用验证了该方法的有效性。
可检验且可操作的全面交换懊悔校准
AI总结 本文提出了一种新的校准度量标准SCDL,该度量标准在不削弱任何要求的前提下,既可操作又可检验,同时具备连续性和一致性等理想特性,并通过实验验证了其在实际中的优越性能。
StatQAT: 深度网络的统计量化优化
AI总结 本文提出了一种新的统计误差分析框架,用于统一和浮点量化,以提供理论洞察,针对不同数据分布的量化配置误差行为。基于此分析,作者提出了适用于任意数据分布的迭代量化器和适用于高斯似分布权重的分析量化器,从而实现了高效的低误差量化,适用于激活和权重。将这些量化器整合到量化感知训练中,并在整数和浮点格式上进行了评估,实验表明提高了准确性和稳定性,展示了该方法在训练低精度神经网络中的有效性。
特征学习如何重塑函数空间?
AI总结 本文研究了特征学习如何通过梯度下降训练改变两层神经网络的函数空间,揭示了特征学习在参数空间或输入空间中的分布变换作用,以及其对函数空间谱结构的影响。
Comments 59 pages, 1 figure
在线非交换面板数据的符合预测
AI总结 本文提出了一种简单的在线符合框架,用于非交换面板数据,通过利用在线面板预测的关键特征,即当需要对一个单位进行预测时,相关单位的同期结果可能已观察到,可以作为校准面板。该方法利用了适应性量来形成预测集,从而在长期内提供覆盖保证。
Comments 34 pages, 5 figures
平稳性变换真的能提升时间序列预测吗?一种受控的实验评估
AI总结 本文通过构造具有已知性质(趋势、季节性、异方差性及组合)的合成数据集,并在七种模型和三种预测时间跨度(共3528次实验)上应用14种变换配置,评估了平稳性变换对不同非平稳性类型和模型家族的预测准确性影响,发现只有18%的变换能提升预测,而方差稳定化方法在异方差数据上表现更佳,且差分线性趋势序列反而会降低预测精度,实验证实应基于经验性外样本评估选择变换而非理论平稳性假设。
关于熵正则化Q学习与函数逼近的高斯近似
AI总结 本文研究了熵正则化异步Q学习在高维中心极限定理下的收敛速率,通过线性函数逼近和多项式步长,建立了在凸距离下的高斯近似界,并推导了算法最后迭代的高阶矩界。
训练无限深且宽的Transformer
AI总结 本文提出了一种严格的数学框架,用于分析Transformer在均场 regime 中的梯度基于训练动态,通过研究无限深和宽的Transformer的均场模型,建立了训练风险的条件Wasserstein梯度的显式公式,并证明了在NTK注入性假设下梯度流收敛到全局极小值。
具有非单调生存数据的星形平均残余寿命模型:一种贝叶斯PMRL回归框架及其在教师留任中的应用
AI总结 本文提出了一种适用于非单调危险模式生存数据的星形平均残余寿命(SMEL)框架,通过贝叶斯PMRL回归方法,展示了在教师留任问题中的应用,该方法在处理复杂时间动态方面具有优势。
有序POVMs与残余坍缩
AI总结 本文研究了通过残余变换生成的有序离散POVMs的实现,探讨了残余变换在连续测试中的应用,提出了残余坍缩POVM的概念,并分析了其等价关系、范围和纤维特性。
用负相关建模泊松分布和二项分布对
AI总结 本文研究了通过引入调整函数构造具有负相关性的双变量分布,应用于泊松分布和二项分布,展示了其在土壤种子竞争数据和审计-C筛查问卷中的应用。
Comments 14 pages, 4 figures, 3 tables; Statistical Research Report, Department of Mathematics, University of Oslo, 17 May 2026; submitted for publication
通过再生核来控制任意结构假设空间中的假发现
AI总结 本文提出了一种基于再生核的框架,用于在任意结构的假设空间中控制假发现率,通过将结构FDR控制转化为正则化学习问题,实现了对连续域、图和层次结构的统一处理,提高了发现能力。
Comments 9 pages
将贝叶斯频谱反卷积与专家科学推理相结合以实现稳健的峰估计
AI总结 本文提出一种结合频谱反卷积与专家科学推理的贝叶斯框架,用于在存在高强度噪声或未知背景时稳健地估计峰结构,通过将物理性质回归层与贝叶斯频谱反卷积结合,提升峰识别的准确性。
Comments 55 pages, 26 figures
多变量EDF检验用于均匀性、正态性、球面和椭球对称性及独立性的Brownian sheet分解
AI总结 本文扩展了一种最近提出的基于EDF的适配性检验方法,用于超立方体[0,1]^p,即m检验和s检验,这些方法基于对p参数Brownian sheet的独特分解。通过将原假设所隐含的联合分布经过适当映射后分解为独立的连续分量,可以将问题转化为超立方体上的均匀性检验。本文引入并分析了基于这些原理的新检验方法,用于检验超球面S^p上的均匀性、多变量正态性、球面和椭球对称性以及R^p中的独立性。该方法基于将有限的有符号测度分解为零边际分量,以隔离坐标间相互作用。实证检验显示,这些扩展方法在统计文献中与现有方法具有竞争力,特别是在检测基于坐标的依赖性和联合依赖结构方面表现出高度敏感性。
Comments Acompanying R package: https://github.com/emcabana/MuniCandS
模块格安全(第三部分):对数单位格上的结构化CVP距离
AI总结 本文研究了对数单位格上结构化CVP距离的性质,证明了在随机短环元到对数单位格的L²距离收敛到特定值,并展示了其在Voronoi单元内的位置,同时给出了关于L∞范数的近似因子和粗格定理,以及模块行列式理想中的三角函数定理,最终将ML-KEM的CDPR因子从指数级降低到亚多项式级。
Comments 26 pages (simplied version). Most important part in this series
关于U统计量的渐近任意时刻有效推断
AI总结 本文研究了在连续监控下二阶U统计量的渐近任意时刻有效置信序列,通过Hoeffding投影将非退化情况转化为时间均匀的中心极限理论,同时在退化情况下提出SAGE边界以解决二次高斯-混沌近似问题,最终实现非退化和退化情况下的最优置信区间宽度。
SMART Fine-tuning Factor Augmented Neural Lasso
AI总结 本文提出了一种结合预训练源模型作为增强特征的残差调优框架(SMART),用于高维非参数回归中的变量选择问题,通过引入低秩因子结构和残差调优分解,实现了协变量和后验偏移的联合处理,并推导了最小最大最优的超额风险界。
Comments Authors are listed in alphabetical order
扩散型地震及其滑动距离标度
AI总结 研究通过分析扩散型地震的滑动距离标度,揭示了地震活动区域的扩散迁移特性,并建立了统一的标度关系。
Comments 33 pages, 10 figures
用于调查抽样中有限总体参数估计的机器学习方法
AI总结 本文探讨了机器学习方法在调查抽样有限总体推断中的应用,重点在于基于设计的有效性与统计推断。虽然灵活的预测工具能显著提高估计准确性,但也带来了重要挑战,主要是由于拟合预测器与样本之间的依赖性。本文聚焦于预测如何通过模型辅助估计、项目非响应插补和单位非响应调整进入调查估计的场景。对于模型辅助估计和项目非响应,展示了交叉拟合和奈曼正交估计方程如何借鉴双重/去偏机器学习的思想,使高维或非参数学习器得以应用,同时在适当条件下保持根n一致性与渐近正态性。相比之下,对于单位非响应,标准逆概率加权方法是结果无关且操作上具有吸引力的,但这一特性使得双重稳健和正交构造在官方统计中更难部署。此外,还简要讨论了小区域估计和概率/非概率数据整合的相关发展。总体而言,本文突显了机器学习的潜力及其对调查实践提出的根本推断挑战。
RIE-Greedy: 基于正则化的探索策略用于上下文老虎机
AI总结 本文提出了一种基于正则化的探索策略(RIE-Greedy),利用模型拟合过程中的随机性作为内在探索源,理论证明其在两臂老虎机情况下等价于Thompson Sampling,并在大规模商业环境中优于epsilon-greedy等基准方法。
在离散空间中使用时间点过程进行采样
AI总结 本文提出了一种基于时间点过程的离散空间采样方法,通过构造多变量时间点过程,使其在固定长度滑动窗口内的事件计数向量收敛于目标分布,同时引入辅助随机性将采样器转化为退化出生-死亡过程,并在多个目标分布上验证了其优越性。
Comments 20 pages, 1 figure. Minor revisions to wording, notation, and formatting. No substantive changes
Proximal-IMH: 用于独立Metropolis-Hastings的近端后验提议
AI总结 本文提出了一种改进的独立Metropolis-Hastings算法,通过引入辅助优化问题来消除近似后验分布中的偏差,从而在保持精确模型的同时提高稳定性和采样效率。
非平稳加权风险最小化中的快速收敛速率
AI总结 本文研究了非平稳条件下加权经验风险最小化方法的样本外预测误差,提出了一种将超额风险分解为学习项和分布漂移相关项的通用分解方法,并在混合条件下证明了学习误差的Oracle不等式,考虑了权重向量的有效样本量、权重和假设类的复杂性以及数据依赖性。
多层交叉注意力是多模态上下文学习中可证明最优的
AI总结 本文研究了多模态上下文学习中多层交叉注意力机制的理论最优性,证明了在多模态数据下,交叉注意力机制在梯度流优化下可达到贝叶斯最优,同时指出单层线性自注意力无法在任务分布下统一恢复贝叶斯最优预测。
SC3D:动态和可微的因果发现用于时序和瞬时图
AI总结 本文提出SC3D,一种动态和可微的因果发现方法,用于处理时序和瞬时图,通过两阶段可微框架联合学习滞后特定的邻接矩阵和瞬时有向无环图,提升了因果结构的稳定性和准确性。
Comments 12 pages
ST-BCP:通过非一致性分数转换紧缩后向符合预测的覆盖界
AI总结 本文提出ST-BCP方法,通过引入数据依赖的非一致性分数转换来缩小后向符合预测中的覆盖界差距,实验表明该方法有效减少了覆盖差距。
Latent-IMH: 高效的贝叶斯推断用于具有近似算子的反问题
AI总结 本文研究了在贝叶斯线性反问题中如何高效地从后验分布采样,其中参数到观测算子A计算成本高。通过将A分解为可构造低成本近似算子A~的方式,提出了一种基于Metropolis-Hastings独立采样器的Latent-IMH方法,通过近似算子生成中间潜在变量并利用精确算子进行优化,从而将计算成本转移到离线阶段,理论分析表明其在KL散度和混合时间上表现优异,实验显示其在计算效率上优于NUTS等现有方法。
Lasso在稀疏线性回归中的预测次优性
AI总结 研究Lasso在高维线性回归中选择调参方式时的预测性能次优问题,发现通过简单改进可在高概率事件和均方误差上提升性能,分析了高斯极大值在选定或局部化支撑上的作用,并讨论了设计矩阵结构因素对次优现象的影响及扩展至其他估计器和更一般噪声结构的可能性。
Comments 26 pages; revised version
在联合嵌入预测世界模型中成功因素是什么?
AI总结 本文研究了在物理规划中使用联合嵌入预测世界模型(JEPA-WMs)的成功因素,通过分析模型架构、训练目标和规划算法对规划成功的影响,提出了一种在导航和操作任务中优于现有基线方法的模型。
Comments V2 of the article: - Added AdaLN-zero - Added table comparing JEPA-WMs with baselines with std translating per-seed variability only, no variability across epochs - Reordered figures in main body of the paper V3: added data scaling experiments, theoretical appendix section on autoregressive rollout, acceptance at TMLR
针对重尾噪声下的非光滑凸优化的截断梯度方法:一种细化分析
AI总结 本文针对重尾噪声下的非光滑凸优化问题,提出了一种改进的截断梯度方法,并在高概率和期望收敛方面提供了更优的收敛速率和理论分析。
Comments A preliminary conference version is accepted at ICLR 2026. This full version includes the formal statements of lower bounds and their proofs. v3: fixed some typos
通过准共轭性在双参数泊松-狄利克雷隐马尔可夫模型中实现精确推断
AI总结 本文提出了一种非参数模型,用于从离散时间数据中推断时间演变的未观察概率分布,数据由无标签的划分组成。潜在过程是双参数泊松-狄利克雷扩散过程,观测通过可交换抽样产生。应用包括社会和遗传数据,其中仅观察到聚类汇总信息。为了解决不可行的似然,我们开发了一个可计算的推断框架,避免了标签枚举和直接模拟潜在状态。我们利用扩散过程与在划分上的纯死亡过程之间的对偶性,以及编码新数据影响的凝集算子,从而得到前向和后向推断的闭式递归更新。我们计算了任意时间点潜在状态的精确后验分布和未来或插值划分的预测分布。这使我们能够进行在线和离线推断和预测,并完全量化不确定性,绕过MCMC和序列蒙特卡罗方法。与粒子滤波相比,我们的方法在准确性、方差和计算效率方面都有显著优势。我们通过合成实验和社会网络应用展示了该方法,恢复了时间变化异质性的可解释模式。
Comments Final accepted version. To appear in JASA
TPV:通过测试预测方差的透镜进行参数扰动分析
AI总结 本文引入测试预测方差(TPV)作为分析训练后鲁棒性的统一框架,通过研究参数扰动对模型输出的一阶敏感性,揭示了SGD噪声、标签噪声、量化和剪枝等机制的统一视角,并提出了基于TPV的剪枝准则和模型选择方法。
Comments ICML 2026
对下游天气预测模型的对抗攻击:应用于热带气旋轨迹预测
AI总结 本文研究了对抗攻击对深度学习天气预测模型的脆弱性,提出了一种新的攻击方法Cyc-Attack,用于生成对抗性轨迹,以提高攻击的准确性并减少检测难度。
Comments Compared with the previous version, we added zeroth-order optimization methods as baselines, clarified the motivation for using a surrogate model, and provided a more detailed investigation of the upstream attack
多类预测中的诚实校准误差
AI总结 本文研究了多类预测中诚实校准误差的实用作用,提出了完美诚实校准误差以处理标签分布的多维线性属性,并分析了这些诚实误差在决策理论上的影响,从而解释并缓解了分箱校准误差的排名鲁棒性问题。
自适应重采样的随机傅里叶特征收敛性
AI总结 本文研究了高维数据中基于随机傅里叶特征的机器学习方法的收敛性,通过自适应重采样频率的方法证明了在节点数和数据量趋于无穷时的收敛性,并通过数值实验验证了回归和分类问题的分析结果。
Comments 50 pages, 19 figures
超越RLHF:对齐的统一理论框架
AI总结 本文提出了一种统一的对齐理论框架,通过将对齐视为基于成对偏好的分布学习,推导出三种新的对齐目标,并证明了它们在非渐近情况下具有O(1/n)的收敛性,为RLHF提供了理论支持。
Nash: 用于结构高维回归的神经自适应收缩
AI总结 本文提出Nash框架,通过神经网络整合协变量特定的侧信息,实现高维稀疏回归,提升模型适应性和准确性。
通过平滑改进随机森林
AI总结 本文提出一种基于核的平滑机制,通过引入局部正则性来增强随机森林的预测性能,同时保留其自适应分区能力,特别是在数据稀缺情况下提升了预测效果。
Comments v2: Accepted manuscript. 30 pages (18 main + 12 appendix), 6 figures
镜像均场 Langevin 动力学
AI总结 本文提出镜像均场 Langevin 动力学(MMFLD),用于优化受限在 $\mathbb{R}^d$ 子集上的概率测度,并通过统一的对数 Sobolev 不等式获得连续 MMFLD 的线性收敛性保证,以及其时间-粒子离散化版本的统一时间传播混沌结果。
Comments ICML 2026
面向LLM推理和AI代理的吞吐量最优调度算法
AI总结 本文从排队论角度研究了LLM推理系统的吞吐量优化问题,证明了工作保持调度算法在DAG和Fork-Join路由拓扑中能实现最大吞吐量,并揭示了批量处理网络中K-FCFS调度的流极限框架,评估了Orca和Sarathi-Serve的吞吐量最优性,同时指出批量大小限制和循环路由拓扑对吞吐量的影响。
观察性研究因果推断的样本量和功效计算
AI总结 本文研究了观察性研究中因果推断的样本量和功效计算,通过分析逆概率加权估计量的方差,将功效计算分解为三个组成部分:倾向分数分布、潜在结果分布及其相关性。提出通过两个参数量化混杂因素-治疗和混杂因素-结果关联强度,并开发了R包和在线计算器。
基于最优传输映射的贝叶斯球面回归
AI总结 本文提出了一种基于最优传输的贝叶斯球面回归方法,通过划分球面领域并局部建模回归映射,以捕捉复杂的球面关系,从而实现灵活且具有表现力的回归模型。
使用随机模拟器进行非确定性极限状态的可靠性分析
AI总结 本文提出了一种基于随机模拟器的可靠性分析方法,通过使用合适的替代模型降低计算成本,验证了通用lambda模型和随机多项式展开在分析风力涡轮机可靠性时的有效性。
GUIDE-VAE:利用用户信息和模式词典推进数据生成
AI总结 本文提出GUIDE-VAE,一种基于用户嵌入和模式词典的生成模型,通过整合用户信息和复杂特征依赖性,提升多用户数据集下的生成性能和样本真实性。
统计泰勒展开:一种新的、路径无关的不确定性分析方法
AI总结 本文提出了一种新的路径无关的不确定性分析方法,通过将精确输入变量替换为具有已知分布和样本数的随机变量,计算每个结果的均值、偏差和可靠因子,从而实现对输入不确定性的传播追踪,使最终结果成为路径无关的,与传统数学方法不同。
Comments 47 pages, 40 figures
混合先验用于复制研究
AI总结 本文提出了一种基于混合先验的新型贝叶斯方法,用于复制研究,通过混合原始研究的后验分布和非信息性分布来量化复制研究的复制程度,并展示了如何利用贝叶斯因子进行科学假设检验。
小批量梯度下降的长期分布是什么?一种大偏差分析
AI总结 本文研究了在一般非凸问题中随机梯度下降(SGD)的长期分布。通过基于大偏差理论和随机扰动动力系统的方法,作者发现SGD的长期分布类似于热力学平衡态的玻尔兹曼-盖布斯分布,其中温度等于方法的步长大小,能量水平由问题的目标函数和噪声统计决定。研究还发现,在长期中,(a)问题的临界区域比任何非临界区域被访问的次数指数级更多;(b)SGD的迭代结果在问题的最低能量状态上指数级集中(该状态不总是对应于目标函数的全局最小值);(c)所有其他临界点的连通分量被访问的频率与它们的能量水平呈指数比例关系;最后,(d)任何局部极大值或鞍点的连通分量都被局部最小值的连通分量所主导,后者被访问的次数指数级更多。
Comments 71 pages, 3 figures; presented in ICML 2024
基于深度ReLU网络的度量与相似性学习的泛化分析
AI总结 本文研究了度量与相似性学习的泛化性能,通过构建结构化的深度ReLU神经网络来近似真实度量,并推导出显式的泛化误差界,首次为该领域提供了明确的泛化分析。
Comments 15 pages, 1 figure
泊松对数正态模型的复合似然推断
AI总结 本文提出了一种结合EM框架与复合似然和重要性采样估计的新型推断方法,用于泊松对数正态模型参数估计,解决了高维积分瓶颈问题,实现了计算可行性,同时保持了最大似然估计的渐近性质。
对多样化R生态系统的实证探索
AI总结 本文通过分析CRAN元数据和文献引用数据,探讨了R生态系统的发展动力及其跨学科影响,揭示了R社区中开发者协作模式及潜在影响。
近似贝叶斯可信集的校准程序
AI总结 本文提出并应用了两种校准程序,用于检查使用蒙特卡洛方法估计的可信区间覆盖性。研究核心是通过半参数逻辑回归和重要性采样来估计后验覆盖,以评估近似可信集的性能。
Comments 28 pages, 6 Figures, 1 Table, 4 Algorithm boxes. Revision improves clarity of presentation and adds relevant citations
基于Bregman散度的方法:一般恰当损失的校准
AI总结 本文提出了一种基于懊悔最小化的通用校准框架,考虑了包括α-Tsallis损失(α∈[1,2])和Lipschitz损失在内的广泛恰当损失家族,同时展示了新的关于Be The Regularized Leader的懊悔等式。
Comments 31 pages
具有Win统计的分层终点的样本量和功效计算的FORSS框架
AI总结 本文提出了一种基于公式的方法,即FORSS框架,用于处理具有分层终点的临床试验中的样本量和功效计算,通过灵活的联合工作分布和熟悉度量来指定边际治疗效应,从而克服了现有方法的局限性。
基于位置感知的多项逻辑带宽学习:从乘法位置效应到一般位置效应
AI总结 本文研究了动态联合品类选择与排列问题,其中每个产品的吸引力取决于其内在吸引力和显示位置,在多项逻辑(MNL)选择框架下。研究从乘法位置效应模型扩展到一般位置效应模型,为两种模型设计了基于轮次的学习算法,并建立了首个最优后悔分析。此外,这些基于轮次的算法为现代平台提供了必要的实时操作。对于乘法模型,开发了具有截断机制的交叉位置成对最大似然估计器,并证明算法P2MLE-UCB达到$ ilde{O}(\sqrt{NT})$的后悔,匹配下限并弥补了先前基于周期的分析留下的$\sqrt{K}$差距。对于一般模型,建立了最小最大下界并提出了GP2-UCB算法,具有匹配的上界。此外,设计了基于Dinkelbach方法和最大权二分图匹配的高效子程序,用于每轮联合品类和排列优化。在合成数据和Expedia数据集上的数值实验表明,我们的算法在性能上始终优于最先进的基准。
利用闭合条件和算子分裂求解线性速率ODE层级(如同主方程)
AI总结 本文提出了一种方法,通过闭合条件和算子分裂来求解线性速率ODE层级,解决了连续时间马尔可夫过程的正向方程问题,展示了该方法在不同应用中的有效性,包括分支过程、矩阵值电报和G/R延长等。
Comments An implementation exists at https://github.com/nih-niddk-mbs/StochasticGene.jl
投影头的几何学:条件性、不变性与坍缩
AI总结 本文提出了一种投影头的几何理论,通过将投影头建模为可训练的黎曼度量来研究自监督学习中的条件性、不变性和坍缩问题,揭示了投影头在不同深度下的适应能力和稳定性。
Comments Accepted at ICML 2026. 29 pages, 8 figures, 7 tables
SGD在对角线线性网络中的高维极限
AI总结 本文研究了在高维情况下,SGD在对角线线性网络中的行为,通过推导随机微分方程来近似SGD的动力学,并推导了描述迭代状态和可观测统计量时间演化的偏微分方程,最终证明了在合适参数化下,SGD动态具有全局良好定义并以指数速度收敛到零风险。
Comments 91 pages, 5 figures
通过谱图稀疏化学习总正性高斯图模型
AI总结 本文提出了一种基于谱图稀疏化的高斯图模型学习方法Spectral-MTP2,通过总正性约束在保持模型准确性的同时生成更稀疏可解释的图结构。
Comments 16 pages
可微优化层用于深度学习中的保证公平性
AI总结 本文提出了一种称为'公平性层'的可微优化层,该层可确保在神经网络中集成时满足所选的输出平等性概念,并介绍了一个在线对偶推理算法,为流式预测提供可证明的公平性保证,即使使用任意小的批量大小。
Comments To be published in International Conference on Machine Learning (ICML), 2026
基于扩散的随机算子网络用于随机偏微分方程中的不确定性量化
AI总结 本文提出了一种新的框架,用于随机偏微分方程(SPDEs)解算子的不确定性量化。尽管SPDEs在建模具有不确定性的复杂物理系统中起着核心作用,但其实际应用通常需要指定模型不确定性的幅度和结构,而这些通常是未知且难以从噪声测量中推断出来的。为此,本文开发了一种随机算子学习框架,直接从噪声数据中学习,并输出均值解场和不确定性量化。所提出的方法,即随机算子网络(SON),通过结合深度算子网络(DeepONet)的结构与随机神经网络(SNNs)来建模随机性并实现概率预测。训练过程通过最小化一种哈密顿型损失并使用随机最大原理优化所得目标进行。在多个不确定性源下的基准SPDEs上的数值实验展示了所提出方法在捕捉解结构和量化预测不确定性方面的准确性和鲁棒性。
全球自动化图谱
AI总结 本文提出了一种基于任务和国家特定的方法,用于全球范围内分类自动化暴露,以区分劳动力替代和增强自动化,相关技术渠道以及人工智能的物质作用。研究涵盖了124个国家,生成了覆盖全球99%人口和GDP的233万个任务-国家标签。
Comments 65 pages, 6 figures. Data and code: https://automationatlas.org/
单世界干预图作为分布:因果识别的一个框架
AI总结 本文提出将单世界干预图视为分布的框架,用于因果识别,通过系统推导干预定义的估计量的识别表达式,扩展了现有文献中的后门推导方法,并提出了适用于复杂场景的前门推导方法。
对随机向量之间依赖性的量化:一个新的指数及其应用
AI总结 本文提出一个新的指数来量化随机向量之间依赖的程度,该指数在[0,1]区间内取值,当且仅当随机向量子独立时取零值。与单纯的不相关性不同,子独立性表示一种更强的依赖形式,但仍然严格弱于完全独立性。该指数通过特征函数构造,并在矩的术语中具有简化表示。我们建立了其理论性质,并推导了相应的经验测度的计算效率公式。此外,我们研究了估计量的渐近行为,并通过在机器学习、精算科学和再生成理论中的应用展示了其实际用途。
Comments 31pages
CAST:基于简单集的因果传输用于分布值时间序列
AI总结 该研究提出CAST方法,通过因果锚定简单集传输来处理分布值时间序列的因果预测,解决了分布传输中的结构性失效问题,并在多个基准测试中表现出色。
从样本复杂性到机理洞察的神经网络学习动态的傅里叶视角
AI总结 本文从傅里叶视角研究神经网络学习动态,揭示了自然图像的近似平移不变性和功率谱特性,展示了简单神经网络在图像分类任务中先依赖幅度信息再利用相位信息的学习过程,并证明了在高维输入下仅基于相位信息的分类任务的难度,以及功率谱如何加速相位信息学习。
生存分析中的差分隐私假设检验
AI总结 本文研究了生存分析中差分隐私假设检验的问题,提出了针对Cox回归系数的隐私部分似然比检验和分数型检验,以及累积危险函数的隐私分布式两样本检验,并证明了差分隐私和有限样本检验保证以及最小最大下界,揭示了隐私在统计上可忽略、主导检验速率以及半参数生存模型中最优隐私检验率仍待解决的问题。
多地区临床试验中区域治疗效应异质性评估的工作流程
AI总结 本文提出了一种结构化、问题导向的框架,用于指导多地区临床试验中区域异质性的探索性评估,通过四个关键问题明确分析目标,并提出相应的统计方法来解决这些问题。
HYVINT: 基于变分表示的强度驱动超图生成
AI总结 本文提出HYVINT框架,通过强度驱动的超图生成机制和变分估计器,解决超图生成中节点-超边关系的建模问题,实现高保真且具有多样性的生成。
预测-干预博弈与不变集
AI总结 本文研究了预测-干预博弈中的领导方如何通过选择预测函数来应对跟随方的干预,证明了基于稳定毯的预测在某些情况下优于因果父母的预测,并讨论了实际应用中的策略。
多分辨率空间图回归模型用于分层空间转录组数据
AI总结 本文提出了一种基于多分辨率空间图回归的贝叶斯框架,用于从多分辨率空间转录组数据中推断空间变化的基因网络,通过引入空间结构的边选择策略和高斯过程先验,提高了对空间变化的建模能力,并在模拟研究和肾癌数据中展示了改进的网络结构恢复和肿瘤梯度中hub基因的识别。
NeuroMAS: 多智能体系统作为神经网络的多智能体系统
AI总结 本文提出NeuroMAS,一种将多智能体系统视为可训练和可扩展的神经网络架构的方法,通过联合强化学习提升多智能体系统的性能和可扩展性。
在上下文流映射中传播混沌
AI总结 本文提出了一种定量统计理论,用于在大上下文范围内研究transformers,通过采用上下文流映射(CFMs)的抽象:在一组注意力块中,动态系统在上下文度量的存在下演进一个区分的token。在此框架下,有限上下文模型近似于理想化的无限上下文系统,其中上下文度量被其底层总体取代,因此上下文长度n成为统计资源。利用动态的麦肯-瓦尔科夫结构和经典的传播混沌经典机器,我们建立了前向边界,控制有限上下文和无限上下文CFMs在深度上的偏差,并建立了后向边界,控制对应的训练轨迹在在线梯度下降迭代中的偏差。这两个边界实现了通用CFMs的最优Wasserstein速率n^{-1/d}和参数速率n^{-1/2},对于包含transformers的受限CFM类。分析基于新的欧拉共轭公式和由此产生的前向-共轭系统的稳定性估计,这两者可能具有独立兴趣。
Comments 31 pages, 1 figure
通过直接变形纤维束端点实现的皮层对齐
AI总结 本文提出了一种基于连接性的皮层对齐方法,通过直接操作白质纤维束端点来对齐皮层表面,以提高纤维束层面的对应性,并在主要纤维束上实现更高的连接性重叠系数和更强的鲁棒性。
样本交叉协方差的集中不等式
AI总结 本文研究了样本交叉协方差矩阵偏离其均值的集中不等式和期望界,针对子高斯随机向量,证明了由两个边缘协方差矩阵有效秩决定的高概率算子范数界,在高斯情况下证明了匹配的期望下界,允许两个随机向量之间任意的相关性。
Comments 13 pages
利用β-TCVAE模型在fMRI中分离非线性独立源
AI总结 本文提出利用β-TCVAE模型处理非线性fMRI数据,分离混合的空间和时间脑信号,恢复具有生物学意义的非线性空间成分,并通过功能网络连接性验证了潜在结构的可解释性。
Comments 6 pages, 2 figures
你的 SaaS 是一种保险产品:一种建模框架
AI总结 本文将 capped-usage SaaS 产品与保险产品进行类比,提出基于频率-严重性分解、保费计算原理和蒙特卡洛储备充足性的建模框架,用于 SaaS 价格建模。
Comments 23 pages, 2 figures, 7 tables. Companion code archived at DOI 10.5281/zenodo.20213155
半参数回归用于误分类竞争风险数据
AI总结 本文提出一种半参数回归方法,用于处理无内部验证样本的竞争风险数据误分类问题,通过外部验证研究估计误分类概率,提升估计效率。
Comments Original Article, Biostatistics - Survival Analysis, 2 figures
分布统计遗忘:一种假设检验方法
AI总结 本文提出一种分布统计遗忘框架,通过假设检验选择样本以减少不需要的分布影响,同时保持所需分布的性能,并分析了允许的编辑数据分布区域和帕累托前沿。
Comments Comments welcome
分数卡尔曼滤波器
AI总结 本文提出分数卡尔曼滤波器,通过结合分数匹配与斯蒂恩恒等式,避免了分区函数的计算,实现了非线性系统的高效滤波,适用于高维问题。
Comments 56 pages, 27 figures
分段线性单调回归
AI总结 本文提出分段线性平滑框架,解决传统单调回归无法提供边际属性的问题,通过双层优化方法在凸非凸情况下提升估计精度。
支付异质性指数:一种用于高 volume 采购监督和决策支持的集成无监督框架
AI总结 本文提出支付异质性指数(PHI),通过整合高斯混合模型参数和非参数统计,用于高 volume 采购监督和决策支持,揭示支付结构和潜在模式。
Comments Request category change from econ.EM -> stat.ML. Paper is methodological, introducing a new unsupervised ML/stat framework (SHI/PHI index) for distributional structure. Methodology is general; procurement is the application. stat.ML is more appropriate primary; econ.EM as cross-list
基于时间到事件结果的因果推断样本量和功效计算
AI总结 本文开发了用于时间到事件结果因果推断的样本量和功效公式,提出新的分析样本量公式,适用于随机试验和观察性研究,修正了经典log-rank方法的误判。
对拉格朗日作用的呼吁:从时间快照中学习群体动力学
AI总结 本文提出通过时间快照学习群体动力学的新方法,基于拉格朗日作用和韦瑟斯特拉格梯度流,提出WLM算法能预测和插值未见边际,并在多种动态中表现优异。
Comments Accepted at ICML 2026 (spotlight)
通过校准大规模观测结果来运输治疗效应
AI总结 本文提出一种方法,通过校准观测结果与实验数据,估计运输治疗效应,并展示其在不同正性下的稳定性。
Comments 37 pages, 5 figures
阈值破裂点
AI总结 本文提出了一种新的有限样本鲁棒性方法,定义了阈值破裂点和有限样本m-敏感性,扩展了Zhang(1996)的决策破裂点,展示了这些概念与假设检验的有限样本对应关系。
Wasserstein分布鲁棒遗憾优化用于人类反馈的强化学习
AI总结 本文提出Wasserstein分布鲁棒遗憾优化(DRRO)用于强化学习从人类反馈,通过简单分配模型研究提示问题,展示在ℓ1-地面成本Wasserstein模糊集下,内最坏遗憾有精确解,最优策略具有水填充结构,从而实现高效政策梯度算法。
在异质目标和约束下聚焦决策的联邦学习
AI总结 本文研究了在异质目标和约束下聚焦决策的联邦学习,通过SPO+替代损失推导出异质性界限,展示了在强凸可行集下联邦学习的鲁棒性,并通过实验验证了其有效性。
通过测量和未测量的中心特征处理指示偏倚的LAGO试验
AI总结 本文提出通过引入固定中心效应来控制指示偏倚,统一了连续和二元结果类型的LAGO理论,并提供了统计检验和优化方法。
Transformer中上下文关系的表达能力
AI总结 本文提出一种测度理论框架,将上下文关系建模为概率对象,揭示了softmax注意力与熵正则化最优传输的联系,并证明Transformer能近似任意上下文关系规则。
弱形式恢复随机生成器与动力学不变量
AI总结 本文通过弱投影方法从稀疏回归中联合识别随机过程的漂移和扩散项,从而显式生成符可进行谱分析,并在基准系统中验证了其准确性。
Comments 21 pages, 5 figures
基于系统理论的Hawkes过程识别方法:保证正定与稳定性
AI总结 本文提出基于系统理论的Hawkes过程识别方法,利用正交拉格朗日基保证正定性和稳定性,通过半定规划高效求解参数约束问题。
Comments 6 pages, 2 figures
不变量分层传播用于表达性图神经网络
AI总结 本文提出不变量分层传播框架,通过改进的WL变体和高效神经网络实现,提升图神经网络的表达能力,解决结构异质性捕捉问题。
有人下棋吗?分析高于高阈值的国际象棋评级
AI总结 本文分析了国际象棋评级中高于高阈值的玩家分布,提出新的模型来解释顶级玩家的差异。
Comments 9 pages, 7 figures
精度的威力:复杂系统中的结构引导检测——从客户流失到癫痫发作 onset
AI总结 本文提出一种基于结构信息的机器学习方法,用于复杂系统中关键事件的早期检测,通过学习最优特征表示和分类模块,实现对隐藏因果结构的识别与利用,展示了在癫痫发作检测和客户流失预测中的有效性。
通过非参数逃逸定理检测离散信号中的随机性
AI总结 本文提出一种基于连续半鞅逃逸和穿越定理的非参数方法,通过比较实测逃逸次数与理论期望比值,区分扩散过程与确定性信号,不依赖参数模型。
保障自主性:如何用运筹学赋能和协调生成式AI系统
AI总结 本文探讨生成式AI在向自主决策系统转变过程中,如何通过运筹学方法提升系统的可行性、鲁棒性和风险控制能力。
Comments Authors are listed alphabetically; Production and Operations Management (POM), 2026
注意力的梯度动力学:交叉熵如何塑造贝叶斯流形
AI总结 研究通过分析交叉熵训练如何重塑Transformer注意力分数和值向量,揭示了注意力评分的优势路由定律和值的职责加权更新,展示了梯度动力学如何塑造贝叶斯流形以支持概率推理。
Comments v2: Add dual-entropy connection - advantage signal drives \r{ho} down; fix duplicate bibliography entries (synced from Paper I)
Transformer 注意力的贝叶斯几何
AI总结 本文通过构建贝叶斯风道,验证了Transformer在上下文中的贝叶斯推理能力,发现其通过几何机制实现后验更新与路由,揭示了注意力机制的必要性及扁平架构的不足。
Comments v2: Add dual-entropy measurement framework (H_I, H_P, \r{ho} = H_P/H_I); incorporate Overleaf revisions; fix duplicate bibliography entries (akyurek mashup; openai title; legacy aliases removed)
无需调谐的Catoni类型联合鲁棒估计
AI总结 本文提出一种无需调谐的Catoni类型联合估计框架,用于具有厚尾噪声的参数模型,同时估计目标参数和未知噪声方差。在均值估计、线性回归和ℓ₂惩罚回归三种经典设置中应用该框架,并建立非渐近性子高斯型偏差界,证明其在厚尾情况下最优。
基于树的密度核及其在聚类DNase-seq轮廓中的应用
AI总结 本文提出一种非参数密度核,用于在分层框架中建模多重采样密度,以捕捉TF足迹的复杂空间依赖性,提升聚类准确性。
基于Lipschitz性的生成模型插值调度设计
AI总结 本文研究了生成模型中插值调度的设计,从统计和数值角度出发,提出通过最小化漂移场的平均平方Lipschitz性来设计调度,以提升生成模型的稳定性与准确性。
图神经网络在住宅选址选择中的应用:与经典logit模型的联系
AI总结 本文提出基于图神经网络的住宅选址选择模型,通过捕捉空间替代关系,优于传统模型,展现深度学习与离散选择模型结合的潜力。
基于基本SDP松弛的稀疏PCA随机算法
AI总结 本文提出基于基本SDP松弛的稀疏PCA随机近似算法,通过构造确定性和随机性解并输出最优解,实现高概率下的稀疏性常数近似比,并在特定条件下保证近似比受对数约束。
Comments 29 pages, 2 figures
推动物理教育研究中的聚类方法:混合模型的案例
AI总结 本文探讨了混合模型在物理教育研究中的应用,对比了k-modes聚类与潜在类别分析的理论差异,并通过平行分析展示其在解决相同研究问题时的异同。
在结构流形上理解上下文学习:连接注意力机制与核方法
AI总结 本文研究了在结构几何数据上上下文学习的理论,通过将注意力机制与核方法联系,揭示了transformers在流形上进行核预测的机制,并推导了泛化误差界。
基于半监督推断的可靠公平性审计
AI总结 本文提出Infairness框架,利用半监督推断在有限标注数据下实现公平性审计,通过回归与非线性基函数填补缺失结果,提升估计鲁棒性和效率,实验证明其在医疗数据中显著降低方差。
用于噪声和任务级流形学习的Transformer:近似和泛化见解
AI总结 本文研究了Transformer在噪声和任务级流形上的学习性能,证明了其在低维结构中泛化能力与任务级流形的内在维度密切相关。
基于e值的家族错误率控制
AI总结 本文提出基于e值的闭合检验框架,用于控制家族错误率,改进了传统方法在静态和动态设置中的性能,并开发了高效的算法。
Comments 32 pages, 12 figures, 4 algorithms
提升最小二乘估计的策略
AI总结 本文探讨了高维最小二乘回归中加速计算的策略,包括MM原理、Moreau包络 smoothing 和约束估计的proximal距离原理,通过迭代加权最小二乘等方法提高计算效率。
新冠疫情前后加密货币市场动态溢出效应研究
AI总结 本文基于非对称断点方法区分加密货币市场中的风险共振与风险分散关系,分析极端事件下加密货币的风险传播机制,并探讨疫情前后加密货币风险关联的动态演变。
Comments This paper has been withdrawn because the current version contains errors in the framing and results that may mislead readers. The authors are preparing a corrected manuscript
用于心血管疾病分类的高效混合超参数调优方法
AI总结 本文提出一种结合随机搜索和网格搜索的混合超参数调优方法,提升心血管疾病分类模型的准确性和效率,实验表明该方法在性能和计算时间上均优于传统方法。
高维部分线性模型与趋势过滤
AI总结 本文提出高维部分线性回归模型,结合线性模型的可解释性和非参数方法的适应性,利用趋势过滤处理局部平滑变化,实现最小最大最优率,用于复杂生物数据集中的生物标志物识别。
Comments 52 pages, 8 figures
抑制注意力:因果注意力门控用于自动驾驶中的鲁棒轨迹预测
AI总结 本文提出CRiTIC模型,通过因果发现网络识别agent间因果关系,并引入因果注意力门控机制提升轨迹预测的鲁棒性和泛化能力,实验表明模型在对抗非因果扰动时鲁棒性提升54%。
Comments Accepted ICRA 2025
选择性学习中泛化理论的实用性研究
AI总结 本文从理论与实践角度探讨选择性学习的泛化能力,提出基于有符号测度的可学习预测方法,并改进OOF泛化性能。
Comments 15 pages. Technical Report (Extended Version)
快速收益最大化
AI总结 本文研究了基于数据的定价问题,通过有限历史价格数据确定单个物品的价格,量化信息价值并指导高效定价实验。核心方法是将无限维问题转化为一维优化问题,提供有保证的定价策略,并展示在动态定价中如何减少实验次数。
基于锚点的异方差噪声用于偏好贝叶斯优化
AI总结 本文提出一种异方差噪声模型用于偏好贝叶斯优化,通过用户提供的可靠示例(锚点)和核密度估计生成用户不确定性图,并推导出风险规避的获取函数,提升风险调整性能。
Comments Camera-ready version (ProbML 2026)
基于高斯过程的学习偏好与选择教程
AI总结 本文介绍了利用高斯过程进行偏好学习的框架,结合经济学和决策理论原理,提出新颖的模型以填补现有文献的空白。
通过ProxSkip在分布式随机优化中实现线性加速
AI总结 本文研究了ProxSkip在非凸设置下的收敛性,证明其在节点数量上实现线性加速,并展示了局部更新对通信效率的提升作用。
集体异常检测与枚举的符合化封闭检验
AI总结 本文提出一种分布无关方法,用于集体异常检测与枚举,结合符合推断和多重检验等思想,通过自动选择分类器和检验程序,有效检测稀疏、弱或隐蔽的异常信号。
权重衰减是否增强训练稳定性?
AI总结 本文研究权重衰减对训练动态稳定性的影响机制,发现其通过参数空间动态和损失尖锐度的变化影响训练稳定性,并揭示了架构依赖的相变现象。
Comments 24 pages, 16 figures
基于观测数据的政策学习:HIV/HCV共感染患者抗病毒治疗的案例
AI总结 本文提出在弱假设下通过观测数据推导多行动政策规则的方法,应用于HIV/HCV共感染患者抗病毒治疗,发现部分患者无需治疗即可自愈,优化治疗分配可降低成本并提升健康效益。
Comments 74 pages, 10 figures
非递减生存回归:从深度Cox模型中校准生存分布
AI总结 本文提出一种非递减回归方法,用于校准深度Cox模型的生存概率,通过理论保证和实验验证提升模型实用性。
一种用于空间深度学习中不确定性量化稳定超参数区域识别的立方策略
AI总结 本文提出一种基于立方体的诊断框架,通过递归划分超参数空间,识别MC dropout产生良好校准预测区间稳定区域,提升空间深度学习模型的不确定性量化能力。
StAD:基于Stein算子的 amortized 散度用于具有扩散和流的快速似然
AI总结 本文提出StAD方法,利用Langevin-Stein算子预测和学习PF-ODE的散度,无需计算雅可比矩阵,提升了似然预测的效率和稳定性。
Comments 24 pages, 10 figures
预处理退火 Langevin 动力学在多模高斯混合中的维度均匀离散化分析
AI总结 本文研究了预处理退火 Langevin 动力学在高斯混合中的稳定性问题,通过 Euler-Maruyama 离散化和指数积分方案,证明了在满足特定谱条件时,KL 散度具有维度均匀的上界。
通过训练协议在视觉变换器中诱导空间局部性
AI总结 研究通过对比不同训练协议,发现CutMix能提升视觉变换器早期层的注意力局部性,降低MAD值,表明CutMix促进局部注意力的产生。
一种结合知识符号学习与认知深度学习的分层图像分类方法
AI总结 本文提出一种统一的神经符号和认知建模框架,通过融合Swin Transformer、焦点集推理和可微模糊逻辑,提升分层图像分类的准确性和逻辑一致性。
Comments 36 pages
TailedTS:用于重尾时间序列预测和周期性量化的大规模基准数据集
AI总结 TailedTS数据集用于测试在重尾、零膨胀和非高斯条件下时间序列预测模型的鲁棒性,通过稀疏自回归框架揭示高频页面的周期性较弱,同时提供非高斯损失函数的标准化预测基准。
通过LLM裁判增强人类评估:你真的需要多少人类评审?
AI总结 本文提出通过LLM作为辅助裁判来增强人类评估,通过两阶段抽样设计确定人类和LLM评审样本量,以实现目标统计功效。
Comments 10 pages, 5 figures
对时间变化模型参数一致性的检验
AI总结 本文研究了模型参数随时间变化的检验问题,提出了一种监控过程并构建了适合检验的统计量,讨论了如何确定变化的位置和类型,适用于各类参数模型。
Comments 23 pages, 3 figures. This is a Statistical Research Report, Department of Mathematics, University of Oslo, from 2001, containing some more material than for the published version, in Journal of Nonparametric Statistics, 2002, vol. 14, pages 113-132. NLH honours Alex Koning (1959-2022) by making these Hjort-Koning methods more visible, via arXiv and other channels
数据驱动的气候停电风险特征分析与联合电力-通信网络韧性分析
AI总结 本文提出数据驱动框架,结合实证停电分析与级联故障模拟,揭示气候相关停电事件增加趋势及沿海地区风险加剧问题,通过逻辑回归模型识别主要影响因素,并通过级联模拟评估不同场景下的韧性缺口。
中长期阿尔茨海默病进展预测:基于残差间隙感知的变换器用于ADNI临床和生物标志物历史的24个月CDR-SB变化
AI总结 本文提出残差间隙感知变换器,结合混合效应统计参考与变换器残差学习,用于预测24个月CDR-SB变化,提升了预测精度和相关性。
Comments Preprint; includes appendix, 4 figures, and 6 tables
核化优势估计:从非参数统计到大语言模型推理
AI总结 本文提出利用非参数统计方法提升大语言模型推理中的优势估计,通过核平滑技术实现高效的价值函数估计与策略优化,提升政策学习质量。
Comments 45 pages, 5 figures
审计审计者:基于社区的 moderation 是否正确?
AI总结 本文研究了基于社区的 moderation 系统在 X 平台 Community Notes 中的审计机制,发现少数贡献者在争议话题中趋于多数意见,并提出一种基于贡献者稳定性权重的两阶段算法以提升预测性能。
未链接线性模型中的反卷积
AI总结 本文研究了在未链接线性回归框架下非参数反卷积问题,提出了一种在Wasserstein距离下达到参数收敛速率的非参数估计器,且噪声平滑度不影响收敛速度。
关于牛顿步和影响函数数据归因的准确性
AI总结 本文研究了牛顿步和影响函数数据归因方法的准确性,推导出误差缩放规律,揭示了NS方法在特定条件下更准确的原因。
关于高斯序列因果条件定向信息率的非渐近误差界
AI总结 本文研究了高斯序列的因果条件定向信息率,提出基于最优预测的显式公式,并给出误差界为O(N^{-1/2}log(N))的估计器。
Comments 9 pages, 1 figure; accepted by IFAC World Congress 2026
通过多项式混沌代理实现序列生成模型中可解释的epistemic不确定性分解
AI总结 本文提出通过多项式混沌展开分析序列生成模型中epistemic不确定性的来源,揭示奖励组件对生成决策的影响,优于深度集合、贝叶斯神经网络等方法,且在多个真实任务中展现高效性和鲁棒性。
Comments 37 pages, 15 figures
通过低秩张量分解估计多变量泊松强度函数
AI总结 本文提出基于矩阵和张量的方法估计非均匀点过程的多变量强度函数,通过函数空间中的无限维矩阵或张量实现最优偏差方差权衡,提高估计精度并降低计算成本。
不确定性量化作为可解释人工智能的原理性基础:反事实解释的案例研究
AI总结 本文通过反事实可解释性中的不确定性量化,展示其作为统一框架的潜力,提出两种解释器变体,并证明其在性能上优于现有方法。
一种考虑子组的评分方法用于观察性研究中的效应修饰研究
AI总结 本文提出一种新的组M统计量方法,通过在每个子组中评分匹配对来解决子组联合分布中因异常值导致的效应修饰混淆问题,通过广泛实验验证其优越性,并应用于西非疟疾预防治疗的效果研究。
图上的Matérn高斯过程
AI总结 本文研究了图上Matérn高斯过程,利用其随机偏微分方程特性,继承了欧几里得和黎曼流形高斯过程的特性,提供标准训练方法,使其适用于小批量和非共轭场景。
HONEM:用于高阶网络的嵌入学习
AI总结 本文提出HONEM方法,针对高阶网络结构,有效捕捉非马尔可夫高阶依赖,提升节点分类、网络重建、链接预测和可视化性能。