Smoothed Rank-Based Regression Estimation Using Wilcoxon Score Functions
基于Wilcoxon得分函数的平滑秩回归估计
AI总结 提出用平滑秩代替整数秩的Wilcoxon秩回归估计,通过核分布函数近似指示函数,在保持稳健性的同时提高重尾误差下的效率并处理结数据,推导了Wald检验并证明渐近正态性。
Comments 17 pages
基于Wilcoxon得分函数的平滑秩回归估计
AI总结 提出用平滑秩代替整数秩的Wilcoxon秩回归估计,通过核分布函数近似指示函数,在保持稳健性的同时提高重尾误差下的效率并处理结数据,推导了Wald检验并证明渐近正态性。
Comments 17 pages
平滑KL重加权:基于信噪比的扩散训练的原则性解释与匹配规则
AI总结 提出平滑KL重加权方法,从扩散散度推导出闭式权重,建立与Min-SNR家族的匹配规则,在CIFAR-10和CelebA-64上验证,最终FID相当但迭代效率因数据集而异。
正弦模型的最小绝对偏差估计
AI总结 提出基于最小绝对偏差的正弦回归模型鲁棒参数估计方法,采用坐标下降算法(加权中位数更新振幅、周期图网格搜索优化频率),证明估计量的强一致性和渐近正态性,在合成数据和真实时间序列中展示对非高斯噪声的鲁棒性。
Comments 34 pages, 5 figures
Volterra--Wiener--Kunchenko正交化:从Wiener--Hermite到分布匹配的Volterra基
AI总结 针对非高斯输入下Volterra辨识的病态问题,通过定向Gram-Schmidt正交化构造分布匹配的VWK基,并证明方差匹配高斯基下的自归一化对角估计器风险受偏度系数控制,实验表明VWK基条件数优于幂基。
Comments 20 pages, 1 figure; companion reproducibility archive with code, frozen results, and Lean 4 files
使用 Jeffrey 引导实现扩散模型的更通用控制
发表机构 * Inria, CNRS, I3S, Maasai Université Côte d’Azur(法国国家信息与自动化研究所、法国国家科学研究中心、信息与系统科学实验室、马赛·蔚蓝海岸大学) ; Technical University of Denmark(丹麦技术大学) ; Inria, CNRS, LJAD, Maasai Université Côte d’Azur(法国国家信息与自动化研究所、法国国家科学研究中心、雅克-路易·利翁实验室、马赛·蔚蓝海岸大学)
AI总结 提出 Jeffrey 引导框架,通过 Jeffrey 条件规则更新边缘分布,扩展扩散模型控制到标准引导无法表达的应用,在 CIFAR-10 和 FFHQ 上显著降低 FID,并在 CelebA-HQ 上实现公平性控制。
Ewens-Pitman模型中最大似然估计的渐近区域:当强度参数重要时
AI总结 研究Ewens-Pitman模型中折扣和强度参数最大似然估计的大样本渐近行为,发现四个不同区域,其中θ可能起关键作用,并通过缩放模型克服无限可交换性限制。
关于依赖下通过熵的近似张量化得到的McDiarmid不等式
AI总结 本文通过熵的近似张量化(ATE)推导依赖数据的McDiarmid不等式,应用于非各向同性高斯向量、强对数凹和对数光滑测度,并解决符号函数集中问题、依赖下Erdős-Rényi图及Dvoretzky-Kiefer-Wolfowitz型不等式,改进收敛速率至$1/\sqrt{n}$。
Comments 27 pages
随机梯度下降分位数估计量的中心极限定理
发表机构 * Department of Statistics, University of Chicago(芝加哥大学统计系) ; Department of Statistics and Data Science, Washington University in St. Louis(圣路易斯华盛顿大学统计与数据科学系)
AI总结 本文针对常学习率SGD分位数估计,利用马尔可夫链理论证明其平稳分布随学习率趋于零时收敛到高斯分布,首次给出CLT型理论保证,并提出置信区间递归算法。
平均显著性水平控制检验的错误发现率调整
AI总结 研究在平均显著性水平控制下,Benjamini-Hochberg过程仍能渐近控制FDR,并证明某些依赖调整在有限样本中有效,为高维非参数设置提供FDR控制方法。
多个未标记高斯网络之间相关性的尖锐检测阈值
AI总结 研究m≥2个带高斯边权的完全加权图在未知顶点重标号后是否互相关的假设检验问题,确定了固定m下的信息论检测阈值,并证明无检测-恢复间隙。
基于贝叶斯机器学习方法的复发事件研究:软贝叶斯加性回归树(SBART)
AI总结 提出软贝叶斯加性回归树(SBART)非参数方法,结合软决策树与贝叶斯集成学习,用于复发事件建模,通过两层数据增强实现高效计算,在模拟和实际数据中优于现有方法。
贝叶斯共形预测的最优时空解耦
AI总结 提出状态自适应贝叶斯共形预测(SA-BCP),通过门控凸组合平衡长期时间惯性与局部空间证据,实现分布漂移下的快速适应与稳定覆盖,并给出MSE最优阈值闭式解及在线选择过程的遗憾界。
GEMSS: 一种用于在分类和回归问题中发现多个稀疏解的变分贝叶斯方法
发表机构 * Faculty of Electrical Engineering, Czech Technical University(捷克技术大学电子工程系)
AI总结 提出GEMSS算法,利用结构化spike-and-slab先验、高斯混合近似后验和Jaccard惩罚,通过变分推断同时发现多个多样化的稀疏特征组合,在128个实验和3个真实数据集上优于对比方法。
基于变分框架的含噪声不完全观测动态系统序贯贝叶斯参数-状态估计
AI总结 提出一种在线变分推断框架,通过分解联合后验为参数边缘分布和条件状态分布,实现动态系统参数与状态的联合估计,并给出误差上界理论保证,数值实验验证了其在混沌和高维系统中的鲁棒性与可扩展性。
Comments 31 pages, 8 figures
关于非参数正态似然
AI总结 提出非参数正态模型的一步估计框架,通过四种新似然函数解决参数联合估计问题,并展示其在变换判别分析中的应用优势。
拟贝叶斯经验贝叶斯:泊松复合决策问题的序贯方法
AI总结 针对流式数据中的泊松复合决策问题,提出基于牛顿算法的拟贝叶斯序贯估计,具有常数计算成本,并证明了其一致性和渐近最优性。
Comments 49 pages
当代表性样本产生更差结果:小预算随机对照试验中的规模决策与测试
AI总结 本文研究小预算随机对照试验中,基于统计显著性检验决定是否扩大干预时,试点样本组成如何影响预期结果,发现小预算下最优设计是仅从单一同质子群体抽样。
整群随机试验中因果中介的半参数贝叶斯推断
AI总结 针对整群随机试验中群组数量少、中介变量在群组层面测量时的因果中介分析难题,提出一种结合参数贝叶斯模型和相似性加权贝叶斯自助法的稳健推断框架,准确估计自然直接和间接效应。
含潜变量图模型中的因果不变性
AI总结 本文研究含潜变量时因果不变性原理的适用条件,刻画了观测变量诱导图的结构,并给出了多变量高斯目标下检验不变性的充要条件。
因果不变性在有限样本设置中对领域适应有多大用处?
发表机构 * Department of Computer Science, ETH Zurich(苏黎世联邦理工学院计算机科学系) ; Causal Artificial Intelligence Lab, Columbia University(哥伦比亚大学因果人工智能实验室) ; Department of Statistics, Columbia University(哥伦比亚大学统计系)
AI总结 研究线性回归中因果不变性如何提升监督领域适应,通过候选预测器的目标风险边界和有限样本估计误差推导匹配上下界,证明当边界足够大时自适应聚合可避免负迁移。
预测驱动的因果推断:自动去偏机器学习与半监督Riesz回归
发表机构 * University of Tokyo(东京大学)
AI总结 研究半监督设置下因果参数的半参数有效估计,通过结合去偏机器学习和半监督Riesz回归,提出DML-PPCI和TMLE-PPCI方法,实现比仅用标注数据更小的渐近方差。
深度双样本检验的反事实解释
发表机构 * Hasso-Plattner-Institute, University of Potsdam(波茨坦大学洪堡-劳恩堡研究所) ; Hasso Plattner Institute for Digital Health at Mount Sinai Icahn School of Medicine at Mount Sinai(辛辛那提医学院洪堡数字健康研究所)
AI总结 针对深度双样本检验,提出基于扩散自编码器和MMD优化的反事实解释框架,生成样本级编辑以揭示驱动假设拒绝的特征。
Comments 17 pages
因果中介的敏感性分析:桥分数、精确敏感性界限和校准
AI总结 本文提出桥分数作为中介阶段的平衡分数,并通过两个可解释的潜在混淆参数推导出精确的点wise界限,同时介绍了两种校准方法以实现敏感性分析。
Comments 33 pages
连续型处理变量的多元增量效应:研究环境混合物的健康影响
AI总结 针对连续型多元暴露(如空气污染混合物)违背正性假设的问题,提出基于指数倾斜的因果推断框架,定义公平比较不同干预方向的因果估计量,并开发高效一步估计、黎曼BFGS算法等理论方法,应用于全国环境健康数据以优化PM2.5化学混合物干预策略。
基于生成式人工智能的因果推断:以文本作为处理变量
发表机构 * Harvard University(哈佛大学) ; John F. Kennedy School of Government(约翰·F·肯尼迪政府学院)
AI总结 提出利用生成式AI(如大语言模型)生成处理变量并利用其内部表示进行因果效应估计,避免从数据中学习因果表示,提高估计准确性和效率。
调查实验的精细分层
AI总结 本文提出两阶段实验模型,通过匹配k元组随机化实现精细分层,开发快速匹配算法,证明可减少处理效应估计方差,并提供充分利用设计效率的推断方法。
数据驱动的扩散参数估计子采样率选择
AI总结 提出基于单调游程统计的自动子采样率选择方法,确保子采样数据与SDE模型在无穷小尺度上一致,无需多尺度扩散渐近框架。
Comments 30 pages, 11 figures
通过大规模特征提取进行时间序列数据参数变化的可解释无模型推断
AI总结 提出一种无监督数据驱动方法,利用超过7000个时间序列特征库,从时间序列数据中推断未知生成过程的参数变化维度和性质,无需指定或拟合模型。
使用噪声对比估计方法校准简化藤蔓连接函数
AI总结 针对简化藤蔓连接函数在条件依赖变化显著时可能误设的问题,提出基于观测特定校正因子的校准策略,利用噪声对比估计(NCE)进行局部调整,提高模型准确性。
Comments Preprint
带中间变量的差异建模:鲁棒高斯过程校准的新框架
AI总结 提出利用中间变量进行差异建模的鲁棒高斯过程校准框架,通过结构化变量选择、离散化缩放高斯过程约束和空间填充设计,联合建模仿真器与差异,提升预测性能并缓解可辨识性问题。
将Prais-Winsten回归扩展到具有高阶自回归误差的面板数据:一项模拟研究
AI总结 将Prais-Winsten AR(k) GLS变换扩展到面板数据,在Stata包xtpraisk中实现,并通过蒙特卡洛模拟验证其统计性质,发现xtpraisk在保持名义第一类错误率的同时比xtscc具有更高功效,且对自回归阶数误设稳健。
切换哈密顿蒙特卡洛方法用于混合分布采样
AI总结 提出切换哈密顿蒙特卡洛方法,结合对称数值积分器和泊松跳跃,实现有限混合玻尔兹曼-吉布斯分布的采样,并证明几何遍历性和二阶偏差。
对数凹采样的统一复杂度界
发表机构 * University of Texas at Austin(得克萨斯大学奥斯汀分校)
AI总结 本文通过In-and-Out算法与指数提升,给出了从热启动采样任意对数凹分布的简单、统一且近乎紧的界,主要创新是提升了提升分布的Poincaré常数界。
Comments 5 pages
二次降阶——高斯过程常微分方程框架用于大规模连续动力系统的推断
AI总结 提出结合高斯过程与二次降阶的框架,实现复杂动力系统的高精度、稳定预测与不确定性量化。
Comments 49 pages, 11 figures
REMAL: 基于残差平衡流形主动学习的替代模型多学科设计分析
AI总结 提出REMAL框架,通过多任务高斯过程学习联合残差流形替代模型,结合熵主动学习在零等高线附近采样,求解非线性最小二乘恢复平衡状态,显著降低耦合系统多设计点分析成本。
Comments 30 pages, 16 figures
黎曼流形上吉布斯测度的快速混合
AI总结 分析黎曼流形上的Langevin动力学,识别确保对数Sobolev不等式(快速混合到吉布斯测度)的条件,涉及曲率、逆温度、鞍点逃逸方向,并排除贫瘠高原和虚假局部极小值,实现维度多项式混合时间。
Comments 88 + 80 pages, 1 figure
熵镜像蒙特卡洛
AI总结 提出一种自适应重要性采样方法,通过结合全局采样与延迟加权机制构建高效提议分布,实现多模态高维目标分布的有效探索,并证明算法在温和假设下几何收敛。
通过序贯蒙特卡洛实现高效随机优化
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对梯度难以计算的优化问题,提出用序贯蒙特卡洛(SMC)采样器替代昂贵的内采样循环,实现高效随机优化,并在能量模型奖励调优中验证有效性。
Comments Accepted to ICML 2026
从几何到动力学:基于几何约束从稀疏观测学习过阻尼朗之万动力学
发表机构 * Dimitra Maoutsa(迪米特拉·马乌茨)
AI总结 提出一种随机控制框架,利用系统不变密度的几何结构进行路径增强,从稀疏时间采样数据中恢复过阻尼朗之万动力学,无需参数模型假设。
Comments 10+54 pages, 14 figures; accepted at ICML 2026 An earlier account of this work has previously appeared in arXiv:2301.08102 and arXiv:2304.00423 ; main methodology remains the same, this version includes additional numerical experiments and theory
即插即用图像恢复:随机去噪正则化
发表机构 * GitHub
AI总结 提出SNORE框架,仅在适当噪声水平图像上应用去噪器,结合随机正则化与梯度下降求解逆问题,在去模糊和修复任务上达到SOTA。
高维probit回归的数据增强Gibbs采样器的混合时间
AI总结 针对贝叶斯probit回归的数据增强Gibbs采样器,基于对数凹目标分布的Gibbs采样器最新结果,给出了混合时间的显式非渐近界,并分析了不同统计场景下的行为。
ProtoX-AD:自解释的时间序列异常检测与特征描述
AI总结 提出ProtoX-AD框架,通过原型学习实现自监督时间序列异常检测的可解释性,在保持检测性能的同时提供语义一致的异常特征解释。
Comments 26 pages, 8 figures
鲁棒的状态条件特征加权跳跃模型用于时间聚类
AI总结 提出一种鲁棒的特征加权跳跃模型,通过Tukey双权损失函数实现鲁棒性,并引入状态特定特征权重,在模拟和实证中优于竞争方法。
无高斯假设的可识别性:符号世界模型与近无限时间一致性
AI总结 本文提出物理基础符号架构(PGSA),证明其在非高斯动态系统中实现精确线性可识别性和近无限时间一致性,克服了统计世界模型的高斯边界限制。
Comments Pre-print
与模拟器学习:计算受限世界中的无悔学习
发表机构 * MIT(麻省理工学院) ; Microsoft Research(微软研究院)
AI总结 提出可模拟过程框架,利用模拟器近似任意复杂依赖的数据分布,恢复VC维误差界,并展示条件采样的统计与计算优势。
Comments To appear at COLT 2026
通过块验证加速推测性扩散
发表机构 * KTH(皇家理工学院) ; Google Research(谷歌研究) ; Google DeepMind(谷歌深Mind)
AI总结 提出一种针对扩散模型的推测性采样方案,通过块验证提高草稿接受率,无需训练的Free Drafter实现高达6.3%的加速。
物理系统概率仿真的可靠性
发表机构 * The Alan Turing Institute(艾伦·图灵研究所) ; Autodesk Research(欧特克研究院) ; PhysicsX ; Orbital ; University of Sheffield(谢菲尔德大学) ; University College London(伦敦大学学院)
AI总结 比较生成模型与CRPS训练集成在物理系统概率仿真中的可靠性,发现CRPS集成在覆盖率和推理速度上更优。
基于物理信息的神经网络用于化疗药代动力学:基准测试临床估计器并揭示参数可辨识性
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本研究将物理信息神经网络(PINN)应用于化疗药代动力学,在双室线性模型上匹配临床标准方法,在Michaelis-Menten扩展模型中揭示参数不可辨识性,并通过稀疏组织观测部分恢复可辨识性。
三中多数是最优的
发表机构 * Department of Statistics, University of California, Berkeley(加州大学伯克利分校统计学系)
AI总结 本文通过简短证明,在可实现PAC学习框架下,三个独立一致分类器的多数投票是最优学习器,简化了投票学习器的算法结构和概率分析。
Comments 9 pages
扩散-网络对齐:一种高效算法与显式概率界
AI总结 提出扩散-网络对齐问题,基于树相关性测试设计高效算法,在稀疏图下证明高概率正确匹配,并给出顶点正确匹配的显式下界。
两层线性自回归模型估计潜在状态
AI总结 本文证明两层线性自回归模型通过经验风险最小化训练时,能近似卡尔曼滤波,恢复潜在状态估计,并提供有限样本保证。
Comments ICML 2026
认知不确定性并非可约简的那种
发表机构 * University of Cambridge(剑桥大学)
AI总结 证明标准定义中认知不确定性为可被更多数据移除的部分,与互信息度量在扩展上不一致,并提出三部分分解:偶然、样本可约简认知和机制可约简认知不确定性。
对称-电子指纹揭示二维材料中的竞争磁性相
AI总结 提出对称-电子指纹(SEF)表示,结合晶体对称性与电子结构,通过随机森林集成学习准确分类磁有序、回归磁矩和各向异性,并识别Stoner铁磁性与局域超交换的竞争区域,模型不确定性可诊断近简并铁磁/反铁磁相。
有限精度下学习Tanh神经网络的局限性
AI总结 基于有限精度计算和L^p精度保证,通过构造尖锐局部化bump函数,证明自适应随机算法在L^p范数下收敛速度不超过蒙特卡洛率O(m^{-1/p}),除非采样预算随网络参数和架构指数增长。
高维受控非线性动力系统学习理论 (I): 模型与方法
AI总结 本文提出一类理论模型,通过动态平均场理论求解神经ODE在在线随机梯度下降下的训练动力学,并推导高维极限下的学习曲线。
Comments 28 pages, 2 figures
一种双参数Weibull框架用于变压器权重分布诊断
发表机构 * Independent Researcher(独立研究者)
AI总结 本文提出了一种基于Weibull分布的双参数框架,用于分析Transformer中元素权重幅度分布,通过实验发现不同模块的k值分布特征,并揭示了训练过程中lambda参数的变化规律。
Comments 27 pages, 14 figures. Companion library npm-weibull-py and benchmark database available at https://github.com/tiexinding/NPM-Weibull-public
通过傅里叶变换和Volterra级数重新审视神经过程
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文利用Volterra展开和集合傅里叶卷积,提出了两种新的条件神经过程模型,解决了现有平移等变神经过程在可解释性和计算效率上的局限性。
条件均值障碍:从确定性回归到条件分布学习
AI总结 本文提出条件均值障碍概念,通过残差-特征正交性和决定系数两个诊断指标识别该障碍,并证明添加潜在随机性会迫使平方损失预测器回到条件均值,从而需要分布评分损失来跨越障碍。
黎曼流形上的镜像下降
发表机构 * School of Mathematical Sciences, Fudan University, Shanghai 200433, China(复旦大学数学学院,上海200433,中国) ; Shanghai Key Laboratory for Contemporary Applied Mathematics, Fudan University, Shanghai 200433, China(上海当代应用数学重点实验室,复旦大学,上海200433,中国)
AI总结 将镜像下降推广到黎曼流形,通过重参数化提出黎曼镜像下降(RMD)及其随机变体,并建立非渐近收敛保证,在Stiefel流形上退化为曲线梯度下降(CGD)。
统一潜在空间解缠的VAE框架及鲁棒的解缠效果评估
发表机构 * Department of Applied and Computational Mathematics and Statistics(应用与计算数学与统计系) ; Lucy Family Institute for Data & Society(数据与社会学院)
AI总结 提出统一框架bfVAE整合多种解缠VAE方法,并开发FVH-LT和DBSR-LS评估解缠效果,引入LSSI指标量化潜在结构分离,无需真实生成因子。
论 $\textit{RemOve-And-Retrain}$ 的陷阱:数据处理不等式视角
发表机构 * KAIST(韩国科学技术院)
AI总结 从信息论角度揭示ROAR基准的缺陷:数据无关的后处理可提升ROAR分数,导致对归因图信息量的误判,并发现模糊性偏差。
Comments Accepted at the 2026 ICML Workshop on Mechanistic Interpretability
自适应生成矩匹配网络用于改进依赖结构学习
发表机构 * Department of Statistics and Actuarial Science, The University of Hong Kong(香港大学统计与精算科学系)
AI总结 提出自适应带宽选择的最大均值差异混合核用于生成矩匹配网络,通过增加核数量和早停策略提升训练性能,在copula随机数生成、高维收敛率及金融数据依赖建模中优于传统方法。
傅里叶多分量与多层神经网络:解锁高频潜力
发表机构 * Department of Applied Mathematics(应用数学系) ; Hong Kong Polytechnic University(香港理工大学) ; Department of Mathematics(数学系) ; Duke University(杜克大学) ; Department of Mathematics and Statistics(数学与统计学系) ; Auburn University(阿伯茨伦大学) ; School of Mathematics(数学学院) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出傅里叶多分量与多层神经网络(FMMNN),结合正弦型激活函数与多分量多层结构,通过低秩架构实现指数级函数逼近能力,优化景观优于标准全连接网络,并设计缩放随机初始化方法加速训练,在高频函数逼近任务中取得高精度与良好收敛性。
Comments Our code and implementation details are available at https://github.com/ShijunZhangMath/FMMNN
受限多变量空间建模
AI总结 针对多变量条件自回归模型信息量过强的问题,提出一种通过重参数化控制信息量的受限MCAR模型,并在心脏病死亡数据中展示其优势。
Comments 30 pages
从不规则且带有误差的动物追踪数据推断资源选择和利用分布
AI总结 提出基于拉普拉斯近似的单阶段框架,通过TMB实现,同时处理测量误差和不规则采样,在模拟和独角鲸数据中优于两步法。
Comments 26 pages
解码昆虫之歌:一种多任务半监督直翅目生物声学分类器
发表机构 * University of Oxford(牛津大学)
AI总结 提出PULSE半监督多任务框架,结合弱监督分类、自监督学习和知识蒸馏,在直翅目生物声学分类中优于通用模型,并通过主动学习进一步提升性能。
Comments ICML 2026 Workshop on Machine Learning for Audio
将人口调整间接比较重新定义为可迁移性问题:基于估计量的视角及其对卫生技术评估的影响
AI总结 本文从估计量角度形式化人口调整间接比较中的可迁移性,区分条件与边际处理效应,并揭示效应修饰、可压缩性与效应尺度如何影响迁移,为卫生技术评估中间接证据的使用提供指导。
Comments 26 pages (excluding supplement and references), 7 figures, 1 table
时间-事件临床试验中期分析中未来事件计数的预测区间
AI总结 针对时间-事件临床试验中期分析,提出基于条件参数自助法的患者级框架,构建未来事件计数的预测区间,并通过模拟和实际案例验证其有效性。
Comments 36 pages, 19 figures
具有协变量相关相关性的联合计数变换模型
AI总结 提出联合计数变换模型,结合无分布边际计数变换与协变量依赖的高斯Copula,通过联合最大似然估计高效建模多物种丰度及其相关性,在鸟类案例中捕获季节变化模式。
平面上的Cox回归
AI总结 提出两种基于Lehmann型表示的Cox比例风险模型扩展,用于双变量生存数据,通过伪观测方法估计回归参数,并证明估计量的一致性和渐近正态性。
Comments 89 pages, including appendices, figures, and tables
序数结局随机对照试验中协变量调整的胜率统计量
AI总结 针对序数结局,提出基于倾向性评分加权和增广加权的胜率估计方法,实现协变量调整以提高效率,并证明模型稳健性。
随机流行病建模的神经后验估计
AI总结 提出使用神经后验估计(NPE)校准随机传染病模型,通过模拟训练神经网络近似后验分布,在样本效率上优于近似贝叶斯计算(ABC),并应用于医疗相关感染数据。
Comments 36 pages, 22 figures, preprint. To be published in the Annals of Applied Statistics
通过动态电价扩展需求侧灵活性
AI总结 本文论证动态电价激励的隐性需求侧灵活性是应对配电网挑战的最可扩展且经济有效的方法,可节省每座受限变电站1300-4800万丹麦克朗。
基于重要性采样和控制变量的认知不确定性下A基准和B基准值的高效估计
AI总结 针对航空航天认证中的保守分位数估计问题,提出一种利用重要性采样和控制变量在混合不确定性下高效估计A基准和B基准的方法,确保无偏一致估计并量化认知不确定性来源。
复合材料界面的随机建模:对空间相关性的敏感性及基于标准断裂试验的贝叶斯识别
AI总结 提出随机有限元框架,通过空间相关随机场表征界面变异性,从标准断裂试验中利用近似贝叶斯计算提取关键参数,提升航空复合材料可靠性评估。
2024年美国总统选举中样本匹配民调的持续无应答偏差
AI总结 针对2024年美国总统选举民调偏差,利用数据缺陷相关性框架分析6万受访者数据,发现特朗普选民的无应答偏差持续存在,并提出基于历史数据缺陷相关性和投票率的预选举偏差校正估计器。
Comments Submitted to Journal of Survey Statistics and Methodology
可扩展的贝叶斯双机器学习框架及其在种族不成比例评估中的应用
AI总结 提出一种结合贝叶斯经验似然与双机器学习的半参数部分线性结构回归方法,用于控制高维混杂并纳入先验假设,应用于伦敦拦截搜查数据发现种族不成比例受行政区种族构成影响。
地理空间环境中的披露风险
AI总结 针对主题地图发布统计信息时披露风险与效用的平衡问题,提出一种不受可修改面积单元问题影响的新风险度量,该度量与目标人口局部密度相关并考虑多单元连接,通过企业位置示例数据集展示其行为。
诊断引导的方差膨胀Fay-Herriot估计:基于非概率样本
AI总结 针对非概率样本的小域估计,提出诊断引导的方差膨胀Fay-Herriot估计,通过域诊断指标调整方差膨胀,在弱覆盖域中加强平滑,显著降低估计误差。
Comments 17 pages, 2 figures
通过任务可交换性实现基于合成数据的有效推断
AI总结 提出任务可交换性条件,确保在科学研究中使用合成数据进行统计推断的有效性,并给出在民意调查和AI评估中的应用。
计算可处理的鲁棒差分隐私均值估计
AI总结 提出一种名为“气球均值”的新差分隐私均值估计器,通过扩展马氏距离球上的迭代裁剪实现计算可处理性、鲁棒性及零集中差分隐私,理论保证在重尾和污染椭圆模型下的统计性能与鲁棒性。
Comments 40 pages, 17 figures
批量校准的置信模糊集:样本外污染下的快速、可处理决策
发表机构 * University of Bristol(布里斯托大学) ; University of Cambridge(剑桥大学) ; University of California, Berkeley(加州大学伯克利分校) ; University of Oxford(牛津大学)
AI总结 提出批量校准置信模糊集,通过分离批量内污染和尾部贡献,得到闭式有限风险目标,转化为线性或二阶锥规划,实现高效鲁棒优化。
Comments Accepted for publication (spotlight) at ICML 2026
不可靠数据下的公平性审计有多可靠?
发表机构 * Purdue University(普渡大学)
AI总结 研究受保护标签缺失对公平性缓解审计的影响,提出种子校准压力测试区分缺失效应与随机波动,发现正可用性缺失通常不改变缓解方法效果,但无标签端点表现不同,且阈值优化可能将单轴公平性增益转化为交叉危害。
HNPclassifier:用于分层Neyman-Pearson分类的R包
AI总结 提出HNPclassifier R包,实现分层Neyman-Pearson框架,通过内置或用户提供的评分函数控制有序多类分类中的欠分类错误。
利用候选采样点遥感数据量化小行星(101955)贝努的表面异质性
AI总结 通过OSIRIS-REx任务获取的可见光-近红外和热红外光谱,量化贝努表面在2-10米尺度上的矿物组成和物理性质异质性,发现不同采样点间水合指标和硅酸盐波段存在显著差异。
Comments Currently under review at JGR: Planets
AI赋能分析中的人类监督分配
发表机构 * Michael G. Foster School of Business, University of Washington(华盛顿大学迈克尔·G·福斯特商学院) ; Department of Management Science, School of Management, Fudan University(复旦大学管理学院管理科学系) ; Guanghua School of Management, Peking University(北京大学光华管理学院)
AI总结 针对AI预测可靠性异质且未知的问题,提出基于上置信界的在线学习策略,动态分配有限的人类验证预算,使终端效率损失随预算增长趋于零。
对比几何学习实现统一的结构与配体药物设计
发表机构 * DeepMind Ltd(DeepMind有限公司)
AI总结 提出对比几何模型ConGLUDe,统一结构与配体训练,实现虚拟筛选、靶标钓鱼和配体条件口袋预测,在多项基准测试中表现优异。
Comments Forty-Third International Conference on Machine Learning
R、Python、Julia 和 C++ 中 SLOPE 的高效求解器
AI总结 提出一套在 R、Python、Julia 和 C++ 中高效求解 Sorted L-One Penalized Estimation (SLOPE) 问题的软件包,采用混合坐标下降算法,支持多种损失函数和数据结构,性能优于现有实现。
Comments 30 pages, 8 figures
数据融合用于高分辨率估计
AI总结 提出一种融合无偏低分辨率数据与有偏高分辨率数据的方法,通过KL散度学习与行政数据一致的分布,显著降低高分辨率估计的偏差。
伯努利缺失生成
AI总结 提出一种基于伯努利分布和copula的随机缺失生成方法,通过指定缺失指示变量的分布而非手动模式,灵活生成多种缺失模式,包括结构化缺失。
基于共形预测从稀疏人类反馈中学习机器人安全
发表机构 * Department of Aeronautics and Astronautics, Stanford University(航空航天工程系,斯坦福大学)
AI总结 通过人类对策略轨迹的二元反馈,利用共形预测识别包含未来策略错误的状态区域,构建具有保证漏检率的预警系统,并用于改进模型预测控制器的安全性。
基于Transformer的语言模型中下一个词预测的泛化界
AI总结 针对文本数据特性,提出基于对数双线性语言模型扩展的数据分布,推导深度Transformer架构的泛化界,揭示其对网络结构、词汇量、文档数和文档长度的依赖。
有界Kullback-Leibler散度下变分近似的一致性
AI总结 研究变分近似在贝叶斯推断中继承后验一致性的条件,证明在一般度量空间上,若近似测度与目标测度序列的KL散度一致有界且目标后验弱收敛到真参数处的狄拉克测度,则变分序列也一致。
度量空间值过程的刻画:度量统计推断中的分离类与弱不变原理
AI总结 研究缺乏拓扑向量空间结构的度量空间值随机过程,利用球性质建立分离类,提出基于测度的推断方法,并推导弱不变原理与L^p替代方法。
高维重尾数据Schott统计量的相变
AI总结 研究Schott统计量在α正则变化高维数据下的渐近分布,发现轻尾(α>3)和重尾(α<3)情形存在相变,提出适用于未知位置参数和所有α>0的标准化检验统计量。
Comments 42 pages
基于性能的地震工程通用框架:结构可靠性与韧性的综合评估
AI总结 提出一个通用PBEE框架,通过连续时间马尔可夫链将损伤和恢复嵌入系统动力学,统一描述结构可靠性和韧性,并利用生成矩阵的谱特性高效计算指标。
固定阈值一位Toeplitz协方差估计在稀疏尺采样下
AI总结 研究固定阈值一位量化结合确定性稀疏尺采样时的Toeplitz协方差估计,提出中心化稀疏尺Toeplitz估计器并证明维度无关的高斯方差收缩定理,在平衡覆盖几何下达到极小化最优率。
Comments v2: substantially revised; 21 pages main text + appendix, 59 pages total
整合潜在变量与网络:探索和扩展心理测量工具箱
AI总结 本文回顾并综合了网络心理测量与经典心理测量方法的联系,提出通过跨学科统计方法扩展心理测量工具箱,促进跨领域合作,提升方法论系统的性和目标性。
均值置信区间的渐近最优性理论
AI总结 研究在i.i.d.样本下构造均值置信区间的问题,基于样本量与置信水平的渐近关系划分三种学习机制,并证明基于KL散度的置信区间在指数族和有界支撑分布族中达到渐近最优宽度。
通过扩展似然法的认知置信陈述
AI总结 本文通过扩展似然法形式化Fisher的认知置信,澄清了信仰概率的争议,并建立了观测数据认知置信与未来数据频率覆盖概率的直接联系,进而将认知置信陈述扩展到多维参数,并应用高阶渐近理论改进一阶渐近结果。
面向空间非齐次二元分类的层次化Besov-Laplace先验
AI总结 针对空间非齐次二元分类问题,提出基于Besov-Laplace先验的层次贝叶斯方法,通过精细调节正则化超先验实现后验分布最优收敛率,并设计高效MCMC算法。
Comments 28 pages, supplement included, 4 figures, 4 tables. To Appear in Advances in Data Analysis and Classification
无偏混合变量距离
AI总结 本文提出无偏混合变量距离,解决不同变量类型和量纲对距离计算的偏倚问题,提供通用公式以构建无偏距离。
Comments 40 pages, 9 figures
full-FORCE:一种基于目标的训练循环网络方法
发表机构 * Department of Neuroscience(神经科学系) ; Zuckerman Institute(Zuckerman研究所) ; Columbia University(哥伦比亚大学) ; Department of Physiology and Cellular Biophysics(生理学与细胞生物物理学系) ; Columbia University College of Physicians and Surgeons(哥伦比亚大学医学与外科学院) ; Princeton Neuroscience Institute(普林斯顿神经科学研究所) ; Lewis-Sigler Institute for Integrative Genomics(整合基因组学研究所)
AI总结 本文提出一种基于目标的循环网络训练方法,通过引入第二网络提供目标动态,实现更高效的任务处理,具有更少的神经元和更高的噪声鲁棒性。
Comments 20 pages, 8 figures