Flaws in the LLM Automation Narrative
LLM自动化叙事中的缺陷
发表机构 * New York University(纽约大学)
AI总结 通过编写代码完成数据分析任务的新基准测试,发现前沿LLM在平均性能、方差和错误幅度上均不如人类专家,挑战了LLM达到人类专家水平的说法。
LLM自动化叙事中的缺陷
发表机构 * New York University(纽约大学)
AI总结 通过编写代码完成数据分析任务的新基准测试,发现前沿LLM在平均性能、方差和错误幅度上均不如人类专家,挑战了LLM达到人类专家水平的说法。
任意步SDE的Itô映射
发表机构 * Harvard University(哈佛大学) ; University of Oxford(牛津大学) ; Kempner Institute(凯门研究所)
AI总结 提出Itô映射,一种任意步随机流映射,通过单次前向传播预测未来状态,实现随机动力学的精确蒸馏,并支持推理时控制和后验采样。
DMT: 基于人口统计条件与形态增强Transformer的无袖带血压估计方法
发表机构 * University of California, San Diego(加州大学圣地亚哥分校)
AI总结 提出一种基于Transformer的PPG信号无袖带血压估计网络,通过FiLM风格特征调制融入人口统计信息,并添加辅助形态头引导模型关注与动脉僵硬度相关的波形形态,在PulseDB数据集上实现收缩压MAE 4.56 mmHg、舒张压MAE 2.62 mmHg。
广义共形预测系统在分布偏移下的应用
发表机构 * IDLab Seminar for Statistics(统计研究所研讨会) ; Department of Electronics(电子系) ; ETH Zurich(苏黎世联邦理工学院) ; Information Systems Zurich, Switzerland(苏黎世信息系统,瑞士) ; Ghent University(根特大学)
AI总结 针对分布偏移,通过观测特定置换权重编码偏移,扩展广义共形预测系统,提出偏移感知预测系统,并引入权重不确定性框构建鲁棒共形预测系统包络,提供有限样本或渐近置信保证。
Comments 27 pages, 10 figures
基于CNN和GRU网络的哮喘与COPD鉴别诊断中二维输入表示和子阶段融合策略的优化
发表机构 * Dept. Electrical and Electronics Engineering Istanbul Bilgi University, Turkey(电气与电子工程系伊斯坦布尔比尔吉大学,土耳其) ; Dept. Computer Engineering Istanbul Bilgi University, Turkey(计算机工程系伊斯坦布尔比尔吉大学,土耳其)
AI总结 本研究优化了二维输入表示(MFCC、对数梅尔谱图、VAR模型)和子阶段特征融合策略(直接拼接、GRU、GRU+注意力),使用CNN和GRU网络鉴别哮喘与COPD,最佳F1分数达0.877。
通过校准视角看人机协作
发表机构 * Department of Computer Science, Johns Hopkins University(计算机科学系,约翰霍普金斯大学) ; Department of Statistics, University of Michigan(统计学系,密歇根大学)
AI总结 研究通过统计校准视角分析人机协作模型,发现组合方法不保留人类校准度,而委托方法将校准负担转移给拒绝器元模型,且当人类依赖系统不可观测信息时无法实现。
Comments 19 pages, 5 figures (including appendix)
睡眠脑电信号临界性作为痴呆认知衰退的非侵入性预测指标
发表机构 * Institute of Cybernetics and Human Informatics, Polish Academy of Sciences(波兰科学院信息学与人类科学研究所)
AI总结 研究通过多重分形去趋势波动分析量化睡眠脑电信号临界性,发现认知健康者更接近最优临界状态,痴呆组DFA指数向1.0偏移,表明睡眠中无标度神经动力学重组先于临床症状,可作为早期筛查工具。
Comments 4 pages, 2 figures, accepted for publication in the Proc. 48th Annu. Int. Conf. IEEE EMBS (EMBC 2026), Toronto, Canada, July 20-24, 2026
在无监督术语发现中恢复齐夫分布
发表机构 * Het Jan Marais Fonds(赫特·詹·马里茨基金会)
AI总结 针对无监督术语发现中中心聚类导致分布不均匀的问题,提出图聚类方法,在三种语言上显著优于K-means等,恢复更接近齐夫分布的词汇分布。
修正随机森林产生的变量重要性评分
发表机构 * Computer and Information Science(计算机与信息科学) ; Mathematics and Data Science(数学与数据科学) ; University of Massachusetts, Dartmouth, MA(马萨诸塞大学达特茅斯分校) ; The Rivers School, Weston, MA(韦斯特on学校的河流学校)
AI总结 针对随机森林变量重要性受变量间相关性影响的问题,提出基于条件相关性的分组方法进行修正,实验证明两种计算高效方案均能有效校正变量重要性。
Comments 22 pages, 10 figures
Spatial-Omni:通过FOA编码在多模态大语言模型中实现空间音频理解
发表机构 * Zhejiang University(浙江大学) ; Tencent Hunyuan(腾讯文心)
AI总结 提出Spatial-Omni,通过SO-Encoder将一阶Ambisonics空间音频注入现有全模态大语言模型,以轻量方式实现空间音频理解,并在构建的SO-Bench基准上超越现有模型。
++nnU-Net: 基于前缀数据增强的nnU-Net扩展
发表机构 * Center Algoritmi / LASI, University of Minho, Braga, Portugal(阿尔戈里米中心/拉斯伊大学,明霍大学,布拉加,葡萄牙) ; Institute for Artificial Intelligence in Medicine, University Medicine Essen, Essen, Germany(医学人工智能研究所,埃森医学院,埃森,德国) ; Institute of Medical Informatics / Dept. of Oral and Maxillofacial Surgery, University Hospital RWTH Aachen, Germany(医学信息学研究所/口腔和颅面外科部,亚琛大学医院,德国) ; Faculty of Computer Science, University of Duisburg-Essen, Essen, Germany(计算机科学学院,杜伊斯堡-埃森大学,埃森,德国)
AI总结 提出++nnU-Net,通过图像配准进行数据增强,在预处理和训练前生成变形图像,在5个2D数据集上提升Dice系数最高约22%。
Comments 7 pages, 1 figure, 2 tables
ClusBench:你一直期待的聚类基准测试数据资源(?)
发表机构 * School of Mathematical Sciences, Lancaster University(兰卡斯特大学数学科学学院)
AI总结 本文通过拟合灵活的非参数分布,从200多个公开数据集生成近3000个合成数据集,用于大规模聚类方法评估,保留真实数据细微差别。
从交易到记录:通过生命周期视角重新概念化区块链系统
AI总结 本文引入ISO 15489-1:2016记录管理原则,提出区块链数据的七阶段生命周期模型,应用于比特币、同质化代币和非同质化代币,论证区块链系统不仅是交易基础设施,更是具有独特特征的记录管理系统。
熵感知域路由混合专家语音-大语言模型框架:多领域儿童-成人ASR案例研究
发表机构 * University of California, Los Angeles, USA(加州大学洛杉矶分校)
AI总结 提出一种混合专家语音-大语言模型,通过分类器域路由、混合投影器和混合LoRA模块以及熵感知路由机制,实现跨不同环境和年龄组的统一儿童-成人ASR,在公共儿童语料库上取得一致改进。
Comments Accepted to Interspeech 2026
基于玻尔兹曼间隔的kNN分类近指数收敛速率
发表机构 * School of Computer Science, University of Oklahoma(计算机科学系,俄克拉荷马大学)
AI总结 提出玻尔兹曼间隔条件,介于Tsybakov与Massart间隔之间,首次证明kNN分类器可实现近指数收敛速率。
Comments Conference on Uncertainty in Artificial Intelligence (UAI)
SSL-GMMVC:自监督表示空间中通过局部线性GMM变换的可解释语音转换
发表机构 * The University of Tokyo, Japan(东京大学)
AI总结 提出SSL-GMMVC方法,在自监督语音空间中用高斯混合模型建模源-目标特征,通过后验加权仿射变换实现可解释的语音转换,在保持可理解性和自然度的同时提升说话人相似度。
Comments Accepted to Interspeech2026
重叠小波扩散用于低光照图像增强
AI总结 提出重叠小波扩散框架OWDiff,通过重叠小波变换消除块伪影,并引入低频引导的高频增强模块恢复细节,在LOLv1和LOLv2-real数据集上优于现有方法。
Comments Advance published in IEICE Transactions on Information and Systems. DOI: 10.1587/transinf.2026PCP0006. Code: https://github.com/FinnPeg/Overlapped-Wavelet-Diffusion
双曲神经群体几何结构有益于计算
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出海马体群体活动诱导双曲几何的理论框架,证明现代Hopfield网络更新规则计算最小均方误差估计,并引入双曲空间中的新联想记忆模型,其容量显著优于现有模型。
Comments Accepted at ICML 2026, 37 pages, 5 figures
ANCHOR: 自回归非侵入式分块有序细化用于联合多分辨率语音质量建模
发表机构 * University of Southern California, USA(美国南加州大学) ; Carnegie Mellon University, USA(美国卡内基梅隆大学)
AI总结 提出ANCHOR模型,将增量语音质量评估重构为多分辨率自回归任务,通过双分辨率令牌和分辨率感知层次实现分块到整句的粗到细细化,在部分输入下显著降低误差,并揭示感知质量的时域积累机制。
Comments Accepted at Interspeech 2026
面向流式广告中节奏控制的决策校准共形不确定性
发表机构 * Department of Mathematics, Embry-Riddle Aeronautical University(数学系,埃姆伯里-瑞德航空大学)
AI总结 提出一种决策校准共形框架,通过衡量预测误差对实际部署策略的最大影响来校准不确定性,理论证明该分数是保护所有可部署节奏控制策略的最小有效不确定性度量,并在公开数据集上显著降低不确定性半径。
鲁棒主动学习用于文本到SQL中的少样本示例选择
发表机构 * NVIDIA
AI总结 针对文本到SQL中少样本示例选择,提出一种鲁棒主动学习方法,通过分层贪婪算法最大化异方差互信息目标,在嵌入流形上实现常数因子近似保证,显著减少标注成本。
Comments 31 pages, 4 figures, 5 tables
DeRA-MOS:通过解耦列表排序和模态对齐优化文本到音乐评估
发表机构 * E.SUN Financial Holding Co., Ltd.(E.SUN财务控股公司) ; United Link Co., Ltd.(联合链接有限公司) ; Institute of Information Science, Academia Sinica(学术院信息科学研究所) ; Department of Computer Science and Information Engineering, National Taiwan Normal University(台湾师范大学计算机科学与信息工程系)
AI总结 提出DeRA-MOS解耦优化框架,通过批感知列表排序损失和分数锚定模态对齐损失,分别优化音乐印象和文本对齐的排名指标,在MusicEval上显著提升评估性能。
Comments Accepted to IEEE Signal Processing Letters (SPL)
深度切片插值用于减少头部CT的穿平面各向异性和噪声
发表机构 * Department of Computer Science and Artificial Intelligence, University of Seville(塞维利亚大学计算机科学与人工智能系) ; Bioaraba Health Research Institute(Bioaraba健康研究 institute) ; IKERBASQUE, Basque Foundation of Science(巴斯克科学基金会)
AI总结 提出一种深度学习系统,通过相邻轴向切片对合成中间CT切片,将有效穿平面间距减半,同时实现隐式降噪,在结构指标上优于经典插值和视频帧插值方法。
GAGI:一种用于分布感知宏观经济福利监测的基尼调整人均GDP指数
发表机构 * Independent Researcher(独立研究者)
AI总结 提出GAGI指数,通过基尼系数和价格水平调整人均GDP,以监测福利分配效应,应用于G7国家发现福利增长与GDP增长持续偏离。
高频风矢量时间序列的随机天气生成器
发表机构 * Department of Statistics, Rutgers University(统计学系,罗格斯大学)
AI总结 针对分钟级风矢量时间序列,开发基于时间矢量量化变分自编码器的机器学习模型,生成逼真序列,捕捉昼夜变化但极端风速分布匹配不足。
TractFM:纤维束图基础模型
发表机构 * The State Key Lab of Brain-Machine Intelligence, Zhejiang University, Hangzhou(脑机智能国家重点实验室,浙江大学,杭州) ; Department of Radiology, Brigham and Women’s Hospital, Mass General Brigham, Boston(放射科,布里洛妇女医院,马萨诸塞总医院,波士顿) ; Harvard Medical School, Boston(哈佛医学院,波士顿) ; Academy of Medical Engineering and Translational Medicine, Tianjin University, Tianjin(医学工程与转化医学研究院,天津大学,天津) ; School of Information and Communication Engineering, University of Electronic Science and Technology of China, Chengdu(信息与通信工程学院,电子科技大学,成都) ; Psychiatry Neuroimaging Laboratory, Brigham and Women’s Hospital, Mass General Brigham, Boston(精神病神经影像实验室,布里洛妇女医院,马萨诸塞总医院,波士顿) ; Department of Psychiatry, Center for Morphometric Analysis, Massachusetts General Hospital, Boston(精神病科,形态分析中心,马萨诸塞总医院,波士顿)
AI总结 提出TractFM基础模型,直接从全脑纤维束集学习可复用表示,结合局部纤维编码器和置换等变纤维束编码器,通过密集解剖束分割预训练,实现纤维束级和受试者级任务的迁移。
通过目标分布设计审视监督微调的统一视角
发表机构 * University of California, Los Angeles (UCLA)(加州大学洛杉矶分校) ; Arena
AI总结 本文重新解读监督微调为目标分布设计,提出Q-target框架,将监督分解为对观测token的依赖强度与替代token的概率分配,并基于此提出Target-SFT方法,在多个推理任务中优于现有方法。
ARM: 一种具有统一离散表示的自回归大型多模态模型
发表机构 * Shanghai Key Lab of Intelligent Information Processing, Fudan University(复旦大学上海智能信息处理重点实验室) ; School of Computer Science, Fudan University(复旦大学计算机科学技术学院) ; Shanghai Collaborative Innovation Center of Intelligent Visual Computing(上海智能视觉计算协同创新中心) ; Youtu Lab, Tencent(腾讯优图实验室) ; Meta AI ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 提出ARM模型,通过离散语义视觉分词器将图像映射为紧凑token序列,结合自回归建模和强化学习,统一实现图像理解、生成和编辑,并提升任务性能与跨任务协同。
Comments technical report
Next Forcing: 基于多块预测的因果世界建模
发表机构 * Robbyant ; HUST(华中科技大学) ; HKUST(香港科技大学) ; HKUST (GZ)(香港科技大学(广州))
AI总结 提出Next Forcing框架,通过多块预测训练目标加速视频生成模型收敛、提升精度并实现推理加速,在多个基准上取得最优结果。
Comments Project page: https://gangweix.github.io/next-forcing/
AnyMod-LLVE: 模态无关推理的低光照视频增强
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出AMNet统一多模态框架,通过空间-频谱双门控转换器学习辅助模态与RGB输入的对应关系,支持推理时任意模态组合,解决低光照视频增强中辅助模态缺失问题。
Comments Accepted at ICML 2026; Project page and code: https://lhfgghc.github.io/LLVE-AMNet