RecourseBench: A Modular Framework for Reproducible Algorithmic Recourse Evaluation
RecourseBench: 一个用于可复现算法追责评估的模块化框架
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 提出RecourseBench框架,通过模块化、可复现性和交互性三大承诺,实现追责方法的统一评估,并集成28种方法,首次通过自动化定量测试强制方法级可复现性。
RecourseBench: 一个用于可复现算法追责评估的模块化框架
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 提出RecourseBench框架,通过模块化、可复现性和交互性三大承诺,实现追责方法的统一评估,并集成28种方法,首次通过自动化定量测试强制方法级可复现性。
缩放自适应深度:范数无关残差网络
发表机构 * Zyphra San Francisco, CA(Zyphra旧金山加州)
AI总结 针对残差网络中残差流范数随深度增长导致深层更新被抑制的问题,提出范数无关残差架构NAG,通过分离幅度和方向信息保持各层贡献,并实现可解释的自适应深度跳过机制,在等计算量下匹配全深度性能。
面向帕累托最优工具集成智能体的帕累托排名策略优化
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出ParetoPO框架,通过超体积引导动态标量化和帕累托排名优势计算,在多目标下优化工具使用语言模型的准确性与效率权衡。
Comments ICML 2026 Spotlight Paper
审计机器遗忘:关于模型是否真正遗忘的系统性研究
发表机构 * University of Technology Sydney(悉尼科技大学) ; Deakin University(迪肯大学) ; Macquarie University(麦考瑞大学)
AI总结 针对隐私法规需求,提出首个实用通用审计框架,通过无知证明概念验证现有遗忘算法能否真正擦除指定数据影响,实验表明重训练和微调方法有效,去优化和Fisher/Hessian方法失败。
SceneCraft: 基于场景图的交互式图像编辑系统
发表机构 * University of Science, Ho Chi Minh, Vietnam(胡志明市理科大学) ; Vietnam National University, Ho Chi Minh, Vietnam(越南国家大学胡志明市) ; University of Dayton, Dayton, Ohio, USA(代顿大学)
AI总结 提出SceneCraft框架,通过场景图表示图像,用户直接操作图结构进行复杂编辑,自动生成精确提示,降低语言歧义,提升编辑质量和用户控制。
基于可学习混合的GSS-Transformer混合架构的长上下文建模
发表机构 * Kadıköy Anadolu High School(卡德柯伊安纳多卢高中) ; Politecnico di Torino(都灵理工大学) ; Istanbul Technical University(伊斯坦布尔理工大学) ; Boğaziçi University(博阿齐奇大学) ; IBM Research - Tokyo(IBM 东京研究院)
AI总结 提出并行混合架构PHA,通过可学习混合机制融合GSS、GQA和FFN,在长上下文建模中实现Transformer级困惑度与更高效率。
Comments 16 pages, 9 tables, 4 figures
VinQA:面向真实世界多模态文档问答的交错视觉元素长文本答案生成
发表机构 * LG AI Research(LG AI研究院)
AI总结 提出VinQA数据集和两种编码方法(页面编码与模态编码),用于生成交错引用视觉元素的长文本答案;通过M-GroSE评估框架和微调Qwen2.5-VL模型,显著缩小与专有模型的性能差距。
Comments Accepted to CVPR 2026. Main paper: 5 figures, 4 tables; includes supplementary material
深海的韵律:抹香鲸叫声中双重模式的计算语言学检验
发表机构 * Independent Researchers(独立研究员)
AI总结 使用1483个抹香鲸叫声,通过计算语言学方法检验其是否具有双重模式结构,发现下层由点击节奏构成,上层显示序列依赖,下层为节奏型而非分段型。
Comments 22 pages, 2 figures, 4 tables. Preprint
Tool-IQA: 利用简单工具增强图像质量评估
发表机构 * National University of Singapore(新加坡国立大学) ; OPPO Research Institute(OPPO研究院) ; Nanyang Technical University(南洋理工大学) ; Duke University(杜克大学) ; City University of Hong Kong(香港城市大学) ; The Hong Kong Polytechnic University(香港理工大学)
AI总结 提出Tool-IQA,通过为视觉语言模型配备放大镜和伽马校正器等简单工具,将被动评分转变为工具增强的工作流程,显著提升图像质量评估性能。
机器人服装自动化部署案例研究:数字孪生集成、互操作性与劳动力赋能
发表机构 * Siemens Corporation(西门子股份公司) ; Sewbo ; Levi's(李维斯) ; Bluewater Defense
AI总结 针对织物柔性导致的机器人操作难题,本文通过牛仔布制造案例,提出集成数字线程、数字孪生、互操作层及运行时监控的机器人缝纫系统,实现快速部署与鲁棒性提升。
Comments 4 pages, 3 figures, IEEE ICRA 2026 Workshop Paper
Phys-JEPA:面向多变量时间序列预测的物理信息潜在世界模型
发表机构 * Tianjin University(天津大学)
AI总结 提出Phys-JEPA架构,将物理一致性约束引入潜在状态和状态转移,分解预测状态为物理和残差分量,在气候、交通、电力数据集上提升预测精度。
Comments Submitted to arXiv as a preliminary manuscript. 10 figures
AME:生成式AI市场中的多类型贡献者归属框架
发表机构 * University of Shanghai for Science and Technology(上海理工大学) ; Fudan University(复旦大学)
AI总结 针对生成式AI中多阶段协作的价值分配问题,提出AME框架,整合异构数据贡献评估、数据权利映射和可信执行,实现与人类判断一致的低成本价值分配。
PVminerLLM2:通过偏好优化改进患者声音的结构化提取
发表机构 * Yale School of Medicine(耶鲁大学医学院) ; Yale School of Public Health(耶鲁大学公共卫生学院) ; Texas State University(德克萨斯州立大学)
AI总结 提出PVminerLLM2,通过偏好优化和令牌级门控稳定项、混淆感知偏好对构建等技术,解决监督微调难以处理的细粒度错误,在患者声音结构化提取任务上优于基线模型。
停止采样器!基于分类器的采样核自适应停止
发表机构 * Stanford University(斯坦福大学)
AI总结 提出将MCMC轨迹终止作为可学习组件,利用非循环生成流网络训练状态依赖分类器,在保证详细平衡条件下自适应停止采样,显著缩短轨迹长度并改善模式覆盖与混合。
Comments ICML 2026 SPIGM Workshop
逐步令牌选择用于高效多模态大语言模型
发表机构 * Shenzhen University of Advanced Technology(深圳先进技术大学)
AI总结 提出一种基于指针机制的逐步视觉令牌选择方法,通过可微松弛实现端到端训练,动态决定保留令牌数量,在去除88.9%令牌时保持94.6%准确率并加速1.88倍。
审计代码强化学习训练环境中的奖励可破解性
发表机构 * GitHub
AI总结 测量代码RL环境接受错误解决方案的比率,发现SWE-bench Verified中28.5%的任务测试套件薄弱,并提出通过LLM判断器和Docker金标准门控来加固漏洞任务的方法。
Mojo:可扩展金融AI效率的有前景工具
发表机构 * Data Science and Artificial Intelligence Innovation Laboratory, School of Engineering and Computer Science, Baylor University(贝勒大学工程与计算机科学学院数据科学与人工智能创新实验室)
AI总结 本文介绍Mojo语言,通过MLIR编译和确定性内核设计,解决量化金融中Python到C++的性能差距与数值不一致问题,在金融AI工作负载上实现20-180倍加速。
Comments 15, 3 figures
超越抽血:用于非侵入性血糖异常风险筛查的可解释机器学习
发表机构 * Department of Computer Science, Aarhus University(奥胡斯大学计算机科学系) ; University at Buffalo, SUNY(纽约州立大学布法罗分校)
AI总结 利用NHANES数据训练LightGBM等六种机器学习模型,实现无需实验室检测的血糖异常风险筛查,AUC达0.820,优于传统风险评分,并识别出年龄、种族和腰高比等关键预测因素。
ALCL:一种用于非高斯噪声下鲁棒学习的自适应对数相关熵损失
发表机构 * University of South Florida(南佛罗里达大学) ; California Polytechnic State University(加州州立理工大学)
AI总结 提出自适应对数相关熵损失(ALCL),通过可微重参数化联合学习形状和尺度参数,使损失几何动态适应残差统计,抑制极端异常值,在混合重尾和脉冲噪声下优于MSE和固定核相关熵损失。
PointDiffusion: 点云领域的基于扩散的场景补全
发表机构 * Intelligent Space Robotics Laboratory, Skolkovo Institute of Science and Technology(斯科尔科沃科学技术学院智能空间机器人实验室)
AI总结 提出多令牌高斯VAE和锚点ICP地面真值精化,实现单步扩散场景补全,在SemanticKITTI上平方倒角距离降低16倍,推理延迟降低25-143倍。
从论证组件到图:一种具有置信门控的多智能体辩论方法用于论证关系识别
发表机构 * Faculty of Electronics and Information Technology, Warsaw University of Technology(华沙理工大学电子与信息技术学院)
AI总结 提出一种多智能体辩论框架,通过置信门控机制仅在不确定时进行辩论,在UKP语料上达到训练无关方法最高Macro F1,并生成可读辩论记录。
Comments Accepted for publication in the proceedings of KES 2026
基于低秩结构的数据选择主动学习
发表机构 * Google Research(谷歌研究院) ; University of California, Berkeley(加州大学伯克利分校) ; Institute of Science and Technology Austria (ISTA)(奥地利科学技术研究所) ; Carnegie Mellon University(卡内基梅隆大学) ; Texas A&M University(德克萨斯农工大学)
AI总结 提出基于低秩近似和残差采样的数据选择框架,在温和正则条件下选择加权子集,使平均损失近似全数据集平均损失,相对误差(1+ε)加性项εΦ_k,实验优于均匀采样和聚类敏感采样。
Comments ICML 2026
自回归蛋白质语言模型中的电路追踪
发表机构 * Stanford University(斯坦福大学)
AI总结 提出ProGenMech框架,通过跨层稀疏编码器忠实恢复ProGen3的生成计算,并零样本发现与蛋白质生成和适应性预测相关的稀疏电路,揭示生物意义基序。
Comments Accepted into the Mechanistic Interpretability Workshop at ICML 2026. 24 pages, 14 figures
利用深度学习实现自主物流车辆对载具的物体与位置识别
发表机构 * Research Group on Cognitive Autonomy & Predictive Intelligence, Technical University of Applied Sciences, Augsburg, Germany(认知自主与预测智能研究组,奥格斯堡应用技术大学,德国) ; Grenzebach Maschinenbau GmbH, Asbach-Bäumenheim, Germany(Grenzebach Maschinenbau GmbH,德国阿斯巴赫-博伊门海姆)
AI总结 提出基于深度学习的框架,通过卷积神经网络从RGBD数据中识别载具上的预定义地标并计算其位姿,实现自主物流车辆对载具的检测与定位,实验验证了工业环境下的可靠性。
Comments 6 pages, 6 figures, IFAC World Congress2026, \c{opyright} 2026 the authors. This work has been accepted to IFAC for publication under a Creative Commons Licence CC-BY-NC-ND
信任错误理由的正确预测:基于LIME的肺癌诊断深度学习可解释性分析
发表机构 * Caldwell University School of Business and Computer Science(考德威尔大学商业与计算机科学学院)
AI总结 本研究通过LIME分析三种深度学习模型(CNN、ResNet50、ViT)在肺癌CT分类中的决策一致性,发现预测高度一致但解释区域差异显著,表明预测一致性不能替代推理一致性。
时序分类的推理时决策校准
发表机构 * Department of Computer Science (DCC), Universidade Federal de Minas Gerais (UFMG)(米纳斯吉拉斯联邦大学计算机科学系)
AI总结 提出将时序分类错误分解为表征错误和决策错误,通过冻结原生分类器并添加残差多尺度分支与事后分支感知校准器,在不重训练骨干网络的情况下区分缺失时序证据与未充分利用的决策级证据。
NTIRE 2026图像去噪挑战赛第三轮:方法与结果
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; University of Würzburg(维尔茨堡大学) ; Beijing University of Posts and Telecommunications(北京邮电大学) ; Tianjin University(天津大学) ; Nanjing University of Science and Technology(南京理工大学) ; University of Beira Interior(贝拉内大学) ; Siddaganga Institute of Technology(西达甘加理工学院) ; National Institute of Technology Karnataka(卡纳塔克邦国立理工学院) ; Sardar Vallabhbhai National Institute of Technology(萨达尔·瓦拉巴伊·帕特尔国立理工学院) ; University of Luxembourg(卢森堡大学) ; University of Twente(特温特大学) ; University of Kragujevac(克拉古耶瓦茨大学) ; Prince Sultan University(苏丹王子大学) ; University of Tunis El Manar(突尼斯埃尔马纳尔大学) ; University of Electronic Science and Technology of China(电子科技大学) ; Wuhan University(武汉大学) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; Peng Cheng Laboratory(鹏城实验室)
AI总结 报告NTIRE 2026高噪声图像去噪挑战赛,参赛团队采用先进神经网络架构,以PSNR为指标,在无约束条件下实现最先进性能。
Comments accepted by cvprw2026
正交约束下共享表示的信息论优势
发表机构 * Johann Radon Institute of Computational and Applied Mathematics, Austrian Academy of Sciences(奥地利科学院约翰·拉东计算与应用数学研究所) ; Faculty of Mathematics, University of Vienna(维也纳大学数学学院)
AI总结 本文通过信息论框架,证明在正交约束下,联合近似比单独近似需要更少的描述长度,揭示了共享表示在组合架构中的效率优势。
领域内监督病理报告分类:从数据整理到生产匹配评估的可复现流程
发表机构 * University of Kentucky(肯塔基大学) ; UK Markey Cancer Center(肯塔基大学马基癌症中心) ; Kentucky Cancer Registry(肯塔基癌症登记处) ; Division of Cancer Biostatistics, University of Kentucky(肯塔基大学癌症生物统计学系) ; Oak Ridge National Laboratory(橡树岭国家实验室) ; Division of Biomedical Informatics, University of Kentucky(肯塔基大学生物医学信息学系)
AI总结 提出领域内监督流程解决病理报告跨注册中心性能下降问题,通过标准化数据整理、生产匹配保留集和低假阴性率操作点选择,在418k报告集上FNR降至0.003,F1提升至0.922。
IBAD:人类移动数据上的可解释行为异常检测
发表机构 * University of Southern California(南加州大学)
AI总结 提出IBAD框架,利用LDA学习可解释的日常移动模板,通过层次自监督模型检测个体行为异常,在真实和合成数据集上验证了模板的可迁移性和鲁棒性。