Geometry-Aware Tabular Diffusion
几何感知表格扩散
发表机构 * arXiv
AI总结 提出几何感知表格扩散(GATD),通过向扩散去噪器注入列值差异的成对角度和长度作为输入和辅助目标,以显式建模列间关系,在10个数据集上以更少参数取得SOTA性能。
Comments Accepted to the ICML 2026 main track. 24 pages, 10 figures, 22 tables
几何感知表格扩散
发表机构 * arXiv
AI总结 提出几何感知表格扩散(GATD),通过向扩散去噪器注入列值差异的成对角度和长度作为输入和辅助目标,以显式建模列间关系,在10个数据集上以更少参数取得SOTA性能。
Comments Accepted to the ICML 2026 main track. 24 pages, 10 figures, 22 tables
ReLoRA: 面向演化LLM服务快速部署的知识复用适配
发表机构 * School of Computer Science and Technology, University of Science and Technology of China(计算机科学与技术学院,中国科学技术大学) ; Suzhou Institute for Advanced Research, University of Science and Technology of China(苏州先进研究院,中国科学技术大学)
AI总结 针对基础模型频繁更新导致已有LoRA适配器失效的问题,提出ReLoRA框架,通过贝叶斯优化初始化与调度正则化微调,实现知识复用与快速重新适配,降低计算开销并提升性能。
用于严重狭窄分类的心电图与血管造影表示的跨模态对比学习
发表机构 * Chair for AI in Healthcare and Medicine, Technical University of Munich and TUM University Hospital(人工智能在医疗与医学中的研究所,慕尼黑技术大学及慕尼黑大学医院) ; Department of Computing, Imperial College London(伦敦帝国理工学院计算机系) ; Munich Center for Machine Learning (MCML), Munich, Germany(慕尼黑机器学习中心(MCML)) ; Department of Internal Medicine, TUM University Hospital(慕尼黑大学医院内科学系)
AI总结 提出StenCE预训练框架,通过跨模态对比学习从心电图特征中实现冠状动脉狭窄风险分层,在严重狭窄分类中首次达到高性能。
来自碎片化ESG数据的可审计气候风险智能:面向范围1-3验证的确定性编排与不平衡感知学习
发表机构 * Kent Business School, University of Kent(肯特大学 Kent 商学院)
AI总结 针对ESG数据碎片化及传统验证缺乏可审计性的问题,提出一种融合确定性编排、时序异常检测、不平衡感知集成学习和可解释治理的框架,并构建合成基准实现可复现验证。
Comments 22 pages, 7 figures. Preprint
COD10K-C:自然图像损坏下伪装目标检测的鲁棒性基准测试
发表机构 * CSE, Bangladesh University of Engineering and Technology(孟加拉国工程与技术大学计算机科学与工程系)
AI总结 提出COD10K-C基准,包含8种损坏类型和5个严重级别,评估伪装目标检测模型在损坏图像上的性能,并引入轻量级模型RobustCODLite,通过损坏增强、频率先验分支和不确定性一致性损失,在损坏条件下保持较高Dice分数。
Comments 7 pages, 1 figure
基于拓扑感知排序的图Mamba生存分析
发表机构 * School of Mathematics and Statistics(数学与统计学学院) ; West China Science and Technology Innovation Harbor(西部科学与技术创新港) ; School of Computer Science and Technology(计算机科学与技术学院)
AI总结 针对WSI生存分析中Mamba模型对输入顺序敏感及单向架构限制空间结构利用的问题,提出基于拓扑感知排序的图Mamba框架TopoMamSurv,通过TAO策略、双向Mamba模块和GCN集成实现高效长程依赖建模与双向空间上下文建模。
测试测试:类分割异常检测中的分数方向不稳定性
发表机构 * GitHub ; arXiv
AI总结 本文通过提出邻域类泄漏诊断方法,揭示了类分割异常检测协议在异常类与正常混合重叠时分数方向不稳定的问题,并建议将其视为几何依赖的压力测试。
Comments 4+1 pages, 1 figure, accepted at ICML 2026 Workshop on Hypothesis Testing
评估区域级脑电图对认知负荷预测的贡献
发表机构 * School of InfoComm Technology, Ngee Ann Polytechnic(信息与通信技术学院,南洋理工学院新加坡分校) ; Engineering Product Development Pillar, Singapore University of Technology and Design(工程产品开发支柱,新加坡科技设计大学) ; NUS High School of Math and Science(国立大学科学高中)
AI总结 提出区域级评估框架,通过跨四个公开数据集的大规模分析,发现额叶电极组在混合被试和独立被试评估中均优于全头皮基线,额中央区域预测稳定性最高,支持设计高效通用的脑电图负荷监测系统。
Comments Accepted to EMBC 2026
使脑机接口更安全
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 针对脑电图(EEG)脑机接口(BCI)易受对抗攻击的问题,提出轻量级卷积神经网络(CNN)架构,在梯度攻击下比EEGNet、DeepConvNet和SleepEEGNet等模型具有更好的分类鲁棒性。
Comments Accepted and presented at IEEE World AI IoT Congress 2026
神经网络损失景观的谱渐近:曲率指数的精确分解
发表机构 * D Labs(9D实验室)
AI总结 本文通过谱对齐分解证明曲率指数α=2+dlogΦ_k/dlogσ_k,揭示了不同层类型曲率指数变化的几何原因,并推导出谱传递恒等式s=αγ,在无自由参数下以约2%中位误差预测Hessian衰减指数。
Comments 13 pages, 6 figures, 3 tables. Code and data: https://github.com/9D-Labs/9d-spectral-alignment-decomposition
面向短租动态定价的人机协同上下文赌博机:历史预热与审批门控在线学习的结构等价性
发表机构 * Oleg Miroshnichenko(奥列格·米罗什尼琴科)
AI总结 针对短租动态定价中反馈稀疏、决策风险高的问题,提出人机协同门控赌博机框架,证明历史定价数据与在线策略预热数据的结构等价性,并设计正则化岭回归预热方法,将冷启动周期从约150轮压缩至约30轮。
X-Stream: 探索多模态大语言模型作为多流理解的多路复用器
发表机构 * MMLab, Chinese University of Hong Kong(中大香港人工智能实验室) ; Huawei Inc.(华为公司)
AI总结 为解决多流视频理解评估缺失的问题,提出首个基准X-Stream,包含4220个QA对和932个视频,覆盖多窗口、多视角和多设备场景,并基于信号多路复用理论评估MLLM作为多路复用器的性能,发现现有模型在并发流上仅达约50%分数。
Comments Project Page: https://peiwensun2000.github.io/xstream/
AGENTCL:面向语言代理持续学习的严格评估
发表机构 * The Ohio State University(俄亥俄州立大学) ; Johns Hopkins University(约翰霍普金斯大学) ; Intuit AI Research(Intuit AI研究)
AI总结 提出AGENTCL评估框架,通过可控任务流和迁移增益指标,严格评估语言代理的持续学习能力,并开发MemProbe探针方法诊断记忆设计的影响。
Comments 10 pages in the main text, 26 pages in total
忘记注意力:重要性感知注意力即你所需
发表机构 * Department of Computer Engineering(计算机工程系)
AI总结 提出SISA方法,通过将状态空间模型的重要性信号直接融入注意力分数计算,实现分数级融合,在语言建模中兼顾全局检索与重要性排序。
Comments 20 pages, 6 figures, 25 tables
学习何时不行动:缓解智能体强化学习中的工具滥用
发表机构 * NLPR, Institute of Automation, Chinese Academy of Sciences(NLPR,自动化研究所,中国科学院) ; ByteDance(字节跳动) ; Zhejiang University(浙江大学)
AI总结 提出EAPO框架,通过引入无工具轨迹、难度感知奖励塑造和置信度感知令牌重加权,在数学和知识密集型推理任务中减少工具滥用,同时提升准确率-效率权衡。
Comments Under review
DFlare: 扩展块扩散推测解码的草稿容量
发表机构 * School of Computer Science, Peking University(北京大学计算机科学系) ; Tencent(腾讯)
AI总结 提出DFlare方法,通过轻量级逐层融合机制扩展草稿模型容量,在多个基准上实现平均5.52倍加速。
Comments 12 pages, 3 figures
FocusDiT: 扩散Transformer中的查询掩码用于细粒度图像生成
发表机构 * Zhejiang University(浙江大学) ; Westlake University(西湖大学)
AI总结 提出FocusDiT方法,通过掩码关键查询令牌仅输入FFN层,增强细粒度视觉生成,实验验证其有效性。
深度研究代理在何处出错?代理轨迹中的跨度级错误定位
发表机构 * NJU-LINK Team, Nanjing University(南京大学NJU-LINK团队) ; JIUTIAN Research(JIUTIAN研究院)
AI总结 针对深度研究代理在长轨迹中难以定位错误的问题,本文通过构建TELBench基准和提出DRIFT审计框架,实现了跨度级错误定位,将首次错误定位准确率提升高达30个百分点。
Comments 28 pages, 11 figures, 4 tables
将零售产品名称编码为消费者价格类别的机器学习:基于规则加词袋的流水线,结合可靠性加权的人工参与标注
发表机构 * Besk Tech(Besk科技) ; Moscow Institute of Physics and Technology (MIPT)(莫斯科物理技术学院)
AI总结 本文提出一种结合规则和词袋模型的流水线方法,并采用可靠性加权的人工参与标注协议,将零售产品名称映射到消费者价格类别(如UN COICOP),实验表明词袋模型在该任务上已接近饱和(F1约0.99),而标注协议中可靠性加权投票仅略优于简单多数投票。
Comments 11 pages, 3 tables. Methodology paper; illustrative experiments only, no proprietary data
基于领域增强的对比增强Transformer用于鲁棒的多场景金属表面缺陷检测
发表机构 * Glasgow College, University of Electronic Science and Technology of China(格拉斯哥学院,电子科学与技术大学)
AI总结 提出对比增强Transformer(CAT)框架,结合Swin Transformer骨干、特征金字塔网络、领域特定液滴增强算法和难负样本挖掘策略,解决金属表面缺陷检测中标注数据有限、多尺度缺陷识别难和跨场景泛化差的问题,在KolektorSDD2数据集上达到99.54%像素级AUROC。
KliniskVestBERT: 针对挪威临床文本特化的BERT模型
发表机构 * helse-vest-ikt(赫尔塞-维斯特信息科技)
AI总结 通过继续预训练现有BERT模型,在挪威临床文本上构建KliniskVestBERT模型,在临床NLP任务中显著优于基线模型。
PHASOR: 面向人形本体的相位锚定通用动作表示
发表机构 * AIM Intelligence ; Seoul National University(首尔国立大学) ; LG Electronics(LG电子) ; MAUM AI ; OpenMind
AI总结 提出PHASOR方法,通过将动作嵌入空间分解为相位流形和姿态分支,并结合运动语义蒸馏,构建跨本体的通用动作表示,实现人形机器人的跨本体检索和下游任务性能提升。
Comments * Equal contribution
ContinuousBench: 差分隐私合成文本能否提升能力?
发表机构 * Columbia University(哥伦比亚大学) ; NYU(纽约大学) ; Google Research(谷歌研究) ; University of Waterloo(滑铁卢大学) ; Vector Institute(向量研究所) ; Google(谷歌)
AI总结 提出ContinuousBench基准,通过持续更新的数据集评估差分隐私合成文本能否传递原始语料库中的新知识,实验表明非隐私合成能有效转移知识,而最先进的DP合成方法即使在高隐私预算下也基本失败。
Comments For datasets, see https://huggingface.co/ContinuousBench; for the evaluation harness, see https://github.com/plau666/ContinuousBenchEval; for an accompanying blog post, see https://peihanliu.com/posts/continuousbench.html
EvoBrain: 面向异构BCI任务的EEG基础模型的持续学习
发表机构 * State Key Laboratory of Brain-machine Intelligence and College of Computer Science and Technology, Zhejiang University(脑机智能国家重点实验室和浙江大学计算机科学与技术学院) ; MOE Frontier Science Center for Brain Science and Brain-Machine Integration, Zhejiang University(教育部脑科学与脑机集成前沿科学中心,浙江大学)
AI总结 提出EvoBrain框架,通过神经频谱任务归一化和响应亲和蒸馏,解决EEG基础模型在异构BCI任务中的持续学习问题,实现跨任务知识迁移和遗忘缓解。
Comments 18 pages,12 figures
基准测试LLM作为裁判在长文本输出评估中的应用
发表机构 * Department of Computer Science and Technology, Tsinghua University(清华大学计算机科学与技术系) ; University of Science and Technology Beijing(北京科技大学)
AI总结 提出LongJudgeBench基准,系统评估LLM裁判在长文本输出评估中的可靠性,发现当前模型存在显著可靠性差距。
重新思考位置编码的作用:无PE的滑动窗口Transformer仍具图灵完备性
发表机构 * Shenzhen Research Institute of Big Data(深圳大数据研究院) ; University of Southern California(南加州大学)
AI总结 本文证明,在滑动窗口机制下,无需位置编码的Transformer仍可通过窗口演化模拟图灵完备的Post机器,从而具备通用计算能力。
ChartArena: 跨语言、场景和格式的图表解析基准测试
发表机构 * Large Language Model Department, Tencent(腾讯大语言模型部门) ; Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; Shenzhen Loop Area Institute(深圳环湖区研究所) ; Nankai University(南开大学)
AI总结 提出ChartArena,一个覆盖8种图表族、3种视觉场景的双语基准,通过人机协作标注和格式无关评估协议,系统评估26个多模态大模型的图表解析能力,揭示前沿模型差距与挑战。
基于Catalan指数先验的决策树贝叶斯模型平均的样本复杂度和决策理论保证
发表机构 * School of Computing and Engineering University of Bedfordshire, Luton, UK(计算与工程学院贝德福德郡大学,卢顿,英国)
AI总结 针对具有Dirichlet-Multinomial叶模型和Catalan指数树大小先验的贝叶斯决策树,建立了理性承诺阈值的完整非渐近理论,回答了贝叶斯模型平均权重何时蕴含足够认知信息以证明对平均分布的承诺利用是合理的。
Comments 22 pages, 3 figures, Submitted to the Journal of Machine Learning Research
局部比较训练下Transformer中涌现的序数几何
发表机构 * Birla Institute of Technology and Science, Pilani(比拉理工学院和科学学院,皮兰)
AI总结 通过仅训练相邻比较,Transformer模型在未见远距离对上展现出泛化能力,并形成一维序数几何结构,其决策置信度与排名距离单调相关,类似于符号距离效应。
Comments 11 pages, 12 figures
OneVLA:面向具身任务的统一框架
发表机构 * Tsinghua University(清华大学) ; Pengcheng Laboratory(鹏城实验室) ; Xiaomi EV(小米电动车) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; Peking University(北京大学) ; HKUST(GZ)(香港科技大学(广州))
AI总结 提出统一架构OneVLA,通过设计统一动作头和渐进式训练策略(含数据构建和思维链微调),在导航与操作任务上实现跨任务正迁移,达到最先进性能。