Counterfactual Explanations Under Concept Drift
反事实解释在概念漂移下的应用
发表机构 * Wrocław University of Science and Technology(沃拉什大学科学与技术学院) ; Poznań University of Technology(波兹南技术大学)
AI总结 本文研究了在数据不断变化的环境中,如何维护反事实解释的有效性,提出了一种轻量级的更新方案以修复现有解释,保持其与原始实例的接近性。
反事实解释在概念漂移下的应用
发表机构 * Wrocław University of Science and Technology(沃拉什大学科学与技术学院) ; Poznań University of Technology(波兹南技术大学)
AI总结 本文研究了在数据不断变化的环境中,如何维护反事实解释的有效性,提出了一种轻量级的更新方案以修复现有解释,保持其与原始实例的接近性。
SAPO:基于推理的生成推荐的步骤对齐策略优化
发表机构 * University of Virginia(弗吉尼亚大学) ; Nokia(诺基亚)
AI总结 本文提出SAPO方法,通过步骤对齐策略优化解决生成推荐中因精确匹配反馈不足导致的训练不稳定问题,改进了基于推理的生成推荐系统的训练效果。
TabKDE: 通过核密度估计实现简单且可扩展的表格数据生成
发表机构 * University of Utah(犹他大学) ; Visa Research(Visa研究)
AI总结 本文提出了一种基于核密度估计的表格数据生成方法,能够在无需大量训练时间的情况下实现与现有方法相当的准确性和防泄漏性能,并且能够高效处理大规模数据集。
基于因果干预的记忆选择用于长时域大语言模型智能体
发表机构 * School of Computing, University of Georgia, Athens, Georgia, USA(佐治亚大学计算机学院)
AI总结 本文提出Causal Memory Intervention(CMI)方法,通过因果推理选择大语言模型的长期记忆,以提高回答质量和鲁棒性,同时引入Causal-LoCoMo基准数据集进行评估。
Comments 12 pages, 3 figures, 3 tables
共引预测性的时变衰减:来自3.96亿乌克兰法院引用的20年法规检索基准
发表机构 * LEX AI LLC
AI总结 本文研究了共引结构在法律信息系统中的稳定性假设,通过构建UA-StatuteRetrieval基准,测试了20年中3.96亿条引用数据的共引可预测性,发现Adamic-Adar MRR在固定文章集上下降33%,在训练/测试时间分割下下降47%,证实了真正的时变衰减而非组合变化或评估伪影。
Comments 12 pages, 8 figures, 4 tables. Dataset: https://huggingface.co/datasets/overthelex/ua-statute-retrieval
TouchMap-OR: 医院内多视角手-表面接触的3D映射
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; Institute for Anesthesiology and Perioperative Medicine, University Hospital Zurich(苏黎世大学麻醉学与围术期医学研究所) ; Department of Public and Global Health, University of Zurich(苏黎世大学公共卫生与全球健康系)
AI总结 本文提出TouchMap-OR系统,通过多视角RGB-D视觉系统实现手术室中身份分辨的手-表面接触重建,利用临床环境的语义结构推断接触时间和位置,通过多视角手部重建与追踪医生获得一致的手部轨迹,并建立手术室的语义3D模型以将手部轨迹映射到特定表面。
SparseSAM: Segment Anything模型中激活的结构稀疏化
发表机构 * University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; College of Engineering & Computer Science, VinUniversity(Vin大学工程与计算机科学学院) ; VinUni-Illinois Smart Health Center, VinUniversity(Vin大学-伊利诺伊智能健康中心) ; DFKI ; Max Planck Research School for Intelligent Systems (IMPRS-IS)(马克斯·普朗克智能系统研究学校) ; University of Stuttgart(斯图加特大学)
AI总结 本文提出SparseSAM,一种无需训练的结构稀疏化框架,通过联合加速注意力和MLP层并保持token身份,从而在保持高质量的同时提高推理速度和减少内存使用。
通过元步骤解码实现验证器引导的代码翻译
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; Google(谷歌)
AI总结 本研究提出了一种元步骤解码框架DTV,通过在生成过程中整合验证器调用,提高了代码翻译的通过率,同时减少了token的使用。
Comments 31 pages, 8 figures
用于长周期科学代理的事件-语义记忆架构
发表机构 * Serbian Institute for Artificial Intelligence Research and Development(塞尔维亚人工智能研究与发展研究所) ; Bayer A.G.(勃林格殷曼有限公司)
AI总结 本文提出了一种双过程记忆架构,用于解决科学代理在长周期任务中面临的情境窗口饱和问题,通过分离即时事件需求和长期知识整合,提升了在大规模科学工作流中的表现和可扩展性。
通过不变/等变半监督学习进行部分标注数据集上的多任务学习
发表机构 * KTH Royal Institute of Technology(皇家理工学院) ; Univrses AB
AI总结 本文研究了不变和等变半监督学习在处理部分标注数据集上多任务模型训练挑战的潜力,通过FixMatch方法和其等变扩展Dense FixMatch进行评估,在城市景观和BDD100K数据集上针对常见的目标检测和语义分割任务进行测试,发现不变和等变半监督学习在大多数情况下优于监督基线,特别是在标注样本较少时效果更佳。
SynVA:一种用于血管生成和动脉瘤编辑的模块化工具包
发表机构 * Visual Computing and Artificial Intelligence, Kiel University, Germany(视觉计算与人工智能研究所,基尔大学,德国) ; Institute for Medical Informatics and Statistics, Kiel University, Germany(医学信息学与统计研究所,基尔大学,德国) ; Clinic for Neuroradiology, Medical Faculty, Magdeburg University, Germany(神经放射科,马格德堡大学医学学院,德国) ; Department of Radiology and Neuroradiology, University Hospital Schleswig-Holstein, Germany(放射学与神经放射学部门,石勒苏益格-荷尔斯泰因大学医院,德国) ; Faculty of Mathematics and Computer Science, Adam Mickiewicz University, Poland(数学与计算机科学学院,亚当·密茨凯维奇大学,波兰)
AI总结 本文提出SynVA,一种模块化工具包,用于生成血管网格和在解剖学上一致的动脉瘤合成,通过结合新的流匹配方法和基于学习的方法,生成真实血管几何和解剖学合理的动脉瘤,同时提供大规模标注数据集以提升医疗影像分析能力。
SafeLens: 一种高效且可靠的视频护栏系统,采用快速和缓慢筛查
发表机构 * University of South Florida(佛罗里达州立大学) ; University of California, Davis(加州大学戴维斯分校)
AI总结 本研究提出SafeLens视频护栏框架,通过快速和缓慢的推理架构实现高效的视频内容审核,同时构建高质量数据集并采用结构化Chain-of-Thought追踪来解决训练时间扩展的限制,从而在实际和AI生成视频基准测试中取得最佳性能,同时显著降低推理成本。
Venom:一个PyTorch生成建模工具包
发表机构 * Paul G. Allen School of Computer Science & Engineering(保罗·G·艾伦计算机科学与工程学院)
AI总结 本文提出Venom,一个基于PyTorch的生成建模工具包,旨在通过统一的接口实现多种生成建模家族,提供可读、可复现的入口点以及一致的训练和采样API,便于教学、原型设计和轻量级基准测试。
Comments Preprints
从单次示范到通用的接触密集操纵策略
发表机构 * Robotics and Biology Laboratory, Technische Universität Berlin(技术大学柏林机器人与生物学实验室) ; Science of Intelligence, Research Cluster of Excellence, Berlin(智能科学,卓越研究集群,柏林) ; Robotics Institute Germany(德国机器人研究所)
AI总结 本文提出了一种学习从示范(LfD)框架,通过利用环境约束作为归纳偏差,实现多阶段、接触密集任务的一次性泛化。该方法将示范表示为利用环境约束的行为序列,将任务通用结构(约束类型及其转换)与实例特定细节(精确示范轨迹、姿态和局部几何)分离。四阶段流程在该表示上构建完整策略:机器人首先将单次示范抽象为环境约束原语,然后通过自我引导探索进行歧义消除,接着整合针对人类修正以处理超出分布的变化,最后通过合规交互在线恢复抽象掉的细节。由于最终策略遵循约束而非模仿轨迹,它在物体姿态、局部几何和未建模接触动力学上实现了泛化。我们在七个现实世界多阶段接触密集操纵任务上验证了该方法,成功率达到90%以上。这些广泛实验结果确立了环境约束作为学习从示范中高效泛化基本构建块的重要性。
Comments 21 pages, 22 figures, 7 tables
专家混合用于低资源大语言模型
发表机构 * National Institute for Testing and Evaluation(国家测试与评估研究所)
AI总结 本文研究了专家混合架构在低资源语言中的专家路由行为,发现持续预训练能有效缓解路由不平衡问题,且路由改进与下游任务表现提升相关。
考虑运动不确定性的移动物体重建最佳下视角规划
发表机构 * Harvard University(哈佛大学) ; University of Modena and Reggio Emilia(摩德纳和雷焦艾米利亚大学)
AI总结 本文提出了一种考虑运动不确定性的最佳下视角规划框架,用于重建未知的刚体目标,该框架利用噪声的平面位置测量和移动机器人深度观测,通过固定滞后高斯过程平滑器估计和预测目标状态,从而生成候选视角并提高重建完整性。
Comments This paper is accepted for publication for Robotics: Science and Systems (RSS) 2026
误差分解类条件融合用于统计保证的硬类别鲁棒感知
发表机构 * Hefei University of Technology, Hefei, China(合肥工业大学) ; Lishui University, Lishui, China(丽水大学)
AI总结 本文提出误差分解类条件融合(ED-CCF)方法,通过解决硬类别可靠性问题,提升关键类别性能的同时保持整体稳定性,实现统计保证的鲁棒感知。
Comments 14 pages, 8 figures. Preprint
形式与功能:将机器去学习视为不一致状态的问题
发表机构 * Second Street Labs, Detroit, MI, USA(第二街实验室,密歇根州底特律) ; Department of Statistics, University of Michigan, Ann Arbor, MI, USA(密歇根大学统计系,密歇根州安阿伯)
AI总结 本文提出将在线L-BFGS的机器去学习问题建模为反事实状态对齐问题,通过引入状态感知度量和反事实 oracle 模型,证明去学习不仅仅是参数修正问题,还需要与可实现的反事实优化器状态对齐。
MSIQ: 基于矩的尺度不变质量度量用于单图像超分辨率
发表机构 * Khmelnytsky National University, Faculty of Information Technology, Ukraine(赫梅利尼茨基国立大学信息科技学院,乌克兰)
AI总结 本文提出了一种基于矩的尺度不变质量度量(MSIQ),用于评估单图像超分辨率(SISR)结果的质量,该方法通过比较两幅图像的归一化中心几何矩,能够直接比较不同空间分辨率的图像,且具有数学确定性和解析形式,解决了传统方法在几何结构保持和强制缩放带来的误差问题。
Comments 23 pages
VVitCutLER: 向视频中无监督的目标检测和分割迈进
发表机构 * RPTU University of Kaiserslautern-Landau(莱茵-瓦尔德大学凯撒斯劳滕-兰道分校) ; German Research Center for Artificial Intelligence(德国人工智能研究中心)
AI总结 该研究提出VVitCutLER框架,通过引入时间一致性提升视频中伪标签的质量,从而改进目标检测和实例分割的性能,减少时间不稳定性。
Comments 11 figures, cvpr workshop
AgentSteerTTS: 一个用于复合指令文本到语音的多智能体闭环框架
发表机构 * University of Chinese Academy of Sciences(中国科学院大学) ; Shenzhen Loop Area Institute(深圳环湖研究院) ; Tencent Turinglab(腾讯人工智能实验室) ; Tsinghua University(清华大学) ; Southwest Jiaotong University(西南交通大学)
AI总结 本文提出AgentSteerTTS,一个多智能体闭环框架,通过引入对抗解耦代理、双流锚定控制器和快速-慢反馈代理,实现了对复合指令的意图忠实表达控制,实验表明其在复合指令基准和公开测试集上显著提升了性能。
Comments Project page: https://kane2kang.github.io/AgentSteerTTS/
尺度等变生成预测:权重绑定的扩张卷积、小波散射输入和频谱一致性训练用于自相似时间序列
发表机构 * Cisco Systems, Inc.(思科系统公司)
AI总结 本文提出了一种尺度等变生成预测方法,通过权重绑定的扩张卷积、小波散射输入和频谱一致性训练,用于自相似时间序列的生成,展示了在S&P 500日收益率上的优越性能。
ECG-WM: 一种基于生理的ECG世界模型用于临床干预模拟
发表机构 * University of Oxford(牛津大学) ; Tsinghua University(清华大学) ; Southern University of Science and Technology(南方科技大学)
AI总结 本文提出了一种基于ECG的世界模型,用于条件化预测心脏电生理学,通过整合生理学普通微分方程先验知识,提升干预后ECG轨迹的生理合理性,并引入不确定性评估策略以更可靠地评估候选干预方案。
TAME: 通过混合专家架构实现视觉语言模型的测试时对抗提示调优
发表机构 * Fellow, IEEE(IEEE会士)
AI总结 本文提出TAME,一种基于混合专家架构的测试时防御方法,旨在提升视觉语言模型在对抗扰动下的鲁棒性,同时保持对清洁样本的泛化能力。
UniAlign:一种用于在分布偏移下鲁棒网络流量分类的模型无关框架
发表机构 * Institute for Network Sciences and Cyberspace, Tsinghua University(网络科学与网络空间研究院,清华大学) ; Department of Computer Science and Technology, Tsinghua University(计算机科学与技术系,清华大学)
AI总结 本文提出UniAlign,一种模型无关的框架,通过领域对齐微调和稳定模型集成提升深度学习网络流量分类模型在分布偏移下的鲁棒性,实验表明其在准确率和F1分数上均优于现有基线。
社交媒体中的深度伪造检测:利用3D卷积神经网络进行时序特征分析
发表机构 * Department of Computer Science AI(计算机科学系人工智能部门) ; Media Analysis Lab Berlin, Germany(媒体分析实验室柏林德国)
AI总结 本文提出了一种基于R3D-18的3D卷积神经网络检测器,通过结合二元交叉熵损失与时间一致性正则化损失,提升深度伪造检测在高分辨率和跨数据集场景下的准确性,证明了时间特征比空间特征在社交媒体重编码中更具鲁棒性。
Comments 13 pages, 6 figures
混合专家在类增量学习中的稳定路由
发表机构 * State Key Laboratory of Novel Software Technology, Nanjing University(南京大学新型软件技术国家重点实验室) ; School of Artificial Intelligence, Nanjing University(南京大学人工智能学院)
AI总结 本文研究了在类增量学习中混合专家模型的稳定路由问题,提出了一种稳定路由框架StaR-MoE,通过敏感性感知路由对齐和不对称容量正则化,提高了模型对新类别的适应能力和旧类别的知识保留能力。
GRPO在离线策略下的可能性:Mu-GRPO用于高效的大语言模型强化学习
发表机构 * Rice University(里士大学)
AI总结 本文探讨了GRPO在离线策略下的可行性,提出Mu-GRPO方法,通过减少rollout-optimization切换开销,实现高效的LLM强化学习,同时在多个基准测试中表现出色。
重新思考点云作为序列:一种因果性下一标记预测学习框架
发表机构 * Nanjing University of Science and Technology(南京理工大学) ; Shanghai Jiao Tong University(上海交通大学) ; Hangzhou City University(杭州城市学院) ; East China Normal University(华东师范大学)
AI总结 本文提出PointNTP,将点云预训练重新定义为全因果、无解码器的潜在下一标记预测问题,通过局部补丁分割和结构化3D标记序列生成,实现对点云结构依赖的直接建模,无需重建解码器或显式几何恢复,实验表明其在多个下游任务中表现优异。
Comments 10 pages, 2 figures. Code will be released upon acceptance
泛化还是记忆?国际象棋训练语言模型的脆弱性测试
发表机构 * School of Computing and Augmented Intelligence(计算与增强智能学院)
AI总结 本文研究了国际象棋训练语言模型是泛化还是记忆,通过测试发现其高性能主要源于模式匹配,并展示了LLM-Modulo框架在提升国际象棋谜题解决性能上的效果,证明了与外部验证器结合的通用LLM比直接训练合成数据更灵活。
Comments 14 pages, 2 figures, 4 tables, 3 equations