IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus
IsabeLLM: 自动化定理证明应用于共识的形式化验证
发表机构 * Imperial College London(伦敦帝国学院)
AI总结 本文改进IsabeLLM自动化定理证明工具,通过检索增强生成、错误追踪和反例生成提升大语言模型上下文,并兼容最新Isabelle和Sledgehammer,用于验证比特币工作量证明共识。
IsabeLLM: 自动化定理证明应用于共识的形式化验证
发表机构 * Imperial College London(伦敦帝国学院)
AI总结 本文改进IsabeLLM自动化定理证明工具,通过检索增强生成、错误追踪和反例生成提升大语言模型上下文,并兼容最新Isabelle和Sledgehammer,用于验证比特币工作量证明共识。
WireCraft:工业DLO操作仿真基准
发表机构 * Department of Mechanical and Industrial Engineering, University of Toronto(多伦多大学机械与工业工程系) ; Department of Computer Science, University of Toronto(多伦多大学计算机科学系) ; CREFLE Inc.(CREFLE公司)
AI总结 针对工业中可变形线性物体(DLO)操作缺乏统一基准的问题,提出WireCraft仿真基准,支持可配置难度和资产,涵盖三种任务族,并评估强化学习、模仿学习和视觉-语言-动作策略。
S4oP:面向资源受限设备的结构化状态空间模型的算子级剪枝
发表机构 * University of Verona(威尼斯大学)
AI总结 提出一种针对S4和S4D模型的增量算子级剪枝方法,通过结构化掩码与微调交替进行,在保持预测性能的同时显著降低推理成本,首次系统研究SSM的结构化算子剪枝。
Next-Turn: 通过预测下一次语音开始时间进行持续时间感知的流式端点检测
发表机构 * Central Media Technology Institute, Huawei(华为中央媒体技术研究院) ; The Chinese University of Hong Kong(香港中文大学) ; Nanyang Technological University(南洋理工大学)
AI总结 提出Next-Turn方法,以到下一次语音开始的时间为训练目标,直接利用语音时间戳,无需额外标注,在端点检测中比最强基线提高25.9%的绝对准确率,且与持续时间感知目标联合训练可进一步提升性能。
Comments Interspeech 2026
EAGG: 通过几何感知图条件实现具身对齐的抓取生成
发表机构 * Department of Computer Science and Technology, Tsinghua University(清华大学计算机科学与技术系) ; Beijing Moce Future Technology Co., Ltd.(北京墨策未来科技有限公司)
AI总结 提出EAGG,一种通过拓扑感知末端执行器图和几何感知令牌实现跨末端执行器抓取生成的统一模型,在MultiGripperGrasp基准上达到56.17%平均成功率,并显著降低接触距离。
Comments 16 pages, 8 figures. Code is available at this https URL (https://github.com/wanhaoniu/EAGG)
从推理轨迹到可复用模块:理解语言模型推理中的组合泛化
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; Institute of Foundation Models(基础模型研究院) ; University of Michigan(密歇根大学)
AI总结 本文通过层次化潜在选择模型形式化组合泛化,理论证明SFT提供原子模块,RL分解轨迹实现组合泛化,实验验证RL能从复合轨迹中提取原子模块并重组解决新配置。
Comments ICML2026
Edge Flow: 一种可处理且可预测的梯度下降在稳定性边缘的连续时间模型
发表机构 * Inria, École Normale Supérieure, PSL Research University(法国国家信息与自动化研究所,巴黎高等师范学院,PSL研究大学)
AI总结 针对深度学习梯度下降在稳定性边缘(EoS)的动力学,提出Edge Flow模型,通过三个耦合常微分方程分解为中心、振荡方向和幅度,实现可处理且预测性的建模,并揭示锐度自稳定机制。
Comments 24 pages, 13 figures
上下文感知与关系感知的图检索增强生成统一框架
发表机构 * Zhejiang University(浙江大学) ; Nanyang Technological University(南洋理工大学) ; Finvolution Group(信也科技集团)
AI总结 提出HyGRAG分层图RAG框架,通过构建融合上下文与关系的摘要、跨层级检索及动态更新,将多跳推理准确率提升9.7%。
Comments Accepted at The ACM Web Conference 2026 (WWW '26)
Volterra生成模型
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
AI总结 提出Volterra生成模型,通过分数阶核引入路径依赖噪声,利用马尔可夫提升和残差状态学习,解决非马尔可夫动力学下的扩散生成问题,在MNIST和CIFAR-10上验证有效性。
Comments 36 pages
基于Agentic AI的框架:缓解医疗应用中的过早诊断交接和无声幻觉
发表机构 * Distributed Systems (qCLOUDS) Lab, School of Computing ; Information Systems, The University of Melbourne, Australia ; 2Department of Computer Science ; Engineering, School of Electrical ; Computer Sciences (SECS), Indian Institute of Technology Bhubaneswar, India ; 3Department of Computer Science Banaras Hindu University, Varanasi, India
AI总结 提出多智能体框架,通过确定性编排约束和两个安全机制(神经符号状态跟踪门和语义熵不确定性量化门)解决LLM在医疗对话中的过早诊断交接和无声幻觉问题,诊断精度提升11.3个百分点。
NoiseTilt: 噪声倾斜反向核用于扩散奖励对齐
发表机构 * KAIST(韩国科学技术院) ; The University of Tokyo(东京大学)
AI总结 提出噪声倾斜反向核(NTRK),通过将奖励梯度注入噪声项实现奖励引导采样,保持预训练反向核不变,每步仅需单样本,在奖励对齐任务中超越现有方法且不损失样本质量。
Comments 52 pages
当LLM分析疤痕:从图像到临床有意义的特征
发表机构 * Liaoning University of Traditional Chinese Medicine(辽宁中医药大学) ; School of Artificial Intelligence, Jilin University(吉林大学人工智能学院)
AI总结 提出ScaFE框架,利用LLM作为知识驱动的特征工程师,将高维图像转化为低维临床可解释特征,在数据稀缺的疤痕分类中优于端到端深度学习方法。
现实中的安全与隐私提示:用户向LLM提问及LLM如何回应
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; RSAC Labs(RSAC实验室)
AI总结 基于WildChat数据集,分析用户向大语言模型提出的安全与隐私问题,分类并评估模型回答质量与一致性。
PseudoBench: 衡量自主研究如何助长伪科学
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; Xi’an Jiao Tong University(西安交通大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出PseudoBench基准,通过200个伪科学声明-证据对评估AI代理识别和抵制伪科学的能力,发现当前系统极易生成有说服力的伪科学报告,拒绝率接近零。
Comments 26 pages, 21 figures
ConSA: 通过可学习分配实现混合注意力中的可控稀疏性
发表机构 * Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络空间安全学院) ; Baidu Inc.(百度公司)
AI总结 提出ConSA框架,通过L0正则化和增广拉格朗日约束学习全注意与滑动窗口注意的最优分配,实现用户指定的稀疏目标,在0.6B和1.7B规模LLM上优于规则基线,并发现底层SWA与中层FA的集中分配模式。
一种用于部分观测下抓取合成的混合优化框架
发表机构 * School of Computer Science, The University of Sydney(悉尼大学计算机科学学院) ; Data61, CSIRO(澳大利亚联邦科学与工业研究组织Data61) ; NVIDIA(英伟达)
AI总结 提出结合基于学习的能量模型与解析迭代最近点方法的混合框架,从部分观测点云生成鲁棒抓取,在67个物体5360次抓取尝试中平均成功率达60.9%,优于现有方法。
面向LLM智能体的组合技能路由:分解、检索与组合
发表机构 * Alibaba Cloud(阿里云)
AI总结 提出SkillWeaver框架,通过迭代技能感知分解(SAD)将复杂查询分解为原子子任务,检索对应技能并组合为可执行计划,在CompSkillBench上验证了分解质量是主要瓶颈,SAD将分解准确率提升32.7%。
ConTex:重新定义时间序列预测的反事实生成
发表机构 * Institute for Technologies and Management of Digital Transformation, University of Wuppertal(伍珀塔尔大学数字转型技术与管理研究所)
AI总结 针对时间序列预测中反事实解释的不一致和高计算成本问题,提出ConTex模型,通过全局一致的干预策略实现单次前向传播生成稀疏反事实,显著降低计算成本并支持实时应用。
Comments 19 pages, 5 figures, 14 tables
基于流的视觉-语言-动作模型的不确定性量化
发表机构 * TU Munich(慕尼黑工业大学) ; ETH Zurich(苏黎世联邦理工学院) ; MPI IS Tübingen(马克斯·普朗克智能系统研究所)
AI总结 提出利用速度场差异(VFD)量化流匹配模型中的认知不确定性,用于故障检测和主动微调,在LIBERO基准上实现高效任务适应。
Comments Project page: this http URL (http://tum-lsy.github.io/uq_vla/). 28 pages, 12 figures
ProvenanceGuard: 基于MCP的LLM智能体的源感知事实性验证
发表机构 * Multiverse Computing ; Parque Cientifico y Tecnológico de Gipuzkoa(吉普斯夸科技园) ; Centre for Social Innovation(社会创新中心) ; Donostia International Physics Center(多诺斯蒂亚国际物理中心) ; Ikerbasque Foundation for Science(伊克尔巴斯克科学基金会)
AI总结 提出ProvenanceGuard,一种源感知验证器,通过追踪MCP工具调用、分解声明并路由到特定源,检测跨源混淆错误,在医疗领域数据集上优于源无关基线。
Comments 20 pages, 4 figures
当英语不是最好的老师:跨语言上下文学习中的源语言效应
发表机构 * Snt, University of Luxembourg(卢森堡大学科学技术系) ; Luxembourg Institute of Science and Technology(卢森堡科学技术研究院)
AI总结 研究跨语言上下文学习(ICL)中源语言选择的影响,发现基于微调的预期在ICL中不成立,提出有效选择源语言的替代启发式方法。
Comments Accepted at 1st Workshop on Multilinguality in the Era of Large Language Models (MeLLM 2026), co-located with ACL 2026
灾难性遗忘是低秩的:持续适应的函数空间理论
发表机构 * Tel Aviv University(特拉维夫大学)
AI总结 本文在神经正切核(NTK)框架下提出函数空间理论,推导出新任务训练导致旧任务预测漂移的闭式表达式,揭示遗忘集中在少量旧任务NTK本征模式上,并给出低秩特性与Kronecker缩放规则。
Comments Accepted to the ICML 2026 Workshop on Continual Adaptation at Scale: Towards Sustainable AI
LoopCoder-v2: 仅循环一次以实现高效的测试时计算扩展
发表机构 * Beihang University(北京航空航天大学) ; IQuest Research ; Langboat(浪波) ; Renmin University of China(中国人民大学)
AI总结 本文提出并行循环Transformer(PLT)并研究循环次数选择,发现两循环变体在代码生成等任务上显著提升,而三循环以上性能下降,揭示了增益-成本权衡。
掩码扩散模型中的递归缩放
发表机构 * LTS4, EPFL, Lausanne, Switzerland(瑞士洛桑联邦理工学院LTS4实验室) ; University of Cambridge, Cambridge, UK(英国剑桥大学)
AI总结 提出递归掩码扩散模型(R-MDMs),通过在每个扩散步骤中重复应用同一去噪变换器增加递归深度,实现参数高效缩放,在数独和倒计时等结构化生成任务中,以更少参数匹配非递归基线性能。
LegalHalluLens: 类型化幻觉审计与校准的多智能体辩论以实现可信赖的法律AI
发表机构 * Independent Researcher, Sunnyvale, CA, USA(独立研究者,美国加州太阳谷) ; Independent Researcher, San Diego, CA, USA(独立研究者,美国加州圣地亚哥)
AI总结 针对法律AI中聚合指标掩盖的错误集中性和方向性问题,提出LegalHalluLens审计框架,通过类型化幻觉画像、风险方向指数(RDI)和校准辩论管道,将幻觉检测减少45%,并揭示聚合指标隐藏的失败模式。
Comments 15 pages, 5 figures; Published at the Second Workshop on Agents in the Wild: Safety, Security, and Beyond (AIWILD) at ICML 2026
PhaseWin:一种用于忠实视觉归因的高效搜索算法
发表机构 * Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络空间安全学院) ; Shanghai Center for Mathematical Sciences, Fudan University(复旦大学上海数学中心) ; College of Electronic Science and Technology, National University of Defense Technology(国防科技大学电子科学学院) ; School of Cyber Science and Technology, Shenzhen Campus of Sun Yat-sen University(中山大学深圳校区网络空间安全学院)
AI总结 提出PhaseWin算法,通过分阶段窗口搜索将视觉归因的计算复杂度从O(n²)降至O(n),在保持接近贪心算法忠实度的同时大幅减少模型评估次数。
Comments 26 pages, 29 figures
C2FL:空间和时间漂移下的聚类持续联邦学习
发表机构 * University of Bologna(博洛尼亚大学) ; Aarhus University(哥本哈根大学)
AI总结 针对空间异质性和时间漂移下节点隐私保护的集体自适应问题,提出C2FL方法,通过空间聚类自组织学习组,结合经验回放和停留时间感知自适应平均,实现鲁棒集体适应。
半条链接足以预测整条链接:理解知识图谱基础模型中的泛化
发表机构 * Institute for AI, University of Stuttgart(斯图加特大学人工智能研究所) ; University of Southampton(南安普顿大学) ; University of Edinburgh(爱丁堡大学)
AI总结 本文通过分析知识图谱基础模型在未见图上的零样本泛化,发现模型利用部分可见的“半链接”进行预测,并基于此提出四类场景的分类法,揭示现有模型的泛化机制与改进方向。
AIGS-Net: 基于2D高斯泼溅的紧凑光照场建模用于快速低光图像增强
发表机构 * College of Mechanical and Vehicle Engineering, Chongqing University(重庆大学机械与车辆工程学院) ; Department of Electrical and Computer Engineering, Carnegie Mellon University(卡内基梅隆大学电气与计算机工程系) ; Herbert Wertheim College of Engineering, University of Florida(佛罗里达大学赫伯特·韦特海姆工程学院) ; School of Mathematics and Statistics, Qingdao University(青岛大学数学与统计学院) ; National Innovation Center of Intelligent and Connected Vehicles(国家智能网联汽车创新中心) ; School of Vehicle and Mobility, Tsinghua University(清华大学车辆与运载学院)
AI总结 提出AIGS-Net,通过输入自适应的2D高斯泼溅光照场和零参数多尺度上下文编码,以约40个可学习参数实现低光图像增强,在LOL和LSRW基准上平衡了增强质量与推理效率。
多重周期性与通道相关的小波分解在长期时间序列预测中的应用
发表机构 * School of Computer Science and Engineering, Central South University(中南大学计算机科学与工程学院)
AI总结 提出McWC模型,通过多层周期性构建、多层感知机提取通道相关性、多级小波分解融合高低频信息,并在频域解耦通道内自相关,实现高效准确的长期预测。