Causal Interventions on Continuous Variables: A Case Study on Verb Bias in Steering Vectors for In-Context Learning
连续变量的因果干预:以上下文学习中转向向量的动词偏向为例
AI总结 提出一种对连续变量进行因果干预的方法,通过定位低维方向并编辑向量实现反事实目标值,应用于动词偏向特征,证明其在语言模型中的因果表示,并探讨与上下文学习的关系。
连续变量的因果干预:以上下文学习中转向向量的动词偏向为例
AI总结 提出一种对连续变量进行因果干预的方法,通过定位低维方向并编辑向量实现反事实目标值,应用于动词偏向特征,证明其在语言模型中的因果表示,并探讨与上下文学习的关系。
Compass: 通过专家引导的LLM代理导航全球海洋铅数据整合
AI总结 针对海洋铅数据分散于非结构化论文中的问题,提出专家引导的LLM代理框架Compass,结合知识树分解任务,从23万篇论文中提取3751条铅记录,构建最大海洋铅数据库,准确率达92%。
线性时态回答集编程的元编程
AI总结 提出一种统一的元编程框架,通过扩展clingo的理论语法并引入转换管道保护嵌套模态,实现了对多种线性时态逻辑(TEL、MEL、DEL)的语义操作化,并开发了metasp系统。
大规模形式化数学
AI总结 提出多智能体系统AutoformBot,利用LLM和形式化验证工具,自动将非正式教材翻译为Lean 4可验证代码,构建了包含超过45,000个声明和50万行代码的Atlas形式化库。
SwInception -- 局部注意力与卷积的结合
AI总结 提出SwInception架构,通过在Swin Transformer的前馈层引入Inception块增强归纳偏置,并改进解码器以更少参数捕捉细节,在多个医学数据集上提升分割性能。
Comments International Conference on Pattern Recognition and Artificial Intelligence, 2024
网格感知的对极匹配用于篮球多视角多人3D姿态估计
AI总结 提出一种无训练框架MAEM,通过单目3D人体网格恢复模型和两阶段对极匹配策略,解决团队运动场景中多视角多人3D姿态估计的遮挡和外观相似问题。
从短历史到长未来:面向长时域预测的视界感知图神经网络
AI总结 提出一种多视界图神经网络模拟器,通过共享图骨干网络和增量预测策略,联合优化多步超前预测,实现长时域稳定且准确的地球物理系统模拟。
Comments Accepted for International Conference on Pattern Recognition (ICPR) 2026
MuPHI: 通过语义基础奖励优化学习隐式多模态有害推理
AI总结 针对视觉语言模型在隐式跨模态有害语义推理上的不足,提出MuPHI数据集和MuPHIRM训练框架,通过多视角奖励优化联合语义学习,提升有害检测与推理质量及分布外鲁棒性。
使大语言模型通过反馈从流式经验中学习合成
AI总结 提出StreamSynth设置和SynLearner框架,使模型通过任务流积累经验并利用反馈提升合成数据生成性能。
Fisher保持引导:用于安全扩散控制的免训练流形约束
AI总结 提出一种免训练的Fisher保持引导方法,通过低秩雅可比分解计算Fisher保持更新,并利用截断Fisher去噪敏感性作为不确定性信号,在视觉导航中实现可靠且高效的轨迹预测。
Comments ICML2026
CityGen: 结构引导的城市风格合成用于跨城市自动驾驶
AI总结 提出CityGen,一种基于扩散模型的生成框架,通过高清地图条件和城市级视觉提示实现零标签城市适应,提升跨城市自动驾驶在感知、分割和规划任务上的鲁棒性。
CLUBench:一个聚类基准测试
AI总结 本文提出CLUBench,一个包含24种算法在131个数据集上的综合聚类基准,通过大规模实验分析超参数调优、数据类型、预训练嵌入、大语言模型聚类等,揭示传统算法仍具竞争力,并结合预训练嵌入可提升效率。
治疗条件扩散用于预测神经退行性疾病进展
AI总结 提出一种治疗条件扩散框架,通过条件化生成过程于患者的筛查DaTscan图像和一年内左旋多巴等效日剂量,预测高保真未来脑状态,在临床保真度上显著优于基线。
Comments 9 pages, 5 figures, 1 table
一切都关乎速度:AI对音乐制作工作流程的影响
AI总结 通过民族志研究,探讨AI和自动化工具如何影响音乐制作工作流程,重点关注录音工程师、混音师和制作人的使用体验与态度,并分析速度、可控性与创造性自主权之间的张力及其缓解方法。
Comments Audio Engineering Society Conference Paper - Presented at the AES International Conference on Machine Learning and Artificial Intelligence for Audio 2025 - September 8-10, London, UK
计划方式重要吗?LLM网络代理计划表示的实证研究
AI总结 本研究提出PlanAhead框架,通过自动难度分类和四种计划表示(顺序子目标、叙述、伪代码、检查清单)的对比实验,发现计划表示形式和生成计划的LLM显著影响网络代理的鲁棒性和任务成功率。
Comments Extended version of paper submitted to EMNLP, waiting for acceptance
一种融合序列、图和3D特征的三模态对比学习框架用于药物-靶标相互作用预测
AI总结 提出TriMod-DTI框架,通过融合药物和蛋白质的1D序列、2D图和3D结构,并采用三模态对比学习策略对齐潜在空间表示,从而提升药物-靶标相互作用预测性能。
Comments 12 pages, 5 figures, ISBRA 2026
论博弈及其求解器的几何结构
AI总结 提出一种结构感知的求解器合成框架,通过学习连续求解器对齐的博弈几何表示,实现自适应均衡计算并揭示求解器行为的连续区域。
通过逐像素生成图像插值减少空间推进薄膜冷却分析中的实验测试
AI总结 提出一种基于轻量级前馈神经网络和位置编码的机器学习方法,从稀疏实验测量中进行图像回归,以减少推进系统薄膜冷却研究中的物理测试需求。
Comments Presented at the 11th European Conference for Aeronautics and Aerospace Sciences (EUCASS), 2025, DOI: 10.13009/EUCASS2025-285
OVA-IB:用于多模态对齐的一对多信息瓶颈
AI总结 提出基于信息瓶颈的一对多对齐框架OVA-IB,通过充分性对比下界和最小性正则化实现任意数量模态的对齐,在分类、回归和跨模态检索任务中表现鲁棒。
ExCAM:可解释的文化意识度量
AI总结 提出ExCAM,首个可识别、评分并解释指令-输出对中文化错误的专用评估度量,在平衡测试集上达到80%准确率。
Comments preprint
训练智能体而非专家:学习利用异构专家进行多轮视觉推理
AI总结 提出VisHarness,一种可训练的视觉智能体,通过解耦高层感知推理与低层任务执行,学习利用异构视觉专家模型,以轻量训练实现多轮交互下的通用视觉任务求解。
冗余还是必要?检测智能体轨迹中冗余步骤的基准
AI总结 针对LLM智能体轨迹中的冗余步骤检测问题,提出RedundancyBench基准,包含标注轨迹的数据集,并评估三种方法,发现最佳方法仅达到24.88%的检测分数。
DVSM: 正确的仅解码器视图合成模型
AI总结 提出仅解码器架构DVSM,通过隐式KV-cache表示场景,在相同渲染复杂度下以更少参数超越编码器-解码器变体,并利用共享权重、基础模型先验和分阶段块大小优化效率与质量,在多个基准上实现新视点合成的最优结果。
Comments Code at https://github.com/NVLabs/dvsm
内部表示,而非临床知识:明显的大语言模型分诊失败源于何处
AI总结 本研究通过稀疏自编码器特征分析,发现大语言模型在分诊任务中表现不佳源于输出格式限制,而非临床知识表示缺陷。
Comments 9 pages main text, 27 pages total including appendices; 7 figures, 25 tables
LaRA: 面向RL后训练中数据污染的逐层表示分析
AI总结 提出LaRA框架,通过逐层表示分析检测强化学习后训练中的污染数据,利用扰动敏感性、方向坍缩和局部表示刚性三个指标,优于现有输出级方法。
Comments Work in Progress
CRITIC-R1: 学习结构化评论用于检索增强生成
AI总结 提出CRITIC-R1框架,通过强化学习将RAG评论建模为结构化错误诊断问题,设计保守判断对齐和诊断质量对齐奖励函数,提升检索增强生成的答案质量。
Comments 17 pages,13 figures
开放问题:通过凯莱表完成分离几何压缩与算法压缩
AI总结 提出凯莱表完成作为测试缺失的算法复杂度最小化归纳偏置的规范问题,并挑战社区将连续平坦性先验推广以自主发现离散算法公理。
Comments 6 pages. Submitted to the Conference on Learning Theory (COLT) 2026 Open Problem track
通过屏障调控自适应闭式引导缓解视觉语言模型中的幻觉
AI总结 提出BRACS框架,通过监测视觉注意力并仅在接地退化时进行闭式修正,无需训练即可有效减少LVLM中的物体幻觉。
Moment-KV: 基于动量的解码时KV缓存压缩用于长文本生成
AI总结 提出Moment-KV方法,利用动量驱动的时序注意力聚合在解码阶段压缩KV缓存,以提升长文本生成质量并保持解码延迟。
LLM引导的未来假设用于多步机器人操作中的视野感知探索
AI总结 提出未来经验条件化(FEC)框架,利用LLM生成短期未来视频作为结构化先验,结合行为克隆和强化学习微调,提升多步机器人操作中的探索和策略适应能力。