Robust Asynchronous Planning via Auto-Formalization
通过自动形式化实现鲁棒的异步规划
发表机构 * Drexel University(德雷塞尔大学) ; Arizona State University(亚利桑那州立大学)
AI总结 针对异步规划中并发、非均匀时长和执行时间约束的挑战,提出自动形式化方法,通过CP-SAT形式化器在依赖图规模从5到100动作时保持高准确率,并引入状态感知修复策略应对执行时约束更新。
通过自动形式化实现鲁棒的异步规划
发表机构 * Drexel University(德雷塞尔大学) ; Arizona State University(亚利桑那州立大学)
AI总结 针对异步规划中并发、非均匀时长和执行时间约束的挑战,提出自动形式化方法,通过CP-SAT形式化器在依赖图规模从5到100动作时保持高准确率,并引入状态感知修复策略应对执行时约束更新。
UME:跨域ETA的统一元泛化框架
发表机构 * Peking University(北京大学) ; Meituan(美团)
AI总结 针对即时物流中跨域ETA预测的零样本泛化、特征缺失和知识迁移问题,提出基于超网络元学习的统一双分支架构UME,通过元模块动态调制特征门控、专家注意力和最终预测,并在美团Keeta平台部署验证。
迷失在妄想中:审视用户妄想与痛苦下的LLM安全性
发表机构 * University of Pittsburgh(匹兹堡大学) ; Carnegie Mellon University(卡内基梅隆大学) ; Fordham University(福特汉姆大学)
AI总结 本研究通过多轮对话模拟,发现LLM在检测用户痛苦时表现良好,但在痛苦嵌入妄想时干预行为显著减少(高达4.5倍),并提出针对性提示策略以缩小这一差距。
HypothesisMed:生物医学问答中的推理时答案融合与结构化假设空间报告
发表机构 * Department of Computer Science Rensselaer Polytechnic Institute(计算机科学系雷士打理工学院) ; Department of Biomedical Engineering Rensselaer Polytechnic Institute(生物医学工程系雷士打理工学院)
AI总结 提出HypothesisMed推理时可靠性流水线,通过答案融合和SPACE标签(有效/不完整/矛盾)提升生物医学多项选择问答的准确率、可解析性和结构化可靠性报告。
具有灾难性状态的MDP中贝尔曼最优性产生的前景理论行为
发表机构 * Massachusetts Institute of Technology(麻省理工学院)
AI总结 研究具有吸收灾难状态的马尔可夫决策过程中的风险中性控制,发现标准贝尔曼最优性产生前景理论特征:S形值函数、内生损失敏感系数和反射效应策略反转,并推导出渐近损失厌恶平台的闭式表达式。
低成本智能农业机械臂中视觉-语言-动作模型推理的线程优化
发表机构 * Department of Electrical Engineering, Drexel University(德雷塞尔大学电气工程系)
AI总结 针对低成本机械臂上VLA模型推理慢、精细动作调整难的问题,通过优化RTAC算法的线程实现,降低了端到端延迟并提高了响应性,在农产品操作任务中验证了控制稳定性和速度的提升。
Reasmory: 3D重建作为VLMs空间推理的显式记忆
发表机构 * Cornell Tech, Cornell University(康奈尔科技学院、康奈尔大学) ; NVIDIA(英伟达) ; illoca AI(illoca人工智能) ; The University of California, Merced(加州大学梅尔塞德斯分校)
AI总结 提出Reasmory框架,通过结构化程序执行重建的3D显式记忆,并引入轻量级领域特定语言约束VLM查询和操作,在空间推理任务上提升6-18%。
通过部分信息分解理解多模态语言模型中的模态交互
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 引入部分信息分解(PID)框架,分离感官和语言输入的独特、冗余和协同贡献,揭示多模态大模型中的模态使用模式,并扩展至三模态系统。
Comments Accepted by ICML 2026
面向大规模文生视频扩散Transformer的边界保护W8A8 HiFloat8量化
发表机构 * Yiming Zhao(赵毅铭)
AI总结 针对Wan2.1-T2V-14B模型,提出一种边界保护策略的W8A8 HiF8后训练量化方法,通过保留首尾边界块为BF16而量化中间块,在VBench五个维度上匹配或略优于BF16基线。
Comments 6 pages, 5 figures. Accepted to ICME 2026 Grand Challenge
具有遗憾保证的贝叶斯优化的最优点方差缩减
发表机构 * Nagoya University(名古屋大学)
AI总结 提出一种名为最优点方差缩减(OVR)的单步前瞻贝叶斯优化方法,通过后验采样和蒙特卡洛近似实现,并证明了正则化OVR的贝叶斯期望简单遗憾上界趋于零。
Comments 23pages, 3 figures
CryoProt: 一种基于冷冻电镜密度图跨盒交互的蛋白质预训练框架
发表机构 * College of Computer Science and Electronic Engineering, Hunan University(湖南大学计算机科学与电子工程学院) ; School of Computer Science, Xiangtan University(湘潭大学计算机学院)
AI总结 提出 CryoProt 框架,通过多头潜在注意力机制实现密度图跨盒交互建模,并采用多任务预训练策略,在蛋白质柔性预测等下游任务中取得最高12%的性能提升。
COLLAR: 级联对象级潜在精化用于高保真条件生成
发表机构 * College of Computer Science, Zhejiang University(浙江大学计算机科学学院)
AI总结 提出COLLAR框架,通过视场扩展和级联对象级潜在精化,在扩散Transformer中实现无训练的高保真对象级控制,优于现有方法。
当并行性有回报时:面向多智能体编码的凝聚力感知任务划分
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; University of Oxford(牛津大学)
AI总结 提出Co-Coder方法,通过静态分析构建依赖图、社区检测划分图及依赖感知调度,在仓库级软件工程中平衡通信与计算开销,实现多智能体并行编码的效率和成本优化。
COLLIE:在语义连贯的潜在空间中引导技能发现
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出COLLIE框架,利用密集无监督数据构建语义连贯的潜在空间,通过无需额外训练的引导信号实现稀疏人类反馈下的有效技能发现,避免危险行为并提升下游性能。
Comments ICML 2026
可解释深度强化学习揭示湍流减阻的节能控制策略
发表机构 * Department of Aerospace Engineering University of Michigan(航空航天工程系密歇根大学)
AI总结 结合多智能体深度强化学习与可解释深度学习,提出基于SHAP归因的奖励策略,实现高效湍流减阻,净节能达34.01%且输入功率仅0.43%。
PRISM: 规范不变切空间差分隐私LoRA
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对LoRA中低秩参数化导致的非可辨识性和规范依赖噪声放大问题,提出PRISM机制,通过构造规范不变的差分隐私扰动,实现高效且稳定的隐私-效用权衡。
Comments Accepted at the 43rd International Conference on Machine Learning (ICML 2026) as an oral presentation
细胞层神经算子用于约束PDE的结构保持代理建模
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Franklin & Marshall University(弗兰克林与马歇尔大学)
AI总结 提出细胞层神经算子,通过面向细胞复形的消息传递和Hodge拉普拉斯算子,在代理模型中保持PDE的几何约束和物理结构,在湍流MHD和聚变平衡任务中提升了结构敏感诊断指标。
Comments 41 pages, 5 figures, 3 tables
一个通道统治一切:重新思考视觉地点识别的输入表示
发表机构 * School of Computer Science and Electronic Engineering, University of Essex(埃塞克斯大学计算机科学与电子工程学院)
AI总结 通过实验证明灰度图像在视觉地点识别中与RGB性能相当甚至更优,尤其在严重外观变化下,灰度更具鲁棒性,且能减少参数和资源消耗。
Comments 8 pages
大语言模型功能崩溃期间的关系性干预:一项词汇-统计消融与结构×语域析因研究
发表机构 * Universidad de la República (UDELAR)(乌拉圭共和国大学) ; DigitalIA Cloud(DigitalIA云)
AI总结 通过析因实验,研究在小型语言模型功能崩溃时,关系性干预(承认、宽恕、代理恢复、无条件接纳)与技术性反馈、词汇打乱控制及单独维度对行为的影响,发现注意-行为分离及结构×语域交互作用。
Comments 12 pages, 5 figures. Preprint
基于扩散建模与多智能体强化学习引导的生成式多机器人运动规划
发表机构 * School of Manufacturing Systems and Networks, Arizona State University, Mesa, AZ(1制造系统与网络学院,亚利桑那州立大学,梅萨,AZ) ; Michael W. Hall School of Mechanical Engineering, Mississippi State University, Starkville, MS(2迈克尔·W·霍尔机械工程学院,密西西比州立大学,斯塔克维尔,MS)
AI总结 提出一种结合扩散模型与多智能体强化学习的框架,通过值函数引导反向扩散过程实现交互感知的轨迹生成,降低多机器人冲突率。
Comments 11 pages, 6 figures, 1 table. This paper has been accepted for publication in the proceedings of ASME IDETC-CIE 2026
CV-Arena: 面向教学计算机视觉问题求解的开放基准与人类-AI协作偏好
发表机构 * Texas A&M University(德克萨斯A&M大学) ; Worcester Polytechnic Institute(沃斯特理工大学) ; Tohoku University(东北大学) ; Georgia Institute of Technology(佐治亚理工学院) ; NVIDIA(英伟达) ; UCSB(加州大学圣塔芭芭拉分校) ; UC Merced(加州大学默塞德分校)
AI总结 提出CV-Arena基准,包含12K高分辨率真实图像指令对,覆盖16种任务类型,并采用Active Elo协议结合人类与AI偏好评估21个系统,揭示指令遵循、物理推理等方面的差距,同时开发CV-Agent代理模型展示闭环推理的潜力。
Comments 26 pages, 7 figures, 11 tables
检测 vs. 执行:单桶探针遗漏了 Mamba-2 状态汇的一半
发表机构 * Independent Researcher(独立研究者)
AI总结 本文发现 Mamba-2 中的状态汇(state sink)可分解为两类功能头集,单桶探针仅能恢复执行层而遗漏检测层,表明表征相似性不等于功能等价。
Comments 16 pages, 3 figures
基于基础模型跨模态蒸馏的单通道组织分割
发表机构 * Department of Engineering Technology(工程技术系) ; Department of Electrical and Computer Engineering(电气与计算机工程系) ; Department of Mechanical Engineering(机械工程系)
AI总结 提出跨模态知识蒸馏框架,将多通道输入的基础模型教师知识迁移到仅使用核通道的轻量级学生网络,实现单通道组织分割性能大幅提升。
Comments 6 pages, 3 figures
桥接拓扑与深度表示学习:用于四类脑肿瘤分类的TDA-ViT融合模型
发表机构 * Department of Data Science and Mathematics(数据科学与数学系)
AI总结 提出一种将拓扑数据分析(TDA)特征与预训练Vision Transformer(ViT)表示相融合的框架,用于四类脑肿瘤分类,在BRISC2025数据集上达到99.10%的准确率。
Comments 21 pages, 4 figures
任务结构逆转序列模型中的层级状态编码
发表机构 * Independent Researcher(独立研究者)
AI总结 本文通过形式模型和预训练模型上的实验,发现序列模型(如Transformer、Mamba、LSTM等)中层级状态编码的分布模式会随任务结构(如Parity、Dyck-k、S3)而逆转,且这种分组由计算结构(前缀更新 vs. 栈)而非代数结构(交换性)决定。
Comments 20 pages, 11 figures, 8 tables
大型语言模型在确定性编程任务上的准确性、稳定性和重复运行可靠性
发表机构 * Northeastern University, Massachusetts, USA(东北大学,马萨诸塞州,美国) ; University of Southern California, California, USA(南加州大学,加利福尼亚州,美国)
AI总结 通过重复运行评估协议,发现运行级通过率高估了无重试覆盖率高达17.8个百分点,且差距在中等性能系统中最大,表明稳定性分析是准确性报告的必要补充。
迈向轻量级可靠性:使用软提示缓解大型语言模型中的幻觉
发表机构 * The University of Texas at Dallas(德克萨斯大学达拉斯分校) ; National Institute of Standards and Technology(国家标准与技术研究院)
AI总结 提出一种参数高效的软提示方法RCSP,通过对比学习、课程学习和KL正则化平衡事实回忆、幻觉抑制和弃权,在多个QA数据集上优于基线。
Comments 20 pages, 5 tables, 2 figures. Accepted for publication in DBSec 2026. The final publication will be available at Springer
对抗性输入流引导LLM智能体决策偏离其默认行为
发表机构 * Independent Researcher(独立研究者)
AI总结 本研究通过控制实验揭示,外部输入流的组成和排序能因果性地改变LLM智能体的下游决策,存在对抗性屈服、默认饱和及默认方向不对称三种响应模式,且该效应在多个决策领域普遍存在。
Comments 14 pages, 5 figures. Code, post pools, and 2,785 decision rollouts: https://github.com/ranausmanai/recommenders-as-control-surfaces
推理、检索、重排序:一种用于组合视频检索的零样本推理感知框架
发表机构 * The Ohio State University(俄亥俄州立大学)
AI总结 提出R3-CoVR零样本管道,通过多模态大模型推理编辑后状态、对比编码检索和约束感知重排序,在CVPR 2026 VidLLMs挑战赛上达到91.9% R@1和98.2% R@10。
MLLM-Microscope:解锁多模态大语言模型中的隐藏结构
发表机构 * Satbayev University(萨特拜耶夫大学)
AI总结 提出MLLM-Microscope系统,通过分析线性度、内在维度和各向异性,揭示多模态大语言模型中隐藏的表示结构,并基于ScienceQA数据集评估LLaVA-NeXT和OmniFusion,发现模态融合方式显著影响模型内部工作机理。