UI2Code^N: UI-to-Code Generation as Interactive Visual Optimization
UI2Code^N: 将UI到代码生成视为交互式视觉优化
发表机构 * Zhejiang University(浙江大学)
AI总结 提出将UI截图转代码任务重构为交互式视觉优化问题,采用基于偏好的强化学习方法RVPO优化视觉排名,在UI起草、润色和编辑任务上达到SOTA。
Comments 27 pages
UI2Code^N: 将UI到代码生成视为交互式视觉优化
发表机构 * Zhejiang University(浙江大学)
AI总结 提出将UI截图转代码任务重构为交互式视觉优化问题,采用基于偏好的强化学习方法RVPO优化视觉排名,在UI起草、润色和编辑任务上达到SOTA。
Comments 27 pages
基于相位的多步态学习用于蝾螈机器人
发表机构 * Nankai University(南开大学)
AI总结 提出一种基于相位的无参考运动学习框架,通过相位变量和相位覆盖奖励,结合形态对称数据增强,使蝾螈机器人自主习得22种动态对称步态。
基于人类演示的计算机使用智能体基础构建
发表机构 * Mila - Quebec AI Institute(魁北克AI研究所) ; McGill University(麦吉尔大学) ; Université de Montréal(蒙特利尔大学) ; ServiceNow Research(ServiceNow研究) ; University of Waterloo(滑铁卢大学) ; University of Oxford(牛津大学) ; National University of Singapore(新加坡国立大学) ; Polytechnique Montréal(蒙特利尔理工学院) ; École de Technologie Supérieure(高级技术学院) ; CIFAR AI Chair(CIFAR人工智能主席)
AI总结 为解决桌面环境高质量基础数据稀缺问题,构建了包含87个应用、56K截图和3.56M人工标注的GroundCUA数据集,并基于此训练GroundNext模型,在5个基准上以少于先前十分之一的数据取得最优结果。
Comments Accepted at ICLR 2026
时间序列中基于大语言模型的推理与智能体系统综述
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; University of Southern California(南加州大学) ; National Yang Ming Chiao Tung University(阳明交通大学)
AI总结 本文定义时间序列推理问题,按推理拓扑分为直接、线性链和分支结构三类,结合传统分析、解释、因果推断和生成等目标,综述方法、系统、数据集和评估实践,并指导拓扑选择与部署权衡。
Comments Accepted to Transactions on Machine Learning Research (TMLR)
面向跨域计数的条件特征对齐
发表机构 * Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; School of Electronic Engineering and Information Science, Beijing Institute of Technology(北京理工大学电子工程与信息科学学院)
AI总结 提出条件特征对齐(CFA)框架,通过标签诱导的条件对齐而非全局域不变性,解决跨域计数中密度分布变化问题,在无监督域适应和源域泛化任务上取得显著性能提升。
Comments 12 pages, 6 figures, 4 tables
基于排序的随机奖品收集博弈中的序数响应策略学习
发表机构 * KTH Royal Institute of Technology(皇家理工学院)
AI总结 提出随机奖品收集定向越野博弈(SPCOG),扩展团队定向越野问题至自利代理场景,利用序数排名(OR)作为强归纳偏置,并设计虚拟序数响应学习(FORL)算法实现收敛策略。
超越扩散:层级到层级自回归用于fMRI到图像重建
发表机构 * The State Key Lab of Brain-Machine Intelligence, Zhejiang University, China(脑机智能国家重点实验室,浙江大学,中国) ; ReLER, CCAI, College of Artificial Intelligence, Zhejiang University, China(ReLER、中国人工智能学会、人工智能学院、浙江大学、中国)
AI总结 提出MindHier框架,通过层级fMRI编码器、层级对齐和尺度感知粗到细引导策略,实现从粗到细的fMRI到图像重建,优于扩散方法。
Comments ICLR 2026
RoboGPT-R1: 通过强化学习增强机器人任务规划
发表机构 * Institute of Automation, CASIA(中国科学院自动化研究所) ; School of Artificial Intelligence, UCAS(中国科学技术大学人工智能学院) ; Huawei Cloud Technology Co., Ltd(华为云技术有限公司)
AI总结 提出RoboGPT-R1两阶段微调框架,先监督学习获取基础知识,再通过强化学习提升视觉空间理解和推理能力,在EmbodiedBench上超越GPT-4o-mini 21.33%。
Journal ref Proceedings of the 25th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2026), pp. 2827-2837, IFAAMAS, 2026
GPO:从关键步骤中学习以改进大语言模型推理
发表机构 * Department of Computer Science Northwestern University(计算机科学系西北大学) ; AI Foundations Capital One(人工智能基础资本 one) ; Meta AI
AI总结 提出引导式关键优化(GPO)微调策略,通过识别推理轨迹中的关键步骤并优先学习,显著提升大语言模型的多步推理能力。
Comments 39th Conference on Neural Information Processing Systems (NeurIPS 2025)
物理驱动的时空建模用于AI生成视频检测
发表机构 * South China University of Technology(华南理工大学) ; University of Science and Technology of China(中国科学技术大学) ; Key Laboratory of Big Data and Intelligent Robot, Ministry of Education(教育部大数据与智能机器人重点实验室) ; Pazhou Lab(琶洲实验室) ; University of Melbourne(墨尔本大学) ; Hunan University(湖南大学) ; Hong Kong Baptist University(香港 Baptist大学)
AI总结 提出基于概率流守恒的物理驱动AI生成视频检测范式,通过归一化时空梯度(NSG)统计量捕捉物理异常,结合预训练扩散模型估计NSG,并利用最大均值差异(MMD)进行检测,在Recall和F1-Score上分别提升16.00%和10.75%。
Comments Accepted at NeurIPS 2025 spotlight
SDQM:用于目标检测数据集评估的合成数据质量指标
发表机构 * Northeastern University, Khoury College of Computer Sciences(东北大学,Khoury 计算科学学院) ; Binghamton University, School of Computing(布ingham顿大学,计算科学学院) ; Air Force Research Laboratory, Mission Applications and Infrastructure Section(空军研究实验室,任务应用与基础设施部门)
AI总结 提出SDQM指标,无需模型训练收敛即可评估合成数据质量,与YOLO11的mAP强相关,优于现有指标。
Comments Accepted and Published at SPIE: Journal of Electronic Imaging, Vol. 35, Issue 3
Journal ref Journal of Electronic Imaging 35(3), 033014 (2026)
绕过生产环境中的提示守卫:受控释放提示攻击
发表机构 * UC Berkeley(加州大学伯克利分校) ; zkBricks Inc(zkBricks公司) ; Ethereum Foundation(以太坊基金会) ; NYU Shanghai(纽约大学上海分校)
AI总结 针对AI对齐的提示过滤存在理论上的不可能性,本文提出受控释放提示攻击,利用轻量级输入过滤器与主模型之间的资源不对称性,在实际部署的大语言模型系统中成功绕过提示守卫。
Comments Accepted to USENIX Security 2026
可认证安全RLHF:基于语义基础与固定惩罚约束优化的更安全大语言模型对齐
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系) ; New Jersey Institute of Technology(新泽西理工学院) ; Department of Computer Engineering(计算机工程系) ; Heritage Institute of Technology(遗产理工学院)
AI总结 针对现有RLHF方法依赖奖励/成本函数和双变量调优导致性能敏感且缺乏可证明安全保证的问题,提出CS-RLHF,通过语义基础成本模型和固定惩罚约束优化,实现可认证安全对齐,效率提升至少5倍。
RelayFormer: 一种用于可扩展图像和视频篡改定位的统一局部-全局注意力框架
发表机构 * Tsinghua Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院,清华大学) ; College of Artificial Intelligence, Nankai University(南开大学人工智能学院) ; College of Computer Science and Software Engineering, Shenzhen University(深圳大学计算机科学与软件工程学院) ; Huawei Technologies Co., Ltd(华为技术有限公司)
AI总结 提出RelayFormer统一框架,通过全局局部中继(GLR)令牌和中继注意力机制,适应不同分辨率并统一处理图像与视频,在篡改定位任务中实现高效且性能优越。
具有动作触发观测的强化学习
发表机构 * Department of Statistical Sciences, University of Toronto(统计科学系,多伦多大学;向量研究所) ; Vector Institute
AI总结 提出动作触发稀疏可追踪MDP框架,推导Bellman方程并证明最优策略存在,利用观测间动作序列的线性表示实现基于回归的方法,在几何分布情节下达到与完全可观测线性MDP匹配的遗憾界。
噪声引导的模仿学习传输方法
发表机构 * University of Cambridge(剑桥大学) ; University of Oxford(牛津大学)
AI总结 针对低数据场景下的模仿学习,提出噪声引导传输(NGT)方法,通过对抗训练将模仿问题转化为最优传输问题,无需预训练或特殊架构,在极低数据量下实现强性能。
Comments Accepted at ICML 2026. Code: https://github.com/lionelblonde/ngt
几何度量与大语言模型:它们测量什么以及何时有效
发表机构 * Moscow Institute of Physics and Technology(莫斯科物理技术学院) ; Russian Academy of Sciences(俄罗斯科学院)
AI总结 本文系统测试了用于大语言模型评估的几何度量,发现部分度量主要反映输出长度,而几何度量在文本统计基础上提供有限但真实的信息,并指出故障检测是最有前景的应用。
基于残差模型引导的偏好对齐大型语言模型
发表机构 * DIMES Dept., University of Calabria, Italy(卡利博大学DIMES系)
AI总结 提出PaLRS方法,利用残差流中的偏好信号提取轻量级引导向量,无需训练即可在推理时对齐模型偏好,在数学推理和代码生成任务上取得一致提升,同时节省大量时间。
Comments Accepted at IJCAI 2026
CU-Multi:多机器人协同感知数据集
发表机构 * Autonomous Robotics and Perception Group at the University of Colorado Boulder(科罗拉多大学波尔得分校自主机器人与感知组) ; Robot Perception Lab at Carnegie Mellon University(卡内基梅隆大学机器人感知实验室) ; Aerospace Controls Laboratory at Massachusetts Institute of Technology(麻省理工学院航空航天控制实验室) ; Computer Science and Artificial Intelligence Laboratory at Massachusetts Institute of Technology(麻省理工学院计算机科学与人工智能实验室) ; Human-Aware Robotic Exploration Lab at University of California Santa Cruz(加州大学圣克ruz分校人感知机器人探索实验室)
AI总结 针对多机器人协同感知基准测试缺乏专用数据集的问题,提出CU-Multi数据集,包含多天采集的同步多机器人轨迹、RGB-D、RTK GPS、语义LiDAR及精确里程计,支持可重复评估。
Comments 8 pages, 11 figures. arXiv admin note: text overlap with arXiv:2505.17576
MARIC:用于图像分类的多智能体推理
发表机构 * Enhans, Seoul, South Korea(韩国首尔Enhans) ; Peking University, Beijing, China(中国北京北京大学)
AI总结 提出多智能体框架MARIC,通过分解图像分类为协作推理过程,利用大纲智能体、方面智能体和推理智能体进行多视角分析与综合,在四个基准数据集上显著优于基线方法。
Comments 11 pages, preprint
辅助推理如何释放VLM中的GUI定位能力
发表机构 * Zhejiang Lab(浙江实验室) ; Hangzhou Research and Development Center(杭州研发中心) ; China Mobile(中国移动) ; Innovation Center of Yangtze River Delta(长江三角洲创新中心) ; Zhejiang University(浙江大学)
AI总结 针对VLM在GUI定位任务中隐式空间理解强但显式坐标输出弱的问题,提出三种零样本辅助推理方法(如标记网格),通过输入图像添加空间线索,显著提升定位性能,在多个基准上达到接近最优微调方法的效果。
超越次优性:离线强化学习通过随机解决方案学习有效调度
发表机构 * Eindhoven University of Technology(埃因霍温理工大学)
AI总结 提出离线RL算法CDQAC,从次优静态数据集学习调度策略,在JSP/FJSP上超越在线RL和强启发式方法,仅需1-5%数据,发现状态-动作覆盖比轨迹质量更重要。
OCSVM引导的无监督异常检测表示学习
发表机构 * Univ. Lyon(里昂大学) ; CNRS UMR 5220(国家科学研究中心UMR 5220) ; Inserm U1294(法国国家医学研究院U1294) ; INSA Lyon(里昂国立应用科学学院) ; UCBL(里昂大学) ; CREATIS(里昂大学生物医学图像研究中心)
AI总结 提出一种将表示学习与可解析求解的一类SVM耦合的方法,通过定制损失函数直接对齐潜在特征与决策边界,在MNIST-C和脑MRI病变检测任务上展现了鲁棒性和性能。
跨域音视频欺骗检测基准测试
发表机构 * Rapid-Rich Object Search (ROSE) Lab and the College of Computing and Data Science, Nanyang Technological University (NTU)(快速丰富对象搜索(ROSE)实验室和南洋理工大学计算与数据科学学院) ; School of Computing and Information Technology and Dongguan Key Laboratory for Intelligence and Information Technology, Great Bay University(计算与信息科技学院和东莞智能与信息技术重点实验室,大湾大学) ; DSO National Laboratories(国防科学实验室) ; College of Computing and Data Science, Nanyang Technological University (NTU)(计算与数据科学学院,南洋理工大学) ; SMBU, Shenzhen 518172, China(深圳SMBU,越南河内VinUniversity,和新加坡NTU) ; VinUniversity, Hanoi 100000, Vietnam ; and NTU, Singapore
AI总结 提出首个跨域音视频欺骗检测基准,评估不同场景下的泛化能力,并设计MM-IDGM算法和Attention-Mixer融合方法提升性能。
Comments 17 pages
使用多模态AI代理进行可持续性评估
发表机构 * Paul G. Allen School of Computer Science & Engineering, University of Washington(保罗·G·艾伦计算机科学与工程学院,华盛顿大学) ; Computer Science and Engineering, University of Notre Dame(计算机科学与工程,诺丁汉大学) ; Electrical and Computer Engineering, Northeastern University(电气与计算机工程,东北大学)
AI总结 提出多模态多代理AI系统,模拟生命周期评估专家与利益相关者协作,自动估算电子设备碳足迹,将数据收集时间从数周缩短至一分钟,误差在19%以内。
Comments This article is published in Nature Electronics, and is available online at: https://www.nature.com/articles/s41928-026-01653-w
跨层离散概念发现用于解释语言模型
发表机构 * University of Washington(华盛顿大学)
AI总结 提出跨层向量量化变分自编码器(CLVQ-VAE),通过离散向量量化瓶颈将残差流中的重复特征压缩为紧凑可解释的概念向量,在三个数据集上优于聚类、单层VQ-VAE和稀疏自编码器基线。
持久同调作为涌现结构理论
发表机构 * Department of Computer Science, University at Albany(计算机科学系,阿尔巴尼大学)
AI总结 提出将涌现属性定义为持久非平凡同调类,通过持久条、收缩相似图算子和Hodge分解等工具,统一描述涌现的六个特征,并提供可验证预测。
基于扩散的累积对抗净化方法用于视觉语言模型
发表机构 * KTH Royal Institute of Technology(皇家理工学院) ; Swiss Federal Institute of Technology Lausanne(洛桑联邦理工学院) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; CISPA Helmholtz Center for Information Security(信息安全赫尔姆霍兹中心) ; RISE Research Institutes of Sweden(瑞典RISE研究机构) ; Halmstad University(哈马碧大学)
AI总结 提出DiffCAP,一种基于扩散的对抗净化策略,通过理论证明对抗效应随扩散单调衰减,并利用噪声注入与VLM嵌入相似度阈值自适应净化,显著提升防御效果并加速去噪。
Comments Accepted to Transactions on Machine Learning Research (TMLR 2026)
MLaGA: 多模态大语言与图助手
发表机构 * New York University(纽约大学) ; New York University Shanghai(纽约大学上海) ; New York University Brooklyn(纽约大学布鲁克林) ; Virginia Polytechnic Institute and State University(弗吉尼亚理工大学) ; New York University Abu Dhabi(纽约大学阿布扎克)
AI总结 提出MLaGA模型,通过结构感知多模态编码器和指令微调,将大语言模型扩展到多模态图数据,在监督和迁移学习任务中优于基线方法。
通过有界自适应裁剪减轻差分隐私学习中的差异影响
发表机构 * Department of Computer Science, University of Helsinki(计算机科学系,赫尔辛基大学) ; Department of Electrical and Computer Engineering, American University of Beirut(电气与计算机工程系,贝鲁特美国大学)
AI总结 针对差分隐私学习中梯度裁剪对少数群体造成的不公平影响,提出有界自适应裁剪方法,通过引入可调下界防止过度梯度抑制,在Skewed和Fashion MNIST上最差类准确率提升超过10个百分点。
Comments TMLR camera-ready version