T2T-LA: A Topology-to-Topology LLM Agent for Graph Learning with Neither Feature Access nor Task Knowledge
T2T-LA:一种用于图学习的拓扑到拓扑LLM代理,无需特征访问或任务知识
发表机构 * MTU(MTU大学)
AI总结 本文提出T2T-LA,一种无需特征访问或任务知识的拓扑到拓扑LLM代理,通过学习失败拓扑与评分之间的关系,实现图学习中的拓扑推理。
T2T-LA:一种用于图学习的拓扑到拓扑LLM代理,无需特征访问或任务知识
发表机构 * MTU(MTU大学)
AI总结 本文提出T2T-LA,一种无需特征访问或任务知识的拓扑到拓扑LLM代理,通过学习失败拓扑与评分之间的关系,实现图学习中的拓扑推理。
深度强化学习与模仿学习入门
发表机构 * ISCTE – University Institute of Lisbon(里斯本大学理工学院)
AI总结 本文介绍深度强化学习和深度模仿学习在具身智能体中的应用,涵盖马尔可夫决策过程、REINFORCE和PPO等核心算法,以及行为克隆、DAgger和GAIL等基础方法。
图正则化稀疏自编码器用于LLM安全引导
发表机构 * ELLIS Institute Tübingen(图宾根ELLIS研究所) ; Max Planck Institute for Intelligent Systems(智能系统马克斯·普朗克研究所) ; Intesa Sanpaolo(Intesa Sanpaolo公司) ; University of Southern California(南加州大学)
AI总结 本文提出图正则化稀疏自编码器,通过在神经元共激活图上平滑解码器向量并应用方向库,提升安全引导效果,在多个基准测试中显著提高有害请求拒绝率。
CryptoBench: 一种动态基准,用于评估LLM代理在加密货币领域的专家级能力
发表机构 * Princeton University(普林斯顿大学) ; Zenith Lab(Zenith实验室) ; University of California, Los Angeles(加州大学洛杉矶分校) ; University of California, Berkeley(加州大学伯克利分校) ; University of Michigan(密歇根大学)
AI总结 本文提出CryptoBench,首个专家 curated 的动态基准,用于严格评估LLM在加密货币领域的真实能力。通过50题/月的动态任务,细分子类评估数据获取与预测能力,揭示LLM在检索与预测上的不平衡问题。
适应性符合预测用于量子机器学习
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; Department of Computer Science, The University of Manchester(曼彻斯特大学计算机科学系)
AI总结 本文提出适应性量子符合预测算法,解决量子处理器时间变化噪声对符合保证的影响,通过重复校准保持有效性,实验证明其在IBM量子处理器上的稳定性和覆盖率。
Comments Accepted at TMLR 05/2026. 27 pages, 5 figures
Journal ref Transactions on Machine Learning Research, May 2026, ISSN 2835-8856
DGS-Net:基于知识蒸馏的梯度手术用于AI生成图像检测中的CLIP微调
发表机构 * School of Computer Science, Nanjing University of Information Science(南京信息工程大学计算机学院) ; University of Macau(澳门大学)
AI总结 本文提出DGS-Net,通过梯度空间分解分离有害和有益的下降方向,提升CLIP在AI生成图像检测中的微调效果,实验表明其在检测性能和泛化能力上优于现有方法。
Comments Accepted by ICML 2026 Spotlight
前沿大语言模型与最先进的规划器相媲美
发表机构 * University of Oxford(牛津大学) ; Federal University of Rio Grande do Sul(里约格兰德杜斯尔大学) ; Linköping University(林霍普大学)
AI总结 研究显示前沿大语言模型在规划任务中超越传统规划器, Gemini 3.1 Pro在标准任务中表现突出,GPT-5表现接近基线,且在符号规划中仍具竞争力,揭示了大语言模型规划能力的提升趋势。
SemanticOpt: 向基于LLM的语义黑盒优化迈进
发表机构 * MIT(麻省理工学院) ; MIT-IBM Watson AI Lab(麻省理工-IBM沃森人工智能实验室)
AI总结 SemanticOpt利用LLM处理语义信息,通过微调结构化贝叶斯优化轨迹与自然语言上下文,提升黑盒优化性能,在多个实际问题中优于传统方法和现有LLM方法。
基于平坦性的3D龙门起重机轨迹规划方法,包含摩擦补偿与碰撞避免
发表机构 * Departamento de Informatica e Ingenieria de Sistemas (DIIS)(信息与系统工程系(DIIS)) ; Instituto de Investigacion en Ingenieria de Aragon (I3A)(阿列尼亚工程研究所(I3A)) ; Universidad de Zaragoza(萨拉戈塔大学)
AI总结 本文提出一种利用微分平坦性优化3D龙门起重机轨迹生成方法,通过直接纳入非线性摩擦和碰撞避免等复杂约束,实现安全高效的运动控制。
Comments 6 pages, 8 figures. Final version, after peer review and acceptance, submitted to the 23rd IFAC World Congress
单调和可分离的集合函数:特征化与神经模型
发表机构 * IIT Bombay(印度理工学院班加罗尔分校) ; Technion(技术学院)
AI总结 本文研究了保持集合自然偏序的集合到向量函数设计,提出弱MAS属性模型,展示了其在集合包含任务中的优势。
ADMIT: RAG基事实核查中的少样本知识污染攻击
发表机构 * Deakin University(德金大学) ; Fudan University(复旦大学) ; City University of Hong Kong(香港城市大学)
AI总结 ADMIT提出一种无需访问目标模型的少样本攻击方法,通过注入真实证据来翻转事实核查决策,实验显示其在多种系统中成功率达86%,揭示了RAG事实核查系统的重大漏洞。
VideoVerse: 你的T2V生成器有世界模型能力来合成视频吗?
发表机构 * Sun Yat-sen University(中山大学) ; Hong Kong Polytechnic University(香港理工大学) ; Tsinghua University(清华大学) ; OPPO Research Institute(OPPO研究院)
AI总结 VideoVerse通过评估T2V模型对复杂时间因果关系和世界知识的理解能力,揭示现有模型与理想世界建模能力的差距。
Comments 26 Pages, 10 Figures, 14 Tables
UniShield: 一种适应性多智能体框架用于统一的伪造图像检测与定位
发表机构 * School of Electronic and Computer Engineering, Peking University(北京大学电子与计算机工程学院) ; School of Future Technology, South China University of Technology(华南理工大学未来技术学院) ; School of Electronic and Information Engineering, South China University of Technology(华南理工大学电子与信息工程学院) ; Guangdong Provincial Key Laboratory of Ultra High Definition Immersive Media Technology, Shenzhen Graduate School, Peking University(北京大学深圳研究生院超高清沉浸媒体技术省重点实验室)
AI总结 UniShield通过多智能体框架实现跨领域伪造图像检测与定位,提升检测的适应性和实用性。
如何训练你的导师:通过导师模型引导黑盒大语言模型
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Bespoke Labs(Bespoke实验室)
AI总结 本文提出Advisor Models,通过训练小型开放权重模型生成动态个性化建议,提升黑盒前沿模型性能,实验显示在多个任务中效果显著,且具有良好的迁移性和鲁棒性。
Comments International Conference on Machine Learning (ICML) 2026
用于精细城市交通建模的Metropolis级道路网络数据集
发表机构 * HSE University(俄罗斯高等经济大学) ; Yandex Research(Yandex研究院) ; BRAIn Lab(BRAIn实验室)
AI总结 本文提出两个主要城市精细化道路网络数据集,用于解决大规模交通预测中的挑战,提供高分辨率的时间序列数据和丰富的静态道路属性。
无需训练的多模态引导用于视频到音频生成
发表机构 * Dept. of Information Engineering, Electronics, and Telecomm., Sapienza University of Rome, Italy(信息工程、电子与电信系,罗马大学萨皮恩扎)
AI总结 本文提出无需训练的多模态引导机制,用于视频到音频扩散生成,通过模态嵌入跨度强制视频、音频和文本的一致对齐,提升生成质量与多模态对齐效果。
Journal ref ICASSP 2026 - 2026 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
动态树RPO:通过结构化采样打破独立轨迹瓶颈
发表机构 * Sun Yat-sen University(中山大学) ; Tsinghua University(清华大学) ; Beijing University of Chemical Technology(北京化工大学)
AI总结 本文提出动态树RPO,通过树状结构采样策略和动态噪声强度,提升文本到图像生成的质量与效率,同时结合层调优强化学习方法,在多个基准测试中表现出色。
Comments Fig.3 updated
无痛激活导向:一种自动化、轻量级的微调大型语言模型方法
发表机构 * Yale University(耶鲁大学)
AI总结 本文提出Painless Activation Steering,一种自动化方法,无需人工干预即可利用标注数据提升模型性能,尤其在行为任务中表现优异,但对智能任务效果有限。
MultiMat: 多模态程序合成用于基于过程的材料生成
发表机构 * University of Mannheim(曼海姆大学) ; Adobe Research(Adobe研究)
AI总结 MultiMat利用大规模多模态模型实现多模态程序合成,提升生成过程材料图的效率与视觉质量,优于纯文本基线方法。
Comments Accepted at ICLR 2026 (poster)
假设逻辑:从零到全面知识的神经符号整合
发表机构 * University of Padua(帕多瓦大学) ; Fondazione Bruno Kessler(布鲁诺·科斯勒基金会) ; University of Bozen-Bolzano(博赞-博尔扎诺大学)
AI总结 本文提出LoH语言,结合数据驱动规则学习与符号先验和专家知识,实现神经符号整合的灵活统一,并通过模糊逻辑实现可微计算图编译。
谈话树木:基于推理的决策树诱导用于表格数据
发表机构 * Yandex ; HSE University(俄罗斯高等经济大学)
AI总结 本文提出利用具备推理能力的LLM诱导小规模表格数据的决策树,生成轻量级树结构,优于CART和非贪心树学习器,并在低资源表格问题中与树集成竞争。
Comments Preprint, code at https://github.com/yandex-research/TalkingTrees
精度降低可能更可靠:对VLMs量化影响的系统评估
发表机构 * Computer Vision Center(计算机视觉中心)
AI总结 本文系统评估了量化对VLMs可靠性的影响,发现量化能提升准确率、校准、异常检测和抗噪能力,但不改善协变量偏移或虚假相关性。
Comments Accepted at ICML 2026
在音乐音频大语言模型中探讨模态贡献
发表机构 * Audio Research Lab, New York University, USA Integrated Design \& Media, New York University, USA
AI总结 本文通过MM-SHAP框架量化音频大语言模型中各模态的贡献,发现高准确率模型更依赖文本回答问题,但音频仍能局部化关键声音事件,首次将MM-SHAP应用于音频大语言模型。
Comments 5 pages, 2 figures, accepted at ICASSP 2026
基于过程的制药制造复杂热力学动态预报
发表机构 * Department of Agricultural and Environmental Sciences, University of Bari(巴里大学农业与环境科学系) ; Department of Mechanical, Mathematics, and Management (DMMM), Polytechnic University of Bari(巴里理工学院机械、数学与管理系) ; Division of Applied Mathematics, Brown University(布朗大学应用数学系)
AI总结 本文提出基于过程的预报方法,结合传统模型和深度学习架构,通过整合过程先验信息提升预测准确性与物理一致性,验证了其在制药冻干过程中的有效性。
自引导在线数据精炼用于扩散模型训练
发表机构 * University of Glasgow(格拉斯哥大学) ; Dotphoton
AI总结 本文研究自引导和在线数据选择方法对扩散模型训练效率的影响,通过合成数据任务验证了自引导在样本质量和多样性上的优势。
Comments Accepted non-archival paper at ICCV 2025 Workshop on Curated Data for Efficient Learning (CDEL)
面向复杂城市环境的街道设施地理定位的随机生灭方法
发表机构 * School of Mathematical Sciences, Dublin City University(都柏林城市大学数学科学学院)
AI总结 本文提出基于能量地图的随机生灭优化算法,用于精确定位城市街道设施,通过整合地理空间信息提升定位精度,验证了其在大规模设施映射中的可行性。
Comments Accepted for publication in the Proceedings of the 27th Irish Machine Vision and Image Processing Conference (IMVIP 2025)
基于采样的全局最优控制与估计通过半正定规划
发表机构 * École Normale Supérieure, PSL Research University(巴黎高等师范大学,PSL研究大学) ; Inria, Département d’informatique de l’ENS, CNRS, PSL Research University(法国国家科学研究中心,ENS计算机系,PSL研究大学) ; U2IS, ENSTA, Institut Polytechnique de Paris(巴黎高等理工学院,U2IS)
AI总结 本文将KernelSOS理论应用于控制和机器人领域,解决实际应用中的重启策略、超参数校准等关键问题,并展示其在高维非参数轨迹优化中的优势。
CIS-BWE: 基于混沌的语音带宽扩展
发表机构 * Chittagong University of Engineering and Technology(奇坦加大学工程与技术学院) ; George Mason University(乔治·梅森大学)
AI总结 本文提出NDSI-BWE框架,利用六种基于非线性动力学系统的判别器捕捉语音的复杂时间行为,通过深度卷积实现参数减少,提升语音带宽扩展性能。
可扩展的多语言模型协作系统:基于检索的选择与探索-利用驱动增强
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; The Chinese University of Hong Kong(香港中文大学) ; Fudan University(复旦大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 本文提出SMCS系统,通过检索优先选择模块和探索-利用驱动后验增强模块,有效协调多个开源语言模型,实验显示其在多个任务中优于闭源模型,且在不同数据集上超越开源模型的平均最佳结果。
在真实世界中导航AI生成图像检测的挑战:真正重要的是什么?
发表机构 * Information Technologies Institute - Centre for Research and Technology Hellas(信息科技研究所 - 希腊研究中心与技术研究所)
AI总结 研究真实世界中AI生成图像检测的挑战,分析设计选择对检测性能的影响,提出优化方法并提升AUC 26.87%。
Comments ACM International Workshop on Multimedia AI against Disinformation 2026 (MAD 2026)