Neural Neural Scaling Laws
神经神经扩展定律
发表机构 * New York University(纽约大学)
AI总结 本文提出NeuNeu模型,通过时间序列外推预测语言模型在下游任务中的性能,相比传统参数化方法,其在66个下游任务上的均方误差降低了44%。
神经神经扩展定律
发表机构 * New York University(纽约大学)
AI总结 本文提出NeuNeu模型,通过时间序列外推预测语言模型在下游任务中的性能,相比传统参数化方法,其在66个下游任务上的均方误差降低了44%。
TSRBench: 一个全面的多任务多模态时间序列推理基准,用于通用模型
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; University of Illinois at Urbana–Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Maryland, College Park(马里兰大学学院公园分校) ; University of California, San Diego(加州大学圣地亚哥分校)
AI总结 TSRBench通过4125个问题和15个任务评估通用模型的时间序列推理能力,揭示了感知和推理中的缩放定律失效以及多模态融合的不足。
Comments Accepted to ICML 2026
TEA-Bench: 一种工具增强情感支持对话代理的系统性基准测试
发表机构 * Harbin Institute of Technology(哈尔滨工业大学)
AI总结 本文提出TEA-Bench,首个评估工具增强情感支持对话代理的交互式基准,通过真实情感场景和工具环境评估情感支持质量和事实性。实验表明工具增强提升情感支持质量并减少幻觉,但效果依赖模型能力。
ART用于扩散采样:一种强化学习方法用于时间步调度
发表机构 * Department of Industrial Engineering and Operations Research, Columbia University, New York, NY 10027, USA(工业工程与运筹学系,哥伦比亚大学,纽约,NY 10027,美国) ; Department of Industrial Engineering and Operations Research & Data Science Institute, Columbia University, New York, NY 10027, USA(工业工程与运筹学系及数据科学研究所,哥伦比亚大学,纽约,NY 10027,美国)
AI总结 本文提出ART方法,通过强化学习优化扩散模型的时间步调度,减少欧拉离散误差,提升生成质量。
Comments 25 pages, 8 figures, 5 tables
基于大型语言模型的SQL生成:提示、自我完善与自适应加权多数投票
发表机构 * Institute of Information Management(信息管理研究所) ; National Yang Ming Chiao Tung University(阳明交通大学) ; R. B. Annis School of Engineering(R. B. Annis工程学院) ; University of Indianapolis(印第安纳大学)
AI总结 本文提出SSEV管道,通过自我完善与加权多数投票提升SQL生成准确性,在多个基准测试中取得良好成绩,并进一步提出ReCAPAgent-SQL框架以应对企业数据库复杂性,提升实际应用效果。
Comments 29 pages, 22 figures
Journal ref 2026 International Conference on Information Management
在3DGS中实现优化解耦的一步
发表机构 * National Engineering Research Center of Robot Visual Perception and Control Technology, School of Artificial Intelligence and Robitics, Hunan University(机器人视觉感知与控制技术国家工程研究中心,人工智能与机器人学院,湖南大学) ; Baidu Inc.(百度公司) ; Central South University(中南大学)
AI总结 本文针对3DGS优化中的耦合问题,提出解耦方法,通过稀疏Adam、重状态正则化和解耦属性正则化提升优化效率和表示效果。
Comments Accepted by ICLR 2026 (fixed typo)
Contrast-X:一个多模态对比图像合成基准及通用模态流匹配
发表机构 * University of Cambridge(剑桥大学) ; MD Anderson Cancer Center(MD安德森癌症中心) ; University of Dundee(邓迪大学)
AI总结 Contrast-X通过多器官CT和乳腺DCE-MRI数据,提出FlowMI模型解决多模态缺失问题,评估合成图像质量及跨器官泛化能力。
用于具有视觉效果的分层图像生成的统一且可控的框架
发表机构 * UC Santa Cruz(加州大学圣克鲁兹分校) ; Adobe Research(Adobe研究)
AI总结 本文提出LASAGNA框架,通过单次前向传递生成逼真背景和具有视觉效果的RGBA前景,支持多种编辑操作,消除身份漂移,同时发布两个社区资源。
超越事实准确性:使用逻辑得分评估RAG系统中的全球推理完整性
发表机构 * Shanxi University(山西大学) ; Nanjing University of Science and Technology(南京理工大学) ; University of Manchester(曼彻斯特大学) ; Singapore University of Technology and Design(新加坡科技设计大学) ; University of Edinburgh(爱丁堡大学)
AI总结 本文提出LogicScore,通过全局推理审查弥补RAG系统在长文本生成中逻辑完整性不足的问题,揭示模型在事实准确性高但全局推理质量差的缺陷。
脚本敏感性:在Unicode、罗马化和混合脚本僧加罗语上对语言模型的基准测试
发表机构 * School of Computing Informatics Institute of Technology(计算学院信息科技研究院)
AI总结 本研究评估了语言模型在僧加罗语等低资源、形态丰富的语言上的表现,发现脚本敏感性显著,模型大小与脚本处理能力无关,Unicode性能预测混合脚本鲁棒性但不预测罗马化能力。
Comments Published at SCSE 2026 (9th IEEE International Research Conference on Smart Computing and Systems Engineering). Best Paper Award - Text Analytics Track
Journal ref 2026 9th IEEE International Research Conference on Smart Computing and Systems Engineering (SCSE), vol. 9, pp. 1-6
Miner:挖掘内在掌握以实现大推理模型的数据高效强化学习
发表机构 * Fudan University(复旦大学) ; Shanghai Jiao Tong University(上海交通大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室)
AI总结 本文提出Miner方法,通过利用策略内在不确定性作为自监督奖励信号,提升大推理模型的数据高效强化学习性能,实现状态-of-the-art结果。
Comments 24 pages
CSMCIR: 基于记忆库的增强对称对齐用于复合图像检索
发表机构 * Kuaishou Technology(快播科技) ; Key Laboratory of Multimedia Trusted Perception and Efficient Computing, Ministry of Education of China, Xiamen University(教育部多媒体可信感知与高效计算重点实验室,厦门大学)
AI总结 本文提出CSMCIR,通过多级链式思维提示策略、对称双塔架构和熵基记忆库策略,实现高效查询-目标对齐,提升复合图像检索性能。
DisCo-FLoc: 通过SE(2)感知对比度解歧实现无语义的地板计划定位
发表机构 * School of Computer Science and Engineering, Central South University(中南大学计算机科学与工程学院) ; School of Electrical and Information Engineering, Tianjin University(天津大学电气与信息工程学院)
AI总结 本文提出DisCo-FLoc,一种无语义的视觉-几何对比度解歧方法,通过深度感知射线回归预测器和空间扰动对比目标,提升地板计划定位的精度与鲁棒性。
Comments 9 pages, 3 figures
FANoS-v2:基于热力学阻尼的反馈控制动量用于轻量级神经优化
发表机构 * School of Computing and Electrical Engineering(计算与电子工程学院) ; Indian Institute of Technology Mandi(印度理工学院曼迪)
AI总结 FANoS-v2通过反馈控制动量和热力学阻尼优化神经网络,实现轻量级优化,在MNIST、Fashion-MNIST和CIFAR-10上优于AdamW,但计算时间更长。
Comments 17 pages, 3 figures, 5 tables
SB-TRPO:迈向带有硬约束的安全强化学习
发表机构 * College of Computing and Data Science, Nanyang Technological University, Singapore(南洋理工大学计算学院和数据科学学院,新加坡) ; Sony Corporation(索尼公司)
AI总结 SB-TRPO通过动态平衡成本降低与奖励提升,提供硬约束强化学习的原理性算法,确保安全性和奖励的改进,实验显示其在安全约束下平衡性能最佳。
在深度贝叶斯强化学习中引入可学习基函数的广义线性模型
发表机构 * School of Computing(计算学院)
AI总结 本文提出GLiBRL,通过可学习基函数实现深度贝叶斯强化学习中的 tractable 贝叶斯推断,改进任务表示与经验核对应关系,提升在MuJoCo和MetaWorld基准上的性能。
用于机器学习的Bloom过滤器编码
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系) ; Florida Atlantic University(佛罗里达大学)
AI总结 本文提出一种利用Bloom过滤器变换预处理数据的方法,通过哈希编码将样本转换为紧凑的位数组,减少内存使用并模糊原始特征值。在六个数据集上评估,结果表明Bloom编码在多个数据集上与原始数据或标准降维技术性能相当,同时提供一致的内存节省。
Comments 14 pages, 7 figures
DiffeoMorph: 通过可微分基于代理的模拟学习3D形状变形
发表机构 * Department of Systems Biology, Harvard Medical School(哈佛医学院系统生物学系) ; Department of Data Science, Dana-Farber Cancer Institute(达纳-法伯癌症研究所数据科学部) ; Departments of Biomedical Informatics, Harvard Medical School(哈佛医学院生物医学信息学部) ; Broad Institute of MIT and Harvard(MIT与哈佛大学Broad研究所)
AI总结 本文提出DiffeoMorph框架,通过可微分代理模拟学习形态发生协议,使代理群体变形为目标3D形状,采用SE(3)等价图神经网络和基于3DZernike多项式的形状匹配损失实现旋转不变性和反射敏感性。
大视频规划器实现通用机器人控制
发表机构 * MIT(麻省理工学院) ; UC Berkeley(加州大学伯克利分校) ; Harvard(哈佛大学)
AI总结 本文提出利用大规模视频预训练构建通用机器人基础模型,通过生成视频计划实现跨任务和环境的泛化控制,并在真实机器人上验证了其可行性。
Comments 29 pages, 16 figures
评估大型语言模型在科学发现中的表现
发表机构 * Deep Principle(深原则) ; Department of Computer Science, Cornell University(计算机科学系,康奈尔大学) ; Department of Computer Science and Engineering, The Ohio State University(计算机科学与工程系,俄亥俄州立大学) ; Department of Chemical Engineering & Applied Chemistry, University of Toronto(化学工程与应用化学系,多伦多大学) ; Department of Computer Science and Engineering, University of Notre Dame(计算机科学与工程系,圣母大学) ; QuEra Computing Inc.(QuEra计算公司) ; Department of Pathology, Department of Genetics, Cancer Biology Program, Stanford University School of Medicine(病理学系、遗传学系、癌症生物学项目,斯坦福大学医学院) ; Harvard Law School(哈佛法学院) ; Department of Computer Science, Tufts University(计算机科学系,塔夫茨大学) ; School of Computational Science and Engineering, Georgia Institute of Technology(计算科学与工程学院,佐治亚理工学院) ; Department of Computer Science, University of California, Los Angeles(计算机科学系,加州大学洛杉矶分校) ; Department of Computer Science, Virginia Tech(计算机科学系,弗吉尼亚理工大学) ; Department of Physics, Tsinghua University(物理系,清华大学) ; Institute for Advanced Study, Tsinghua University(清华大学高级研究所) ; Laboratory of Artificial Chemical Intelligence, Ecole Polytechnique Federale de Lausanne(人工化学智能实验室,瑞士联邦理工学院)
AI总结 本文提出一个基于场景的基准测试,评估LLM在生物学、化学、材料科学和物理学中的科学发现能力,揭示了模型在科学发现任务中的性能差距和改进方向。
神经CDEs作为已学习时间序列模型的校正器
发表机构 * Department of Mechanical Engineering(机械工程系) ; Iowa State University(爱荷华州立大学) ; Sibley School of Mechanical and Aerospace Engineering(机械与航空航天工程学院) ; Cornell University(康奈尔大学)
AI总结 本文提出了一种预测-校正框架,利用神经控制微分方程校正时间序列预测误差,通过正则化策略提升性能并保证稳定性,实验显示其在多种预测器上均能提升预报效果。
AgentProg: 通过程序引导的上下文管理赋能长周期GUI代理
发表机构 * Tsinghua University(清华大学) ; Peking University(北京大学)
AI总结 本文提出AgentProg,通过将交互历史重构为程序结构,实现长周期GUI任务的高效上下文管理,实验表明其在AndroidWorld和扩展任务集上达到最优性能,并在长周期任务中保持稳健表现。
Comments 16 pages, 8 figures
BEAVER:一种高效的确定性大语言模型验证器
发表机构 * University of Illinois, Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 BEAVER 提出了一种计算大语言模型安全属性确定性概率界限的框架,通过新颖的 Token trie 和 Frontier 数据结构系统探索模型输出空间,提供可靠保证并识别更多高风险实例。
ATHENA:分层进化数值算法的智能团队
发表机构 * Division of Applied Mathematics, Brown University(布朗大学应用数学系)
AI总结 ATHENA通过知识驱动的诊断流程,实现科学计算与科学机器学习的自动化,结合专家蓝图和组合空间,生成高精度数值解和稳定求解器,达到10^-14的验证误差。
在驾驶前思考:基于世界模型的多模态接地用于自动驾驶车辆
发表机构 * University of Macau(澳门大学) ; UESTC(电子科技大学) ; Purdue University(普渡大学) ; McGill University(麦吉尔大学) ; Massachusetts Institute of Technology(麻省理工学院) ; University of Washington(华盛顿大学) ; The Hong Kong University of Science and Technology(香港科学与技术大学)
AI总结 本文提出ThinkDeeper框架,通过预测未来空间状态提升自动驾驶车辆的自然语言指令理解能力,结合超图引导解码器融合多模态输入,提出DrivePilot数据集并在多个基准测试中表现优异。
基于闭式旋转的W4A4大语言模型量化去噪
发表机构 * National University of Defense Technology(国防科技大学) ; Qinghai Normal University(青海师范大学) ; Tibet University(西藏大学)
AI总结 本文提出SingleQuant框架,通过闭式最优旋转平滑激活异常值,提升大语言模型量化性能,实验证明其在多种任务中优于基线方法。
Comments 9 pages, 4 figures
视觉语言动作模型中的持续演进技能知识
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai Innovation Institute(上海创新研究院) ; University of Cambridge(剑桥大学) ; Beihang University(北京航空航天大学) ; Nanyang Technological University(南洋理工大学) ; MIT SMART(麻省理工学院SMART实验室) ; AgiBot
AI总结 本文提出Stellar VLA框架,通过无需增加参数的持续模仿学习方法,实现视觉语言动作模型的持续知识积累,实验表明其在任务专精和知识转移方面表现优异。
学习提出问题:基于推理和求解器适应的数据合成
发表机构 * Tsinghua University(清华大学) ; Tencent(腾讯) ; Nanyang Technological University(南洋理工大学) ; Sun Yat-sen University(中山大学)
AI总结 本文提出一种基于推理和求解器适应的数据合成方法,通过生成相关问题对并利用推理模型生成中间步骤,提升问题设计策略,实验表明在多个基准上实现了3.4%的平均提升。
跨任务的 amortized 多目标优化与生成解建模
发表机构 * College of Computing and Data Science, Nanyang Technological University, Singapore(南洋理工大学计算与数据科学学院,新加坡) ; School of Mechanical Sciences, Indian Institute of Technology, Goa, India(印度理工学院Goa分校机械科学学院,印度) ; Centre for Frontier AI Research, Agency for Science, Technology and Research, Singapore(新加坡科技研究局前沿人工智能研究中心) ; Singapore Institute of Manufacturing Technology, Agency for Science, Technology and Research, Singapore(新加坡制造技术研究所,新加坡科技研究局)
AI总结 本文提出一种新型参数化多目标贝叶斯优化器,通过生成解采样和跨任务协同搜索,实现连续任务偏好空间中的解预测,避免重复昂贵评估。
Comments Accepted by IJCAI 2026
MemSearcher:通过端到端强化学习训练LLM进行推理、搜索和管理内存
发表机构 * Chinese Information Processing Laboratory, Institute of Software, Chinese Academy of Sciences, Beijing, China(中国科学院软件研究所信息处理实验室,北京,中国) ; University of Chinese Academy of Sciences, Beijing, China(中国科学院大学,北京,中国) ; Xiaohongshu Inc(小红书公司)
AI总结 MemSearcher通过端到端强化学习训练LLM进行推理、搜索和内存管理,通过维护紧凑的记忆在多轮交互中保持上下文长度稳定,优于基于历史拼接的基线方法。
Comments Accepted to ACL 2026