Fast and Effective Redistricting Optimization via Composite-Move Tabu Search
通过复合移动禁忌搜索实现高效的选区优化
发表机构 * Department of Land Surveying and Geo-Informatics(土地测绘与地理信息系)
AI总结 本文提出复合移动禁忌搜索算法,解决选区优化中的连通性约束问题,提升解的质量、鲁棒性和效率。
通过复合移动禁忌搜索实现高效的选区优化
发表机构 * Department of Land Surveying and Geo-Informatics(土地测绘与地理信息系)
AI总结 本文提出复合移动禁忌搜索算法,解决选区优化中的连通性约束问题,提升解的质量、鲁棒性和效率。
关于应变和涡量在流匹配数值积分误差中的作用
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文分析了流匹配中应变和涡量对积分误差的影响,证明应变通过对数范数控制指数误差放大,而涡量仅线性影响局部截断误差,提出加权雅可比正则化方法,实验验证了理论预测,提升了积分精度。
Comments 16 pages, 7 figures. Preliminary version. Includes qualitative CIFAR-10 comparison and supporting synthetic experiments
打破幻觉:当积极与消极在多模态解码中相遇
发表机构 * School of Astronautics, Beihang University(北京航空航天大学航天学院) ; Longcat Interaction Team, Meituan(美团Longcat交互团队) ; Tianmushan Laboratory, Beihang University(北京航空航天大学天门山实验室)
AI总结 本文提出PND框架,通过在解码过程中引入正负对比路径,增强视觉真实性,无需重新训练即可在POPE、MME和CHAIR数据集上取得最佳性能。
Comments Accepted by CVPR 2026 (Conference on Computer Vision and Pattern Recognition). 11 pages, 5 figures. Code available at: https://github.com/JiangYubo4399/PND
基于Wasserstein GAN的气候情景生成器用于风险管理与保险:以土壤沉降为例
发表机构 * Biostatistiques et Processus Spatiaux (BioSP), INRAE, Avignon, France(生物统计与空间过程(BioSP),法国国家农业食品与环境研究委员会(INRAE),法国阿维尼昂) ; CREST, CNRS, Ecole polytechnique, Groupe ENSAE-ENSAI, ENSAE Paris, Institut Polytechnique de Paris, Palaiseau, France(法国国家科学研究中心(CNRS)、巴黎高等理工学院(École polytechnique)、ENSAE-ENSAI小组、巴黎ENSAE、巴黎理工学院(Institut Polytechnique de Paris)、法国帕莱索) ; Fondation du Risque, Institut Louis Bachelier, Paris, France(风险基金会、路易·巴舍利尔研究所(Institut Louis Bachelier)、法国巴黎)
AI总结 本文提出基于条件生成对抗网络的SwiGAN模型,生成未来气候指数时空轨迹,用于模拟土壤湿润指数的干旱传播模式,支持适应性风险管理与保险策略设计。
LKV:端到端学习头部预算和令牌选择以LLM KV缓存淘汰
发表机构 * University of Science and Technology of China(中国科学技术大学) ; State Key Lab of Processors, Institute of Computing Technology, CAS, Beijing, China(中国科学院计算技术研究所过程器重点实验室,北京,中国) ; University of Chinese Academy of Sciences, Beijing, China(中国科学院大学,北京,中国)
AI总结 本文提出LKV,通过端到端可微优化问题实现KV缓存压缩,学习任务优化全局预算和内在KV重要性,提升长上下文推理性能。
RateQuant: 通过率-失真理论实现最优混合精度KV缓存量化
发表机构 * BA TechWorks (BMW Group)(BA TechWorks(宝马集团)) ; National University of Singapore(新加坡国立大学) ; Tsinghua University(清华大学)
AI总结 RateQuant利用率-失真理论优化混合精度KV缓存量化,通过为不同重要性头部分配不同位宽,减少内存瓶颈,提升生成性能。
Comments 18 pages, 7 figures, 5 tables
领域级元认知监控在前沿大语言模型中的应用:一个33模型图谱
发表机构 * Independent Researcher(独立研究员)
AI总结 本文通过33个前沿LLM在MMLU基准领域中的表现,揭示了元认知评分掩盖的领域级差异,发现应用/专业知识领域监控效果最佳,而形式推理和自然科学领域最难,且中等难度领域无显著差异。
Comments 25 pages, 7 figures, 1 supplementary table. Code and data: https://github.com/synthiumjp/metacognitive-profile-atlas
GraphDC: 一种用于可扩展图算法推理的分而治之多智能体系统
发表机构 * Department of Computer Science, Virginia Tech(弗吉尼亚理工大学计算机科学系)
AI总结 GraphDC通过分而治之的多智能体框架提升图算法推理效率,通过分解图并分配子任务给专用智能体,结合主智能体整合结果,提升大规模图处理的性能和鲁棒性。
MASPO:基于大语言模型的多智能体系统的联合提示优化
发表机构 * Institute of Computing and Intelligence, Harbin Institute of Technology, Shenzhen, China(哈尔滨工业大学深圳研究院)
AI总结 本文提出MASPO框架,通过联合评估机制和数据驱动的进化束搜索,优化多智能体系统中的提示,提升整体性能,实验显示在6个任务中平均准确率提升2.9。
Comments Accepted at ICML 2026
新冠疫情信息洪流。利用机器学习方法理解内容特征以检测虚假新闻
发表机构 * Faculty of Computer Science & Information Technology, Universiti Malaya(马来亚大学计算机科学与信息技术学院) ; LIGM, Univ Gustave Eiffel, CNRS(法国埃菲尔大学LIGM研究所,CNRS)
AI总结 本研究通过机器学习方法探讨内容特征在虚假新闻检测中的应用,发现文本和语言特征单独使用能提升检测效果,但结合使用未显著提升性能。
Journal ref Malaysian Journal of Computer Science, 2023, 36 (1), pp.1-13
渲染,而非解码:具有潜在结构解耦的权重空间世界模型
发表机构 * Department of Computer Science(计算机科学系) ; University of Manchester(曼彻斯特大学) ; University of Bristol(布里斯托大学)
AI总结 本文提出NOVA框架,通过权重和偏置构建隐式神经表示,实现高效且可解释的世界模型,支持结构场景组件的解耦与编辑。
Comments 35 pages, 30 figures, 8 tables
Safactory:一个可扩展的代理基础设施,用于训练可信的自主智能
发表机构 * Shanghai AI Laboratory(上海人工智能实验室)
AI总结 本文提出Safactory,一个可扩展的代理工厂,用于训练可信的自主智能。该框架整合了三个紧密耦合的平台,以实现长期决策、工具使用和真实环境交互的可靠性和连续改进。
Comments 50 pages, 21 figures
VLA-GSE: 提升VLA中基于通用和专用专家的参数高效微调
发表机构 * Microsoft Research Asia(微软亚洲研究院) ; Tsinghua University(清华大学)
AI总结 VLA-GSE通过通用和专用专家机制提升VLA在机器人控制中的参数高效微调效果,保留预训练知识的同时提高适应能力,实验表明其在多个基准测试中表现优异。
均值模式尖叫:用于1000层扩散变换器的均值-方差分割残差
发表机构 * Beijing, China(中国北京)
AI总结 本文提出均值-方差分割残差,解决扩散变换器在数百层时出现的均值主导崩溃问题,通过分割残差更新和泄漏主干均值替换,使模型在极端深度下保持稳定训练。
Comments 43 pages (9-page main paper + appendix)
熵正则化对偶匹配用于离线强化学习
发表机构 * College of Computing(计算学院) ; Mohammed VI Polytechnic University(穆莱·阿卜杜勒阿齐兹技术大学)
AI总结 本文提出最大熵对偶匹配框架,通过镜像下降熵最大化和混合行为先验机制,缓解流行偏差和支撑绑定问题,提升离线数据中最优策略的提取能力。
CrossCult-KIBench:一种用于多模态大语言模型跨文化知识插入的基准测试
发表机构 * Hefei University of Technology(合肥工业大学) ; Key Laboratory of Ethnic Language Intelligent Analysis and Security Governance of MOE, Minzu University of China(民族语言智能分析与安全治理国家重点实验室,中央民族大学) ; School of Information Engineering, Minzu University of China(中央民族大学信息工程学院)
AI总结 本文提出CrossCult-KIBench基准测试,用于评估跨文化知识插入的有效性及非目标文化的影响,通过9800个图像场景测试不同语言文化的适应性,提出MCKI方法并揭示了当前模型在文化适应与行为保持间的平衡难题。
基于时间平滑的双重鲁棒知识追踪学习
发表机构 * School of Computer Science and Technology, Guangdong University of Technology(广东工业大学计算机科学与技术学院)
AI总结 本文提出TSDR框架,通过引入时间平滑正则化,结合倾向性模型与误差填补模型,解决知识追踪中的偏差问题,提升预测稳定性与准确性。
MAS-Algorithm: 一个基于多智能体系统的算法问题求解工作流
发表机构 * Peking University(北京大学) ; Alibaba Group(阿里巴巴集团) ; Huazhong University of Science and Technology(华中科技大学)
AI总结 本文提出MAS-Algorithm,通过多智能体工作流提升算法问题求解能力,实验显示在多个模型上均取得显著提升,包括接受率提升6.48%和LiveCodeBench-Pro上的4.72%提升。
从输入侧最小化模态差距:你的语音大语言模型可以成为具有语调意识的文本大语言模型
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; Huawei Technologies(华为技术)
AI总结 本文提出TextPro-SLM,通过改进语音输入使其更接近具有语调意识的文本大语言模型,从而有效减少模态差距,实验表明其在3B和7B规模下表现最佳,且数据效率高。
Comments Work in progress
XDecomposer:学习无先验的多相X射线衍射集分解
发表机构 * New Laboratory of Pattern Recognition (NLPR), Institute of Automation, Chinese Academy of Sciences (CASIA)(中国科学院自动化研究所新型模式识别实验室) ; School of Advanced Interdisciplinary Sciences, University of Chinese Academy of Sciences(中国科学院大学先进交叉学科学院) ; Guangzhou Municipal Key Laboratory of Materials Informatics, The Hong Kong University of Science and Technology (Guangzhou)(广州市材料信息学重点实验室,香港科技大学(广州)) ; Green Dynamics, Australia(澳大利亚绿动公司)
AI总结 XDecomposer通过无先验假设的方法,实现多相X射线衍射模式的联合分解与识别,无需候选相列表或结构模板,提升重建准确性和相识别能力。
Comments 28pages, 8figures, 6tables
内部检索:基于注意力模型的内在能力
发表机构 * NVIDIA ; Department of Electrical Engineering, Technion, Haifa, Israel(技术学院电子工程系,以色列海法)
AI总结 本文提出INTRA框架,通过注意力机制直接从内部表征检索证据,统一检索与生成流程,提升问答任务的召回与生成质量。
CRAFT:面向持续学习的遗忘感知干预式适应
发表机构 * Iowa State University(爱荷华州立大学) ; Maro Systems(Maro系统) ; University of California, Berkeley(加州大学伯克利分校) ; AMD
AI总结 CRAFT通过在隐藏表示上学习低秩干预,避免更新模型权重,通过输出分布分歧路由任务、KL散度正则化和合并干预,减少遗忘并提升性能。
Comments 24 pages
具有显著性感知的正则化量化校准用于大语言模型
发表机构 * University of Science and Technology of China(中国科学技术大学) ; University College London(伦敦大学学院) ; Shanghai University of Finance and Economics(上海财经大学) ; Academy of Mathematics and Systems Science, Chinese Academy of Sciences(中国科学院数学与系统科学研究院) ; University of Copenhagen(哥本哈根大学) ; Imperial College London(伦敦帝国学院) ; Technical University of Denmark(丹麦技术大学) ; Peking University(北京大学)
AI总结 本文提出SARQC,通过引入显著性感知正则化改进量化校准,提升大语言模型的泛化能力,实验表明在密集和专家混合模型中提升了困惑度和零样本准确率。
EGA:基于冻结编码器的向量搜索适应方法,具有受限制的分布外退化
发表机构 * Tacoma School of Engineering and Technology University of Washington(塔科马工程与技术学院华盛顿大学)
AI总结 本文提出EGA方法,通过零初始化、局部三元组损失和超球面投影,解决冻结编码器在部署时面对未见类查询的问题,提升分布外场景下的标签精度。
Comments added ack and github link
LLMSpace:大型语言模型在低地球轨道卫星上的推理碳足迹建模
发表机构 * Indiana University(印第安纳大学)
AI总结 本文提出LLMSpace框架,用于建模AI赋能低地球轨道卫星上大型语言模型推理的碳足迹,分析碳足迹、延迟、硬件设计和使用寿命之间的关键权衡。
Comments 12 pages, 4 figures, 6 tables
信念记忆:在部分可观测性下的智能体记忆
发表机构 * MBZUAI ; RIKEN AIP ; UT Austin ; Wuhan University(武汉大学)
AI总结 本文提出BeliefMem,通过保留多个候选结论及其概率,解决智能体在部分可观测环境中记忆的不确定性问题,实验证明其在LoCoMo和ALFWorld基准上表现优异。
在代理时代谁定价认知劳动?基于计算的工资
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文提出计算锚定工资理论,指出代理并非劳动力而是将计算资本转化为认知劳动的有效单位,从而改变劳动力市场的工资定价机制。
多头自注意力的梯度流结构与定量动力学
发表机构 * Ayan Pendharkar
AI总结 本文研究多头自注意力的动力学,揭示其梯度流结构及聚类行为,提出非单调性障碍并建立稳定性机制,通过简化模型推导关键温度与聚类速率关系。
Comments 20 pages, 5 figures
区间选举中Thiele规则及其推广的计算
发表机构 * Department of Mathematics and Computer Science(数学与计算机科学系) ; Eindhoven University of Technology(埃因霍温理工大学) ; School of Computer Science, and Department of Mathematics and Statistics(计算机科学学院和数学与统计学系) ; McGill University(麦吉尔大学)
AI总结 本文研究了区间选举中Thiele规则的计算问题,发现其在候选区间域内可通过线性规划高效求解,但在选民区间域内则存在NP难性,并提出了新的域扩展方法。
Comments 19 pages
通过自蒸馏实现多语言安全对齐
发表机构 * Tongji University(同济大学) ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 本文提出多语言自蒸馏框架,通过将高资源语言的安全能力迁移到低资源语言,解决多语言安全对齐问题,无需特定语言响应数据,实验表明方法在多语言安全性能上表现优异。