AI 大模型
语言大模型 / LLM
大语言模型、预训练、指令微调、后训练和语言模型应用。
1. 领域大模型 3 篇
ShuntServe: Cost-Efficient LLM Serving on Heterogeneous Spot GPU Clusters
ShuntServe: 异构竞价型GPU集群上的成本高效LLM服务
专题命中 领域大模型 :提出ShuntServe系统优化LLM在异构GPU上服务
AI总结 提出ShuntServe系统,通过屋顶线模型估计性能和动态规划优化模型放置,在异构竞价型GPU集群上最大化吞吐量,结合输出保留迁移与共享张量存储实现容错,相比基线吞吐量提升1.42倍,成本效率提升31.9%以上。
Comments 18 pages, 16 figures, 5 tables
2. 预训练 4 篇
Geometric and Stochastic Analysis of Discontinuities in Sparse Mixture-of-Experts
稀疏混合专家模型中不连续性的几何与随机分析
专题命中 预训练 :分析稀疏MoE不连续性,提出平滑机制,核心是LLM架构改进。
AI总结 本文对稀疏混合专家模型中的不连续性进行几何与随机分析,分类不连续阶数,建立渐近体积估计,证明随机路径几乎必然击中一阶不连续,并提出低开销平滑机制以提升性能。
Comments ICML 2026 Spotlight. arXiv admin note: text overlap with arXiv:2510.17794 by other authors
3. 指令微调 2 篇
Efficient Financial Language Understanding via Distillation with Synthetic Data
通过合成数据蒸馏实现高效金融语言理解
专题命中 指令微调 :用大教师模型蒸馏到小模型,金融情感分析。
AI总结 提出一种在低资源条件下通过合成数据蒸馏进行金融情感分析的框架,利用聚类种子选择生成代表性合成数据,使紧凑模型在少量标注下达到强性能,甚至在某些任务上超越教师模型。
Journal ref Proceedings of the Fifteenth Language Resources and Evaluation Conference (LREC 2026), European Language Resources Association (ELRA), 2026, pp. 10242-10254
4. 后训练 10 篇
EfficientRollout: System-Aware Self-Speculative Decoding for RL Rollouts
EfficientRollout: 面向强化学习推演的感知系统的自推测解码
专题命中 后训练 :提出自推测解码加速强化学习推演。
AI总结 针对强化学习推演中自回归解码延迟瓶颈,提出感知系统的自推测解码框架,通过量化自推测解码器与感知系统的推测开关策略,在保持模型质量前提下降低推演和端到端延迟。
Comments Project Page: https://github.com/furiosa-ai/EfficientRollout
5. 其他LLM 11 篇
Beyond Prediction: Tail-Aware Scheduling for LLM Inference
超越预测:面向LLM推理的尾延迟感知调度
专题命中 其他LLM :提出LLM推理调度框架,优化尾延迟
AI总结 针对LLM推理中长度预测调度在分布偏移和尾延迟控制上的脆弱性,提出无预测的分布感知调度框架,通过轻量统计信号实现软优先级提升,结合缓存感知抢占,在多种工作负载下将P99 TTLT降低35-50%,TTFT降低34-47%。
Journal ref Forty-Third International Conference on Machine Learning (2026)
Superstudent intelligence in thermodynamics
热力学中的超级学生智能
专题命中 其他LLM :评估o3模型在热力学考试中的表现
AI总结 研究展示OpenAI的o3模型在热力学考试中超越所有学生,证明机器在复杂任务中的能力,影响工程教育与实践。
Comments This document is the unedited Author's version of a yet to be Submitted Work to Physical Review Physics Education Research. 15 pages, 2 figures, Graphical Abstract, Highlights and SI available (12 pages)
As Easy as Rocket Science: Assessing the Ability of Large Language Models to Interpret Negation in Figurative Language
像火箭科学一样简单:评估大型语言模型解释比喻语言中否定能力的研究
专题命中 其他LLM :评估LLM对否定与比喻语言的理解
AI总结 本研究通过开发新的注释数据集,测试多种大型语言模型在比喻语言中理解否定的能力,发现否定与比喻的组合对模型构成挑战,且性能高度依赖提示风格。
Comments 16 pages, 16 figures; for associated code and data see https://github.com/jrdowers/Negation-and-Fig-Lang; To be published in Transactions of the Association for Computational Linguistics
Bounded Context Management for Tabular Foundation Models on Stream Learning
表格基础模型在流学习中的有界上下文管理
专题命中 其他LLM :表格基础模型流学习上下文管理
AI总结 针对表格流学习中分布漂移问题,提出上下文管理策略CURE,通过不确定性门控准入和冗余感知驱逐管理上下文,在七个流上相对提升最高27.0%。
Comments Accepted as a spotlight oral (top 5%) at the 2nd ICML Workshop on Foundation Models for Structured Data (FMSD@ICML2026)