arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

语言大模型 / LLM

大语言模型、预训练、指令微调、后训练和语言模型应用。

今日/当前日期收录 15 信号源:cs.CL, cs.AI, cs.LG
2606.19266 2026-06-18 cs.CL cs.AI 新提交 专题 90

Trade-offs in Medical LLM Adaptation: An Empirical Study in French QA

医学LLM适应中的权衡:法语问答的实证研究

Ikram Belmadani, Oumaima El Khettari, Carlos Ramisch, Frederic Bechet, Richard Dufour, Benoit Favre

专题命中 领域大模型 :法语医学LLM领域适应策略比较

AI总结 通过法语医学问答任务,实证比较持续预训练(CPT)和监督微调(SFT)在多个模型家族和规模下的效果,发现CPT+SFT在多项选择问答上最优但增益小,SFT是强且经济的默认选择,而CPT在开放式问答中提升重叠指标。

2606.18699 2026-06-18 cs.CL cs.AI cs.IR 新提交 专题 90

TW-LegalBench: Measuring Taiwanese Legal Understanding

TW-LegalBench: 衡量台湾法律理解

Fei-Yueh Chen, Chun Huang Lin, Chan Wei Hsu, Kuan Hsuan Yeh, Zih-Ching Chen, Kuan-Ming Chen, Patrick Chung-Chia Huang

专题命中 领域大模型 :台湾法律理解基准,评估LLM法律推理

AI总结 提出TW-LegalBench基准,包含多项选择、开放式问答和法律判决预测任务,评估13个LLM在台湾法律上的表现,发现顶尖模型通过律师考试但未达到法官检察官标准,且法律条文引用困难。

Comments 10 pages, 2 figures, To appear in ICAIL 2026

2606.18600 2026-06-18 cs.DC 新提交 专题 85

ShuntServe: Cost-Efficient LLM Serving on Heterogeneous Spot GPU Clusters

ShuntServe: 异构竞价型GPU集群上的成本高效LLM服务

Seungwoo Jeong, Moohyun Song, Juhyun Park, Kyungyong Lee

专题命中 领域大模型 :提出ShuntServe系统优化LLM在异构GPU上服务

AI总结 提出ShuntServe系统,通过屋顶线模型估计性能和动态规划优化模型放置,在异构竞价型GPU集群上最大化吞吐量,结合输出保留迁移与共享张量存储实现容错,相比基线吞吐量提升1.42倍,成本效率提升31.9%以上。

Comments 18 pages, 16 figures, 5 tables

2606.18596 2026-06-18 cs.HC cs.AI 新提交 专题 80

Better Adherence, Richer Context: A Field Evaluation of LLM-Powered Conversational Voice Diaries for Sleep

更好的依从性,更丰富的上下文:基于LLM的对话式语音睡眠日记的现场评估

Amama Mahmood, Bokyung Kim, Honghao Zhao, Molly E. Atwood, Luis F. Buenaver, Michael T. Smith, Chien-Ming Huang

专题命中 领域大模型 :LLM驱动的对话式语音睡眠日记现场评估

AI总结 通过现场实验评估基于LLM的对话式语音睡眠日记,发现相比文本日记,语音日记提高了依从性并收集了更详细的上下文信息,但结构化字段完整性较低。

2606.18989 2026-06-18 cs.CL cs.AI 新提交 专题 75

G-IdiomAlign: A Gloss-Pivoted Benchmark for Cross-Lingual Idiom Alignment

G-IdiomAlign:基于释义的跨语言习语对齐基准

Fengying Ye, Yanming Sun, Runzhe Zhan, Zheqi Zhang, Lidia S. Chao, Derek F. Wong

专题命中 领域大模型 :构建跨语言习语对齐基准,评估LLM翻译能力。

AI总结 提出G-IdiomAlign基准,通过维基词典释义锚定习语,构建高置信度对齐集,并设计多项选择等价测试和释义对比生成协议,揭示大语言模型在习语翻译中的字面翻译偏差。

Comments Accepted to ACL 2026

2606.18986 2026-06-18 cs.CL cs.AI 新提交 专题 75

Beyond Tokenization: Direct Timestep Embedding and Contrastive Alignment for Time-Series Question Answering

超越分词:面向时间序列问答的直接时间步嵌入与对比对齐

Yafeng Wu, Huu Hiep Nguyen, Thin Nguyen, Hung Le

专题命中 领域大模型 :提出时间序列问答框架,直接嵌入时间步避免分词瓶颈。

AI总结 提出CADE框架,通过逐点线性编码器直接嵌入每个时间步,避免分词瓶颈,并利用单向监督对比损失对齐时间序列与文本锚点,在Time-MQA基准上提升六项TSQA任务性能。

2606.18803 2026-06-18 cs.AI cs.CY 新提交 专题 75

ProfiLLM: Utility-Aligned Agentic User Profiling for Industrial Ride-Hailing Dispatch

ProfiLLM: 面向工业网约车调度的效用对齐智能用户画像

Tengfei Lyu, Zirui Yuan, Xu Liu, Kai Wan, Zihao Lu, Li Ma, Hao Liu

专题命中 领域大模型 :LLM应用于工业调度,属于领域大模型

AI总结 提出ProfiLLM,一种通过工具增强全局知识挖掘和效用对齐画像探索的智能LLM数据管道,解决工业网约车调度中大规模行为日志的用户画像问题,在滴滴生产系统中实现AUC提升6.14%、GMV提升4.35%。

2606.18597 2026-06-18 cs.CL 新提交 专题 75

Low-resource Language Discrimination Towards Chinese Dialects with Transfer learning and Data Augmentation

低资源中文方言辨识:基于迁移学习与数据增强

Fan Xu, Yangjie Dan, Keyu Yan, Yong Ma, Mingwen Wang

专题命中 领域大模型 :迁移学习与数据增强用于中文方言辨识

AI总结 针对中文方言标注资源稀缺的问题,提出结合迁移学习与数据增强的CDDTLDA框架,利用源域ASR模型和目标域数据增强及微调,通过自注意力机制捕获共性语义特征,显著超越现有方法。

Comments Published in ACM TALLIP

2606.19167 2026-06-18 cs.SE 新提交 专题 70

Teaching Software Engineering with LLM and MCP Integration: From Classroom to Industry Practice

用LLM和MCP集成教学软件工程:从课堂到工业实践

Kehui Chen, Jacky Keung, Weining Li, Xiangbing Shao, Yishu Li, Xiaoxue Ma

专题命中 领域大模型 :使用LLM辅助软件工程教学,但非核心模型创新

AI总结 本研究将LLM和MCP集成到软件工程协作教学模式中,通过嵌入驱动工具到教学、代码辅助和工程模拟,弥合传统教学与工业流程的差距,提升学生编程、问题解决和智能工具使用能力。

Comments Aceept by International Symposium on Educational Technology (ISET) 2026

2606.18789 2026-06-18 eess.SY cs.SY 新提交 专题 70

PowerAgentBench-SS: A Benchmark for Agentic AI in Power System Steady-State Studies

PowerAgentBench-SS:电力系统稳态研究中智能体AI的基准测试

Costas Mylonas, Magda Foti, Andrea Pomarico, Matheus Duarte, Qian Zhang, Emmanouel Varvarigos

专题命中 领域大模型 :电力系统领域LLM智能体基准

AI总结 提出PowerAgentBench-SS基准框架,用于评估LLM智能体在电力系统稳态研究中执行工程工作流的能力,通过工具API、验证预算和风险敏感指标区分智能体性能。

2606.18636 2026-06-18 cs.CL cs.AI 新提交 专题 70

PEC-Home: Interpretation of Progressively Elliptical Commands in Smart Homes

PEC-Home:智能家居中渐进式省略命令的解释

Yingyu Shan, Zeming Liu, Silin Li, Boao Qian, Jiashu Yao, Yuhang Guo, Haifeng Wang

专题命中 领域大模型 :智能家居中渐进式省略命令的解释

AI总结 针对智能家居中用户因共享上下文而使用渐进式省略命令导致的指代和意图歧义问题,提出首个模拟家庭数据集PEC-Home,实验表明现有LLM助手难以准确执行省略命令。

Comments Accepted by ACL 2026 Findings

2606.18584 2026-06-18 cs.CL 新提交 专题 70

Speech-Driven End-to-End Language Discrimination towards Chinese Dialects

语音驱动的端到端汉语方言语言鉴别

Fan Xu, Jian Luo, MingWen Wang, GuoDong Zhou

专题命中 领域大模型 :语音驱动端到端汉语方言语言鉴别

AI总结 针对相似语言和方言鉴别难题,提出基于MFCC特征和HMM-DNN端到端模型的语音驱动方法,结合注意力机制和CNN融合词嵌入与MFCC特征,在基准语料上优于现有方法。

Comments Published in ACM TALLIP

2606.18560 2026-06-18 cs.SD 新提交 专题 70

Constraining to Generalize: Subspace Tuning for Few-shot Generalization of Audio-Language Models

约束泛化:音频-语言模型少样本泛化的子空间微调

Jaehyuk Jang, Kangwook Ko, Wonjun Lee, Changick Kim

专题命中 领域大模型 :子空间微调提升音频-语言模型少样本泛化

AI总结 针对音频-语言模型少样本微调导致的基类-新类权衡问题,提出子空间微调(SubT),通过结构化子空间参数化和残差锚定约束文本嵌入漂移,并利用子空间感知门控抑制负迁移,在11个音频基准上实现高效强泛化。

2606.18372 2026-06-18 cs.CL cs.AI 新提交 专题 60

Redact or Keep? A Fully Local AI Cascade for Educational Dialogue De-Identification

保留还是删除?用于教育对话去标识的完全本地AI级联框架

Haocheng Zhang, Zhuqian Zhou, Kirk Vanacore, Bakhtawar Ahtisham, René F. Kizilcec

专题命中 领域大模型 :使用本地LLM级联进行教育对话去标识。

AI总结 针对教育对话中课程术语与个人身份信息混淆的问题,提出一种完全本地的级联框架,通过召回优先的联合提议器和上下文感知审查器实现约束性隐私分类,在数学辅导对话上达到0.958的宏F1,优于商业API和纯LLM基线。

2606.18256 2026-06-18 cs.HC cs.AI 新提交 专题 60

Dynamic In-Group Persona Generation for Enhancing Human-AI Rapport

动态内群体人格生成以增强人机融洽关系

Yoonseok Oh, Inseo Jung, Jinkyu Kim, Jungbeom Lee, Minwoo Kang, Suhong Moon

专题命中 领域大模型 :LLM聊天机器人通过内群体人格增强融洽关系

AI总结 提出一种动态内群体人格生成方法,通过识别用户主要关切并生成共享相似关切的内群体人格,显著提升人机融洽关系,实验表明该方法优于无人格条件和最小自我表露基线。