AI 大模型
语言大模型 / LLM
大语言模型、预训练、指令微调、后训练和语言模型应用。
Analyzing Error Propagation in Korean Spoken QA with ASR-LLM Cascades
分析韩语语音问答中ASR-LLM级联中的误差传播
专题命中 领域大模型 :研究ASR-LLM级联在韩语语音问答中的误差传播
AI总结 本文研究了韩语语音问答中ASR-LLM级联中误差传播的问题,通过分析下游语义失败,揭示了传统ASR指标无法完全捕捉的误差影响,发现不同性能的LLM在级联降级上的一致性,识别出单字符ASR错误作为语义失败通道,并通过辅助比较表明大音频语言模型在噪声韩语SQA中优于匹配语言模型的ASR-LLM流水线。
Comments Preprint. Submitted to APSIPA ASC 2026
TransLaw: A Large-Scale Dataset and Multi-Agent Benchmark Simulating Professional Translation of Hong Kong Case Law
TransLaw:模拟香港判例法专业翻译的大规模数据集与多智能体基准
专题命中 领域大模型 :多智能体框架用于法律翻译
AI总结 针对香港判例法英译中资源匮乏、法律术语和格式要求严格的问题,构建了首个大规模句对齐平行语料库HKCFA Judgment 97-22,并提出多智能体框架TransLaw,通过分解翻译任务、集成法律词汇库和检索增强生成,显著提升翻译质量,但仍未达到人类专家的风格自然度。
Comments Accepted at ICML 2026 - AI for Law
More Parameters Than Populations: A Systematic Literature Review of Large Language Models within Survey Research
参数多于总体:调查研究中的大语言模型系统文献综述
专题命中 领域大模型 :系统综述LLM在调查研究中的应用,涵盖三个阶段。
AI总结 通过系统文献综述,评估大语言模型在调查研究三个阶段(数据收集前、中、后)的应用,讨论其潜力与陷阱,并展望调查研究对LLM发展的贡献。
Comments This working paper is outdated as of June 2026 - please refer to the full version with substantive changes here: https://doi.org/10.31235/osf.io/eubj4_v1 This work was presented at NLPOR 2025 (non-archival): https://openreview.net/forum?id=0Hxhwa56Yg
Closing the Social-Semantic Gap: SPSD for Edge-Based Prompt Compression in Cloud LLM Inference
缩小社会-语义差距:SPSD用于云LLM推理中的边缘端提示压缩
专题命中 领域大模型 :边缘端提示压缩用于云LLM推理。
AI总结 针对云LLM推理中提示词预填充阶段能耗高的问题,提出SPSD边缘端管道,利用4比特量化小语言模型压缩用户提示,在保持响应质量非劣效的前提下,平均节省99.9个输入token,每调用净节能70-270 uWh。
Comments 19 pages, 7 tables, 1 figure, includes appendix
Creating Multilingual Mental Health Dialogue Datasets: Limits of Persona-Based Localization via Nationality and Language
创建多语言心理健康对话数据集:基于国籍和语言的人物角色本地化方法的局限性
专题命中 领域大模型 :研究LLM生成多语言心理健康对话数据集及评估。
AI总结 研究通过修改人物角色中的国籍和语言参数生成中文、孟加拉语和印地语临床对话,发现仅添加这些参数会导致跨语言临床不一致,且LLM评估非英语文本的抑郁严重度时存在不准确性。
Comments 15 pages, 4 figures. Accepted to the 2026 Workshop on Computational Linguistics and Clinical Psychology (CLPsych 2026), co-located with ACL 2026
TSAssistant: A Human-in-the-Loop Agentic Framework for Automated Target Safety Assessment
TSAssistant: 一种人在回路中的自动化靶点安全性评估智能体框架
专题命中 领域大模型 :利用LLM进行生物医学文献检索与综合
AI总结 提出TSAssistant多智能体框架,通过分层指令架构和交互式优化循环,将靶点安全性评估报告生成分解为专业子任务,实现高可重复性和证据溯源。
Comments Updated with quantitative and expert evaluations
Wisdom of Committee: Diverse Distillation from Large Foundation Models and Domain Experts
委员会智慧:来自大型基础模型和领域专家的多样化蒸馏
专题命中 领域大模型 :蒸馏基础模型到紧凑领域模型,涉及推荐和视觉
AI总结 针对基础模型向紧凑领域模型蒸馏时能力、架构和模态差异大的问题,提出DiverseDistill框架,通过可学习的问答机制和对齐异构教师输出,在推荐和视觉任务上恢复73-114%的性能差距。
Comments Accepted at the 1st Workshop on Resource-Efficient Learning and Knowledge Discovery (RelKD), KDD 2026
Journal ref Proceedings of the RelKD Workshop at KDD 2026