ParliaBench: An Evaluation and Benchmarking Framework for LLM-Generated Parliamentary Speech
ParliaBench: 面向大语言模型生成的议会演讲的评估与基准框架
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出ParliaBench基准框架,通过构建英国议会数据集、结合计算指标与LLM评判的评估方法以及两种新型嵌入指标(政治光谱对齐和政党对齐),系统评估LLM生成议会演讲的语言质量、语义连贯性和政治真实性,实验表明微调显著提升多数指标且新指标对政治维度具有强区分力。
Journal ref Proceedings of the Fifteenth Language Resources and Evaluation Conference (LREC 2026), pp. 4797-4818, European Language Resources Association (ELRA), Palma, Mallorca, Spain, May 2026