A Systematic Evaluation of Black-Box Uncertainty Estimation Methods for Large Language Models
大型语言模型黑盒不确定性估计方法的系统评估
发表机构 * State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所多模态人工智能系统国家重点实验室)
专题命中 其他LLM :系统评估LLM黑盒不确定性估计方法。
AI总结 系统评估了24种黑盒不确定性估计方法在4个模型和4个数据集上的表现,发现无单一方法普遍最优,但基于答案空间推理和比较的方法通常有效,混合方法在多数条件下表现良好。