TopBench: A Benchmark for Implicit Predictive Reasoning in Tabular Question Answering
TopBench:表格问答中隐式预测推理的基准
发表机构 * School of Artificial Intelligence, Nanjing University, China(人工智能学院,南京大学,中国) ; National Key Laboratory for Novel Software Technology, Nanjing University, China(新型软件技术国家重点实验室,南京大学,中国)
专题命中 复杂问题求解 :表格问答中隐式预测推理的基准
AI总结 提出TopBench基准,包含779个样本和四个子任务,评估大语言模型在表格问答中识别隐式预测意图并进行可靠推理的能力,发现当前模型在意图识别上存在困难。