SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding
SciHorizon-GENE:从基因知识到功能理解的生命科学推理基准测试
发表机构 * Computer Network Information Center, Chinese Academy of Sciences(中国科学院计算机网络信息中心) ; University of the Chinese Academy of Sciences(中国科学院大学) ; DUKE-NUS Medical School, National University of Singapore(新加坡国立大学杜克-新加坡医学学校) ; Singapore Immunology Network, Agency for Science, Technology and Research(新加坡免疫网络,科技研究局)
专题命中 蛋白质与生物分子 :基因功能推理基准,属于生命科学AI。
AI总结 针对大语言模型在基因级推理能力上的不足,构建了包含超过19万个人类基因和54万问题的基准SciHorizon-GENE,从研究关注敏感性、幻觉倾向、答案完整性和文献影响力四个生物学关键维度评估模型,揭示了模型在生成忠实、完整且基于文献的功能解释方面的持续挑战。
Comments Accepted by SIGKDD 2026. 12 pages