2605.23271
2026-05-25
cs.CV
cs.AI
EvalVerse: Pipeline-Aware and Expert-Calibrated Benchmarking for Professional Cinematic Video Generation
EvalVerse:面向专业电影级视频生成的流水线感知与专家校准基准测试
Songlin Yang, Haobin Zhong, Ruilin Zhang, Xiaotong Zhao, Shuai Li, Kai Zheng, Xuyi Yang, Zhe Wang, Zhenchen Tang, Yang Li, Bohai Gu, Zhengwei Peng, Yidan Huang, Mengzhou Luo, Yihang Bo, Dalu Feng, Yujia Zhang, Juntao Ma, Ruiqi Wang, Lvmin Zhang, Yuwei Guo, Frank Guan, Maneesh Agrawala, Hongbo Fu, Alan Zhao, Anyi Rao
发表机构
*
The Hong Kong University of Science and Technology(香港科学与技术大学)
;
Tencent(腾讯)
;
Tsinghua University(清华大学)
;
Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所)
;
Beijing Film Academy(北京电影学院)
;
Stanford University(斯坦福大学)
;
The Chinese University of Hong Kong(香港中文大学)
;
Singapore Institute of Technology(新加坡理工学院)
AI总结
随着生成式视频基础模型的快速发展,影视级视频生成成为研究热点,但现有的评估方法多关注生成内容是否符合提示,而忽视了其艺术质量、表演和美学表现。为解决这一问题,本文提出 EvalVerse,一个流程感知且由专家校准的评估框架,通过构建专业影视制作流程的评估体系、收集大规模专家标注数据,并结合专家校准的微调策略提升视觉语言模型的推理能力,从而实现对视频生成质量的全面评估,为未来奖励模型和评估代理的研究提供了基础支撑。