Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles
Maestro:通过强化学习协调分层模型-技能集合
发表机构 * Tsinghua University(清华大学) ; Zhejiang University(浙江大学) ; The Chinese University of Hong Kong(香港中文大学) ; Nanyang Technological University(南洋理工大学) ; Tongji University(同济大学)
AI总结 本文提出Maestro框架,通过强化学习协调多模态任务,利用分层模型-技能集合提升多模态任务性能,实现高效且通用的协调策略。