ViCoStream: Streaming VideoLLMs Can Run Beyond 100 FPS with Stage-Wise Coordinated Inference
ViCoStream: 流式视频大模型通过阶段协调推理可运行超过100 FPS
发表机构 * Southeast University(东南大学) ; Eastern Institute of Technology, Ningbo(宁波东方理工大学) ; Shanghai Jiao Tong University(上海交通大学)
专题命中 视频理解 :提出流式视频大模型推理框架,提升视频吞吐和延迟。
AI总结 提出ViCoStream框架,通过阶段协调的流水线(分块执行、CUDA流重叠、视觉令牌控制、有界视觉注意力、查询端检索)实现流式视频大模型的高吞吐低延迟推理,在单A100上达到134 FPS视频吞吐和<50 ms首令牌延迟,精度接近全历史基线。
Comments 19 pages, 7 figures, 13 tables