Cataract-LMM Large-Scale Multi-Source Multi-Task Benchmark for Deep Learning in Surgical Video Analysis
白内障LMM大规模多源多任务基准用于手术视频分析中的深度学习
发表机构 * Applied Robotics and AI Solutions (ARAS)(应用机器人与人工智能解决方案) ; Faculties of Electrical and Computer Engineering(电气与计算机工程学院) ; K.N. Toosi University of Technology(卡里姆·纳尼·托西技术大学) ; Translational Ophthalmology Research Center(转化眼科研究中心) ; Farabi Eye Hospital(法拉比眼科医院) ; Tehran University of Medical Sciences(德黑兰医科大学) ; Noor Ophthalmology Research Center(努尔眼科研究中心) ; University of Alberta(阿尔伯塔大学) ; Departments of Electrical and Computer Engineering & Biomedical Engineering(电气与计算机工程及生物医学工程系)
AI总结 本文提出一个包含3000个白内障超声乳化手术视频的数据集,用于训练通用深度学习模型,通过多任务基准验证了模型在手术流程识别、场景分割等方面的效果。
Comments 28 pages, 14 figures, 15 tables. Data descriptor for the Cataract-LMM benchmark dataset. Source code and dataset are available