FineVision: Open Data Is All You Need
FineVision: 你只需要开放数据
发表机构 * Hugging Face ; Technical University of Munich(慕尼黑技术大学) ; Stanford University(斯坦福大学)
AI总结 本文提出FineVision,一个包含2400万样本的高质量数据集,通过半自动化流程整合了200多个来源,通过严格的数据清洗和人工审核确保数据质量,训练基于该数据集的模型在广泛评估中表现更优,推动数据驱动的视觉语言模型研究。