Pretraining Language Models with Subword Regularization: An Empirical Study of BPE Dropout in Low-Resource NLP
AI总结 本文研究了在低资源自然语言处理任务中,是否在预训练阶段应用BPE Dropout能提升下游任务表现。研究通过在多种语言的子集上训练单语和双语BERT模型,并在多个基准数据集上进行评估,发现同时在预训练和微调阶段使用随机分词能取得最佳效果,尤其在数据量较少时,预训练阶段引入BPE Dropout具有明显优势。实验还表明,预训练阶段的随机分词有助于模型更一致地接触形态对齐的分词方式,从而提升模型的表示能力。
Comments Comments: 12 pages, 8 figures, 5 tables