Is She Even Relevant? When BERT Ignores Explicit Gender Cues
AI总结 本研究探讨了在荷兰语中,BERT模型如何以及在什么情况下会捕捉到性别信息,特别是针对具有显性形态性别标记和通用形式的语言。通过分析训练过程中的上下文嵌入,研究构建了动态的性别子空间,发现尽管性别信息在训练约20轮后变得线性可分,但模型在面对明确性别线索的短句模板时,仍难以更新其内部性别表征,表现出对男性默认的持续倾向。这一结果挑战了现有假设,表明模型在性别方向上的表征动态性不足,难以有效反映反刻板印象的性别线索。