Valence-Arousal Subspace in LLMs: Circular Emotion Geometry and Multi-Behavioral Control
AI总结 本研究揭示了大语言模型中情感向量在二维“效价-唤醒”(VA)子空间中呈现出环形几何结构,并通过主成分分解和岭回归方法,恢复出与情感控制向量相关的VA轴。研究发现,沿这些轴进行情感引导可实现对生成文本情感属性的单调控制,并能同时双向调控下游行为(如拒绝和奉承)。实验在多个主流模型中复现,表明该方法具有普适性,且提出词汇中介机制解释其有效性。