STRIDE: Training Data Attribution via Sparse Recovery from Subset Perturbations
STRIDE: 通过子集扰动的稀疏恢复进行训练数据归因
发表机构 * Jinesis AI Lab, University of Toronto & Vector Institute(Jinesis AI实验室,多伦多大学及向量研究所) ; Max Planck Institute for Intelligent Systems, Tübingen, Germany(智能系统马克斯·普朗克研究所,图宾根,德国) ; Thoughtworks(Thoughtworks公司) ; Martian ; ELLIS Institute, Tübingen, Germany(图宾根ELLIS研究所,德国) ; EuroSafeAI
AI总结 提出STRIDE框架,将训练数据归因建模为压缩感知中的稀疏恢复问题,通过激活空间中的轻量级“引导算子”模拟数据子集的影响,实现高效且准确的LLM预训练归因。
Comments project page: https://stride-tda.github.io/