2605.11161
2026-05-13
cs.LG
cs.AI
Interpretability Can Be Actionable
Hadas Orgad, Fazl Barez, Tal Haklay, Isabelle Lee, Marius Mosbach, Anja Reusch, Naomi Saphra, Byron Wallace, Sarah Wiegreffe, Eric Wong, Ian Tenney, Mor Geva
发表机构
*
Kempner Institute at Harvard University(哈佛大学凯默纳研究所)
;
University of Southern California(美国南加州大学)
;
Mila – Quebec AI Institute(魁北克AI研究所)
;
McGill University(麦吉尔大学)
;
Google DeepMind(谷歌DeepMind)
;
Tel Aviv University(特拉维夫大学)
;
University of Pennsylvania(宾夕法尼亚大学)
;
University of Maryland(马里兰大学)
;
University of Oxford(牛津大学)
;
Northeastern University(东北大学)
;
Boston University(波士顿大学)
AI总结
本文探讨了深度神经网络可解释性研究的实践价值问题,指出当前研究缺乏将可解释性转化为实际决策和干预能力的评估标准。作者提出应以“行动性”作为可解释性的核心评价标准,从具体性和验证性两个维度定义可操作的可解释性,并分析了阻碍其实际应用的障碍。文章进一步识别了五个可解释性具有独特优势的领域,提出了与实际效果对齐的评估框架,旨在推动可解释性研究从理论探索向实际应用转化。