Prediction-Powered Risk Monitoring of Deployed Models for Detecting Harmful Distribution Shifts
预测驱动的已部署模型风险监控:检测有害分布漂移
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出预测驱动风险监控(PPRM),一种基于预测驱动推断的半监督方法,通过结合合成标签与少量真实标签构建运行风险的随时有效下界,实现对有害漂移的检测,并在图像分类、大语言模型和电信监控任务中验证有效性。
Comments Accepted by ICML2026