Web Agents Should Adopt the Plan-Then-Execute Paradigm
发表机构 * UC Berkeley(加州大学伯克利分校)
AI总结 本文指出,当前基于ReAct架构的大型语言模型代理在处理网页任务时存在安全隐患,因为其在决策过程中直接使用未验证的网页内容,容易受到提示注入攻击。作者主张网页代理应采用“先规划后执行”的范式,即在观察网页内容前制定任务特定的执行计划,从而隔离不可信数据对控制流的影响。研究分析了WebArena基准,发现大多数任务可通过纯程序化规划完成,而无需运行时调用LLM子程序,并指出实现该范式的关键在于构建类型化、可审计的网页API接口,而非改进模型本身。