AutoTool: Dynamic Tool Selection and Integration for Agentic Reasoning
AutoTool: 面向智能体推理的动态工具选择与集成
发表机构 * Nanyang Technological University(南洋理工大学)
AI总结 提出AutoTool框架,通过双阶段优化(SFT+RL轨迹稳定化和KL正则化Plackett-Luce排序)使大语言模型具备动态工具选择能力,在数学、科学、代码和多模态推理等任务上平均提升6.4%-7.7%。
Comments ICML2026; Best Paper Award at ICCV 2025 Workshop on Multi-Modal Reasoning for Agentic Intelligence