LLM-Evolved Domain-Independent Heuristics for Symbolic AI Planning
LLM进化的符号AI规划领域无关启发式
专题命中 规划推理 :LLM进化领域无关启发式,用于符号规划
AI总结 本文使用进化搜索让大语言模型生成领域无关的启发式函数,在未见测试域上超越手工最优启发式,并首次系统评估了启发式的信息性-速度权衡。
Comments Accepted at the LM4Plan workshop at ICAPS 2026
AI 大模型
大模型数学、逻辑、规划、多步推理和测试时计算能力。
LLM进化的符号AI规划领域无关启发式
专题命中 规划推理 :LLM进化领域无关启发式,用于符号规划
AI总结 本文使用进化搜索让大语言模型生成领域无关的启发式函数,在未见测试域上超越手工最优启发式,并首次系统评估了启发式的信息性-速度权衡。
Comments Accepted at the LM4Plan workshop at ICAPS 2026
鲁棒正则化策略迭代在转移不确定性下
发表机构 * College of Computer Science and Technology, Zhejiang University, Hangzhou, China(浙江大学计算机科学与技术学院) ; School of Artificial Intelligence, Optics and Electronics (iOPEN), Northwestern Polytechnical University, Xi'an, China(西北工业大学人工智能、光学与电子学院(iOPEN)) ; School of Software Technology, Zhejiang University, Hangzhou, China(浙江大学软件技术学院) ; School of Software Engineering, Xi'an Jiaotong University, Xi'an, China(西安交通大学软件工程学院) ; School of Systems Science and Engineering, Sun Yat-sen University, Guangzhou, China(中山大学系统科学与工程学院)
专题命中 规划推理 :鲁棒策略迭代用于离线强化学习
AI总结 提出鲁棒正则化策略迭代(RRPI),通过将离线强化学习建模为鲁棒策略优化,使用KL正则化替代难解的双层目标,并基于鲁棒正则化贝尔曼算子实现高效策略迭代,理论保证收敛性,实验在D4RL基准上表现优异。