AI 大模型
AI Agent
智能体、工具调用、规划、工作流、多智能体和自主任务执行。
Structured Cognitive Loop for Behavioral Intelligence in Large Language Model Agents (Extended Revision: From Behavioral Architecture to Epistemic Accountability)
大型语言模型代理中行为智能的结构化认知循环(扩展修订:从行为架构到认知问责)
专题命中 规划决策 :结构化认知循环实现LLM代理可问责行为
AI总结 提出结构化认知循环(SCL)架构,通过分离认知、记忆、控制和行动模块,实现LLM代理的可问责行为,在360个任务中成功率86.3%,优于基线方法。
Comments This revised version extends the original SCL framework from a behavioral architecture for reliable LLM agents into a broader architecture of epistemic accountability, integrating context-aware Human-in-the-Loop control, Pool-Gated Retrieval, and the Horizon-Warrant-Commitment structure
OmniPlan: An Adaptive Framework for Timely and Near-Optimal Network Planning Optimization
OmniPlan:一种用于及时且近乎最优的网络规划优化的自适应框架
专题命中 规划决策 :自适应框架动态选择求解器进行规划
AI总结 提出OmniPlan自适应框架,利用大语言模型解析用户意图,通过混合专家架构动态选择MIP求解器、启发式算法或深度强化学习模型,实现网络规划优化的及时性与近乎最优性,在分布式机器学习推理卸载任务中延迟降低97.8%,资源消耗降低11.5%。
Comments Accepted by ACM KDD 2026
Online Reward-Punishment Learning from Fixed-Channel Perceptual Event Streams without Environment Rewards
无环境奖励的固定通道感知事件流在线奖惩学习
专题命中 规划决策 :提出无环境奖励的在线奖惩学习框架。
AI总结 提出OHIRL框架,在无标量奖励下通过固定通道感知流进行在线奖惩学习,利用内部轨迹评估器推断感知维度的效价,在XOR任务和CartPole等控制任务中达到高准确率。
Comments 9 pages, 5 figures, 6 tables; 13-page technical supplement
On the Fairness of Additive Welfarist Rules
关于加法福利主义规则的公平性
专题命中 规划决策 :公平分配规则研究,与多智能体系统相关
AI总结 本文研究了加法福利主义规则在公平分配中的公平性,证明了MNW规则是唯一能保证EF1的规则,同时探讨了不同实例类型下的规则特性。
Comments Appears in the 24th International Conference on Autonomous Agents and Multiagent Systems (AAMAS), 2025
Journal ref ACM Transactions on Economics and Computation, 14(2):5 (2026)