AI 大模型
AI Agent
智能体、工具调用、规划、工作流、多智能体和自主任务执行。
1. 多智能体 11 篇
Multi-Agent Systems are Mixtures of Experts: Who Becomes an Influencer?
多智能体系统是专家混合:谁成为影响者?
专题命中 多智能体 :研究多智能体LLM协商机制,属于多智能体系统。
AI总结 本文通过Friedkin-Johnsen意见动力学模型分析多智能体LLM协商机制,揭示输入依赖的FJ参数使系统成为专家混合,并探讨基于自信度、感知自信度和初始观点对齐的影响者形成机制。
Comments Accepted at the 2nd Workshop on Compositional Learning at ICML 2026
GateMem: Benchmarking Memory Governance in Multi-Principal Shared-Memory Agents
GateMem:多主体共享内存代理中的内存治理基准
专题命中 多智能体 :多主体共享内存代理的记忆治理基准
AI总结 提出GateMem基准,评估多主体共享内存代理在效用、访问控制和遗忘三方面的治理能力,发现现有方法无法同时满足三者。
Comments 24 pages, 8 figures. Code and dataset are available at https://github.com/rzhub/GateMem and https://huggingface.co/datasets/Ray368/GateMem
AdsMind: A Physics-Grounded Multi-Agent System for Self-Correcting Discovery of Adsorption Configurations on Heterogeneous Catalyst Surfaces
AdsMind: 一种基于物理的多智能体系统,用于异质催化剂表面吸附构型的自校正发现
专题命中 多智能体 :提出闭环多智能体框架,自主纠错搜索。
AI总结 提出AdsMind闭环多智能体框架,利用机器学习力场弛豫反馈实现吸附构型搜索的自主纠错,在基准测试中成功率高达100%和98.8%,且仅需少量弛豫步骤,显著优于启发式枚举和单次方法。
Comments 37 pages, 5 figures
2. 软件智能体 2 篇
Vision AI Agent for Continuous Material Monitoring of LEGEND-1000 LoFi Reentrant Tube
用于LEGEND-1000 LoFi回旋管连续材料监测的视觉AI智能体
专题命中 软件智能体 :LangChain智能体流水线,自动材料监测
AI总结 提出基于LangChain和Claude Haiku 4.5的视觉AI智能体流水线,通过SAM2分割和混合OCR验证从静水压测试视频中自动提取OFHC铜圆柱的直径和应变,计算屈服强度并与模拟对比。
Comments 27 pages, 8 figures, 5 tables, submitted to PRX Intelligence
3. 其他Agent 5 篇
4. 规划决策 8 篇
Structured Cognitive Loop for Behavioral Intelligence in Large Language Model Agents (Extended Revision: From Behavioral Architecture to Epistemic Accountability)
大型语言模型代理中行为智能的结构化认知循环(扩展修订:从行为架构到认知问责)
专题命中 规划决策 :结构化认知循环实现LLM代理可问责行为
AI总结 提出结构化认知循环(SCL)架构,通过分离认知、记忆、控制和行动模块,实现LLM代理的可问责行为,在360个任务中成功率86.3%,优于基线方法。
Comments This revised version extends the original SCL framework from a behavioral architecture for reliable LLM agents into a broader architecture of epistemic accountability, integrating context-aware Human-in-the-Loop control, Pool-Gated Retrieval, and the Horizon-Warrant-Commitment structure
OmniPlan: An Adaptive Framework for Timely and Near-Optimal Network Planning Optimization
OmniPlan:一种用于及时且近乎最优的网络规划优化的自适应框架
专题命中 规划决策 :自适应框架动态选择求解器进行规划
AI总结 提出OmniPlan自适应框架,利用大语言模型解析用户意图,通过混合专家架构动态选择MIP求解器、启发式算法或深度强化学习模型,实现网络规划优化的及时性与近乎最优性,在分布式机器学习推理卸载任务中延迟降低97.8%,资源消耗降低11.5%。
Comments Accepted by ACM KDD 2026