Plan-and-Execute将Agent分为规划器和执行器两个独立组件,是处理复杂多步任务的有效架构。本文解读Plan-and-Solve Prompting论文,详解分层规划(hierarchical planning)策略,分析动态重规划(re-planning)机制如何应对执行中的意外情况。结合LangGraph的PlanAndExecute实现,展示这一架构的代码实践。
Agent 架构与工具链
从单工具到MCP生态,从无状态到持久化Agent的架构进阶
文章列表
- 11
- 12记忆是Agent区分于无状态API调用的关键。本文聚焦短期记忆管理:详解上下文窗口策略(滑动窗口、优先级保留)、自动压缩(summarization)技术,以及Stanford Generative Agents论文(Park et al., UIST 2023)中的Memory Stream架构——时间戳+重要性+相关性三维度检索。分析LangGraph Checkpoint如何实现短期记忆持久化。
- 13长期记忆让Agent跨会话保留知识。本文详解向量数据库选型(ChromaDB轻量本地、Pinecone全托管、Qdrant高性能、Milvus大规模),嵌入模型选择(OpenAI text-embedding-3、BGE、Cohere),以及Agentic RAG与传统RAG的关键区别——Agent自主决定何时检索、检索什么、如何整合。介绍Mem0、Zep等Agent记忆工具。
- 14MCP(Model Context Protocol)是Anthropic推出的开放标准,被称为"AI工具的USB-C"。本文深度解析MCP架构:Host-Client-Server三层模型、三大服务端原语(Tools可执行函数/Resources数据源/Prompts模板)、两大客户端原语(Sampling请求LLM完成/Elicitation请求用户输入),以及传输层(Stdio本地通信/Streamable HTTP远程通信)和JSON-RPC 2.0生命周期管理。
- 15动手构建MCP Server。本文使用FastMCP和官方Python SDK,从零开发一个完整的MCP工具服务:注册Tools(带JSON Schema类型安全)、暴露Resources(提供上下文数据)、定义Prompts(可复用模板)。详解错误处理、部署选项(Stdio模式本地使用/HTTP模式远程访问),以及如何在Claude Desktop或Claude Code中集成自建MCP Server。
- 16生产级Agent需要状态持久化能力。本文详解LangGraph的Checkpointer机制(SqliteSaver/PostgresSaver/MemorySaver),通过thread_id实现多会话管理,支持中断恢复和时间旅行(Time-travel)调试。对比OpenAI Agents SDK的Session方案(SQLite/Redis/SQLAlchemy/Dapr),分析不同场景下的选型建议。
- 17代码Agent是Agent Engineering最成功的应用领域之一。本文深入解析SWE-agent论文(Yang et al., NeurIPS 2024)的Agent-Computer Interface设计——如何让Agent像人类开发者一样浏览代码、编辑文件、运行测试。详解代码沙箱执行的安全设计,以及OpenAI CodeInterpreter、ShellTool的实现原理。分析SWE-bench上的最新评测结果。
- 18浏览器Agent让AI像人类一样操作网页。本文详解Playwright MCP Server和Browser Use等方案的架构设计,分析DOM理解(Accessibility Tree vs 原始HTML)、元素定位(CSS选择器 vs 视觉定位)、多标签管理等核心技术。结合WebArena基准(812个真实Web任务),评估当前浏览器Agent的能力边界。
- 19关键决策点引入人工审批是Agent安全落地的重要策略。本文详解OpenAI Agents SDK的needs_approval工具审批机制和RunState序列化,LangGraph的interrupt断点恢复机制,以及AG2的UserProxyAgent(human_input_mode=TERMINAL/ALWAYS/NEVER)。分析何时需要HITL(高风险操作、大额交易、数据删除)以及如何设计优雅的审批UX。
- 20将Ep 11-19的架构知识融会贯通,构建一个完整的个人助理Agent。该助理具备:持久化长期记忆(向量数据库存储用户偏好和历史对话)、多工具能力(通过MCP集成搜索、日历、文件操作)、人机协作(关键操作需人工确认)。从架构设计到完整Python实现,展示Ep 11-19所有技术在真实系统中的协同工作。