11---
2- title : AI Agent 核心概念:Agent Loop、Context Engineering 、Tools 注册
2+ title : AI Agent 核心概念:Agent Loop、Plan-and-Execute、A2A、Agentic Workflows 、Tools 注册
33description : 深入解析 AI Agent 核心概念,梳理从被动响应到常驻自治的演进历程,对比 Agent、传统编程、Workflow 的区别和适用场景。
44category : AI 应用开发
55head :
88 content : AI Agent,智能体,ReAct,Function Calling,RAG,MCP,多智能体协作,Computer Use
99---
1010
11- <!-- @include: @article-header.snippet.md -->
12-
1311第一次被 ChatGPT 震到的时候,很多人应该都还在研究 Prompt 怎么写。那时候它更像一个会聊天的知识库。你问,它答;你不问,它也不会自己动。三年过去,AI 已经不只是在聊天框里回复文字了。它开始会调用工具,会读文件,会跑代码,甚至能操作电脑界面。
1412
1513再往前走一步,就是现在大家反复提到的 AI Agent。
@@ -30,9 +28,9 @@ AI Agent 不是突然冒出来的。它大概经历了几次明显变化。
3028
3129** 2022 年,ChatGPT 这类产品刚火的时候** ,大家主要还在和模型“对话”。能力很强,但它只能基于已有知识回答问题,不能主动调用外部工具,也不能自己完成操作。
3230
33- 当时最重要的玩法是 Prompt Engineering。你把提示词写得越清楚,它回答得越稳。
31+ 当时最重要的玩法是 [ Prompt Engineering] ( https://javaguide.cn/ai/agent/prompt-engineering.html ) 。你把提示词写得越清楚,它回答得越稳。
3432
35- 但它还是不能动 。
33+ 但它本质上还是会说,不是会做 。
3634
3735** 2023 年中,Function Calling 出现后,事情开始变了。**
3836
@@ -42,15 +40,39 @@ LLM 可以调用外部 API,不再只是生成文字。RAG 也开始大规模
4240
4341** 2023 年底,大家开始重视编排。**
4442
45- ReAct 这种推理框架逐渐被接受,多智能体协作也开始被讨论。Coze、Dify 这类平台把开发门槛降了下来,用 DAG(有向无环图)来约束执行流程,避免 AutoGPT 那种完全放飞的自治方式。
43+ ReAct 这种推理框架逐渐被接受。模型不只是直接给答案,而是先思考下一步要做什么,再决定是否调用工具,然后根据工具返回结果继续推理。
44+
45+ 多 Agent 协作也开始被讨论。比如一个 Agent 负责规划,一个 Agent 负责执行,一个 Agent 负责检查。
46+
47+ Coze、Dify 这类平台把开发门槛降了下来,用 DAG(有向无环图)来约束执行流程,避免 AutoGPT 那种完全放飞的自治方式。
4648
4749** 2024 年底,标准化和多模态开始变重要。**
4850
49- MCP 协议出现,解决工具接入碎片化的问题。Computer Use 让 Agent 可以操作图形界面。Cursor 这类 AI 编程工具也把 "Vibe Coding" 带火了。
51+ [ MCP 协议] ( https://javaguide.cn/ai/agent/mcp.html ) 出现,解决工具接入碎片化的问题。Computer Use 让 Agent 可以操作图形界面。
52+
53+ AI 编程工具也在这个阶段快速发展。Cursor、Claude Code、Codex 这类工具把代码库阅读、修改、测试、提交串了起来,“Vibe Coding”也在这个阶段被更多人讨论。
54+
55+ ** 2025 年,Agent 开始往长任务执行方向走。**
56+
57+ 这一年,Agent 不再只是一次对话里的助手,而是开始变成可以接任务、跑流程、产出结果的工作单元。
58+
59+ Agent Skills 这类机制也开始出现。很多任务不是一句 Prompt 就能做好,而是需要固定流程、上下文、模板、脚本和校验规则。Skill 做的就是把这些方法封装下来,让 Agent 遇到类似任务时按既定流程执行。
5060
51- ** 2025 年,Agent 开始往常驻自治方向走 。**
61+ ** 到了 2026 年,Agent 开始更接近长期在线的数字工作单元 。**
5262
53- Agent Skills、Heartbeat 这类机制成熟后,Agent 可以在后台长时间运行,也开始强调本地数据主权。
63+ OpenClaw 这类项目把 Skills 和 Heartbeat 推到更显眼的位置。
64+
65+ Skills 负责封装能力,Heartbeat 负责周期性唤醒 Agent,让它检查消息、处理任务、更新状态,而不是只能等用户下一次提问。
66+
67+ 不过,Heartbeat 不等于真正的连续意识,它更像定时唤醒;本地数据主权也不等于绝对安全。只要 Agent 能安装 Skill、访问文件、执行脚本,就会带来新的权限、沙箱和供应链风险。
68+
69+ Harness Engineering 也开始被更多人讨论。
70+
71+ 可以简单理解为:Agent = Model + Harness。模型负责推理和生成,Harness 负责把模型放进一个可执行、可观察、可恢复、可验证的工作环境里。
72+
73+ 大家不再只盯着模型参数、上下文长度和 Prompt 技巧,开始更关注模型外面的工程环境。
74+
75+ ** 后续发展展望。**
5476
5577再往后看,几个方向会继续推进:内建记忆、预测能力,以及从数字世界扩展到物理机器人。
5678
@@ -215,7 +237,7 @@ OpenAI Schema 解决数据格式问题,MCP 解决通信接入问题。
215237
216238Claude Code、Cursor 这类工具已经原生支持这套模式,会自动扫描项目里的 ` .claude/skills/ ` 目录,由模型自己判断哪个 Skill 该激活。
217239
218- 纯代码封装、调用路径固定,用 Toolkits。团队经验沉淀、任务流程灵活,用 Agent Skills 更合适。更详细的 Skills 工程实践——包括路由设计、SKILL.md 写法避坑、第三方 Skill 安全审计,可以看:[ 《Agent Skills 详解》] ( ./ skills.md ) 。
240+ 纯代码封装、调用路径固定,用 Toolkits。团队经验沉淀、任务流程灵活,用 Agent Skills 更合适。更详细的 Skills 工程实践——包括路由设计、SKILL.md 写法避坑、第三方 Skill 安全审计,可以看:[ 《Agent Skills 详解》] ( https://javaguide.cn/ai/agent/ skills.html ) 。
219241
220242### 通信接入:MCP 协议
221243
@@ -251,17 +273,19 @@ JSON Schema 是数据格式,MCP 是通信协议层。
251273
252274Prompt(提示词)可以简单理解为给大语言模型下达的指令。Prompt Engineering 就是怎么把这条指令写清楚,让模型输出更可控。关键在边界是否清晰——指令越模糊,模型越容易乱猜;指令越结构化,输出就越稳定。
253275
254- 这块展开讲内容很多,可以单独看这篇:[ 《提示词工程(Prompt Engineering)》] ( ./ prompt-engineering.md ) 。
276+ 这块展开讲内容很多,可以单独看这篇:[ 《提示词工程(Prompt Engineering)》] ( https://javaguide.cn/ai/agent/ prompt-engineering.html ) 。
255277
256278## 什么是 Context Engineering?
257279
258- 很多 Agent 做不好,不是模型太弱 ,而是上下文太乱。
280+ 很多时候, Agent 做不好,不是模型能力太多 ,而是上下文太乱。
259281
260282Context Engineering 做的事情,就是在有限 Token 窗口里,把最有用的信息喂给模型,把噪声挡在外面。它很容易和 Prompt Engineering 混在一起。
261283
262284Prompt Engineering 更偏提示词怎么写,Context Engineering 管得更宽,包括规则、记忆、工具描述、会话状态、外部观察结果、Token 预算。
263285
264- 这块展开讲内容很多,可以单独看这篇:[ 《提示词工程(Prompt Engineering)》] ( ./prompt-engineering.md ) 和 [ 《上下文工程(Context Engineering)》] ( ./context-engineering.md ) 。
286+ ![ Context Engineering 和 Prompt Engineering 差别] ( https://oss.javaguide.cn/github/javaguide/ai/context-engineering/context-engineering-vs-context-engineering-dimension-comparison.png )
287+
288+ 这块展开讲内容很多,可以单独看这篇:[ 《提示词工程(Prompt Engineering)》] ( https://javaguide.cn/ai/agent/prompt-engineering.html ) 和 [ 《上下文工程(Context Engineering)》] ( https://javaguide.cn/ai/agent/context-engineering.html ) 。
265289
266290## Agent 核心范式有哪些?
267291
@@ -413,7 +437,7 @@ Node 只做一件事,读取状态、执行逻辑、写回结果。节点里可
413437
414438“审核不通过就回到修改,最多重试 3 次”,翻译成图结构,是一条从 ReviewNode 指向 ReviseNode 的条件边,加上 ` iteration_count >= 3 ` 时跳到 ExitNode 的安全边界。State 里的 ` iteration_count ` 是让这条逻辑能跑起来的关键。
415439
416- 这套图结构比写死的 if-else 链更容易扩展,出了问题也好定位到哪个节点哪条边。LangGraph(Python)和 Spring AI Alibaba Graph(Java)都是基于这套思路实现的。详细设计和代码实现可以看:[ 《AI 工作流中的 Workflow、Graph 与 Loop》] ( ./ workflow-graph-loop.md ) 。
440+ 这套图结构比写死的 if-else 链更容易扩展,出了问题也好定位到哪个节点哪条边。LangGraph(Python)和 Spring AI Alibaba Graph(Java)都是基于这套思路实现的。详细设计和代码实现可以看:[ 《AI 工作流中的 Workflow、Graph 与 Loop》] ( https://javaguide.cn/ai/agent/ workflow-graph-loop.html ) 。
417441
418442### 什么时候用 Agent,什么时候用 Workflow?
419443
0 commit comments