Skip to content

Commit 503cf4f

Browse files
committed
docs(ai): 完善Agent介绍
1 parent 6680c6e commit 503cf4f

3 files changed

Lines changed: 49 additions & 17 deletions

File tree

docs/ai-coding/README.md

Lines changed: 4 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,13 +1,13 @@
11
---
22
title: AI 编程实战指南:Claude Code、Cursor、Codex、Trae 使用技巧与面试题
3-
description: AI 编程面试与实战学习路线,涵盖 Claude Code、Cursor、OpenAI Codex、Trae、CLI vs IDE 选型、多模型协同和代码审查
3+
description: AI 编程实战指南:Claude Code 使用技巧与核心命令、Vibe Coding 技巧、OpenAI Codex 最佳实践、Spec Coding 规范驱动编程、AI 代码审查与提交管理。覆盖工具选型、真实项目案例和 AI 编程面试题,帮你把 AI 编程工具用稳、用到生产级
44
category: AI 编程
55
tag:
66
- AI 编程
77
- AI 辅助开发
88
- 开发效率
99
- 后端面试
10-
icon: "mdi:code-tags"
10+
icon: mdi:code-tags
1111
head:
1212
- - meta
1313
- name: keywords
@@ -24,6 +24,8 @@ head:
2424

2525
AI 编程工具好不好用,真不全看模型。很多时候,差别反而出在你怎么给上下文、怎么拆任务、怎么看 diff。
2626

27+
当然了,这不是说模型不重要,模型的质量是根本。但使用同样的模型,在不同的人手中最终达到的效果是差别很大的。
28+
2729
别把它想成“我把需求丢给 AI,然后代码自己就写好了”。真实项目里没这么轻松。更常见的是:AI 写到一半方向歪了,你得接回来;一次改太多文件,你得拆小;测试没过,你还得顺着错误往回追;它一本正经瞎编的时候,你得能看出来。
2830

2931
所以这个专题不会只聊“哪个工具最强”。Claude Code、Cursor、OpenAI Codex、Trae 都有能帮上忙的地方,关键是你得知道:什么时候让 AI 写代码,什么时候让它查资料、读代码,什么时候该自己上手。还有更重要的一点,出问题以后怎么回滚,怎么把影响控制住。

docs/ai-coding/deepseek-v4-claude-code.md

Lines changed: 7 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -53,7 +53,13 @@ npm install -g @anthropic-ai/claude-code
5353
}
5454
```
5555

56-
注意替换 `your_deepseek_api_key` 为你的 DeepSeek API Key。如果你使用的是 DeepSeek-V4-Flash,把 `ANTHROPIC_MODEL` 改为 `DeepSeek-V4-Flash` 即可。
56+
注意替换 `your_deepseek_api_key` 为你的 DeepSeek API Key。
57+
58+
API Key 创建地址:<https://platform.deepseek.com/>
59+
60+
![DeepSeek 创建 API Key](https://oss.javaguide.cn/github/javaguide/ai/coding/deepseek-api-keys.png)
61+
62+
如果你使用的是 DeepSeek-V4-Flash,把 `ANTHROPIC_MODEL` 改为 `DeepSeek-V4-Flash` 即可。
5763

5864
配置完成后启动 Claude Code:
5965

docs/ai/agent/agent-basis.md

Lines changed: 38 additions & 14 deletions
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: AI Agent 核心概念:Agent Loop、Context Engineering、Tools 注册
2+
title: AI Agent 核心概念:Agent Loop、Plan-and-Execute、A2A、Agentic Workflows、Tools 注册
33
description: 深入解析 AI Agent 核心概念,梳理从被动响应到常驻自治的演进历程,对比 Agent、传统编程、Workflow 的区别和适用场景。
44
category: AI 应用开发
55
head:
@@ -8,8 +8,6 @@ head:
88
content: AI Agent,智能体,ReAct,Function Calling,RAG,MCP,多智能体协作,Computer Use
99
---
1010

11-
<!-- @include: @article-header.snippet.md -->
12-
1311
第一次被 ChatGPT 震到的时候,很多人应该都还在研究 Prompt 怎么写。那时候它更像一个会聊天的知识库。你问,它答;你不问,它也不会自己动。三年过去,AI 已经不只是在聊天框里回复文字了。它开始会调用工具,会读文件,会跑代码,甚至能操作电脑界面。
1412

1513
再往前走一步,就是现在大家反复提到的 AI Agent。
@@ -30,9 +28,9 @@ AI Agent 不是突然冒出来的。它大概经历了几次明显变化。
3028

3129
**2022 年,ChatGPT 这类产品刚火的时候**,大家主要还在和模型“对话”。能力很强,但它只能基于已有知识回答问题,不能主动调用外部工具,也不能自己完成操作。
3230

33-
当时最重要的玩法是 Prompt Engineering。你把提示词写得越清楚,它回答得越稳。
31+
当时最重要的玩法是 [Prompt Engineering](https://javaguide.cn/ai/agent/prompt-engineering.html)。你把提示词写得越清楚,它回答得越稳。
3432

35-
但它还是不能动
33+
但它本质上还是会说,不是会做
3634

3735
**2023 年中,Function Calling 出现后,事情开始变了。**
3836

@@ -42,15 +40,39 @@ LLM 可以调用外部 API,不再只是生成文字。RAG 也开始大规模
4240

4341
**2023 年底,大家开始重视编排。**
4442

45-
ReAct 这种推理框架逐渐被接受,多智能体协作也开始被讨论。Coze、Dify 这类平台把开发门槛降了下来,用 DAG(有向无环图)来约束执行流程,避免 AutoGPT 那种完全放飞的自治方式。
43+
ReAct 这种推理框架逐渐被接受。模型不只是直接给答案,而是先思考下一步要做什么,再决定是否调用工具,然后根据工具返回结果继续推理。
44+
45+
多 Agent 协作也开始被讨论。比如一个 Agent 负责规划,一个 Agent 负责执行,一个 Agent 负责检查。
46+
47+
Coze、Dify 这类平台把开发门槛降了下来,用 DAG(有向无环图)来约束执行流程,避免 AutoGPT 那种完全放飞的自治方式。
4648

4749
**2024 年底,标准化和多模态开始变重要。**
4850

49-
MCP 协议出现,解决工具接入碎片化的问题。Computer Use 让 Agent 可以操作图形界面。Cursor 这类 AI 编程工具也把 "Vibe Coding" 带火了。
51+
[MCP 协议](https://javaguide.cn/ai/agent/mcp.html)出现,解决工具接入碎片化的问题。Computer Use 让 Agent 可以操作图形界面。
52+
53+
AI 编程工具也在这个阶段快速发展。Cursor、Claude Code、Codex 这类工具把代码库阅读、修改、测试、提交串了起来,“Vibe Coding”也在这个阶段被更多人讨论。
54+
55+
**2025 年,Agent 开始往长任务执行方向走。**
56+
57+
这一年,Agent 不再只是一次对话里的助手,而是开始变成可以接任务、跑流程、产出结果的工作单元。
58+
59+
Agent Skills 这类机制也开始出现。很多任务不是一句 Prompt 就能做好,而是需要固定流程、上下文、模板、脚本和校验规则。Skill 做的就是把这些方法封装下来,让 Agent 遇到类似任务时按既定流程执行。
5060

51-
**2025 年,Agent 开始往常驻自治方向走**
61+
**到了 2026 年,Agent 开始更接近长期在线的数字工作单元**
5262

53-
Agent Skills、Heartbeat 这类机制成熟后,Agent 可以在后台长时间运行,也开始强调本地数据主权。
63+
OpenClaw 这类项目把 Skills 和 Heartbeat 推到更显眼的位置。
64+
65+
Skills 负责封装能力,Heartbeat 负责周期性唤醒 Agent,让它检查消息、处理任务、更新状态,而不是只能等用户下一次提问。
66+
67+
不过,Heartbeat 不等于真正的连续意识,它更像定时唤醒;本地数据主权也不等于绝对安全。只要 Agent 能安装 Skill、访问文件、执行脚本,就会带来新的权限、沙箱和供应链风险。
68+
69+
Harness Engineering 也开始被更多人讨论。
70+
71+
可以简单理解为:Agent = Model + Harness。模型负责推理和生成,Harness 负责把模型放进一个可执行、可观察、可恢复、可验证的工作环境里。
72+
73+
大家不再只盯着模型参数、上下文长度和 Prompt 技巧,开始更关注模型外面的工程环境。
74+
75+
**后续发展展望。**
5476

5577
再往后看,几个方向会继续推进:内建记忆、预测能力,以及从数字世界扩展到物理机器人。
5678

@@ -215,7 +237,7 @@ OpenAI Schema 解决数据格式问题,MCP 解决通信接入问题。
215237

216238
Claude Code、Cursor 这类工具已经原生支持这套模式,会自动扫描项目里的 `.claude/skills/` 目录,由模型自己判断哪个 Skill 该激活。
217239

218-
纯代码封装、调用路径固定,用 Toolkits。团队经验沉淀、任务流程灵活,用 Agent Skills 更合适。更详细的 Skills 工程实践——包括路由设计、SKILL.md 写法避坑、第三方 Skill 安全审计,可以看:[《Agent Skills 详解》](./skills.md)
240+
纯代码封装、调用路径固定,用 Toolkits。团队经验沉淀、任务流程灵活,用 Agent Skills 更合适。更详细的 Skills 工程实践——包括路由设计、SKILL.md 写法避坑、第三方 Skill 安全审计,可以看:[《Agent Skills 详解》](https://javaguide.cn/ai/agent/skills.html)
219241

220242
### 通信接入:MCP 协议
221243

@@ -251,17 +273,19 @@ JSON Schema 是数据格式,MCP 是通信协议层。
251273

252274
Prompt(提示词)可以简单理解为给大语言模型下达的指令。Prompt Engineering 就是怎么把这条指令写清楚,让模型输出更可控。关键在边界是否清晰——指令越模糊,模型越容易乱猜;指令越结构化,输出就越稳定。
253275

254-
这块展开讲内容很多,可以单独看这篇:[《提示词工程(Prompt Engineering)》](./prompt-engineering.md)
276+
这块展开讲内容很多,可以单独看这篇:[《提示词工程(Prompt Engineering)》](https://javaguide.cn/ai/agent/prompt-engineering.html)
255277

256278
## 什么是 Context Engineering?
257279

258-
很多 Agent 做不好,不是模型太弱,而是上下文太乱。
280+
很多时候, Agent 做不好,不是模型能力太多,而是上下文太乱。
259281

260282
Context Engineering 做的事情,就是在有限 Token 窗口里,把最有用的信息喂给模型,把噪声挡在外面。它很容易和 Prompt Engineering 混在一起。
261283

262284
Prompt Engineering 更偏提示词怎么写,Context Engineering 管得更宽,包括规则、记忆、工具描述、会话状态、外部观察结果、Token 预算。
263285

264-
这块展开讲内容很多,可以单独看这篇:[《提示词工程(Prompt Engineering)》](./prompt-engineering.md)[《上下文工程(Context Engineering)》](./context-engineering.md)
286+
![Context Engineering 和 Prompt Engineering 差别](https://oss.javaguide.cn/github/javaguide/ai/context-engineering/context-engineering-vs-context-engineering-dimension-comparison.png)
287+
288+
这块展开讲内容很多,可以单独看这篇:[《提示词工程(Prompt Engineering)》](https://javaguide.cn/ai/agent/prompt-engineering.html)[《上下文工程(Context Engineering)》](https://javaguide.cn/ai/agent/context-engineering.html)
265289

266290
## Agent 核心范式有哪些?
267291

@@ -413,7 +437,7 @@ Node 只做一件事,读取状态、执行逻辑、写回结果。节点里可
413437

414438
“审核不通过就回到修改,最多重试 3 次”,翻译成图结构,是一条从 ReviewNode 指向 ReviseNode 的条件边,加上 `iteration_count >= 3` 时跳到 ExitNode 的安全边界。State 里的 `iteration_count` 是让这条逻辑能跑起来的关键。
415439

416-
这套图结构比写死的 if-else 链更容易扩展,出了问题也好定位到哪个节点哪条边。LangGraph(Python)和 Spring AI Alibaba Graph(Java)都是基于这套思路实现的。详细设计和代码实现可以看:[《AI 工作流中的 Workflow、Graph 与 Loop》](./workflow-graph-loop.md)
440+
这套图结构比写死的 if-else 链更容易扩展,出了问题也好定位到哪个节点哪条边。LangGraph(Python)和 Spring AI Alibaba Graph(Java)都是基于这套思路实现的。详细设计和代码实现可以看:[《AI 工作流中的 Workflow、Graph 与 Loop》](https://javaguide.cn/ai/agent/workflow-graph-loop.html)
417441

418442
### 什么时候用 Agent,什么时候用 Workflow?
419443

0 commit comments

Comments
 (0)