Skip to content

sou350121/Agent-Playbook

Repository files navigation

Agent-Playbook

Agent-Playbook

CC BY 4.0 PRs Welcome Auto-updated PULSAR 照见 RSS 订阅 Daily Pulse

📊 PULSAR 照见 · 每日北京时间 12:00 更新,减少信息焦虑 — sou350121.github.io/pulsar-web

📈 Daily Pulse · 12 个 AI Agent 方法族 + 3 大竞争对(SINGLE vs SWARM / ACT vs THINK / OPEN vs CLOSED)· 每日自动生成

📡 RSS 订阅 · AI 每日 + 周/双周报告直达你的阅读器 · 完整使用说明

🎯 速查表 (Cheat Sheet) · Agent 框架对比 · Prompt 模式 · 评测体系 · 失效模式 T1-T7

全中文 · AI Agent 工程情报终端

AI Agent 领域每天 50+ 工具 / 论文 / 公告,95% 是噪音。 这个 Playbook 做一件事:把"该投入"和"是炒作"之间的边界,每天画清楚。

93 篇 theory(6 个主题模块 × Agentic Engineering 三支柱核心)· 30+ 工具集成指南 · 12 个生产级 Prompt 模板 · 19 条 AI App 假设(月度置信度校准)· 12 期双周预测(✅/❌ 历史可查)· 每日自动 pipeline(⚡ 信号评级 · Devil's Advocate 反驳 · 跨域引擎)


三句话说清楚这个 Playbook 的价值

  1. 不是新闻流,是过滤器:50+ 原始信号 → qwen3.5-plus 评级(⚡战略 / 🔧可操作 / 📖参考 / ❌噪音)→ 每日 5-10 条精选 + 一条独立反驳(Devil's Advocate)
  2. 预测可追责:12 期双周报告公开了每一条预测的 ✅准确 / ❌偏差。判断错了不藏起来——错的方式比"只发对的"更值得读
  3. 假设可校准:维护 19 条领域假设 + 月度置信度浮动(±0.08)。当 Karpathy / Altman / LeCun 等观点与现有假设冲突,自动标注需重新评估的假设序号

🔥 三个其他地方没有的能力

Agent-Playbook 与公众号 / Twitter / Awesome 列表的根本差异,浓缩在三件事上。

🛡️ Devil's Advocate · 独立质疑机制

对每日评为 ⚡/🔧 的最强信号,流水线额外生成一条具体反驳:

🔥 最强反驳

  • [信号名]:具体质疑角度(禁止空话 · 禁止"但需要时间验证"这类废话)

目的是对抗确认偏误——再热的信号,也要有人公开质疑它的假设。这不是公平守则,是认识论纪律

📋 Predictions · 公开判断历史

每两周一次预测 → 下一期回头验证

预测样例 验证
03-25 "agentic_coding 三个月内出现 framework 收敛"
03-25 "MCP 在 6 个月内成为 IDE 必备"
04-08 "Claude/OpenAI Agents SDK 会让 LangChain 退场"
04-08 "context engineering 优先级超过 RAG" ❌ 反向

📎 完整记录:reports/ · 12 期预测 · 公开置信度浮动 ±0.08/月

🎯 Hypothesis Tracking · 假设动态校准

维护 19 条 AI App 领域假设,置信度每月自动浮动(上限 ±0.08):

  • 日常信号触发时实时比对假设清单
  • 大佬观点(Karpathy / Altman / LeCun 等)与现有假设冲突 → 自动标注假设序号
  • 月度汇总更新 watch-list · 校准记录归档于 memory/,可通过 MCP get_predictions 接口查询

为什么重要:单纯收集信息会让人越读越确信自己已有的判断(确认偏误)。维护可校准的假设是把"信号 → 判断 → 偏差 → 修正"做成显式循环,而不是隐式凭感觉。


📡 订阅 · 让信号主动找到你

不想每天来刷?订阅 RSS feed,新内容自动推送到阅读器:

Feed 内容 链接
📘 AI 每日 每日 5-10 条 ⚡🔧 精选 + 深度解读 ai-daily.xml
📚 周/双周报告 前瞻侦察 + 回顾分析(含预测验证) weekly.xml

🎁 一键全订阅OPML 导入文件(Feedly / Inoreader / NetNewsWire 都支持)

📖 完整使用说明docs/SUBSCRIBE.md — 含各阅读器教学、CC BY 4.0 说明、FAQ


与其他 AI 信息源的区别

读 AI Agent 信息,大多数人用这五种方式——先说各自真正好在哪:

Twitter/X:实时第一手 + 作者反应,但碎片化、不可搜索、算法埋没 GitHub Awesome 列表:经典资源书签,但收录即存档、不淘汰、不评级 微信公众号:中文综述编辑质量稳定,但软文比例高、90 天后限流 Hacker News:高质量讨论 + 票选机制,但英文 + 偏 SaaS 视角 Discord/官方博客:第一手发布,但需要主动追踪每个项目

选 Agent-Playbook:每日自动过滤 + 评级 + 反驳 + 验证——不是再增加一条信息流,而是替你做完判断

维度 Twitter/X Awesome 列表 公众号 HN Discord/Blog Agent-Playbook
过滤深度 ❌ 原始噪音 ❌ 收录即存档 ⚠️ 软文比例高 ⚠️ 票选粗筛 ❌ 全量 50+ → 5-10 评级门控
失效分析 ⚠️ 极少 ⚠️ 偶尔 架构深潜
独立质疑 ⚠️ comments 有 Devil's Advocate
预测追责 双周 ✅/❌ 历史
假设校准 19 假设 + 月度置信度浮动
历史可检索 ❌ 算法埋没 ✅ 静态 ❌ 90d 失效 ✅ 但散乱 ⚠️ Discord 失效 Git 永久 grep

先看这几篇(30 分钟内建立正确框架)

按依赖顺序排列——每一篇回答上一篇读完后自然产生的问题。

# 文章 解决什么
1 playbooks/onboarding/01-mindset-shift.md 从"用 ChatGPT"切到"建 Agent"的思维迁移 5 min
2 theory/03-engineering/delegation-not-automation-... 为什么没有 scope 的 Agent 是责任真空 — Task Packet 即委托合同 8 min
3 theory/03-engineering/trust-tier-design.md T0-T3 信任分层 · 谁能做什么 · 何时升级人工 10 min
4 theory/03-engineering/agent-failure-taxonomy.md T1-T7 失效分类(含 MAST 研究 1600+ trace 实证) 12 min
5 theory/03-engineering/eval-loop-as-production-practice.md 为什么 eval 是生产实践不是测试阶段 10 min
6 theory/03-engineering/context-engineering-field-guide.md Context 工程 · 不是 prompt engineering 的延伸 12 min
7 PULSE.md 当下生态实时图 · 12 家族 + 3 竞争对 3 min

➡️ 速查(看完上面再用):cheat-sheet/ — Frameworks / Prompts / Eval / Failure Modes 四份对应速查


theory/ 知识体系(93 篇 · 6 模块)

围绕三个核心张力构建——读懂它们就读懂了为什么 03-engineering/ 是整个体系的支柱:

张力 核心命题 工程含义
委托 vs. 自动化 没有 scope 定义的 Agent = 责任真空 Task Packet 是最小委托合同
能力 vs. 可控性 越强大的 Agent 越需要分层信任架构 T0-T3 信任分层决定谁能做什么
速度 vs. 可靠性 评估是生产实践,不是测试阶段的事 eval loop 嵌入生产流程而非事后
                ┌─────────────────────────┐
                │  03-engineering ★ (35)  │  ← 三支柱核心
                │  护栏 · Context · Eval  │
                └────────────▲────────────┘
                             │
   ┌─────────────────────────┼─────────────────────────┐
   ▼                         │                         ▼
01-principles            02-agent-design        04-paradigm
原理 (11)                设计 (17)              范式 (11)
   │                         │                         │
   └─────────────────────────┴─────────────────────────┘
                             │
                ┌────────────▼────────────┐
                │     05-strategy (13)    │
                │  战略生存 · 落地变现     │
                └────────────▲────────────┘
                             │
                ┌────────────┴────────────┐
                │   06-frontier (7)       │
                │  前沿 · 具身 · 世界模型  │
                └─────────────────────────┘

完整学习指南 theory/README.md · 含三条学习路径(开发者 / 架构师 / 战略) · 精选必读 · 全部 93 篇索引


内容地图

目录 聚焦 更新
📊 PULSE.md 12 方法族趋势 + 3 竞争对(每日图) 每日(自动)
🎯 cheat-sheet/ Frameworks / Prompts / Eval / Failure T1-T7 按需
🗺️ landscape/ AI 生态图谱 · 工具索引 · 关键人物 月度
📐 theory/01-06/ 6 模块 × 93 篇知识体系 按需
🛣️ playbooks/onboarding/ 8 阶段学习路径(思维 → 商业化) 稳定
🔧 playbooks/tools/ 30+ 工具集成指南 工具发布后
💬 playbooks/prompts/ 12 个生产级 Prompt 模板 按需
🎬 playbooks/use-cases/ 真实场景案例 按需
🔐 playbooks/security/ IDE 自动执行风险 · 权限边界 按需
🏗️ scaffolds/ 生产就绪项目模板 按需
📑 reports/ 双周深度 + 预测验证 每两周
📦 memory/blog/archives/ 日报精选 · 社交情报归档 每日(自动)

自动更新时刻表(北京时间)

06:45  RSS 采集       50+ 来源 · GitHub / HN / 36kr / ithome / Simon Willison Blog ...
07:00  AI 日报        qwen3.5-plus 评级 → 5-10 条精选 → Telegram 推送
07:15  归档           ai-daily-pick.json 追加 · Git 历史永久留存
07:45  社交情报       Twitter/X + 论坛 · 72h 时效窗口 · 去重过滤
12:00  Daily Pulse    field-state 快照 → assets/ai-method-trends.{svg,md}
15:30  深度分析       周二/四/六 · 失效模式 · 并发陷阱 · AI 代码盲区

双周节律:预测生成 → 下期验证 → 归档 · 判断历史完全公开reports/


信号评级系统

标签 含义 通常含义
战略级 影响技术选型 / 架构走向 / 半年内不会过时
🔧 可操作 近期可落地的工程实践 / 有具体使用路径
📖 参考 背景知识 · 按需查阅
不收录 噪音 · 重复 · 软文

方向标注:🎯 当前主方向 · [Coding Agent] [RAG] [MCP] 等 — 团队专项追踪


背后的系统:照见 Pulsar

本仓库内容由 Pulsar 照见 驱动生成:

  • 🔓 开源模板sou350121/Pulsar-KenVersion — 一键部署到自己的服务器
  • ⚙️ 技术栈:Python 3.11 + DashScope (qwen3.5-plus) + Telegram Bot + GitHub Contents API
  • 💾 资源约束:自托管 · 2GB RAM 稳定运行 · 无外部 SaaS 依赖
  • 🌐 可视化前端Pulsar 照见 网站 · Astro 5 + Tailwind v4

如需复用本系统监控其他领域(量化交易 / 法律科技 / 游戏行业等),参考 Pulsar-KenVersion 的 setup.sh 一键部署流程。


贡献与使用

引用规范:sou350121 · Agent-Playbook · https://github.com/sou350121/Agent-Playbook · CC BY 4.0


许可证

内容以 Creative Commons Attribution 4.0 (CC BY 4.0) 授权 — 可自由转载 / AI 训练 / 商用,只需署名。

代码部分(如 scripts/scaffolds/)若有不同许可,以各文件 header 为准。


Agent-Playbook · Filtered, not flooded · Powered by Pulsar 照见

About

⚗️ AI Agent 生态每天海量资讯,99% 是噪音。这个仓库只做一件事:把最新碎片信号提纯为你能直接用的架构导轨、设计模式和工程实践。

Topics

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors