📊 PULSAR 照见 · 每日北京时间 12:00 更新,减少信息焦虑 — sou350121.github.io/pulsar-web
📈 Daily Pulse · 12 个 AI Agent 方法族 + 3 大竞争对(SINGLE vs SWARM / ACT vs THINK / OPEN vs CLOSED)· 每日自动生成
📡 RSS 订阅 · AI 每日 + 周/双周报告直达你的阅读器 · 完整使用说明
🎯 速查表 (Cheat Sheet) · Agent 框架对比 · Prompt 模式 · 评测体系 · 失效模式 T1-T7
AI Agent 领域每天 50+ 工具 / 论文 / 公告,95% 是噪音。 这个 Playbook 做一件事:把"该投入"和"是炒作"之间的边界,每天画清楚。
93 篇 theory(6 个主题模块 × Agentic Engineering 三支柱核心)· 30+ 工具集成指南 · 12 个生产级 Prompt 模板 · 19 条 AI App 假设(月度置信度校准)· 12 期双周预测(✅/❌ 历史可查)· 每日自动 pipeline(⚡ 信号评级 · Devil's Advocate 反驳 · 跨域引擎)
- 不是新闻流,是过滤器:50+ 原始信号 → qwen3.5-plus 评级(⚡战略 / 🔧可操作 / 📖参考 / ❌噪音)→ 每日 5-10 条精选 + 一条独立反驳(Devil's Advocate)
- 预测可追责:12 期双周报告公开了每一条预测的 ✅准确 / ❌偏差。判断错了不藏起来——错的方式比"只发对的"更值得读
- 假设可校准:维护 19 条领域假设 + 月度置信度浮动(±0.08)。当 Karpathy / Altman / LeCun 等观点与现有假设冲突,自动标注需重新评估的假设序号
Agent-Playbook 与公众号 / Twitter / Awesome 列表的根本差异,浓缩在三件事上。
对每日评为 ⚡/🔧 的最强信号,流水线额外生成一条具体反驳:
🔥 最强反驳
- [信号名]:具体质疑角度(禁止空话 · 禁止"但需要时间验证"这类废话)
目的是对抗确认偏误——再热的信号,也要有人公开质疑它的假设。这不是公平守则,是认识论纪律。
每两周一次预测 → 下一期回头验证:
| 期 | 预测样例 | 验证 |
|---|---|---|
| 03-25 | "agentic_coding 三个月内出现 framework 收敛" | ✅ |
| 03-25 | "MCP 在 6 个月内成为 IDE 必备" | ✅ |
| 04-08 | "Claude/OpenAI Agents SDK 会让 LangChain 退场" | ⏳ |
| 04-08 | "context engineering 优先级超过 RAG" | ❌ 反向 |
📎 完整记录:reports/ · 12 期预测 · 公开置信度浮动 ±0.08/月
维护 19 条 AI App 领域假设,置信度每月自动浮动(上限 ±0.08):
- 日常信号触发时实时比对假设清单
- 大佬观点(Karpathy / Altman / LeCun 等)与现有假设冲突 → 自动标注假设序号
- 月度汇总更新 watch-list · 校准记录归档于
memory/,可通过 MCPget_predictions接口查询
为什么重要:单纯收集信息会让人越读越确信自己已有的判断(确认偏误)。维护可校准的假设是把"信号 → 判断 → 偏差 → 修正"做成显式循环,而不是隐式凭感觉。
不想每天来刷?订阅 RSS feed,新内容自动推送到阅读器:
| Feed | 内容 | 链接 |
|---|---|---|
| 📘 AI 每日 | 每日 5-10 条 ⚡🔧 精选 + 深度解读 | ai-daily.xml |
| 📚 周/双周报告 | 前瞻侦察 + 回顾分析(含预测验证) | weekly.xml |
🎁 一键全订阅:OPML 导入文件(Feedly / Inoreader / NetNewsWire 都支持)
📖 完整使用说明:docs/SUBSCRIBE.md — 含各阅读器教学、CC BY 4.0 说明、FAQ
读 AI Agent 信息,大多数人用这五种方式——先说各自真正好在哪:
Twitter/X:实时第一手 + 作者反应,但碎片化、不可搜索、算法埋没 GitHub Awesome 列表:经典资源书签,但收录即存档、不淘汰、不评级 微信公众号:中文综述编辑质量稳定,但软文比例高、90 天后限流 Hacker News:高质量讨论 + 票选机制,但英文 + 偏 SaaS 视角 Discord/官方博客:第一手发布,但需要主动追踪每个项目
选 Agent-Playbook:每日自动过滤 + 评级 + 反驳 + 验证——不是再增加一条信息流,而是替你做完判断。
| 维度 | Twitter/X | Awesome 列表 | 公众号 | HN | Discord/Blog | Agent-Playbook |
|---|---|---|---|---|---|---|
| 过滤深度 | ❌ 原始噪音 | ❌ 收录即存档 | ❌ 全量 | ✅ 50+ → 5-10 评级门控 | ||
| 失效分析 | ❌ | ❌ | ❌ | ✅ 架构深潜 | ||
| 独立质疑 | ❌ | ❌ | ❌ | ❌ | ✅ Devil's Advocate | |
| 预测追责 | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ 双周 ✅/❌ 历史 |
| 假设校准 | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ 19 假设 + 月度置信度浮动 |
| 历史可检索 | ❌ 算法埋没 | ✅ 静态 | ❌ 90d 失效 | ✅ 但散乱 | ✅ Git 永久 grep |
按依赖顺序排列——每一篇回答上一篇读完后自然产生的问题。
| # | 文章 | 解决什么 | ⏱ |
|---|---|---|---|
| 1 | playbooks/onboarding/01-mindset-shift.md |
从"用 ChatGPT"切到"建 Agent"的思维迁移 | 5 min |
| 2 | theory/03-engineering/delegation-not-automation-... |
为什么没有 scope 的 Agent 是责任真空 — Task Packet 即委托合同 | 8 min |
| 3 | theory/03-engineering/trust-tier-design.md |
T0-T3 信任分层 · 谁能做什么 · 何时升级人工 | 10 min |
| 4 | theory/03-engineering/agent-failure-taxonomy.md |
T1-T7 失效分类(含 MAST 研究 1600+ trace 实证) | 12 min |
| 5 | theory/03-engineering/eval-loop-as-production-practice.md |
为什么 eval 是生产实践不是测试阶段 | 10 min |
| 6 | theory/03-engineering/context-engineering-field-guide.md |
Context 工程 · 不是 prompt engineering 的延伸 | 12 min |
| 7 | PULSE.md |
当下生态实时图 · 12 家族 + 3 竞争对 | 3 min |
➡️ 速查(看完上面再用):cheat-sheet/ — Frameworks / Prompts / Eval / Failure Modes 四份对应速查
围绕三个核心张力构建——读懂它们就读懂了为什么 03-engineering/ 是整个体系的支柱:
| 张力 | 核心命题 | 工程含义 |
|---|---|---|
| 委托 vs. 自动化 | 没有 scope 定义的 Agent = 责任真空 | Task Packet 是最小委托合同 |
| 能力 vs. 可控性 | 越强大的 Agent 越需要分层信任架构 | T0-T3 信任分层决定谁能做什么 |
| 速度 vs. 可靠性 | 评估是生产实践,不是测试阶段的事 | eval loop 嵌入生产流程而非事后 |
┌─────────────────────────┐
│ 03-engineering ★ (35) │ ← 三支柱核心
│ 护栏 · Context · Eval │
└────────────▲────────────┘
│
┌─────────────────────────┼─────────────────────────┐
▼ │ ▼
01-principles 02-agent-design 04-paradigm
原理 (11) 设计 (17) 范式 (11)
│ │ │
└─────────────────────────┴─────────────────────────┘
│
┌────────────▼────────────┐
│ 05-strategy (13) │
│ 战略生存 · 落地变现 │
└────────────▲────────────┘
│
┌────────────┴────────────┐
│ 06-frontier (7) │
│ 前沿 · 具身 · 世界模型 │
└─────────────────────────┘
→ 完整学习指南 theory/README.md · 含三条学习路径(开发者 / 架构师 / 战略) · 精选必读 · 全部 93 篇索引
| 目录 | 聚焦 | 更新 |
|---|---|---|
📊 PULSE.md |
12 方法族趋势 + 3 竞争对(每日图) | 每日(自动) |
🎯 cheat-sheet/ |
Frameworks / Prompts / Eval / Failure T1-T7 | 按需 |
🗺️ landscape/ |
AI 生态图谱 · 工具索引 · 关键人物 | 月度 |
📐 theory/01-06/ |
6 模块 × 93 篇知识体系 | 按需 |
🛣️ playbooks/onboarding/ |
8 阶段学习路径(思维 → 商业化) | 稳定 |
🔧 playbooks/tools/ |
30+ 工具集成指南 | 工具发布后 |
💬 playbooks/prompts/ |
12 个生产级 Prompt 模板 | 按需 |
🎬 playbooks/use-cases/ |
真实场景案例 | 按需 |
🔐 playbooks/security/ |
IDE 自动执行风险 · 权限边界 | 按需 |
🏗️ scaffolds/ |
生产就绪项目模板 | 按需 |
📑 reports/ |
双周深度 + 预测验证 | 每两周 |
📦 memory/blog/archives/ |
日报精选 · 社交情报归档 | 每日(自动) |
06:45 RSS 采集 50+ 来源 · GitHub / HN / 36kr / ithome / Simon Willison Blog ...
07:00 AI 日报 qwen3.5-plus 评级 → 5-10 条精选 → Telegram 推送
07:15 归档 ai-daily-pick.json 追加 · Git 历史永久留存
07:45 社交情报 Twitter/X + 论坛 · 72h 时效窗口 · 去重过滤
12:00 Daily Pulse field-state 快照 → assets/ai-method-trends.{svg,md}
15:30 深度分析 周二/四/六 · 失效模式 · 并发陷阱 · AI 代码盲区
双周节律:预测生成 → 下期验证 → 归档 · 判断历史完全公开于 reports/
| 标签 | 含义 | 通常含义 |
|---|---|---|
| ⚡ | 战略级 | 影响技术选型 / 架构走向 / 半年内不会过时 |
| 🔧 | 可操作 | 近期可落地的工程实践 / 有具体使用路径 |
| 📖 | 参考 | 背景知识 · 按需查阅 |
| ❌ | 不收录 | 噪音 · 重复 · 软文 |
方向标注:🎯 当前主方向 · [Coding Agent] [RAG] [MCP] 等 — 团队专项追踪
本仓库内容由 Pulsar 照见 驱动生成:
- 🔓 开源模板:sou350121/Pulsar-KenVersion — 一键部署到自己的服务器
- ⚙️ 技术栈:Python 3.11 + DashScope (qwen3.5-plus) + Telegram Bot + GitHub Contents API
- 💾 资源约束:自托管 · 2GB RAM 稳定运行 · 无外部 SaaS 依赖
- 🌐 可视化前端:Pulsar 照见 网站 · Astro 5 + Tailwind v4
如需复用本系统监控其他领域(量化交易 / 法律科技 / 游戏行业等),参考 Pulsar-KenVersion 的 setup.sh 一键部署流程。
- 内容归档由自动化流水线写入 · 人工内容请参阅 CONTRIBUTING.md
- Agent 行为规范参见 AGENT_CONSTITUTION.md
- 多 Agent 协作约定参见 AGENTS.md
引用规范:sou350121 · Agent-Playbook · https://github.com/sou350121/Agent-Playbook · CC BY 4.0
内容以 Creative Commons Attribution 4.0 (CC BY 4.0) 授权 — 可自由转载 / AI 训练 / 商用,只需署名。
代码部分(如 scripts/、scaffolds/)若有不同许可,以各文件 header 为准。
Agent-Playbook · Filtered, not flooded · Powered by Pulsar 照见