Agent-Playbook

Name: Agent-Playbook
Author: sou350121

📊 PULSAR 照见 · 每日北京时间 12:00 更新，减少信息焦虑 — sou350121.github.io/pulsar-web

AI App 工程监控手册 — Pulsar 系统的 AI 工具与 Agent 情报臂，每日自动过滤 50+ 发布，提炼工程关键信号，持续追踪生产级架构模式与预测验证记录。

这是什么

Agent-Playbook 记录 AI 工具与 Agent 领域的工程级洞察：哪些值得投入、哪些存在生产陷阱、社区真实反馈如何分布。内容由 Pulsar 自动化流水线驱动，人工审校后归档。

与其他信息源的区别

维度	Twitter/X 信息流	GitHub Awesome 列表	微信公众号	Agent-Playbook
过滤深度	无 — 原始噪音	收录即存档，不淘汰	软文比例高	50+ → 5-10，qwen3.5-plus 评级门控
失效模式分析	极少	无	极少	架构深潜：并发陷阱、AI 代码盲区
社区信号	碎片化，不可搜索	无	无	Git 历史永久可检索
独立视角	无	无	无	Devil's Advocate — 对最强信号给出具体质疑
预测追责	无	无	无	双周预测 + ✅/❌ 验证记录，公开判断历史
跨域信号	无	无	无	与 VLA 机器人研究的交叉规则引擎

内容导航

目录	聚焦	更新频率
`landscape/`	AI 生态图谱：工具索引、技术全景、关键人物	月度
`theory/01-principles/`	底层原理：Transformer、RLVR、Scaling Law 等（11 篇）	按需
`theory/02-agent-design/`	Agent 设计：架构、记忆、工具、UI/API 设计（17 篇）	按需
`theory/03-engineering/`	Agentic 工程实战：护欄 / Context 工程 / 评估迭代（35 篇）★	按需
`theory/04-paradigm/`	范式转变：Vibe Coding、Software 3.0、Intent-Driven（11 篇）	按需
`theory/05-strategy/`	战略生存：工程师定位、变现、组织角色（13 篇）	按需
`theory/06-frontier/`	前沿研究：具身智能、世界模型、生物分子（7 篇）	按需
`playbooks/onboarding/`	8 阶段学习路径（思维 → 商业化）	稳定
`playbooks/tools/`	30+ 工具集成指南	工具发布后
`playbooks/prompts/`	12 个生产级 Prompt 模板	按需
`playbooks/use-cases/`	真实场景案例研究	按需
`playbooks/security/`	IDE 自动执行风险、权限边界	按需
`scaffolds/`	生产就绪项目模板（阿里云、DocOps）	按需
`reports/`	双周情报报告 + 预测验证	每两周
`memory/blog/archives/`	日报精选、社交情报归档	每日（自动）

theory/ 知识体系

Agentic Engineering 知识库（93篇）围绕三个核心张力构建，读懂它们就读懂了为什么 03-engineering/ 是整个体系的核心：

张力	核心命题	工程含义
委托 vs. 自动化	没有 scope 定义的 Agent = 责任真空	Task Packet 是最小委托合同
能力 vs. 可控性	越强大的 Agent 越需要分层信任架构	信任分层矩阵决定谁能做什么
速度 vs. 可靠性	评估是生产实践，不是测试阶段的事	eval loop 嵌入生产流程而非事后

[底层原理] ──▶ [Agent 设计] ──▶ [工程实战 ★]
     ↑               ↑               ↓
[前沿研究]       [范式转变]       [战略生存]

→ 完整学习指南 theory/README.md（含三条学习路径、精选必读、全部 93 篇索引）

自动化流水线（北京时间）

06:45  RSS 采集       50+ 来源：GitHub、Hacker News、ithome、36kr、少数派等
07:00  AI 日报        qwen3.5-plus 评级 → 5-10 条工程关键精选 → Telegram 推送
07:15  每日精选归档   ai-daily-pick.json 追加，Git 历史永久留存
07:45  社交情报采集   Twitter/X + 论坛，72h 时效窗口，去重过滤

深度分析（周二/四/六 15:30）

架构深潜：失效模式、AI 代码盲区、并发陷阱、生产部署反模式。

双周节律

预测生成 → 下期验证（✅ 准确 / ❌ 偏差）→ 归档，判断历史完全透明。

信号标签体系

重要性分级

标签	含义
⚡	战略级 — 影响技术选型或架构走向
🔧	可操作 — 近期可落地的工程实践
📖	参考 — 背景知识，按需查阅
❌	不收录 — 噪音、重复、软文

方向标注

标签	含义
🎯	主方向 — 当前核心关注域
`[方向名]`	团队专项追踪（如 `[Coding Agent]`、`[RAG]`）

Devil's Advocate — 独立质疑机制

对每日评为 ⚡/🔧 的最强信号，流水线额外生成一条具体反驳：

🔥 最强反驳

[信号名]：具体质疑角度（禁止空话）

目的是对抗确认偏误，保留判断的独立性。

假设追踪与月度校准

流水线维护 19 条 AI App 领域假设，置信度每月自动校准：

日常信号触发时实时比对假设清单
大佬观点（Karpathy / Altman / LeCun 等）与假设冲突时标注假设序号
月度汇总：置信度上下浮动上限 ±0.08，更新 watch-list

校准记录归档于 memory/，可通过 MCP get_predictions 接口查询。

Pulsar 自动化系统

本仓库内容由 Pulsar 驱动生成：

开源模板：sou350121/Pulsar-KenVersion
技术栈：Python 3.11 + DashScope (qwen3.5-plus) + Telegram Bot + GitHub Contents API
自托管，2GB RAM 约束下稳定运行，无外部 SaaS 依赖

如需复用本系统监控其他领域，参考 Pulsar-KenVersion 的 setup.sh 一键部署流程。

姊妹仓库

VLA-Handbook — Pulsar 系统的机器人视觉-语言-动作研究臂，追踪 VLA 论文、SOTA 进展与具身智能理论。

跨域规则引擎在两个仓库的信号之间建立连接：AI App 领域出现 embodied AI 实践突破，或 VLA 领域的扩展律研究影响 Agent 架构选型时，自动触发跨域洞察。

贡献与使用

内容归档由自动化流水线写入，人工内容请参阅 CONTRIBUTING.md
Agent 行为规范参见 AGENT_CONSTITUTION.md
多 Agent 协作约定参见 AGENTS.md

许可证

内容以 CC BY 4.0 授权。引用时注明出处即可。