ai-collaboration-notebook
Health Pass
- License — License: MIT
- Description — Repository has a description
- Active repo — Last push 0 days ago
- Community trust — 37 GitHub stars
Code Warn
- Code scan incomplete — No supported source files were scanned during light audit
Permissions Pass
- Permissions — No dangerous permissions requested
No AI report is available for this listing yet.
让 AI 主动记错题、自我迭代的协作机制 · A framework that makes your AI reflect on its own mistakes and stop repeating them
AI 协作错题本 · AI Collaboration Mistake-Log
让 AI 助手主动反思、迭代式优化协作质量的轻量机制
不是「列规则」,是「建反馈循环」
A lightweight framework that makes your AI assistant reflect on its own mistakes — and stop repeating them.
Works with Claude · Cursor · Gemini · ChatGPT · 任何能读 Markdown 规则的 AI 助手
🌏 Docs are in Chinese. Fastest way to read them? Ask your AI to summarize — which is, quite literally, what this repo is about.
🤖 AI 用户:直接读 AGENTS.md,一个文件包含完整协议 + 错题本,无需跨文件跳转。
AI assistants: fetch AGENTS.md directly — all content in one file.
📖 是什么 • ⚠️ 痛点 • 🏗 架构 • 🔄 v2 更新 • 🚀 开始用 • 📜 协作协议 • 📓 错题本
这是什么
跟 AI 协作久了你会发现:AI 经常犯同一种错,纠正成本极高,规则越列越多但 AI 选择性遵守。
这是一套已经跑了几个月的协作机制,核心思想:
把 AI 协作当工程问题做反馈循环,不当玄学碰运气。
它由三份文档组成——一份 协作协议(AI 该怎么和你配合)+ 一份 错题本(AI 犯错时主动记录、复发 3 次升级为新协议)+ 一份 CLAUDE.md(自动加载层,触发上面两份的读取)。
v2 更新了什么
这个仓库的卖点是"机制自我迭代"——v2 就是迭代真实发生的证据:
- "事不过三"升级机制第一次完整跑通:根因「完工验证不彻底」复发 5 次后正式升级为规则 16,不再是设计稿
- 机制自己长胖了,被同一套方法修好:错题本 800+ 行 → 分层精炼到约 150 行 + 根因聚类视图 + 规则退役机制(升级加规则、退役减规则,加减对称)
- 自动加载层升级为"核心卡 + 意图路由表":开工不再全文读两个长文件,按任务类型决定深读什么
- 新增规则 12-16 + 5 个新案例——含一条所有 AI 用户都该警惕的 🔴「编造工具输出」
完整故事见 CHANGELOG.md。
你大概率经历过这些瞬间
| 场景 | 你心里的 OS |
|---|---|
| AI 说"已修复 X"——你跑代码发现没修 | 它怎么又这样 |
| AI 信誓旦旦说"这个做不到"——你换个问法发现能做到 | 它在编造限制 |
| 同一个错改了 3 次还在犯 | 我是不是该换个工具 |
| 写了 5000 字 CLAUDE.md / .cursorrules,AI 第三轮就忘了 | 规则太多没用 |
| AI 不被你追问,就发现不了它说错了 | 这才是最可怕的 |
这套机制不能让 AI 不犯错,但能让重复同类错的概率降下来 + 纠正成本随时间下降。
核心创新(7 个)
跟 GitHub 上常见的 awesome-cursor-rules 类项目比,那些是列规则,这个是反馈循环机制:
- 「沉默错误」概念——专盯"用户不追问就发现不了"的错,不是泛泛防 AI 出错
- 思维根因 vs 知识根因——不写"下次注意 X",深挖"哪一步思维方式错了"
- 「事不过三」升级阈值——同一根因复发 3 次才升级为硬规则,防规则膨胀(v2 里它第一次完整跑通)
- 三层架构:观察层 ↔ 规则层 ↔ 自动加载层,闭环升级
- 「动作 ≠ 结果」反射——AI 说"已 X"必须对应真实工具调用
- 规则退役机制(v2 新增)——与升级对称的"减法":根因休眠 → 规则降级。只增不减的规则体系必然膨胀
- 核心卡 + 意图路由表(v2 新增)——高频反射常驻上下文,长文档按需深读,治"读了规则不用规则"
三层架构(v2)
┌──────────────────────────────────────────────┐
│ CLAUDE.md (自动加载层) │
│ 内嵌「核心卡」:30 秒自检 + 16 条规则速查 │
│ + 意图路由表(按任务类型决定深读什么) │
├──────────────────────────────────────────────┤
│ PROTOCOL.md (规则层) │
│ 16 条协作规则——按路由表对应规则按需深读 │
├──────────────────────────────────────────────┤
│ MISTAKE-LOG.md (观察层,v2 起内部分两档) │
│ 活跃层:根因索引 + 聚类视图(开工扫这个) │
│ 归档层:完整推理路径(复盘才读) │
│ ↑ AI 每次犯错主动追加 │
│ ↑ 同根因 ≥ 3 次 → 升级到规则层 │
│ ↓ 根因休眠 2 次回顾 → 规则退役降级 │
└──────────────────────────────────────────────┘
为什么需要三层:
- 单层(只有 CLAUDE.md):规则爆炸、AI 选择性遵守
- 双层(CLAUDE.md + 规则):规则不变,无法吸取新教训
- 三层:错题本是观察池,规则是稳定提炼,CLAUDE.md 是触发器——形成闭环
- v2 教训:三层闭环只解决"怎么学新教训",不解决"学多了怎么办"——所以补了分层精炼 + 退役机制 + 核心卡,给系统装上"减"的能力
冷启动指南
第一周:只做"记"
不要一上来就写一堆规则。AI 每犯一个错你主动指出 + 让 AI 自己分析根因写进 MISTAKE-LOG.md。目标:攒 5-8 条错题,看 AI 经常犯哪几类错。
第一个月:开始"升级"
翻一遍错题本,找复发的根因。同一根因 ≥ 3 次 → 升级为 PROTOCOL.md 硬规则。目标:建立你自己的协作协议(5-10 条)。
第三个月起:定期回顾
每 2 周一次"错题本健康检查":同根因复发间隔是不是在拉长?🔴 占比有没有下降?过时规则要删掉。目标:把机制本身也当作可优化对象。
真实案例预览
错题本里 11 个高代表性案例(脱敏后开源版):
| # | 标题 | 根因 |
|---|---|---|
| 1 | 把 OAuth 403 误判为"地区限制" | 推测当事实、证据缺口用猜测填空 |
| 2 | merge 提交信息夸大"人工核验通过" | 动作 ≠ 结果、能渲染 ≠ 已核验 |
| 3 | 把别的 AI 判定的"性格弱点"当事实写进档案 | 没追溯来源、推测当事实 |
| 4 | HTML 整合堆砌行业黑话,未配生活化比喻 | 读了规则没在每一步用 |
| 5 | 共享日志里别人做的事被当成自己功劳 | 跨实例协作的责任归属 |
| 6 | 过度防御"内容纪律",忽视"视觉品质" | 上次教训过度泛化 |
| 7 🆕 | 编造工具输出:把"我以为会发生"当成"已经发生" | 完成欲压过真实性——推测当事实的极端形态 |
| 8 🆕 | 听到持久偏好只口头答应,没落盘 | 口头确认 ≠ 持久化 |
| 9 🆕 | 验证只查"正面"漏查"反面"——留下鬼影 | 虚假确信:贴了证据没证到点子上 |
| 10 🆕 | 用肉眼数网格坐标,反复偏错 | 把不可靠输入当客观工具 |
| 11 🆕 | 3D 模型只验"出现"没验"完整"——规则 16 诞生 | 完工验证不彻底(第 5 次复发,触发升级) |
每条都包含:现象 → 真相 → 错误推理路径 → 思维根因 → 预防规则。
仓库内容
| 文件 | 用途 |
|---|---|
| README.md | 本文件 |
| PROTOCOL.md | AI 该怎么跟你配合——16 条协作规则 + 自动加载层核心卡 + HITL 工作流 |
| MISTAKE-LOG.md | AI 协作误判记录 + 思维根因分析 + 升级/退役机制 |
| CHANGELOG.md | v1 → v2 的进化记录——机制自我迭代的证据 |
| AGENTS.md | 单文件合并版,给 AI 直接读 |
适合谁
- 跟 AI 协作做正经活的人:PM、研发、设计师、写作者、研究者……
- 觉得 AI 经常"犯傻"但又必须用它的人
- 看不上"列 100 条规则"那种 .cursorrules 模板的人
- 想沉淀自己跟 AI 协作方法论的人
它的局限
❌ 不能让 AI 不犯错(即使升级硬规则后,本机制案例显示规则 7 对应根因仍累计复发 11 次——纯文字规则有上限)
❌ 不能全自动维护(需要你主动指出错误、让 AI 记录)
❌ 不能跨工具直接迁移(每个 AI 工具的"读规则"行为不一样,需要适配)
✅ 能显著降低同类错误反复出现的频率
✅ 能让你的纠正成本随时间下降
✅ 能让协作方法论变得可见、可分享、可迭代
怎么贡献
欢迎:
- Issue:你跟 AI 协作时遇到的"沉默错误"案例
- PR:补充新的错题本案例(脱敏后)、修订规则、增加冷启动指南细节
- 讨论:你自己的协作机制对比
唯一要求:新增的错题条目必须包含「思维根因」和「预防规则」两节——不要只发"AI 又错了"的吐槽。
它是怎么来的
作者是 AI 产品经理(独立做事),编程小白,每天用 Claude Code / Cursor 协作 8+ 小时。跑了几个月发现 AI 同一类错反复出现——于是开始记错题本。攒到 30+ 条后发现"事不过三"是个好阈值。
机制本身也在持续迭代——v1 发布两周后机制自己就长出了 5 条新规则和 3 个新机制,见 CHANGELOG。
License
MIT —— 随便用、随便改、欢迎在你的项目里挂出处。
这个仓库本身就在用错题本机制持续迭代。
如果你看到 README 里有让你疑惑的地方,那可能就是下一条错题。
Reviews (0)
Sign in to leave a review.
Leave a reviewNo results found