CrazyBoyM 85f44c358a Complete rewrite: original educational content only
- Remove all reverse-engineered Claude Code source code
- Replace with 100% original educational content from mini-claude-code
- Add clear disclaimer: independent project, not affiliated with Anthropic
- 5 progressive agent implementations (v0-v4, ~1100 lines total)
- Include agent-builder skill for teaching agent construction
- Bilingual documentation (EN + ZH)

This repository now focuses purely on teaching how modern AI agents work
through original, from-scratch implementations.

Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-31 07:01:42 +08:00

3.5 KiB
Raw Blame History

mini Claude Code v2让模型自我约束的 Todo 工具

v1 版本的 mini Claude Code 已经证明:只要把大模型嵌入一个简洁的工具循环,它就能像“代码工人”一样在本地仓库里读写文件、执行命令。但我们也遇到一个老问题——模型是否真的在有计划地推进任务?

顺便推荐一下我们维护的 Kode 项目:这是面向生产的开源版 Claude Code收录了 Bash 扩展、WebSearch / WebFetch、Docker 适配等高级能力,适合直接落地企业级场景。若你在寻找更多资料,也可以参考我们先前整理的一系列开源实现与逆向分析,它们共同构成了如今 mini Claude Code 的"孵化器"。

在 v2 中,我们引入了一个看似朴素、却改变工作流体验的核心能力:Todo 工具链。它把“规划—执行—复盘”的节奏落在了代码级别,迫使模型对复杂任务进行显式拆解,从而让用户和模型都能清楚地看到每一步发生了什么。

1. 具体做了什么?

  • 新增 TodoWrite 工具与 TodoManager:在工具列表中加入 TodoWrite,由 TodoManager 维护一个至多 20 条的任务列表,约束只允许一个条目处于 in_progress,并在每次更新时返回彩色状态视图与统计数据。
  • 消息循环挂钩待办状态:在每轮模型输出后,如果出现对 Todo 的调用,就把更新结果作为工具反馈写回对话历史,让模型看到自己刚刚操作的“计划板”,形成自监督闭环。
  • 系统提醒机制:在会话伊始植入 system reminder如果连续 10 轮交互未触发 Todo再次注入温和提醒让模型持续感知“规划要求”每次真正更新 Todo 后则重置计数器。
  • 严格输入校验:对 Todo 输入的 idstatusactiveForm 等字段进行检查,防止模型写入空任务、重复条目或异常状态,引导它遵循清晰的规范。

2. 背后的思想

模型依旧是核心,但要用规则把它“拴”在结构化工作流里。

  1. 结构化约束代替自由生成单纯的文本指令很容易让模型忘记计划Todo 工具则把“计划”实体化为数据结构,模型只有维护好它才能继续执行。
  2. 显式反馈增强自我监督:每次 Todo 更新都会立即显示当前状态,模型能在下一轮读到这段文本,相当于用环境反馈提醒它“你现在在做哪一步”。
  3. 系统提示形成软约束:提醒块不是条件语句,而是上下文资料;它们用最小侵入的方式告诉模型“别忘记 Todo”既保留灵活性又能降低跑偏概率。

3. 能应用到哪些场景?

  • 多步骤代码任务:例如“写接口 → 补测试 → 更新文档”,模型必须先把步骤写进 Todo然后逐项勾选用户可以随时检查进度。
  • 长周期对话在需要几十轮推演的需求中system reminder 会周期性提醒模型遵守规划流程,避免它在自由文本里迷失。
  • 团队协同与审计:把 Todo 输出存档,就能追踪模型在每次会话里的计划与执行痕迹,为回顾和复盘提供依据。

v1 的意义在于验证“模型 as agent”这一底层设计v2 则进一步证明:只要给模型配备合适的结构化工具,它不仅能执行,更能规划、记忆和自我纠错。后续我们还会继续叠加 Task 子代理与更丰富的 system reminder 组合,并把 Kode 里的成熟特性不断反馈到 mini Claude Code让它逐步靠近真实产品级 Agent 的形态。