mirror of https://github.com/shareAI-lab/analysis_claude_code.git synced 2026-02-04 13:16:37 +08:00

CrazyBoyM 85f44c358a Complete rewrite: original educational content only

- Remove all reverse-engineered Claude Code source code
- Replace with 100% original educational content from mini-claude-code
- Add clear disclaimer: independent project, not affiliated with Anthropic
- 5 progressive agent implementations (v0-v4, ~1100 lines total)
- Include agent-builder skill for teaching agent construction
- Bilingual documentation (EN + ZH)

This repository now focuses purely on teaching how modern AI agents work
through original, from-scratch implementations.

Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>

2025-12-31 07:01:42 +08:00

3.5 KiB

Raw Blame History

mini Claude Code v2：让模型自我约束的 Todo 工具

v1 版本的 mini Claude Code 已经证明：只要把大模型嵌入一个简洁的工具循环，它就能像“代码工人”一样在本地仓库里读写文件、执行命令。但我们也遇到一个老问题——模型是否真的在有计划地推进任务？

顺便推荐一下我们维护的 Kode 项目：这是面向生产的开源版 Claude Code，收录了 Bash 扩展、WebSearch / WebFetch、Docker 适配等高级能力，适合直接落地企业级场景。若你在寻找更多资料，也可以参考我们先前整理的一系列开源实现与逆向分析，它们共同构成了如今 mini Claude Code 的"孵化器"。

在 v2 中，我们引入了一个看似朴素、却改变工作流体验的核心能力：Todo 工具链。它把“规划—执行—复盘”的节奏落在了代码级别，迫使模型对复杂任务进行显式拆解，从而让用户和模型都能清楚地看到每一步发生了什么。

1. 具体做了什么？

新增 TodoWrite 工具与 TodoManager：在工具列表中加入 TodoWrite，由 TodoManager 维护一个至多 20 条的任务列表，约束只允许一个条目处于 in_progress，并在每次更新时返回彩色状态视图与统计数据。
消息循环挂钩待办状态：在每轮模型输出后，如果出现对 Todo 的调用，就把更新结果作为工具反馈写回对话历史，让模型看到自己刚刚操作的“计划板”，形成自监督闭环。
系统提醒机制：在会话伊始植入 system reminder，如果连续 10 轮交互未触发 Todo，再次注入温和提醒，让模型持续感知“规划要求”；每次真正更新 Todo 后则重置计数器。
严格输入校验：对 Todo 输入的 id、status、activeForm 等字段进行检查，防止模型写入空任务、重复条目或异常状态，引导它遵循清晰的规范。

2. 背后的思想

模型依旧是核心，但要用规则把它“拴”在结构化工作流里。

结构化约束代替自由生成：单纯的文本指令很容易让模型忘记计划，Todo 工具则把“计划”实体化为数据结构，模型只有维护好它才能继续执行。
显式反馈增强自我监督：每次 Todo 更新都会立即显示当前状态，模型能在下一轮读到这段文本，相当于用环境反馈提醒它“你现在在做哪一步”。
系统提示形成软约束：提醒块不是条件语句，而是上下文资料；它们用最小侵入的方式告诉模型“别忘记 Todo”，既保留灵活性，又能降低跑偏概率。

3. 能应用到哪些场景？

多步骤代码任务：例如“写接口 → 补测试 → 更新文档”，模型必须先把步骤写进 Todo，然后逐项勾选，用户可以随时检查进度。
长周期对话：在需要几十轮推演的需求中，system reminder 会周期性提醒模型遵守规划流程，避免它在自由文本里迷失。
团队协同与审计：把 Todo 输出存档，就能追踪模型在每次会话里的计划与执行痕迹，为回顾和复盘提供依据。

v1 的意义在于验证“模型 as agent”这一底层设计；v2 则进一步证明：只要给模型配备合适的结构化工具，它不仅能执行，更能规划、记忆和自我纠错。后续我们还会继续叠加 Task 子代理与更丰富的 system reminder 组合，并把 Kode 里的成熟特性不断反馈到 mini Claude Code，让它逐步靠近真实产品级 Agent 的形态。

3.5 KiB Raw Blame History Unescape Escape

mini Claude Code v2：让模型自我约束的 Todo 工具

1. 具体做了什么？

2. 背后的思想

3. 能应用到哪些场景？

3.5 KiB

Raw Blame History