Files
gui-yue 1baf1aca5a Follow up PR #265: refine chapters, diagrams, and add S20 (#283)
* feat: s01-s14 docs quality overhaul — tool pipeline, single-agent, knowledge & resilience

Rewrite code.py and README (zh/en/ja) for s01-s14, each chapter building
incrementally on the previous. Key fixes across chapters:

- s01-s04: agent loop, tool dispatch, permission pipeline, hooks
- s05-s08: todo write, subagent, skill loading, context compact
- s09-s11: memory system, system prompt assembly, error recovery
- s12-s14: task graph, background tasks, cron scheduler

All chapters CC source-verified. Code inherits fixes forward (PROMPT_SECTIONS,
json.dumps cache, real-state context, can_start dep protection, etc.).

* feat: s15-s19 docs quality overhaul — multi-agent platform: teams, protocols, autonomy, worktree, MCP tools

Rewrite code.py and README (zh/en/ja) for s15-s19, the multi-agent platform
chapters. Each chapter inherits all previous fixes and adds one mechanism:

- s15: agent teams (TeamCreate, teammate threads, shared task list)
- s16: team protocols (plan approval, shutdown handshake, consume_inbox)
- s17: autonomous agents (idle polling, auto-claim, consume_lead_inbox)
- s18: worktree isolation (git worktree, bind_task, cwd switching, safety)
- s19: MCP tools (MCPClient, normalize_mcp_name, assemble_tool_pool, no cache)

All appendix source code references verified against CC source. Config priority
corrected: claude.ai < plugin < user < project < local.

* fix: 5 regressions across s05-s19 — glob safety, todo validation, memory extraction, protocol types, dep crash

- s05-s09: glob results now filter with is_relative_to(WORKDIR) (inherited from s02)
- s06-s08: todo_write validates content/status required fields (inherited from s05)
- s09: extract_memories uses pre-compression snapshot instead of compacted messages
- s16: submit_plan docstring clarifies protocol-only (not code-level gate)
- s17-s19: match_response restores type mismatch validation (from s16)
- s17-s19: claim_task deps list handles missing dep files without crashing

* fix: s12 Todo V2 logic reversal, s14/s15 cron range validation, s18/s19 worktree name validation

- s12 README (zh/en/ja): fix Todo V2 direction — interactive defaults to Task,
  non-interactive/SDK defaults to TodoWrite. Fix env var name to
  CLAUDE_CODE_ENABLE_TASKS (not TODO_V2).
- s14/s15: add _validate_cron_field with per-field range checks (minute 0-59,
  hour 0-23, dom 1-31, month 1-12, dow 0-6), step > 0, range lo <= hi.
  Replace old try/except validation that only caught exceptions.
- s18/s19: add validate_worktree_name() to remove_worktree and keep_worktree,
  not just create_worktree.

* fix: align s16-s19 teaching tool consistency

* fix pr265 chapter diagrams

* Add comprehensive s20 harness chapter

* Fix chapter smoke test regressions

* Clarify README tutorial track transition

---------

Co-authored-by: Haoran <bill-billion@outlook.com>
2026-05-20 21:45:38 +08:00

14 KiB
Raw Permalink Blame History

s16: Team Protocols — チームメイト間には取り決めが必要

中文 · English · 日本語

s01 → ... → s14 → s15 → s16s17 → s18 → s19 → s20

"チームメイト間には取り決めが必要" — request-response パターンが全てのネゴシエーションを駆動。

Harness 層: プロトコル — Agent 間の構造化ハンドシェイク。


課題

s15 のチームメイトは仕事ができるが、連携は緩いLead がメッセージを送り、チームメイトが返信するだけで、構造化されたプロトコルがない。2 つのシナリオで問題が露呈する:

シャットダウンLead が Alice にシャットダウンを頼む。スレッドを強制終了すると、書きかけのファイルがディスクに残る。ハンドシェイクが必要Lead がリクエストを送信、Alice が收尾後に確認。

計画承認Bob が認証モジュールのリファクタリングを提案、高リスク操作。Lead が Bob の計画を確認し、承認後に実行すべき。

これら 2 つのシナリオは同じ構造:一方がリクエストを送信、もう一方が返信、両者は同じ ID で関連付けられる。状態機械が追跡pending → approved / rejected。


ソリューション

Team Protocols Overview

教学版は前章までの Agent 能力の流れを受け継ぎ、S15 のチーム通信の上に構造化プロトコルを追加する。プロトコル機構に集中するため、完全なエラーリカバリ、メモリ、スキルシステムは省略。追加:ProtocolState(リクエスト状態追跡)、dispatch_message(メッセージタイプ別ルーティング)、match_responserequest_id でリクエストとレスポンスを関連付け、型検証付き)。

2 つのプロトコル、1 つの仕組み:

プロトコル 方向 用途
shutdown_request / response Lead → チームメイト 丁寧なシャットダウンハンドシェイク
plan_approval_request / response チームメイト → Lead 計画承認プロトコルの例

教学版は計画承認の request-response メッセージフローをデモするが、実行ゲーティング(未承認時の bash/write_file 拦截)は未実装。真实 CC にはチームメイト向けの permission gating 機構がある。


仕組み

ProtocolState: リクエスト状態

各プロトコルリクエストは、送信者、受信者、現在の状態、ペイロードを記録する状態レコードを作成:

@dataclass
class ProtocolState:
    request_id: str      # 一意 ID、例 "req_004281"
    type: str            # "shutdown" | "plan_approval"
    sender: str          # 送信者
    target: str          # 受信者
    status: str          # pending | approved | rejected
    payload: str         # 計画テキストまたはシャットダウン理由
    created_at: float    # タイムスタンプ

pending_requests: dict[str, ProtocolState] = {}

リクエスト送信時にレコードを作成、レスポンス受信時に request_id で該当レコードを見つけて状態を更新。

4 ステッププロトコルフロー

シャットダウンを例にした完全な流れ:

1. Lead がリクエスト送信
   req_id = new_request_id()           # "req_004281"
   pending_requests[req_id] = ProtocolState(type="shutdown", status="pending", ...)
   BUS.send("lead", "alice", "shutdown_request", metadata={"request_id": req_id})

2. チームメイト受信 → dispatch
   inbox = BUS.read_inbox("alice")
   msg_type = msg["type"]              # "shutdown_request"
   → handle_shutdown_request() にルーティング

3. チームメイト返信
   BUS.send("alice", "lead", "shutdown_response",
            metadata={"request_id": req_id, "approve": True})

4. Lead がレスポンス受信 → match
   match_response("shutdown_response", req_id, approve=True)
   pending_requests[req_id].status = "approved"

request_id はチェーン全体を貫く関連キー、リクエストが持ち出し、レスポンスが持ち帰る。

dispatch_message: タイプ別ルーティング

チームメイトの inbox は通常メッセージとプロトコルメッセージの両方を受信。handle_inbox_message がメッセージタイプで振り分け:

def handle_inbox_message(name, msg, messages):
    msg_type = msg.get("type", "message")
    req_id = msg.get("metadata", {}).get("request_id", "")

    if msg_type == "shutdown_request":
        BUS.send(name, "lead", "Shutting down.", "shutdown_response",
                 {"request_id": req_id, "approve": True})
        return True   # ループ停止

    if msg_type == "plan_approval_response":
        approve = msg["metadata"].get("approve", False)
        messages.append({"role": "user",
            "content": "[Plan approved]" if approve else "[Plan rejected]"})
    return False       # 継続

新しいプロトコルタイプの追加は新しい if 分岐を追加するだけ。

match_response: 型検証

match_responserequest_id で状態を見つけるだけでなく、レスポンスタイプがリクエストタイプと一致するか検証:

def match_response(response_type, request_id, approve):
    state = pending_requests.get(request_id)
    if not state:
        return
    if state.type == "shutdown" and response_type != "shutdown_response":
        return  # タイプ不一致、スキップ
    if state.type == "plan_approval" and response_type != "plan_approval_response":
        return
    if state.status != "pending":
        return  # 既に解決済み、重複をスキップ
    state.status = "approved" if approve else "rejected"

shutdown_response が誤って plan_approval リクエストを承認することはない。

統一 inbox コンシューマconsume_lead_inbox

check_inbox ツールとメインループ末尾の両方が同じ consume_lead_inbox() 関数を呼び出す。プロトコルメッセージを先にルーティングしてから残りの内容を返す。メッセージが消費されてもプロトコル状態が更新されない問題を防ぐ:

def consume_lead_inbox(route_protocol=True) -> list[dict]:
    msgs = BUS.read_inbox("lead")
    if route_protocol:
        for msg in msgs:
            meta = msg.get("metadata", {})
            req_id = meta.get("request_id", "")
            msg_type = msg.get("type", "")
            if req_id and msg_type.endswith("_response"):
                match_response(msg_type, req_id, meta.get("approve", False))
    return msgs

メインループは inbox メッセージを history に注入し、LLM が確認して反応できるようにする。

チームメイト idle loop終了ではなく待機

s15 のチームメイトは 10 ラウンドで終了。s16 のチームメイトは LLM が非 tool_use を返した後 idle 待機に入るinbox をポーリング、shutdown_request に応答して終了、または新メッセージで作業継続。

LLM が非 tool_use を返す
  → idle: 毎秒 inbox をポーリング
  → shutdown_request 受信 → shutdown_response 返信 → 終了
  → 新メッセージ受信 → messages に注入 → LLM ターン継続

教学版は Lead への idle_notification を省略。真实 CC は idle 時に idle_notification を送信、Lead はチームメイトが空いていることを知り、新しいタスクを割り当て可能。

組み合わせて実行

1. Lead: "Alice にファイルを作成させ、その後シャットダウン"
2. Lead → spawn_teammate("alice", "backend", "config.py を作成")
3. alice スレッド起動 → write_file("config.py", "...") → 完了 → idle
4. Lead → request_shutdown("alice")
   → BUS.send("shutdown_request", {request_id: "req_000142"})
5. alice idle ポーリング受信 → handle_shutdown_request
   → BUS.send("shutdown_response", {request_id: "req_000142", approve: True})
6. Lead consume_lead_inbox → match_response("req_000142", approve=True)
   → pending_requests["req_000142"].status = "approved"
   → inbox メッセージが history に注入、LLM がシャットダウン結果を確認

シャットダウンハンドシェイク完了:リクエスト → 確認 → シャットダウン。各ステップは request_id で追跡。


s15 からの変更

コンポーネント 変更前 (s15) 変更後 (s16)
連携方法 緩いテキストメッセージ 構造化 request-response プロトコル
リクエスト追跡 なし ProtocolState + pending_requests dict
メッセージルーティング 全てテキストとして処理 dispatch_message がタイプ別にルーティング
シャットダウン 自然終了またはスレッド強制終了 request_id ハンドシェイク機構
計画承認 なし メッセージフローの例(実行ゲーティングなし)
新規メッセージ型 message, result + shutdown_request/response, plan_approval_request/response
チームメイトライフサイクル 最大 10 ラウンド idle loopinbox メッセージを待機)
Lead inbox check_inbox とメインループが別々に読み取り 統一 consume_lead_inbox
Lead ツール 14 (s15) 14コアツールセットに request_shutdown、request_plan、review_plan を追加)
チームメイトツール 4 (s15) + submit_plan (5)

試してみる

cd learn-claude-code
python s16_team_protocols/code.py

以下のプロンプトを試してください:

  1. Spawn alice as a backend dev. Ask her to create a file. Then request her shutdown.
  2. Spawn bob with a refactoring task. Have him submit a plan first. Then review and approve it.

観察ポイント:シャットダウンハンドシェイクは完了しているか(リクエスト → 確認 → シャットダウン)?pending_requests の状態は正しく遷移しているか?request_id はリクエストとレスポンス間で一貫しているかidle チームメイトは shutdown_request を受信できるか?


次の章

s15-s16 では、Lead が各チームメイトにタスクを割り当てる必要がある。"Alice はこれ、Bob はあれ"。ボードに 10 個の未認領タスクがあれば、Lead が手動で assign しなければならない。

チームメイトが自分でボードを見て認領できたらどうかLead はタスクを作成するだけで、チームメイトが自分で発見、認領、完了する。

s17 Autonomous Agents → チームメイトの自己組織化、リーダーの割り当て不要。

CC ソースコード深掘り

CC のチームプロトコル実装(teammateMailbox.ts、1184 行は教学版と同じコア構造request_id + approve/reject の request-response パターン。違いは以下の通り:

シャットダウンプロトコルCC のシャットダウンは三方向通信(teammateMailbox.ts:720-763SendMessageTool.ts:268-430。Lead が shutdown_request を送信、チームメイトが shutdown_approved(または理由付き shutdown_rejected)で返信、システムが teammate_terminated で全関係者に通知。確認後、システムが自動的に panetmux/iTerm2をクリーンアップ、タスクを unassign、team config からメンバーを削除(useInboxPoller.ts:677-800)。教学版は shutdown_response で統一命名、真实源码は shutdown_approvedshutdown_rejected の 2 つの独立したメッセージ型に分割。

計画承認:真实源码では plan approval request は ExitPlanModeV2Tool.ts:263-312 で plan-mode-required チームメイトが plan mode を終了する際に生成される。useInboxPoller.ts:599-661 は現在自動的に approval を書き戻し、リクエストを Lead にコンテキストregular messageとして渡す。SendMessageTool.ts:434-518 は明示的な approve/reject response 能力を保持、承認時に同時に permissionMode を設定可能(例:"承認するが plan mode で実行")、レスポンスにはチームメイトが修正して再提出するための feedback 文字列を含めることができる。単純な「Lead が手動で review_plan ツールを使う」フローではない。

メッセージ形式CC のプロトコルメッセージは構造化 JSONZod schema 検証付き)、教学版はシンプルな type + metadata dict。フィールド名も統一されていないpermission は request_idteammateMailbox.ts:453-462、shutdown と plan approval は requestIdteammateMailbox.ts:684-763)。

実行ゲーティングCC のチームメイトには完全な permission gating がある。未承認の高リスク操作は拦截され、オプションではない。教学版はメッセージフローのみをデモ。

汎用性:教学版の 1 つの FSMpending → approved | rejectedが 2 つのプロトコルに対応する簡略化は正しい。CC の全プロトコルメッセージは同じ request id 関連機構を共有。