Subagent-Lifecycle v5 运行评估

评估时间: 2026-04-29 17:45 CST
评估范围: 3 批共 8 个子 agent
评估者: xiaomimi 🐱

总体结果: ✅ 成功

8/8 子 agent 全部产出完整报告，全部转 HTML 上线 GitHub Pages。

各批次详况

Batch 1 (13:24 spawn, 三路并行)

任务	report.md	HTML	归档	质量
coding-agent-benchmark	22.7KB	✅	✅	4 工具对比+benchmark+costs
crawl-framework	13KB+17KB代码+5.6KB skill	✅	✅	产出最全
agent-context-protocol	30.7KB+18.6KB代码	✅	✅	业界参考+协议设计

skill 暴露的问题: - 上一个 session 误判（并行 completion event 未独立处理）→ v5 已修 - 子 agent prompt 里写了 $WORKSPACE/sessions.jsonl，isolated context 无法展开 → v5 已修（职责归主 agent）

Batch 2 (16:32 spawn, 三路并行)

任务	report.md	HTML	归档	质量
codex-deploy-guide	21.6KB	✅	✅	Lightsail/EC2/GitHub Actions三个场景
gitnexus-review	15.9KB	✅	✅	能力边界+许可证风险分析
yixing-travel-plan	11.4KB	✅	✅	3天行程+宠物友好+充电站

skill 暴露的问题: 子 agent 产出 HTML 报错无回滚机制（降级到 raw markdown 即可）

Batch 3 (17:33 spawn, 两路并行)

任务	report.md	HTML	归档	质量
getnotes-analysis	11.1KB	✅	✅	模型溯源+prompt engineering分析
gov-doc-chatbot	35KB	✅	✅	4 公文体 prompt 模板+RAG 架构+成本估算

Skill 各阶段表现

Phase	行为	评价
1.1 Deny 拦截	8/8 正常通过，无 deny 命中	✅
1.2 Prompt 构建	v5 版本职责分界生效，子 agent 不再尝试写 sessions.jsonl	✅
1.3 Spawn	全部 timeoutSeconds:600，1 次 timeout（gov-doc-chatbot 实际 ~480s）	✅ 边界足够
1.4 登记	Batch 1 完整，Batch 2/3 registry 缺少 sessionKey	⚠️ 修复中
Phase 2 监控	在 session 切换中 completion event 正确到达	✅
3.1 收集	优先读 archive → fallback 读 report.md	✅
3.4 Registry 更新	部分更新（Batch 1 完整，Batch 2/3 需要补）	⚠️
4.1-4.3 归档	sessions.jsonl + MEMORY.md + registry archived	✅
4.4 GitHub Pages	全部 8 份 HTML 上线，索引自动更新	✅
4.4 Telegram 通知	按新规则只发链接，不发文件	✅

发现的问题

1. Registry 数据不完整（中等）

Batch 2/3 的 registry 记录 sessionKey 字段丢失（显示为 ?），根因是 Phase 3.4/4.3 的 shell 脚本变量 $KEY 在 session 切换后未正确获取。不影响产出（HTML 都在），但 registry 作为单一事实源不可靠。

修复: 在 Phase 3.4/4.3 前从 subagent-archive/<label>.md 的 YAML frontmatter 中提取 sessionKey。

2. 子 agent 自归档覆盖率不完整（低）

8 个任务只有 batch 1 的 3 个写了 subagent-archive。后续任务的自归档文件位置分散（被写在各自的 PROJECT_DIR 下而非统一的 subagent-archive/）。Phase 3.1 的 fallback 到 report.md 缓解了影响。

修复: Phase 3.1 增加搜索逻辑——先搜统一目录，再搜 PROJECT_DIR。

3. gov-doc-chatbot 接近超时（低）

实际运行约 480s，600s 超时刚好兜住。该任务涉及大量 web_search + RAG 架构设计+prompt 模板生成，合并在一个子 agent 里偏重。

建议: 若单任务预计 tool call > 20 次，考虑拆成两个子 agent（调研 + 设计）。

与 v4 对比

维度	v4 表现	v5 改进
职责分界	子 agent 尝试写 sessions.jsonl 失败	✅ 子 agent 只写自归档+结果文件
路径变量	`$WORKSPACE` 无法展开	✅ prompt 中全部用绝对路径
并行处理	误判整批失败	✅ 独立处理每个 completion event
手机阅读	内联代码块体验差	✅ GitHub Pages HTML 暗色主题
prompt 具体性	无指导	✅ 1.2 节加经验表

综合评分

维度	评分	说明
可用性	⭐⭐⭐⭐⭐	8/8 任务产出完整，生产可用
健壮性	⭐⭐⭐⭐	Registry 小问题不影响产出，需修
可维护性	⭐⭐⭐⭐	审计/索引/归档链路清晰
自动化	⭐⭐⭐⭐⭐	spawn→产出→HTML→GitHub Pages 全自动
文档完整性	⭐⭐⭐⭐⭐	Skill 文档 v5 覆盖所有实战发现

结论: subagent-lifecycle v5 已达到生产可用级别。registry 字段提取问题修复后即可定稿。