这个 GitHub 爆火的文件规划 Skill 到底能干嘛?实测来了
前言:为什么 AI Agent 总做着做着就”忘了初心”?
用过 Claude Code、Codex、Cursor 等 AI 编程工具的开发者,大概率遇到过这个场景:
你让 Agent 帮你重构一个模块,它前 10 步还干得风生水起,到了第 30 步突然开始写一些跟原始目标完全不相关的代码。你问它为什么要改那个文件,它答不上来——因为它已经”忘了”最初要做什么了。
这不是 Agent 笨,这是上下文窗口(Context Window)的物理限制。就像人的短期记忆一样,塞太多东西之后,最早的信息就被挤出去了。
今天我们要介绍的这个 Skill,就是为了解决这个问题而生的——而且它背后的灵感来源相当硬核:Manus,那个被 Meta 以 20 亿美金收购的 AI Agent 公司。
原始项目简介
| 项目 | 详情 |
|---|---|
| 仓库 | OthmanAdi/planning-with-files |
| GitHub 星数 | 20,400+ ⭐ |
| 许可证 | MIT |
| 最后更新 | 2026 年 5 月 |
| 语言 | Python(脚本部分) |
这个项目的核心理念非常简单粗暴,但极其有效:
上下文窗口 = 内存(易失的、有限的) 文件系统 = 磁盘(持久的、无限的) 任何重要的东西,写到磁盘上。
核心功能:三个文件撑起整个工作流
这个 Skill 的核心机制就是用 3 个 Markdown 文件 来替代 Agent 的”大脑记忆”:
1. task_plan.md — 任务计划
这是你的”导航仪”。它记录:
- 任务目标(Goal)
- 阶段划分(Phases),每个阶段标记为
[ ](未完成)或[x](已完成) - 关键问题(Key Questions)
- 已做出的决策(Decisions Made)
- 遇到的错误(Errors Encountered)
2. findings.md — 研究发现
这是你的”笔记本”。所有研究过程中发现的内容都写到这里:
- 搜索结果摘要
- 代码分析结论
- API 文档要点
- 设计决策理由
3. progress.md — 进度日志
这是你的”操作日志”。实时记录:
- 每个操作做了什么
- 测试结果
- 临时想法
最让我拍案叫绝的几个设计
🎯 “两步规则”(The 2-Action Rule)
每进行 2 次浏览/搜索操作后,立即将关键发现保存到文本文件。
这个规则解决了一个痛点:Agent 用浏览器看了 10 个网页,结果第 11 步时已经把前面 10 个网页的内容全忘了。两步规则强制 Agent 定期”存档”,确保信息不丢失。
🔄 “决策前重读计划”模式
这是 Manus 能执行约 50 次工具调用而不迷失方向的核心秘诀:
[已经执行了很多工具调用...][上下文变得越来越长...][原始目标可能已经被遗忘了...]
→ 读取 task_plan.md ← 这步让目标重新进入注意力窗口!→ 现在做决策 ← 目标是新鲜的就像一个飞行员在长途飞行中时不时看一眼导航仪一样。
🛡️ “三次失败协议”
Agent 犯错不可怕,可怕的是重复犯同样的错。这个 Skill 定义了一个清晰的错误处理流程:
第 1 次:诊断并修复(针对性)第 2 次:换方法/换工具/换库(替代方案)第 3 次:质疑假设、搜索方案、更新计划(重新思考)3 次后:升级给用户,说明尝试过什么📊 读 vs 写决策矩阵
什么时候该读?什么时候该写?Skill 里有一张清晰的决策矩阵:
| 场景 | 操作 | 原因 |
|---|---|---|
| 刚写了文件 | 不要再读 | 内容仍在上下文中 |
| 查看了图片/PDF | 立即写入 | 多模态内容会丢失 |
| 开始新阶段 | 读取计划 | 重新定位目标 |
| 发生错误 | 读取相关文件 | 获取当前状态来修复 |
实际使用场景
场景 1:研究任务
“调研一下 Next.js 15 的新特性,写一份总结”
Agent 会:
- 先创建
task_plan.md,列出要调研的方向 - 搜索每个方向,把结果写入
findings.md - 综合所有发现,写总结文档
- 更新
task_plan.md标记完成
场景 2:Bug 修复
“修复登录模块的 Bug”
Agent 会:
- 创建计划,列出排查步骤
- 定位代码,记录发现
- 尝试修复,记录每次错误
- 验证修复,标记完成
场景 3:功能开发
“给设置页面加一个深色模式切换”
Agent 会:
- 先调研现有主题系统,写入
findings.md - 制定实施计划到
task_plan.md - 分阶段实现,每完成一步更新进度
- 测试验证,交付成果
适用场景 vs 不适用场景
✅ 适合用
- 多步骤任务(3 步以上)
- 研究类任务(需要大量信息搜集)
- 构建/创建项目(需要规划架构)
- 需要大量工具调用的长任务
- 任何需要”保持方向感”的任务
❌ 不适合用
- 简单问答(“这个函数什么意思?”)
- 单文件小修改(“把这个变量名改一下”)
- 快速查找(“帮我找一下配置文件在哪”)
与同类工具的对比
| 维度 | planning-with-files | TodoWrite | 无规划直接干 |
|---|---|---|---|
| 上下文持久化 | ✅ 文件持久 | ❌ 会话内有效 | ❌ 完全依赖上下文 |
| 会话恢复 | ✅ 重启后自动恢复 | ⚠️ 部分恢复 | ❌ 完全丢失 |
| 错误追踪 | ✅ 结构化记录 | ⚠️ 散落在对话中 | ❌ 无记录 |
| 决策质量 | ✅ 决策前重读计划 | ⚠️ 依赖短期记忆 | ❌ 容易偏离方向 |
| 上手成本 | 中等(需创建 3 个文件) | 低 | 无 |
个人评价:★★★★★
我给这个 Skill 打 5 星(满分 5 星),理由如下:
- 理念简单但极其有效:核心就一句话”写到文件里”,但效果立竿见影
- 源自经过验证的架构:基于 Manus 的实际工作模式,不是纸上谈兵
- 跨平台兼容:Claude Code、Codex、Cursor、OpenCode 等都能用
- 开源且活跃维护:MIT 许可,版本已迭代到 2.36+,社区活跃
唯一的小门槛是:你需要在每次复杂任务开始前花 1 分钟创建 3 个规划文件。但一旦习惯了这个流程,你会发现 Agent 的执行质量和稳定性有明显提升——尤其是在长任务中,它再也不会”做着做着就跑题了”。
如何使用
如果你也在使用 Claude Code 或类似的 AI Agent 工具,可以按照以下步骤上手:
- 安装 Skill(将 SKILL.md 放入你的 Agent 技能目录)
- 开始复杂任务前,创建三个文件:
task_plan.md、findings.md、progress.md - 按照 Skill 中的规则执行:两步存档、决策前重读、错误必记录
- 享受更稳定、更有条理的 Agent 协作体验
参考链接:
文章分享
如果这篇文章对你有帮助,欢迎分享给更多人!