这个 GitHub 爆火的文件规划 Skill 到底能干嘛?实测来了

1711 字
9 分钟
这个 GitHub 爆火的文件规划 Skill 到底能干嘛?实测来了

前言:为什么 AI Agent 总做着做着就”忘了初心”?#

用过 Claude Code、Codex、Cursor 等 AI 编程工具的开发者,大概率遇到过这个场景:

你让 Agent 帮你重构一个模块,它前 10 步还干得风生水起,到了第 30 步突然开始写一些跟原始目标完全不相关的代码。你问它为什么要改那个文件,它答不上来——因为它已经”忘了”最初要做什么了。

这不是 Agent 笨,这是上下文窗口(Context Window)的物理限制。就像人的短期记忆一样,塞太多东西之后,最早的信息就被挤出去了。

今天我们要介绍的这个 Skill,就是为了解决这个问题而生的——而且它背后的灵感来源相当硬核:Manus,那个被 Meta 以 20 亿美金收购的 AI Agent 公司。

原始项目简介#

项目详情
仓库OthmanAdi/planning-with-files
GitHub 星数20,400+ ⭐
许可证MIT
最后更新2026 年 5 月
语言Python(脚本部分)

这个项目的核心理念非常简单粗暴,但极其有效:

上下文窗口 = 内存(易失的、有限的) 文件系统 = 磁盘(持久的、无限的) 任何重要的东西,写到磁盘上。

核心功能:三个文件撑起整个工作流#

这个 Skill 的核心机制就是用 3 个 Markdown 文件 来替代 Agent 的”大脑记忆”:

1. task_plan.md — 任务计划#

这是你的”导航仪”。它记录:

  • 任务目标(Goal)
  • 阶段划分(Phases),每个阶段标记为 [ ](未完成)或 [x](已完成)
  • 关键问题(Key Questions)
  • 已做出的决策(Decisions Made)
  • 遇到的错误(Errors Encountered)

2. findings.md — 研究发现#

这是你的”笔记本”。所有研究过程中发现的内容都写到这里:

  • 搜索结果摘要
  • 代码分析结论
  • API 文档要点
  • 设计决策理由

3. progress.md — 进度日志#

这是你的”操作日志”。实时记录:

  • 每个操作做了什么
  • 测试结果
  • 临时想法

最让我拍案叫绝的几个设计#

🎯 “两步规则”(The 2-Action Rule)#

每进行 2 次浏览/搜索操作后,立即将关键发现保存到文本文件。

这个规则解决了一个痛点:Agent 用浏览器看了 10 个网页,结果第 11 步时已经把前面 10 个网页的内容全忘了。两步规则强制 Agent 定期”存档”,确保信息不丢失。

🔄 “决策前重读计划”模式#

这是 Manus 能执行约 50 次工具调用而不迷失方向的核心秘诀:

[已经执行了很多工具调用...]
[上下文变得越来越长...]
[原始目标可能已经被遗忘了...]
→ 读取 task_plan.md ← 这步让目标重新进入注意力窗口!
→ 现在做决策 ← 目标是新鲜的

就像一个飞行员在长途飞行中时不时看一眼导航仪一样。

🛡️ “三次失败协议”#

Agent 犯错不可怕,可怕的是重复犯同样的错。这个 Skill 定义了一个清晰的错误处理流程:

第 1 次:诊断并修复(针对性)
第 2 次:换方法/换工具/换库(替代方案)
第 3 次:质疑假设、搜索方案、更新计划(重新思考)
3 次后:升级给用户,说明尝试过什么

📊 读 vs 写决策矩阵#

什么时候该读?什么时候该写?Skill 里有一张清晰的决策矩阵:

场景操作原因
刚写了文件不要再读内容仍在上下文中
查看了图片/PDF立即写入多模态内容会丢失
开始新阶段读取计划重新定位目标
发生错误读取相关文件获取当前状态来修复

实际使用场景#

场景 1:研究任务#

“调研一下 Next.js 15 的新特性,写一份总结”

Agent 会:

  1. 先创建 task_plan.md,列出要调研的方向
  2. 搜索每个方向,把结果写入 findings.md
  3. 综合所有发现,写总结文档
  4. 更新 task_plan.md 标记完成

场景 2:Bug 修复#

“修复登录模块的 Bug”

Agent 会:

  1. 创建计划,列出排查步骤
  2. 定位代码,记录发现
  3. 尝试修复,记录每次错误
  4. 验证修复,标记完成

场景 3:功能开发#

“给设置页面加一个深色模式切换”

Agent 会:

  1. 先调研现有主题系统,写入 findings.md
  2. 制定实施计划到 task_plan.md
  3. 分阶段实现,每完成一步更新进度
  4. 测试验证,交付成果

适用场景 vs 不适用场景#

✅ 适合用#

  • 多步骤任务(3 步以上)
  • 研究类任务(需要大量信息搜集)
  • 构建/创建项目(需要规划架构)
  • 需要大量工具调用的长任务
  • 任何需要”保持方向感”的任务

❌ 不适合用#

  • 简单问答(“这个函数什么意思?”)
  • 单文件小修改(“把这个变量名改一下”)
  • 快速查找(“帮我找一下配置文件在哪”)

与同类工具的对比#

维度planning-with-filesTodoWrite无规划直接干
上下文持久化✅ 文件持久❌ 会话内有效❌ 完全依赖上下文
会话恢复✅ 重启后自动恢复⚠️ 部分恢复❌ 完全丢失
错误追踪✅ 结构化记录⚠️ 散落在对话中❌ 无记录
决策质量✅ 决策前重读计划⚠️ 依赖短期记忆❌ 容易偏离方向
上手成本中等(需创建 3 个文件)

个人评价:★★★★★#

我给这个 Skill 打 5 星(满分 5 星),理由如下:

  1. 理念简单但极其有效:核心就一句话”写到文件里”,但效果立竿见影
  2. 源自经过验证的架构:基于 Manus 的实际工作模式,不是纸上谈兵
  3. 跨平台兼容:Claude Code、Codex、Cursor、OpenCode 等都能用
  4. 开源且活跃维护:MIT 许可,版本已迭代到 2.36+,社区活跃

唯一的小门槛是:你需要在每次复杂任务开始前花 1 分钟创建 3 个规划文件。但一旦习惯了这个流程,你会发现 Agent 的执行质量和稳定性有明显提升——尤其是在长任务中,它再也不会”做着做着就跑题了”。

如何使用#

如果你也在使用 Claude Code 或类似的 AI Agent 工具,可以按照以下步骤上手:

  1. 安装 Skill(将 SKILL.md 放入你的 Agent 技能目录)
  2. 开始复杂任务前,创建三个文件:task_plan.mdfindings.mdprogress.md
  3. 按照 Skill 中的规则执行:两步存档、决策前重读、错误必记录
  4. 享受更稳定、更有条理的 Agent 协作体验

参考链接:

文章分享

如果这篇文章对你有帮助,欢迎分享给更多人!

这个 GitHub 爆火的文件规划 Skill 到底能干嘛?实测来了
https://boke.hackerdream.xyz/posts/planning-with-files-introduction/
作者
晴天
发布于
2025-02-14
许可协议
CC BY-NC-SA 4.0
Profile Image of the Author
晴天
Hello, I'm 晴天.
公告
欢迎来到我的博客!这是一则示例公告。
音乐
封面

音乐

暂未播放

0:00 0:00
暂无歌词
分类
标签
站点统计
文章
125
分类
17
标签
287
总字数
257,955
运行时长
0
最后活动
0 天前

目录