这个 GitHub 爆火的文件规划 Skill 到底能干嘛？实测来了

1711 字

9 分钟

这个 GitHub 爆火的文件规划 Skill 到底能干嘛？实测来了

2025-02-14

AI工具

AI Agent

Skill

规划

Manus

上下文工程

前言：为什么 AI Agent 总做着做着就”忘了初心”？#

用过 Claude Code、Codex、Cursor 等 AI 编程工具的开发者，大概率遇到过这个场景：

你让 Agent 帮你重构一个模块，它前 10 步还干得风生水起，到了第 30 步突然开始写一些跟原始目标完全不相关的代码。你问它为什么要改那个文件，它答不上来——因为它已经”忘了”最初要做什么了。

这不是 Agent 笨，这是上下文窗口（Context Window）的物理限制。就像人的短期记忆一样，塞太多东西之后，最早的信息就被挤出去了。

今天我们要介绍的这个 Skill，就是为了解决这个问题而生的——而且它背后的灵感来源相当硬核：Manus，那个被 Meta 以 20 亿美金收购的 AI Agent 公司。

原始项目简介#

项目	详情
仓库	OthmanAdi/planning-with-files
GitHub 星数	20,400+ ⭐
许可证	MIT
最后更新	2026 年 5 月
语言	Python（脚本部分）

这个项目的核心理念非常简单粗暴，但极其有效：

上下文窗口 = 内存（易失的、有限的） 文件系统 = 磁盘（持久的、无限的） 任何重要的东西，写到磁盘上。

核心功能：三个文件撑起整个工作流#

这个 Skill 的核心机制就是用 3 个 Markdown 文件 来替代 Agent 的”大脑记忆”：

1. `task_plan.md` — 任务计划#

这是你的”导航仪”。它记录：

任务目标（Goal）
阶段划分（Phases），每个阶段标记为 [ ]（未完成）或 [x]（已完成）
关键问题（Key Questions）
已做出的决策（Decisions Made）
遇到的错误（Errors Encountered）

2. `findings.md` — 研究发现#

这是你的”笔记本”。所有研究过程中发现的内容都写到这里：

搜索结果摘要
代码分析结论
API 文档要点
设计决策理由

3. `progress.md` — 进度日志#

这是你的”操作日志”。实时记录：

每个操作做了什么
测试结果
临时想法

最让我拍案叫绝的几个设计#

🎯 “两步规则”（The 2-Action Rule）#

每进行 2 次浏览/搜索操作后，立即将关键发现保存到文本文件。

这个规则解决了一个痛点：Agent 用浏览器看了 10 个网页，结果第 11 步时已经把前面 10 个网页的内容全忘了。两步规则强制 Agent 定期”存档”，确保信息不丢失。

🔄 “决策前重读计划”模式#

这是 Manus 能执行约 50 次工具调用而不迷失方向的核心秘诀：

1
[已经执行了很多工具调用...]
2
[上下文变得越来越长...]
3
[原始目标可能已经被遗忘了...]
4

5
→ 读取 task_plan.md          ← 这步让目标重新进入注意力窗口！
6
→ 现在做决策                 ← 目标是新鲜的

就像一个飞行员在长途飞行中时不时看一眼导航仪一样。

🛡️ “三次失败协议”#

Agent 犯错不可怕，可怕的是重复犯同样的错。这个 Skill 定义了一个清晰的错误处理流程：

1
第 1 次：诊断并修复（针对性）
2
第 2 次：换方法/换工具/换库（替代方案）
3
第 3 次：质疑假设、搜索方案、更新计划（重新思考）
4
3 次后：升级给用户，说明尝试过什么

📊 读 vs 写决策矩阵#

什么时候该读？什么时候该写？Skill 里有一张清晰的决策矩阵：

场景	操作	原因
刚写了文件	不要再读	内容仍在上下文中
查看了图片/PDF	立即写入	多模态内容会丢失
开始新阶段	读取计划	重新定位目标
发生错误	读取相关文件	获取当前状态来修复

实际使用场景#

场景 1：研究任务#

“调研一下 Next.js 15 的新特性，写一份总结”

Agent 会：

先创建 task_plan.md，列出要调研的方向
搜索每个方向，把结果写入 findings.md
综合所有发现，写总结文档
更新 task_plan.md 标记完成

场景 2：Bug 修复#

“修复登录模块的 Bug”

Agent 会：

创建计划，列出排查步骤
定位代码，记录发现
尝试修复，记录每次错误
验证修复，标记完成

场景 3：功能开发#

“给设置页面加一个深色模式切换”

Agent 会：

先调研现有主题系统，写入 findings.md
制定实施计划到 task_plan.md
分阶段实现，每完成一步更新进度
测试验证，交付成果

适用场景 vs 不适用场景#

✅ 适合用#

多步骤任务（3 步以上）
研究类任务（需要大量信息搜集）
构建/创建项目（需要规划架构）
需要大量工具调用的长任务
任何需要”保持方向感”的任务

❌ 不适合用#

简单问答（“这个函数什么意思？”）
单文件小修改（“把这个变量名改一下”）
快速查找（“帮我找一下配置文件在哪”）

与同类工具的对比#

维度	planning-with-files	TodoWrite	无规划直接干
上下文持久化	✅ 文件持久	❌ 会话内有效	❌ 完全依赖上下文
会话恢复	✅ 重启后自动恢复	⚠️ 部分恢复	❌ 完全丢失
错误追踪	✅ 结构化记录	⚠️ 散落在对话中	❌ 无记录
决策质量	✅ 决策前重读计划	⚠️ 依赖短期记忆	❌ 容易偏离方向
上手成本	中等（需创建 3 个文件）	低	无

个人评价：★★★★★#

我给这个 Skill 打 5 星（满分 5 星），理由如下：

理念简单但极其有效：核心就一句话”写到文件里”，但效果立竿见影
源自经过验证的架构：基于 Manus 的实际工作模式，不是纸上谈兵
跨平台兼容：Claude Code、Codex、Cursor、OpenCode 等都能用
开源且活跃维护：MIT 许可，版本已迭代到 2.36+，社区活跃

唯一的小门槛是：你需要在每次复杂任务开始前花 1 分钟创建 3 个规划文件。但一旦习惯了这个流程，你会发现 Agent 的执行质量和稳定性有明显提升——尤其是在长任务中，它再也不会”做着做着就跑题了”。

如何使用#

如果你也在使用 Claude Code 或类似的 AI Agent 工具，可以按照以下步骤上手：

安装 Skill（将 SKILL.md 放入你的 Agent 技能目录）
开始复杂任务前，创建三个文件：task_plan.md、findings.md、progress.md
按照 Skill 中的规则执行：两步存档、决策前重读、错误必记录
享受更稳定、更有条理的 Agent 协作体验

参考链接：

GitHub 仓库：https://github.com/OthmanAdi/planning-with-files
Manus 上下文工程官方文档：https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

文章分享

如果这篇文章对你有帮助，欢迎分享给更多人！

这个 GitHub 爆火的文件规划 Skill 到底能干嘛？实测来了

https://boke.hackerdream.xyz/posts/planning-with-files-introduction/

作者

晴天

发布于

2025-02-14

许可协议

CC BY-NC-SA 4.0

这个 GitHub 爆火的文档查阅 Skill 到底能干嘛？实测来了

这个 GitHub 爆火的 React Native 最佳实践 Skill 到底能干嘛？实测来了

音乐

音乐

前言：为什么 AI Agent 总做着做着就”忘了初心”？#

原始项目简介#

核心功能：三个文件撑起整个工作流#

1. `task_plan.md` — 任务计划#

2. `findings.md` — 研究发现#

3. `progress.md` — 进度日志#

最让我拍案叫绝的几个设计#

🎯 “两步规则”（The 2-Action Rule）#

🔄 “决策前重读计划”模式#

🛡️ “三次失败协议”#

📊 读 vs 写决策矩阵#

实际使用场景#

场景 1：研究任务#

场景 2：Bug 修复#

场景 3：功能开发#

适用场景 vs 不适用场景#

✅ 适合用#

❌ 不适合用#

与同类工具的对比#

个人评价：★★★★★#

如何使用#

文章分享

音乐

目录

音乐

音乐

这个 GitHub 爆火的文件规划 Skill 到底能干嘛？实测来了

前言：为什么 AI Agent 总做着做着就”忘了初心”？#

原始项目简介#

核心功能：三个文件撑起整个工作流#

1. task_plan.md — 任务计划#

2. findings.md — 研究发现#

3. progress.md — 进度日志#

最让我拍案叫绝的几个设计#

🎯 “两步规则”（The 2-Action Rule）#

🔄 “决策前重读计划”模式#

🛡️ “三次失败协议”#

📊 读 vs 写决策矩阵#

实际使用场景#

场景 1：研究任务#

场景 2：Bug 修复#

场景 3：功能开发#

适用场景 vs 不适用场景#

✅ 适合用#

❌ 不适合用#

与同类工具的对比#

个人评价：★★★★★#

如何使用#

文章分享

音乐

目录

1. `task_plan.md` — 任务计划#

2. `findings.md` — 研究发现#

3. `progress.md` — 进度日志#