这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛?实测来了
这个 Skill 是什么?
Agentic Engineering(Agent 工程化)来自 GitHub 上拥有 17.3 万星的明星项目 affaan-m/everything-claude-code,是一套专门针对 AI Agent 参与软件开发工作流的工程方法论。
简单来说,它解决的核心问题是:当 AI Agent 开始写大部分代码时,人类工程师应该怎么管理这个过程?
不是教你怎么写代码,而是教你怎么管 Agent 写代码。
原始项目简介
- 仓库:affaan-m/everything-claude-code
- Stars:173,000+(截至 2026 年 5 月)
- 语言:JavaScript / Markdown
- 简介:Agent harness 性能优化系统,包含 Skills、Instincts、Memory、Security 等模块,适用于 Claude Code、Codex、Cursor 等多种 AI 编码工具
- 许可协议:MIT
这个项目不只是几个 skill 的集合,而是一整套 AI 辅助开发的最佳实践体系。agentic-engineering 是其中最核心的”元 skill”——它告诉你怎么正确使用其他所有 skill。
核心功能与亮点
1. 评估优先(Eval-First Loop)
这是最颠覆传统开发流程的理念。传统流程是「写代码 → 测试」,Agent 工程化的流程是:
- 先定义评估标准(能力评估 + 回归评估)
- 跑基线测试,记下当前有哪些失败
- 让 Agent 执行实现
- 重新跑评估,对比变化量
这意味着你不会在 Agent 瞎改一通之后才发现”哎呀这个功能坏了”。
2. 15 分钟单元规则
任务分解时遵循三个标准:
| 标准 | 含义 |
|---|---|
| 独立可验证 | 这个单元能不能单独跑测试? |
| 单一主导风险 | 最大的风险点只有一个,不是多个风险混杂 |
| 清晰完成条件 | ”做完了”的定义明确,不会模棱两可 |
这其实就是把敏捷开发里的”用户故事”思想用到了 Agent 任务上。
3. 智能模型路由
不是所有任务都要用最贵的模型:
| 模型 | 用途 |
|---|---|
| Haiku(轻量/便宜) | 分类、样板代码、小范围编辑 |
| Sonnet(中等) | 功能实现、代码重构 |
| Opus(重量/贵) | 架构设计、根因分析、跨文件改动 |
省钱又高效。用 Haiku 做分类,用 Opus 做架构,各取所长。
4. 成本纪律
要求每个任务都跟踪:
- 用了什么模型
- Token 消耗估算
- 重试次数
- 实际耗时
- 成功还是失败
这个对于用 API 付费跑 Agent 的团队来说,是实打实的成本管控。
使用方法
安装
- 从 Gitee 仓库获取中文版:
git clone https://gitee.com/wyb_001/awesome-ai-agent-skills-zh.git-
在 OpenClaw 中使用,将
skills/agentic-engineering/目录放置到你的 skills 路径下。 -
或者直接使用原始英文版本:
git clone https://github.com/affaan-m/everything-claude-code.git使用场景示例
场景一:大型功能开发
1. 定义能力评估:新功能需要满足哪些测试用例2. 定义回归评估:已有功能不能退化3. 拆分为 15 分钟可完成的子任务4. 简单子任务 → Haiku,核心逻辑 → Sonnet,架构决策 → Opus5. 每完成一个子任务,跑评估验证场景二:技术债重构
1. 先跑回归评估,建立基线2. 拆分为独立的重构单元3. 用 Sonnet 执行重构4. 回归评估对比,确保没引入 bug适用 vs 不适用场景
✅ 适合使用
- 多人团队使用 AI Agent 辅助开发
- 需要控制 API 成本的场景
- 有持续集成/持续评估流程的项目
- 需要在 AI 生成代码和人类审查之间建立流程
❌ 不太适合
- 个人小项目(过度工程化)
- 没有自动化测试的项目(eval-first 跑不起来)
- 纯探索性/原型开发(太正式了)
- 预算不敏感、不在乎 Token 消耗的场景
与其他 Skill 的对比
| Skill | 侧重点 | 与本 Skill 的关系 |
|---|---|---|
subagent-driven-development | 多 Agent 协作开发流程 | 互补:agentic-engineering 管整体策略,subagent-driven 管执行细节 |
executing-plans | 执行已有计划 | 互补:agentic-engineering 包含计划制定和评估,executing-plans 专注执行 |
systematic-debugging | 系统性调试 | 互补:agentic-engineering 的工程框架下,用 systematic-debugging 处理 bug |
verification-before-completion | 完成前验证 | 子集关系:验证优先是 agentic-engineering 评估循环的一部分 |
个人评价
推荐指数:⭐⭐⭐⭐⭐(5/5)
这是我搬运过的 Skill 里最”元”的一个——它不是教你做某件具体的事,而是教你怎么正确地让 AI 帮你做事。
几个特别打动我的点:
- “别在调试过程中压缩上下文” —— 这条建议太真实了。调试到一半 context 被截断,那种痛谁懂
- “15 分钟单元规则” —— 给任务拆分提供了一个具体的量化标准,不是模糊的”拆小一点”
- 成本纪律 —— 大多数 AI 开发教程都不提钱,这个直接把成本追踪写进流程,很务实
如果你是团队技术负责人或正在规模化使用 AI 编码工具,这个 Skill 值得认真读一遍。
📌 本搬运源自 affaan-m/everything-claude-code 项目,中文翻译版见 awesome-ai-agent-skills-zh
文章分享
如果这篇文章对你有帮助,欢迎分享给更多人!