这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛？实测来了

1252 字

6 分钟

这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛？实测来了

2025-04-11

AI工具

AI Agent

Skill

工程化

Claude Code

开发效率

这个 Skill 是什么？#

Agentic Engineering（Agent 工程化）来自 GitHub 上拥有 17.3 万星的明星项目 affaan-m/everything-claude-code，是一套专门针对 AI Agent 参与软件开发工作流的工程方法论。

简单来说，它解决的核心问题是：当 AI Agent 开始写大部分代码时，人类工程师应该怎么管理这个过程？

不是教你怎么写代码，而是教你怎么管 Agent 写代码。

原始项目简介#

仓库：affaan-m/everything-claude-code
Stars：173,000+（截至 2026 年 5 月）
语言：JavaScript / Markdown
简介：Agent harness 性能优化系统，包含 Skills、Instincts、Memory、Security 等模块，适用于 Claude Code、Codex、Cursor 等多种 AI 编码工具
许可协议：MIT

这个项目不只是几个 skill 的集合，而是一整套 AI 辅助开发的最佳实践体系。agentic-engineering 是其中最核心的”元 skill”——它告诉你怎么正确使用其他所有 skill。

核心功能与亮点#

1. 评估优先（Eval-First Loop）#

这是最颠覆传统开发流程的理念。传统流程是「写代码 → 测试」，Agent 工程化的流程是：

先定义评估标准（能力评估 + 回归评估）
跑基线测试，记下当前有哪些失败
让 Agent 执行实现
重新跑评估，对比变化量

这意味着你不会在 Agent 瞎改一通之后才发现”哎呀这个功能坏了”。

2. 15 分钟单元规则#

任务分解时遵循三个标准：

标准	含义
独立可验证	这个单元能不能单独跑测试？
单一主导风险	最大的风险点只有一个，不是多个风险混杂
清晰完成条件	”做完了”的定义明确，不会模棱两可

这其实就是把敏捷开发里的”用户故事”思想用到了 Agent 任务上。

3. 智能模型路由#

不是所有任务都要用最贵的模型：

模型	用途
Haiku（轻量/便宜）	分类、样板代码、小范围编辑
Sonnet（中等）	功能实现、代码重构
Opus（重量/贵）	架构设计、根因分析、跨文件改动

省钱又高效。用 Haiku 做分类，用 Opus 做架构，各取所长。

4. 成本纪律#

要求每个任务都跟踪：

用了什么模型
Token 消耗估算
重试次数
实际耗时
成功还是失败

这个对于用 API 付费跑 Agent 的团队来说，是实打实的成本管控。

使用方法#

安装#

从 Gitee 仓库获取中文版：

1
git clone https://gitee.com/wyb_001/awesome-ai-agent-skills-zh.git

在 OpenClaw 中使用，将 skills/agentic-engineering/ 目录放置到你的 skills 路径下。
或者直接使用原始英文版本：

1
git clone https://github.com/affaan-m/everything-claude-code.git

使用场景示例#

场景一：大型功能开发

1
1. 定义能力评估：新功能需要满足哪些测试用例
2
2. 定义回归评估：已有功能不能退化
3
3. 拆分为 15 分钟可完成的子任务
4
4. 简单子任务 → Haiku，核心逻辑 → Sonnet，架构决策 → Opus
5
5. 每完成一个子任务，跑评估验证

场景二：技术债重构

1
1. 先跑回归评估，建立基线
2
2. 拆分为独立的重构单元
3
3. 用 Sonnet 执行重构
4
4. 回归评估对比，确保没引入 bug

适用 vs 不适用场景#

✅ 适合使用#

多人团队使用 AI Agent 辅助开发
需要控制 API 成本的场景
有持续集成/持续评估流程的项目
需要在 AI 生成代码和人类审查之间建立流程

❌ 不太适合#

个人小项目（过度工程化）
没有自动化测试的项目（eval-first 跑不起来）
纯探索性/原型开发（太正式了）
预算不敏感、不在乎 Token 消耗的场景

与其他 Skill 的对比#

Skill	侧重点	与本 Skill 的关系
`subagent-driven-development`	多 Agent 协作开发流程	互补：agentic-engineering 管整体策略，subagent-driven 管执行细节
`executing-plans`	执行已有计划	互补：agentic-engineering 包含计划制定和评估，executing-plans 专注执行
`systematic-debugging`	系统性调试	互补：agentic-engineering 的工程框架下，用 systematic-debugging 处理 bug
`verification-before-completion`	完成前验证	子集关系：验证优先是 agentic-engineering 评估循环的一部分

个人评价#

推荐指数：⭐⭐⭐⭐⭐（5/5）

这是我搬运过的 Skill 里最”元”的一个——它不是教你做某件具体的事，而是教你怎么正确地让 AI 帮你做事。

几个特别打动我的点：

“别在调试过程中压缩上下文” —— 这条建议太真实了。调试到一半 context 被截断，那种痛谁懂
“15 分钟单元规则” —— 给任务拆分提供了一个具体的量化标准，不是模糊的”拆小一点”
成本纪律 —— 大多数 AI 开发教程都不提钱，这个直接把成本追踪写进流程，很务实

如果你是团队技术负责人或正在规模化使用 AI 编码工具，这个 Skill 值得认真读一遍。

📌 本搬运源自 affaan-m/everything-claude-code 项目，中文翻译版见 awesome-ai-agent-skills-zh

文章分享

如果这篇文章对你有帮助，欢迎分享给更多人！

这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛？实测来了

https://boke.hackerdream.xyz/posts/agentic-engineering-introduction/

作者

晴天

发布于

2025-04-11

许可协议

CC BY-NC-SA 4.0

这个 GitHub 爆火的 Skill 编写方法论到底能干嘛？实测来了

这个 GitHub 爆火的 Brand Voice Skill 到底能干嘛？实测来了

音乐

音乐

这个 Skill 是什么？#

原始项目简介#

核心功能与亮点#

1. 评估优先（Eval-First Loop）#

2. 15 分钟单元规则#

3. 智能模型路由#

4. 成本纪律#

使用方法#

安装#

使用场景示例#

适用 vs 不适用场景#

✅ 适合使用#

❌ 不太适合#

与其他 Skill 的对比#

个人评价#

文章分享

音乐

目录