这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛?实测来了

1252 字
6 分钟
这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛?实测来了

这个 Skill 是什么?#

Agentic Engineering(Agent 工程化)来自 GitHub 上拥有 17.3 万星的明星项目 affaan-m/everything-claude-code,是一套专门针对 AI Agent 参与软件开发工作流的工程方法论。

简单来说,它解决的核心问题是:当 AI Agent 开始写大部分代码时,人类工程师应该怎么管理这个过程?

不是教你怎么写代码,而是教你怎么管 Agent 写代码

原始项目简介#

  • 仓库affaan-m/everything-claude-code
  • Stars:173,000+(截至 2026 年 5 月)
  • 语言:JavaScript / Markdown
  • 简介:Agent harness 性能优化系统,包含 Skills、Instincts、Memory、Security 等模块,适用于 Claude Code、Codex、Cursor 等多种 AI 编码工具
  • 许可协议:MIT

这个项目不只是几个 skill 的集合,而是一整套 AI 辅助开发的最佳实践体系。agentic-engineering 是其中最核心的”元 skill”——它告诉你怎么正确使用其他所有 skill。

核心功能与亮点#

1. 评估优先(Eval-First Loop)#

这是最颠覆传统开发流程的理念。传统流程是「写代码 → 测试」,Agent 工程化的流程是:

  1. 先定义评估标准(能力评估 + 回归评估)
  2. 跑基线测试,记下当前有哪些失败
  3. 让 Agent 执行实现
  4. 重新跑评估,对比变化量

这意味着你不会在 Agent 瞎改一通之后才发现”哎呀这个功能坏了”。

2. 15 分钟单元规则#

任务分解时遵循三个标准:

标准含义
独立可验证这个单元能不能单独跑测试?
单一主导风险最大的风险点只有一个,不是多个风险混杂
清晰完成条件”做完了”的定义明确,不会模棱两可

这其实就是把敏捷开发里的”用户故事”思想用到了 Agent 任务上。

3. 智能模型路由#

不是所有任务都要用最贵的模型:

模型用途
Haiku(轻量/便宜)分类、样板代码、小范围编辑
Sonnet(中等)功能实现、代码重构
Opus(重量/贵)架构设计、根因分析、跨文件改动

省钱又高效。用 Haiku 做分类,用 Opus 做架构,各取所长。

4. 成本纪律#

要求每个任务都跟踪:

  • 用了什么模型
  • Token 消耗估算
  • 重试次数
  • 实际耗时
  • 成功还是失败

这个对于用 API 付费跑 Agent 的团队来说,是实打实的成本管控。

使用方法#

安装#

  1. 从 Gitee 仓库获取中文版:
Terminal window
git clone https://gitee.com/wyb_001/awesome-ai-agent-skills-zh.git
  1. 在 OpenClaw 中使用,将 skills/agentic-engineering/ 目录放置到你的 skills 路径下。

  2. 或者直接使用原始英文版本:

Terminal window
git clone https://github.com/affaan-m/everything-claude-code.git

使用场景示例#

场景一:大型功能开发

1. 定义能力评估:新功能需要满足哪些测试用例
2. 定义回归评估:已有功能不能退化
3. 拆分为 15 分钟可完成的子任务
4. 简单子任务 → Haiku,核心逻辑 → Sonnet,架构决策 → Opus
5. 每完成一个子任务,跑评估验证

场景二:技术债重构

1. 先跑回归评估,建立基线
2. 拆分为独立的重构单元
3. 用 Sonnet 执行重构
4. 回归评估对比,确保没引入 bug

适用 vs 不适用场景#

✅ 适合使用#

  • 多人团队使用 AI Agent 辅助开发
  • 需要控制 API 成本的场景
  • 有持续集成/持续评估流程的项目
  • 需要在 AI 生成代码和人类审查之间建立流程

❌ 不太适合#

  • 个人小项目(过度工程化)
  • 没有自动化测试的项目(eval-first 跑不起来)
  • 纯探索性/原型开发(太正式了)
  • 预算不敏感、不在乎 Token 消耗的场景

与其他 Skill 的对比#

Skill侧重点与本 Skill 的关系
subagent-driven-development多 Agent 协作开发流程互补:agentic-engineering 管整体策略,subagent-driven 管执行细节
executing-plans执行已有计划互补:agentic-engineering 包含计划制定和评估,executing-plans 专注执行
systematic-debugging系统性调试互补:agentic-engineering 的工程框架下,用 systematic-debugging 处理 bug
verification-before-completion完成前验证子集关系:验证优先是 agentic-engineering 评估循环的一部分

个人评价#

推荐指数:⭐⭐⭐⭐⭐(5/5)

这是我搬运过的 Skill 里最”元”的一个——它不是教你做某件具体的事,而是教你怎么正确地让 AI 帮你做事

几个特别打动我的点:

  1. “别在调试过程中压缩上下文” —— 这条建议太真实了。调试到一半 context 被截断,那种痛谁懂
  2. “15 分钟单元规则” —— 给任务拆分提供了一个具体的量化标准,不是模糊的”拆小一点”
  3. 成本纪律 —— 大多数 AI 开发教程都不提钱,这个直接把成本追踪写进流程,很务实

如果你是团队技术负责人或正在规模化使用 AI 编码工具,这个 Skill 值得认真读一遍。


📌 本搬运源自 affaan-m/everything-claude-code 项目,中文翻译版见 awesome-ai-agent-skills-zh

文章分享

如果这篇文章对你有帮助,欢迎分享给更多人!

这个 GitHub 爆火的 Agent 工程化 Skill 到底能干嘛?实测来了
https://boke.hackerdream.xyz/posts/agentic-engineering-introduction/
作者
晴天
发布于
2025-04-11
许可协议
CC BY-NC-SA 4.0
Profile Image of the Author
晴天
Hello, I'm 晴天.
公告
欢迎来到我的博客!这是一则示例公告。
音乐
封面

音乐

暂未播放

0:00 0:00
暂无歌词
分类
标签
站点统计
文章
125
分类
17
标签
287
总字数
257,955
运行时长
0
最后活动
0 天前

目录