AI 蒸馏战争:当公司开始把员工变成数字替身

4208 字
21 分钟
AI 蒸馏战争:当公司开始把员工变成数字替身

引爆点#

2026 年 4 月的某一天,GitHub Trending 页面出现了一件诡异的事:前十名里有六个项目的名字都以 .skill 结尾。

其中最离谱的是一个叫 colleague-skill 的仓库——它在 5 天内拿到了 6.6k 星,小红书上的同名帖子收获了 4500 个赞。这个项目的 README 只有一句话:

“把你同事的工作习惯、沟通风格和决策模式,打包成一个 AI 可以直接加载的 Skill 文件。”

与此同时,一个更隐秘的暗语开始在各大互联网公司的内部群里流传——

“我的 skill 已上传。”

说这句话的人,不是在炫耀什么技术成就。恰恰相反,他们在表达一种恐惧:我已经被数字化了,我的替代品已经就绪。

这场被媒体称为”蒸馏战争”的风暴,正在改写职场的底层逻辑。


第一章:什么是蒸馏#

从 Agent Skill 说起#

故事要从 2025 年说起。

那一年,Anthropic 推出了 Claude 的 Skills 功能——你可以为 Claude 编写一份”技能说明书”,让它在特定场景下表现得像一个特定的人。不是简单的 prompt,而是一套包含行为模式、决策偏好、沟通风格的完整人格描述。

几乎同时,开源社区的 OpenClaw 项目定义了一套更标准化的 Skill 规范。一个 Skill 的标准形态是这样的:

my-skill/
├── SKILL.md # 核心行为描述
├── prompts/ # 场景化提示词
├── scripts/ # 自动化脚本
└── references/ # 参考资料

SKILL.md 是灵魂——它不是告诉 AI “你能做什么”,而是告诉 AI “你是谁”

从能力模型到行为模型#

传统的知识管理是”能力模型”:这个人会 Java,那个人懂财务。但 Skill 做的事情完全不同——它捕捉的是行为模型

  • 这个人在面对紧急 bug 时,第一反应是查日志还是回滚?
  • 这个人在会议上被质疑时,是据理力争还是先记下来回头验证?
  • 这个人写代码的时候,变量命名风格是什么?注释习惯是什么?

当你把一个人的行为模型写得足够精细,AI 就不再是”模仿”这个人——它开始成为这个人的数字投影。

五层人格架构#

社区很快发展出了一套”五层人格架构”,从浅到深:

层级名称内容可蒸馏性
Layer 0技能层会什么工具、什么语言⭐⭐⭐⭐⭐ 极易
Layer 1习惯层工作流程、命名规范、沟通模板⭐⭐⭐⭐ 容易
Layer 2偏好层技术选型倾向、审美偏好⭐⭐⭐ 中等
Layer 3判断层风险评估、优先级排序、取舍逻辑⭐⭐ 困难
Layer 4直觉层”感觉不对”、“这个方案有味道”⭐ 极难

蒸馏的本质,就是尽可能地把一个人从 Layer 0 到 Layer 4 的所有层级,压缩进一个文本文件。

这个过程,被称为人格蒸馏(Personality Distillation)


第二章:蒸馏生态大爆发#

colleague-skill:蒸馏你的同事#

截至本文写作时,colleague-skill 已经涨到了 10.6k 星。

它的工作原理令人不安地简单:连接你的飞书、钉钉或 Slack 工作空间,自动采集目标同事的聊天记录、代码提交、文档编辑、会议纪要,然后通过大模型提炼出一份完整的 Skill 文件。

Terminal window
# 是的,蒸馏一个同事就是这么简单
$ colleague-skill extract --source feishu --target "张三" --depth 3
[██████████] 分析聊天记录 12,847 条
[██████████] 分析代码提交 2,341 次
[██████████] 分析文档编辑 567 篇
[██████████] 生成行为模型...
输出: zhang-san.skill/SKILL.md (Layer 0-3, 置信度 87%)

置信度 87%。也就是说,这个 AI 在 87% 的场景下,会做出和张三一样的决策。

ex-skill:蒸馏你的前任#

如果说 colleague-skill 还算有点职场实用价值,那 ex-skill 就纯粹是人类情感的深渊了。

这个项目把微信聊天记录导入,分析对方的说话方式、回复节奏、用词习惯、情绪模式,然后生成一个 Skill——让 AI 用你前任的方式跟你聊天。

README 里有一句话让人脊背发凉:

“Ta 离开了,但 Ta 的说话方式可以留下来。“

yourself-skill:蒸馏你自己#

yourself-skill 走的是”数字永生”路线。它鼓励你主动记录自己的一切——决策逻辑、价值观、口头禅、处事风格——然后生成一个”你”的 Skill。

项目 slogan:“当你不在的时候,让世界还能听到你的声音。”

听起来很浪漫。但当你的公司也开始对这件事感兴趣的时候,浪漫就变成了恐怖片。

boss-skill:蒸馏你的老板#

这个项目的 star 增长最慢,但 fork 数最高——因为大家都 fork 了之后偷偷用,不敢公开 star。

用途很直接:分析老板的决策模式、审批偏好、雷区关键词,然后在提交方案之前先让 AI 模拟老板的反应。

有人在 issue 里写:“自从用了 boss-skill,我的方案通过率从 40% 涨到了 85%。”

36氪在《疯狂的 Skill》专题报道中总结得很精准:“Skill 生态的爆发,本质上是人类第一次大规模地、系统性地将’人’本身作为数据进行提取和复制。“


第三章:大型公司正在蒸馏员工#

故事到这里还只是开源社区的狂欢。真正让人不安的转折,发生在企业内部。

“请把你的工作经验写成 Skill”#

2026 年 Q1,至少三家互联网大厂在内部推行了”知识沉淀计划”。

名义上,这是”给新员工写入职手册”的升级版。实际操作是:每个核心岗位的员工,需要在一个月内完成自己岗位的 Skill 编写。

要求非常具体:

  • 日常工作流程和决策节点
  • 常见问题的处理方案和判断依据
  • 跨部门协作的沟通策略
  • 代码审查的关注重点和标准

一位匿名员工在脉脉上写道:

“HR 说这是知识管理。但我们都知道,一旦 Skill 写完,人就可以被替换了。我们在亲手编写自己的讣告。“

法律的灰色地带#

2026 年 3 月,北京某仲裁委处理了一起引人注目的案件:一家科技公司在员工完成”岗位 Skill 编写”后的两个月内,以”组织架构调整”为由裁撤了该员工所在的整个部门。

仲裁结果认定:利用 AI 技术系统性替代员工岗位职能,并以此为基础实施裁员,构成违法解除劳动关系。

但这只是一个案例。更多的公司学聪明了——它们不会在 Skill 完成后立刻裁人。它们会等半年,等一年,等到”业务调整”看起来足够自然。

而且,最关键的问题是:公司从来不会”要求”你写 Skill。它们只是”鼓励”你”分享经验”、“沉淀知识”、“帮助团队成长”。

你是”自愿”的。


第四章:反蒸馏——打工人的数字防御#

有矛就有盾。当蒸馏成为系统性威胁时,反蒸馏工具应运而生。

anti-distill:知识清洗术#

anti-distill 项目在 GitHub 上悄然出现,两周内收获了 1352 颗星。它的定位非常明确:帮助你在”配合”公司知识沉淀的同时,系统性地稀释你的核心竞争力信息。

项目首先定义了六大高价值知识类别——这些是你最不应该被蒸馏的东西:

  1. 踩坑经验:那些只有你知道的隐藏陷阱
  2. 判断直觉:面对模糊情况时的决策本能
  3. 人际网络:你知道该找谁、怎么找
  4. 隐性上下文:文档里没写的背景知识
  5. 故障记忆:上次系统崩溃时你是怎么救回来的
  6. 独特行为模式:你之所以是你的那些微妙习惯

五种稀释手法#

anti-distill 提供了五种核心清洗策略:

  1. 泛化(Generalize):将具体经验替换为通用描述
  2. 抽象(Abstract):去掉可操作的细节,只留方向
  3. 归因转移(Redirect):把个人判断包装成”团队规范”
  4. 噪声注入(Noise):混入无关但看起来合理的信息
  5. 深度降级(Downgrade):把 Layer 3-4 的知识伪装成 Layer 0-1

三档清洗强度#

档位名称效果适用场景
🟢 轻度Soft Wash保留 70% 信息量,去掉关键细节日常知识分享
🟡 中度Medium Wash保留 40% 信息量,核心判断逻辑被替换岗位 Skill 编写
🔴 重度Hard Wash保留 10% 信息量,仅剩框架性描述离职交接(自保模式)

清洗前后对比#

让我们看一个具体的例子。假设你要写一份关于 Redis 使用经验的 Skill:

清洗前(你的真实经验):

## Redis 缓存策略
- 所有 Redis key 必须设置 TTL,最长不超过 7 天
- 热点 key 使用 `singleflight` 模式防止缓存击穿
- 大 key(>10KB)必须拆分,用 hash 分片存储
- 监控 `used_memory_rss` 而非 `used_memory`,前者反映真实内存占用
- 集群模式下避免使用 MGET,改用 pipeline + 按 slot 分组
- **关键**:上次 P0 事故就是因为有人在大促前做了 KEYS * 操作
导致 Redis 阻塞 30 秒,直接雪崩。现在已经在生产环境
禁用了 KEYS 命令,用 SCAN 替代

清洗后(Medium Wash):

## Redis 缓存策略
- 缓存使用遵循团队规范和最佳实践
- 注意缓存穿透和击穿问题,采用常见防护策略
- 大对象建议合理拆分存储
- 关注内存使用指标,定期监控
- 集群环境下注意命令兼容性
- 遵循生产环境安全操作规范

看到区别了吗?清洗后的版本看起来”什么都说了”,但实际上什么都没说。那些真正有价值的细节——TTL 策略、singleflight 模式、RSS vs used_memory 的区别、那次 P0 事故的血泪教训——全部被抹去了。

留下来的,是任何一个初级工程师都能在网上搜到的泛泛之谈。


第五章:反·反蒸馏——老板的反击#

你以为老板不知道你在搞反蒸馏?

anti-anti-distill:清洗检测器#

anti-anti-distill 项目的出现,标志着这场军备竞赛正式升级。

这个工具专为管理者设计,核心功能是检测员工提交的 Skill 是否经过清洗。它定义了九大清洗信号:

  1. 具体度骤降:前后文档的信息密度差异过大
  2. 归因模糊化:大量使用”团队规范""最佳实践”等模糊引用
  3. 场景缺失:只有”怎么做”,没有”什么时候做”和”为什么这么做”
  4. 故障记忆空白:一个工作三年的人,不可能没遇到过事故
  5. 数字消失:具体的阈值、超时时间、容量限制全部被泛化
  6. 决策树退化:if-else 逻辑被简化成单一建议
  7. 情感平坦化:真实经验会带情绪(“千万别""血的教训”),清洗后没有
  8. 知识深度不匹配:自称资深,但输出的内容是初级水平
  9. 模板化痕迹:多个模块的句式结构高度相似

七维评分体系#

anti-anti-distill 会对每份 Skill 进行七个维度的评分:

具体性 (Specificity) ████████░░ 78%
场景覆盖 (Coverage) ██████░░░░ 62%
故障密度 (Incident) ███░░░░░░░ 31% ⚠️ 异常低
决策深度 (Decision) █████░░░░░ 54%
情感真实度 (Emotion) ██░░░░░░░░ 23% 🚨 疑似清洗
数字密度 (Numeric) ████░░░░░░ 42% ⚠️ 偏低
独特性 (Uniqueness) ███░░░░░░░ 35% 🚨 疑似清洗

当多个维度同时亮红灯时,系统会输出一个冷冰冰的结论:

⚠️ 清洗概率:82%。建议与员工进行一对一沟通,要求补充具体案例和数据。

有人在 anti-anti-distill 的 issue 区写了一句话,获得了 247 个 👍:

“公司就是你的全部,懂么?你的经验、你的判断、你的直觉,都是在公司的工资和项目中养成的。现在公司要求你把这些交出来,你觉得不合理?”

这条评论下面紧跟着另一条,获得了 312 个 👍:

“合理。但我拒绝。“


第六章:未来何去何从#

军备竞赛没有终点#

蒸馏与反蒸馏的对抗,本质上是一场信息不对称的博弈。

anti-distill 会升级清洗算法,让泛化更自然、噪声更逼真。anti-anti-distill 会训练更强的检测模型,识别更微妙的清洗痕迹。然后 anti-distill 再升级,然后检测器再升级……

这跟广告拦截器和反拦截器的军备竞赛一模一样。没有赢家,只有不断升级的复杂度。

真正不可被蒸馏的是什么#

但在这场喧嚣中,有一个更根本的问题值得思考:什么东西是真正无法被蒸馏的?

Layer 0 到 Layer 2 的知识,迟早会被完整提取。你会什么工具、用什么框架、偏好什么技术栈——这些信息根本藏不住,也不值得藏。

真正的护城河在 Layer 3 和 Layer 4:

  • 判断力:在信息不完整、时间紧迫、利益冲突的情况下,做出”不完美但足够好”的决策的能力。这不是规则,这是直觉。直觉来自无数次的试错、失败和反思,它无法被简单地编码为 if-else。

  • 创造力:不是那种”把两个已有概念组合起来”的初级创造力——AI 已经很擅长这个了。而是那种”看到所有人都没看到的角度”的能力,那种”在所有数据都指向 A 的时候,直觉告诉你应该选 B”的勇气。

  • 在未知面前的勇气:面对一个从未遇到过的问题,没有文档、没有先例、没有最佳实践可以参考的时候,你依然能迈出第一步的能力。这不是知识,这是人格。

肉身在场的意义#

当一个人的经验、习惯甚至性格都可以被打包成一个文本文件时,肉身在场的意义究竟还剩下多少?

我不想给出一个廉价的乐观答案。事实是,对于很多标准化程度高的岗位,蒸馏确实会带来替代效应。一个 Skill 写得足够好的客服代表、一个行为模型足够精确的初级分析师,他们的数字替身确实可能在 80% 的场景下达到 80% 的效果。

但人不是 80% × 80% 就能定义的。

人是那个在系统崩溃的凌晨三点,一边骂娘一边 debug 的存在。是那个在所有指标都正常但”感觉不对劲”的时候,坚持多查了一层日志从而避免了一次 P0 事故的存在。是那个在会议上说出”我觉得我们方向错了”然后承受所有人目光的存在。

这些东西,写不进 SKILL.md。

保护你的核心知识资产#

最后,给每一个正在或即将面对”知识沉淀”要求的打工人一些建议:

  1. 知道什么该分享,什么该保留。团队协作的基础知识、文档化的流程,大方分享。但你的判断直觉、踩坑记忆、人际网络——这些是你的核心资产。

  2. 持续学习,让蒸馏追不上你。如果你的 Skill 一年前写的还能代表你,说明你这一年没有成长。最好的反蒸馏不是清洗,是进化。

  3. 建立不可替代性。不是通过藏信息来制造不可替代,而是通过不断深入 Layer 3 和 Layer 4 来建立真正的壁垒。

  4. 关注法律动态。蒸馏相关的劳动法规正在形成中。了解你的权利,必要时用法律保护自己。


尾声#

在写这篇文章的时候,colleague-skill 的星数已经突破了 12k。GitHub 上每天都有新的 .skill 项目诞生。

有人在蒸馏同事,有人在蒸馏自己,有人在反蒸馏,有人在反反蒸馏。

这场战争才刚刚开始。

而你——正在阅读这篇文章的你——现在需要认真想一个问题:

你的 skill,上传了吗?

文章分享

如果这篇文章对你有帮助,欢迎分享给更多人!

AI 蒸馏战争:当公司开始把员工变成数字替身
https://boke.hackerdream.xyz/posts/ai-distillation-war/
作者
晴天
发布于
2026-04-08
许可协议
CC BY-NC-SA 4.0
Profile Image of the Author
晴天
Hello, I'm 晴天.
公告
欢迎来到我的博客!这是一则示例公告。
音乐
封面

音乐

暂未播放

0:00 0:00
暂无歌词
分类
标签
站点统计
文章
125
分类
17
标签
287
总字数
257,955
运行时长
0
最后活动
0 天前

目录