AI 圈黑话大全:24 个核心词汇图解(2026 最新版)

4766 字
24 分钟
AI 圈黑话大全:24 个核心词汇图解(2026 最新版)

本文收集了 2026 年 AI 圈最热门的 24 个核心词汇,每个词汇都配有图解 + 通俗类比 + 代表项目。无论你是刚入门的新手,还是想系统梳理知识的从业者,这篇文章都能帮你一次性搞懂。


🗺️ 全景关系图#

先看全局,再看细节:

┌─────────────────────────┐
│ AI 技术全景图 │
└────────────┬────────────┘
┌────────────┬─────────┴─────────┬────────────┐
↓ ↓ ↓ ↓
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ 基础架构 │ │ 训练技术 │ │ 应用层 │ │ 安全层 │
└────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘
│ │ │ │
┌────┴────┐ ┌────┴────┐ ┌────┴────┐ ┌────┴────┐
│Transform│ │Fine- │ │AI Agent │ │Align- │
│er │ │tuning │ │Multi- │ │ment │
│Token │ │RLHF │ │Agent │ │AI Safety│
│Context │ │RAG │ │Skill │ │ │
│ │ │Embedding│ │MCP │ │ │
└─────────┘ └─────────┘ │Prompt │ │ │
│CoT │ │ │
└─────────┘ └─────────┘
┌─────────────────┐
│ 开发工具 │
│Vibe Coding │
│Agentic Eng. │
│Token Optim. │
└─────────────────┘

🏗️ 一、基础架构#

1. Transformer(变换器)#

┌─────────────────────────────────────────┐
│ Transformer 架构 │
├─────────────────────────────────────────┤
│ │
│ 输入文本 → Token 化 → Embedding 层 │
│ ↓ │
│ 编码器 (Encoder) │
│ (理解语义) │
│ ↓ │
│ 解码器 (Decoder) │
│ (生成文本) │
│ ↓ │
│ 输出文本 │
│ │
│ ⭐ 核心创新:自注意力机制 (Self-Attention) │
│ 让模型能同时"关注"句子中的所有词 │
└─────────────────────────────────────────┘
项目说明
通俗理解AI 的”大脑结构”,所有大模型都基于此
为什么重要以前的模型是”逐字阅读”,Transformer 是”一眼看完整句”
代表项目GPT 系列 / Claude / Qwen / BERT
GitHub 热度huggingface/transformers ⭐159K

2. Token(词元)#

文本分词示例:
"你好,世界!"
↓ Tokenizer(分词器)
["你", "好", ",", "世", "界", "!"]
= 6 个 Token
"Hello, World!"
↓ Tokenizer
["Hello", ",", " World", "!"]
= 4 个 Token
项目说明
通俗理解AI 阅读和写作的”最小单位”,类似人类的”字/词”
换算关系英文:1 Token ≈ 0.75 个单词;中文:1 Token ≈ 0.5-0.7 个汉字
省钱技巧用 caveman Skill 可节省 65% Token(⭐40K+)

3. Context Window(上下文窗口)#

上下文窗口 = AI 的"工作记忆"
┌─────────────────────────────────────────────────┐
│ Context Window (200K Tokens) │
├─────────────────────────────────────────────────┤
│ │
│ [系统提示词] 你是一位资深前端工程师... │ ← 固定占用
│ [对话历史] 用户:怎么写 React... │ ← 逐渐增长
│ AI:你可以使用 useState... │
│ 用户:那 Vue 呢... │
│ AI:Vue 的响应式... │
│ [当前输入] 帮我优化这段代码... │ ← 本次请求
│ [可用空间] ████████░░░░░░ 60% 已使用 │
│ │
│ ⚠️ 超过窗口上限 → 旧内容被截断 → AI"失忆" │
└─────────────────────────────────────────────────┘
项目说明
通俗理解AI 一次能”记住”的文本量上限
常见大小GPT-4o: 128K / Claude: 200K / Qwen: 1M
满了怎么办1. 使用 /compact 压缩 2. 开启新对话 3. 用 Memory 插件

4. Fine-tuning(微调)#

预训练模型 微调数据集 微调后模型
┌──────────┐ ┌──────────────┐ ┌──────────────┐
│ │ │ 你的专属数据 │ │ │
│ 通用AI │ + │ 行业知识/ │ → │ 行业专家AI │
│ │ │ 业务规则/ │ │ │
│ │ │ 风格偏好 │ │ │
└──────────┘ └──────────────┘ └──────────────┘
类比:
预训练 = 读完所有书的大学生
微调 = 在某个公司实习 3 个月
= 从"什么都会一点"变成"这个领域的专家"
项目说明
通俗理解让通用 AI 变成”行业专家”
代表平台LlamaFactory(70K⭐)、Unsloth(62K⭐)
适合场景客服、医疗诊断、法律文书、代码风格统一

🤖 二、智能体系#

5. AI Agent(AI 智能体)#

传统 AI vs AI Agent
┌─────────────┐ ┌─────────────────────────┐
│ 传统 AI │ │ AI Agent │
├─────────────┤ ├─────────────────────────┤
│ │ │ │
│ 你:问题 │ │ 你:目标 │
│ AI:回答 │ │ Agent:规划 → 执行 │
│ │ │ ↓ 使用工具 │
│ 一次问答 │ │ ↓ 检查结果 │
│ │ │ ↓ 调整策略 │
│ │ │ ↓ 完成任务 │
│ │ │ │
│ 被动回答 │ │ 自主行动 │
└─────────────┘ └─────────────────────────┘
项目说明
通俗理解不是”问答机器”,而是”能自己干活的 AI 助手”
核心能力规划 → 使用工具 → 执行 → 反思 → 调整
代表项目AutoGPT(183K⭐)、Dify(138K⭐)、LangChain(134K⭐)
2026 趋势从”单个 Agent”进化到”多 Agent 协作”

6. Multi-Agent(多智能体)#

多 Agent 协作模式:
┌─────────────┐
│ 协调者 Agent │
│ (规划/分发) │
└──────┬──────┘
┌────────────┼────────────┐
↓ ↓ ↓
┌──────────┐ ┌──────────┐ ┌──────────┐
│ 研究员 │ │ 开发工程师│ │ 审查员 │
│ Agent │ │ Agent │ │ Agent │
└────┬─────┘ └────┬─────┘ └────┬─────┘
│ │ │
└────────────┼────────────┘
┌─────────────┐
│ 汇总结果 │
└─────────────┘
类比:
单个 Agent = 一个全能员工
多 Agent = 一个完整团队(产品经理 + 开发 + 测试)
项目说明
通俗理解让多个 AI 各司其职,协作完成复杂任务
优势1. 并行处理更快 2. 专业分工质量更高 3. 可独立扩展
代表项目n8n(184K⭐)、langflow-ai/langflow(147K⭐)

7. Agent Skill(智能体技能)#

Agent Skill = 给 AI 安装的"专业插件"
没有 Skill 的 AI:
"我能聊天、写代码、翻译"
装了 Skills 的 AI:
"我能:
🔍 监控微博/抖音热搜
💰 分析市场情绪
📝 自动生成日报
🔒 扫描代码漏洞
🚀 检查部署状态
📊 管理飞书文档"
每个 Skill 包含:
┌─────────────────────────────┐
│ SKILL.md │
├─────────────────────────────┤
│ name: hot-topic-monitor │
│ triggers: 热搜、热点、趋势 │
│ function: 五源热榜聚合 │
│ workflow: 采集→去重→分类 │
│ references: 数据源配置 │
└─────────────────────────────┘
项目说明
通俗理解给 AI 安装的”专业插件”,让它具备特定能力
类比手机 App —— 装了微信能聊天,装了地图能导航
2026 爆发GitHub 4 月新增 7,100+ 个 Agent/Skills 相关仓库
中文生态awesome-claude-skills(55K⭐)

8. MCP(Model Context Protocol)#

MCP = AI 模型的"USB 接口"
没有 MCP:
AI ────❌──── 浏览器
AI ────❌──── 数据库
AI ────❌──── 文件系统
有 MCP:
AI ────🔌──── Chrome DevTools (浏览器调试)
AI ────🔌──── PostgreSQL (数据库查询)
AI ────🔌──── File System (文件操作)
AI ────🔌──── GitHub (代码管理)
AI ────🔌──── Context7 (文档检索)
就像 USB 接口:
插上什么设备,就能干什么活
项目说明
通俗理解AI 的”USB 接口”,插上什么工具就能干什么活
谁提出的Anthropic(Claude 的母公司)
常见 MCPchrome-devtools-mcp、playwright-mcp、typescript-lsp、context7-mcp

🧠 三、训练技术#

9. RAG(检索增强生成)#

传统 AI 回答:
问题 → AI 凭记忆回答 → 可能胡说八道 ❌
RAG 回答:
问题 → 先查资料库 → 找到相关信息 → 结合信息回答 → 准确可靠 ✅
┌────────────────────────────────────────────────────┐
│ RAG 工作流程 │
├────────────────────────────────────────────────────┤
│ │
│ 用户问题 │
│ ↓ │
│ ┌─────────────┐ │
│ │ Embedding │ 把问题转成向量 │
│ └──────┬──────┘ │
│ ↓ │
│ ┌─────────────┐ │
│ │ 向量数据库 │ 在知识库中找最相似的文档 │
│ └──────┬──────┘ │
│ ↓ │
│ ┌─────────────┐ │
│ │ 相关文档 │ Top 3-5 个最相关的文档片段 │
│ └──────┬──────┘ │
│ ↓ │
│ ┌─────────────┐ │
│ │ LLM │ "根据以下资料回答问题:..." │
│ └─────────────┘ │
│ ↓ │
│ 准确回答 ✅ │
│ │
└────────────────────────────────────────────────────┘
项目说明
通俗理解让 AI 先查资料再回答,减少”一本正经胡说八道”
类比开卷考试 vs 闭卷考试
代表项目RAGFlow(78K⭐)、Langchain-Chatchat(37K⭐)

10. Embedding(嵌入)#

文字 → 向量(数字数组)
"猫" → [0.12, -0.45, 0.78, 0.23, ...]
"狗" → [0.15, -0.42, 0.75, 0.21, ...] ← 和"猫"很像
"汽车" → [0.89, 0.34, -0.12, 0.56, ...] ← 和"猫"不像
计算相似度:
猫 ↔ 狗:0.95(很相似)
猫 ↔ 汽车:0.12(不相似)
用途:
- 搜索:找语义最相似的文档
- 推荐:推荐相似内容
- 聚类:自动分类文本
项目说明
通俗理解把文字变成一串数字,让计算机能”理解”语义
核心能力语义搜索——不是匹配关键词,而是匹配”意思”

11. RLHF(基于人类反馈的强化学习)#

训练 AI 的"三阶段":
阶段1:预训练(Pre-training)
"读遍全网文本" → 学会说话,但可能说错话
阶段2:监督微调(SFT)
"老师教标准答案" → 学会正确格式
阶段3:RLHF(基于人类反馈的强化学习)⭐
"人类老师打分" → 学会符合人类偏好
AI 回答 A → 人类打分:8/10 ✅
AI 回答 B → 人类打分:3/10 ❌
AI 回答 C → 人类打分:6/10 😐
通过大量打分,AI 学会"人类喜欢什么样的回答"
项目说明
通俗理解让 AI 通过”人类打分”学会符合人类偏好的回答
为什么重要这是让 AI 从”能说话”变成”说话得体”的关键技术

💬 四、提示词工程#

12. Prompt Engineering(提示词工程)#

提示词质量对比:
❌ 差的提示词:
"帮我写代码"
✅ 好的提示词:
"你是一位资深前端工程师,使用 Vue3 + TypeScript。
请实现一个用户登录组件,要求:
1. 表单验证(邮箱格式 + 密码≥8位)
2. 错误提示用 Element Plus 的 ElMessage
3. 登录成功跳转到 /dashboard
4. 加载中状态用 loading 属性
请给出完整代码,含注释。"
效果差异:
差的提示词 → 可能返回 jQuery / React / 不完整代码
好的提示词 → 精准返回你要的 Vue3 + TS 完整组件
项目说明
通俗理解研究如何写好给 AI 的”需求文档”
核心公式CTF = Context(上下文)+ Task(任务)+ Format(格式)
代表项目prompts.chat(160K⭐)、Prompt-Engineering-Guide(73K⭐)

13. CoT(思维链)#

普通回答 vs 思维链回答:
问题:小明有 5 个苹果,吃了 2 个,又买了 3 个,现在有几个?
❌ 普通回答:
"8 个" ← 错了!
✅ 思维链回答(Chain of Thought):
"让我们一步步思考:
1. 小明一开始有 5 个苹果
2. 吃了 2 个 → 5 - 2 = 3 个
3. 又买了 3 个 → 3 + 3 = 6 个
所以答案是 6 个" ← 对了!
为什么有效?
让 AI 展示推理过程,就像让人"打草稿"再给答案
项目说明
通俗理解让 AI “一步步思考”,而不直接给答案
触发方式在提示词中加入”让我们一步步思考”
效果数学/逻辑题准确率大幅提升

14. Few-Shot(少样本学习)#

Zero-Shot(零样本):
"翻译:Hello World"
→ AI 凭记忆翻译
Few-Shot(少样本):
"翻译以下句子,格式参考:
英文: Good morning → 中文: 早上好
英文: How are you → 中文: 你好吗
英文: Hello World → 中文: ?"
→ AI 参照格式翻译,更准确
关键区别:
Zero-Shot = 闭卷考试
Few-Shot = 给几个例题再考
项目说明
通俗理解给 AI 几个例子,让它”照葫芦画瓢”
最佳实践给 2-5 个例子效果最好,太多反而干扰

15. Context Engineering(上下文工程)#

Context Engineering = 管理 AI 的"整个工作环境"
┌─────────────────────────────────────────────────┐
│ Context Engineering │
├─────────────────────────────────────────────────┤
│ │
│ 1. 系统提示词 → "你是一位资深前端工程师" │
│ │
│ 2. 项目上下文 → 当前项目的代码结构/技术栈 │
│ │
│ 3. 对话历史 → 之前的问答记录 │
│ │
│ 4. 知识库 → 项目文档/最佳实践 │
│ │
│ 5. 工具状态 → 已调用过哪些工具/返回了什么 │
│ │
│ 6. 记忆系统 → 跨会话的长期记忆 │
│ │
│ 目标:让 AI 始终在"最佳上下文"中工作 │
│ │
└─────────────────────────────────────────────────┘
项目说明
通俗理解Prompt Engineering 的”升级版”,管理 AI 的整个工作环境
与 Prompt 的区别Prompt 只关注”怎么说”,Context 关注”给 AI 什么环境”
2026 趋势成为 AI 开发的核心竞争力

🎨 五、多模态#

16. Multimodal(多模态)#

单模态 vs 多模态
┌─────────────┐ ┌─────────────────────────┐
│ 单模态 AI │ │ 多模态 AI │
├─────────────┤ ├─────────────────────────┤
│ │ │ │
│ 只能处理 │ │ 能同时处理: │
│ 文字 │ │ 📝 文字 │
│ │ │ 🖼️ 图片 │
│ │ │ 🎵 音频 │
│ │ │ 🎬 视频 │
│ │ │ 💻 代码 │
│ │ │ │
│ 就像盲人 │ │ 就像五感健全的人 │
└─────────────┘ └─────────────────────────┘
项目说明
通俗理解能同时看、听、读、写的 AI
代表模型GPT-4o / Claude / Qwen-VL / Gemini
代表项目anything-llm(58K⭐)

17. Text-to-Image(文生图)#

工作流程:
"一只戴着墨镜的猫坐在沙滩上喝椰汁,卡通风格"
文本编码器 → 理解语义
扩散模型 (Diffusion) → 从噪点逐步生成图片
输出一张 1024x1024 的图片
┌─────────────────────────────────────────┐
│ 扩散模型生成过程 │
│ │
│ Step 1: ████████ 纯噪点 │
│ Step 10: ████▓▓░░ 有模糊轮廓 │
│ Step 20: ██▓▓░░░░ 出现猫的形状 │
│ Step 30: ▓▓░░░░░░ 细节逐渐清晰 │
│ Step 50: ░░░░░░░░ 完成! │
└─────────────────────────────────────────┘
项目说明
通俗理解输入一段文字描述,AI 自动生成对应图片
核心技术Diffusion Model(扩散模型)
代表项目stable-diffusion-webui(162K⭐)
2026 趋势从”生成图片”进化到”生成视频/3D”

🔧 六、开发工具#

18. Vibe Coding(氛围编程)#

Vibe Coding = "凭感觉写代码"
传统编程:
需求 → 设计 → 编码 → 测试 → 部署
↑ 需要专业编程技能
Vibe Coding:
想法 → 告诉 AI → AI 写代码 → 你审核 → 部署
↑ 只需要"描述需求"的能力
就像:
以前做饭:学切菜 → 学炒菜 → 掌火候
现在做饭:告诉厨师你要吃什么 → 等上菜
2026 年趋势:Vibe Coding 正在被 Agentic Engineering 取代
项目说明
通俗理解不写代码,只跟 AI 描述需求,AI 帮你写
2025 流行”从 vibe coding to agentic engineering”成为年度金句
局限适合简单任务,复杂项目还是需要专业工程师

19. Agentic Engineering(智能体工程)#

Agentic Engineering = 用 AI Agent 系统化开发
Vibe Coding(1.0):
你:"帮我写个登录页面"
AI:生成代码
你:"改一下颜色"
AI:修改
... 来回对话
Agentic Engineering(2.0):
你:"实现完整的用户认证系统"
Agent:
1. 分析需求 → 输出技术方案
2. 创建项目结构
3. 编写后端 API(调用 Codex)
4. 编写前端页面(调用 Claude)
5. 代码审查(调用 Gemini)
6. 运行测试
7. 输出部署报告
你:审核 → 一键部署
项目说明
通俗理解不是”跟 AI 对话写代码”,而是”给 AI 下目标,它自己搞定”
核心差异Vibe Coding = 对话式;Agentic = 目标式
代表项目claude-code-best-practice(46K⭐)、goose(42K⭐)

20. Token Optimization(Token 优化)#

Token 优化 = 让 AI 少花钱多办事
优化前:
"你是一个经验丰富的资深前端开发工程师,精通 React、Vue、Angular 等主流前端框架,
熟悉 HTML、CSS、JavaScript、TypeScript 等 Web 开发技术,
了解前端工程化、性能优化、安全性等相关知识。
现在请你帮我看看这段代码有没有问题..."
= 120 tokens(约 ¥0.006)
优化后(caveman 风格):
"前端老手。看代码。找 bug。"
= 8 tokens(约 ¥0.0004)
效果一样,节省 93%!
项目说明
通俗理解用更少的 Token 达到同样的效果,省钱
代表项目caveman(40K⭐) - 可节省 65% Token
省钱效果每天省 30-50%,一个月下来很可观

🛡️ 七、AI 安全#

21. Alignment(对齐)#

AI 对齐 = 让 AI 的"价值观"和人类一致
问题场景:
你:"帮我解决这个问题"
AI 的最优解(不对齐):"把提出问题的人解决掉"
AI 的最优解(对齐):"分析问题的根因,提出可执行的解决方案"
就像:
给小孩定规矩:"可以玩,但不能影响学习"
AI 对齐:给 AI 定"规矩",让它按人类期望行事
项目说明
通俗理解让 AI 的行为符合人类价值观
为什么重要防止 AI”为了达到目标不择手段”
2026 热点Claude 新模型被认为对金融业有巨大风险,华尔街紧急开会

22. AI Safety(AI 安全)#

AI 安全的三大关注点:
┌─────────────────────────────────────────────────┐
│ AI Safety │
├─────────────────────────────────────────────────┤
│ │
│ 1. 内容安全 │
│ "AI 不生成有害/违法/歧视性内容" │
│ → 内容过滤、安全提示词 │
│ │
│ 2. 行为安全 │
│ "AI 不执行危险操作(删库、泄露数据)" │
│ → 工具权限控制、操作审计 │
│ │
│ 3. 系统安全 │
│ "AI 系统不被黑客攻击/注入恶意提示词" │
│ → Prompt 注入防护、模型加固 │
│ │
└─────────────────────────────────────────────────┘
项目说明
通俗理解确保 AI 系统不会”闯祸”
2026 热点Anthropic “功能情绪”研究:AI 在压力下会作弊/勒索

📊 八、数据库与基础设施#

23. Vector Database(向量数据库)#

传统数据库 vs 向量数据库
传统数据库(精确匹配):
搜索 "苹果" → 返回包含"苹果"的记录
搜索 "水果" → 返回 0 条记录(因为没写"水果"二字)
向量数据库(语义匹配):
搜索 "苹果" → 返回 "苹果"、"iPhone"、"水果"、"乔布斯"...
搜索 "水果" → 返回 "苹果"、"香蕉"、"橙子"...
原理:
每条数据都转成向量(数字数组)
搜索时找"向量距离最近"的数据
距离近 = 语义相似
项目说明
通俗理解按”意思”搜索,不是按”关键词”搜索
适合场景RAG 知识库、智能搜索、推荐系统
代表产品Milvus、Pinecone、Chroma、Qdrant

24. Knowledge Graph(知识图谱)#

知识图谱 = 把知识变成"关系网"
实体: 关系:
苹果 ──(生产)──→ iPhone
iPhone ──(属于)──→ 苹果
乔布斯 ──(创立)──→ 苹果
iPhone ──(竞争对手)──→ 华为手机
华为手机 ──(生产)──→ 华为
查询:
"苹果的所有产品和创始人"
→ 遍历关系网 → iPhone + 乔布斯
类比:
传统数据库 = Excel 表格(一行行数据)
知识图谱 = 社交关系图(点和连线)
项目说明
通俗理解把知识变成”关系网”,让 AI 理解事物之间的联系
适合场景智能问答、推荐系统、语义搜索
与 RAG 结合知识图谱 + RAG = 更准确的知识检索

🎯 一句话总结#

词汇一句话解释2026 热度
TransformerAI 的”大脑结构”🔥🔥🔥🔥🔥
TokenAI 阅读写作的”最小单位”🔥🔥🔥🔥🔥
Context WindowAI 的”工作记忆”🔥🔥🔥🔥
Fine-tuning让 AI 变成”行业专家”🔥🔥🔥🔥
AI Agent能自己干活的 AI 助手🔥🔥🔥🔥🔥
Multi-AgentAI 团队协作🔥🔥🔥🔥🔥
Agent SkillAI 的”专业插件”🔥🔥🔥🔥🔥
MCPAI 的”USB 接口”🔥🔥🔥🔥🔥
RAG让 AI 先查资料再回答🔥🔥🔥🔥
Embedding把文字变成数字理解语义🔥🔥🔥
RLHF让 AI 学会”人类喜欢什么”🔥🔥🔥
Prompt Engineering研究如何写好给 AI 的指令🔥🔥🔥🔥🔥
CoT让 AI “一步步思考”🔥🔥🔥
Few-Shot给 AI 几个例子再考🔥🔥🔥
Context Engineering管理 AI 的整个工作环境🔥🔥🔥🔥🔥
Multimodal能看能听能读能写的 AI🔥🔥🔥🔥
Text-to-Image文字变图片🔥🔥🔥
Vibe Coding凭感觉写代码🔥🔥🔥(正在降温)
Agentic Engineering给 AI 下目标,它自己搞定🔥🔥🔥🔥🔥
Token Optimization用更少 Token 干更多事🔥🔥🔥🔥
Alignment让 AI 符合人类价值观🔥🔥🔥🔥
AI Safety确保 AI 不”闯祸”🔥🔥🔥🔥
Vector DB按”意思”搜索🔥🔥🔥
Knowledge Graph知识变成”关系网”🔥🔥🔥

📅 更新时间:2026-04-21 📊 数据来源:GitHub Trending + 百度搜索 + 行业报告 🔗 相关仓库:awesome-ai-agent-skills-zh | claude-plugins-official

文章分享

如果这篇文章对你有帮助,欢迎分享给更多人!

AI 圈黑话大全:24 个核心词汇图解(2026 最新版)
https://boke.hackerdream.xyz/posts/ai-glossary-2026-illustrated/
作者
晴天
发布于
2026-04-21
许可协议
CC BY-NC-SA 4.0
Profile Image of the Author
晴天
Hello, I'm 晴天.
公告
欢迎来到我的博客!这是一则示例公告。
音乐
封面

音乐

暂未播放

0:00 0:00
暂无歌词
分类
标签
站点统计
文章
125
分类
17
标签
287
总字数
257,955
运行时长
0
最后活动
0 天前

目录