作者：王君生

前言#

skills 是个很难定义的东西，从翻译来看叫技能，但是它不只是代表技能，今天我们先从历史脉络上梳理一下 LLM 的几个发展阶段，然后再看 skills 能做什么，再给出简单的定义，最后结合代码的解析，给出一些关于 skill 的不成熟的思考。

刀耕火种#

2022 年底 — ChatGPT 爆火，大家的热情很高，都在跟 ChatGPT 对话、聊天，当时对于我们来说跟 ChatGPT 交流的核心就是”怎么说才能让它听话”。大家都在交流 prompt 如何写，如何定义 role，如何把“需求 + 指令 + 约束”全部塞进一句话，并且在当时还真的出现了 prompt 工程师。这个阶段的知识高度碎片化，难以复用，不过这个过程也改变了程序的逻辑，从“程序的逻辑”变成“自然语言”。

开始规模化#

2023年初 — Anthropic 发布 Constitutional AI 、OpenAI 出 prompt engineering 官方指南，开始把有效的 prompt 沉淀成模板库、系统提示（system prompt）规范，在这个阶段，还诞生了 Prompt-Engineering 、 awesome-chatgpt-prompts-zh 等有名的 prompt 仓库。不过问题也随之暴露： 模板难以维护、跨任务迁移困难、模型更新后又需要大量重新调试 。在这个阶段 prompt 开始函数化，但在工程角度上来看，还是很弱的，prompt 的管理依旧是个难题。

有标准#

2023年6月 — OpenAI 正式推出 Function Calling ，模型第一次有了结构化调用外部系统的标准接口，2024年， MCP（Model Context Protocol）由 Anthropic 提出，试图统一工具调用的协议层，生态开始标准化。当模型具备了调用外部工具的能力后，” 让模型做什么 “和” 模型怎么做 “开始分离。Prompt 不再需要硬编码所有逻辑，而是描述意图，执行交给工具。这打开了更结构化的思路，开始真正的从“语言生成”到“决策”+“调度”。

推出 skill#

2025 年 10 月中旬，Anthropic 正式发布 Claude Skills 。Skills 本质上是可复用的、有文档的能力单元。它把” 如何完成某类任务的最佳实践 “封装起来（比如如何生成 docx、如何读 PDF），让模型在需要时查阅并遵循，而不是靠 prompt 里的临时指令。这带来了几个优势：

知识可维护 ：最佳实践集中在 SKILL.md 和其他相关的文件夹中，更新就可以了；
按需加载 ：模型判断需要时才读取，不污染上下文；
人机协作 ：人只负责打磨 skill 文档，模型负责执行；
可复用 ：别人只需要获取编写好的 skills，得到结果基本无差；

我们可以把 Skills 理解成「公司规章制度」+「工具箱」的组合。

公司规章制度告诉 AI：「当你遇到某类任务时，应该怎么做，分几步，每一步用什么工具。」工具箱里装着它需要用的脚本和参考资料。

展开来说，一个 Skill 就是一个文件夹，里面有三样东西：

第一，SKILL.md 文件 。这是「指令」，用自然语言写的。告诉 AI：这个 Skill 是干什么的，什么情况下该用，怎么用，有什么注意事项。

第二，脚本 。可以是 Python、JavaScript 或者其他语言写的代码。当 AI 需要「动手」的时候，就执行这些脚本。

第三，资源文件 。比如参考文档、模板、配置文件。AI 在执行任务的时候可以查阅这些资料。

所以 skills 可以看成是综合了 高阶的 prompt + 工具调用 ，再结合 clawhub 等类似的发布平台，就有了 skills 的发布、查询、安装、版本管理等，之前的问题都解决了。

打个比方。函数调用像是给你一把锅铲、一个锅、再加一些调料，你得自己知道什么时候倒油，什么时候放菜，用锅铲怎么炒，怎么颠锅等。Skills 像是给 AI 一本《中国八大菜系菜谱》 + 十八般的工具，菜谱里不只是告诉 AI 炒菜步骤，还告诉他各个阶段所需要的工具。在这个过程中，AI 只管用，只管炒菜，结束了就是一盘菜。哪怕来一个从来没炒过菜的人，只要跟 AI 说，我要做个土豆丝，他得到的成品和前面五星级大厨的成品是一样的。

所以对于 skills，根据上面的叙述，简单的定义可以是：可被语义触发的能力包，它包含领域知识、执行步骤、输出规范与约束条件。

Skills 是如何实现的#

Skill 的本质，是把磁盘上一段我们可读的 markdown（SKILL.md），在调用瞬间编译成模型能消化的 prompt blocks，然后注入对话上下文。所以我们可以将 skill 分为两个大的阶段，一个是 loading（加载）阶段，还有一个是注入调用阶段。今天我们从 Claude Code 源代码的角度去看去了解，这两个阶段是如何实现，为了实现这两个阶段，Claude Code 做了哪些事情，怎么去实现这个设计

加载#

一、启动入口：从命令行到 main()#

当我们在命令行中输入 claude 时，下面的流程就启动了

关键代码位置：src/main.tsx:1918-1932

1
typescript 体验AI代码助手 代码解读复制代码// 同步注册：必须在 getCommands 之前完成
2
if (process.env.CLAUDE_CODE_ENTRYPOINT !== 'local-agent') {
3
  initBuiltinPlugins();
4
  initBundledSkills();
5
}
6
// 并行启动
7
const setupPromise = setup(preSetupCwd, ...);
8
const commandsPromise = worktreeEnabled ? null : getCommands(preSetupCwd);

为什么要这样设计 ： initBundledSkills() 是纯内存的数组 push 操作（ bundledSkills.push(skill) ），耗时 <1ms。它必须在 getCommands() 启动前完成，否则 getBundledSkills() 返回空数组，结果技能会丢失。

二、技能加载#

当我们在 .claude/skills/ 目录、项目目录等地方放了 skills 时，会通过 IO 的方式读取 skills，整体的流程如下：

loadAllCommands 的合并顺序（优先级从高到低）：

1
typescript 体验AI代码助手 代码解读复制代码// 如果有重复的，会进行去重去处理
2
return [
3
  ...bundledSkills,          // 内嵌技能
4
  ...builtinPluginSkills,    // 内置插件技能
5
  ...skillDirCommands,       // 磁盘上的技能（用户/项目/管理）
6
  ...workflowCommands,       // 工作流命令
7
  ...pluginCommands,         // 插件命令
8
  ...pluginSkills,           // 插件技能
9
  ...COMMANDS(),             // 内置命令（非技能类型）
10
]

三、磁盘技能加载：getSkillDirCommands#

关键代码位置：getSkillDirCommands:

这是最核心的技能加载逻辑，负责从文件系统读取 SKILL.md 文件。

3.1 目录搜索范围#

1
plain 体验AI代码助手 代码解读复制代码getSkillDirCommands(cwd) 搜索以下目录：
2
    │
3
    ├── Managed Skills      ←── /etc/claude/.claude/skills/ （企业策略管理）
4
    ├── User Skills         ←── ~/.claude/skills/            （用户全局技能）
5
    ├── Project Skills      ←── .claude/skills/              （项目级技能，沿目录树向上搜索）
6
    ├── Additional Skills   ←── --add-dir 指定的目录/.claude/skills/
7
    └── Legacy Commands     ←── .claude/commands/            （旧格式，向后兼容）

3.2 并行加载策略#

所有目录的加载是并行的（ Promise.all ），因为它们互不依赖：

1
typescript 体验AI代码助手 代码解读复制代码const [managedSkills, userSkills, projectSkills, additionalSkills, legacyCommands] =
2
  await Promise.all([
3
    loadSkillsFromSkillsDir(managedSkillsDir, 'policySettings'),
4
    loadSkillsFromSkillsDir(userSkillsDir, 'userSettings'),
5
    Promise.all(projectSkillsDirs.map(dir => loadSkillsFromSkillsDir(dir, 'projectSettings'))),
6
    Promise.all(additionalDirs.map(dir => loadSkillsFromSkillsDir(join(dir, '.claude/skills'), ...))),
7
    loadSkillsFromCommandsDir(cwd),
8
  ]);

3.3 单个技能目录的加载过程#

1
plain 体验AI代码助手 代码解读复制代码loadSkillsFromSkillsDir(basePath, source)
2
    │
3
    ├── 1. fs.readdir(basePath)               ←── 读取目录列表
4
    │
5
    └── 2. 对每个 entry 并行处理：
6
        │
7
        ├── 跳过非目录项（只支持 skill-name/SKILL.md 格式）
8
        │
9
        ├── 读取 skill-name/SKILL.md 文件内容
10
        │
11
        ├── parseFrontmatter(content)         ←── 解析 YAML frontmatter
12
        │   输入: "---\ndescription: ...\n---\n# Skill body"
13
        │   输出: { frontmatter: {...}, content: "# Skill body" }
14
        │
15
        ├── parseSkillFrontmatterFields(...)  ←── 提取结构化字段
16
        │   提取: description, allowedTools, model, hooks, paths, effort...
17
        │
18
        └── createSkillCommand(...)           ←── 构建 Command 对象
19
            闭包捕获 markdownContent，延迟到调用时再编译

3.4 去重机制#

加载完成后，使用 realpath 解析文件的真实路径进行去重：

1
typescript 体验AI代码助手 代码解读复制代码// 通过 realpath 检测符号链接和重复的父目录
2
const fileIds = await Promise.all(
3
  allSkillsWithPaths.map(({ filePath }) => getFileIdentity(filePath))
4
);
5

6
// 先到先得：优先级由合并顺序决定
7
// managed > user > project > additional > legacy
8
for (entry of allSkillsWithPaths) {
9
  if (seenFileIds.has(fileId)) continue;  // 跳过重复
10
  seenFileIds.set(fileId, skill.source);
11
  deduplicatedSkills.push(skill);
12
}

3.5 条件技能（Conditional Skills）#

带有 paths frontmatter 的技能不会立即激活，而是存储在 conditionalSkills Map 中：

1
yaml 体验AI代码助手 代码解读复制代码---
2
description: React 组件开发助手
3
paths: src/components/**, src/pages/**
4
---
5

6
当用户操作的文件路径匹配 paths 模式时，技能被激活并加入动态技能列表。

激活流程： activateConditionalSkillsForPaths(filePaths, cwd) → 使用 ignore 库做 gitignore 风格匹配。

四、SKILL.md 文件解析#

4.1 Frontmatter 字段格式#

1
yaml 体验AI代码助手 代码解读复制代码---
2
# 基础信息
3
name: 显示名称（可选，默认取目录名）
4
description: 技能描述
5
argument-hint: <参数提示文本>
6
arguments: [arg1, arg2]
7

8
# 模型和行为控制
9
model: claude-sonnet-4-6       # 指定使用的模型
10
effort: high                    # low | medium | high | 整数
11
context: fork                   # fork = 独立子进程执行，inline = 主线程
12
agent: agent-name               # 指定 agent 定义
13

14
# 权限控制
15
allowed-tools: [Bash, Read, Write]
16
user-invocable: true            # 用户是否可通过 /name 调用
17
disable-model-invocation: false # 模型是否可通过 SkillTool 调用
18

19
# 条件激活
20
paths: src/**/*.tsx             # 匹配文件路径时自动激活
21

22
# 钩子
23
hooks:
24
  PreToolUse:
25
    - command: "eslint $FILE"
26
      matcher: "Write|Edit"
27

28
# Shell 执行环境
29
shell: bash
30

31
# 版本
32
version: "1.0"
33
---

4.2 解析为 Command 对象#

parseSkillFrontmatterFields() 将 YAML 映射为结构化字段，然后 createSkillCommand() 组装成 Command 对象：

1
typescript 体验AI代码助手 代码解读复制代码{
2
  type: 'prompt',              // 技能都是 prompt 类型
3
  name: 'skill-name',          // 目录名（唯一标识）
4
  description: '...',          // 从 frontmatter 或正文第一行提取
5
  source: 'projectSettings',   // 来源：userSettings / projectSettings / policySettings
6
  loadedFrom: 'skills',        // 加载方式：skills / bundled / plugin / mcp
7
  allowedTools: ['Bash'],      // 额外允许的工具
8
  model: 'claude-sonnet-4-6',  // 模型覆盖
9
  effort: 'high',              // 努力程度
10
  userInvocable: true,         // 用户可调用
11
  context: 'fork',             // 执行上下文
12
  hooks: {...},                // 钩子配置
13
  paths: ['src/**/*.tsx'],     // 条件路径
14
  contentLength: 1234,         // SKILL.md 内容长度
15
  skillRoot: '/path/to/skill', // 技能目录路径
16

17
  // 核心：延迟加载闭包
18
  getPromptForCommand: async (args, toolUseContext) => {...}
19
}

五、延迟加载机制：getPromptForCommand#

技能内容在 启动时只解析 frontmatter ，SKILL.md 的正文内容通过闭包捕获，仅在用户调用 /skill-name 时才执行完整的”编译”过程。

设计权衡 ：启动时只解析 frontmatter（用于技能列表展示），正文编译延迟到调用时。这使得启动速度快，同时支持动态内容（shell 命令在每次调用时执行获取最新结果）。

六、动态技能发现#

除了启动时加载，系统还支持在会话过程中动态发现新技能。

6.1 文件操作触发发现#

当用户读写文件时，系统会沿文件路径向上搜索 .claude/skills/ 目录：

1
plain 体验AI代码助手 代码解读复制代码discoverSkillDirsForPaths(filePaths, cwd)
2
    │
3
    ├── 对每个 filePath：
4
    │   从文件父目录开始，向上遍历到 cwd（不含 cwd）
5
    │   每级检查是否存在 .claude/skills/ 目录
6
    │   记录到 dynamicSkillDirs（去重用）
7
    │
8
    └── 返回新发现的目录列表（按深度降序排列）

6.2 激活流程#

1
plain 体验AI代码助手 代码解读复制代码addSkillDirectories(dirs)
2
    │
3
    ├── 对每个目录调用 loadSkillsFromSkillsDir()
4
    │
5
    ├── 深层路径覆盖浅层路径（同名技能）
6
    │
7
    ├── 存入 dynamicSkills Map
8
    │
9
    └── skillsLoaded.emit()  ←── 通知缓存失效

6.3 缓存失效#

动态技能加载后，需要清除相关的 memoization 缓存：

1
typescript 体验AI代码助手 代码解读复制代码clearCommandMemoizationCaches() {
2
  loadAllCommands.cache?.clear?.()
3
  getSkillToolCommands.cache?.clear?.()
4
  getSlashCommandToolSkills.cache?.clear?.()
5
  clearSkillIndexCache?.()         // 技能搜索索引

getCommands() 不被缓存（因为需要每次重新检查 availability 和 isEnabled），但它内部的 loadAllCommands 被 memoize，所以清除内层缓存即可。

七、技能优先级总览#

1
plain 体验AI代码助手 代码解读复制代码优先级从高到低：
2

3
1. managed skills          ←── 企业策略目录 /etc/claude/.claude/skills/
4
2. user skills             ←── 用户全局 ~/.claude/skills/
5
3. project skills          ←── 项目目录 .claude/skills/（最近的优先）
6
4. additional skills       ←── --add-dir 指定目录
7
5. legacy commands         ←── 旧格式 .claude/commands/
8
6. bundled skills          ←── 代码内嵌技能
9
7. builtin plugin skills   ←── 内置插件技能
10
8. plugin skills           ←── 第三方插件技能
11

12
同名技能：先注册者胜出（由合并顺序决定）
13
文件去重：realpath 相同的文件只保留第一个

八、关键数据流图#

调用#

加载的阶段将所有的 skills 加载到 Command[] 数组中，等着被调用，梳理 Claude Code 的源码来看，用户总共有 9 个入口可以去调用 skills，9 种入口如下：

#	入口	触发方式	执行模式	关键文件
1	用户斜杠命令	用户输入 `/skill-name`	inline / fork	processSlashCommand.tsx:309
2	立即命令	查询进行中输入 `/config` 等	local-jsx 直接执行	REPL.tsx:3161
3	SkillTool.call()	模型调用 `Skill` 工具	inline / fork / remote	SkillTool.ts:580
4	MCP Skill	通过 SkillTool 或 `/server:skill`	fork（强制）	SkillTool.ts:81-94
5	Cron/定时任务	`scheduled_tasks.json` 或 `/loop`	队列 → processUserInput	useScheduledTasks.ts:40
7	Agent 预加载	Agent 定义中的 `skills:` 字段	预注入初始消息	runAgent.ts:578-645
8	Ultraplan 关键字	输入包含魔法关键字	重写为 `/ultraplan`	processUserInput.ts:467
9	初始 prompt	`-p "/skill ..."` 或 agent initialPrompt	onSubmit → processSlashCommand	main.tsx:3094

本文限于篇幅，9 种如果都讲述篇幅太大，也不利于阅读，所以今天就讲述第一种，用户用斜杠命令行的方式来调用 skills。

代码的调用流程图如下#

详细代码调用流程#

第 1 层 REPL.onSubmit() — 入口把关#

详细代码位置：REPL.tsx:3142

当我们在 Claude Code 中输入 /commit 并按下回车，在中，组件 PromptInput 调用 onSubmit 回调。这里是整条链路的入口。

1
javascript 体验AI代码助手 代码解读复制代码// 1. 检测是否是 immediate 命令（immediate: true 的 local-jsx 命令）
2
//    这些命令可以在 AI 正在处理时立即执行，不用排队
3
if (!speculationAccept && input.trim().startsWith('/')) {
4
  const commandName = /* 从 input 提取命令名 */
5
    const matchingCommand = commands.find(...)
6
  const shouldTreatAsImmediate = queryGuard.isActive &&
7
    (matchingCommand?.immediate || options?.fromKeybinding)
8

9
  if (matchingCommand && shouldTreatAsImmediate && matchingCommand.type === 'local-jsx') {
10
    // 直接执行，跳过队列 — return early
11
  }
12
}

对于大多数 /skill-name（type 为 prompt），这里不会命中 immediate 快速通道，而是继续往下走。

接下来的处理：

清空输入框
加入历史记录
调用 handlePromptSubmit()
加载接与 frontmatter 解析

第 2 层：handlePromptSubmit() — 队列化#

详细代码位置：handlePromptSubmit.ts:120

这个模块的核心职责是决定输入是立即执行还是排队等待。

1
javascript 体验AI代码助手 代码解读复制代码// 如果 AI 正在处理中（queryGuard.isActive），新的输入进入队列
2
if (queryGuard.isActive || isExternalLoading) {
3
  enqueue({ value: finalInput.trim(), mode, pastedContents })
4
  return  // 不执行，等 AI 空闲后 dequeue
5
}
6
// 否则立即执行
7
await executeUserInput({ queuedCommands: [cmd], ... })
8
executeUserInput 是实际执行的核心函数，它内部调用 processUserInput()。

第 3 层：processUserInput() — 模式路由#

详细代码位置：processUserInput.ts:533

这个函数是一个大型路由器，根据输入模式分发给不同处理器：

1
javascript 体验AI代码助手 代码解读复制代码// Bash 模式 → processBashCommand()
2
if (mode === 'bash') { ... }
3

4
// Slash command → processSlashCommand()
5
if (inputString !== null && !effectiveSkipSlash && inputString.startsWith('/')) {
6
  const { processSlashCommand } = await import('./processSlashCommand.js')
7
  const slashResult = await processSlashCommand(inputString, ...)
8
  return slashResult
9
}
10

11
// 普通文本 → processTextPrompt()
12
// ...
13
/commit 以 / 开头，命中 slash command 分支。

第 4 层：processSlashCommand() — 命令解析与分发#

详细代码位置：processSlashCommand.tsx:309

这是整条链路中最关键的分发层。

Step 4.1：解析命令名

1
javascript 体验AI代码助手 代码解读复制代码const parsed = parseSlashCommand(inputString)
2
// 如果输入的是 /commit fix: 修复bug
3
// 那么经过 parseSlashCommand 函数转化成： { commandName: 'commit', args: 'fix: 修复bug', isMcp: false }

parseSlashCommand 函数的解析规则

去掉 / 前缀
第一个空格前为命令名
支持 MCP 命令格式：/mcp (MCP) args

Step 4.2：查找命令注册表

1
javascript 体验AI代码助手 代码解读复制代码if (!hasCommand(commandName, context.options.commands)) {
2
  // 命令不存在 → 判断是文件路径还是未知命令
3
  if (looksLikeCommand(commandName) && !isFilePath) {
4
    return { messages: [...], shouldQuery: false, resultText: 'Unknown skill: xxx' }
5
  }
6
  // 可能是文件路径（如 /var/log）→ 当普通文本发给模型
7
  return { messages: [...], shouldQuery: true }
8
}

Step 4.3：按 type 分发
Claude Code 有三种命令类型（types/command.ts），不同的命令会执行不一样的动作：

type	行为	示例
prompt	展开为文本，发送给 AI 模型	/commit, skill 类命令
local	本地执行，返回文本结果	/compact
local-jsx	渲染交互式 UI 组件	/config, /model

对于 /skill-name（type = prompt），进入 getMessagesForPromptSlashCommand()。

第 5 层：getMessagesForPromptSlashCommand() — 技能内容加载#

processSlashCommand.tsx:827

这是 skill 的核心——将 SKILL.md 的内容加载为 prompt。

Step 5.1：检查 context === ‘fork’

1
javascript 体验AI代码助手 代码解读复制代码if (command.context === 'fork') {
2
  return await executeForkedSlashCommand(...)
3
  // 在独立子 agent 中执行，有自己的上下文和 token 预算, 默认不是 fork
4
}

Step 5.2：加载技能内容

1
javascript 体验AI代码助手 代码解读复制代码const result = await command.getPromptForCommand(args, context)

getPromptForCommand 在技能注册时（就是前面一个加载阶段获取到的）定义（ loadSkillsDir.ts:344 ），它做了以下事情：

变量替换：将 $ARGUMENTS, ${CLAUDE_SKILL_DIR}, ${CLAUDE_SESSION_ID} 替换为实际值
Shell 执行：如果 SKILL.md 中有!command 格式的 shell 注入，会先执行
返回 ContentBlockParam[]：包含最终展开后的文本内容

Step 5.3：构造消息列表

1
javascript 体验AI代码助手 代码解读复制代码const messages = [
2
  createUserMessage({ content: metadata }),        // 命令元数据：名称、参数
3
  createUserMessage({ content: skillContent, isMeta: true }),  // SKILL.md 内容（对用户隐藏）
4
  ...attachmentMessages,                           // 附件消息
5
  createAttachmentMessage({                        // 权限声明：allowedTools
6
    type: 'command_permissions',
7
    allowedTools: additionalAllowedTools,
8
  }),
9
]
10
return {
11
  messages,
12
  shouldQuery: true,    // ← 关键：告诉上层需要调用 AI 模型
13
  allowedTools: additionalAllowedTools,
14
  model: command.model,
15
  effort: command.effort,
16
  command,
17
}

第 6 层：onQuery() — 发送给 AI#

详细代码位置：handlePromptSubmit.ts:560
回到 executeUserInput()（handlePromptSubmit.ts:560）：

1
javascript 体验AI代码助手 代码解读复制代码await onQuery(
2
  newMessages,          // 包含 skill 内容的消息列表
3
  abortController,
4
  shouldQuery,          // true → 需要调用模型
5
  allowedTools ?? [],   // skill 声明的额外工具权限
6
  model ?? mainLoopModel,
7
  onBeforeQuery,
8
  primaryInput,
9
  effort,
10
)

onQuery 将这些消息追加到对话历史，然后调用 Claude API。此时 SKILL.md 的全部内容作为一条 user message 发送给模型，模型根据技能指令执行相应操作。

不成熟的思考#

一、Skill 在解决什么问题？#

LLM 目前的三个缺陷，构成了 Skill 系统存在的全部理由：

缺陷	本质	Skill 的对抗手段
输出不一致性	同一输入产生不同输出	Prompt 模板 + 参数化注入 → 固定行为边界
结构漂移	长对话中偏离初始意图	Frontmatter 约束 + hooks 校验 → 结构护栏
瞎猜问题	缺乏上下文时产生幻觉	`when_to_use` + `paths` 条件激活 → 精确触发域

但这个观察也只是停留在表层。我们考虑深层的问题是： 为什么 Prompt 模板能收敛概率模型？

答案在代码里。看 createSkillCommand 的 getPromptForCommand 闭包：

代码位置

1
typescript 体验AI代码助手 代码解读复制代码async getPromptForCommand(args, toolUseContext) {
2
  let finalContent = baseDir
3
    ? \`Base directory for this skill: ${baseDir}\n\n${markdownContent}\`
4
    : markdownContent
5

6
  finalContent = substituteArguments(finalContent, args, true, argumentNames)
7
  finalContent = finalContent.replace(/\$\{CLAUDE_SKILL_DIR\}/g, skillDir)
8
  finalContent = finalContent.replace(/\$\{CLAUDE_SESSION_ID\}/g, getSessionId())
9
  finalContent = await executeShellCommandsInPrompt(finalContent, ...)
10
  return [{ type: 'text', text: finalContent }]
11
}

这不是简单的”给 LLM 一个模板”。这是一套 编译管线 ——把声明式的 Markdown 编译成确定性的运行时上下文。每一层转换都在缩小 LLM 的决策空间：

Base directory 注入 ：锚定文件系统上下文，消除路径猜测
参数替换 ：将用户输入映射到预定义槽位，限制输入域
环境变量注入 ：运行时状态确定性绑定
Shell 命令执行 ：动态注入实时数据，避免 LLM 凭记忆猜测
返回 ContentBlockParam[] ：结构化输出，消除格式不确定性

所以 Skill 的本质不是”模板”，而是一个 Prompt 编译器 ——把高熵的人的意图，通过多层转换，编译成低熵的结构化指令。

二、它不是一个，而是三个系统#

从代码中可以识别出三个正交的子系统，各有不同的设计目标和权衡：

2.1 声明层：SKILL.md 作为 DSL#

SKILL.md 不是 Markdown 文档，而是一个 领域特定语言（DSL） ：

1
yaml 体验AI代码助手 代码解读复制代码---
2
name: ...          # 标识符
3
description: ...   # 语义描述（用于模型路由）
4
when_to_use: ...   # 触发条件（用于模型自主调用）
5
paths: ...         # 文件路径守卫（用于条件激活）
6
allowed-tools: ... # 权限边界
7
model: ...         # 计算资源分配
8
effort: ...        # 推理深度控制
9
context: fork      # 隔离级别
10
hooks: ...         # 生命周期钩子
11
shell: ...         # 执行环境
12
---

每一行 frontmatter 都在回答一个问题： 这个 Skill 需要什么样的运行时保证？

字段	回答的问题	设计意图
`paths`	何时激活？	延迟加载，减少上下文污染
`allowed-tools`	能做什么？	最小权限原则
`model`	用什么脑子？	成本-质量权衡
`effort`	想多深？	推理预算控制
`context: fork`	隔离吗？	故障爆炸半径
`hooks`	谁来校验？	外部护栏注入

但这里在梳理的时候也发现一个问题 ：目前的 DSL 缺少一个 depends_on 或 composes 字段。Skill 之间的组合目前只能通过 SkillTool 在 Prompt 层面隐式实现，没有声明式的依赖关系。这意味着 Skill 的组合是”调用时发现”而非”设计时保证”，不过如果设计了 depends_on ，也有可能会变成类似于 node_modules 可怕的依赖地狱。而且从现在 skills 开放以来，各种带“毒”的 skills 也在层出不穷，如果加上依赖，这些“毒”会隐藏的更深。

2.2 编译层：getPromptForCommand 作为编译管线#

延迟编译是一个精妙的设计 。启动时只解析 frontmatter（ estimateSkillFrontmatterTokens 只估算元信息的 token），正文编译推迟到调用时。这意味着：

启动速度不受 Skill 内容大小影响
Shell 命令每次调用获取最新结果（而非启动时的快照）
代价是每次调用的首次延迟（需执行编译管线）

这是经典的 延迟求值（Lazy Evaluation）策略 ，在 prompt 工程中的应用，很有意思， pi 在 pi-mono 中也用了同样的设计。

2.3 运行时层：Command 对象作为运行时表示#

createSkillCommand 返回的 Command 对象是一个闭包 ——捕获了 markdownContent 和所有 frontmatter 字段，但不执行任何计算。直到 getPromptForCommand 被调用时，编译管线才启动。

这个设计有一个重要的推论： Skill 的内容在内存中只有一份拷贝 （闭包捕获引用），但每次调用会产生新的编译结果。这意味着：

内存效率 ：N 个 Skill 只占用 N 份 Markdown 的空间
CPU 效率 ：只有被调用的 Skill 才消耗编译时间
一致性代价 ：同一个 Skill 的两次调用，如果中间 Shell 命令结果变了，输出会不同（这个可以测验一下，挺有意思的）

三、Skill 系统解决不了什么？#

3.1 组合爆炸问题#

当前 Skill 的组合是隐式的——一个 Skill 可以通过 SkillTool 调用另一个 Skill，但：

没有声明式的组合关系（ A composes B, C ）
没有组合后的 token 预算管理
没有组合冲突检测（两个 Skill 对同一文件给出矛盾指令）
没有 DAG 调度（Skill A 的输出作为 Skill B 的输入）

如果引入声明式组合，Skill 系统会从一个”Prompt 模板库”进化为一个”Prompt 计算图”。每个 Skill 是一个节点， composes 定义边，运行时按拓扑序执行，每层的输出作为下一层的输入。这能解决：

Token 预算 ：DAG 调度可以精确计算每层预算
冲突检测 ：编译期静态分析 DAG 的输出冲突
可观测性 ：每层的输入输出可独立审查

但是这样复杂度也上去了，孰好孰坏，还是要看这个痛点对于用户是否足够痛

3.2 验证闭环缺失#

从代码看，Skill 的执行路径是单向的：

1
plain 体验AI代码助手 代码解读复制代码SKILL.md → parseFrontmatter → createSkillCommand → getPromptForCommand → LLM → 输出

没有反馈回路。如果 LLM 的输出偏离了 Skill 的预期，系统无法：

自动检测偏离
回退到上一个检查点
动态调整 Prompt 参数

hooks 是一个部分解决方案（PostToolUse 可以校验工具调用的输出），但它只能拦截工具调用，不能拦截 LLM 的纯文本输出。

理想的结构是：

1
plain 体验AI代码助手 代码解读复制代码SKILL.md → 编译 → 执行 → 校验 → { 通过 → 输出 | 失败 → 回退 + 重新编译 }

这需要为 Skill 引入 output_schema 或 validation 字段，定义期望的输出结构。这样也让我们自己写 skill 没法写用例去进行测试，都只能边写边调，结果也没法量化。

3.3 版本和演进问题#

Frontmatter 有 version 字段，但代码中 不使用它做任何版本控制逻辑 。它只是一个标签。

当 Skill A 依赖 Skill B 的 v1 行为，而 B 升级到 v2 时，没有机制保证兼容性。这在团队协作中尤其危险——一个人的 Skill 升级可能悄悄破坏另一个人的工作流。

四、从产研流程视角重新审视 Skill#

4.1 当前的现实#

Skill 目前自动化的都是 原子操作 ：/commit, /review, /test 等。这些是产研流程中的”叶节点”——它们不依赖其他操作的输出。

1
plain 体验AI代码助手 代码解读复制代码需求 → 技术方案 → 编码 → 测试 → 上线
2
  │        │         │       │       │
3
  │        │         ├─/commit      ├─/deploy
4
  │        │         ├─/review       │
5
  │        │         └─/test         │
6
  │        │                         │
7
  └────────┴───── 尚未有 Skill 介入 ─┘

4.2 Skill 能覆盖的范围（理论最大值）#

如果我们按产研流程的每个阶段来映射 Skill 的能力：

阶段	当前状态	Skill 理论上能做的	需要的额外基础设施
需求分析	无	从 PRD 提取关键需求，识别模糊点，生成问题清单	需求文档的结构化输入
技术方案	趋势（/ultraplan 等）	架构建议、依赖分析、风险评估、方案对比	项目依赖图、历史方案库
编码	/commit, /review, TDD skill	按方案自动编码、增量校验	方案到代码的映射规则
测试	部分覆盖	自动生成测试、覆盖率分析、边界探测	测试策略模板、覆盖率基础设施
上线	无	变更影响分析、回滚方案、灰度策略	CI/CD 集成、部署配置

所以产研在 skills 上的探索，就可以以各个节点为基准点，通过各个领域内的专家来编写 skills，然后通过自动化或人工的方式，走通产研流程。

4.3 关键约束：Skill 不等于自动化#

正如上面的产研的覆盖范围做的，我们使用 skills 做嵌入产研流程，一定要放弃惯性思维，我们使用 skills ， 整个过程可能并不一定是提效，而是更好的提高整个研发的质量 ，更深度一点来说。Skill 的核心价值不在于 自动化 （用机器替代人），而在于 跟 AI 交互（交流）的标准化 （让不同的人产出相同质量的工作）。

标准化带来的是：

降低随机性 ：没有 Skill 时，代码审查质量取决于审查者的经验和状态；有 Skill 时，审查流程由 Skill 保证最低质量
知识传递 ：高级工程师的方法论可以编码为 Skill，而非仅存在于他们的脑子里
可审计性 ：Skill 的执行路径是确定性的，可以回溯和审查

但这有一个隐含假设： Skill 编写者的方法论是正确的 。如果方法论本身有缺陷，Skill 会以工业化的速度传播这个缺陷。所以，归根结底，不在于要不要 AI 贯穿整个产研流程，也不在要不要使用 skill，而是团队或者编写 skill 的人方法论是正确的，是适合团队和个人的，不然整个方向会越走越偏。

AI 总结#

Claude Code 的 skills 源码解析总结#

核心思想#

Skills 是 Claude Code 中可复用的、有文档的能力单元，本质上是把”如何完成某类任务的最佳实践”封装起来，让模型在需要时查阅并遵循。它综合了高阶 prompt + 工具调用，解决了 prompt 模板难以维护、跨任务迁移困难、模型更新后需要大量重新调试等问题。

我的理解#

这篇文章不仅是对 Skills 技术实现的解析，更是对 LLM 应用开发范式演变的深刻洞察。从刀耕火种的 prompt 工程，到标准化的函数调用，再到 Skills 这种可复用能力包的出现，体现了 LLM 应用从”手工艺”向”工业化”转变的过程。Skills 的设计哲学——将最佳实践封装、人机协作分离、知识可维护——这些理念值得所有 LLM 应用开发者深思。

主要内容#

LLM 发展的四个阶段#

刀耕火种（2022年底）：ChatGPT 爆火，核心是”怎么说才能让它听话”，知识高度碎片化，prompt 工程师出现
开始规模化（2023年初）：Constitutional AI、prompt engineering 官方指南发布，prompt 模板库出现，但模板难以维护、跨任务迁移困难
有标准（2023年6月）：Function Calling 推出，MCP 协议提出，“让模型做什么”和”模型怎么做”开始分离
推出 skill（2025年10月）：Claude Skills 发布，可复用的能力单元出现

Skills 的定义与组成#

简单定义：可被语义触发的能力包，包含领域知识、执行步骤、输出规范与约束条件。

一个 Skill 文件夹包含三样东西：

SKILL.md 文件：用自然语言写的”指令”，告诉 AI 这个 Skill 是干什么的、什么情况下该用、怎么用
脚本：Python、JavaScript 等代码，AI 需要”动手”时执行
资源文件：参考文档、模板、配置文件等

Skills 加载阶段#

一、启动入口#

initBundledSkills() 必须在 getCommands() 前完成，纯内存数组 push 操作，耗时 <1ms

二、技能加载合并顺序（优先级从高到低）#

1
1. managed skills          - 企业策略目录
2
2. user skills             - 用户全局 ~/.claude/skills/
3
3. project skills          - 项目目录 .claude/skills/
4
4. additional skills       - --add-dir 指定目录
5
5. legacy commands         - 旧格式 .claude/commands/
6
6. bundled skills          - 代码内嵌技能
7
7. builtin plugin skills   - 内置插件技能
8
8. plugin skills           - 第三方插件技能

三、磁盘技能加载（getSkillDirCommands）#

搜索范围：Managed Skills、User Skills、Project Skills、Additional Skills、Legacy Commands
并行加载：所有目录并行加载（Promise.all）
去重机制：使用 realpath 解析文件真实路径去重
条件技能：带有 paths frontmatter 的技能存储在 conditionalSkills Map 中，路径匹配时激活

四、SKILL.md 文件解析#

Frontmatter 支持的关键字段：

name、description：基础信息
model、effort、context：模型和行为控制
allowed-tools、user-invocable：权限控制
paths：条件激活
hooks：钩子配置
shell、version：执行环境和版本

五、延迟加载机制#

启动时只解析 frontmatter（用于技能列表展示）
SKILL.md 正文内容通过闭包捕获
仅在用户调用 /skill-name 时才执行完整的”编译”过程

六、动态技能发现#

文件操作时沿路径向上搜索 .claude/skills/ 目录
深层路径覆盖浅层路径（同名技能）
加载后清除 memoization 缓存

Skills 调用阶段#

9 种调用入口#

用户斜杠命令 - /skill-name
立即命令 - 查询中输入 /config 等
SkillTool.call() - 模型调用 Skill 工具
MCP Skill - 通过 SkillTool 或 /server:skill
Cron/定时任务 - scheduled_tasks.json 或 /loop
Agent 预加载 - Agent 定义中的 skills: 字段
Ultraplan 关键字 - 输入包含魔法关键字
初始 prompt - -p "/skill ..." 或 agent initialPrompt

斜杠命令调用详细流程（6层）#

第 1 层：REPL.onSubmit() - 入口把关

检测 immediate 命令快速通道
清空输入框、加入历史记录、调用 handlePromptSubmit()

第 2 层：handlePromptSubmit() - 队列化

AI 处理中时新输入进入队列
否则立即执行 executeUserInput()

第 3 层：processUserInput() - 模式路由

Bash 模式 → processBashCommand()
Slash command → processSlashCommand()
普通文本 → processTextPrompt()

第 4 层：processSlashCommand() - 命令解析与分发

解析命令名（parseSlashCommand）
查找命令注册表
按 type 分发（prompt、local、local-jsx）

第 5 层：getMessagesForPromptSlashCommand() - 技能内容加载

检查 context === ‘fork’（独立子 agent 执行）
调用 getPromptForCommand() 加载技能内容
- 变量替换：$ARGUMENTS、${CLAUDE_SKILL_DIR}、${CLAUDE_SESSION_ID}
- Shell 执行：!command 格式的 shell 注入
- 返回 ContentBlockParam[]
构造消息列表（元数据、SKILL.md 内容、附件、权限声明）

第 6 层：onQuery() - 发送给 AI

将消息追加到对话历史
调用 Claude API

我的理解#

作者对 Skills 源码的解析非常透彻，尤其在调用流程的 6 层架构分析上，展现了深厚的代码阅读功底。但更有价值的是，作者没有停留在代码实现层面，而是深入思考了 Skills 系统解决的本质问题——LLM 的输出不一致性、结构漂移、幻觉问题。这种从”是什么”到”为什么”的分析思路，是这篇文章最值得学习的地方。

总结#

这篇文章从古茗前端团队的视角，深入解析了 Claude Code 的 Skills 系统。文章首先梳理了 LLM 发展的四个历史阶段，清晰地定位了 Skills 出现的背景和意义；然后从源码角度详细分析了 Skills 的加载和调用两大阶段，包括启动入口、目录搜索、并行加载、延迟编译、动态发现等核心机制，以及斜杠命令调用的 6 层详细流程；最后作者提出了四个方面的”不成熟思考”，深入探讨了 Skills 解决的问题、三个正交子系统的设计、当前的局限性，以及从产研流程视角的重新审视。

我的扩展总结#

Skills 系统的本质：Prompt 编译器#

作者提出了一个非常深刻的见解：Skills 不是简单的”模板”，而是一个 Prompt 编译器。getPromptForCommand 闭包中的多层转换（Base directory 注入、参数替换、环境变量注入、Shell 命令执行、返回结构化输出），每一层都在缩小 LLM 的决策空间，把高熵的人的意图，通过多层转换，编译成低熵的结构化指令。这是理解 Skills 系统设计的关键。

三个正交子系统的设计智慧#

文章将 Skills 系统拆解为三个正交的子系统，这个视角非常有启发性：

声明层（SKILL.md 作为 DSL）：每一个 frontmatter 字段都在回答”这个 Skill 需要什么样的运行时保证？“，这种设计体现了”声明式”优于”命令式”的思想
编译层（getPromptForCommand 作为编译管线）：延迟求值的设计精妙，平衡了启动速度和运行时灵活性
运行时层（Command 对象作为运行时表示）：闭包设计实现了内存效率和 CPU 效率的双重优化

这三个子系统的正交设计，使得 Skills 系统既有灵活性，又有可维护性。

局限性分析：不仅仅是技术问题#

作者指出的三个局限性（组合爆炸、验证闭环缺失、版本和演进问题），本质上反映了 LLM 应用开发从”单技能”向”多技能协作”演进时面临的共性挑战。这些问题不仅仅是技术问题，更是生态问题：

组合爆炸：需要类似 npm 的包管理机制，但又不能重蹈 node_modules 的覆辙
验证闭环缺失：需要标准化的测试框架和验证机制，让 Skill 可以像传统代码一样进行单元测试和集成测试
版本和演进问题：需要语义化版本管理和依赖解析机制，保证 Skill 生态的健康发展

这些局限性既是挑战，也是未来的创新方向。

产研流程视角的重新审视：质量优先于效率#

作者最后提出的”Skill 的核心价值不在于自动化，而在于跟 AI 交互的标准化”这个观点，打破了人们对 AI 的常规认知。通常我们认为 AI 是为了提效，但在产研流程中，标准化带来的质量保证（降低随机性、知识传递、可审计性）可能比单纯的效率提升更有价值。这提醒我们，在将 AI 引入产研流程时，首先要思考的是”如何保证质量”，而不是”如何提高效率”。

对 Skill 编写者的启示#

这篇文章也给 Skill 编写者提供了重要启示：

方法论正确性是前提：如果方法论本身有缺陷，Skill 会以工业化的速度传播这个缺陷
深入理解系统设计：理解加载和调用流程，可以编写出更高效、更可靠的 Skill
思考 Skill 的局限性：在单个 Skill 层面，可以通过设计缓解一些系统层面的局限性
关注产研流程的实际痛点：最好的 Skill 来自对实际工作流程的深刻理解

总的来说，这篇文章不仅是对 Claude Code Skills 系统的技术解析，更是一份关于 LLM 应用开发的深度思考。它让我们看到，Skills 系统的意义远不止于一个功能特性，而是代表了 LLM 应用开发工业化的一个重要方向。

本文档基于 https://juejin.cn/post/7625838952655912994 整理总结，并加入了扩展理解

原文链接：https://juejin.cn/post/7625838952655912994