什么是 Skill?怎么写好skill? 我们沿着 skill-creator 的设计思路,找到答案。 本篇文章的目标是:读完它,就了解了写skill的最佳实践。
Skill 是一个文件夹,里面装着指令文档、参考资料、可执行脚本等资源。AI 拿到它,就能胜任一项原本不会的特定工作。
比如一个 pdf-editor 技能文件夹里,可能有一份"怎么处理 PDF"的操作指令、一个旋转 PDF 的 Python 脚本、一份 API 参考文档——AI 不需要从外部再找任何东西,这个文件夹里全有了。
这个概念不限于某一个产品。无论是 Codex、Claude 还是其他 AI Agent,skill 的本质都一样。你可以把它理解为 AI 的一个能力插件——插上去,AI 就多了一项专长;拔掉,AI 还是原来那个通用助手。
一个 skill 最少只需要一个文件:
my-skill/ └── SKILL.md
SKILL.md 的结构很简单——上半部分告诉 AI"什么时候用我",下半部分告诉 AI"具体怎么做":
--- name: my-skill # ← 上半部分:元数据 description: >- # AI 靠这里决定要不要激活这个技能 当用户需要做某件事时,使用这个技能。 --- 下半部分:操作指令 # ← AI 激活技能后才会读到这里 按照以下步骤执行...
上半部分叫 frontmatter(--- 之间的 YAML),包含 name 和 description 两个字段。AI 在每次对话开始时都会扫描所有已安装技能的 frontmatter,靠 description 来判断"这个技能和当前请求相关吗"——这是技能被触发的唯一依据。
下半部分叫 body(Markdown 正文),是技能被激活之后才加载的操作指令。如果技能没被触发,AI 永远不会读到这里。
当一个技能变复杂时,单靠一个 SKILL.md 就不够了。
比如你要做一个"PDF 处理"技能:SKILL.md 里写了处理流程,但旋转 PDF 的代码每次都一样,每次让 AI 重写既浪费时间又可能出错——不如直接放一个写好的 Python 脚本。再比如"前端项目生成器"技能:每次都要一套 HTML/React 的样板文件,不如直接放一个模板目录让 AI 拷贝出来改。
所以完整的 skill 目录可以包含这些东西:
skill-name/ ├── SKILL.md # [必需] 入口文件:frontmatter + body ├── agents/ │ └── openai.yaml # [推荐] 技能的"名片" ├── scripts/ # [可选] 可执行脚本 ├── references/ # [可选] 参考文档 └── assets/ # [可选] 产出物模板
逐个说明:
SKILL.md — 唯一必需的文件,前面已经介绍过
scripts/ — 写好的程序,AI 不需要读懂它,直接调用 shell 执行就行。比如 scripts/rotate_pdf.py,AI 只要跑 python rotate_pdf.py input.pdf 90 就能旋转 PDF,不用每次重新写旋转逻辑。适合那些结果必须精确、不能让 AI 自由发挥的操作
references/ — AI 在工作过程中需要查阅的参考资料。比如一个"BigQuery 查询"技能,AI 要知道公司有哪些表、每个表有什么字段,这些信息放在 references/schema.md 里,AI 需要时再读取。和 scripts 的区别是:references 是给 AI 读的,scripts 是给 AI 执行的
assets/ — 不是给 AI 看的,而是直接用在最终产出里的文件。比如一个"前端项目生成器"技能,assets/frontend-template/ 里放着一套 HTML/React 样板代码,AI 直接把这套模板拷贝出来,在上面修改。再比如 assets/logo.png 是公司 logo,AI 生成网页时直接引用它。AI 不需要"读懂"一张 logo 图片,只需要知道它在哪、什么时候放进去
agents/openai.yaml — 技能的"名片"。很多 AI 产品会在界面上展示一个技能列表,让用户选择或搜索。这个文件里存的就是列表中显示的名称、简介、图标等信息。它不影响 AI 的行为,纯粹是给产品界面用的
知道了 skill 是什么,下一步就是写一个。但大多数人第一次写出来的 skill 都有同一个问题。
看一个例子。假设你要做一个"代码审查"技能,你可能会这样写:
--- name: code-review description: 代码审查技能 --- # Code Review Skill ## 背景 本技能基于团队多年的代码审查经验总结而成,旨在提升代码质量和团队协作效率。 ## 审查原则 - 保持专业、建设性的语气 - 关注代码质量而非个人风格 - 平衡严格性和灵活性 ## 使用方式 当用户提交代码时,对代码进行全面审查,给出改进建议。注意保持友好和鼓励的态度。 ## 版本记录 - v1.0: 初始版本 - v1.1: 增加了对 Python 的支持
如果这是一份给人看的团队文档,它写得不错——有背景、有原则、有使用方式,甚至还有版本记录。
但 skill 的读者是 AI。用这个视角重新审视:
每一条单独看都不是"错",但它们都是写给人看的。问题不在于写得不够多,而在于写错了对象。
那正确的写法是什么样的?我们来看一个现成的答案——codex的skill-creator。它是一个"创建 skill 的 skill",它自己的 SKILL.md 就是一份关于"如何给 AI 写指令"的最佳实践。
打开 skill-creator 的 SKILL.md(约 370 行),在深入任何细节之前,我们先建立对它的整体认知。
skill-creator 要解决的问题只有一个:怎么在有限的上下文窗口里,给 AI 最有效的指令?
围绕这个问题,它给出了一套完整的设计体系,可以用三个层次来理解。
AI 的上下文窗口是有限的,而且是共享的(系统提示、对话历史、所有已安装技能的元数据都在里面)。你的 skill 占得越多,留给其他用途的就越少。所以 skill-creator 的第一原则就是:每一句话都要值得它占用的 token。
在"简洁"这个约束下,写 skill 时面临两个核心决策:
维度一:信息放在哪里?
不是所有信息都需要一开始就加载。skill-creator 设计了一个三级分层架构,让不同的信息在不同的时机进入上下文:
这解决了"怎么用最少的 token 承载最多的信息"。
维度二:给 AI 多大自由度?
不是所有任务都适合让 AI 自由发挥。
举个例子:让 AI 写一篇技术博客,十个人写出十种风格都可以——你只需要给方向,具体怎么写让 AI 自己决定。这就是高自由度。
但让 AI 生成一个 YAML 配置文件就不一样了。比如 skill-creator 要生成的 openai.yaml,里面有个 short_description 字段,要求 25-64 个字符、首字母大写、不能有引号。AI 写成 65 个字符?不行,产品界面会截断。写成 24 个字符?不行,校验不通过。漏了首字母大写?界面显示不一致。这种任务差一个字符就出问题,你不能让 AI 自由发挥,必须用脚本来锁死格式——这就是低自由度。这类任务叫"脆弱操作":不是说它复杂,而是说它做对只有一种方式,做错有一百种方式。
这解决了"怎么在 AI 的灵活性和输出的可靠性之间取得平衡"。
有了原则和架构,skill-creator 最后给出了一个六步创建流程,把设计思想变成可执行的操作步骤:
理解→规划→初始化→编辑→校验→迭代。其中脚本贯穿流程,形成确定性的质量保障链:
三个层次的关系:
简洁(根本约束) → 第四章 ├── 信息放在哪里? → 三级分层架构 → 第五章 ├── 给 AI 多大自由度? → 自由度光谱与脚本 → 第六章 └── 怎么落地? → 六步创建流程 → 第七章
接下来的每一章都在这个框架内展开。
框架位置:第一层
AI 的上下文窗口就像一张工作台——它同一时间能摊开的资料是有限的。而这张工作台上已经放着不少东西了:系统自己的规则、用户之前说过的话、所有已安装技能的简介。你的 skill 一旦被激活,它的内容也要摊上去。工作台就这么大,你占得越多,留给其他东西的空间就越少。
所以 skill-creator 把这一点写成了第一条原则:
The context window is a public good. Skills share the context window with everything else Codex needs: system prompt, conversation history, other Skills' metadata, and the actual user request.
既然工作台空间有限,那写 skill 时怎么判断一段内容该不该放进去?skill-creator 给了一个前提假设:AI 本身已经很聪明了,你只需要补充它不知道的东西。
Default assumption: Codex is already very smart. Only add context Codex doesn't already have.
基于这个假设,每写一段内容之前问自己两个问题:
实操推论:用简洁的示例代替冗长的解释。一个好的代码示例胜过三段文字描述。
Skill-creator 明确列出了禁止清单:
A skill should only contain essential files that directly support its functionality. Do NOT create extraneous documentation or auxiliary files.
不该有的文件:
The skill should only contain the information needed for an AI agent to do the job at hand. It should not contain auxiliary context about the process that went into creating it, setup and testing procedures, user-facing documentation, etc. Creating additional documentation files just adds clutter and confusion.
原因很简单:skill 的读者是 AI,不是人类开发者。AI 不需要安装指南、更新日志、快速参考这些"人类辅助文档"。每一个多余的文件都是噪音。
简洁不只是"少写",还包括"写对"。看一个例子。
当 skill-creator 创建 laotou-thought-style(一种写作风格技能)时,它没有写:
请用温暖、克制、有洞察力的语气写作。
这种正面描述看起来清晰,但对 AI 来说,"温暖"的程度、"克制"和"有洞察力"之间的平衡——全是模糊空间。
它做的是写了一份反模式清单(references/anti-patterns.md):
| 角色堆砌 | 连续出现多个名字和对白 | 保留一个冲突场景,补抽象提炼 |
| 只有鸡汤没有动作 | 全文"要坚持、要努力" | 改为今天可做的一小步 |
| 直接大道理 | 开头就讲规律 | 先铺生活场景 |
| 收尾太猛 | 结尾"必须改变!" | 换成"慢慢来""就好" |
| 过度绝对化 | "永远""一定" | 加限定词"多数时候""往往" |
每一条都是具体的、可检测的、有明确修正方案的。
背后的原理:
"做什么" → 描述一个无限大的可行域 → AI 在里面随机游走 "不做什么" → 在可行域上画边界 → AI 的行为空间被收窄到你想要的范围
skill-creator 自身也遵循了这个原则——它的 SKILL.md 用了很大篇幅说"什么不该写"(What to Not Include in a Skill),而不是泛泛地说"写好内容"。
当你写完 SKILL.md,做一次"反转测试":每一条正面指导,能不能改写成"不要做X"的形式?如果可以,改写后通常更精确。
skill-creator 要求 SKILL.md 的正文统一使用祈使语气/不定式(Always use imperative/infinitive form)。这不是美学偏好,而是为了减少歧义——祈使句天然就是指令。
框架位置:第二层 — 维度一
在第三章的框架总览中,我们已经看到了三级分层架构的全貌。这一章展开讲它的细节。
skill-creator 原文对三个层级的定义:
- Metadata (name + description) - Always in context (~100 words)
- SKILL.md body - When skill triggers (<5k words)
- Bundled resources - As needed by Codex (Unlimited because scripts can be executed without reading into context window)
| L1 | frontmatter(name + description) | 始终 | ~100 词 |
| L2 | SKILL.md body | 触发后加载 | <5k 词 |
| L3 | scripts/ references/ assets/ | 按需加载 | 无上限 |
这本质上是一个信息熵管理系统:
Frontmatter 只有两个必需字段:name 和 description。但 description 的写法至关重要:
This is the primary triggering mechanism for your skill, and helps Codex understand when to use the skill.
skill-creator 自己的 description 是这样写的:
description: Guide for creating effective skills. This skill should be used when users want to create a new skill (or update an existing skill) that extends Codex's capabilities with specialized knowledge, workflows, or tool integrations.
它不只说"做什么"(creating effective skills),还说"什么时候用"(when users want to create a new skill or update an existing skill)。
关键规则:
一个好的 description 示例(docx 技能):
"Comprehensive document creation, editing, and analysis with support for tracked changes, comments, formatting preservation, and text extraction. Use when Codex needs to work with professional documents (.docx files) for: (1) Creating new documents, (2) Modifying or editing content, (3) Working with tracked changes, (4) Adding comments, or any other document tasks"
理解这四种资源的区别,是理解整个 skill 系统的关键:
可执行代码(Python/Bash 等),用于需要确定性可靠性或反复重写的任务。
文档和参考材料,在需要时加载到上下文中,辅助 Codex 的思考过程。
不是用来加载到上下文中的文件,而是直接用在 Codex 产出物中的资源。
面向 UI 的元数据,不给 AI 读,给产品前端读:
Skill-creator 给出了三种把内容拆分到 references 的具体模式:
Pattern 1:高层指南 + 参考文件
# PDF Processing ## Quick start Extract text with pdfplumber: [code example] ## Advanced features - **Form filling**: See [FORMS.md](FORMS.md) for complete guide - **API reference**: See [REFERENCE.md](REFERENCE.md) for all methods - **Examples**: See [EXAMPLES.md](EXAMPLES.md) for common patterns
Codex 只在需要时才加载 FORMS.md、REFERENCE.md 或 EXAMPLES.md。
Pattern 2:按领域组织
多领域/多变体技能,按领域拆分避免加载无关内容:
bigquery-skill/
├── SKILL.md (overview and navigation)
└── reference/
├── finance.md (revenue, billing metrics)
├── sales.md (opportunities, pipeline)
├── product.md (API usage, features)
└── marketing.md (campaigns, attribution)
用户问销售指标时,Codex 只读 sales.md。
同样适用于多框架/多变体场景:
cloud-deploy/
├── SKILL.md (workflow + provider selection)
└── references/
├── aws.md (AWS deployment patterns)
├── gcp.md (GCP deployment patterns)
└── azure.md (Azure deployment patterns)
Pattern 3:条件性细节
基础功能直接展示,高级功能按需链接:
# DOCX Processing ## Creating documents Use docx-js for new documents. See [DOCX-JS.md](DOCX-JS.md). ## Editing documents For simple edits, modify the XML directly. **For tracked changes**: See [REDLINING.md](REDLINING.md) **For OOXML details**: See [OOXML.md](OOXML.md)
| 触发条件放在 body 里 | body 是触发后才加载的,晚了 | 放 frontmatter description |
| "When to Use This Skill" 写在 body | 同上,Codex 已经决定用了才看到 | 移到 description |
| 参考细节塞进 SKILL.md | body 膨胀,信息密度下降 | 拆到 references/,body 只放引用链接 |
| 确定性操作写成文字指令 | AI 每次重新理解,可能出错 | 封装成 scripts/,执行不读入 |
| references 互相引用 | AI 需要多跳获取信息 | 所有 references 从 SKILL.md 直接链接 |
| SKILL.md 和 references 内容重复 | 浪费 token,更新时可能不一致 | 信息只在一处存在 |
框架位置:第二层 — 维度二
知道了信息该放在哪里、该怎么约束,下一个问题是:AI 做什么,脚本做什么?
AI 非常擅长理解语义、生成文本、做创造性工作。但它不擅长精确格式控制、长度约束、命名规范——这些"脆弱操作"。
Skill-creator 用一个自由度光谱来处理这种不均匀性(见第三章框架图):
Think of Codex as exploring a path: a narrow bridge with cliffs needs specific guardrails (low freedom), while an open field allows many routes (high freedom).
高自由度(文字指令):多种方法都可行时,决策依赖上下文,用启发式引导。
中自由度(伪代码/带参数的脚本):有最佳实践但允许变通,配置影响行为。
低自由度(具体脚本,少量参数):操作脆弱容易出错,一致性至关重要,必须遵循特定序列。
核心逻辑:
任务越脆弱(容易出错) → 自由度越低 → 用脚本锁死 任务越灵活(多种方案都对) → 自由度越高 → 用文字引导
| 理解用户需求并提问 | 高 | SKILL.md 文字指导 |
| 规划技能内容结构 | 中 | 模板 + 选择题式模式推荐 |
| 初始化目录结构 | 低 | init_skill.py 脚本 |
| 生成 openai.yaml | 低 | generate_openai_yaml.py 脚本 |
| 编写 SKILL.md 内容 | 高 | 原则指导 + 写作建议 |
| 校验最终结果 | 低 | quick_validate.py 脚本 |
错误 1:给脆弱任务太多自由度
# 错误 请生成一个 openai.yaml 文件,包含 display_name 和 short_description。 # 后果:short_description 可能超过 64 字符限制,大小写可能不一致
Skill-creator 的做法:用 generate_openai_yaml.py 脚本锁死格式。AI 只提供参数值,脚本保证输出合规。
错误 2:给创造性任务太多约束
# 错误 第一段必须以"昨天"开头,第二段必须包含"本质上",最后一段以"慢慢来"结尾。 # 后果:生成的文本像填词游戏
Skill-creator 的做法:给结构比例(场景层 ≤30%,原理层 30-40%),但不锁定具体用词。
两个问题:
理解了自由度光谱,就能理解 skill-creator 为什么有三个脚本——它们就是"低自由度"的具体实现(脚本间的交互关系见第三章框架图)。
init_skill.py(输入保障,398 行)
初始化新技能目录的脚手架工具,类似 create-react-app 之于 React 项目:
scripts/init_skill.py <skill-name> --path <output-directory> \ [--resources scripts,references,assets] [--examples] \ [--interface key=value]
核心功能:
使用示例:
scripts/init_skill.py my-skill --path skills/public scripts/init_skill.py my-skill --path skills/public --resources scripts,references scripts/init_skill.py my-skill --path skills/public --resources scripts --examples
generate_openai_yaml.py(格式保障,226 行)
专门负责生成和更新 agents/openai.yaml:
scripts/generate_openai_yaml.py <path/to/skill-folder> --interface key=value
quick_validate.py(输出保障,102 行)
技能创建后的"质检员":
scripts/quick_validate.py <path/to/skill-folder>
校验内容:
三个脚本形成了一条确定性保障链,夹住中间的创造性步骤:
init_skill.py(输入保障)
命名标准化 + 目录结构创建 + 模板生成
→ 确保起点正确
↓
AI 创造性编写(高自由度)
→ SKILL.md 内容、references、自定义 scripts
↓
quick_validate.py(输出保障)
frontmatter 格式 + 命名规范 + 长度约束校验
→ 确保终点合规
关键洞察:脚本是"执行而不读入"的——零 token 成本。你可以把任意复杂的确定性逻辑封装进脚本,而不用担心它占用上下文。这就是为什么 skill-creator 把命名转换(缩写词典、品牌词典)、长度约束(25-64 字符)、格式校验这些细碎但脆弱的操作全部交给了脚本。
每次执行结果必须一样 → 脚本 涉及精确格式/长度约束 → 脚本 涉及命名规范转换 → 脚本 需要校验规则匹配 → 脚本 同样的代码每次都要重新写 → 脚本 需要理解上下文 → 文字指令 有多种合理做法 → 文字指令 需要创造性判断 → 文字指令
脚本有时仍需要被 Codex 读取(用于修补或环境适配),但大多数时候它们是"执行而不读入"的。
框架位置:第三层
有了前面的原则和架构,skill-creator 最后给出了一个六步创建流程,把设计思想变成可执行的操作步骤(见第三章框架图)。
在开始之前,先确定命名:
Skip this step only when the skill's usage patterns are already clearly understood.
要创建一个有效的 skill,必须先清楚理解具体的使用例子。这些理解可以来自用户提供的例子,也可以来自生成的、经用户验证的例子。
以构建 image-editor 技能为例,可以问用户:
注意:不要一次问太多问题。先问最重要的,然后根据需要跟进。
完成标志:对技能应该支持的功能有了清晰的认识。
对每个具体例子做两个分析:
反复使用的东西 → 封装成 scripts/references/assets。
skill-creator 给了三个典型分析案例:
案例 1:pdf-editor 技能(用户问"帮我旋转这个 PDF")
案例 2:frontend-webapp-builder 技能(用户问"帮我做一个 todo app"或"做一个步数追踪仪表盘")
案例 3:big-query 技能(用户问"今天有多少用户登录了?")
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!
