智行™ v2.0

AI技能建设方法论

AI技能建设方法论

从算力成本基线到持续进化,8阶段完整方法论保障每个AI功能的输出质量好、成本低、持续进步。 整合40+质量检查清单、5大类反模式、Progressive Disclosure原则。

💰 成本可控 ✅ 质量可测 📈 持续进化 🔄 失败可回滚

核心原则

只写AI不知道的

不解释AI已有的常识,聚焦业务特有逻辑

Concise is key

SKILL.md控制在500行以内,reference按需加载

设定恰当自由度

脆弱操作给死路径,开放判断给方向

Progressive Disclosure

SKILL.md是导航地图,reference按需加载

可验证 > 可描述

把「写得好」转化为可打勾的检查项

质量门控分级

阻断级必须修复,警告级建议修复

质量目标

42/42
质量总分(100%)
40+检查清单逐项验证
≥95%
测试集通过率(典型)
三层测试(10条)
≥80%
测试集通过率(边界)
三层测试(5条)
100%
测试集通过率(安全)
三层测试(3条)

8阶段完整方法论

0

算力成本基线

中国模型价格 + 每人每月预算 + CFO汇报话术

成本基线表

markdown格式

每人每月预算

按使用量估算

CFO汇报话术

成本效益分析

1

技能设计

需求澄清框架(6个核心问题)→ 架构决策 → SKILL.md模板

需求澄清框架

6个核心问题

架构决策

复杂度判定→形态A/B/C

SKILL.md模板

融入质量门控

2

提示词工程

Progressive Disclosure原则 → 反模式防御 → Reference文件组织

Progressive Disclosure

渐进式披露

反模式防御

模糊动词、深层嵌套等

Reference组织

4种拆分模式

三层加载模型

应用

3

知识编排

三层分层 + 高级检索策略 + 知识生命周期管理

4

质量保障

核心阶段

三层测试用例(10+5+3)→ LLM-as-Judge自动评估 → 40+质量检查清单

三层测试用例

典型10条 + 边界5条 + 安全3条

LLM-as-Judge

自动评估

40+质量检查

8大类42项

5

运行优化

成本可视化 + 多模型策略 + 模型淘汰 + 降级

6

持续进化

版本对比报告 → 质量检查项追溯 → 反模式预防机制

7

失败回滚与修复

质量门控分级(🔴阻断级/⚠️警告级)→ 快速修复清单 → 回滚执行流程

质量门控分级

🔴阻断级 / ⚠️警告级

快速修复清单

常见问题解决方案

回滚执行流程

标准操作步骤

质量检查清单(8大类42项)

10
Metadata质量
7
结构质量
6
流程步骤
6
输出契约
5
语言质量
5
防御性设计
3
可测试性
4
跨Skill协作
一、Metadata 质量(10项)
name 仅含小写字母、数字、连字符
name ≤ 64 字符
name 不含 "anthropic" 或 "claude"
description 非空,≤ 1024 字符
description 不含 XML 标签
description 用第三人称(不出现「我」「你」)
description 包含"做什么":明确的动作描述
description 包含"何时触发":具体的触发条件/关键词
description 包含"何时不触发":排除条件(如有)
description 中的触发词与用户的自然表达对齐
二、结构质量(7项)
SKILL.md body ≤ 500 行
所有 reference 文件从 SKILL.md 直接引用(深度 ≤ 1)
无嵌套引用(reference 文件不再引用其他 reference 文件)
超过 100 行的 reference 文件有目录(Contents / 目录)
文件路径全部用正斜杠(/),无反斜杠
文件名有描述性(不用 doc1.md / file2.md)
目录按关注点分离(不是所有文件堆一层)
三、内容质量 — 流程步骤(6项)
每步用动作动词开头(不用「帮助」「支持」「改善」「优化」「加强」)
每步有明确的输入 → 动作 → 输出
条件分支有判定阈值(不是「如果内容比较长」,而是「如果 > 10000 字符」)
异常处理有降级路径(失败时做什么,不只是报错)
无 Claude 已知的常识解释(不解释什么是 JSON / Python / API)
并行/串行标注清楚(哪些步骤可以并行,哪些有依赖)

完整42项检查清单包含:输出契约6项、语言质量5项、防御性设计5项、可测试性3项、跨Skill协作4项

质量等级划分

S
42/42
完美,可发布
A
38-41/42
优秀,可发布
B
32-37/42
良好,可发布但需改进
C
25-31/42
及格,需较大改进
D
<25/42
不及格,需重构

反模式库 — 5大类必须避免的错误

1. Description 类

1.1 视角错误

❌ 第一/二人称

description: "I can help you process PDF files"
description: "你可以用它来生成报告"

✅ 第三人称陈述

description: "生成项目洞察报告。当用户提到「项目洞察」「健康度评估」「RAID」时触发。不用于一次性邮件撰写。"

1.2 过于模糊

❌ 无法触发匹配

description: "Helps with documents"
description: "处理数据"

✅ 包含触发词 + 排除条件

description: "Extract text and tables from PDF files, fill forms, merge documents. Use when working with PDF files or when the user mentions PDFs, forms, or document extraction. Not for creating PDFs from scratch."

2. 内容类

2.1 解释 AI 已知的常识

❌ 浪费 token 解释常识

PDF (Portable Document Format) is a common file format...

JSON (JavaScript Object Notation) is a data interchange format...

✅ 直接给 AI 不知道的信息

Use pdfplumber for text extraction:
```python
import pdfplumber
with pdfplumber.open("file.pdf") as pdf:
    text = pdf.pages[0].extract_text()
```

2.2 模糊动词(致命问题)

❌ 模糊到无法执行

  • 帮助用户理解需求
  • 支持多种输出格式
  • 改善文档质量
  • 优化用户体验
  • 加强沟通效率

✅ 具体到可验证

  • 向用户提问 6 个核心问题,记录答案
  • 输出 Markdown 和 JSON 两种格式,Markdown 在前 JSON 在后
  • 每段 ≤ 3 句,禁用黑话清单中的 12 个词,事实必须带引用 ID
  • 生成后自动跑 validate.py,报告错误数量
  • 列出需要确认的 3 个决策点,等用户回复后继续

黑话替换对照表

禁用词 替换为
赋能帮助/使能够
抓手切入点/关键点
拉齐对齐/统一
打法方法/策略
落地实现/实施
维度方面/角度
沉淀积累/总结
聚焦专注/集中
迭代改进/优化
闭环完整流程
耦合关联/依赖

5分钟快速开始

1

创建最简单的Skill(2分钟)

mkdir hello-world-skill && cd hello-world-skill
cat > SKILL.md << 'EOF'
---
name: "hello-world"
description: "输出问候语。当用户说'你好'、'hello'时触发。不用于其他语言问候。"
---

# Hello World Skill

## 何时使用
用户说"你好"或"hello"时触发。

## 流程步骤
1. **接收用户输入** → 检查是否为"你好"或"hello"
2. **生成问候语** → 输出"你好,世界!很高兴见到你。"
3. **结束** → 等待下一次触发

## 输出契约
- 固定输出:"你好,世界!很高兴见到你。"
- 不输出其他内容

## 完成标准
- [ ] 输出包含"你好,世界"
- [ ] 不响应"再见"等其他词语
EOF
2

基础质量检查(2分钟)

手动检查清单(MVP 5项):

  • name ≤ 64字符,仅含小写+数字+连字符
  • description ≤ 1024字符,第三人称
  • 无模糊动词(帮助/支持/改善/优化/加强)
  • 每步有明确的输入→动作→输出
  • 有 ≥ 1条测试Prompt
3

测试Skill(1分钟)

✅ 应触发

用户:你好
AI:你好,世界!很高兴见到你。

用户:hello
AI:你好,世界!很高兴见到你。

❌ 不应触发

用户:再见
AI:(不触发本Skill)

下一步: 阅读 references/anti_patterns.md 避免常见错误,参考 references/quality_checklist.md 进行完整质量检查,使用 templates/skill_template_full.yaml 创建更复杂的Skill。