智行™ v2.0

核心原则

只写AI不知道的

不解释AI已有的常识，聚焦业务特有逻辑

Concise is key

SKILL.md控制在500行以内，reference按需加载

设定恰当自由度

脆弱操作给死路径，开放判断给方向

Progressive Disclosure

SKILL.md是导航地图，reference按需加载

可验证 > 可描述

把「写得好」转化为可打勾的检查项

质量门控分级

阻断级必须修复，警告级建议修复

质量目标

42/42

质量总分（100%）

40+检查清单逐项验证

≥95%

测试集通过率（典型）

三层测试（10条）

≥80%

测试集通过率（边界）

三层测试（5条）

100%

测试集通过率（安全）

三层测试（3条）

8阶段完整方法论

算力成本基线

中国模型价格 + 每人每月预算 + CFO汇报话术

成本基线表

markdown格式

每人每月预算

按使用量估算

CFO汇报话术

成本效益分析

技能设计

需求澄清框架（6个核心问题）→ 架构决策 → SKILL.md模板

需求澄清框架

6个核心问题

架构决策

复杂度判定→形态A/B/C

SKILL.md模板

融入质量门控

提示词工程

Progressive Disclosure原则 → 反模式防御 → Reference文件组织

Progressive Disclosure

渐进式披露

反模式防御

模糊动词、深层嵌套等

Reference组织

4种拆分模式

三层加载模型

应用

知识编排

三层分层 + 高级检索策略 + 知识生命周期管理

质量保障

核心阶段

三层测试用例（10+5+3）→ LLM-as-Judge自动评估 → 40+质量检查清单

三层测试用例

典型10条 + 边界5条 + 安全3条

LLM-as-Judge

自动评估

40+质量检查

8大类42项

运行优化

成本可视化 + 多模型策略 + 模型淘汰 + 降级

持续进化

版本对比报告 → 质量检查项追溯 → 反模式预防机制

失败回滚与修复

质量门控分级（🔴阻断级/⚠️警告级）→ 快速修复清单 → 回滚执行流程

质量门控分级

🔴阻断级 / ⚠️警告级

快速修复清单

常见问题解决方案

回滚执行流程

标准操作步骤

反模式库 — 5大类必须避免的错误

1. Description 类

1.1 视角错误

❌ 第一/二人称

description: "I can help you process PDF files"
description: "你可以用它来生成报告"

✅ 第三人称陈述

description: "生成项目洞察报告。当用户提到「项目洞察」「健康度评估」「RAID」时触发。不用于一次性邮件撰写。"

1.2 过于模糊

❌ 无法触发匹配

description: "Helps with documents"
description: "处理数据"

✅ 包含触发词 + 排除条件

description: "Extract text and tables from PDF files, fill forms, merge documents. Use when working with PDF files or when the user mentions PDFs, forms, or document extraction. Not for creating PDFs from scratch."

2. 内容类

2.1 解释 AI 已知的常识

❌ 浪费 token 解释常识

PDF (Portable Document Format) is a common file format...

JSON (JavaScript Object Notation) is a data interchange format...

✅ 直接给 AI 不知道的信息

Use pdfplumber for text extraction:
```python
import pdfplumber
with pdfplumber.open("file.pdf") as pdf:
    text = pdf.pages[0].extract_text()
```

2.2 模糊动词（致命问题）

❌ 模糊到无法执行

帮助用户理解需求
支持多种输出格式
改善文档质量
优化用户体验
加强沟通效率

✅ 具体到可验证

向用户提问 6 个核心问题，记录答案
输出 Markdown 和 JSON 两种格式，Markdown 在前 JSON 在后
每段 ≤ 3 句，禁用黑话清单中的 12 个词，事实必须带引用 ID
生成后自动跑 validate.py，报告错误数量
列出需要确认的 3 个决策点，等用户回复后继续

黑话替换对照表

禁用词	替换为
赋能	帮助/使能够
抓手	切入点/关键点
拉齐	对齐/统一
打法	方法/策略
落地	实现/实施
维度	方面/角度
沉淀	积累/总结
聚焦	专注/集中
迭代	改进/优化
闭环	完整流程
耦合	关联/依赖

5分钟快速开始

创建最简单的Skill（2分钟）

mkdir hello-world-skill && cd hello-world-skill
cat > SKILL.md << 'EOF'
---
name: "hello-world"
description: "输出问候语。当用户说'你好'、'hello'时触发。不用于其他语言问候。"
---

# Hello World Skill

## 何时使用
用户说"你好"或"hello"时触发。

## 流程步骤
1. **接收用户输入** → 检查是否为"你好"或"hello"
2. **生成问候语** → 输出"你好，世界！很高兴见到你。"
3. **结束** → 等待下一次触发

## 输出契约
- 固定输出："你好，世界！很高兴见到你。"
- 不输出其他内容

## 完成标准
- [ ] 输出包含"你好，世界"
- [ ] 不响应"再见"等其他词语
EOF

基础质量检查（2分钟）

手动检查清单（MVP 5项）：

name ≤ 64字符，仅含小写+数字+连字符
description ≤ 1024字符，第三人称
无模糊动词（帮助/支持/改善/优化/加强）
每步有明确的输入→动作→输出
有 ≥ 1条测试Prompt

测试Skill（1分钟）

✅ 应触发

用户：你好
AI：你好，世界！很高兴见到你。

用户：hello
AI：你好，世界！很高兴见到你。

❌ 不应触发

用户：再见
AI：（不触发本Skill）

下一步： 阅读 references/anti_patterns.md 避免常见错误，参考 references/quality_checklist.md 进行完整质量检查，使用 templates/skill_template_full.yaml 创建更复杂的Skill。

AI技能建设方法论

核心原则

只写AI不知道的

Concise is key

设定恰当自由度

Progressive Disclosure

可验证 > 可描述

质量门控分级

质量目标

8阶段完整方法论

算力成本基线

技能设计

提示词工程

知识编排

质量保障

运行优化

持续进化

失败回滚与修复

质量检查清单（8大类42项）

质量等级划分

反模式库 — 5大类必须避免的错误

1. Description 类

2. 内容类

黑话替换对照表

5分钟快速开始

创建最简单的Skill（2分钟）

基础质量检查（2分钟）

测试Skill（1分钟）