MCP 热潮后,企业如何做 Skill 目录治理

Skill目录治理 是企业在引入 MCP、工具调用和各类外部连接器后,对 AI 数字员工可用能力进行登记、分级、验收和复盘的运营机制。它回答的不是“还能接入多少工具”,而是“哪些工具能被哪个 Agent 调用、调用前需要什么输入、失败后谁负责、产物放在哪里”。如果没有这层治理,团队每天会在重复授权、口径不一、工具选错、文件散落和人工追责中耗时。
Anthropic 发布 Model Context Protocol 后,行业更重视模型与工具、数据源之间的标准连接;OpenAI 的 Agents 文档也把工具作为 Agent 能力的重要组成部分,见 OpenAI Agents tools guide。这些趋势说明连接能力会持续增加。但对企业来说,工具数量不是护城河,可审核的 Skill 目录才是护栏。
目录先于自动化
很多团队第一次做 AI 数字员工时,会直接把浏览器、邮件、表格、CRM、文档库、数据库和网页搜索都交给同一个 Agent。短期看很强,长期看会制造三类问题:重复工具不知道用哪个;同一工具在不同任务里输入格式不同;高风险工具没有清楚的确认边界。
Axon 的表达方式更适合白领团队:System Skills 提供开箱即用的办公、文件、互联网和媒体能力;User Skills 把企业自己的业务动作封装成可复用能力;Agent 再把这些 Skills 编排成固定流程。不了解能力分层的团队,可以先读 System Skills 是什么 和 System Skills 与通用 Agent 的分层。
Skill目录治理 的核心立场:工具不应该直接堆给 Agent,工具必须先变成有边界、有字段、有权限、有验收记录的 Skill。
一个可运营的 Skill 目录长什么样
Skill 目录不是技术团队内部清单,而是运营、业务负责人和审核人都能读懂的能力资产表。它至少要包含能力用途、输入字段、输出产物、权限等级、失败处理和可复用场景。
{
"skillId": "sales-brief-from-web-and-pdf",
"owner": "sales-ops",
"capabilityLayer": "user-skill",
"allowedAgents": ["weekly-customer-brief-agent"],
"inputContract": ["companyName", "sourceUrls", "pdfFiles", "recipientRole"],
"permissionLevel": "confirm",
"outputs": ["brief.md", "source-list.md", "email-draft.md"],
"failurePolicy": "missing source or uncertain claim returns a review note",
"reviewEvidence": ["runId", "artifactPath", "approvalDecision"]
}
这段配置的价值不在格式,而在约束。allowedAgents 防止任意 Agent 调错能力;inputContract 让 Source Data 字段先变成输入契约,可继续参考 Source Data 字段设计;permissionLevel 把高风险动作交给 Trust Mode;reviewEvidence 让一次运行能被复盘。
| 目录字段 | 运营用途 | 如果缺失会发生什么 |
|---|---|---|
| owner | 找到能力负责人 | 工具失败后没人修 |
| inputContract | 控制输入质量 | Agent 把上下文写进大段提示词 |
| permissionLevel | 区分自动和确认 | 发送、覆盖、删除等动作越界 |
| outputs | 明确产物归属 | 文件留在聊天窗口无法验收 |
| failurePolicy | 处理不确定性 | Agent 编造结果或静默失败 |
外部工具进入 Axon 前的晋升规则
一个外部工具不应因为“能接上”就立刻进入核心 Agent。更稳的做法是把能力分成观察、候选、受控、稳定四个状态。
- 观察:只允许人工试用,记录适合解决什么问题。
- 候选:允许在一次性任务中调用,但不能进入定时 Agent。
- 受控:已经有输入契约、权限等级和产物目录,可以进入少量 Agent。
- 稳定:经过多次运行,有失败样例、修复记录和验收标准,可以加入团队标准 Skill 目录。
这套晋升规则能减少“工具热度”对业务流程的干扰。MCP、插件、浏览器自动化和文件工具都可以存在,但只有被目录治理过的能力,才适合进入长期 AI 数字员工。
Axon 视角:目录治理连接 Trust Mode 和 workspace
Skill目录治理 不能停在表格里。它要落到三个 Axon 对象上。
第一是 Trust Mode。低风险读取和整理可以自动执行;发送邮件、调用外部系统、覆盖文件、删除内容和发布动作必须确认或授权。相关边界可以继续读 人工确认边界。
第二是 workspace。每次 Skill 运行都应把输入快照、产物文件、日志摘要和人工决策放进 workspace,而不是只留在聊天历史里。这样审核人可以看到“这次 Agent 为什么这么判断”。
第三是 Agent 控制台。目录治理给控制台提供能力元数据:哪个 Agent 调用了哪个 Skill,是否越权,失败是输入问题还是能力问题。对于已经开始运营多条流程的团队,这些字段会成为控制台的状态、风险和复盘来源。
三段式落地顺序
这篇文章不建议把目录治理做成复杂项目。先从一个部门和少量高频能力开始。
- 第一步:列出当前已经被 Agent 或人工助手反复调用的 5 个工具,标注 owner、输入字段和输出文件。
- 第二步:把其中 2 个低风险工具封装成 Skill 目录卡,明确 permissionLevel 和 failurePolicy。
- 第三步:选择 1 个 Agent 试运行,把 runId、artifactPath 和 approvalDecision 写入 workspace。
FAQ
Q1: Skill目录治理 会不会拖慢 AI 数字员工上线?
会让第一条流程更慢一点,但会让第二条、第三条流程更快。因为输入字段、权限和失败处理已经沉淀下来,后续 Agent 不需要每次重新解释工具边界。
Q2: MCP 工具能不能直接给业务团队用?
可以试用,但不建议直接进入长期 Agent。业务团队真正需要的是被封装后的 Skill:有名称、有用途、有输入契约、有输出产物、有权限等级。
Q3: 哪些工具最适合先进入目录?
优先选择低风险、高频、产物可验收的工具,例如网页资料读取、PDF 解析、Markdown 生成、Excel 读取和邮件草稿生成。涉及发送、覆盖、删除、付款和外部发布的能力要进入确认或授权模式。
Q4: 如何判断目录治理做得足够好?
抽查一条 Agent 运行记录:如果你能看到它调用了哪些 Skills、输入来自哪里、输出文件在哪里、是否触发确认、失败后如何处理,就说明目录治理已经开始发挥作用。
交给审核人的下一步
如果你的团队正在尝试 MCP 或外部工具连接,不要先问“还能接什么”。先把 3 个高频办公动作写成 Skill 目录卡:输入字段、权限等级、产物路径和失败处理。再用 Axon 把其中一张卡组装进可验收的 AI 数字员工。现在就开始使用这张目录卡做一次小范围试跑,并继续阅读更多 Axon 的 Agent 运营文章。