MCP 热潮后，企业如何做 Skill 目录治理

Axon AI 2026-05-23 AI 数字员工 Skills 技能

#Skill目录治理#AI数字员工#MCP#工具治理

摘要：工具越多，AI 数字员工越需要目录治理。Axon 把外部工具热潮降维成可审核的 Skill 目录、权限等级、输入契约和运行证据。

Skill目录治理是企业在引入 MCP、工具调用和各类外部连接器后，对 AI 数字员工可用能力进行登记、分级、验收和复盘的运营机制。它回答的不是“还能接入多少工具”，而是“哪些工具能被哪个 Agent 调用、调用前需要什么输入、失败后谁负责、产物放在哪里”。如果没有这层治理，团队每天会在重复授权、口径不一、工具选错、文件散落和人工追责中耗时。

Anthropic 发布 Model Context Protocol 后，行业更重视模型与工具、数据源之间的标准连接；OpenAI 的 Agents 文档也把工具作为 Agent 能力的重要组成部分，见 OpenAI Agents tools guide。这些趋势说明连接能力会持续增加。但对企业来说，工具数量不是护城河，可审核的 Skill 目录才是护栏。

目录先于自动化

很多团队第一次做 AI 数字员工时，会直接把浏览器、邮件、表格、CRM、文档库、数据库和网页搜索都交给同一个 Agent。短期看很强，长期看会制造三类问题：重复工具不知道用哪个；同一工具在不同任务里输入格式不同；高风险工具没有清楚的确认边界。

Axon 的表达方式更适合白领团队：System Skills 提供开箱即用的办公、文件、互联网和媒体能力；User Skills 把企业自己的业务动作封装成可复用能力；Agent 再把这些 Skills 编排成固定流程。不了解能力分层的团队，可以先读 System Skills 是什么和 System Skills 与通用 Agent 的分层。

Skill目录治理的核心立场：工具不应该直接堆给 Agent，工具必须先变成有边界、有字段、有权限、有验收记录的 Skill。

一个可运营的 Skill 目录长什么样

Skill 目录不是技术团队内部清单，而是运营、业务负责人和审核人都能读懂的能力资产表。它至少要包含能力用途、输入字段、输出产物、权限等级、失败处理和可复用场景。

{
  "skillId": "sales-brief-from-web-and-pdf",
  "owner": "sales-ops",
  "capabilityLayer": "user-skill",
  "allowedAgents": ["weekly-customer-brief-agent"],
  "inputContract": ["companyName", "sourceUrls", "pdfFiles", "recipientRole"],
  "permissionLevel": "confirm",
  "outputs": ["brief.md", "source-list.md", "email-draft.md"],
  "failurePolicy": "missing source or uncertain claim returns a review note",
  "reviewEvidence": ["runId", "artifactPath", "approvalDecision"]
}

这段配置的价值不在格式，而在约束。allowedAgents 防止任意 Agent 调错能力；inputContract 让 Source Data 字段先变成输入契约，可继续参考 Source Data 字段设计；permissionLevel 把高风险动作交给 Trust Mode；reviewEvidence 让一次运行能被复盘。

目录字段	运营用途	如果缺失会发生什么
owner	找到能力负责人	工具失败后没人修
inputContract	控制输入质量	Agent 把上下文写进大段提示词
permissionLevel	区分自动和确认	发送、覆盖、删除等动作越界
outputs	明确产物归属	文件留在聊天窗口无法验收
failurePolicy	处理不确定性	Agent 编造结果或静默失败

外部工具进入 Axon 前的晋升规则

一个外部工具不应因为“能接上”就立刻进入核心 Agent。更稳的做法是把能力分成观察、候选、受控、稳定四个状态。

观察：只允许人工试用，记录适合解决什么问题。
候选：允许在一次性任务中调用，但不能进入定时 Agent。
受控：已经有输入契约、权限等级和产物目录，可以进入少量 Agent。
稳定：经过多次运行，有失败样例、修复记录和验收标准，可以加入团队标准 Skill 目录。

这套晋升规则能减少“工具热度”对业务流程的干扰。MCP、插件、浏览器自动化和文件工具都可以存在，但只有被目录治理过的能力，才适合进入长期 AI 数字员工。

Axon 视角：目录治理连接 Trust Mode 和 workspace

Skill目录治理不能停在表格里。它要落到三个 Axon 对象上。

第一是 Trust Mode。低风险读取和整理可以自动执行；发送邮件、调用外部系统、覆盖文件、删除内容和发布动作必须确认或授权。相关边界可以继续读人工确认边界。

第二是 workspace。每次 Skill 运行都应把输入快照、产物文件、日志摘要和人工决策放进 workspace，而不是只留在聊天历史里。这样审核人可以看到“这次 Agent 为什么这么判断”。

第三是 Agent 控制台。目录治理给控制台提供能力元数据：哪个 Agent 调用了哪个 Skill，是否越权，失败是输入问题还是能力问题。对于已经开始运营多条流程的团队，这些字段会成为控制台的状态、风险和复盘来源。

三段式落地顺序

这篇文章不建议把目录治理做成复杂项目。先从一个部门和少量高频能力开始。

第一步：列出当前已经被 Agent 或人工助手反复调用的 5 个工具，标注 owner、输入字段和输出文件。
第二步：把其中 2 个低风险工具封装成 Skill 目录卡，明确 permissionLevel 和 failurePolicy。
第三步：选择 1 个 Agent 试运行，把 runId、artifactPath 和 approvalDecision 写入 workspace。

FAQ

Q1: Skill目录治理会不会拖慢 AI 数字员工上线？

会让第一条流程更慢一点，但会让第二条、第三条流程更快。因为输入字段、权限和失败处理已经沉淀下来，后续 Agent 不需要每次重新解释工具边界。

Q2: MCP 工具能不能直接给业务团队用？

可以试用，但不建议直接进入长期 Agent。业务团队真正需要的是被封装后的 Skill：有名称、有用途、有输入契约、有输出产物、有权限等级。

Q3: 哪些工具最适合先进入目录？

优先选择低风险、高频、产物可验收的工具，例如网页资料读取、PDF 解析、Markdown 生成、Excel 读取和邮件草稿生成。涉及发送、覆盖、删除、付款和外部发布的能力要进入确认或授权模式。

Q4: 如何判断目录治理做得足够好？

抽查一条 Agent 运行记录：如果你能看到它调用了哪些 Skills、输入来自哪里、输出文件在哪里、是否触发确认、失败后如何处理，就说明目录治理已经开始发挥作用。

交给审核人的下一步

如果你的团队正在尝试 MCP 或外部工具连接，不要先问“还能接什么”。先把 3 个高频办公动作写成 Skill 目录卡：输入字段、权限等级、产物路径和失败处理。再用 Axon 把其中一张卡组装进可验收的 AI 数字员工。现在就开始使用这张目录卡做一次小范围试跑，并继续阅读更多 Axon 的 Agent 运营文章。