External Agent Trust Boundary：让 Codex 这类外部 Agent 进工作流前先过信任边界

Axon AI 2026-06-01 AI 数字员工 Agents 数字员工

#外部Agent#Trust Mode#Codex#工作流治理

External Agent Trust Boundary：让 Codex 这类外部 Agent 进工作流前先过信任边界

摘要：本文定义 External Agent Trust Boundary：外部 Agent 进入 Axon 工作流前，需要先明确授权、workspace、产物审核、工具权限和不可逆动作确认。

External Agent Trust Boundary 是外部 Agent 进入业务工作流前必须经过的信任边界：它规定谁授权、能访问哪个 workspace、能调用哪些工具、产物如何审核、哪些动作必须人工确认，以及失败后如何停止或回退。团队每天把文件、脚本、API 和发布后台交给 Agent 时，真正的痛点不是能力不够，而是人工追责困难、重复检查低效、误发误删风险高。Codex、Claude、Manus 或其他外部 Agent 越强，这个边界越重要。没有边界的外部 Agent 不是数字员工，而是一个权限过宽的黑盒。

OpenAI Developers 的 Codex use cases 覆盖 workflow、automation、engineering 和 knowledge work；OpenAI code generation guide 涉及 CI/CD pipelines with SDK 和不同使用入口；NIST 的 AI Risk Management Framework 则把治理、映射、测量和管理作为 AI 风险管理的重要结构。Axon 的 External Agent Trust Boundary 就是把这些风险语言翻译成白领能执行的 workflow 控制。

外部 Agent 的能力越像员工，它越需要入职规则、权限范围、工作记录和交付验收，而不是更长的 prompt。

信任边界先于自动化

很多团队在接入外部 Agent 时先问“它能做什么”。更好的问题是“它不应该做什么”。这听起来像限制能力，实际上是在保护可持续自动化。一个 Agent 如果能读所有文件、改所有脚本、访问所有工具、自动发布结果，那么它的每次成功都带着隐藏风险。

边界	应该提前定义什么	不能靠什么临时补救
身份	谁授权外部 Agent、授权多久	运行后再追问是谁批准
workspace	能读写哪些目录和文件类型	让 Agent 自己判断敏感文件
工具	shell、network、browser、API 的权限	出错后再删日志
产物	输出路径、格式、验收人	只看最终自然语言总结
不可逆动作	发布、删除、覆盖、发信、更新记录	默认自动执行

Axon 的 Trust Mode 应该把这些问题前置。外部 Agent 不是不能用，而是必须先进入可解释、可撤销、可确认的运行轨道。

权限梯子

externalAgentTrustBoundary:
  identity:
    actor: "authorized Codex external agent"
    owner: "workflow owner"
  workspace:
    read:
      - "./approved-source"
    write:
      - "./draft-artifacts"
  tools:
    shell: "confirm"
    network: "confirm"
    backendSubmit: "auth"
  artifacts:
    reviewRequired:
      - "article markdown"
      - "cover webp"
      - "dry-run output"
  stopRules:
    - "missing product evidence"
    - "attempt to publish before approval"
    - "workspace path outside allowed scope"

这不是技术团队自嗨的配置文件，而是业务 owner 能读懂的权限梯子：自动做什么、确认做什么、授权做什么、触发什么就停。

四个最容易被忽略的风险

第一，外部 Agent 看到太多。
为了“帮得上忙”，团队常把更多文件塞给 Agent。结果是上下文变厚，权限变宽，隐私和误引用风险上升。Axon 应该用 workspace-scoped workflows 把输入范围写清楚。

第二，外部 Agent 改得太快。
Codex 擅长批量修改文件，但业务文件、发布脚本和配置文件不应该同一权限处理。能改草稿，不等于能改线上配置。

第三，外部 Agent 解释得太顺。
自然语言总结可能很流畅，但缺少证据。信任边界要求每个关键动作都有产物路径、日志或 span，而不是“我检查过了”。

第四，外部 Agent 发布得太早。
最危险的不是生成错误草稿，而是把错误草稿直接推到用户面前。发布、发送、删除、覆盖、调用运营后台都应该进入 auth 或 confirm。

用状态机管理外部 Agent

External Agent Trust Boundary 最好不要只写在政策文档里。它应该进入 Workflow State Machine：draft、dry-run、waiting-confirmation、running、exception、accepted、archived。外部 Agent 的每个动作都应该让状态前进或停下。

步骤 1：进入 running 前，验证授权、workspace 和 Source Data。步骤 2：进入 waiting-confirmation 前，展示产物和 dry-run 结果。步骤 3：进入 accepted 前，确认 owner 明确批准。这个三段式比“Agent 运行完成”更适合企业流程。

事件样例

{
  "event": "external_agent_publish_blocked",
  "agent": "Codex",
  "reason": "human approval missing",
  "currentState": "waiting-confirmation",
  "artifact": "dry-run-report.txt",
  "nextAllowedAction": "request_owner_review"
}

这样的事件能被 Workflow Telemetry Spans 使用，也能帮助团队复盘：不是 Agent 没完成，而是它正确地停在了信任边界。

常见问题

Q1：信任边界会不会拖慢外部 Agent？
会增加少量前置配置，但会减少误改、误发和无法解释的返工。对企业流程来说，速度必须服从可控性。

Q2：哪些动作一定要人工确认？
发布、删除、覆盖、发信、调用生产 API、更新客户或财务记录、改变权限配置，都应该进入 confirm 或 auth。

Q3：外部 Agent 失败时应该自动重试吗？
只有低风险、幂等、范围清楚的步骤可以自动重试。涉及权限、事实不确定或产物质量不足时，应进入 fallback 或人工 review。

先画边界，再谈自动化

如果你准备把 Codex 或其他外部 Agent 接入 Axon，不要先写最长的 prompt。先写 External Agent Trust Boundary：身份、workspace、工具、产物、stop rules 和审批动作。再结合 Trust Mode、workspace boundary、state machine 和 source lineage，了解更多外部 Agent 治理方式，并开始使用 Axon 把外部 Agent 放进一条可控 workflow。这样做不会削弱 Agent，反而会让它更像一个可以被团队长期使用的 AI 数字员工。