External Agent Trust Boundary:让 Codex 这类外部 Agent 进工作流前先过信任边界

Axon AI 2026-06-01 AI 数字员工 Agents 数字员工
#外部Agent#Trust Mode#Codex#工作流治理
External Agent Trust Boundary:让 Codex 这类外部 Agent 进工作流前先过信任边界
摘要:本文定义 External Agent Trust Boundary:外部 Agent 进入 Axon 工作流前,需要先明确授权、workspace、产物审核、工具权限和不可逆动作确认。

External Agent Trust Boundary 是外部 Agent 进入业务工作流前必须经过的信任边界:它规定谁授权、能访问哪个 workspace、能调用哪些工具、产物如何审核、哪些动作必须人工确认,以及失败后如何停止或回退。团队每天把文件、脚本、API 和发布后台交给 Agent 时,真正的痛点不是能力不够,而是人工追责困难、重复检查低效、误发误删风险高。Codex、Claude、Manus 或其他外部 Agent 越强,这个边界越重要。没有边界的外部 Agent 不是数字员工,而是一个权限过宽的黑盒。

OpenAI Developers 的 Codex use cases 覆盖 workflow、automation、engineering 和 knowledge work;OpenAI code generation guide 涉及 CI/CD pipelines with SDK 和不同使用入口;NIST 的 AI Risk Management Framework 则把治理、映射、测量和管理作为 AI 风险管理的重要结构。Axon 的 External Agent Trust Boundary 就是把这些风险语言翻译成白领能执行的 workflow 控制。

外部 Agent 的能力越像员工,它越需要入职规则、权限范围、工作记录和交付验收,而不是更长的 prompt。

信任边界先于自动化

很多团队在接入外部 Agent 时先问“它能做什么”。更好的问题是“它不应该做什么”。这听起来像限制能力,实际上是在保护可持续自动化。一个 Agent 如果能读所有文件、改所有脚本、访问所有工具、自动发布结果,那么它的每次成功都带着隐藏风险。

边界 应该提前定义什么 不能靠什么临时补救
身份 谁授权外部 Agent、授权多久 运行后再追问是谁批准
workspace 能读写哪些目录和文件类型 让 Agent 自己判断敏感文件
工具 shell、network、browser、API 的权限 出错后再删日志
产物 输出路径、格式、验收人 只看最终自然语言总结
不可逆动作 发布、删除、覆盖、发信、更新记录 默认自动执行

Axon 的 Trust Mode 应该把这些问题前置。外部 Agent 不是不能用,而是必须先进入可解释、可撤销、可确认的运行轨道。

权限梯子

externalAgentTrustBoundary:
  identity:
    actor: "authorized Codex external agent"
    owner: "workflow owner"
  workspace:
    read:
      - "./approved-source"
    write:
      - "./draft-artifacts"
  tools:
    shell: "confirm"
    network: "confirm"
    backendSubmit: "auth"
  artifacts:
    reviewRequired:
      - "article markdown"
      - "cover webp"
      - "dry-run output"
  stopRules:
    - "missing product evidence"
    - "attempt to publish before approval"
    - "workspace path outside allowed scope"

这不是技术团队自嗨的配置文件,而是业务 owner 能读懂的权限梯子:自动做什么、确认做什么、授权做什么、触发什么就停。

四个最容易被忽略的风险

第一,外部 Agent 看到太多。
为了“帮得上忙”,团队常把更多文件塞给 Agent。结果是上下文变厚,权限变宽,隐私和误引用风险上升。Axon 应该用 workspace-scoped workflows 把输入范围写清楚。

第二,外部 Agent 改得太快。
Codex 擅长批量修改文件,但业务文件、发布脚本和配置文件不应该同一权限处理。能改草稿,不等于能改线上配置。

第三,外部 Agent 解释得太顺。
自然语言总结可能很流畅,但缺少证据。信任边界要求每个关键动作都有产物路径、日志或 span,而不是“我检查过了”。

第四,外部 Agent 发布得太早。
最危险的不是生成错误草稿,而是把错误草稿直接推到用户面前。发布、发送、删除、覆盖、调用运营后台都应该进入 auth 或 confirm。

用状态机管理外部 Agent

External Agent Trust Boundary 最好不要只写在政策文档里。它应该进入 Workflow State Machine:draft、dry-run、waiting-confirmation、running、exception、accepted、archived。外部 Agent 的每个动作都应该让状态前进或停下。

步骤 1:进入 running 前,验证授权、workspace 和 Source Data。步骤 2:进入 waiting-confirmation 前,展示产物和 dry-run 结果。步骤 3:进入 accepted 前,确认 owner 明确批准。这个三段式比“Agent 运行完成”更适合企业流程。

事件样例

{
  "event": "external_agent_publish_blocked",
  "agent": "Codex",
  "reason": "human approval missing",
  "currentState": "waiting-confirmation",
  "artifact": "dry-run-report.txt",
  "nextAllowedAction": "request_owner_review"
}

这样的事件能被 Workflow Telemetry Spans 使用,也能帮助团队复盘:不是 Agent 没完成,而是它正确地停在了信任边界。

常见问题

Q1:信任边界会不会拖慢外部 Agent?
会增加少量前置配置,但会减少误改、误发和无法解释的返工。对企业流程来说,速度必须服从可控性。

Q2:哪些动作一定要人工确认?
发布、删除、覆盖、发信、调用生产 API、更新客户或财务记录、改变权限配置,都应该进入 confirm 或 auth。

Q3:外部 Agent 失败时应该自动重试吗?
只有低风险、幂等、范围清楚的步骤可以自动重试。涉及权限、事实不确定或产物质量不足时,应进入 fallback 或人工 review。

先画边界,再谈自动化

如果你准备把 Codex 或其他外部 Agent 接入 Axon,不要先写最长的 prompt。先写 External Agent Trust Boundary:身份、workspace、工具、产物、stop rules 和审批动作。再结合 Trust Mode、workspace boundary、state machine 和 source lineage,了解更多外部 Agent 治理方式,并开始使用 Axon 把外部 Agent 放进一条可控 workflow。这样做不会削弱 Agent,反而会让它更像一个可以被团队长期使用的 AI 数字员工。