Trust Mode 如何保护 AI 数字员工的邮件发送边界

Axon AI 2026-05-20 AI 数字员工 Agents 数字员工
#Trust Mode#邮件确认#Agent安全
Trust Mode 如何保护 AI 数字员工的邮件发送边界
摘要:本文围绕入门教程中的邮件确认卡,说明 Trust Mode 如何把低风险自动化和高风险人工确认分开。

Trust Mode 边界是 AI 数字员工从“可运行”走向“可托付”时必须明确的安全规则:低风险步骤可以减少人工打断,高风险动作必须在正确时机停下来确认。很多团队希望 AI 帮自己减少重复、手动、耗时、容易出错的工作,但真正阻止他们开启自动化的,往往不是能力不足,而是不知道 AI 会不会越权发送、删除、移动或发布。

Axon 入门教程把邮件发送放在第一条主线里,正是为了展示这个边界。教程中的 Agent 会先生成研究报告,再导出 PDF,最后通过 std-internet-email.send_email 发送邮件。关键点是:手动试跑时,邮件发送前会出现确认卡,用户检查收件人、主题、正文和附件后再确认。

如果你正在设计团队级自动化,可以把本文和人工确认边界如何定义 AI 数字员工责任范围一起看;如果关注定时执行阶段的治理,则应继续阅读定时 AI 数字员工的运营治理

Trust Mode 不是让 Agent 失控,而是让用户在明确边界后减少低风险步骤的摩擦。

为什么 Trust Mode 要单独讲

如果只宣传“自动运行”,用户很容易产生两个误解:

  1. AI 可以跳过所有人工确认。
  2. 只要能运行,就适合定时运行。

这两个理解都不符合 Axon 入门教程的设计。教程要求先关闭 Trust Mode 手动试跑,是为了让用户看见确认卡、检查 PDF、确认收件箱结果。只有这些都通过后,才讨论是否开启定时执行。

低风险步骤和高风险动作不同

在“公开研究报告分发”案例里,不同步骤的风险并不一样:

动作 风险等级 建议处理
根据公开主题生成研究 Markdown 低到中 可以自动执行,但要检查来源和质量
把 Markdown 导出为 PDF 可以自动执行,用户检查文件预览
保存文件卡片 可以自动执行
发送邮件 手动运行时需要确认卡
删除或移动资料 不放入第一课主线

这个表可以泛化到更多 Agent。只要动作会对外触达、修改重要资料或造成难以撤销的影响,就应该保留确认。

确认卡是可解释自动化的一部分

邮件确认卡不是“麻烦步骤”,而是可解释自动化的证据。它让用户看到:

  • Agent 准备发给谁。
  • 邮件主题是什么。
  • 正文大意是否正确。
  • 附件是否为刚生成的 PDF。
  • 用户是否愿意让这个动作继续。

没有这张卡,用户只能事后检查错误;有这张卡,用户能在影响发生前阻止错误。

Trust Mode 与定时执行的关系

Axon 客户端中,定时执行会以信任模式运行,因为定时触发时通常没有人在场点击确认。这意味着用户在开启定时前必须完成更严格的手动验收。

入门教程给出的顺序是:

  1. 构建 Agent。
  2. 保持 Trust Mode 关闭。
  3. 手动运行一次。
  4. 检查 Research、PDF、Email 三步结果。
  5. 确认邮件发送卡。
  6. 检查收件箱。
  7. 全部通过后,再考虑定时执行。

这就是 Trust Mode 边界的核心:自动化不是从信任开始,而是从验收后建立信任。

什么时候可以开启 Trust Mode

可以考虑开启的情况:

  • 输入字段稳定。
  • 收件人固定或来自已验收清单。
  • 邮件主题和附件格式已经多次检查。
  • PDF 文件可预览且内容可靠。
  • Agent 没有删除、移动、发布等高风险步骤。

不建议开启的情况:

  • 第一次试跑尚未完成。
  • 收件人每次都变化,且没有二次确认。
  • 研究内容需要强编辑判断。
  • 附件可能包含未授权文件或敏感资料。
  • 用户还没有检查过收件箱结果。

如何在文章和教程中讲清边界

面向用户时,不要把 Trust Mode 写成“把所有风险交给自动化”。更准确的表达是:

Trust Mode 适合已经人工跑通、输入稳定、风险可控的流程。
外部发送、删除、移动、发布等动作,应在手动试跑阶段通过确认卡验证。
定时执行前,必须确认收件人、附件、正文和触发频率。

这段话可以适用于邮件、日历、文件、内容发布等多个场景。它不会夸大自动化,也不会把用户吓退,而是给出可执行判断标准。

一套可复用的风险分层清单

Step 1:列出所有动作

先把 Agent 每一步写出来。例如:

  1. 研究公开主题。
  2. 生成 Markdown。
  3. 导出 PDF。
  4. 发送邮件。

Step 2:标记影响范围

每一步回答三个问题:

  • 是否会触达外部人员?
  • 是否会修改或删除资料?
  • 是否会造成品牌、客户或合规影响?

只要任一问题为“是”,第一版就应保留人工确认步骤。

Step 3:设计验收证据

入门教程里的验收证据包括研究结果、PDF 文件卡片、邮件确认卡、发送结果和收件箱证明。其他 Agent 也应该设计类似证据,而不是只显示“完成”。

Step 4:再决定是否定时

定时任务只解决触发,不解决质量。如果手动验收无法通过,定时只会把问题重复放大。

常见错误

把 Trust Mode 当成跳过验收的开关

Trust Mode 不应该用来绕过不确定性。它适合已经验证的稳定流程,不适合第一次试跑。

忽略外部动作

生成文件和发送邮件不是同一类风险。文件可以先检查,邮件一旦发出就影响外部收件人。

在未验收收件人的情况下开启定时

如果收件人、主题或附件格式尚未验证,不应启用定时发送。先手动运行,再检查收件箱。

FAQ

Q1:Trust Mode 是否会跳过邮件确认点击?

当某次运行开启 Trust Mode 时,确认类动作可能不再等待人工点击;定时执行也会以信任模式运行。因此,邮件类 Agent 必须在手动阶段先完成确认卡和收件箱检查。

Q2:不打开 Trust Mode 是否就不能自动化?

不是。你可以先手动运行并保存 Agent。Trust Mode 只影响确认类动作是否等待人工点击,不影响你构建和测试工作流。

Q3:哪些动作最需要保留确认?

发送邮件、回复邮件、删除邮件、删除日历、发布内容、删除或移动重要文件,都应该在第一版流程里保留确认或明确排除。

下一步

开始使用 Axon 时,建议先按入门教程完成邮件确认卡的手动试跑。确认 Trust Mode 边界后,再回到Research、PDF、Email 工作流检查整条链路,把同样方法应用到会议、报告、日历和文件类 Agent 中。