AI Agent 成本治理:把模型路由写成运营政策

AI Agent成本治理 是指企业为 AI 数字员工制定模型选择、Token 预算、调用频率、例外审批和产物验收规则,让自动化流程在质量、风险和费用之间保持可控。很多团队每天手动追账单、重复调整提示词,月底才发现 Token 浪费和返工成本。它不是“统一换成便宜模型”,也不是“让员工少问几次”。真正的问题是:哪个任务必须用强模型,哪个任务可以用轻量模型,哪个动作失败后要停止,哪类输出必须有人验收。
公开模型厂商都提供按模型、输入、输出和能力类型区分的价格信息,例如 OpenAI API pricing 和 Anthropic pricing。价格表本身不会替企业省钱,只有当模型选择被写入 Agent 运行政策,成本才会从“月底账单惊讶”变成“日常运营指标”。
给 CFO 和运营负责人的一页备忘录
如果 AI 数字员工开始处理投研摘要、销售简报、邮件草稿、合同整理和周报生成,成本治理就不能只交给技术同学。业务负责人需要一页能读懂的政策备忘录。
备忘录观点:AI Agent成本治理 的目标不是压低每次调用价格,而是让每次模型调用都有任务价值、风险边界和验收证据。
备忘录应写清三件事。第一,什么任务值得自动化;第二,什么任务允许后台运行;第三,什么任务触发人工确认或更高模型。对 Axon 来说,模型路由要跟 Skills、Agent、Trust Mode 和 workspace 绑定,而不是藏在聊天窗口里。
当模型路由进入日常运营后,负责人要能在 AI Agent 控制台 看到每次运行的成本、产物和风险边界;如果任务开始定时执行,还要把预算、暂停和升级规则纳入 定时 AI 数字员工治理。一旦出现反复返工或异常调用,团队需要用 AI Agent 可靠性复盘 判断问题来自输入字段、Skill 能力还是路由政策。
成本台账不只记录金额
很多团队的台账只记录模型调用次数和费用,这不够。AI 数字员工的成本台账应该能解释“为什么值得花这笔钱”。下面是一个更适合运营团队的字段模型。
| 台账字段 | 成本含义 | 运营判断 |
|---|---|---|
| runPurpose | 本次运行的业务目标 | 没有目标则不应运行 |
| skillClass | 调用的 Skill 类型 | 读取、生成、发送、发布成本不同 |
| modelTier | 模型档位 | 强模型用于高不确定或高价值环节 |
| riskGate | Trust Mode 等级 | 高风险动作不能靠省钱跳过确认 |
| artifactAccepted | 产物是否通过验收 | 未验收输出不应算成功节省 |
| rerunReason | 重跑原因 | 判断成本浪费来自输入、模型还是流程 |
这张表的关键是把成本和产物绑定。若一个 Agent 生成了客户简报,但来源不清、文件丢失或邮件需要重写,账面调用再便宜也不是好成本。
路由政策:按任务价值分配模型
一个实用的模型路由政策,可以把任务拆成四类。
- 低风险整理:摘要、格式转换、表格读取、文件命名。优先使用成本可控的模型和 System Skills。
- 中等判断:竞品对比、邮件草稿、报告提纲、异常解释。允许使用更强模型,但必须保存来源和草稿。
- 高价值交付:投研结论、客户策略、法务风险提示、管理层报告。需要更强模型、人工验收和完整 workspace 证据。
- 外部影响动作:发送、发布、覆盖、删除、调用外部系统。模型档位不是核心,Trust Mode 和审批才是核心。
在 Axon 中,这些政策可以落到 Agent step 上:每个步骤都有 Skill、输入来源、风险描述和验收要求。模型服务厂商路由应该写成受控选择,而不是“自动全网最优”。没有基准数据时,不写固定降本比例。
routing_policy:
default_tier: controlled
escalation:
- if: "missing_source or conflicting_evidence"
action: "pause_and_request_review"
- if: "external_send or publish"
action: "trust_mode_confirm"
evidence_required:
- "source-list.md"
- "artifact-path"
- "review-decision"
例外审批比统一限额更重要
统一限额很容易误伤好任务。比如月末财务分析、重点客户方案和紧急风险排查,可能确实需要更高成本的模型调用。更好的机制是例外审批:超过预算不一定拒绝,但必须说明业务目标、输入完整度、预期产物和复盘方式。
这也是 Axon 与泛化聊天工具的区别。聊天工具通常只呈现一次对话;Axon 应该把例外原因写回运行记录。下一次同类任务再出现时,团队能判断是继续授权、改成 User Skill,还是把任务拆成更稳定的 System Skill 链路。
落地校准动作
- 步骤 1:选一条已经重复运行的 Agent,列出最近 10 次运行的模型档位、产物路径和验收结果。
- 步骤 2:把失败或重跑原因分成输入缺失、证据不足、模型不适合、Skill 设计不稳四类。
- 步骤 3:为每类原因写出路由动作,例如暂停、降级、升级、进入 Trust Mode 或改成 User Skill。
FAQ
Q1: AI Agent成本治理 是否等于永远选择便宜模型?
不是。低价值、低风险、可批量复核的任务适合更低成本路径;高不确定、高影响、面向客户或管理层的产物,需要更高质量模型和人工验收。
Q2: 定时 Agent 为什么更需要成本治理?
定时任务会持续运行,如果输入质量差或流程设计错,浪费会被自动放大。定时 Agent 必须有跳过、暂停、重试和升级规则。
Q3: 成本台账应该给谁看?
至少给业务负责人、运营负责人和流程拥有者看。技术团队看调用明细,业务团队看产物是否被接受,财务或管理者看预算趋势和例外原因。
Q4: Axon 如何避免把成本治理写成口号?
把成本字段放进 Agent 运行记录:runId、Skill、模型档位、产物路径、Trust Mode 决策和验收结果。能复盘,才是真治理。
给团队的行动建议
本周不要先讨论“哪个模型最便宜”。先选一个正在重复运行的 AI 数字员工,补上成本台账字段和路由例外规则。等它跑过几次后,再决定哪些步骤需要强模型,哪些步骤应该下沉成稳定 Skill。现在开始使用这张成本政策做一次小范围试跑,并继续阅读更多 Axon 控制台和定时治理内容。