如何用 AI 助手和 AI 构建组装第一个 Agent

AI 构建 Agent 是把一个具体业务目标整理成角色、任务、执行指令、Skills 链路和源头数据的过程。对很多白领用户来说,真正耗时、重复、手动、容易出错的不是“问 AI 一个问题”,而是每次都要重新解释工作背景、复制材料、检查文件、确认邮件。Axon 入门教程用“公开研究报告分发”展示了一条更稳的路径:先用 AI 助手确认业务目标,再用 AI 构建填充 Agent 表单,最后手动运行一次。
这篇文章不只复述教程,而是把这套方法泛化成适合更多场景的构建框架。无论你要做研究报告、会议准备、邮件附件整理,还是日报草稿,第一步都不是让模型自由发挥,而是把目标转换成可以保存、可以检查、可以运行的 Agent。
构建之前,建议先理解System Skills 是什么,因为 Agent 的稳定性来自可执行能力、源头数据和权限边界的组合。后续如果要把输入字段设计得更可复用,可以继续看Source Data 字段如何让 Agent 可复用。
好的 Agent 构建不是写一段很长的提示词,而是把目标、步骤、输入、输出和风险边界拆清楚。
从业务目标开始,而不是从功能列表开始
很多人第一次使用 AI 自动化工具,会先问“有哪些功能”。这当然重要,但不适合直接作为构建入口。更好的起点是一个明确任务:
- 我要完成什么工作?
- 每次运行需要什么输入?
- 中间要生成什么产物?
- 哪些动作必须人工确认?
- 成功结果如何检查?
入门教程里的任务是:根据公开研究主题生成 Markdown 报告,导出 PDF,再发送到指定邮箱。这个任务非常适合 AI 构建 Agent,因为它有明确的输入、步骤、文件产物和外部发送边界。
AI 助手负责确认目标
在教程里,用户先进入 智能构建,停留在 AI 助手页签。这里的目标不是马上填表,而是确认业务目标和能力组合。用户可以输入:
我想自动生成公开研究报告,导出 PDF,并发送到指定邮箱,应该如何构建 Agent?
AI 助手会帮助用户把自然语言目标整理成更清晰的构建指令。这个环节适合回答三类问题:
- 这个目标需要哪些 System Skills?
- 每个步骤的输入和输出是什么?
- 哪些步骤有风险,需要确认或 Trust Mode 边界?
如果跳过这一步,用户往往会把目标写成“帮我自动处理整份报告”,但没有说明研究主题、文件名、收件人、输出语言和确认策略。
AI 构建负责填表
确认目标后,再切到 AI 构建页签。AI 构建的任务是把构建指令提取成结构化表单,包括角色、简介、任务、执行指令、Skills、源头数据和运行策略。
入门教程里推荐的中文角色名是“公开研究报告分发”,而不是“报告生成助手”。这个细节很重要。Agent 角色名要像业务能力,而不是泛泛的聊天身份。好的命名能让团队成员一眼知道它负责什么。
Agent 表单应该检查什么
检查角色和任务是否具体
一个可运行 Agent 至少要回答四个问题:
| 字段 | 检查重点 |
|---|---|
| 角色 | 是否像一个业务能力,例如“公开研究报告分发”。 |
| 简介 | 是否说明产物和交付方式。 |
| 任务 | 是否描述每次运行要完成什么。 |
| 执行指令 | 是否写清不编造来源、不越权、不跳过确认。 |
AI 构建 Agent 的结果不能只看是否“填上了”。你需要检查它是否能支撑后续执行。如果任务描述含糊,Agent 运行时就容易把研究、排版、发送混成一团。
检查 Skills 链路是否短而稳
入门教程第一版只使用三步:
std-internet-research.deep-research-flashstd-office-pdf.generatestd-internet-email.send_email
这条链路短,但很完整。它先生成内容,再生成文件,最后处理外部发送。对于第一次 AI 构建 Agent,不建议加入过多步骤。越多步骤意味着越多参数、越多失败点、越难定位问题。
检查源头数据是否可复用
教程里的源头数据是:
agent_goal: 本次要完成的业务结果
source_material: 运行时需要读取的资料或链接
output_artifact: 希望生成的文件或草稿类型
reviewer: 首次试跑的验收人
risk_boundary: 需要暂停确认的动作
first_run_mode: manual_review
这些字段能覆盖一次构建的核心变量。它们也让用户后续可以在执行页表单里更换目标、资料、产物和验收人,而不必重建 Agent。
一套可复用的构建步骤
Step 1:写出业务目标
不要从“我要一个智能助手”开始。直接写业务结果:
我想把一个公开研究主题变成 PDF 报告,并发送给指定收件人。
这类目标包含对象、产物和交付方式,更容易被 AI 助手转成构建指令。
Step 2:列出步骤
把目标拆成 3 到 5 个可执行动作:
- 根据主题做公开研究。
- 输出 Markdown。
- 把 Markdown 渲染成 PDF。
- 发送邮件前显示确认卡。
- 保存或展示执行结果。
这一步决定 Agent 是否像工作流,而不是像聊天。
Step 3:标记风险边界
对外发送、删除、移动、发布和修改重要资料都应被视为高风险动作。入门教程把邮件发送放在确认卡之后,就是为了让用户看到边界。
Step 4:交给 AI 构建填表
当目标、步骤和风险边界明确后,再让 AI 构建填表。此时 AI 构建 Agent 的结果通常更稳定,因为输入不是一句模糊愿望,而是一份可结构化的任务说明。
手动试跑是构建的一部分
构建完成后,不要马上开启定时。先进入执行页手动运行一次,至少检查:
- Research 是否生成了围绕主题的 Markdown。
- PDF 文件卡片是否出现,内置预览是否可读。
- 邮件发送前是否出现确认卡。
- 收件箱是否收到正确附件。
- Agent 是否没有读取私人文件、删除数据或发送给未验收对象。
如果这些检查没有通过,说明 Agent 仍处于构建阶段。保存表单不是完成,手动验收才是完成。
常见错误
把 AI 助手当成最终构建器
AI 助手适合确认目标和生成构建指令,不等于已经保存 Agent。真正的结构化配置需要进入 AI 构建页签并填充表单。
角色名太泛
“研究助手”“邮件机器人”这类名称无法说明业务边界。更好的命名是“公开研究报告分发”“会议资料准备”“日报编排”等业务能力名称。
没有源头数据
如果不设计输入字段,Agent 每次运行都要靠用户重新解释,无法稳定复用。源头数据是 Agent 从一次性提示词变成可重复流程的关键。
FAQ
Q1:AI 构建 Agent 是否意味着完全不用检查?
不是。AI 构建负责填表和结构化,用户仍然要检查角色、步骤、源头数据和确认边界。
Q2:第一次 Agent 应该有多少步骤?
建议 3 到 5 步。入门教程使用 Research、PDF、Email 三步,足够展示完整链路,也便于定位问题。
Q3:什么时候可以开启定时执行?
只有手动试跑通过后才适合开启。涉及邮件发送时,还要确认收件人、主题、附件和正文都稳定。
下一步
如果你准备开始使用 Axon,可以先按照入门教程完成第一个公开研究报告分发 Agent。完成后,继续阅读Research、PDF、Email 工作流拆解和Trust Mode 邮件确认边界,再把这套 AI 构建 Agent 方法迁移到会议准备、日报编排、文件整理或其他白领工作流中。