本文介绍如何使用腾讯元器平台搭建一个面向企业场景的合同发票智能体。通过知识库增强专业问答能力,通过工作流实现合同条款的自动分析与优化建议生成。实测表明,该智能体能识别出合同中多个预留问题,包括多个人工审核容易遗漏的隐晦风险点。
企业日常运营中,合同审核和发票处理是两个高频且耗时的场景。

常见问题:

常见问题:

基于以上痛点,我搭建了「合同发票一把抓」智能体,核心能力包括:

组件 | 作用 | 技术实现 |
|---|---|---|
提示词 | 定义智能体角色、能力边界、输出风格 | Prompt Engineering |
知识库 | 存储合同/发票专业知识,增强问答准确性 | RAG检索增强 |
工作流 | 处理多步骤任务(问题识别→条款优化→报告生成) | 多节点编排 |
登录腾讯元器平台,第一感觉是界面很清爽,没有那种企业级产品常见的"功能堆砌感"。点击「新建智能体」,弹出的配置面板也很直观,左边填信息,右边实时预览效果。
配置基本信息:
名称和简介会直接展示给用户,所以我尽量写得直白一点,让人一眼就知道这个智能体能干什么。

提示词结构分为三部分:
角色定义:
你是一个专业的企业合同与发票顾问,既能处理文件,也能解答相关问题。能力边界:
## 合同相关
1. 文件处理:提取关键信息(双方、金额、期限、付款方式),识别风险条款
2. 知识问答:解释条款含义、提供审核要点、解答常见问题
## 发票相关
1. 文件处理:识别发票全部信息,结构化输出
2. 知识问答:发票类型区别、开票认证流程、报销规范风格要求:
- 说人话,不打官腔
- 重点突出,发现问题直接说
- 不确定的不要编,重要合同提醒找专业法务欢迎语:
来了!合同发票的事儿找我就对了。
📄 合同:可以帮你分析条款、找风险,也能解答签约中的各种疑问
🧾 发票:可以识别提取信息,也能聊聊开票报销那些事儿
有文件直接传,有问题直接问,不用客气。
这里要夸一下腾讯元器的编辑体验:左侧改提示词,右侧立刻能看到效果预览,包括欢迎语、示例问题的展示样式。不用保存、不用刷新,所见即所得,调试效率很高。
知识库是这个智能体的"专业底座"。没有知识库的话,模型只能靠通用知识回答,遇到具体的政策法规问题,容易给出模糊甚至过时的答案。
腾讯元器的知识库功能做得很友好,整个流程就三步:建库→上传→关联,不需要写代码,也不需要懂向量数据库那些概念。
我准备了两份Markdown文档:
合同篇(约4500字):
发票篇(约6300字):
先创建一个知识库,点击「新建知识库」,填个名称和描述就行:

然后导入文档。支持的格式很全,PDF、Word、Markdown、Excel都可以,单个文件最大200MB,对于知识文档来说完全够用了。直接把两份Markdown拖进去:

上传后系统会自动解析文档,把内容切分成适合检索的片段。这个过程不需要人工干预,等状态变成"解析完成"就行:

最后一步,在智能体设置里关联这个知识库。关联之后,用户提问时,系统会先从知识库里检索相关内容,再结合模型能力生成回答。

测试一下效果。问"电子合同有法律效力吗",智能体的回答是:"根据《电子签名法》,可靠的电子签名与手写签名具有同等法律效力。建议使用正规电子签约平台。"
注意看右侧的调试面板,显示了"参考来源:知识库-合同篇",说明这个回答确实是基于知识库内容生成的,而不是模型自己编的。这个溯源功能挺实用,能让用户知道答案从哪来。
这是整个项目最有意思的部分。
对于"优化合同条款"这类任务,单靠提示词很难稳定实现。因为它需要多个步骤:先找出所有问题,再针对每个问题给建议,最后整合成报告。用提示词的话,模型有时候会漏步骤,有时候格式乱,不够可控。
腾讯元器的工作流功能正好解决这个问题。它提供了一个可视化的流程编排界面,可以把复杂任务拆成多个节点,每个节点专注做一件事,节点之间通过参数传递数据。
工作流的整体设计:

新建工作流时,有两个关键配置:名称和触发条件。
名称要用"动词+名词"的格式,比如"优化合同条款",这样模型更容易理解什么时候该调用这个工作流。
触发条件更重要,要写清楚什么情况触发、什么情况不触发:
#场景描述:当用户上传合同并明确要求优化、修改、改进条款时触发此流程。
只分析不优化的(如"看看有没有问题")、知识问答类(如"违约金怎么约定")不触发此流程
#常见问法:帮我优化这份合同、把风险条款改掉、不合理的地方帮我修正
工作流编辑器是拖拽式的,左边是节点库,右边是画布,把节点拖进来、连线、配置参数就行。对于不会写代码的人来说,这个交互方式很友好。
配置完成后,可以在编辑器里直接调试。点击「调试」按钮,输入测试数据,就能看到每个节点的执行结果。这个功能太实用了,不用发布就能验证逻辑对不对。

调试面板会显示每个节点的输入、输出、耗时、token消耗,排查问题很方便。
搭建完成后,我用几个实际场景来测试效果。
先测试最基础的发票识别能力。上传一张滴滴电子发票PDF,输入"帮我提取发票信息":

识别结果很详细:
输出是结构化的,可以直接复制到Excel或者财务系统里。这个识别速度也很快,基本上传完就出结果了。
接下来测试合同分析能力。为了验证智能体的风险识别能力,我专门准备了一份"有问题"的软件开发合同,里面预埋了17个坑。
这些问题分两类:
明显问题(3个)——大多数人能发现:
隐晦问题(14个)——人工审核容易漏:
上传这份合同,让智能体分析:

智能体先把合同的基本信息提取出来了:合同编号、双方信息、项目内容、金额、付款方式等。然后开始分析风险点:

请求"优化这份合同的条款",触发工作流。
输出的优化建议示例:
原条款 | 问题 | 优化建议 |
|---|---|---|
逾期付款每日1%违约金 | 年化365%,过高 | 改为每日万分之五,累计不超过合同总额10% |
甲方终止赔30%+不退款,乙方终止只退预付款 | 严重不对等 | 双方违约责任应对等设置 |
管辖地在乙方所在地 | 对甲方不利 | 改为甲方所在地或被告所在地 |
"3个月左右" | 工期无约束 | 改为"3个月,如需延期应书面协商" |
增补费用由乙方确定 | 甲方无议价权 | 改为"增补费用由双方协商确定" |
测试结果:能识别出多个问题。
所有功能测试通过后,就可以发布了。
腾讯元器的发布流程也很简单,点击「应用发布」,填写发布说明,选择发布渠道就行。支持的渠道很多:官方小程序、微信公众号、微信客服、企业微信应用等,基本覆盖了腾讯生态的主要触点。

发布成功后,会生成一个体验链接和小程序码。可以直接分享链接,也可以让用户扫码访问:

从新建智能体到发布上线,整个过程大概花了两天时间,主要时间花在准备知识库文档和调试工作流上。腾讯元器本身的操作门槛不高,不需要写代码,拖拖拽拽就能完成大部分配置。
对比项 | 无知识库 | 有知识库 |
|---|---|---|
回答来源 | 模型通用知识 | 优先检索知识库 |
专业性 | 一般 | 更准确、有依据 |
时效性 | 可能过时 | 可随时更新文档 |
可追溯 | 无 | 显示参考来源 |
知识库适合存放:专业术语解释、政策法规、操作流程、FAQ等结构化知识。
对比项 | 纯提示词 | 工作流 |
|---|---|---|
多步骤任务 | 不稳定,容易漏步骤 | 每个节点专注一件事,稳定 |
调试 | 黑盒,难以定位问题 | 可查看每个节点的输入输出 |
复用 | 需要重复写提示词 | 节点可复用 |
工作流适合:需要多步骤处理、有逻辑依赖、对输出格式有要求的任务。
提示词不是越长越好,核心是让模型理解任务边界。
这次用腾讯元器搭建智能体,整体体验比预期的要顺畅。几个印象比较深的点:
总的来说,如果你有类似的企业场景需求,腾讯元器是一个值得尝试的平台。
点击即可体验: 合同发票一把抓

欢迎体验,有问题可以交流。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。