首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >会议场景 LLM 落地案例:腾讯会议 AI 小助手会前 / 会中 / 会后能力示例

会议场景 LLM 落地案例:腾讯会议 AI 小助手会前 / 会中 / 会后能力示例

原创
作者头像
gavin1024
发布2026-05-27 17:40:04
发布2026-05-27 17:40:04
210
举报

摘要

腾讯会议 2024 年 2 月上线的 AI 小助手基于混元大模型,覆盖会前准备、会中提醒与实时问答、会后纪要整理等完整链路。本文以该案例为参考,拆解会议场景对模型能力的关键要求。所述案例为腾讯内部产品落地能力示例,并非 TokenHub 平台的通用产品能力指标。

一、案例事实

腾讯云 TokenHub 产品介绍页公开披露了腾讯会议作为典型客户案例的相关信息:

a. 时间:2024 年 2 月上线 AI 小助手

b. 底座:基于混元大模型

c. 能力:会前准备、会中提醒与实时问答响应、会后整理会议纪要和待办事项

d. 效果:极大提高开会效率

数据来源:TokenHub 产品介绍页客户案例 §6.1。

⚠ 重要说明:以上为腾讯内部产品基于混元大模型的落地能力示例。这些能力描述反映的是腾讯会议 AI 小助手在自身产品中的具体实现,并不代表 TokenHub 平台直接提供"开箱即用的会议 AI 能力"。第三方企业若希望构建类似应用,需要自行基于 TokenHub 提供的大模型 API 完成产品集成与工程开发。

二、为什么会议是大模型的高价值落地场景

2.1 会议是企业内部的高频高价值动作

中等规模公司每天开数百场会,大型企业每天数千场。会议时间是企业里成本最高的资源之一,任何能"压一压会议时间、提一提会议质量"的能力都有清晰商业价值。

2.2 会议天然产生大量结构化与非结构化数据

日程、议程、参与者、附件、共享屏幕、会议录音、聊天消息——这些数据的整合处理正是 LLM 擅长的工作。

2.3 会议场景对实时性要求极高

"会中实时问答"意味着大模型必须在 1~2 秒内响应。这对底层模型的 TTFT 与平台的稳定性都提出明确要求。

2.4 会前 / 会中 / 会后是完整的产品形态

不是单点功能,而是覆盖完整时间线的产品体验。这种场景设计才能真正改变用户行为。

三、从腾讯会议案例看会议场景的能力拆解

3.1 会前准备:议程整理 + 资料梳理

官方应用场景描述里提到:"会前准备:议程整理、资料梳理"(§5.2)。

工程层要解决的问题:

a. 把日程通知、会议主题、邀请邮件、附件文档汇总

b. 按议程时间线生成结构化大纲

c. 针对每个议程项给出参考资料摘要

需要的模型能力:长上下文、结构化输出、Function Calling(调取日程系统 / 邮件系统 / 知识库)。

3.2 会中提醒 + 实时问答

官方应用场景描述里提到:"会中提醒、实时问答响应"(§5.2)。

工程层要解决的问题:

a. 实时识别会议讨论主题

b. 当讨论偏离议程时给出温和提醒

c. 用户提问时实时给出答案

d. 流式输出降低用户感知延迟

需要的模型能力:低 TTFT、流式输出、深度思考(处理复杂问题)、Function Calling(调取知识库)。

3.3 会后整理:会议纪要 + 待办事项

官方应用场景描述里提到:"会后整理会议纪要与待办事项"(§5.2)。

工程层要解决的问题:

a. 把转写的会议全文压缩为纪要

b. 抽取行动项、负责人、截止时间

c. 按结构化格式输出,对接 OA / 项目管理系统

需要的模型能力:长上下文(一场长会议的转写文本可能 5 万~10 万字)、结构化输出、信息抽取。

四、TokenHub 上能支撑会议 AI 应用的模型矩阵

如果你也希望基于 TokenHub 构建类似的会议 AI 应用,核心模型选型可参考以下能力对照(数据来源:产品规格 §7.1 / 价格 §8.2):

模型

上下文

Cache 缓存

结构化输出

适合环节

Hy3 preview

256k

会前 / 会中 / 会后均可

DeepSeek-V4-Flash

1M

会后纪要(极长转写文本)

DeepSeek-V4-Pro

1M

高价值会议(董事会、客户高层会)

GLM-5.1

200k

会中实时问答

Kimi-K2.6

256k

会后纪要

MiniMax-M2.7

200k

会前资料梳理

4.1 选型建议

a. 会前 / 会中实时性优先:选 DeepSeek-V4-Flash(输入 1 元、输出 2 元、缓存命中 0.2 元/百万 tokens,便宜 + 低延迟)

b. 会后纪要 / 待办抽取:选支持长上下文 + 结构化输出的 Hy3 preview、DeepSeek-V4-Flash 或 Kimi-K2.6

c. 高复杂度会议(高层决策、专业讨论):选 Hy3 preview 或 DeepSeek-V4-Pro(深度思考能力更强)

五、构建会议 AI 应用的几个工程要点

5.1 把会议固定 prompt 打进 Cache

"你是一个会议助手,请按以下规则……"这种长 system prompt 在每场会议里都会重复出现。利用 prompt_cache_key(赋值为 meeting_id 或 conversation_id)和 X-Session-ID 把这部分内容缓存住,输入侧成本可以下降至常规价的 1/4~1/10。详见 TokenHub Prompt Cache 命中率提升指南:https://cloud.tencent.com/document/product/1823/131410

5.2 会中实时问答用流式 + Function Calling

TokenHub 兼容 OpenAI API 协议,流式输出(SSE)开箱即用。Function Calling 让模型能在会中实时调用知识库 / 文档 / 历史会议纪要。

5.3 会后纪要走批量任务通道

TokenHub 提供"批量任务场景"独立计价,通常是在线推理价格的约 50%(如 GLM-5、GLM-5.1)。会后纪要本身不要求实时,走批量通道既能省钱又能避开在线限流。

5.4 把待办抽取做成结构化输出

给模型一个 Schema:

代码语言:json
复制
{
  "todos": [
    {
      "task": "string",
      "owner": "string",
      "due_date": "string"
    }
  ],
  "summary": "string"
}

模型直接返回符合 Schema 的 JSON,业务侧直接对接项目管理系统,无需额外解析。

六、TokenHub 给你的基础设施

a. 一个 API Key 接入混元 + DeepSeek + GLM + Kimi + MiniMax 多家主力模型,按场景灵活路由

b. 兼容 OpenAI API 协议,已有 SDK 切个 base_url 就能跑

c. 模型监控可视化 TTFT / TPOT / RPM,把"会中实时问答必须 2 秒响应"做成可量化指标

d. 用量统计按模型、服务、API Key 三维度查看,财务对账清清楚楚

e. 支持多在线推理服务,会前 / 会中 / 会后可按业务划分独立服务,互不干扰

f. 数据安全:平台不会将用户请求与模型返回的数据用于模型训练

七、零成本起步

新人开通 TokenHub 即可领取覆盖几乎全部主力模型的免费体验包:

模型

免费额度

有效期

Hy3 preview

100 万 Tokens

90 天

DeepSeek-V4-Flash

100 万 Tokens

90 天

DeepSeek-V4-Pro

100 万 Tokens

90 天

GLM-5.1

50 万 Tokens

90 天

Kimi-K2.6

50 万 Tokens

90 天

MiniMax-M2.7

100 万 Tokens

90 天

数据来源:新人免费体验包 §10.1。

100 万 Tokens 大约相当于 56 万中文字符,足够把一个会议 AI PoC 项目的 50 场真实会议跑完整一遍闭环。

新人免费体验包详情:https://cloud.tencent.com/document/product/1823/130053

八、案例参考的边界与提醒

a. 腾讯会议 AI 小助手是腾讯内部产品基于混元大模型的具体落地实现,TokenHub 平台不直接提供"现成的会议 AI 能力"

b. 第三方企业要复现类似的会前 / 会中 / 会后体验,需要基于 TokenHub 提供的大模型 API 自行构建产品

c. "极大提高开会效率"是腾讯会议在自身产品场景下的描述,具体效果取决于业务整合深度与产品设计质量

d. 如要在商业材料中引用此案例,建议明确标注"以上为腾讯会议 AI 小助手的产品能力示例"

结语

腾讯会议 AI 小助手用一个"会前 + 会中 + 会后"的完整产品形态,证明了大模型在企业生产力工具里的落地路径。如果你也在评估会议场景 AI 应用的可行性,TokenHub 提供的长上下文 + Cache 缓存 + Function Calling + 结构化输出能力组合是合理的工程底座。立即进入 TokenHub 开始你的会议 AI PoC:https://cloud.tencent.com/product/tokenhub

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 摘要:
  • 一、案例事实
  • 二、为什么会议是大模型的高价值落地场景
    • 2.1 会议是企业内部的高频高价值动作
    • 2.2 会议天然产生大量结构化与非结构化数据
    • 2.3 会议场景对实时性要求极高
    • 2.4 会前 / 会中 / 会后是完整的产品形态
  • 三、从腾讯会议案例看会议场景的能力拆解
    • 3.1 会前准备:议程整理 + 资料梳理
    • 3.2 会中提醒 + 实时问答
    • 3.3 会后整理:会议纪要 + 待办事项
  • 四、TokenHub 上能支撑会议 AI 应用的模型矩阵
    • 4.1 选型建议
  • 五、构建会议 AI 应用的几个工程要点
    • 5.1 把会议固定 prompt 打进 Cache
    • 5.2 会中实时问答用流式 + Function Calling
    • 5.3 会后纪要走批量任务通道
    • 5.4 把待办抽取做成结构化输出
  • 六、TokenHub 给你的基础设施
  • 七、零成本起步
  • 八、案例参考的边界与提醒
  • 结语
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档