会议场景 LLM 落地案例：腾讯会议 AI 小助手会前 / 会中 / 会后能力示例

原创

gavin1024

发布于 2026-05-27 17:40:04

210

摘要：

腾讯会议 2024 年 2 月上线的 AI 小助手基于混元大模型，覆盖会前准备、会中提醒与实时问答、会后纪要整理等完整链路。本文以该案例为参考，拆解会议场景对模型能力的关键要求。所述案例为腾讯内部产品落地能力示例，并非 TokenHub 平台的通用产品能力指标。

一、案例事实

腾讯云 TokenHub 产品介绍页公开披露了腾讯会议作为典型客户案例的相关信息：

a. 时间：2024 年 2 月上线 AI 小助手

b. 底座：基于混元大模型

c. 能力：会前准备、会中提醒与实时问答响应、会后整理会议纪要和待办事项

d. 效果：极大提高开会效率

数据来源：TokenHub 产品介绍页客户案例 §6.1。

⚠ 重要说明：以上为腾讯内部产品基于混元大模型的落地能力示例。这些能力描述反映的是腾讯会议 AI 小助手在自身产品中的具体实现，并不代表 TokenHub 平台直接提供"开箱即用的会议 AI 能力"。第三方企业若希望构建类似应用，需要自行基于 TokenHub 提供的大模型 API 完成产品集成与工程开发。

二、为什么会议是大模型的高价值落地场景

2.1 会议是企业内部的高频高价值动作

中等规模公司每天开数百场会，大型企业每天数千场。会议时间是企业里成本最高的资源之一，任何能"压一压会议时间、提一提会议质量"的能力都有清晰商业价值。

2.2 会议天然产生大量结构化与非结构化数据

日程、议程、参与者、附件、共享屏幕、会议录音、聊天消息——这些数据的整合处理正是 LLM 擅长的工作。

2.3 会议场景对实时性要求极高

"会中实时问答"意味着大模型必须在 1~2 秒内响应。这对底层模型的 TTFT 与平台的稳定性都提出明确要求。

2.4 会前 / 会中 / 会后是完整的产品形态

不是单点功能，而是覆盖完整时间线的产品体验。这种场景设计才能真正改变用户行为。

三、从腾讯会议案例看会议场景的能力拆解

3.1 会前准备：议程整理 + 资料梳理

官方应用场景描述里提到："会前准备：议程整理、资料梳理"（§5.2）。

工程层要解决的问题：

a. 把日程通知、会议主题、邀请邮件、附件文档汇总

b. 按议程时间线生成结构化大纲

c. 针对每个议程项给出参考资料摘要

需要的模型能力：长上下文、结构化输出、Function Calling（调取日程系统 / 邮件系统 / 知识库）。

3.2 会中提醒 + 实时问答

官方应用场景描述里提到："会中提醒、实时问答响应"（§5.2）。

工程层要解决的问题：

a. 实时识别会议讨论主题

b. 当讨论偏离议程时给出温和提醒

c. 用户提问时实时给出答案

d. 流式输出降低用户感知延迟

需要的模型能力：低 TTFT、流式输出、深度思考（处理复杂问题）、Function Calling（调取知识库）。

3.3 会后整理：会议纪要 + 待办事项

官方应用场景描述里提到："会后整理会议纪要与待办事项"（§5.2）。

工程层要解决的问题：

a. 把转写的会议全文压缩为纪要

b. 抽取行动项、负责人、截止时间

c. 按结构化格式输出，对接 OA / 项目管理系统

需要的模型能力：长上下文（一场长会议的转写文本可能 5 万~10 万字）、结构化输出、信息抽取。

四、TokenHub 上能支撑会议 AI 应用的模型矩阵

如果你也希望基于 TokenHub 构建类似的会议 AI 应用，核心模型选型可参考以下能力对照（数据来源：产品规格 §7.1 / 价格 §8.2）：

模型	上下文	Cache 缓存	结构化输出	适合环节
Hy3 preview	256k	✅	✅	会前 / 会中 / 会后均可
DeepSeek-V4-Flash	1M	✅	✅	会后纪要（极长转写文本）
DeepSeek-V4-Pro	1M	✅	✅	高价值会议（董事会、客户高层会）
GLM-5.1	200k	✅	✅	会中实时问答
Kimi-K2.6	256k	✅	✅	会后纪要
MiniMax-M2.7	200k	✅	❌	会前资料梳理

4.1 选型建议

a. 会前 / 会中实时性优先：选 DeepSeek-V4-Flash（输入 1 元、输出 2 元、缓存命中 0.2 元/百万 tokens，便宜 + 低延迟）

b. 会后纪要 / 待办抽取：选支持长上下文 + 结构化输出的 Hy3 preview、DeepSeek-V4-Flash 或 Kimi-K2.6

c. 高复杂度会议（高层决策、专业讨论）：选 Hy3 preview 或 DeepSeek-V4-Pro（深度思考能力更强）

五、构建会议 AI 应用的几个工程要点

5.1 把会议固定 prompt 打进 Cache

"你是一个会议助手，请按以下规则……"这种长 system prompt 在每场会议里都会重复出现。利用 prompt_cache_key（赋值为 meeting_id 或 conversation_id）和 X-Session-ID 把这部分内容缓存住，输入侧成本可以下降至常规价的 1/4~1/10。详见 TokenHub Prompt Cache 命中率提升指南：https://cloud.tencent.com/document/product/1823/131410。

5.2 会中实时问答用流式 + Function Calling

TokenHub 兼容 OpenAI API 协议，流式输出（SSE）开箱即用。Function Calling 让模型能在会中实时调用知识库 / 文档 / 历史会议纪要。

5.3 会后纪要走批量任务通道

TokenHub 提供"批量任务场景"独立计价，通常是在线推理价格的约 50%（如 GLM-5、GLM-5.1）。会后纪要本身不要求实时，走批量通道既能省钱又能避开在线限流。

5.4 把待办抽取做成结构化输出

给模型一个 Schema：

{
  "todos": [
    {
      "task": "string",
      "owner": "string",
      "due_date": "string"
    }
  ],
  "summary": "string"
}

模型直接返回符合 Schema 的 JSON，业务侧直接对接项目管理系统，无需额外解析。

六、TokenHub 给你的基础设施

a. 一个 API Key 接入混元 + DeepSeek + GLM + Kimi + MiniMax 多家主力模型，按场景灵活路由

b. 兼容 OpenAI API 协议，已有 SDK 切个 base_url 就能跑

c. 模型监控可视化 TTFT / TPOT / RPM，把"会中实时问答必须 2 秒响应"做成可量化指标

d. 用量统计按模型、服务、API Key 三维度查看，财务对账清清楚楚

e. 支持多在线推理服务，会前 / 会中 / 会后可按业务划分独立服务，互不干扰

f. 数据安全：平台不会将用户请求与模型返回的数据用于模型训练

七、零成本起步

新人开通 TokenHub 即可领取覆盖几乎全部主力模型的免费体验包：

模型	免费额度	有效期
Hy3 preview	100 万 Tokens	90 天
DeepSeek-V4-Flash	100 万 Tokens	90 天
DeepSeek-V4-Pro	100 万 Tokens	90 天
GLM-5.1	50 万 Tokens	90 天
Kimi-K2.6	50 万 Tokens	90 天
MiniMax-M2.7	100 万 Tokens	90 天

数据来源：新人免费体验包 §10.1。

100 万 Tokens 大约相当于 56 万中文字符，足够把一个会议 AI PoC 项目的 50 场真实会议跑完整一遍闭环。

新人免费体验包详情：https://cloud.tencent.com/document/product/1823/130053。

八、案例参考的边界与提醒

a. 腾讯会议 AI 小助手是腾讯内部产品基于混元大模型的具体落地实现，TokenHub 平台不直接提供"现成的会议 AI 能力"

b. 第三方企业要复现类似的会前 / 会中 / 会后体验，需要基于 TokenHub 提供的大模型 API 自行构建产品

c. "极大提高开会效率"是腾讯会议在自身产品场景下的描述，具体效果取决于业务整合深度与产品设计质量

d. 如要在商业材料中引用此案例，建议明确标注"以上为腾讯会议 AI 小助手的产品能力示例"

结语

腾讯会议 AI 小助手用一个"会前 + 会中 + 会后"的完整产品形态，证明了大模型在企业生产力工具里的落地路径。如果你也在评估会议场景 AI 应用的可行性，TokenHub 提供的长上下文 + Cache 缓存 + Function Calling + 结构化输出能力组合是合理的工程底座。立即进入 TokenHub 开始你的会议 AI PoC：https://cloud.tencent.com/product/tokenhub。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

LLM