
腾讯会议 2024 年 2 月上线的 AI 小助手基于混元大模型,覆盖会前准备、会中提醒与实时问答、会后纪要整理等完整链路。本文以该案例为参考,拆解会议场景对模型能力的关键要求。所述案例为腾讯内部产品落地能力示例,并非 TokenHub 平台的通用产品能力指标。
腾讯云 TokenHub 产品介绍页公开披露了腾讯会议作为典型客户案例的相关信息:
a. 时间:2024 年 2 月上线 AI 小助手
b. 底座:基于混元大模型
c. 能力:会前准备、会中提醒与实时问答响应、会后整理会议纪要和待办事项
d. 效果:极大提高开会效率
数据来源:TokenHub 产品介绍页客户案例 §6.1。
⚠ 重要说明:以上为腾讯内部产品基于混元大模型的落地能力示例。这些能力描述反映的是腾讯会议 AI 小助手在自身产品中的具体实现,并不代表 TokenHub 平台直接提供"开箱即用的会议 AI 能力"。第三方企业若希望构建类似应用,需要自行基于 TokenHub 提供的大模型 API 完成产品集成与工程开发。
中等规模公司每天开数百场会,大型企业每天数千场。会议时间是企业里成本最高的资源之一,任何能"压一压会议时间、提一提会议质量"的能力都有清晰商业价值。
日程、议程、参与者、附件、共享屏幕、会议录音、聊天消息——这些数据的整合处理正是 LLM 擅长的工作。
"会中实时问答"意味着大模型必须在 1~2 秒内响应。这对底层模型的 TTFT 与平台的稳定性都提出明确要求。
不是单点功能,而是覆盖完整时间线的产品体验。这种场景设计才能真正改变用户行为。
官方应用场景描述里提到:"会前准备:议程整理、资料梳理"(§5.2)。
工程层要解决的问题:
a. 把日程通知、会议主题、邀请邮件、附件文档汇总
b. 按议程时间线生成结构化大纲
c. 针对每个议程项给出参考资料摘要
需要的模型能力:长上下文、结构化输出、Function Calling(调取日程系统 / 邮件系统 / 知识库)。
官方应用场景描述里提到:"会中提醒、实时问答响应"(§5.2)。
工程层要解决的问题:
a. 实时识别会议讨论主题
b. 当讨论偏离议程时给出温和提醒
c. 用户提问时实时给出答案
d. 流式输出降低用户感知延迟
需要的模型能力:低 TTFT、流式输出、深度思考(处理复杂问题)、Function Calling(调取知识库)。
官方应用场景描述里提到:"会后整理会议纪要与待办事项"(§5.2)。
工程层要解决的问题:
a. 把转写的会议全文压缩为纪要
b. 抽取行动项、负责人、截止时间
c. 按结构化格式输出,对接 OA / 项目管理系统
需要的模型能力:长上下文(一场长会议的转写文本可能 5 万~10 万字)、结构化输出、信息抽取。
如果你也希望基于 TokenHub 构建类似的会议 AI 应用,核心模型选型可参考以下能力对照(数据来源:产品规格 §7.1 / 价格 §8.2):
模型 | 上下文 | Cache 缓存 | 结构化输出 | 适合环节 |
|---|---|---|---|---|
Hy3 preview | 256k | ✅ | ✅ | 会前 / 会中 / 会后均可 |
DeepSeek-V4-Flash | 1M | ✅ | ✅ | 会后纪要(极长转写文本) |
DeepSeek-V4-Pro | 1M | ✅ | ✅ | 高价值会议(董事会、客户高层会) |
GLM-5.1 | 200k | ✅ | ✅ | 会中实时问答 |
Kimi-K2.6 | 256k | ✅ | ✅ | 会后纪要 |
MiniMax-M2.7 | 200k | ✅ | ❌ | 会前资料梳理 |
a. 会前 / 会中实时性优先:选 DeepSeek-V4-Flash(输入 1 元、输出 2 元、缓存命中 0.2 元/百万 tokens,便宜 + 低延迟)
b. 会后纪要 / 待办抽取:选支持长上下文 + 结构化输出的 Hy3 preview、DeepSeek-V4-Flash 或 Kimi-K2.6
c. 高复杂度会议(高层决策、专业讨论):选 Hy3 preview 或 DeepSeek-V4-Pro(深度思考能力更强)
"你是一个会议助手,请按以下规则……"这种长 system prompt 在每场会议里都会重复出现。利用 prompt_cache_key(赋值为 meeting_id 或 conversation_id)和 X-Session-ID 把这部分内容缓存住,输入侧成本可以下降至常规价的 1/4~1/10。详见 TokenHub Prompt Cache 命中率提升指南:https://cloud.tencent.com/document/product/1823/131410。
TokenHub 兼容 OpenAI API 协议,流式输出(SSE)开箱即用。Function Calling 让模型能在会中实时调用知识库 / 文档 / 历史会议纪要。
TokenHub 提供"批量任务场景"独立计价,通常是在线推理价格的约 50%(如 GLM-5、GLM-5.1)。会后纪要本身不要求实时,走批量通道既能省钱又能避开在线限流。
给模型一个 Schema:
{
"todos": [
{
"task": "string",
"owner": "string",
"due_date": "string"
}
],
"summary": "string"
}模型直接返回符合 Schema 的 JSON,业务侧直接对接项目管理系统,无需额外解析。
a. 一个 API Key 接入混元 + DeepSeek + GLM + Kimi + MiniMax 多家主力模型,按场景灵活路由
b. 兼容 OpenAI API 协议,已有 SDK 切个 base_url 就能跑
c. 模型监控可视化 TTFT / TPOT / RPM,把"会中实时问答必须 2 秒响应"做成可量化指标
d. 用量统计按模型、服务、API Key 三维度查看,财务对账清清楚楚
e. 支持多在线推理服务,会前 / 会中 / 会后可按业务划分独立服务,互不干扰
f. 数据安全:平台不会将用户请求与模型返回的数据用于模型训练
新人开通 TokenHub 即可领取覆盖几乎全部主力模型的免费体验包:
模型 | 免费额度 | 有效期 |
|---|---|---|
Hy3 preview | 100 万 Tokens | 90 天 |
DeepSeek-V4-Flash | 100 万 Tokens | 90 天 |
DeepSeek-V4-Pro | 100 万 Tokens | 90 天 |
GLM-5.1 | 50 万 Tokens | 90 天 |
Kimi-K2.6 | 50 万 Tokens | 90 天 |
MiniMax-M2.7 | 100 万 Tokens | 90 天 |
数据来源:新人免费体验包 §10.1。
100 万 Tokens 大约相当于 56 万中文字符,足够把一个会议 AI PoC 项目的 50 场真实会议跑完整一遍闭环。
新人免费体验包详情:https://cloud.tencent.com/document/product/1823/130053。
a. 腾讯会议 AI 小助手是腾讯内部产品基于混元大模型的具体落地实现,TokenHub 平台不直接提供"现成的会议 AI 能力"
b. 第三方企业要复现类似的会前 / 会中 / 会后体验,需要基于 TokenHub 提供的大模型 API 自行构建产品
c. "极大提高开会效率"是腾讯会议在自身产品场景下的描述,具体效果取决于业务整合深度与产品设计质量
d. 如要在商业材料中引用此案例,建议明确标注"以上为腾讯会议 AI 小助手的产品能力示例"
腾讯会议 AI 小助手用一个"会前 + 会中 + 会后"的完整产品形态,证明了大模型在企业生产力工具里的落地路径。如果你也在评估会议场景 AI 应用的可行性,TokenHub 提供的长上下文 + Cache 缓存 + Function Calling + 结构化输出能力组合是合理的工程底座。立即进入 TokenHub 开始你的会议 AI PoC:https://cloud.tencent.com/product/tokenhub。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。