AI 智能识别包括语音转文本、实时翻译和实时语音合成三个能力。
语音转文本识别 TRTC 房间内指定用户或所有用户的音频流,将其进行语音转文本(Speech-To-Text,STT)识别并输出。
实时翻译在语音转文本的基础上,通过 AI 将转写出来的文本翻译成目标语言。
实时语音合成识别 TRTC 房间内指定用户输出的文字信息,将其进行文本转语音(Text-To-Speech, TTS)识别并进行输出。
计费说明
套餐包费用
解锁 AI 智能识别能力位的方式具体如下:
套餐包 | 套餐版本 | 套餐价格 | 赠送 AI 智能识别时长 | 语音转文本 | 实时翻译 | 实时语音合成 |
轻量版 | 50 元/月(每个账号限购 1 次) | 1,000 分钟/月 | ✓ | ✓ | ✓ | |
| 基础版 | 500 元/月 | 10,000 分钟/月 | ✓ | - | - |
| 尊享版 | 1000 元/月 | 20,000 分钟/月 | ✓ | ✓ | ✓ |
- | ✓ | ✓ | ✓ | |||
| 入门版 | 0 元免费订阅 | - | - | - | - |
| 基础版 | 625 元/月 | - | - | - | - |
| 尊享版 | 1875 元/月 | - | - | - | - |
| 尊享版 Plus | 限时 8 折 2875 元 | 10,000 分钟/月 | ✓ | - | - |
| 旗舰版 | 6250 元/月 | - | - | - | - |
| 旗舰版 Plus | 限时 8 折 8000 元 | 20,000 分钟/月 | ✓ | ✓ | ✓ |
说明:
购买 AI 智能识别时长包的任一规格的套餐包,均支持 语音转文本 API 文档 中所有语音转文本模型的识别。
套餐包的有效期为购买当日 - 次月当日。例如:2025 年 3 月 1 日购买,其有效时间为 2025 年 3 月 1 日 - 2025 年 4 月 1 日。
每个套餐仅对单个 SDKAppID 生效,可用于抵扣当前应用(SDKAppID)产生的 AI 智能识别时长用量消耗,如果您有多个 SDKAppID 需要购买,您需依次为其 购买 单独的套餐。超额的部分按套餐外超量费用进行收费。
当单个 SDKAppID 购买的 AI 智能识别套餐包到期后,对应应用解锁的增值功能也将停用,建议您购买时,开启自动续期避免影响业务使用。开启续期:登录腾讯云控制台 > 费用中心,在左侧导航中选择 续期管理。
AI 智能识别套餐包退费规则详情请参见 退费说明。
并发限制 100 QPS ,若您有更高的并发需求,请 联系我们。
抵扣比例说明
赠送的 AI 智能识别时长具体抵扣规则如下:
能力 | 类型 | 抵扣比例 |
语音转文字能力 | 基础语言引擎 | 1 |
| 标准语言引擎 | 1.6 |
| 高级语言引擎 | 3 |
实时翻译能力 | 翻译引擎 | 1.4 |
实时语音合成能力 | Flash | 0.006 注:实际计费时,1字符可抵扣 0.36 秒的智能识别时长,换算为分钟维度后,1 字符对应 0.006 分钟的智能识别时长。 |
| 多语种 | |
说明:
语音转文字能力:标准语言引擎于 2025 年 5 月 20 日起,支持 AI 智能识别时长包抵扣。
实时翻译能力:购买 AI 智能识别轻量版、AI 智能识别尊享版或使用包月套餐旗舰版 Plus 赠送的 AI 智能识别时长包均可以支持翻译引擎功能。自 2025 年 9 月 24 日 0 时起,支持抵扣实时翻译用量。
实时语音合成能力:购买 AI 智能识别轻量版、AI 智能识别尊享版或使用包月套餐旗舰版 Plus 赠送的 AI 智能识别时长包均可以支持Flash和多语种语音合成。自 2025 年 11 月 20 日 0 时起,支持 AI 智能识别时长包抵扣。
超量费用
付费方式 | 能力 | 类型 | 价格 | 说明 |
套餐外超量费用 (日结后付费) | 语音转文本能力 | 基础语言引擎 | 0.05 元/分钟 | 支持普通话(简体)、普通话(繁体)、英语的单语种识别。 |
| | 标准语言引擎 | 0.08 元/分钟 | 支持普通话(简体)、普通话(繁体)、英语、方言、海外多语种的混合识别。 |
| | 高级语言引擎 | 0.15 元/分钟 | |
| 实时翻译能力 | 翻译引擎 | 0.07 元/分钟 | |
| 实时语音合成能力 | Flash | 3.00 元/万字符 | 支持将中文、英语文本实时转换为自然流畅的多音色语音。 |
| | 多语种 | | 支持除中英文外多种语言文本实时转换为自然流畅的多音色语音,具体参见文本末支持语言列表。 |
用量统计
语音转文本
只有开始参与 AI 智能识别的音频时长才进行用量统计。
主播多路流输入,若调用不同的语言引擎模型,则按照不同语言引擎单价进行区分收费。
注意:
使用 AI 智能识别服务时,将会有机器人作为虚拟观众加入房间,订阅需要识别的音频流。机器人费用按照 音视频时长计费规则 进行计费。
时长统计精度为秒,按 SDKAppID 维度,以每日累计秒数转换成分钟数后进行计费,不足一分钟按一分钟计。
实时翻译
按照参与 AI 智能识别翻译能力的音频时长进行用量统计。
主播单路流输入,若输出多种翻译语言,则按照输入的音频时长 * 输出的语种个数进行收费。
说明:
时长统计精度为秒,按日累计秒数转换成分钟数后进行计费,不足一分钟按一分钟计算。
实时语音合成
按照实时语音合成的输入文本字符数量进行用量统计。
主播单路流输入,按照需要语音合成的字符数量进行收费。
说明:
文本字符统计精度为万字符,按日累计字符数进行计费,保留四位小数。
1 个汉字算 2 个字符(包括日文汉字、韩文汉字或其他语言中产生和用到的汉字);每个英语字母,其他语言字符,标点符号,特殊符号,空格,回车等均统计为 1 个字符。
计费示例
示例 1
用户 A 希望使用语音转文本的功能,那么需要购买 AI 智能识别任一规格套餐包,在 2024 年 11 月 01 日一次性购买了 AI 智能识别(10,000 分钟规格)3 个月,并开启了“自动续期”功能。
则:
客户一次性付费 = 500 元/月 × 3 个月 = 1500 元,(3 个月套餐分别在 2024 年 11 月 01 日、2024 年 12 月 01 日、2025 年 01 月 01 日下发)。
从 2025 年 02 月 01 日开始触发“自动续费”,每月自动扣费 500 元,并下发 AI 智能识别包含 10,000 分钟的套餐包。
说明:
示例 2
用户 A 和 B 用中文通话,观众 C 需要看到英文字幕,观众 D 需要看到日文字幕,使用大语言模型进行语音转文本,再使用实时翻译的功能,通话 5 分钟的计费如下:
计费类型 | 用户 A | 用户 B | 小计 |
语音转文本 | 5 分钟 | 5 分钟 | 10 分钟 |
实时翻译 | 5 分钟 * 2 | 5 分钟 * 2 | 20 分钟 |
分析:
语音转文本:共产生 10 分钟用量,单价为 0.08 元/分钟,共 0.8 元。
实时翻译:共产生 20 分钟用量,单价为 0.07 元/分钟,共 1.4 元。
则此场景中,您需要支付 2.2 元。
注意:
本文计费示例采用刊例价计算,如果您与腾讯云的商务经理签订了合同,以合同约定的价格为准。
示例 3
用户 A 和 B 用中文通话,观众 C 需要看到英文字幕并能听到英文语音,观众 D 需要看到日文字幕并听到日文语音,使用大语言模型进行语音转文本,再使用实时翻译和实时语音合成的功能,通话 50 分钟,文本字符累计 2.0000 万(用户 A 中文通话的文本字符为 0.9000 万字符,用户 B 中文通话的文本字符为 1.1000 万字符)的计费如下:
计费类型 | 用户 A | 用户 B | 小计 |
语音转文本 | 50 分钟 | 50 分钟 | 100 分钟 |
实时翻译 | 50 分钟 * 2 | 50 分钟 * 2 | 200 分钟 |
实时语音合成 | 0.9000 万字符 * 2 | 1.1000 万字符 * 2 | 4.0000 万字符 |
分析:
语音转文本:共产生 100 分钟用量,单价为 0.08 元/分钟,共 8 元。
实时翻译:共产生 200 分钟用量,单价为 0.07 元/分钟,共 14 元。
实时语音合成:共产生 4.0000 万字用量,单价为 3 元/万字符,共 12 元。
则在此场景中,您需要支付 34 元。
接入说明
AI 智能识别的语音转文本和实时翻译具体接入步骤请参见 语音转录与翻译 接入说明。
AI 对话中配置实时语音合成具体接入步骤请参见 AI 对话文字转语音配置。
支持的语言列表
| 支持语言种类 | 支持方言种类 |
语音转文本 | 中文、英语、越南语、日语、韩语、印度尼西亚语、泰语、葡萄牙语、土耳其语、阿拉伯语、西班牙语、印地语、法语、马来语、菲律宾语、德语、意大利语、俄语、瑞典语、丹麦语、挪威语。 | 上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、广东话、客家话、南宁话。 |
实时翻译 | 中文、英语、越南语、日语、韩语、印度尼西亚语、泰语、葡萄牙语、阿拉伯语、西班牙语、法语、马来语、德语、意大利语、俄语。 | / |
实时语音合成 | 中文、英语、越南语、日语、韩语、印尼语、泰语、葡萄牙语、阿拉伯语、西班牙语、法语、马来语、德语、意大利语、俄语、土耳其语、荷兰语、乌克兰语、波兰语、罗马尼亚语、希腊语、捷克语、芬兰语、印地语、保加利亚语、丹麦语、希伯来语、波斯语、斯洛伐克语、瑞典语、克罗地亚语、菲律宾语、匈牙利语、挪威语、斯洛文尼亚语、加泰罗尼亚语、尼诺斯克语、泰米尔语、阿非利卡语。 | 广东话 |
注意: