实时音视频文字转语音配置

本文主要介绍如何配置 开始 AI 对话任务 StartAIConversation 接口中的 TTSConfig 参数。
您可以选择快速配置 TRTC 的 TTS 服务或者 自主接入第三方服务。
使用 TRTC TTS 配置
若您在 AI 实时对话中选择使用 TRTC 实时语音合成服务，可参考下方配置快速接入。套餐权限开通和计费规则请参考 AI 智能语音计费。
目前仅支持配置默认 TTS 版本，即 AI 智能语音 的语音合成 Flash 版。
{
  "TTSType": "flow",  // 【必填】固定为此值
  "VoiceId": "v-female-R2s4N9qJ", // 【必填】精品音色 ID /克隆音色 ID。不同音色ID 库参考下方音色列表
  "Model": "flow_02_turbo", // 【必填】当前默认的 TTS 模型版本（对应 Flash 版本）
  "Speed": 1.0,    //【可选】调节语速 范围 [0.5-2.0],默认 1.0; 取值越大，语速越快
  "Volume": 1.0,   // 【可选】调节音量 (0, 1] 默认值 1.0; 取值越大，音量越高
  "Pitch": 0,   // 【可选】调节语调 [-12,12],默认值为 0,其中 0 为原音色输出。
  "Language": "zh" //【可选】建议填写，目前支持填写中文：zh 英文：en 粤语方言：yue; 参数参考：(ISO 639-1) 
}
说明：
目前 TRTC 的 TTS 服务支持一批中英精品音色，如果您有其他音色或者更多语种需求，欢迎通过商务联系我们。
若您需要在 AI 实时对话中自主接入 TTS 服务，请点击跳转至 自主接入 TTS。
精品音色库
TRTC 语音合成精品音色库 Voice ID 请参考下方列表，您可以根据需求偏好选择音色进行配置填写。
音色名称
音色 ID
支持语言
语言 ID
威严男霸总
v-male-Bk7vD3xP
中文
zh
温柔姐姐
v-female-R2s4N9qJ
中文
zh
傲娇学姐
v-female-m1KpW7zE
中文
zh
夹子女生
v-female-U8aT2yLf
中文
zh
闲聊男声
v-male-s5NqE0rZ
中文
zh
自然男声
v-male-W1tH9jVc
中文
zh
客服小美（女）
female-kefu-xiaomei
中文
zh
客服小心（女）
female-kefu-xiaoxin
中文
zh
客服小悦（女）
female-kefu-xiaoyue
中文
zh
客服小徐（男）
male-kefu-xiaoxu
中文
zh
清晰女旁白
v-female-p9Xy7Q1L
美式英语
en
理性女讲解
v-female-Z3x9LmQ2
美式英语
en
严谨男讲师
v-male-A4b9KqP2
美式英语
en
权威男解读
v-male-r7K2pQ9L
美式英语
en
沉着男评审
v-male-Q6p8ZxL3
美式英语
en
静心女教练
v-female-T3s8BqL9
美式英语
en
温和男顾问
v-male-P6q7LzD8
美式英语
en
内敛女播音
v-female-M7k2PxL9
美式英语
en
淡然女配音
v-female-S5n9QxJ4
美式英语
en
沉稳女配音
v-female-T8m4WxP7
美式英语
en
深沉男评析
v-male-D6p3KxN8
美式英语
en
温情女主持
v-female-A9b3KfL2
美式英语
en
真挚女创作
v-female-A7h2MxQ5
美式英语
en
温和男创作
v-male-G4n7RxM3
美式英语
en
暖心男顾问
v-male-H3p9LxK7
美式英语
en
真诚男主播
v-male-R6n2MxT9
美式英语
en
自信女演员
v-female-C8k4NxL6
美式英语
en
阳光男演讲
v-male-L7m5QxP4
美式英语
en
理性男评论
v-male-N4k8TxR7
美式英语
en
理智女旁白
v-female-B7k5WxN4
美式英语
en
雅致女解说
v-female-k3P8sL0Q
中文-粤语方言
yue
沉稳男解说
v-male-L4s7PqZ9
中文-粤语方言
yue
用户自主接入 TTS
若您选择自主接入 TTS，则需要您自行准备相关 TTS 服务账号或 API Key，不同服务商的配置方式可参考下面章节。
Tencent TTS
{ 
    "TTSType": "tencent", // String TTS 类型
    "AppId": 您的应用ID, // Integer 必填
    "SecretId": "您的密钥ID", // String 必填
    "SecretKey":  "您的密钥Key", // String 必填
    "VoiceType": 101001, // Integer 必填，音色 ID，包括标准音色与精品音色，精品音色拟真度更高，价格不同于标准音色，请参见语音合成计费概述。完整的音色 ID 列表请参见语音合成音色列表。
    "Speed": 1.25, // Float 非必填，语速，范围：[-2，6]，分别对应不同语速： -2: 代表0.6倍 -1: 代表0.8倍 0: 代表1.0倍（默认） 1: 代表1.2倍 2: 代表1.5倍  6: 代表2.5倍  如果需要更细化的语速，可以保留小数点后 2 位，例如0.5/1.25/2.81等。 参数值与实际语速转换，可参考 语速转换
    "Volume": 5, // Float 非必填，音量大小，范围：[0，10]，分别对应11个等级的音量，默认值为0，代表正常音量。
    "PrimaryLanguage": 1, // Integer 可选 主要语言 1-中文（默认） 2-英文 3-日文
    "FastVoiceType": "xxxx", // String 可选参数，快速声音复刻的参数 
    "EmotionCategory":"angry", // String 非必填，控制合成音频的情感，仅支持多情感音色使用。取值: neutral(中性)、sad(悲伤)...
    "EmotionIntensity":150 // Integer 非必填，控制合成音频情感程度，取值范围为 [50,200]，默认为 100；只有 EmotionCategory 不为空时生效。 
}
参见：语音合成-音色列表﻿
MiniMax TTS
{
    "TTSType": "minimax",  // String TTS 类型,
    "Model": "speech-2.6-turbo",  // String 必填，请求的模型版本。
    "APIUrl": "https://api.minimax.chat/v1/t2a_v2",  // String 必填，接口地址
    "APIKey": "eyxxxx",  // String 必填
    "GroupId": "181000000000000",  // String 必填，用户所属的组
    "VoiceType":"female-tianmei-jingpin",  // String 必填，请求的音色编号，对应 voice_id
    "Speed": 1.0,  // Float 非必填，生成声音的语速，范围[0.5,2]，默认值为1.0
    "Volume": 1.0,  // Float 非必填，生成声音的音量，范围（0,10]，默认值为1.0
    "Pitch": 0,  // Integer 非必填，生成声音的语调，范围[-12,12]，默认值为0
    "Emotion": "",  // String 非必填，控制合成语音的情绪，该参数仅对 speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-turbo,speech-01-hd 生效
    "LanguageBoost": "",  // String 非必填，增强对指定的小语种和方言的识别能力，设置后可以提升在指定小语种/方言场景下的语音表现。如果不明确小语种类型，则可以选择 "auto"，模型将自主判断小语种类型。
    "PronunciationDict": { "tone": [] }  // 非必填，替换需要特殊标注的文字、符号及对应的注音。
}
有关 MiniMax 更多模型型号和 API 参数详情可查看：MiniMax > 同步语音合成。
API 速率限制参见：MiniMax > 速率限制。
Azure TTS
{
    "TTSType": "azure", // 必填：String； TTS类型
    "SubscriptionKey": "xxxxxxxx", // 必填：String； 用户订阅的 Key
    "Region": "chinanorth3",  // 必填：String 订阅的地区
    "VoiceName": "zh-CN-XiaoxiaoNeural", // 必填：String 音色名必填
    "Language": "zh-CN", // 必填：String 合成的语言  
    "Rate": 1 // 选填：float 语速  0.5～2 默认为 1
}
参见：使用 SSML 来自定义语音和声音﻿
Cartesia TTS
{
    "TTSType": "cartesia",  // 必填: String； TTS 类型
    "Model": "sonic-multilingual", //必填 模型型号
    "APIKey": "eyxxxx", //必填：获取 API 密钥
    "VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0"  //必填 声音 id https://play.cartesia.ai/
}
参见：Cartesia TTS﻿
ElevenLabs TTS
{
    "TTSType": "elevenlabs",  // 必填: String TTS 类型, 
    "Model": "eleven_turbo_v2_5", //必填，模型类型
    "APIKey": "eyxxxx",
    "VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0"  //声音类型 https://elevenlabs.io/docs/api-reference/get-voices
}
参见：ElevenLabs TTS﻿
自定义 TTS 
{
  "TTSType": "custom", // String 必填
  "APIKey": "ApiKey", // String 必填，用来鉴权
  "APIUrl": "http://0.0.0.0:8080/stream-audio", // String，必填，对应服务商的 TTS API URL
  "AudioFormat": "wav", // String, 非必填，期望输出的音频格式，如mp3， ogg_opus，pcm，wav，默认为 wav，目前只支持pcm和wav，
  "SampleRate": 16000,  // Integer，非必填，音频采样率，默认为16000(16k)，推荐值为16000
  "AudioChannel": 1,    // Integer，非必填，音频通道数，取值：1 或 2  默认为1  
}
具体协议规范请参见 自定义 TTS 协议。

音色名称	音色 ID	支持语言	语言 ID
威严男霸总	v-male-Bk7vD3xP	中文	zh
温柔姐姐	v-female-R2s4N9qJ	中文	zh
傲娇学姐	v-female-m1KpW7zE	中文	zh
夹子女生	v-female-U8aT2yLf	中文	zh
闲聊男声	v-male-s5NqE0rZ	中文	zh
自然男声	v-male-W1tH9jVc	中文	zh
客服小美（女）	female-kefu-xiaomei	中文	zh
客服小心（女）	female-kefu-xiaoxin	中文	zh
客服小悦（女）	female-kefu-xiaoyue	中文	zh
客服小徐（男）	male-kefu-xiaoxu	中文	zh
清晰女旁白	v-female-p9Xy7Q1L	美式英语	en
理性女讲解	v-female-Z3x9LmQ2	美式英语	en
严谨男讲师	v-male-A4b9KqP2	美式英语	en
权威男解读	v-male-r7K2pQ9L	美式英语	en
沉着男评审	v-male-Q6p8ZxL3	美式英语	en
静心女教练	v-female-T3s8BqL9	美式英语	en
温和男顾问	v-male-P6q7LzD8	美式英语	en
内敛女播音	v-female-M7k2PxL9	美式英语	en
淡然女配音	v-female-S5n9QxJ4	美式英语	en
沉稳女配音	v-female-T8m4WxP7	美式英语	en
深沉男评析	v-male-D6p3KxN8	美式英语	en
温情女主持	v-female-A9b3KfL2	美式英语	en
真挚女创作	v-female-A7h2MxQ5	美式英语	en
温和男创作	v-male-G4n7RxM3	美式英语	en
暖心男顾问	v-male-H3p9LxK7	美式英语	en
真诚男主播	v-male-R6n2MxT9	美式英语	en
自信女演员	v-female-C8k4NxL6	美式英语	en
阳光男演讲	v-male-L7m5QxP4	美式英语	en
理性男评论	v-male-N4k8TxR7	美式英语	en
理智女旁白	v-female-B7k5WxN4	美式英语	en
雅致女解说	v-female-k3P8sL0Q	中文-粤语方言	yue
沉稳男解说	v-male-L4s7PqZ9	中文-粤语方言	yue

文字转语音配置

本页目录：

使用 TRTC TTS 配置

精品音色库

用户自主接入 TTS

Tencent TTS

MiniMax TTS

Azure TTS

Cartesia TTS

ElevenLabs TTS

自定义 TTS