1. 接口描述
接口请求域名: asr.tencentcloudapi.com 。
说话人注册接口用于注册一个指定音频,生成一个唯一的说话人id,后续可通过说话人验证接口验证其它音频和已有的说话人ID匹配度,注册时可指定说话人昵称,方便标识说话人ID, 说话人昵称可重复配置。
(注: 一个appid最多可以注册1000个说话人ID,一个说话人ID仅支持一条音频注册,后续可通过更新接口进行更新)
使用须知
支持的输入格式:编码文件(PCM, WAV)、16 bit采样位数、单声道(mono)。
支持的音频采样率:16000 Hz。
默认接口请求频率限制:20次/秒。
推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。
2. 输入参数
以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数。
参数名称 | 必选 | 类型 | 描述 |
---|---|---|---|
Action | 是 | String | 公共参数,本接口取值:VoicePrintEnroll。 |
Version | 是 | String | 公共参数,本接口取值:2019-06-14。 |
Region | 否 | String | 公共参数,此参数为可选参数。 |
VoiceFormat | 是 | Integer | 音频格式 0: pcm, 1: wav 示例值:0 |
SampleRate | 是 | Integer | 音频采样率,目前支持16000,单位:Hz,必填 示例值:16000 |
Data | 是 | String | 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M |
SpeakerNick | 否 | String | 说话人昵称 不超过32字节 示例值:小明 |
GroupId | 否 | String | 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符 |
3. 输出参数
参数名称 | 类型 | 描述 |
---|---|---|
Data | VoicePrintBaseData | 说话人基本数据 |
RequestId | String | 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。 |
4. 示例
示例1 注册说话人
通过一段音频数据进行说话人注册
输入示例
POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: VoicePrintEnroll
<公共请求参数>
{
"VoiceFormat": 0,
"SampleRate": 16000,
"SpeakerNick": "abc",
"Data": "abc"
}
输出示例
{
"Response": {
"Data": {
"VoicePrintId": "abc",
"SpeakerNick": "abc"
},
"RequestId": "abc"
}
}
5. 开发者资源
腾讯云 API 平台
腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。
API Inspector
用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。
SDK
云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。
- Tencent Cloud SDK 3.0 for Python: GitHub Gitee
- Tencent Cloud SDK 3.0 for Java: GitHub Gitee
- Tencent Cloud SDK 3.0 for PHP: GitHub Gitee
- Tencent Cloud SDK 3.0 for Go: GitHub Gitee
- Tencent Cloud SDK 3.0 for Node.js: GitHub Gitee
- Tencent Cloud SDK 3.0 for .NET: GitHub Gitee
- Tencent Cloud SDK 3.0 for C++: GitHub Gitee
- Tencent Cloud SDK 3.0 for Ruby: GitHub Gitee
命令行工具
6. 错误码
以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码。
错误码 | 描述 |
---|---|
FailedOperation.NotExistentVoicePrintId | 不存在的说话人id |
InternalError | 内部错误。 |
InternalError.ErrorRecognize | 识别失败。 |
InternalError.FailAccessDatabase | 访问数据库失败。 |
InternalError.FailedVoicePrintDecode | 说话人音频解码失败 |
InternalError.FailedVoicePrintEnroll | 说话人注册接口失败 |
InternalError.VoicePrintAudioFailed | 说话人音频处理失败 |
InternalError.VoicePrintDecodeFailed | 传入音频解码失败 |
InternalError.VoicePrintEnrollFailed | 说话人ID注册失败 |
InternalError.VoicePrintVerifyFailed | 说话人验证失败 |
InvalidParameter | 参数错误。 |
InvalidParameterValue.ErrorVoicedataTooLong | 音频时长超过限制。 |
InvalidParameterValue.NoHumanVoice | 音频内容没有人声或有效人声小于1秒 |
LimitExceeded.VoicePrintFull | 说话人ID创建数量达到上限 |
MissingParameter | 缺少参数错误。 |