说话人注册

最近更新时间:2024-06-25 01:07:54

我的收藏

1. 接口描述

接口请求域名: asr.tencentcloudapi.com 。

说话人注册接口用于注册一个指定音频,生成一个唯一的说话人id,后续可通过说话人验证接口验证其它音频和已有的说话人ID匹配度,注册时可指定说话人昵称,方便标识说话人ID, 说话人昵称可重复配置。
(注: 一个appid最多可以注册1000个说话人ID,一个说话人ID仅支持一条音频注册,后续可通过更新接口进行更新)

使用须知
支持的输入格式:编码文件(PCM, WAV)、16 bit采样位数、单声道(mono)。

支持的音频采样率:16000 Hz。

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:VoicePrintEnroll。
Version String 公共参数,本接口取值:2019-06-14。
Region String 公共参数,此参数为可选参数。
VoiceFormat Integer 音频格式 0: pcm, 1: wav
示例值:0
SampleRate Integer 音频采样率,目前支持16000,单位:Hz,必填
示例值:16000
Data String 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
SpeakerNick String 说话人昵称 不超过32字节
示例值:小明
GroupId String 分组id, 仅支持大小写字母和下划线的组合,不超过128个字符

3. 输出参数

参数名称 类型 描述
Data VoicePrintBaseData 说话人基本数据
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 注册说话人

通过一段音频数据进行说话人注册

输入示例

POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: VoicePrintEnroll
<公共请求参数>

{
    "VoiceFormat": 0,
    "SampleRate": 16000,
    "SpeakerNick": "abc",
    "Data": "abc"
}

输出示例

{
    "Response": {
        "Data": {
            "VoicePrintId": "abc",
            "SpeakerNick": "abc"
        },
        "RequestId": "abc"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
FailedOperation.NotExistentVoicePrintId 不存在的说话人id
InternalError 内部错误。
InternalError.ErrorRecognize 识别失败。
InternalError.FailAccessDatabase 访问数据库失败。
InternalError.FailedVoicePrintDecode 说话人音频解码失败
InternalError.FailedVoicePrintEnroll 说话人注册接口失败
InternalError.VoicePrintAudioFailed 说话人音频处理失败
InternalError.VoicePrintDecodeFailed 传入音频解码失败
InternalError.VoicePrintEnrollFailed 说话人ID注册失败
InternalError.VoicePrintVerifyFailed 说话人验证失败
InvalidParameter 参数错误。
InvalidParameterValue.ErrorVoicedataTooLong 音频时长超过限制。
InvalidParameterValue.NoHumanVoice 音频内容没有人声或有效人声小于1秒
LimitExceeded.VoicePrintFull 说话人ID创建数量达到上限
MissingParameter 缺少参数错误。