1. 接口描述
接口请求域名: mps.tencentcloudapi.com 。
同步接口,返回语音识别结果
默认接口请求频率限制:5次/秒。
推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。
2. 输入参数
以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数。
| 参数名称 | 必选 | 类型 | 描述 |
|---|---|---|---|
| Action | 是 | String | 公共参数,本接口取值:RecognizeAudio。 |
| Version | 是 | String | 公共参数,本接口取值:2019-06-12。 |
| Region | 否 | String | 公共参数,本接口不需要传递此参数。 |
| AudioData | 是 | String | base64编码的音频数据 示例值:KwDn/zIA5v///wUA0v8D |
| Source | 否 | String | 识别目标语言,为空默认 auto 自动识别语种。 注:如果自动识别语种识别效果不佳,可以指定语种提高准确率 当前支持语言: auto: 自动识别 zh: 简体中文 en: 英语 ja: 日语 ko: 韩语 vi: 越南语 ms: 马来语 id: 印度尼西亚语 fil: 菲律宾语 th: 泰语 pt: 葡萄牙语 tr: 土耳其语 ar: 阿拉伯语 es: 西班牙语 hi: 印地语 fr: 法语 de: 德语 it: 意大利语 yue: 粤语 ru: 俄语 af: 南非荷兰语 sq: 阿尔巴尼亚语 am: 阿姆哈拉语 hy: 亚美尼亚语 az: 阿塞拜疆语 eu: 巴斯克语 bn: 孟加拉语 bs: 波斯尼亚语 bg: 保加利亚语 my: 缅甸语 ca: 加泰罗尼亚语 hr: 克罗地亚语 cs: 捷克语 da: 丹麦语 nl: 荷兰语 et: 爱沙尼亚语 fi: 芬兰语 gl: 加利西亚语 ka: 格鲁吉亚语 el: 希腊语 gu: 古吉拉特语 iw: 希伯来语 hu: 匈牙利语 is: 冰岛语 jv: 爪哇语 kn: 卡纳达语 kk: 哈萨克语 km: 高棉语 rw: 卢旺达语 lo: 老挝语 lv: 拉脱维亚语 lt: 立陶宛语 mk: 马其顿语 ml: 马拉雅拉姆语 mr: 马拉地语 mn: 蒙古语 ne: 尼泊尔语 no: 博克马尔挪威语 fa: 波斯语 pl: 波兰语 ro: 罗马尼亚语 sr: 塞尔维亚语 si: 僧伽罗语 sk: 斯洛伐克语 sl: 斯洛文尼亚语 st: 南索托语 su: 巽他语 sw: 斯瓦希里语 sv: 瑞典语 ta: 泰米尔语 te: 泰卢固语 ts: 聪加语 uk: 乌克兰语 ur: 乌尔都语 uz: 乌兹别克语 ve: 文达语 xh: 科萨语 zu: 祖鲁语 示例值:zh |
| AudioFormat | 否 | String | 音频数据格式,默认为 pcm 支持的格式:pcm (16k 采样率的单声道 16 位采样 pcm 数据) 示例值:pcm |
| UserExtPara | 否 | String | 扩展参数,默认不填,特殊需求使用 示例值:{"key":1} |
3. 输出参数
| 参数名称 | 类型 | 描述 |
|---|---|---|
| Text | String | 整段音频的识别结果 示例值:腾讯云,媒体处理 |
| AudioLength | Float | 音频长度,单位秒 示例值:4.1 |
| Sentence | Array of RecognizeAudioSentence | 分句的识别结果 |
| RequestId | String | 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。 |
4. 示例
示例1 RecognizeAudio
输入示例
POST / HTTP/1.1
Host: mps.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: RecognizeAudio
<公共请求参数>
{
"Source": "zh",
"AudioFormat": "pcm",
"AudioData": "KwDn/zIA5v///wUA0v8D"
}
输出示例
{
"RequestId": "f27f3866-3882-4c18-a4ac-3b3d83fd2f5a",
"Response": {
"AudioLength": 4.2,
"RequestId": "f27f3866-3882-4c18-a4ac-3b3d83fd2f5a",
"Sentence": [
{
"End": 3.59,
"Start": 0.03,
"Text": "在人民大会堂举行第三次和第四次会议。",
"WordsInfo": [
{
"End": 0.27,
"Start": 0.03,
"Word": "在"
},
{
"End": 0.43,
"Start": 0.27,
"Word": "人"
},
{
"End": 0.51,
"Start": 0.43,
"Word": "民"
},
{
"End": 0.71,
"Start": 0.51,
"Word": "大"
},
{
"End": 0.91,
"Start": 0.71,
"Word": "会"
},
{
"End": 1.07,
"Start": 0.91,
"Word": "堂"
},
{
"End": 1.55,
"Start": 1.39,
"Word": "举"
},
{
"End": 1.71,
"Start": 1.55,
"Word": "行"
},
{
"End": 1.95,
"Start": 1.75,
"Word": "第"
},
{
"End": 2.15,
"Start": 1.95,
"Word": "三"
},
{
"End": 2.39,
"Start": 2.15,
"Word": "次"
},
{
"End": 2.75,
"Start": 2.47,
"Word": "和"
},
{
"End": 2.91,
"Start": 2.75,
"Word": "第"
},
{
"End": 3.11,
"Start": 2.91,
"Word": "四"
},
{
"End": 3.27,
"Start": 3.11,
"Word": "次"
},
{
"End": 3.51,
"Start": 3.31,
"Word": "会"
},
{
"End": 3.59,
"Start": 3.51,
"Word": "议。"
}
]
}
],
"Text": "在人民大会堂举行第三次和第四次会议。"
}
}
5. 开发者资源
腾讯云 API 平台
腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。
API Inspector
用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。
SDK
云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。
- Tencent Cloud SDK 3.0 for Python: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for Java: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for PHP: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for Go: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for Node.js: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for .NET: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for C++: CNB, GitHub, Gitee
- Tencent Cloud SDK 3.0 for Ruby: CNB, GitHub, Gitee
命令行工具
6. 错误码
以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码。
| 错误码 | 描述 |
|---|---|
| InvalidParameterValue.AudioData | 音频数据不合法 |
| InvalidParameterValue.AudioDataTooLong | 音频数据过长 |
| InvalidParameterValue.AudioFormat | 音频数据格式不支持 |
| InvalidParameterValue.SourceLanguage | SourceLanguage参数错误 |
| ResourceNotFound.UserUnregister | 用户未注册。 |