识别音频

最近更新时间:2025-12-26 01:39:40

我的收藏

1. 接口描述

接口请求域名: mps.tencentcloudapi.com 。

同步接口,返回语音识别结果

默认接口请求频率限制:5次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:RecognizeAudio。
Version String 公共参数,本接口取值:2019-06-12。
Region String 公共参数,本接口不需要传递此参数。
AudioData String base64编码的音频数据
示例值:KwDn/zIA5v///wUA0v8D
Source String 识别目标语言,为空默认 auto 自动识别语种。
注:如果自动识别语种识别效果不佳,可以指定语种提高准确率

当前支持语言:
auto: 自动识别
zh: 简体中文
en: 英语
ja: 日语
ko: 韩语
vi: 越南语
ms: 马来语
id: 印度尼西亚语
fil: 菲律宾语
th: 泰语
pt: 葡萄牙语
tr: 土耳其语
ar: 阿拉伯语
es: 西班牙语
hi: 印地语
fr: 法语
de: 德语
it: 意大利语
yue: 粤语
ru: 俄语
af: 南非荷兰语
sq: 阿尔巴尼亚语
am: 阿姆哈拉语
hy: 亚美尼亚语
az: 阿塞拜疆语
eu: 巴斯克语
bn: 孟加拉语
bs: 波斯尼亚语
bg: 保加利亚语
my: 缅甸语
ca: 加泰罗尼亚语
hr: 克罗地亚语
cs: 捷克语
da: 丹麦语
nl: 荷兰语
et: 爱沙尼亚语
fi: 芬兰语
gl: 加利西亚语
ka: 格鲁吉亚语
el: 希腊语
gu: 古吉拉特语
iw: 希伯来语
hu: 匈牙利语
is: 冰岛语
jv: 爪哇语
kn: 卡纳达语
kk: 哈萨克语
km: 高棉语
rw: 卢旺达语
lo: 老挝语
lv: 拉脱维亚语
lt: 立陶宛语
mk: 马其顿语
ml: 马拉雅拉姆语
mr: 马拉地语
mn: 蒙古语
ne: 尼泊尔语
no: 博克马尔挪威语
fa: 波斯语
pl: 波兰语
ro: 罗马尼亚语
sr: 塞尔维亚语
si: 僧伽罗语
sk: 斯洛伐克语
sl: 斯洛文尼亚语
st: 南索托语
su: 巽他语
sw: 斯瓦希里语
sv: 瑞典语
ta: 泰米尔语
te: 泰卢固语
ts: 聪加语
uk: 乌克兰语
ur: 乌尔都语
uz: 乌兹别克语
ve: 文达语
xh: 科萨语
zu: 祖鲁语

示例值:zh
AudioFormat String 音频数据格式,默认为 pcm

支持的格式:pcm (16k 采样率的单声道 16 位采样 pcm 数据)
示例值:pcm
UserExtPara String 扩展参数,默认不填,特殊需求使用
示例值:{"key":1}

3. 输出参数

参数名称 类型 描述
Text String 整段音频的识别结果
示例值:腾讯云,媒体处理
AudioLength Float 音频长度,单位秒
示例值:4.1
Sentence Array of RecognizeAudioSentence 分句的识别结果
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 RecognizeAudio

输入示例

POST / HTTP/1.1
Host: mps.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: RecognizeAudio
<公共请求参数>

{
    "Source": "zh",
    "AudioFormat": "pcm",
    "AudioData": "KwDn/zIA5v///wUA0v8D"
}

输出示例

{
    "RequestId": "f27f3866-3882-4c18-a4ac-3b3d83fd2f5a",
    "Response": {
        "AudioLength": 4.2,
        "RequestId": "f27f3866-3882-4c18-a4ac-3b3d83fd2f5a",
        "Sentence": [
            {
                "End": 3.59,
                "Start": 0.03,
                "Text": "在人民大会堂举行第三次和第四次会议。",
                "WordsInfo": [
                    {
                        "End": 0.27,
                        "Start": 0.03,
                        "Word": "在"
                    },
                    {
                        "End": 0.43,
                        "Start": 0.27,
                        "Word": "人"
                    },
                    {
                        "End": 0.51,
                        "Start": 0.43,
                        "Word": "民"
                    },
                    {
                        "End": 0.71,
                        "Start": 0.51,
                        "Word": "大"
                    },
                    {
                        "End": 0.91,
                        "Start": 0.71,
                        "Word": "会"
                    },
                    {
                        "End": 1.07,
                        "Start": 0.91,
                        "Word": "堂"
                    },
                    {
                        "End": 1.55,
                        "Start": 1.39,
                        "Word": "举"
                    },
                    {
                        "End": 1.71,
                        "Start": 1.55,
                        "Word": "行"
                    },
                    {
                        "End": 1.95,
                        "Start": 1.75,
                        "Word": "第"
                    },
                    {
                        "End": 2.15,
                        "Start": 1.95,
                        "Word": "三"
                    },
                    {
                        "End": 2.39,
                        "Start": 2.15,
                        "Word": "次"
                    },
                    {
                        "End": 2.75,
                        "Start": 2.47,
                        "Word": "和"
                    },
                    {
                        "End": 2.91,
                        "Start": 2.75,
                        "Word": "第"
                    },
                    {
                        "End": 3.11,
                        "Start": 2.91,
                        "Word": "四"
                    },
                    {
                        "End": 3.27,
                        "Start": 3.11,
                        "Word": "次"
                    },
                    {
                        "End": 3.51,
                        "Start": 3.31,
                        "Word": "会"
                    },
                    {
                        "End": 3.59,
                        "Start": 3.51,
                        "Word": "议。"
                    }
                ]
            }
        ],
        "Text": "在人民大会堂举行第三次和第四次会议。"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
InvalidParameterValue.AudioData 音频数据不合法
InvalidParameterValue.AudioDataTooLong 音频数据过长
InvalidParameterValue.AudioFormat 音频数据格式不支持
InvalidParameterValue.SourceLanguage SourceLanguage参数错误
ResourceNotFound.UserUnregister 用户未注册。