腾讯云语音识别(ASR,Automatic Speech Recognition)产品除了适用于通用场景外,在多个垂类场景(如:智能外呼、法庭、游戏、医疗、教育、直播等)进行了大量训练,能够满足不同业务的识别需求,腾讯云语音识别所提供的多套模型的识别性能得到内外部用户的一致认可。
对于部分特殊的业务场景,尤其是原创用语、创新用语、新热度词句、生僻用语组合等可能影响识别性能的情况,我们提供了 热词 和 自学习定制模型 两种方案,供客户自助对此类特殊场景进行 ASR 优化,在短时间内即可实现 ASR 识别性能的提升。
功能优势
腾讯云语音识别在语音行业多年的沉淀,使语音识别模型具备极佳的泛化能力,因此可以支持客户从词级别和句段级别自行进行引擎优化,从而有效提高单个垂类场景的识别性能。
功能介绍
热词和自学习定制模型虽然都有助于提升 ASR 识别准确率,但在优化维度、适用场景、生效方式等方面有区别,客户可根据自己的业务需要选择更适合的方案对 ASR 性能进行优化。选择合适的优化方案能够极大提升 ASR 识别准确率,也可以根据业务情况同时启用两种方案。
如需了解使用详情,可单击下方链接进入对应页面进行查看。
功能名称 | 优化维度 | 适用场景 | 适用的基础产品和模型 | 生效方式 | 生效时间 |
字、词级别 | 如需对单独的短语(如:人名、地名、专有名词)进行优化,更适合使用热词方案 | 适用的基础产品: 录音文件识别 实时语音识别 一句话识别 语音流异步识别 适用模型: 所有中文普通话模型 所有英文模型 所有粤语模型 (包括含中文普通话、英文、粤语的混合模型) | 1. 可设置生效默认热词表,发起请求时自动生效默认热词表 2. 发起请求时传入指定的热词表 ID 生效 说明:每个请求只能生效1个热词表 ID,但不同的请求可以生效不同的热词表 ID | 即时生效 | |
句子、段落级别 | 如需对大段来自垂类场景的文本语料进行优化,更适合使用自学习定制模型方案 | | 发起请求时传入指定的自学习定制模型 ID 生效(需要传入上线中的 ID,每个账号最多同时上线10个) 说明:每个请求只能生效1个自学习定制模型 ID,但不同的请求可以生效不同的自学习定制模型 ID | 自训练后生效(根据语料长短不同,通常为分钟级) |
热词和自学习定制模型生效流程
热词生效流程
2. 产品后端服务将热词表配送至识别层(由后端服务完成,客户无感知)
3. 客户发起语音识别请求,并传入热词表 ID(如不传入热词表 ID,则生效默认热词表)
4. 识别层根据请求传入的热词表 ID 生效对应的热词表(由后端服务完成,客户无感知)
自学习定制模型生效流程
2. 自学习定制模型完成自训练,处于预上线状态,客户可自行选择需要上线的自学习定制模型(每个账号下最多可同时上线10个)
3. 产品后端服务将自学习定制模型配送至识别层(由后端服务完成,客户无感知)
4. 客户发起语音识别请求,并传入自学习定制模型 ID,且需要是已上线的自学习定制模型 ID
5. 识别层根据请求传入的自学习定制模型 ID 生效对应的模型(由后端服务完成,客户无感知)