自定义热词可显著提升语音识别对专有词汇的识别准确率,同音同调时会优先按权重较高的热词来识别。目前仅支持中文普通话、英语的热词配置。热词内容更新成功10分钟后生效。
注意事项
系统会结合热词的权重以及出现的频率来进行识别和替换,权重值越大且频率越低被命中的概率越高。
新建词库
1. 登录 云直播控制台,功能配置 > 直播字幕 > 自定义词库。
2. 单击新建词库,在弹窗中,您可以根据实际业务需求在创建热词词库页面填写配置项。
配置项 | 是否必填项 | 说明 |
词库名称 | 是 | 词库名称前缀固定为 "hotword",仅支持英文、数字 、_、- ,不超过30个字符。 |
直接导入 | 否 | 若您需要导入热词,可以手动开启直接导入热词的功能。单击“选择文件”,然后从您的计算机中选择要上传的文件。上传的文件请确保符合以下要求: 文件格式:TXT。 文件大小:100KB以内。 文件编码:UTF-8或GBK编码。 |
关键词 | 是 | 根据您的业务需求创建关键词。 多个热词用英文逗号分割,最多不超过128个; 通过 “|” 分割的词和权重,如:“腾讯云计算有限责任公司|10,张三|5,ASR test|1”,热词权重范围为1-10,热词权重值越大,被识别出来的概率越大; |
3. 单击确认,即可成功导入热词。
查看词库
在自定义热词库页面,单击左侧的您想要查看词库名称,在弹窗中查看已配置词库的详细信息。
词库的详细信息,包括词库名称、词库表 ID、最近更新时间、热词数量、热词、权重。
修改词库
1. 在自定义热词库页面,找到并选中您想要操作的词库,单击右侧的编辑,然后在弹窗中根据业务需求修改配置词库信息。
2. 单击确认即可保存当前模板,完成自定义词库的修改。
删除词库
1. 在自定义热词库页面,找到并选中您想要操作的词库,然后单击右侧的删除,即可删除该词库。
2. 单击删除后,会弹出删除确认提示框,单击确定即可删除自定义词库。