词库包括术语库与热词库两种类别,其中术语库用于辅助跨语种翻译场景下的特定词汇(如产品名称、歧义词、外来词等)的翻译规则,确保翻译准确性;热词库则通过添加并设置权重,显著提升语音识别对专有词汇(如品牌、技术名词等)的识别准确率,当同音同调时将优先匹配高权重热词,助力字幕&同传生成更精准、专业。
注意事项
系统会结合热词的权重以及出现的频率来进行识别和替换,权重值越大且频率越低被命中的概率越高。
目前词库只支持中文、英文的配置,词库内容更新成功10分钟后生效。
术语词库可对客户在特定领域的术语进行翻译。
新建词库
1. 登录 云直播控制台,选择 功能配置 > AI 智能 > 字幕&同传 ,然后单击管理词库。

2. 单击新建词库。

3. 在弹窗中,您可以根据业务需求在创建热词词库页面填写配置项。类别:默认热词词库(可选术语词库)。详细配置请参考以下列表。

配置项 | 说明 |
类别 | 热词词库:同音同调时优先按权重较高的热词来识别。 |
词库名称 | 词库名称前缀固定为 "hotword",仅支持英文、数字 、_、-,不超过30个字符。 |
描述 | 仅支持中文、英文、数字、空格、 _、-描述不能超过100个字符。 |
直接导入 | 若您需要导入热词,可以手动开启直接导入热词的功能。单击“选择文件”,然后从您的计算机中选择要上传的文件。上传的文件请确保符合以下要求: 文件格式:TXT。 文件大小:100KB以内。 文件编码:UTF-8或GBK编码。 |
关键词 | 根据您的业务需求创建关键词。 热词只能是汉字或英文,最长10个汉字或30个英文字符,不能包含标点和特殊字符。 多个热词用英文逗号分割,最多不超过1000个。 通过 “|” 分割词和权重,如:“腾讯云|10,语音识别|5,ASR|10”,热词权重范围为1-10,热词权重越大,被识别出来的概率越大。 |

配置项 | 说明 |
类别 | 术语词库:对客户在特定领域的术语进行翻译,纠正翻译结果。 |
词库名称 | 词库名称前缀固定为 "term",仅支持英文、数字 、_、-,不超过30个字符。 |
描述 | 仅支持中文、英文、数字、空格、 _、-描述不能超过100个字符。 |
语向 | 语言的转换方向: 支持 中文与英文之间的互译,包括以下两种转换方向: 1. 中文 → 英文 2. 英文 → 中文 |
是否双向 | 根据您的业务需求,可选择是否启用中英文双向互译功能。 选项:是/否(默认值为"是") |
直接导入 | 根据您的实际业务需求,您可以选择从计算机上传文件或使用常用词库功能。 选择文件 若您需要导入热词,可以手动开启直接导入热词的功能。单击“选择文件”,然后从您的计算机中选择要上传的文件。上传的文件请确保符合以下要求: 文件格式:TXT。 文件大小:100KB以内。 文件编码:UTF-8或GBK编码。 常用词库 可直接选用预设词库。 |
关键词 | 根据您的业务需求创建关键词。 多个术语用英文逗号分割,最多不超过150个。 通过英文“|” 分割源语言和翻译语言,如:“Tencent Cloud|腾讯云,ASR|语音识别,P&L|盈亏,API|API”。 术语中大小写敏感。 |
4. 单击确认,即可成功导入热词。
查看词库
1. 在 管理词库 页面,单击左侧的您想要查看的词库名称,在弹窗中查看已配置词库的详细信息。

2. 词库的详细信息,包括词库名称、词库表 ID、最近更新时间、热词数量、热词、权重、语向、翻译语言等。

修改词库
1. 在 管理词库 页面,找到并选中您想要操作的词库,单击右侧的编辑,然后在弹窗中根据业务需求修改配置词库信息。

2. 单击确认即可保存当前模板,完成自定义词库的修改。
删除词库
1. 在管理词库页面,找到并选中您想要操作的词库,然后单击右侧的删除,即可删除该词库。

2. 单击删除后,会弹出删除确认提示框,单击确定即可删除自定义词库。

