管理词库

最近更新时间:2025-12-18 18:07:31

我的收藏
词库包括术语库与热词库两种类别,其中术语库用于辅助跨语种翻译场景下的特定词汇(如产品名称、歧义词、外来词等)的翻译规则,确保翻译准确性;热词库则通过添加并设置权重,显著提升语音识别对专有词汇(如品牌、技术名词等)的识别准确率,当同音同调时将优先匹配高权重热词,助力字幕&同传生成更精准、专业。

注意事项

系统会结合热词的权重以及出现的频率来进行识别和替换,权重值越大且频率越低被命中的概率越高。
目前词库只支持中文、英文的配置,词库内容更新成功10分钟后生效。
术语词库可对客户在特定领域的术语进行翻译。

新建词库

1. 登录 云直播控制台,选择 功能配置 > AI 智能 > 字幕&同传 ,然后单击管理词库

2. 单击新建词库。

3. 在弹窗中,您可以根据业务需求在创建热词词库页面填写配置项。类别:默认热词词库(可选术语词库)详细配置请参考以下列表。
热词词库
术语词库

配置项
说明
类别
热词词库:同音同调时优先按权重较高的热词来识别。
词库名称
词库名称前缀固定为 "hotword",仅支持英文、数字、_、-,不超过30个字符。
描述
仅支持中文、英文、数字、空格、_、-
描述不能超过100个字符。
直接导入
若您需要导入热词,可以手动开启直接导入热词的功能。单击“选择文件”,然后从您的计算机中选择要上传的文件。上传的文件请确保符合以下要求:
文件格式:TXT。
文件大小:100KB以内。
文件编码:UTF-8或GBK编码。
关键词
根据您的业务需求创建关键词。
热词只能是汉字或英文,最长10个汉字或30个英文字符,不能包含标点和特殊字符。
多个热词用英文逗号分割,最多不超过1000个。
通过 “|” 分割词和权重,如:“腾讯云|10,语音识别|5,ASR|10”,热词权重范围为1-10,热词权重越大,被识别出来的概率越大。


配置项
说明
类别
术语词库:对客户在特定领域的术语进行翻译,纠正翻译结果。
词库名称
词库名称前缀固定为 "term",仅支持英文、数字、_、-,不超过30个字符。
描述
仅支持中文、英文、数字、空格、_、-
描述不能超过100个字符。
语向
​语言的转换方向:
支持 ​中文与英文之间的互译,包括以下两种转换方向:
1. ​中文 → 英文​
2. ​英文 → 中文
是否双向
根据您的业务需求,可选择是否启用中英文双向互译功能。
选项:是/否(默认值为"是")
直接导入
根据您的实际业务需求,您可以选择从计算机上传文件或使用常用词库功能。
选择文件
若您需要导入热词,可以手动开启直接导入热词的功能。单击“选择文件”,然后从您的计算机中选择要上传的文件。上传的文件请确保符合以下要求:
文件格式:TXT。
文件大小:100KB以内。
文件编码:UTF-8或GBK编码。
常用词库
可直接选用预设词库。
关键词
根据您的业务需求创建关键词。
多个术语用英文逗号分割,最多不超过150个。
通过英文“|” 分割源语言和翻译语言,如:“Tencent Cloud|腾讯云,ASR|语音识别,P&L|盈亏,API|API”。
术语中大小写敏感。
4. 单击确认,即可成功导入热词。

查看词库

1. 管理词库 页面,单击左侧的您想要查看的词库名称,在弹窗中查看已配置词库的详细信息。

2. 词库的详细信息,包括词库名称、词库表 ID、最近更新时间、热词数量、热词、权重、语向、翻译语言等。


修改词库

1. 管理词库 页面,找到并选中您想要操作的词库,单击右侧的编辑,然后在弹窗中根据业务需求修改配置词库信息。

2. 单击确认即可保存当前模板,完成自定义词库的修改。

删除词库

1. 管理词库页面,找到并选中您想要操作的词库,然后单击右侧的删除,即可删除该词库。

2. 单击删除后,会弹出删除确认提示框,单击确定即可删除自定义词库