腾讯云释义(Tencent Cloud Explanation,TCEX)是一款为开发者提供的简单易用的内容解析工具。该工具集成了腾讯云光学字符识别(OCR)和腾讯云自然语言处理(NLP)能力,支持对文本进行分类、理解内容的情感、命名实体识别、合同关键信息抽取。开发者无需算法背景,通过在线标注,即可训练生成自定义的模型。
目前产品还处于公测阶段(免费)
命名实体识别:抽取文本中的实体内容,支持通过标注优化识别效果;
文本分类:分析文本所描述的内容,按照内容类目进行分类;
情感分类:理解文本中所表达的用户情绪,将情绪分成好、中、坏三类情绪;
合同关键信息抽取:抽取合同中核心主体信息,如甲方、乙方、数量、单价、金额等相关信息。 算法模型自训练
优化命名实体识别:提供在线标注工具,标注后可在通用命名实体识别算法基础上训练自定义模型,用于抽取内容中的关键信息。
登录控制台
https://console.cloud.tencent.com/tcex/
首先要点击开通腾讯云释义服务(当前免费),进入产品服务列表页面
(1)第一步:打开服务列表页,选择“创建服务”
(2)第二步:首先选择文件类型,可以是文本文件或是文档扫描件,支持word、txt、pdf、jpg、png等多种格式,再选择解析算法,例如“文本分类”和“合同关键信息抽取”, 算法可以根据需要自由组合,目前支持4种算法类型,共8种子分类,未来还将支持保单识别,法律文书识别等算法。选择完成后,输入服务名称,点击“确定”,完成创建。
(3)第三步:在“服务列表页”点击步骤2中创建的服务,进入服务详情,点击“上传”文本文件
(4)第四步:点击“开始解析”,等待1-2秒,右侧就会出现文本的解析结果,如下图所示
(5)第五步:如果想要对算法的识别结果进行优化,使其更加准确,满足自己业务的需求,可以对算法进一步训练,选择工具“命名实体标注”,点击“新增标注”
(6)第六步:填写“名称”,选择要关联的服务,填写标注标签,在标注详情页里面可以进一步添加和修改标签,最后选择“创建”
(7)第七步:进入标注详情页,上传要标注的文档,在内容展示框中划词,选中后会显示可以标注的标签,点击标签确定,就会新增一条标注记录。
您也可以选择创建词典,在添加词典内容包括标准词、同义词(可选)后,在文档标注页关联词典。该词典后面页会应用在对算法的训练过程中,用来优化算法的效果。
(8)第八步:回到文档标注列表页,点击“编译”,启动算法编译。算法编译完成后,会自动替换服务里的算法,在下次“解析文档”的时候就会使用到新的算法,看到效果的变化。
(9)第九步:在服务“发布管理”页面,您可以选择将你训练调试完,认为效果理想的算法发布上线,除了可以腾讯云控制台页面使用算法,您也可以通过API接口调用发布上线的服务。
腾讯云释义产品API接口:https://cloud.tencent.com/document/api/1266/48990
(10)第十步:选择控制台“运行数据”,可以查看到您的线上服务数和调用量情况。
好了,以上就是关于腾讯云释义产品的最佳实践,只能说产品设计的非常简单好用,比起其他枯燥的算法训练平台,产品体验好太多,接口易用。依托腾讯云NLP自然语言处理团队强大的算法能力,未来腾讯云释义产品一定会
越来越好,为云客户提供更加简单强大的文档处理能力,助力企业的数字化办公转型。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。