6月8日,由中国人工智能产业发展联盟(AIIA)、上海临港地区开发建设管理管委会、上海临港科技创业中心联合举办“2018年人工智能产业发展峰会暨中国人工智能产业发展联盟信息与创新中心揭牌仪式”活动正式启幕。
达观数据作为中国人工智能产业发展联盟成员,副总裁贾学锋在人工智能峰会高峰论坛上进行了“人工智能与文字阅读理解”的主题演讲,介绍了人工智能与文本智能处理的应用现状与未来应用前景。
自然语言处理技术的发展成熟,在所以很多行业中,越来越多的基础性的文字处理工作可交给计算机完成,即降低的企业的成本,提高了工作效率,也让劳动力释放出来,做更多有创造性和有价值的工作。
在随后的圆桌论坛环节中,结合达观数据服务的具体案例,谈及了文档智能处理在落地过程中与各大企业深入结合经验。
贾学锋介绍,和人的阅读速度相比,计算机的阅读速度是人的五百倍。一个人看完一份文件、新闻、报告或小说,人最后能记住的信息非常少,但是计算机能记住每一个字。
在强大的运算能力和记忆能力的基础上,随着深度神经网络技术的发展和成熟,让计算机真正的具备了阅读理解的能力。和人的学习方式类似,人通过字、词、段落、文章的学习来掌握文字规律,计算机也同样通过阅读海量的文本内容,从中总结规律,建立算法模型,在使用中不断优化纠正错误,让自己越来越“聪明”。
计算机在进行阅读理解时,它是先理解每个词的意思,再理解每个句子的意思,最后再理解文章的意思。计算机可以瞬间对于字词进行切分,可以自动的分析出来,哪个是动词哪个是名词,哪个是形容词,哪个是副词。
文本智能处理在企业应用的价值无限
计算机进行文字处理的能力已经接近普通人的水平,在很多的应用场景里面它可以用来代替那些重复性的工作。
比如达观研发的文字校对系统,可以协助文字工作者进行文稿的校对;在达观数百亿语料积累和庞大的文本数据库中,结合机器学习与深度学习的算法,快速发现错字、别字和搭配错误等问题。
此外达观最受好评的产品—文档智能审阅系统,可以协助审计人员进行财务报表账目信息的抽取,商业票据关键信息识别、应标书信息自动导出、基金合同差异核对、投资报告项目信息自动提取等工作。
贾学锋介绍,目前企业在文本智能处理方面的应用还比较少,但未来文字处理中的一半的工作内容都将由计算机协助来完成。
人工智能在未来更像是一种工具,它需要一个具体落地的场景,如同在2000年初的互联网的发展,如今各个行业都离不开互联网。未来的人工智能也会渗透到各个行业中,成为行业发展和驱动的一部分。