首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

理解人类情感,AI绝不甘心当“人工智障”

关注 AIDaily 打开通向未来的第一入口

作者|小a

编辑|小a、仟亿

8月12日早晨,腾讯视频在报道第九号台风“利奇马”时,推送导语出现重大失误,忘记写明具体伤亡人数致使推送导语变成“全省伤亡”。虽然腾讯在第一时间进行了修改并道歉,但这种后知后觉的做法终究无法避免人为失误所造成的负面影响。

“人工智能 = 人工智障”、“人工最智能”等言论再次成为人们议论的焦点。

新闻快讯编辑推送是一项简单重复却又要求准确、快速的工作,依靠人工处理本身就带有不确定的风险,因此,在人工智能成为热门领域之后,机器编辑也是经常被提及的应用方向之一。

在AI编辑领域,腾讯、微软、今日头条都曾公布过相应的研究成果,马斯克倡导成立的OpenAI甚至还能根据提供的信息编写“假新闻”,成品甚至能以假乱真。

人工智能编写新闻本质上是在对自然语言理解的基础上对信息的再加工,这是NLP(自然语言处理)技术的表现之一。如今,“AI写新闻”早已不是什么新鲜事,但人类对NLP的研究却还有很大的进步空间。

情感理解是NLP技术的进阶

无论是腾讯、微软、今日头条还是其他投身AI领域的企业,“AI写新闻”只不过是小儿科。以微软小冰为例,编写新闻只是其诸多功能中占比很小的一项,与之相比,绘画、写诗、聊天交互才是微软小冰的核心能力,而这些核心能力也是NLP技术发展的主要方向,即“情感识别与解读”。也就是说,识别文字对技术来说并非难事,理解文字背后的喜怒哀乐才是难点所在。

对语义及其所表达的情感做出准确解读是NLP技术能够广泛商用的关键,语音交互是NLP技术应用的一个方向,与腾讯对此兴趣寥寥不同,百度在语音交互方面做了不少尝试。最新的成果是在开发者大会上公布了小度“全双工”模式,消灭唤醒词的做法让人机对话更接近于人与人对话的状态。

不过,AI对于语音的理解能力显然不如对文本的理解,后者传递的信息更为准确,通过对关键字的抓取,理解语义也更为容易。这也是为什么语音交互的应用场景更多的是局限在功能唤醒、信息搜索等方面,而对文本的处理却可以做到更多。

比如国美所使用的百度大脑NLP的情感倾向分析功能与评论观点抽取功能,这一功能是百度在自然语言情感理解方面的成功。这项功能可以实现对用户评论的自动分析和处理,凭借较高的准确率,国美目前客服运营人力需求从一天5人降低到3人,负面问题处理率从60%飙升至100%,售后差评率降低7%。

据悉,这项功能的实现需要AI系统准确理解用户的评价,并确定用户的评价所表现的主观情绪(正面/负面),同时以抽取关键词等简洁的方式将结果呈现给后台管理人员。在上述的应用场景中,发挥作用的百度大脑NPL能力的情感倾向分析,可以为口碑分析、话题监控、舆情分析等应用场景提供基础技术支持,同时支持用户自行定制模型效果。

这项能力算的上AI技术的一大进步,情感一直是AI研究过程中一个比较模糊的部分,数据可以量化,参数可以调整,唯独情感很难模拟出来的。通过对自然语义的解读抽离出其中的情感成分,对于优化人机交互的优化会起到比较大的作用。

要实现这种情感解读其实并不简单,神经网络和词向量是其实现的基础,所谓词向量,就是用连续、稠密的向量去表示这个词,从而使其具有更多更丰富的信息。当对文本进行情感分析时,将这个词的多个向量放置到特殊网络(循环伸经网络等)中,以此计算出积极情感和消极情感的概率。

而对这套神经网络的训练不能简单的依靠标注的语料,不仅不经济而且还有可能不准确,因此,可以选择将系统分割为两个部分,只选取一部分按照传统方式训练,这样就可以减少数据训练,更多的是通过预知网络和预训练模型完成。

文本处理仍有可拓展的空间

实际上,上述功能依然是聚焦在AI对词的理解,但在处理大量文本时句意的理解更加重要。谷歌曾经推出过一个基于英文语言系统的模型,即抽取文本中的单词去构造模型从而实现对文本的理解。不过,具体到中文语境中,词的属性和含义都与英文有很大的区别。

以目前的技术发展来看,AI写简讯只能算是AI文本理解的入门任务,真正的难点在于为文本的整体理解,其具体的应用场景包括文本审核、创作、分类等等。简而言之,需要功能更为细化。

事实上,很多与信息、内容更近的企业都在尝试依靠AI代替一部分人工对内容进行审核,这其中的客观原因在于互联网和移动设备的普及导致的信息爆炸,平台分发信息的压力远高于之前。

今日头条、百度都在做这方面的尝试,尤其是百度,依靠在AI技术方面的积累,除自用以外也在为外部厂商提供相应的解决方案,与纵横文学的合作就是其中之一。

纵横文学主要接入了百度大脑NLP文本审核功能,机器代替人工审核后,速度从每人每天60万字提升到600万字,只需要两个人就可以完成对风险内容和问题章节的处理。纵横文学产品总监张皓表示,百度大脑NLP文本审核的优点在于词库、审核力度、监控维度都可以自定义,对内容平台管理而言相当灵活。

这项功能包含在百度大脑一个大的框架下,官方称之为“可持续学习语义理解框架ERNIE 2.0”,实际上是在上述谷歌的模型中加了一层transfer的模型,该模型可以记录整个句子,因此可以保存更为复杂的信息。目前,这个模型已经学习了十几亿的数据。

百度大脑针对语义理解开发过多个模型,包括语义表示模型以及篇章分析模型,后者就是对长文本理解、标注、创作的关键。该模型包含四个关键点,分别为:要素识别、篇章关系、篇章关注点图谱、文本语义理解。

这四点环环相扣,第一点可以识别篇章的主体内容,第二点抽离文章中要素之间的关系,第三点是对内容打标签,以此可以实现个性推荐。最后一点是整个模型的核心,上层是知识数据,以此可以判断出篇章中的核心信息。

此外,篇章分析模型中还包括文本生成,所谓生成,就是抽离篇章的核心内容,稍作修改生成摘要,类似于AI写新闻。

在2018年百度世界大会时,百度就曾公布过由百度大脑开发的智能创作平台,分为自动创作和辅助创作两部分。改版后的创作平台已经可以实现热点发现、热词分析、用词润色、标题生成、多模态创作、文本审核、文章分类、文章标签等工能。

这些功能的实现正来自于上述模型所构建的技术框架,其中,自动创作技术和标题生成是其能力的延伸。

目前,除纵横网以外,央视网也在使用以百度NLP技术为基础的自动文摘、文本挖掘(文本分类)、信息检索等功能。

文本理解只是AI发展的一个阶段,对文本的剖析也将使Ai更加准确的理解文字背后的情感。现阶段,或许我们只需要让AI更懂文字就能很好的让技术服务于各个方面,真正理解人类的喜怒哀乐仍然需要技术的积累。

但AI真正理解人类喜怒哀乐的这一天如果真的到来了,不知道人类是应该“喜乐”还是应该“哀怒”呢?

想要了解未来究竟如何发展?我们将持续关注,您只需:

关注AIDaily 打开通向未来的第一入口……

关注 AIDaily

打开通向未来的第一入口

虚位以待……

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190814A0E5EG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券