首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么聊天机器人表现不尽如人意

策划编辑|Vincent

编译 孙浩

编辑|Emily

尽管聊天机器人在 NLP 上取得了巨大的进步,但它们最大的缺点是仍然需要添加语料脚本和人工辅助;我们可以认为它只不过是一个美化的 IVR,或者更极端的认为它只是一个基于搜索的查询而已。假如你的提问与语料脚本相差太远,你便会得到“我不懂这个问题”的回答。

《Facebook 虚拟助理 M 已死,这就是聊天机器人的现状》

要理解聊天机器人为什么会如此糟糕,你需要了解它们是如何构建的。

聊天机器人组件

步骤 1:决定你想让聊天机器人服务的场景,并收集所有相关的问题。每一个问题都定义了一个意图。所有这些意图都被构建到 NLP 引擎的树型结构中。

步骤 2:每个问题和意图都会根据用户可能的表达习惯,采用多种方式来表述。比如:用“山景城的天气”和“今天的天气有多冷”来查看天气。这些被称为歧义。所有的聊天机器人的歧义都被 NLP 引擎翻译成相应的意图。

步骤 3:最后,将聊天机器人语料脚本或者对话场景联系在一起。比如:假如你买了一件衬衫,那就输入性别,尺寸,颜色。如果你离开了这个话题,问了句“这件衬衫是用棉花做的吗?”,那你就不一定那么走运获得正确答案了。

聊天机器人之所以不尽如人意是因为所有这些步骤都存在着巨大的缺点。

聊天机器人存在的问题

要想在功能覆盖方面做得很好,就需要知道用户可能会问的所有问题。如果没有用户数据,就会遇到冷启动问题——使用一个功能有限的测试版聊天机器人。它将收集数据并学习,但这会让用户感到沮丧。不过很少有公司在一开始就有大量的数据。因此,绝大多数市面上的聊天机器人都是很普通的,它们的目标是随着时间的推移不断提升自身能力。

要把问题分类做得很好,你需要大量的问题,包括广泛的行业领域知识。例如:“上不了网”和“我的浏览器没有加载”一样。现在,这些歧义大多是人为造成的——除了减少用户问题的覆盖率之外,消除歧义这项工作可能是成本较高的了。规模化的自动创建这些歧义的新方法正在投入使用,尽管对于这种智能来说,还需要一些时间来获得领域的背景知识。

最后,要想在一个丰富的对话脚本中表现突出,聊天机器人需要捕捉用户想要跳转意图场景的所有方式,并通过回溯之前的选项,跳转到其他选项,并得到正确的回复答案。在不知道用户如何使用它的情况下,编写这样的脚本是很困难的,这是一个让用户无法避免的问题。

自学习和定制树有希望解决这些问题,同时极大地提升使用体验。

聊天机器人未来的发展所在

自学习:随着使用数据被捕获学习,聊天机器人会变得越来越好,它的反馈信息将用于人工扩展服务支持、歧义和脚本选项——这是一个缓慢而乏味的过程,但又不能扩大规模。所以,聊天机器人智能应该促进自我学习,这样它就能识别出用户想要的新功能、问题、歧义或脚本变化,并相应地调整体验。通过这种方式,它可以自动为 #1、#2 的变体添加问题 (和答案),并更改 #3 的脚本,以快速构建一个健壮的服务。

个性化:聊天机器人目前为止还没有提供超乎想象的个人体验。个性化与自学习有关,每个用户根据机器人的学习行为获得不同的脚本。这个机器人是一个自定义的实例,它可以使用你的数据自动调整,可以动态地更新所显示的语料脚本。在理想的情况下,每个人都有自己的个人机器人版本,类似于电影《她》中的萨曼莎。随着人工智能创新的步伐加快,2018 年将会带来更广泛的智能能力,从而在聊天机器人中实现更深入的个性化对话。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180128G0FJ3S00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券