作为一个创始工作, 我们会展现NLP的技术, 数据源以及可以利用的众包来建立这样一个关于电子商务的面向任务的对话系统....为了解决这些问题, 我们的工作专注于三种类型的数据(对于电子商务web服务是共通的, 同时是易于爬取获得的):
产品知识库(结构化存储的产品信息)
搜索日志(产品, 自然语言查询和用户选择的行为)
社交网站..., 以及带有标记的意图短语
特别地, 三种状态相关的意图也被考虑进来:
添加过滤条件
添加多个过滤条件使得对话成为多轮的对话系统
查看更多
意味着用户想查看更多商品, 比如"其他的", "下一个...产品类别检测
在这个环节中, 我们将产品类别检测看作是一个多分类的问题, 给定一个带有购买意图的用户言语, 产品类别检测的目的就是预测出用户说的东西的类别, 这东西的用处在于缩小预测的范围, 利用预先检测出来的类别来从浩瀚的产品库中选取一部分子集...给定用户话语的一个产品类型的后验概率, 通过一个softmax函数, 基于相似性分数来进行计算, 模型用来最大化正确匹配话语和产品类型的似然性, 这里使用随机梯度下降
6.