近日,国际自然语言处理领域的权威学术会议“国际计算语言学协会年会”(ACL 2020)公布了今年大会论文录用结果,本届大会共收到3429篇投稿论文,投稿数量创下新高。小i机器人联合华东师范大学发表的论文《基于槽注意力机制和信息共享的对话状态追踪方法(Dialogue State Tracking via Slot Attention and Slot Information Sharing, SAS)》成功入选。
关于ACL
ACL年会是计算语言学和自然语言处理领域最重要的顶级国际会议,被CCF与清华均列为顶级A类会议,由计算语言学协会主办,每年举办一次。其接收的论文覆盖了对话交互系统、语义分析、摘要生成、信息抽取、问答系统、文本挖掘、机器翻译、语篇语用学、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。
关于入选论文
如何解决多轮复杂对话上的状态追踪问题,一直是自然语言处理领域研究的难点。本篇论文聚焦基于槽注意力机制和信息共享的对话状态追踪方法(Dialogue State Tracking via Slot Attention and Slot Information Sharing, SAS),进一步验证了 SAS在对话状态追踪任务上优于其他方法,那么具体是如何做到的呢?
什么是对话状态追踪?
所谓对话状态追踪,就是指每回合从对话中捕捉用户对话状态的任务,而这些对话状态往往以槽值对的形式表示,它们代表了用户每回合的需求。由于用户的需求往往分布在一场对话中的各个回合,而多轮回合间信息的保留一直是自然语言处理领域的难点,对话状态追踪任务目前还存在着不少挑战。随着任务式对话状态系统应用领域从单领域扩展为多领域,解决多轮复杂对话上的状态追踪问题越发重要。
对话状态追踪日渐成为研究热点
目前,任务式对话系统以其广泛的应用性得到了各大科技公司的青睐,不少机构纷纷展开了对其的研究。任务式对话系统与以娱乐为目标的聊天对话系统不同,它需要为用户完成某种特定的任务,比如订餐、旅游安排、天气预报等。作为任务式对话系统的关键组件,对话状态追踪器的性能大大影响了对话系统的最终效果。因此,对话状态追踪任务已经成为了一个研究热点。
目前业内针对任务式对话状态追踪已有一些方法。例如用表示学习技术进行对话状态追踪的NBT模型、用global-local编码器捕捉槽和全局特征的GLAD模型、将对话状态追踪任务建模成文本生成任务,并引入pointer-generator结构的TRADE等……这些方法虽然有效地改善任务式对话状态追踪的性能,但长对话、复杂多领域对话上追踪效果不足的问题仍存在,而这些问题正是此次论文要解决的问题。此外,由于不同槽间存在着一定关联性,将这些信息利用起来也有助于帮助对话状态追踪。
SAS的优势
在本篇论文中提出的SAS(Slot Attention and Slot Information Sharing)由两部分构成。第一部分,用槽注意力从历史记录中抽取各个槽所需的关键信息;第二部分,将关键信息根据各个槽的关联性进行信息重组与共享。其中,第二部分有两种不同的实现方法,分别是基于超参数的信息共享和基于k-means的信息共享。SAS 利用注意力机制为独立的每个槽从多轮长对话中提取出最有价值的特征,从而避免不相干槽的冗余信息对目标槽的干扰。其次,为了改善模型在数据不足的槽上的追踪效果,模型共享了关联槽上的信息。在多领域和单领域数据集上的实验结果验证了 SAS在对话状态追踪任务上优于其他方法。
深耕认知智能19年,展示超强技术积累
小i机器人自2001年成立以来,就专注于以自然语言处理为基础的认知智能相关技术的自主研发和商业落地。此次联合论文入选ACL 2020,是继今年小i机器人与加州大学戴维斯分校联合论文入选AAAI 2020后,再次被国际顶级会议录用,展示出了小i机器人超强的技术积累实力。除此之外,小i机器人“智能客服系统(iBot)”日前也被工信部纳入“新一代人工智能工业创新重点任务入围揭榜单位”,进一步印证了小i机器人在智能交互领域强大的研发和技术实力。
未来,小i机器人也会将先进的认知智能技术与产业应用相融合,赋能产业发展,用认知智能技术探索人工智能的无限可能。
领取专属 10元无门槛券
私享最新 技术干货