随着人工智能和LBS的发展,语音助手从与用户的交互过程中获取语音发言环境,地理数据,和某些位置的声学环境进而从特定的位置做出典型的查询成为现实。
文|张壮壮
校对|诗诗
图源|网络
集微网消息,据权威市场调研机构数据显示,在中国智能手机在手机中的销量占比高达96%了,同样在美国也达到了96%。而在众多的智能手机中,必带的一款系统软件便是语音助手了,相信已经有很多朋友已经使用过这款软件了。
早期的智能手机上的语音助手只是简单的进行语音识别和简单的系统知识搜索的程序,而不具有利用从一个用户到另一个用户的信息来改进来自新的和现有用户的新的查询的质量和准确度的技术。
随着人工智能和LBS(基于位置的服务)的发展,语音助手从与用户的交互过程中获取语音发言环境,地理数据,和某些位置的声学环境进而从特定的位置做出典型的查询成为现实。
语音助手的这个结合特定的位置去对用户的语言进行意图理解的这一过程叫做基于位置的会话理解,最常用的是向语音助手发出推荐附近好吃好玩的语言请求了。
系统提供外部接口(语音助手软件)以接收外部查询,根据查询的位置信息查询系统中的环境上下文数据库是否已经有此上下文,如果数据库存有同种环境上下文,系统可以根据环境上下文使用语言模型将语言查询转化为文本,进而进行后续的文本查找操作,最后提供一个查询结果给用户。
当数据库中不存在此查询位置的环境上下文时,如何生成与该查询相关联的环境上下文是该技术的重点。
相关联的环境上下文,主要包括将识别的声学干扰和所识别的主题与查询时的位置关联起来,以及将识别的声学干扰和所识别的主题和查询时的位置信息都存储在上下文数据库中。其中所说的声学干扰的工作就是分析查询的音频以及识别查询音频中的背景噪声。
其中查询时的位置信息是全球定位系统GPS坐标或与使用的用户相关联的区域代码或是邮政编码或是地标的接近度。比如说将一个背景声音(列车汽笛)存在与给定位置(火车站GPS坐标)相关联构成了一个环境上下文。
具体的实现是根据查询的音频系统标识出声学干扰,根据声学干扰系统进而标识出查询的主题,最后与查询的位置信息进行关联创建出一个新的上下文环境,并将它插入到上下文数据库中,以供后续查询使用。
接下来就是系统进行查询转化和反馈的过程了。
至此,小编的基于位置的会话理解对的专利解析就告一段落了,如果想了解更多专利方面的知识,请多多关注我们吧!
END
领取专属 10元无门槛券
私享最新 技术干货