随着互联网的形态从PC互联网向手机无线网和硬件物联网发展,人与智能设备的信息交互模式也发生了颠覆性改变。首先是输入模态的变化。传统的键盘鼠标正在被触感、语音、图像等模态的自然输入方式逐渐替代。从复杂语义信息传输的角度看,语音具有得天独厚的优势,是未来人机信息交互的核心入口。其次是用户获取信息习惯的变化。移动环境下的信息搜索行为呈现碎片化、本地化、个性化、情境化等特点,信息获取的目的性更强,使得基于理解的“对话交互式”信息获取成为新兴的语言处理关键技术。这两个趋势也使得以语音为主要通道的“对话智能”成为人工智能研究的新兴问题。
对话智能是人工智能技术的集中体现,目前尚无公认可行的通用处理框架理论。从语义结构化和交互方式角度来说,人机对话大体有三种主要类型。
1. 问答。这类对话一般有两大特点,一是单轮为主,对话模式是一问一答,不涉及复杂的对话上下文;二是语义非结构化,很难用预定义的本体和语义槽来表达整个对话任务。问答往往涉及到非结构化的知识表达、搜索以及在回答中的匹配。问答的目的在于完成任务和提取知识点,有非常明确的信息需求。
2. 聊天。聊天一般是娱乐或消磨时间,没有实用性的明确目的。这类对话通常是多轮交互,上下文相关,语义也是非结构化的。
3. 任务型对话。任务型对话系统针对具体的应用领域,具有比较清晰的业务语义单元定义、本体结构以及用户目标范畴,例如航班信息查询、电影搜索、设备控制等等。这类交互是以完成特定的操作任务为交互目标。此外,任务型对话绝大部分都是多轮的,需要结合对话上下文进行用户意图理解。
三种对话系统的应用场景、工程架构及核心技术不尽相同。“对话智能”本质上应该是上述三种类型对话的有机组合。
领取专属 10元无门槛券
私享最新 技术干货