智能语音机器人系统的总体架构分为三层,分别包括:
1-服务管理层
2-智能业务层
3-基础任务执行层
其中智能业务层是整个系统的核心部分,如下图所示。
下面分别对各层主要模块功能进行介绍:
Ø 服务管理层
服务管理层在智能语音机器人系统上为企业提供丰富的增值服务,包括业务开发管理服务、服务监控服务。业务开发管理服务为业务人员提供业务编辑的管理界面,方便其对业务流程进行编辑,如业务人员可以通过话术编辑和组件拖拽的方式构建电话呼叫对话流程图。服务监控服务则主要针对语义解析引擎当前配置信息的管理与设置,实时对系统的运行数据进行统计分析。
Ø 智能业务层
智能业务层是智能语音机器人系统的核心层,是系统具备机器智能呼叫/接听功能的关键所在,包括业务流程对话管理以及语义解析引擎两大模块。业务流程对话管理又包括业务解析和对话管理子模块。业务解析子模块实现对本地业务脚本文件或业务开发管理服务提供的业务流程图的加载;对话管理子模块则是根据加载的业务流程完成其描述的对话流程,该过程需要调用语义解析引擎进行语义解析。语义解析引擎同样包括意图识别和智能问答两个子模块,分别实现用户意图的识别以及智能问答的功能。
Ø 基础任务执行层
基础任务执行层主要包括传统的呼叫中心的各个模块,同时增加了语音处理功能,主要包括呼叫中心ACD、MS媒体服务模块以及语音处理模块。基础任务执行层主要负责呼叫的分发、与智能业务层的交互,调度MS媒体服务模块完成放音、收号、录音、ASR、TTS等的控制。
介绍完智能语音机器人系统的总体架构和各层的主要功能后,接着分析在智能语音对话流程的各个主要模块交互时序流程(以呼入为例),如图2所示:
主要流程为:
1-客户拨打电话给智能语音客服。
2-智能语音客服接听电话后,呼叫中心平台调用业务流程管理接口,启动并初始化对话流程状态图。
3-业务对话流程管理模块初始化对话流程状态图后,发送开场白话术给呼叫中心。
4-呼叫中心平台接收到开场白话术,根据配置选择进行TTS语音合成或者直接播放录制好的录音,并进行放音操作通知用户。
5-客户收到开场白语音后同样做出相应的语音回复,开始进行对话流程。
6-呼叫中心平台收到用户的回复语音后通过MRCP协议调用ASR服务进行语音识别。
7-呼叫中心收到ASR返回的文字结果后,通过HTTP协议调用业务流程对话管理接口进行对话状态更新。
8-业务流程对话管理接收到呼叫中心传来的请求信息后,调用语义解析模块进行语义解析,并根据语义解析的结果选择话术返回给呼叫中心平台并更新对话状态。
9-呼叫中心收到当前话术,根据配置选择进行TTS语音合成或者直接播放录制好的录音,并进行放音操作通知客户。
10-根据配置好的业务流程状态图,重复6-9步骤,直至呼叫对话流程结束。
11-业务对话流程结束后,呼叫中心通知ASR服务结束当前的语音转写时间请求。最终通知业务流程对话管理模块挂机操作,并向呼叫管理平台上报呼叫结果。
具体的,在确定了语义解析请求的具体业务后,就会进行相应的语义解析,该部分流程如图3所示:
1-提取用户语音识别转写后的文本首先通过数据预处理单元,进行文本去噪(过滤语音转写生成的语气词等)、分词、分字、提取拼音。
2-预处理后的文本进入语义解析单元,进行通用意图识别,该部分依次进行模板匹配和通用意图识别模型,若成功识别为某一通用意图,则返回意图ID,否则进入步骤3。
3-进入业务意图识别,该部分同样依次进行模板匹配和通用意图识别模型,如果成功识别为某一通用意图,则返回意图ID,否则进入步骤4。
4-进入智能问答进行语义匹配,如果成功匹配到标准问题,则返回问题ID,否则返回无意图。
领取专属 10元无门槛券
私享最新 技术干货