智能语音语义技术主要研究人机之间语音信息的处理问题。简单来说,就是让计算机、智能设备、家用电器等通过对语音进行分析、理解和合成,实现人“能听会说”、具备自然语言交流的能力。
智能语音技术概述
按机器在其中所发挥作用的不同,分为语音合成技术、语音识别技术、语音评测技术等。语音合成技术即让机器开口说话,通过机器自动将文字信息转化为语音,相当于机器的嘴巴。
语音识别技术即让机器听懂人说话,通过机器自动将语音信号转化为文本及相关信息,相当于机器的耳朵;语音评测技术通过机器自动对发音进行评分、检错并给出矫正指导。此外,还有根据人的声音特征进行身份识别的声纹识别技术,可实现变声和声音模仿的语音转换技术,以及语音消噪和增强技术等。
智能语音产品和服务形态多样
智能语音技术会成为未来人机交互的新方式,将从多个应用形态成为未来人机交互的主要方式。
智能音箱类产品提升家庭交互的便利性。智能音箱是从被动播放音乐,过渡到主动获取信息、音乐和控制流量的入口。当前智能音箱以语音交互技术为核心,成为作为智能家庭设备的入口,不但能够连接和控制各类智能家居终端产品,而且加入了个性化服务,如订票、查询天气、播放音频等能力。
个人智能语音助手重塑了人机交互模式。个人语音助手,特别是嵌入到手机、智能手表、个人电脑等终端中的语音助手,将显著提升这类产品的易用性。如苹果虚拟语音助手 Siri 与苹果智能家居平台Homekit 深度融合,用户可通过语音控制智能家居。Google Now 为用户提供关心的内容,如新闻、体育比赛、交通、天气等等。微软的Cortana 主要优势在于提升个人计算机的易用性。
以 API 形式提供的智能语音服务成为行业用户的重要入口。智能语音 API 主要提供语音语义相关的在线服务,可包括语音识别、语音合成、声纹识别、语音听转写等服务类型,并且可以嵌入到各类产品,服务或 APP 中。在商业端,智能客服、教育(口语评测)、医疗(电子病历)、金融(业务办理)、安防、法律等领域需求强烈;在个人用户领域,智能手机、自动驾驶及辅助驾驶、传统家电、智能家居等领域需求强烈。(部分内容来源于网络如有侵权请联系删除)
欢迎您分享文章,让更多有需要的人看到。
领取专属 10元无门槛券
私享最新 技术干货