1月16日,百度输入法人工智能探索版正式出现在百度输入法“人工智能”上。新输入全感官输入2.0“会议。它是一种新的输入产品,使用全语音输入的默认输入模式,并移动表达式、肢体等进行全感官输入。与此同时,百度宣布,语音技术在全球学术界和业界都取得了重大的技术突破。流截断多层注意建模(SMLTA)将提高在线语音识别的精度15%,实现全球首个基于注意技术的在线语音识别服务大规模应用。
在会议现场,百度高级副总裁王海峰表示,输入法是最接近用户的产品之一,也是人工智能登陆的“桥头堡”。百度的全方位的人工智能能力不断使输入法更加“智能化”。他还介绍了输入法行业的“未来概况”。他认为,虽然目前的输入法产品主要用于手机,但未来的输入法将应用于各种智能设备和用户之间的交互,并将走向世界,为全球用户提供更加多样化的输入法。
据报道,截至2018年底,活跃百度每月输入法的数量已达到5亿,峰值语音日请求量超过5.5亿,AR表达式使用量超过1亿次。同时,百度海外输入法在全球已安装超过1亿台,支持120种语言,覆盖190个国家和地区,并与全球100多个知名IP合作,实现了技术和市场的双重收获。
SMLTA语音识别精度全球领先的语音技术创新推动互动变革
百度输入法人工智能探索版是百度人工智能登陆应用的又一重要成果。全语音交互是其最大特点之一。”百度中文输入法负责人蔡玉婷说:“虽然主流的输入法是键盘输入法,但我们有信心能够更早推出这种全语音互动产品,因为我们对用户不断变化的需求了如指掌。”与2016年相比,百度输入法的平均每日语音请求量增加了8倍,语音输入法的场景从聊天和搜索扩展到游戏、娱乐和购物。在许多场景中也是如此。
全语音交互要求语音识别的高精度。百度引入全语音交互输入法的信心也来自于百度业内领先的语音技术。百度语音技术部负责人高亮当场宣布了百度语音输入的四大突破和用户体验改善带来的输入方法。
在网络语音领域,百度发布了流截断多层注意建模(smlta),这是中国网络语音识别历史上的两大突破:第一次在世界范围内,本地注意建模和识别精度超过全球注意模型;第一次在世界范围内,在线关注建模和识别精度超过全球注意模型。大规模部署了OICE交互注意力模型。该技术可以解决传统注意力模型在识别上的滞后和大规模在线语音实时交互的问题,提高在线语音识别精度15%,超过行业最高水平15%。
在离线语音识别领域,为了满足用户在多输入场景下的需求,百度不断优化深峰值2系统,使离线语音输入的相对精度再次提高,比行业平均水平高出35%。即使用户处于地铁、电梯、隧道或拥挤交通的离线场景中,也可以使用百度输入法进行准确的语音输入。
汉英混合语音输入技术,以及方言和方言、方言和普通话混合语音输入技术的突破,使用户真正实现“自由语音”。无论是汉英混音,还是普通话家话来回切换,百度输入法都能准确识别。据介绍,百度输入法是唯一一个实现了高精度“中英自由理论”和“方言自由理论”的产品。
百度语音技术的突破也使海外用户体验到语音输入的便利性。在这次会议上,百度海外输入法显示了日文识别、印地语识别和印英混合输入功能。根据第三方评估,百度日语输入法在语音识别准确度方面位居行业第一。
领取专属 10元无门槛券
私享最新 技术干货