今年是5G元年,也是人工智能刚开始崭露头角的时候,现在已经有越来越多的人工智能产品在工作和生活中发挥作用,现在相关的产品核心主要是人工智能语音助手,通过语音来控制各种设备。不过这就会遇到个问题,就是口语和地方语言的问题,比如印度英语和伦敦英语有很大大区别,因此在口语的语音识别方面,智能设备如何判断准确是个复杂的难题,另外一点来说, 智能助理类产品与人交互所发的声音,可能并不适合每个人的喜好,因此,谷歌现在推出了9种新的语音,其中有7种不是英语。
不管是早期的Siri或者其他厂商的语音助手,声音都是那种很死板的“机器人声音”,让人们听着有点别扭。在过去的几年中,像Siri和谷歌助手这些比较领先的产品,已经有了很大的改观,特别是随着人工智能和机器学习变得更加先进,在这些方面,谷歌已经做了很深的布局。
也正是因为这些原因,谷歌使用了DeepMind arm的WaveNet,它的最大特点是使用深度神经网络,不是分析用户语音输入,而是生成音频波形,这是一项相当先进的技术。
WaveNet也是谷歌Assistant支持的11种英语语音背后的技术。使用户有更多样化的选择,谷歌增加了次要的声音,并且新增的声音中并非所有的都是英语。这份新榜单包括德语、法语、荷兰语、挪威语、意大利语、韩语、日语、英语(英国)和印度英语。
和以往很多先进的产品一样,谷歌该计划是分批推出的,甚至可能并不会在所有的地区推出。对于这种新的语音技术,我只想说,什么时候能听懂并且发出有感情的汉语声音,你觉得呢?
领取专属 10元无门槛券
私享最新 技术干货