继前阵子找来前Google AI大将John Giannandrea改善Siri后,苹果近日于苹果的机器学习期刊中,发布用机器学习技术来加强Hey Siri语音命令的辨识,因为Hey Siri的指令较简洁,因此有时会辨识不正确,举例来说,在使用者说到类似的词句时,或是非本人说该指令时,都有可能意外地唤醒Siri,为了解决这个问题,苹果将透过机器学习来改善。
苹果过去在iOS 8的iPhone 6首次推出Hey Siri的功能,使用者不需要按Home键,能透过说:「Hey Siri」将Siri唤醒,系统听到Hey Siri的指令后,将会处理后面使用者所说的话,给予使用者回覆,用语音指令唤醒Siri的功能给使用者带来方便,在没有手按手机按键的情况下,还是可以与语音助理互动,像是煮饭或是开车的时候。
不过,Hey Siri的语音指令现在的辨识还不够精准,对主要使用者人声的辨识也不够精准,目前会发生三种辨识错误的情形,包含使用者讲到类似的语音指令和他人讲Hey Siri都可能不小心唤醒Siri,另外,还有使用者讲了Hey Siri却无法唤醒Siri的情况。
辨识Hey Siri的问题出在过去是采用侦测关键词的方法,因此系统接收到类似Hey Siri的指令时,容易意外唤醒Siri,苹果Siri团队透度学习来建立侦测模型,并加入递归神经网路来训练模型,让模型可以更准确地辨认用户本人的指令,根据苹果的研究实验结果,透过机器学习技术改善Hey Siri的辨识模型后,可以减少75%因为其他人意外唤醒Siri的情况,而因为类似语音指令唤醒Siri的情况可减少50%。
目前Siri在最一开始设定时,需要使用者说5次Hey Siri相关的指令,来建立个人化声音辨识模型,在之后辨识的阶段,就是将使用者的语句与预先建立的模型比对,来决定是否要唤起Siri。不过,在使用者设定Hey Siri的阶段中,因为环境变数而造成建立模型的误差。
因此,苹果唤醒Siri的模型除了将使用者的声纹与预先建立的模型比对之外,还会保留40次使用者最新能唤起Hey Siri的声纹记录,未来苹果希望可以跳过使用者注册Siri这一段,直接透过使用者唤醒Siri的记录,就能正确地辨认语音指令。
领取专属 10元无门槛券
私享最新 技术干货