@酱番梨 问:
来自社友的回答
▼▼▼
@lyn
不管是语音识别还是指纹,人脸,都有一定的容错范围,各家的范围标准必然有所不同。个人猜测XXXX为了提高唤醒成功率应该设置的比较宽松。 曾经使用某米手机,也被一个长得比较像的哥们成功解锁?
@Lamaric
虽然说世上没有完全相似的声音,但在一定误差范围内会出现识别错误的情况。毕竟没有100%的识别率。猜测可能是厂商在开发系统时就把阈值降低了,导致容错率增大,出现误识的情况也会更多。
@杨 晓凡
我也来抢答嘻嘻嘻。 首先这个问题体现出了语音识别的两种取向:是“语音转文本”还是“声纹识别”,前者是所有语音助手、智能音箱核心关注的事情,识别出用户说的话的内容是什么,把它以文本的形式输出,便于后续处理;后者就是关注说话的人到底是谁。(补充说明一句,已经8102年了,没有任何一家的语音解锁会直接把当初激活时的录音和后来用户解锁时的收音音频波形直接进行对比,因为受到距离以及环境噪音影响,无法匹配简直是家常便饭。所以现代实际使用的技术一定是在这两个维度之间找一个平衡) 那么,现在的市场环境是每家科技企业恨不得都要有自己的智能语音助手,这些“助手”在设计时是一定不能放松“语音转文本”的准确率的。这些成熟或不成熟的助手也就集成到了手机中。我有个猜测是,既然手机已经有了“语音转文本”功能,那做语音解锁功能的时候,工程们有什么理由不直接用这个功能呢?既然语音转文本功能本来就不需要鉴别说话人,接下来产生“谁说对了都能解锁”的效果也就不奇怪了。 有没有办法解决呢?也不难,多加一个“声纹识别”的功能就好了,要求说话的内容和说话人的声音特点同时匹配才解锁,就可以满足日常使用要求(实际上苹果的“Hey Siri”功能就有类似的两步判断) 所以,技术上挺简单的事情,工程师偷了个大懒。应该扣奖金!
@ToBeStrong
某耀8也是这样,舍友随便叫一声,就能识别