其实现在的AI还没那么智能,它无法在复杂的环境下区分有用的信息。只能听懂简单的指令,而无法辨别有用的信息。
比如您在嘈杂的集市中能准确听到你问小贩:“这个苹果多少钱?”但对于AI语音识别芯片来说却很吃力,它就像一个贪玩的孩子,很容易被环境的其他声音干扰。从而会出现执行命令错误,无法捕捉到有用信息。
人的听觉可以进行声音识别,为什么语音芯片却有点难?
人的听觉系统有个著名的效应“鸡尾酒效应”,它指的是在酒会上,参会者总能很轻松地把注意力集中到感兴趣的话题上,其他无关紧要的却自动过滤掉。
但对于智能音箱来说,这个却不容易实现。当他们处于嘈杂的环境中,他们会受到不同的声音连续暴击,最后陷入我是谁,我在干嘛的恶性循环中。
于是工程师们想了很多办法,希望它能专心工作,不被干扰。因而测试阶段,都会让它不断学习。
浅析耳朵为啥可以分辨声音?
要知道我们的耳膜不是直接暴露在空气中的,通过头发,身体,肩膀,躯干等一系列部位反射,最后才进入耳膜。由于声波所走的路径不同,经过多次反射之后的声音他们的频谱会发生变化。因而不同频波的声音传送到大脑,它很容易区分,因为她们很有特色。
那么一开始大脑也是需要积累数据的,这可以从婴儿时期观察得到,小婴儿对外界的声音也是听不懂的,那是她们的积累不够,没有充分的数据库,因而没办法调用数据和它匹配,这也是为啥智能语音芯片也需要学习,因为在学习的过程中,它积累了自己的数据库,能够对数据进行分析改造。
机器辨音能力的获得
如何让机器和人一样懂得分辨声音?我们需要进行声音改造,那么北京一位专家就发明了一种新材料,声学材料,它能够进行单声道多声源定位与分离。那么我们是如何让他来进行辨音的呢?首先我们把这个特殊的声学材料做的外壳套在麦克风上,经过这个声学材料过滤掉的声音再传送给麦克风,就会形成差异化声音。那么这样的声音就立即能够被识别了吗?答案是否定的,因为仅仅对声音进行了处理,只是相当于耳蜗,那么需要经过大脑接受并进行识别,才能最后被理解。而这一步骤就涉及了一串代码,也叫算法。
领取专属 10元无门槛券
私享最新 技术干货