你经常用手机里的语音识别吗?可能不少朋友还不知道语音识别是什么,它实际上是智能手机中智能助手、语音转文字、声音解锁等功能的技术支持。如今智能手机中这些与语音识别相关的功能已经得到了广泛应用,消费者只需要对着手机下达指令,不需要自己亲手指点就能达成控制目的,因此语音识别技术被认为是实现人工智能的重要技术之一。
但语音识别同样存在技术瓶颈,相信喜欢用语音转文字或智能助手的朋友会有这样的感受,自己按平时说话的方式下达的指令系统并没有识别出来,非要以尽可能标准的普通话才能识别出来,这就是语音识别的准确率问题。目前全球还没有一家技术公司能够将语音识别准确率提高到百分之百,这是为何呢?
根本原因在于,人类的语言实在是太过多样化了,即使是一个国家里的人,不同地区也流行着不同的方言。即使是一个地方的人,不同村庄的方言口音还不同。人类的语言库对于语音识别技术来说就是一个海量的学习库,其背后的机器学习目前还无法学习所有的语言,这对那些说话带着严重口音的人来说就不是那么友好了。
那么现在语音识别准确率达到了什么水平呢?实际上在2016年微软研究院就开发出了一套能够将准确率提高到94%的语音识别算法,但从那之后剩下6%的发展空间一直都没有公司能够完全占领,这也成为了语音识别领域中最后一片蓝海。对于外人来说,这片蓝海指日可待,而对于内行人来说,这片蓝海高深莫测。
有人可能会好奇,94%的准确率在日常生活中已经够用了,为什么还要追求100%呢?对于一般人来说尚且如此,但对于应用这项技术来进行专业工作的人来说,情况明显不同。比如对于从事新闻行业的工作者来说,越高的语音识别准确率意味着他们的工作负担会减小,工作效率会提高。
如果语音识别的准确率一直维持在94%左右没有提高的趋势,那么对于新闻工作者来说意义并不大,因为人工识别语音的准确度或许还比机器识别还要高。但我们也要相信机器学习的能力,随着训练强度的增加,它的识别能力会逐渐上去的。
领取专属 10元无门槛券
私享最新 技术干货