首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

影响机器人智能程度的关键因素竟然是它!

人工智能发展了几十年,既有阿尔法狗大胜李世石的高光时刻,亦有不少“人工智障”翻车瞬间。例如,我们问机器人的时候,可能会出现:停顿、答非所问或直接不回答等等让人暴走的情形,这到底是怎么一回事呢?

这些Bug的出现,主要的原因是它被环境中的其他噪音干扰了,机器人无法准确识别,进而影响下一步的判断回复。

说到底,这不是机器人听不懂的问题,而是机器人有没有听到、听清楚的问题。

语音库中的语音模板基本上是在无噪声和无混响的环境中采集、转换而成,而实际应用中噪声是无法避免的,这些噪音虽然对我们没影响,但对AI来说,一切声音都会是干扰:

1、不同语音的交叠

2、远场的混响和噪音干扰

语音识别原理框图

除了噪音的干扰,还有语音的模糊性,发音人的多变性,也给语音识别造成了困难。别小瞧了些许识别率的差异,假设一个识别率是95%,一个是92%,在多轮对话中,语音识别率是相乘关系,那么三轮对话最终的结果是:

95%*95%*95%=86%

92%*92%*92%=78%

只是3%的区别,最终的结果相差了8%!逐轮递减,交互次数越多,影响越大!

作为客服领域应用,电话机器人还要受到通信传输的影响。在电话信道下,由于信道的衰减、传输的距离较长,音频的质量对ASR文字转录影响很大。

完整的语音交互过程分听清、听懂、满足三个步骤,听清排在首位。唯有识别越准确,机器人才能越智能。

Yeta电话机器人采用AI领域头部厂商技术,深耕语音20余年,效果有保障。同时针对电话信道下识别效果衰减的问题(手机APP可以达到98%识别率,电话中会衰减到70%左右),我们定制了专门的电话应用识别模型,即时在电话信道下,机器人仍然可以保持90%以上的准确率,这也是我们开放机器人在线体验的底气。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200604A0JVDU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券