9月27日是国际聋人日,当天,腾讯多媒体实验室、腾讯基金会、深圳市信息无障碍研究会共同发起“天籁行动”,向公益开发者、人工耳蜗设备厂商、NGO及行业免费开放腾讯天籁AI音频技术,以帮助更多听障人群解决“听不清”难题。
据悉,腾讯天籁是新一代实时音频技术,也是腾讯会议背后的关键技术。为了训练天籁技术,腾讯会议和多媒体实验室曾对多达20多种复杂通话场景里的通话情况进行采集和深度学习,已经可以做到识别各类复杂场景,智能消除环境声,增强还原人声。
半年前,腾讯会议把“天籁”AI音频智能降噪技术开放给国内最大的人工耳蜗厂商诺尔康。
双方通过合作,将天籁技术置入研发的声音伴侣App,与人工耳蜗相连形成了一整套解决方案。其中,“声音伴侣”先对采集到的语音信号进行预处理,定向增强人声减弱场景声;另外,听障人群也可以根据需要,自行调节相关模式。经过处理后的声音,利用无线传输实时送达到人工耳蜗传递给人。
据诺尔康实验检测数据显示,天籁技术与人工耳蜗结合后,语音识别性能大幅提升,平均识别率达到96.28%,其中带噪语音识别率为93.38%,环境噪音中声音识别率达到94.24%;在手机App中植入天籁技术,手机双麦阵列降噪的信噪比提升 20dB,MOS分提升了0.3-0.5,对于改善听障人群听觉体验有着积极效果。
诺尔康总经理李楚在接受媒体采访时指出,这次和腾讯的合作,是希望把最先进的音频降噪技术导入人工耳蜗设备里,这是一个很关键的技术,“我们人工耳蜗里面现有的技术不如腾讯的AI降噪技术这么好”。
李楚表示,要把新的技术放到产品里,需要事先产品的临床注册才能合法的放到产品上。至于这个技术是否商业化?诺尔康和腾讯合作以来压根就没有聊过,“我们本身的想法是这个技术免费放到从低端到高端的整个系列产品中里,就算现在用着旧耳蜗的患者,只要这款技术,药监局批准了,我可以免费给他们更新”。
更多内容请下载21财经APP
领取专属 10元无门槛券
私享最新 技术干货