智慧交通、智慧安防、智慧物流……人工智能技术正让我们的生活更加便利。
随着人工智能技术不断发展,被称为人工智能训练师的职业日益壮大。作为“数字职业”之一,人工智能训练师的出现,加速了人工智能快速发展,正在让机器越来越有人性。
本期深圳卫视《先行》,一起走进他们与人工智能的故事,看他们如何让AI“更懂”人类。
听得见却听不清
AI能否让助听器更聪明?
人工智能,带来划时代的变革,加速改变人类的生活方式。
在深圳一家头部科技企业的声学实验室里,人工智能训练师肖易明,正在为一项公益计划,进行人工智能降噪的技术分析。
“我们的技术就是使用AI技术将降噪做得更好,帮助那些听损老人,把周围的环境声滤除掉,让他只听到想听到的声音,这样才能够使他们更愿意戴助听器。”人工智能训练师、腾讯会议天籁实验室音频算法工程师肖易明向记者介绍道。
根据一线老人们的反馈,戴上助听器之后,虽然对方说话的声音放大了,但周围的环境噪声也大。
与配眼镜要检验眼镜度数类似,听力损伤也分程度,但更为复杂的是,声音分频率,听力障碍者对于不同频率的接受能力存在较大差异,需要进行不断调试。
“目前国内的一些助听器做得还不够完善,它们仅仅是简单地将音量放大,而没有考虑到助听器复杂的应用场景,特别是嘈杂的场景,所以使老人佩戴没有那么舒适,对老人的听力也没有很好的保护。”肖易明说。
不断“喂”数据
模型如何变得更“聪明”?
“感觉跟计算机相关的(工作)肯定希望首选深圳。”1995年出生的肖易明,两年前从武汉大学研究生毕业后,就来到深圳,成为了一名人工智能训练师。
在肖易明看来,科技不是高山仰止的冰冷,而是充满了人文关怀温度。将人工智能技术“植入”助听器,让听障患者在人工智能的帮助下更好地“听到”这个世界,是肖易明和团队目前正在攻克的难题。
降噪技术由于应用场景不同,就会涉及到一个很关键问题——计算量。
一般运行在电脑或手机上的时候,CPU处理能力会更好一点,而一个小小的助听器就这么小一个,留给助听器降噪算法结算量就更小了。
所以这就要求算法工程师除了能够训练好模型进行计算之外,还要尽量精简和优化它的模型,同时拥有更多处理噪声的能力。
要有算法
还要“走出去”
人工智能训练师,相当于人工智能的“教练”。通过数据采集、模型训练、场景测试、调整算法,让人工智能越来越“聪明”、越来越“懂”人类。
想要多少智能,就要多少人工。人耳中有15000个听觉细胞,直接与大脑相连,要在嘈杂环境并存的几十种声音中自觉捕捉到需要放大的那一项,这是普通的电子设备难以达到的效果。
借助人工智能降噪,让机器学习足够多的噪音样本是第一步,而采集噪音的体力劳动,肖易明和团队一样都不能免除。
在车库内,人工智能训练师、腾讯会议天籁实验室音频算法工程师李娟娟正在采集车引擎、停车的声音。
“它对于助听器来说,是一种噪声,要把它抑制掉,把我们的声音凸显出来。噪声你得想得比较全面一些,它才能录制得比较全。”李娟娟说。
完成收集数据的“体力活”后,真正的挑战接踵而至。
肖易明团队发现,市面上各大厂家的降噪核心算法各有千秋,抑制被识别为噪音的声线是普遍做法。如何让人工智能不仅能认识不同的声音,甚至“聪明地”识别不同的场景和需求,动态定义噪音并进行相应处理,是团队面临的第二个难题。
“现在是在采集水流的声音,比如说现在我们如果要说话,它属于一个噪声,如果我们想听到流水声音时,它就不属于噪声了。”李娟娟说。
要精准抓取用户在不同场景希望感知的不同声音,必须设计一套更先进的算法。
人工智能训练师们借鉴线上会议使用的AI增强技术和深度学习模型,尝试根据环境和用户的需求,进行智能降噪。训练师把这比作“为近视患者提供度数合适的镜片”。
李娟娟说:“当时有一个听障患者反映,当天有下那种小雨,他就觉得我们的助听器怎么把那种淅淅沥沥的小雨声给它滤除掉了。他们也希望享有这种听到大自然的声音的权利,如果把这种声音给它消除掉了,自然是不合适的。所以我们也是一步一步去迭代我们的算法。”
在经历了一系列声音采集、模型训练、算法调整的工作后,用人工智能技术降低噪音的测试,正在声学试验室中进行。
经过降噪处理,同样的声音呈现出两种截然不同的状态。
“标注的特征越多、越细,人工智能适应的场景就越多,智商才会越高,它们就像一个孩子,会越来越‘聪明’,我特别有成就感。肖易明说。
让人工智能“飞入寻常百姓家”
在韶关市桂头镇,肖易明正与社区义工林淑兰一起前往听力障碍者家中,了解助听器使用情况。
通过走访,肖易明团队将掌握的一线信息,带回实验室,不断优化。
迭代算法,更新模型,“聪明”的人工智能降噪技术“植入”了助听器,黄奶奶听到的世界,也因此出现了些许不同。
林淑兰:奶奶说,平时做饭的时候,铁铲和铁盆的声音会很大,听着很不舒服。
肖易明:好的,我来调一下。
林淑兰:奶奶,还吵不吵?
林淑兰:奶奶说不会吵,回到了以前正常的状态。
在深圳,许多像肖易明一样的人,正在不断探索人工智能前沿,用技术改变生活。
“随着年龄的增长,我爷爷逐渐听不到了。一开始,我们并没有意识到,到后来,他要拿着字典去看电视,不知道那个字念什么的时候他会问我。”人工智能训练师、腾讯会议天籁实验室音频算法工程师熊义辉说。
熊义辉表示现在回想起来,那时候爷爷肯定是很困扰的,“虽然他已经不在了,但我觉得这个事情还是挺有意义的,让大家能够有更好的技术去听得更清楚。”
“人工智能涉及到的领域很多,我们这一份工作只是人工智能的一小块,如果我们的技术,能够真正给他们提供相应的服务,让他们能够听得到并且愿意与人去沟通,是很有意义的一件事情的,”肖易明说。
记者 / 王羽丰 王涛 孙树君 向仕双 温国赞 郑温仪
编辑 / 何欢
领取专属 10元无门槛券
私享最新 技术干货