如果“思想”能够被阅读并主动生成文本,那么有语言功能障碍的人就有望实现“开口”说话。而这一这愿景似乎离我们越来越近。
3月30日,《自然-神经科学》发表了美国加州大学旧金山分校华裔教授 Edward Chang 及同事开发的一款脑电波 AI 解码器,能够将大脑活动信号直接转化为句子文本。
该研究小组招募了四名志愿者,在他们的大脑中植入了电极阵列来监测癫痫发作。
这四名志愿者被要求大声且反复朗读50组句子,包括“Tina Turner is a pop singer”以及 “Those thieves stole 30 jewels”等等。研究人员在志愿者朗读过程中追踪他们的神经活动。
然后这些大脑活动数据被输入到机器学习算法中--一种将每说一个句子产生的大脑活动数据转化为数字字符串的人工智能系统。
试验证明,训练后的机器翻译算法能够准确地解码受试者的神经活动,并将其接近实时地翻译为句子文本,错误率低至 3%。
而且试验还发现,如果利用某人的神经活动和言语对循环网络进行预训练后再在另一名受试者身上进行训练,最终的解码结果有所改善,这意味着这种方法在不同人员之间或许是可转移的。
实际上,这种脑电波解码方式也可以粗略地理解为机器翻译,它们都是从一种语言到另一种语言的翻译,只不过前者输入的内容是神经信号,后者输入的内容为文本。
但是,目前该脑电波解码器还存在一定的局限性。首先如果测试者所说内容超出上述特定50组句子,就会出现乱码的现象;此外,该系统目前还不能用于有严重语言功能障碍的患者。
其实这种方式与Facebook早前进行一项“大脑打字”项目很相似。
该项目是 Facebook Reality Labs 和加州大学旧金山分校的一项共同研究项目。在经过一年多的努力后,初见成效。研究成果于去年发表在 Nature Communications 杂志上。
在该项目期间,研究人员邀请了三名正在接受癫痫治疗的患者参与了测试。
参与测试的患者在听到一些例如“喜欢哪种乐器”等简单问题后,系统可以通过检测他们脑电波的方式直接把他们心中所想的答案显示在屏幕上。不过该系统准确率当时仅为61%至76%。
与上述脑电波 AI 解码器不同的是,Facebook“大脑打字”采用的是非侵入,即将布满电极的帽子戴在头上即可,而前者是需要将电极植入大脑。
通常情况下,非侵入式脑机接口设备会偏向于消费级产品,比如和VR\AR硬件配合使用。侵入式的则更专注于研发高精度的脑电测量设备,产品针对临床和科研级别的。
但是无论是哪种方式,它们都有望改变有语言功能障碍的残疾人士的交互方式,为人类的交往带来革新。
参考资料:https://www.theguardian.com/science/2020/mar/30/scientists-develop-ai-that-can-turn-brain-activity-into-text
领取专属 10元无门槛券
私享最新 技术干货