美国斯坦福大学的研究人员在《Optica》上发表研究成果,展示了直接在光芯片上使用光模拟“反向传播”算法的方式可训练人工神经网络,证实直接在一个光芯片上训练人工神经网络的可能性。该重大突破性进展展示了光电路能够实现基于电子的人工神经网络的重要功能,并能够以更廉价、更快和更高能效的方式来执行类似语音或图像识别等复杂任务。“反向传播”算法是训练传统神经网络的标准方式
需求背景
人工智能神经网络是一个通过使用互连单元以类似人脑的方式来处理信息的一种人工智能。人工智能神经网络可用来执行复杂任务,如在语音识别中,需要重要步骤来训练算法来为不同单词等输入进行分类。
尽管神经网络处理通常在传统计算机进行,但在设计神经网络计算专用硬件上也投入了巨大精力。以光器件实现对人工神经网络的训练获得了大量关注,因为其能够使用比电子器件更少的能量及并行方式执行计算。
论文的第一作者Tyler W. Hughes说:“使用一个物理器件而不是一个计算机模型来进行训练,可使训练过程更加精确。而且,因为训练是实现神经网络的一个高计算密集型过程,以光学方式执行该过程是改进人工智能网络计算效率、速度、功耗的关键。”
虽然光人工神经网络最近以实验方式进行了展示,但训练步骤使用的仍是在传统数字计算机上的模型,然后将最后的设置输入到光电电路中。
核心进展
在此次进展中,研究人员设计了一款能够复制传统计算机训练神经网络方法的光芯片,克服了实现一个全光神经网络所面临的重大挑战。
一个人工神经网络可以被认为是一个带有很多旋钮的黑盒子。在训练阶段,这些旋钮转动一点,然后对整个系统进行测试,看看算法的性能是否改进了。Hughes说:“我们的方法不仅能够帮助预测旋钮转动的方向,还能预测每个旋钮应该旋转多少以尽可能获得想要的性能。我们的方法能够显著加速训练,尤其是大的网络,因为我们并行地获得每个旋钮的信息。”
成果展示
研究人员已经展示了可使用一个光芯片(图中蓝色长方形区域)来训练一个神经网络。在完整网络中,有几个这样的光芯片连接到一起。激光输入(绿色)对信息进行编码,然后由光电波导(黑色)传过芯片。芯片使用可调分光器执行对人工神经网络关键的操作,这些通过波导中的弯曲部分来表现,耦合两个相邻的波导,通过调整光移相器的设置来调整(红色和蓝色闪光部分),它像“旋钮”一样工作,在训练过程中调整来执行给定的任务。(图片来源:Tyler W. Hughes, Stanford University)
过程说明
新的训练协议在带有可调分光器的光电电路上运行,这些分光器可通过改变光移相器来改变设置。激光编码信息传递到光芯片进行处理,并由光波导传递通过分光器,这些分光器像旋钮一样调整来训练神经网络算法。
在新的训练协议中,激光首先通过光芯片。当离开器件时,就可计算出与预期输出的差异。然后使用该信息来产生新的光信号,这个信号然后以相反的方向送回并穿过光电网络。通过测量在这个过程中每一个分光器的光电密度,研究人员展示了对神经网络性能的并行测量是如何根据每个分光器设置发生改变。移相器设置能够基于该信息发生改变,该过程将重复进行直到神经网络产生所需的输出。
结果测试
研究人员使用一个光电仿真测试了他们的训练技术——教一个算法来执行复杂功能,例如在一套点中挑选复杂特性。他们发现光实现过程的性能可与传统电子计算机一致。
意义
研究团队领导者、斯坦发大学的Shanhui Fan说:“使用光电芯片来执行神经网络计算比数字计算机可能实现的效率更高,可以实现更复杂的问题得到解决。这将提高人工神经网络执行特定任务的能力,如自动驾驶汽车或对一个发问给出合适的答案。他将以我们现在无法想象的方式来改进我们的生活。我们的工作展示了能够使用物理学来实现计算机科学算法。通过在光学域训练这些网络,显示了光神经网络能够用于实现只用光自身就可实现的某种功能。”
下一步工作
研究人员计划进一步优化网络,并打算使用其来实现神经网络任务的实际应用。他们设计的通用方法可用于多种神经网络架构,并且用于可配置光电器件等其他应用。
参考文献
Tyler W. Hughes, Momchil Minkov, Yu Shi, Shanhui Fan.Training of photonic neural networks through in situ backpropagation and gradient measurement.Optica, 2018; 5 (7): 864 DOI:10.1364/OPTICA.5.000864
领取专属 10元无门槛券
私享最新 技术干货