Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >颠覆传统计算架构:光神经网络硬件登上Nature

颠覆传统计算架构:光神经网络硬件登上Nature

作者头像
机器之心
发布于 2019-05-15 02:43:09
发布于 2019-05-15 02:43:09
1.1K0
举报
文章被收录于专栏:机器之心机器之心

光纤以光的形式传输数据,是现代远程通信网络的支柱。但在分析这种数据时,我们需要把光转换为电子,然后用电子方法进行处理。光学曾被认为是一种潜在计算技术的基础,但由于电子计算发展迅速,光学计算在这条赛道上跑得很吃力。

然而,近几年来,人们越来越关注计算的能源成本。因此,光学计算再次受到关注,因为它不仅可以降低能源需求,还可作为加速人工智能算法(如深度神经网络)的专用硬件。德国明斯特大学物理研究所的 Feldmann 等人在《Nature》上发表了一篇论文——「All-optical spiking neurosynaptic networks with self-learning capabilities」,阐述了这种网络的全光学实现取得的可喜进展。

深度神经网络包含很多层人工神经元和人工突触,它们是神经元之间的连接。这些连接的强度被称为权重,它们可以是正的,表示神经元被激活;也可以是负的,表示神经元抑制。深度神经网络通过改变其突触权重来学习执行图像识别等任务,从而最小化实际输出与预期输出之间的差距。

CPU 和其他数字硬件加速器通常用于深度神经网络计算。深度神经网络可以使用一个已知的数据集进行训练,而已经训练的深度神经网络可以在推理任务中应用于未知数据。无论哪种情况,虽然计算量很大,运算种类却不多,因为「乘积累加」运算在诸多突触权重和神经元激活中占据主导地位。

众所周知,深度神经网络在计算精度低时也能表现良好。因此,这些网络为非传统计算技术提供了一个很好的机遇。例如,研究人员正在探索基于非易失性存储设备的深度神经网络加速器。这类设备在切断电源时也能保存信息,同时通过模拟电子计算能够提升深度神经网络的速度和能源效率。

那么,为什么不考虑利用光学呢?引导光的结构--无论是用于电信的光纤还是用于光子晶片的波导--都可以包含大量数据。在这类波导内部,光的很多波长可以利用波分复用(wavelength division multiplexing)技术同时传播。之后,每个波长可以进行调制(其改变时可以携带信息),其中调制速度受限于与电-光计算和光-电计算有关的可用带宽。

谐振器结构使波导能够添加或删除单个波长。例如,微米级环状(微环)谐振器可以实现突触权重阵列。这类谐振器可以进行热态电光调制,或利用上述论文中提到的相变材料调制。这些材料可以在非晶相和晶相之间转换,这与它们吸收光的能力大不相同。在理想状况下,得出的乘积累加运算只需少量电能。

Feldmann 等人提出了一种在毫米级光子芯片上的全光学神经网络,该网络内部没有光到电的转换。输入的数据被电子调制成不同的波长以注入网络,但之后所有数据都会停留在芯片上。利用集成相变材料来实现权重调制和神经元集成;它们位于两种微环谐振器上,具有突触或神经功能。

在不同工作波长情况下注入的未调制光接收到在相变材料中累积的神经元激活,之后将它们传递到网络下一层。即使没有芯片上光学增益(在这个过程中,一种介质将能量传递给通过它传输的光),这个设置也可能扩展至更大的网络。作者在其上实现了小规模的监督学习和无监督学习。

由于权重通过光吸收来实现,负权重需要一个较大的偏置信号,一定不能激活相变材料。另一种可以快速提供负权重的方法是采用 Mach–Zehnder 干涉仪。在这些设备中,单个波导被分为两个分支,之后重新结合,这使得传输光的数量取决于两条路径间的光学相位差。但是,这种方法与波分复用方法的结合可能具有挑战性,因为每个干涉仪的分支需要为每个波长引入合适的相位差。

光学 DNN 仍然面临巨大挑战。在理想状态下,它们的总功率使用可能较低,但热光功率经常需要调整和保持每个 Mach–Zehnder 干涉仪分支中的光学相位差异。此外,注入包含相变材料系统中的总光学功率必须仔细校准,使材料对输入信号的响应完全符合预期。

尽管相变材料可以用来调整 Mach–Zehnder 相位,但材料吸收光的强度和减慢光速之间不可避免的交叉耦合会带来相当大的复杂性。

相变材料似乎非常适合突触权重的非挥发性长期存储,突触权重基于微环共振器,只需要很少的调整。然而,当在神经元中使用时,这种材料的结晶速度会限制神经元被激发的最大速率。

另外,在每次潜在的激发事件后,需要熔化材料以诱导完全神经元复位,这将迅速消耗材料虽然很大但有限的开关耐用性。

传统的 DNN 已经发展壮大,现在的 DNN 通常包含数千个神经元和数百万突触。但光学网络需要相隔很远的波导,以防止耦合,并且避免急剧弯曲以防光离开波导。因为交叉两个波导可能将不想要的功率注入错误路径,因此光子芯片的 2D 特性呈现出实质性的设计限制。

实现光学网络除了需要很长的距离和很大的面积外,每个光子结构关键部件的制造也要求非常精确。因为波导和耦合区域(例如,在每个微环谐振器的入口和出口处)必须有精确的维度来达到预期的性能。

小型微环共振器的制造也有限制。最后,调制技术提供的相对较弱的光学效果需要很长的交互区域,以使它们对通过的光的有限影响达到显著水平。

Feldmann 及其同事在研究中所取得的进步,有望推动该领域的未来发展。开发容易获得的宽带片上增益将大有裨益,支持对每片光学编码数据进行独立和任意操作、而无需大面积光子芯片的技术也同样如此。

如果提供高能效的可扩展光子神经加速器最终出现,Feldmann 等人和该领域其他人的研究将会成为该项技术的开山之作。

论文:All-optical spiking neurosynaptic networks with self-learning capabilities

论文地址:https://www.nature.com/articles/s41586-019-1157-8

类脑运算中的软件实现是图像处理语音识别等诸多重要计算任务以及人工智能和深度学习应用的基础。然而不同于真正的神经组织,传统计算架构物理分隔了内存和处理的核心计算功能,导致很难实现快速、高效和低能耗计算。为了克服这些限制,设计能够模拟神经元和突触的硬件不失为一种好方案。当在神经网络或神经形态系统中连接时,这种硬件像大脑一样处理信息。

在本篇论文中,作者提出一种全光学神经突触系统,能够实现监督和无监督学习。他们利用波分复用技术实现了光子神经网络的可扩展回路架构,成功展示了在光学领域的模式识别。这种光子神经突触网络有望获得光学系统固有的高速和高带宽,从而能够直接处理光通信和视觉数据。

图 1:本论文中的全光学脉冲神经元回路。a, b:本研究实现的神经网络原理图,包括几个突触前输入神经元和一个突触后输出神经元,二者通过 PCM 突触连接。输入脉冲使用 PCM 单元加权,利用一个 WDM 多路转换器(MUX)进行综合。如果突触后脉冲的综合功率超过一定的阈值,环形谐振器上的 PCM 单元就会转换,输出脉冲就会产生(神经元脉冲)。c:带有符号块的集成光学神经元的光子回路图,其中几个符号块可以使用波长输入和输出连接到更大的网络(见图 5)。d:三组神经元(B1、D1、D2)的光学显微照片,有四个输入端口。左边的四个小环形谐振器用于将不同波长的光从输入端耦合到单个波导上,然后在与大环形的交点处形成 PCM 单元。底部的三角形结构是光栅耦合器,用于将光耦合到芯片上和芯片外。

图 2:人工神经元的脉冲产生和操作。a:一种相变神经元回路的光子实现原理图。b:用电子显微扫描环形谐振器以实现激活函数;c:该器件在 b 中的归一化传输测量(除以测量的最大传输值)及其对脉冲能量的依赖。d:归一化传输到固定波长输出(c 中虚线),显示用于定义神经元触发阈值的激活函数。

图 3:利用相变全光学神经元进行监督学习和无监督学习。a 和 b 表示两个神经元在不同输入模式下的输出;C:全光学神经元的无监督学习机制;d:重复显示「0110」模式时四个突触的权重随时间的变化。

图 4:全光学神经网络的可扩展架构。a:整个神经网络包含一个输入层、一个输出层和几个隐藏层。b:神经网络中一个单层结构的光子实现。

图 5:单层脉冲神经网络的实验实现。a:该装置由四个光子神经元组成,每个神经元有 15 个突触。b:输出脉冲强度的变化显示在右侧所示的四种训练模式中。

参考链接:https://www.nature.com/articles/d41586-019-01406-0

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
英伟达研究亮点和启发
Bill 首先简单介绍了他所在研究实验室。这里松散地分为供给方和需求方,供应方试图开发技术 直接为产品组提供更好的 GPU 和更好的电路。另一方面设计方法的架构,以降低使用成本。接着介绍了 NVIDIA 实验室在不同阶段完成的三个最新的研究成果。
用户1324186
2021/09/17
9080
Nature最新:下一代计算架构革命,从“全光学神经网络”开始
光纤能够以光的形式在世界范围内传输数据,成为现代电信技术的支柱。不过如果需要分析这些传输数据,要将其从光信号转换为电子信号,然后用电子设备进行处理。曾经有一段时间,光学被认为是未来最具潜力的计算技术的基础,但与电子计算机的快速进步相比,光学计算技术的竞争力明显不足。
新智元
2019/05/15
1.6K0
Nature最新:下一代计算架构革命,从“全光学神经网络”开始
光速执行AI运算,港科大双层「全光学」神经网络不要计算机也能做分类
在处理模式识别、风险管理以及其他同样复杂的任务时,最强大的计算机都无法与人脑匹敌。但是,近来光学神经网络取得的进展通过模拟人脑中神经元的反应方式缩小了计算机与人脑之间的差距。这种光学神经网络比 ML 中的网络能耗更低、运算更快,是未来大规模应用 AI 的坚实基础。
机器之心
2019/09/03
9860
光速执行AI运算,港科大双层「全光学」神经网络不要计算机也能做分类
光芯片上的全光脉冲神经网络
Nature昨天刊登了德国明斯特大学的一篇最新进展,研究人员在光芯片上实现了脉冲神经网络(spike neural network)。先睹为快,这篇笔记主要介绍下这篇进展。研究人员将氮化硅波导与相变材料结合,实现了监督式和非监督式的机器学习,并演示了对15个像素图片的模式识别。
光学小豆芽
2020/08/13
1.6K0
IEDM 2024:台积电的硅光(高性能工艺平台、CPO、光计算) 进展(一)
台积电在IEDM 2024会议上有好多论文,其中硅光的也有好几篇,看了之后还是很震撼的。
光芯
2025/04/08
3910
IEDM 2024:台积电的硅光(高性能工艺平台、CPO、光计算) 进展(一)
光子存内计算硬件架构:从相变材料到非互易磁光材料的可扩展之路
      本报告是匹兹堡大学Nathan Youngblood助理教授团队,针对光子存算一体架构的可扩展性难题,基于非易失性光学材料展开的前沿技术分享,题目为Scalable Architectures for Photonic Compute-In-Memory Using Nonvolatile Optical Materials
光芯
2025/06/11
1180
光子存内计算硬件架构:从相变材料到非互易磁光材料的可扩展之路
非冯诺依曼新架构:IBM100万忆阻器大规模神经网络加速AI
【新智元导读】众所周知,目前将深度神经网络和生物神经网络进行匹配的研究正处于瓶颈期。而近期,IBM公司Irem Boybat等人在《Nature Communication》中发表的文章,有望改善此难题:他们设计了多记忆突触结构(multi-memristive synaptic architecture),能够在不增加功率密度的情况下提高突触的精度,并在一个拥有100多万台相变存储器(PCM)器件的脉冲神经网络(SNN)中对多记忆突触结构进行了实验演示。
新智元
2018/07/31
9260
非冯诺依曼新架构:IBM100万忆阻器大规模神经网络加速AI
OFC 2025预热(二):短距光互连的明星初创公司们
今天来看看OFC 2025上那些明星初创公司都介绍了哪些有意思的进展。主要介绍的公司之前都有陆续写过,包括Ayar labs,、Lightmatter、Celestial AI、OpenLight、Xscape、Lucidean等。Lightmatter和Celestial AI的验证结果展示感觉是脚步最快、最惊艳的(也体现到他们的融资上),Ayar Labs在瞄准大规模制造优化耦合封装方案,而Xscape、Lucidean公司也有了不俗的进展,Nubis展示了新的应用场景,奇点光子开始露面,Openlight平台在持续演进,昨天Tower新闻稿提到的400G/lane技术看会不会在会场有介绍。
光芯
2025/04/08
4420
OFC 2025预热(二):短距光互连的明星初创公司们
TSMC硅光平台COUPE的最新进展
TSMC在今年四月份展示了其硅光平台的路线图,在2025年实现适用于可插拔光模块的1.6T光引擎,在2026年利用CoWoS封装技术实现适用于CPO场景的6.4T光引擎, 后续进一步发展用于Optical IO场景下的12.8T光引擎,如下图所示。在今年的IEDM 2024大会上,TSMC交上了今年的成绩单,展示了更多的技术细节,信息量非常大,小豆芽这里整理汇总下相关的结果,方便大家参考。
光学小豆芽
2025/06/09
2180
TSMC硅光平台COUPE的最新进展
英伟达首席架构师:GPU性能濒临极限,但我们还有很多压榨套路
说到 GPU 的未来,没有人能比英伟达首席科学家,美国国家工程院、文理科学学院院士,计算机架构大师 Bill Dally 更有资格发表观点了。
机器之心
2021/06/08
5350
基于频率梳的光学神经网络
2021年伊始,Nature杂志在同一期上刊登了两篇光学神经网络的最新进展,标题分别是:
光学小豆芽
2021/03/13
1.6K0
超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊
在人工神经网络中,被称之为神经元的诸多组件被植入数据并协同来解决诸如人脸识别等问题。神经网络反复调整相互间的突触——一种神经元之间的连接,确定由此产生的行为模式是否为更佳的解决方案。但随着时间推移,神经网络最终会在计算的结果中发现最佳的行为模式。而后它会选取这些模式作为默认值,模仿人脑的学习过程。
机器之心
2022/12/15
2780
超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊
光子集成OCS技术:从单材料平台到异质集成平台
剑桥大学的Richard Penty教授在OCP EMEA 2025上做了题目为Photonic Integrated Switch Fabrics:from homogeneous integration to heterogeneous integration的报告,介绍了多年来项目组所研发的多种光子集成光开关技术及其在AI数据中心中的潜在应用及未来演进。 一、光开关技术在AI数据中心的应用背景
光芯
2025/05/17
1760
光子集成OCS技术:从单材料平台到异质集成平台
业界 | Nature:能自主学习的人工突触,为无监督学习开辟新的路径
选自Nature 机器之心编译 参与:蒋思源、刘晓坤 近日,Nature 发表了一个研究团队开发的一种能自主学习的人工突触,它能提高人工神经网络的学习速度。该研究表明记忆就是神经元间相连接突触的强度分布所表示,而学习可以通过突触的重新配置(即可塑性)而实现。这种能自主学习的人工突触有助于无监督学习的进一步发展。机器之心对该研究进行了简要介绍,详细的研究论文请查看 Nature 上的论文。 模拟大脑 人工智能的发展和进步很大程度上归咎于人类大脑模拟技术的支持。在信息技术领域中,这样的 AI 系统被称作神经网络
机器之心
2018/05/08
1.2K0
业界 | Nature:能自主学习的人工突触,为无监督学习开辟新的路径
MIT新突破:Nature Photonics揭秘新型光学深度神经网络系统
选自MIT 作者:David Chandler 机器之心编译 参与:吴攀、黄小天、蒋思源 尽管科学家和研究者一直在探索新型的计算形式,但目前电子计算仍然是绝对的主流。随着以深度学习为代表的人工智能技术的兴起,人们也开始关注如何开发出能更有效、更高速地执行神经网络运算的计算硬件。近日,麻省理工学院(MIT)的研究者在 Nature Photonics 上发表的一篇论文《Deep learning with coherent nanophotonic circuits》提出了一种使用光子技术实现神经网络的方法
机器之心
2018/05/08
1.6K0
MIT新突破:Nature Photonics揭秘新型光学深度神经网络系统
Nature:用光子处理器提升人工智能计算速度
随着人工智能的兴起,传统的电子计算方式逐渐达到其性能极限,远远落后于可处理数据的快速增长。在各种类型的AI中,神经网络由于其出色的表现而被广泛用于AI任务中。这些网络使用多层相互连接的人工神经元执行复杂的数学运算,其中占用了大多数计算资源的基本运算是矩阵向量乘法。
机器之心
2021/01/20
8890
光子学与人工智能的融合:光互连、光交换、AI辅助光子设计、光计算
在科技飞速发展的当下,光子学与人工智能(AI)的融合成为了前沿热点领域。这一融合不仅为AI的发展注入了新动力,也为光子学开辟了更广阔的应用空间。今天就来分享一篇来自Coherent公司DCTO陈博士(Young-Kai Chen,IEEE终生fellow)的邀请文章,深入剖析这一极具潜力的领域。
光芯
2025/04/08
3310
光子学与人工智能的融合:光互连、光交换、AI辅助光子设计、光计算
首个光电子神经网络问世,速度快3个数量级,扩展人工智能新疆域
【新智元导读】 光学计算一直被计算机科学界寄予厚望 。光子具有比电子多得多的带宽,因此可以更快地处理更多的数据。但是光学数据处理系统的优点从未超过制造它们的额外成本,因此从未被广泛采用。近日,普林斯顿大学的研究员宣布开发出了世界上首个光电子神经网络芯片,有效硬件加速提升至少3个数量级。 神经网络正在以席卷之势占领计算世界。研究人员使用它们来创建机器,让机器学习大量的此前是人类特有的技能:对象识别,面部识别,自然语言处理,机器翻译等。所有这些技能,以及更多更多的技能,现在正成为机器的“标配”。 因此,创建
新智元
2018/03/26
7250
首个光电子神经网络问世,速度快3个数量级,扩展人工智能新疆域
戴琼海团队新作登上Nature:提出光电可重构计算模式,迈向AI新时代
4月12日,一篇题为“Large-scale neuromorphic optoelectronic computing with a reconfigurable diffractive processing unit”的论文登上Nature子刊《Nature Photonics》。
AI科技评论
2021/04/16
2.3K0
戴琼海团队新作登上Nature:提出光电可重构计算模式,迈向AI新时代
惠普实验室:大规模III-V/Si异质集成光子器件平台助力下一代光计算(二)
在人工智能和机器学习快速发展的背景下,构建高效的光子集成电路对于提升计算性能至关重要。传统的电子计算架构在处理大规模 AI 任务时面临着诸多挑战,如能耗高、计算速度受限等,而光子集成电路凭借其独特的优势成为解决这些问题的关键研究方向。 (一)张量化光神经网络(TONN) TONN 的出现源于对 AI 计算效率的追求,模型压缩技术中的修剪方法为其提供了灵感。在传统的光神经网络中,随着模型规模的扩大,计算资源的消耗呈指数级增长,严重限制了其应用范围。
光芯
2025/04/08
1110
惠普实验室:大规模III-V/Si异质集成光子器件平台助力下一代光计算(二)
推荐阅读
英伟达研究亮点和启发
9080
Nature最新:下一代计算架构革命,从“全光学神经网络”开始
1.6K0
光速执行AI运算,港科大双层「全光学」神经网络不要计算机也能做分类
9860
光芯片上的全光脉冲神经网络
1.6K0
IEDM 2024:台积电的硅光(高性能工艺平台、CPO、光计算) 进展(一)
3910
光子存内计算硬件架构:从相变材料到非互易磁光材料的可扩展之路
1180
非冯诺依曼新架构:IBM100万忆阻器大规模神经网络加速AI
9260
OFC 2025预热(二):短距光互连的明星初创公司们
4420
TSMC硅光平台COUPE的最新进展
2180
英伟达首席架构师:GPU性能濒临极限,但我们还有很多压榨套路
5350
基于频率梳的光学神经网络
1.6K0
超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊
2780
光子集成OCS技术:从单材料平台到异质集成平台
1760
业界 | Nature:能自主学习的人工突触,为无监督学习开辟新的路径
1.2K0
MIT新突破:Nature Photonics揭秘新型光学深度神经网络系统
1.6K0
Nature:用光子处理器提升人工智能计算速度
8890
光子学与人工智能的融合:光互连、光交换、AI辅助光子设计、光计算
3310
首个光电子神经网络问世,速度快3个数量级,扩展人工智能新疆域
7250
戴琼海团队新作登上Nature:提出光电可重构计算模式,迈向AI新时代
2.3K0
惠普实验室:大规模III-V/Si异质集成光子器件平台助力下一代光计算(二)
1110
相关推荐
英伟达研究亮点和启发
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档