美国ADI公司和普林斯顿大学合作通过改变计算的基本属性,实现集存储和计算功能于一体的可编程芯片,加速人工智能发展,并削减功耗。
成果概述
该芯片基于一种被称为内存计算的技术,可在内存中计算,消除冯诺依曼架构中最主要的计算瓶颈(迫使计算机处理器需要花费时间和能量从内存中获取数据),内存计算直接在存储中执行计算,从而提高速度和效率。该芯片已集成到可编程处理器架构中,可采用标准编程语言,如C,尤其适合依赖高性能计算但电池寿命有限的手机、手表或其他设备上使用。
核心技术
在某种程度上,新芯片是对摩尔定律放缓预期的回应。电气工程副教授Naveen Verma专注于电路和系统设计,考虑了在架构级别而不是晶体管级别上实现摩尔定律(在相同面积内放入更多晶体管)。如果AI可以在与计算机内存相同的位置进行,则AI所需的计算将更加有效,因为将消除用于获取远处存储的数据的时间和能量。如果不升级晶体管,这将使计算机更快。但是创建这样一个系统提出了挑战。存储器电路设计得尽可能密集,以便打包大量数据。另一方面,计算要求将空间用于额外的晶体管。
一种选择是用称为电容器的电子元件替代晶体管。晶体管本质上是使用电压变化代表构成二进制计算机信号1和0的开关。可以使用1和0阵列进行各种计算,这就是系统被称为数字的原因。电容器存储和释放电荷,因此可以代表任何数字,而不仅仅是1和0。Verma意识到,使用电容器,他可以在比晶体管更密集的空间内进行计算。
电容器也可以非常精确地制作在芯片上,远远超过晶体管。新设计将电容器与芯片上的静态随机存取存储器(SRAM)的传统单元配对。电容器和SRAM的组合用于对模拟(非数字)域中的数据进行计算,也可以可靠且易于包括可编程性特征的方式进行计算。现在,存储器电路可以芯片的中央处理单元指示的方式执行计算。
结果测试
在发布芯片成果的同时,也发布了可对其进行编程的系统。电路的实验室测试表明,该芯片的性能比同类芯片快几十到几百倍。但是,最初的芯片并未包含最新版本的所有组件,因此功能有限。
自评
Verma小组的研究生兼芯片设计者之一的Hongyang Jia说:“以前的芯片是有力而强大的引擎。这款芯片就是整个一辆车。”虽然该芯片有广泛应用前景,目标是支持为深度学习推理而设计的系统,这些算法允许计算机通过学习数据集来制定决策和执行复杂的任务,指导自动驾驶汽车,面部识别系统和医疗诊断软件。
Verma表示,对于许多应用而言,芯片的节能与性能提升同样重要。这是因为许多AI应用程序将用于移动电话或可穿戴医疗传感器等由电池供电的设备。例如,Apple iPhone X已经将AI芯片作为其电路的一部分。但是,如果能够通过需要它们的广泛应用程序访问它们,那么节能和性能提升都是有用的 - 这就是对可编程性的需求所在。
Verma说:“内存计算近年来已展现众多前景,真正解决了计算系统的能量和速度。最大问题是,这个前景是否可扩展并用于我们真正关心的所有AI应用程序。这使得可编程性变得必要。“
领取专属 10元无门槛券
私享最新 技术干货