在昨天的开发者大会上,谷歌宣布推出用于人工智能和机器学习的第三代TPU,其功能比Google TPU 2.0多八倍,性能高达100 petaflops。它们耗电量大,需要水冷。ExtremeTech报道:那么我们对TPU 3.0了解多少?不多, 但我们可以做出一些有教育意义的猜测。根据Google自己的文档,TPU 1.0建立在台积电28nm工艺节点上,主频为700MHz,功耗为40W。每个TPU PCB通过PCIe 3.0 x16连接。TPU 2.0做了一些重大改变。与只能处理8位整数操作的TPU v1不同,Google增加了对TPU v2中单精度浮点数的支持,并为每个TPU增加了8 GB的HBM内存以提高性能。一个TPU集群包括总计算能力180 TFLOPS,总计64GB的HBM内存,以及总共2,400GB / s的内存带宽。
对于处理器的其他高级功能还没有任何说法,而且它们应该仍然是Google自己使用的,而不是更广泛的采用。Pichai声称TPU v3可以处理100 PFLOPS,但这必须是聚簇式的,除非谷歌正在推出一个新的试验性项目,我们称之为“谷歌恒星等效热密度”。如果是这样的话,我们会希望听到这个消息。随着越来越多的公司涌向AI / ML旗帜,期待看到更多的公司加入这个领域进行挑战。
领取专属 10元无门槛券
私享最新 技术干货