首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

海底下的智算中心,到底怎么把算力价格“打下来”?

早在几十年前,就有科幻作品幻想出把智能计算集群放置在水下和海底的场景。后来的科幻作品中,也不乏类似的设定。像是《流浪地球2》中泡在水里的根服务器,大家一定都印象深刻。

在现实中,也有一些海外顶尖科研机构正在进行相关的探索,但是大多都缺乏落地价值,仅仅作为他们用来“炫技”的“黑科技”。在最近这两年,随着我国科技实力的不断增强,海底数据中心已不止是海外的实验室秀肌肉的产物,而是于2023年在我国正式实现了商业运营。

2月19日,央视新闻报道了关于我国海底数据中心发展的最新动态。一个新的数据舱于2月18日被放入海底,与正在运营的海底数据中心相衔接,构成海南海底智算中心集群。据了解集群当前计算能力相当于约3万台高端电脑同时运算,1秒可完成普通电脑一年的计算量。

海南海底智算中心项目正是由国内海底数据中心的先行者海兰云主导,目前已完成675PFlops的高质量算力集群建设。智算中心正式启用后,将整舱交付给并行科技,为其综合算力服务提供有力支撑。该公司在海底数据中心的建设运营上有着丰富的经验,也是全球为数不多的有着商业化运行的海底数据中心项目的公司。海兰云第一座海底商业数据中心,已经放置海底运营一年有余。这一年多的时间里,各项运营指标和业务指标均十分优异。

海底数据中心由一个个水下数据仓和一整套相关设施构成。数据仓有着特殊的外壳,其数据仓里填充的气体,能够隔绝海洋对于数据中心的影响。其中搭载的服务器可以为当地AI企业和应用提供绿色算力。海底数据中心以天然海水为冷却源,一方面使得其极大的降低散热成本,节能减排降耗效果优异,另一方面运行时隔绝了外界环境干扰,更加平稳安全。

不光央视在此前已多次报道海南海底数据中心动态,就在昨天,人民日报也在头版内容提及海底智算中心。那么,为什么要把AI算力中心建设在海底呢?

算力成本细细说

自从以大语言模型为代表的AI产业火爆全球以来,高昂的算力成本一直是摆在AI普及面前最大的门槛,不论是训练端还是应用端,成本问题让绝大部分国家都望而却步。到目前为止,全球也只有中美两个AI赛道头部玩家。

最基本的成本就是GPU和服务器设备的购置价格。这一点各家基本上成本都差不多,除非能在Nvidia这里有什么独门砍价秘籍。10万规模的H100服务器,建设成本基本上都在40亿美元的级别。这还要考虑电力供给。

剩下的就是维持算力运转的成本,主要的大头就是电费。所谓“AI的尽头是电力”,这句话不是空穴来风的。大模型的参数量达到万亿级别,驱动着智算中心的组网规模向五万卡,甚至是十万卡级演进。

做一个简单的估算,一个10万卡集群每年耗电量约为1.59太瓦时(即15.9亿千瓦时),按照美国电力的标准费率0.78美元/千瓦时,每年的用电成本就达到了1.24亿美元。

把这个成本再乘以1.8就是数据中心的运营耗电和费用,而这多余的耗电,则是用来给这个10万卡集群散热的。总耗电量约在28亿千瓦时。

这个规模的电量是什么概念呢?我国是全球发电能力和耗电量都排第一的国家,再加上人口众多,一个普通一点的地级市年耗电量差不多也就在40-200亿千瓦时。注意,这200亿可是除了居民用电外,还包括了整个社会层面的工业用电。

也就是说,一个10万卡计算集群,一年差不多就耗了一个中等规模的城市六分之一,小型城镇一整年的耗电量。大型智算中心就像是EVA中的自走阳电子炮,一个大型集群,就消耗一座城市的全部电力。为了供养AI大模型,全城人都不能开空调、看电视,这消耗未免也太令人咂舌。

有调研显示,水电费支出占到了数据中心运营成本的60%以上,而智算中心GPU的密度进一步增加,电量负荷会倍数增长,直接导致云厂商的成本激增。

于是为了减少电费,云厂商和数据中心服务商们可谓是想尽了办法,比如将数据中心建在高纬度,气候严寒的地区。

无论何种方法,核心都是借助自然的伟力——天然低温来进行自然冷却,减少依靠空调,液冷等电力设备降温。

而这些自然冷却方案中,利用海水作为天然冷源的海底数据中心无疑是最有“减电”竞争力的。但是相比陆地数据中心,水下环境的复杂度更高,布线、维护更为麻烦,为什么还能成为一种选择?

因为海底数据中心的成本“第一刀”,就把自然冷却效果打到了“地板价”。作为冷却效果最极致的解决方案,海底数据中心直接利用了海水的低温特性,比其他物质(如空气冷却、风力冷却)吸收更多热量,大幅减少了额外的冷却需求。

同时,由于海底环境本身就提供了有效的冷却,因此可以减少对空调系统的依赖和能耗。可以说,利用水流带走热量,海底数据中心节能降耗的成本优势最为显著。

不止是省电,而且更省水

除耗电成本外,数据中心散热带来的另一大成本消耗是水。而海底数据中心的独特优势正好是不光省电,而且更省水。

现在的数据中心,因为热量产生的实在太过迅速,导致传统的风冷已经无能为力。所以这个时候就需要液冷,或者利用水来带走GPU的热量,因此就会造成大量的水资源消耗。

为此在PUE之外产生了一个衡量数据中心水资源利用效率的指标WUE(Water Usage Effectiveness),水资源利用效率。早些年的数据中心,内中大多还是CPU设备,当时的热量风冷设备基本上绰绰有余。但到了现在,由于智算算力产生的热量太多,风冷的能力就捉襟见肘。大量的设备改用水冷液冷。很多数据中心消耗的水资源甚至已经开始给附近的城镇造成了用水紧张。2023年,美国亚利桑那州就因为担心水资源消耗问题,限制当地数据中心建设。

而降低WUE的核心就是减少分子——输入数据中心的水量,主要由冷冻补水、冷却补水、加湿补水等生产用水组成。冷却过程中消耗的水资源越少,WUE就越高。

把数据中心泡在海里,就能减少生产用水吗?可以,而且甚至是0。

一方面,海底数据中心直接使用周围水体的低温来冷却服务器,无需蒸发散热,省去了传统数据中心中的冷却塔和冷水系统,用于冷却的水资源消耗等于0。

此外,海底数据中心冷却过程中蒸发的水分直接回到水体中,对于公共水源来说也几乎没有损失。一些干旱缺水的地区,如果利用湖泊、河流、地下水来降温,蒸发的水资源却未必能快速回到当地的水系之中,会给当地水环境带来负面影响。而海底数据中心即使产生一些热蒸腾,也会很快被广阔的海洋代谢掉,不会影响到当地的水循环。

而海底数据中心以海水为自然冷源,最大的优势是减少能耗,同时几乎不消耗淡水资源,可以支持更高的功率密度,进而提升算力。

海洋与陆地的成本趋势

数据中心由陆向海还有很多额外的优势。比如,数据中心内各种电器设备密集,火灾隐患大,因此,全球的数据中心都格外注意防范火灾。海底数据舱内充入了惰性气体,无氧无尘、密闭隔绝的空间可进一步保护服务器电子器件,减少事故发生。

除此之外在陆地上建数据中心,自然要占用土地空间,除了土地成本之外,一些天然气温较低的寒冷内陆城市和地区,基础设施条件一般也没有沿海地区发达,比如北极圈,导致TCO总体拥有成本上升。

尤其是随着超万卡集群的到来,对陆地上的数据中心/智算中心配套设施,比如供电、承重、机房洁净度和走线架设计等提出了极高要求。

《面向超万卡集群的新型智算技术白皮书(2024年)》显示,由于超万卡集群的算力密度更高、功耗密度更高,线缆的布放量也随之增大,一个1.8万卡的智算集群,需要布放10万量级的线缆,这将对走线架的宽度和承重带来新的挑战。

可以说,陆地数据中心/智算中心的总体成本正在走高。与之相比,海底数据中心的建设成本正在下降,二者之间的“剪刀差”越来越小。

海兰云的商用海底数据中心首批数据舱于2022年12月下水,目前运行稳定,各项数据检测正常,相较于同等体量的服务器,整体能效提升40%至60%。而正在建设中的海底智能算力,具有高算力、低能耗、高安全、低时延的优势。

“满舱的智算中心设备就像一台海底的‘超级计算机’,一台数据舱的服务器比陆地机房更加密集。计算能力相当于几万台传统电脑同时运行,能在几十秒内处理超过上千万张高清照片。整个海兰云海底智算中心将会是一云双芯底座,接入国内智算资源池,按需调度资源,提供通用计算和智能计算服务。

前景广阔的海底智算

关于最重要的安全和稳定性问题,海底数据中心在这方面的指标可谓超乎人们的想象。毕竟沉入海底的数据舱并非就此成为“孤岛”,它像风筝一样,被海底光电复合缆所链接,依托水下分电站,时时刻刻与岸站保持紧密的联系,构成完整的海底数据中心。海底光电复合缆联通其余3部分,将电力和网络分配到每一个独立的海底数据舱。

而每一座数据舱的内、外部环境和各项参数,都可以在岸站总控室内的大屏幕上一目了然。舱内的监测设备实时记录每一台服务器的运行、负载状况;客户运营业务情况也可通过数字系统呈现。

相较于陆上数据中心,海底数据中心的岸站占地仅数百平方米,需要的工作人员不到10人。这也是海底数据中心的优势之一——通过智能远程操控系统,可减少运维人员日常巡检工作,降低后期运营成本。

安全保障方面,海兰云团队先后攻克海底密封安全性、海生物环境抗附着及腐蚀能力等技术难题,数据舱的设计寿命达到25年。

几十米深的海水也是天然屏障,降低了自然灾害风险。哪怕是台风、地震等极端工况条件下的外部冲击,都能很好地承受。比如根据2023年7月发布的半年度运营报告,第4号台风“泰利”几乎未对海底数据中心造成影响。

除此之外,还有着岸基雷达监控系统。将海底数据中心区域划成内部核心区和外部监控区,时刻紧密监视这片海域的异常。一旦不明船只,海洋生物等经过或靠近海底数据中心,岸站会收到警报,快速处置。

而在更广阔的市场需求的层面上,离岸数据中心需求正在日益增长。海兰云的海底智算中心面向海外市场,有着得天独厚的地理区位优势。不仅能够为数字经济发展提供底层支撑,还将助力海南自贸港跨境数据安全有序流动。

与此同时,2024年5月,Natick项目第二期已经开始,反映出微软对智算数据中心解决方案的持续追求。境内,海外,都在纷纷投入资源进入海洋智算这一赛道。

目前,《海南省海洋经济发展“十四五”规划》明确支持海底数据中心建设,规划将海底数据中心列为“海洋新型基础设施”重点工程,填补海洋工程与数据中心融合发展的空白。考虑到海南独特的地理和环境条件,海底智算中心项目充分利用海洋资源,实现了绿色低碳发展。这种因地制宜发展新质生产力的模式,不仅符合海南的自然环境特点,也为其他地区提供了可持续发展的新思路。

算力即国力的未来已经肉眼可见。在这个可预见的未来里,海洋智算这一赛道将会是一个多方角逐,共通参与的系统工程,其重要性将会日益凸显。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OSaj0OAw6rLm5XQCX2Ch_1OA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券