如果我们把喜马拉雅山炸开一道甭多了50公里宽的口子,世界屋脊还留着,把印度洋的暖风引到我们这里来,试想一下,那我们美丽的青藏高原从此摘掉落后的帽子不算,还得变出多少个鱼米之乡?——电影《不见不散》
作为贺岁片的代表作,这部电影已经深入人心,许多人对葛优的这段台词也是耳熟能详。但可能许多人不知道,这段话并非是葛大爷或者编剧的临时创作,而是有着确切的出处。早在20多年前,中华大地上就有人提出了这样的构想,这个人叫做牟其中。围绕在他身边的是是非非并不是我们今天要讨论的问题,我们只是好奇“炸开喜马拉雅山”这件事,真的靠谱吗?
“我们当然不能真的去炸山,但是我们可以采用数值模拟的手段,制造一个虚拟的地球。任何有趣的想法、大胆的想法、天马行空的想法,都可以借助数值模拟去实现”,清华大学地球系统科学系副教授、地球系统数值模拟教育部重点实验室副主任黄小猛博士如是说。
黄教授的主要研究方向包括海洋模式、并行计算和大数据,即通过计算机进行地球系统数值模拟的相关研究,简称为地学研究。“地学是一个非常古老、非常重要的基础学科,在传统地学当中,我们研究的主要对象就是我们人类赖以生存的地球环境,包括大气圈、水圈、冰雪圈、岩石圈、生物圈等等,还包含地幔、地核等等,构成有机的整体”。
但是由于地学研究的特殊性,不可能向生物、化学实验那样进行人工操作,一方面是物理条件不具备,另一方面则是投入的财力、物力、人力不可估量,所以更多时候地学研究都是基于高性能计算进行模拟,也就是与计算机科学紧密的结合在一起。
虽然听起来地学研究相当高大上,甚至让人觉得有些高不可攀,但其实它与我们每个人的生活都是息息相关的,比如我们每天都在看的天气预报就是基于地学研究而实现的。我们经常听到全球气候变暖这样的说法,而地学研究其实早就对这一现象进行了计算机模拟仿真,从而用科学手段和计算数据指导我们的生产与生活。这一切,都得益于地学研究与计算机应用的突破。
“在地学研究中,高性能计算机主要应用在三个方面,首先是海量数据的分析和处理,其次是将这些数据应用到地球数值模拟的模型当中,最后则是在计算的精度上进行提升,从原本的10公里精确到1公里甚至更小的范围”,黄教授介绍说。
乍听起来,这些应用并没有什么新奇,但是在实际科研中每一项进步都面临着巨大的挑战。比如在最初的海量数据分析中所需要处理的数据量非常巨大,其中包括了观测数据、模型输出数据、实测观测台站的数据等等。按照2011年《Science》杂志相关文章的介绍,到2030年需要进行的模拟数据总量将要超过300个PB,这也势必要求用于处理的高性能计算机具备强大的计算能力和海量的存储空间。
同样,面对如此庞大的数据,如何将其应用在系统模型当中,如何借助于公式进行海量数据的计算,也对计算机的性能产生了进一步的挑战。我们知道,传统地学应用的公式都是得益于科学推演,而在海量数据的应用规模下,进行这样的推演将耗费巨大的时间。如果能够将计算机的性能提升10%哪怕是1%,都会节省大量的科研时间。
而精度的细化更使得地学研究面临巨大的挑战。许多人都听过《国王与麦子》的故事,棋盘上每个方格所需要的麦穗会呈指数级增长,同样当我们将计算范围从10公里精确到1公里,所需要的计算量则对应提升了成百上千倍,这也对高性能计算机的性能产生了进一步的需求。“据我所知,我国最快的神威太湖之光计算机有大约一半的算力都在进行地学应用模拟”,黄教授补充说。
但是这依然远远不够。从以上三点我们可以看出,地学研究对于高性能计算机和高性能计算能力有着近乎无限的需求,同样计算机的发展程度也影响了地学研究的发展状况。那么,难道我们就需要默默等待计算机的发展,在这个“后摩尔定律”时代等待硬件性能的小幅度提升吗?是否有一种技术快速吻合地学发展的需求呢?
答案就是四个字——人工智能。其实如今,人工智能计算已经融入我们生活的方方面面,我们出行、购物等许多方面都可以看到AI的身影。同样在科研领域,AI也在帮助像黄教授这样的专家们解决实际遇到的问题,并且为地学研究提供了另一种实现的可能。
“AI有强大的能力,就是从大数据当中找规律,增强我们对地学的某些现象的预测能力。比如我们对于高温热浪、冰川冰雪的融化等自然灾害一直采用的是传统的数理方程或者是统计方法进行预测,但是在积累了大量的数据之后,我们还可以通过AI进行数据分析、推理和预测,充分发挥AI非线性拟合的能力”。黄小猛教授介绍道。
浪潮人工智能与高性能产品部应用开发负责人刘羽对于AI与HPC的融合也有自己的理解。在他看来,其实不仅仅是地学研究,包括整个HPC应用都与AI有着密切的关系:“传统的HPC是用我们已知的物理方程进行大量的演化,计算量非常大,但是也因为模拟时间很长,会积累一些误差,某些混沌现象也可能会放大;但是在借助于AI之后,因为AI是基于数据提炼的方法,就好比经验丰富的老专家,就可以把传统计算过程中的明显错误进行修正,预测的精度和整体的时间纬度预测可以更长”。
除了能够弥补传统计算误差的问题之外,在计算资源的需求方面,AI也要小得多。所以对于类似于APEC或者奥运会之类的重大需求,就可以通过AI进行场馆周边半小时或者一小时为频次、甚至几分钟之内的气象预报模拟计算,保障重大活动的进行。这也是HPC与AI互补的重要体现之一,或者从另一个角度来说,至少在天气预报领域,AI可以为传统HPC提供有效的辅助作用。
“地球是一个庞大的星球,人类观测有卫星开始的数据也不过就三十几年,这样的数据跟我们想研究的地球亿万年年龄相比较,还是非常稀疏的。所以我们认为在未来相当长的时间内,AI还是以辅助的姿态与传统模型结合,甚至可以将模型输出的数据用来训练AI,进一步促进两者之间的融合”, 黄教授表示。
当然,相对于传统HPC应用来说,AI应用还比较“年轻”,无论是借助于深度神经网络还是其他技术,都需要全新的知识体系来掌握,自然也需要相关人才的培养。在这一点上,浪潮与清华大学一直以来都有密切的合作,两者甚至设立了计算地球科学的人才基金,奖励40岁以下从事计算地球科学的青年人才。
“我们希望让更多专注于相关研究的青年科学家们共同推动奖项建设,也推动计算地球科学方向的发展,让越来越多的人,特别是学生和青年人,能够参与我们这个方向的建设”,黄小猛教授感慨道。
领取专属 10元无门槛券
私享最新 技术干货