北京时间12月15日凌晨,NASA联合谷歌公布了一项重大发现:在2545光年外,找到一颗新行星——开普勒90i,这使得人类首次在太阳系外,找到由8颗行星组成的行星系统。而在这一发现背后,是人工智能在系外行星搜索中的突破性应用。
编译 许楠、顾金涛
编辑 吴非
数年前,开普勒天文望远镜在2545光年外发现了一颗大小与太阳相近的恒星:开普勒90。在随后的观测中,科学家发现了更多与太阳系相似的特征:开普勒90拥有7颗行星,且较小的行星距恒星更近,而更大的行星占据外侧轨道。
在刚刚公布的这项新发现中,NASA与谷歌联合找出了该行星系统的第8颗行星:开普勒90i,这使得人类首次在太阳系外,找到由8颗行星组成的行星系统。
艺术家笔下,开普勒90行星系统中的8颗行星(行星大小按比例描绘;距离不按照比例)
新发现的开普勒90i同样是一颗类地行星,它比地球大了约30%,是该行星系统中距恒星第三近的行星。但与地球相比,开普勒90i离恒星更近,公转一周仅需14.4天,而其宿主恒星也比太阳更热,因此它的表面平均温度可能超过了800华氏度(约427摄氏度),与水星接近。显然,这个温度对于生物来说显得太高了。
事实上,整个开普勒90行星系统就像是一个被压缩的太阳系:即使是最外侧的行星开普勒90h,与宿主恒星的距离比日地距离还要短。
开普勒90行星系统与太阳系的轨道对比
这个被称作“第二个太阳系”的行星系统不含宜居的行星,这可能让很多人略感失望。但相比于开普勒90i本身,这项研究更重大的意义在于,人工智能手段开始参与系外行星的搜寻,并且首次为人类找出此前被遗漏的行星。
开普勒太空望远镜
相比于主动发光的恒星,黯淡、渺小的系外行星往往难以直接观测。但当行星从其宿主恒星前方穿过时,会遮住恒星的一部分光线。因此,我们观测到恒星亮度出现微弱的下降,呈现出下图所示的“U”型曲线。通过这种“凌星”现象,我们能够对系外行星进行间接探测。
2009年升空的开普勒太空望远镜,正是通过凌星法,连续扫描了超过15万颗恒星,以检索恒星表面产生的微弱亮度变化。2014年,开普勒由第二任务K2接班,K2任务在范围更小的数据库基础上捕捉系外行星,甚至还进行了许多其它观测。2014年,开普勒的第二阶段K2项目启动,在范围更小的数据库基础上捕捉系外行星,并对其进行多项观测。
开普勒的行星捕捉任务获得了不可思议的成功。截至目前,开普勒项目已经确认了超过2500颗系外行星——数量约为目前已知行星的三分之二;同时,还有超过2000颗“候选行星”等待进一步的观测、分析进行确认。
尽管开普勒项目已经取得丰硕的成果,但很多人相信,在开普勒数据库中,还有很多重要信息有待挖掘。而限制我们进一步分析这些数据的因素,是软件的分析速度及分辨率。开普勒太空望远镜每30分钟对浩瀚宇宙拍摄一张照片,一共创造了大约 140 亿个数据点,其中包含了35000个可能的行星信号。即便是对于最强大的计算机来说,这也是海量数据,分析起来既耗时又费力。另一个问题在于,通过自动化检测或用肉眼检测,我们可以发现数据中最有可能的信号。然而,最微弱的信号通常会被这些方法忽略。
用人工智能搜寻系外行星
当谷歌AI团队的高级软件工程师Christopher Shallue发现,人类从太空获取数据的技术在不断发展,但海量数据已经将天文学淹没时,他提出一个设想:或许,我们可以将神经网络应用于开普勒数据的分析。
在这一过程中,他与德克萨斯大学奥斯汀分校的天体物理学家Andrew Vanderburg进行合作,将机器学习技术运用到了太空探索中,让机器学会了识别绕着遥远恒星公转的行星。
研究人员用超过 1.5 万个经过标记的开普勒太空望远镜信号的数据集,对机器学习系统进行训练。为此,系统需要能够辨别出行星的特征,并且能够与恒星黑子、双星系统和其他天体进行区分。随后,他们利用这个系统来测试未曾分析过的信号,系统识别行星信号和非行星信号的准确率高达 96%。因此,研究人员相信,该方法能够在行星搜寻中发挥作用。
通过该系统,研究人员对670个已知至少包含两颗行星的系外星系进行了检测,并从中发现开普勒90i。
“我们找到了许多假阳性行星,但是也可能存在更多的真实行星,”Vandnerburg如是说。“这个过程就像从石头中找寻宝石,如果你用一个更细的滤网,那么你在得到更多石头的同时,也会找到更多的宝石。”
开普勒90i并不是这个神经网络筛选出来的唯一宝石。在开普勒80行星系统中,他们还找到了该星系的第六颗行星——和地球大小相近的开普勒80g。它与相邻的四颗行星构成了一条“共振链”——行星被彼此的重力拴住,在轨道上有节律地共舞。如此一来,便与TRAPPIST-1星系(包含7颗地球大小的类地行星的行星系统)中的七颗行星相似,形成非常稳定的系统。
人工智能在系外行星搜寻中的应用才刚刚起步。Vandnerburg在新闻发布会中提到,“在开普勒90行星系统中,可能有很多尚未发现的行星,如果这颗恒星周围没有更多了行星了,或许才会令我感到惊讶。”
开普勒90是我们在太阳系以外发现的第一个拥有八颗行星的行星系统,但很显然,它不会是最后一个。我们期待,人工智能会将我们对宇宙认知提升到一个新的高度。
在Reddit论坛上,NASA与谷歌的研究人员回答了读者的提问,以下为问答精选:
问:我想知道当James Webb接替了哈勃之后,谷歌AI是否会用来协助它工作?另外,在未来10-20年中,我们可以期待用James Webb观测到什么?我们能否用AI和James Webb来确定是否真的存在人类宜居星球?
答:谷歌AI或者其他机器学习工具在未来的任务,如Webb, Tess或者其他任务中,可能会被用来进行数据分析。就像Chris和Andrew合作从公共数据库中发掘出了Kepler数据库,其他NASA新旧数据库中的数据也可能被发掘出来,进行进一步的研究。在未来10-20年中,我们预计会继续统计系外行星数量并对之进行勘测(如测量重量、大小等性质),甚至可能会用日冕仪或星冕仪技术直接成像。我们的目标是回答这个历史性问题:我们孤单吗?通过Webb, Tess及其他任务,我们有希望回答这个问题,但是很难说是在下一个十年、二十年,还是需要更久……——Kartik Sheth, NASA HQ
问:Kepler的分辨率是多少?如果用它来观测冥王星和海王星,会看到什么?而在观测系外行星时,又看到了什么?
答:Kepler的分辨率约为6角秒,在天文望远镜中相对较低——与之相比,哈勃望远镜的分辨率要好60倍。原因在于Kepler主要注重视角的广度。Kepler观测海王星的影像在以下链接中,虽然图像不精美,但是亮度测量确十分精准。https://www.youtube.com/watch?v=Tw-q3uM_5_0 ——Andrew V, UT Austin
问:文中提到采用卷织神经网络(convolutional neural networks , CNN)筛选“候选星”清单,但是CNN擅长二维数字信号分析。所以分析中,输入CNN的信息是恒星的光变曲线还是影像?
答:问得好!CNN的确如你所说,通常用来分析二维影像,但是他们还可以用来分析N维数字信号。实际上,彩色图片就是三维数字信号,因为它们有两个空间维度和一个色彩维度(RGB),彩色视频就是四位数字信号,因为它们还有时间维度。在这个项目中,我们训练了一维CNN,输入信息为一维的光变曲线,即随不同时间光亮度的值。——Chris Shallue, Google AI
问:机器学习很像魔术中,会产生不可思议结果的暗箱,在你们不知道它的实际过程时,研究的科学价值不会因为这个程序而受到质疑吗?
答:我们开发机器学习模型时,我们特地移除了一些标记的训练数据片段——约10%。然后,当我们的模型完成训练后,我们用这些该模型从未见过的10%的数据来进行测试,在此过程中,我们发现模型完成测试的正确率为96%。就对机器学习系统的了解来说,我们具备观测模型“内部运作”的技术,因此可以帮助我们了解为什么它们会做出某些决策。我们开发了一些使神经网络可视化的方式,它们在Kepler信号中发挥了作用。一般来说,神经网络本身并不是不可解读的,并且还有一个宏观的研究正在对探测和了解神经网络的工具进行进一步开发。
https://www.nasa.gov/press-release/artificial-intelligence-nasa-data-used-to-discover-eighth-planet-circling-distant-star
https://www.space.com/39099-alien-solar-system-with-eight-exoplanets-discovery.html
https://nasa.tumblr.com/post/168542791629/researchers-just-found-for-the-first-time-an-8th
https://en.wikipedia.org/wiki/Kepler-90
https://www.reddit.com/r/science/comments/7jrexn/science_ama_series_were_planet_hunters_from_nasa/
领取专属 10元无门槛券
私享最新 技术干货