近日,由中国科学院上海天文台教授葛健带领的国际团队,创新了一种深度学习算法,成功在开普勒卫星2017年释放的恒星测光数据中发现了5颗直径小于地球、轨道周期短于1天的超短周期行星,其中4颗是迄今为止发现的距其主星最近的最小行星,类似火星大小。
这是天文学家首次利用人工智能(AI)一次性完成搜寻疑似信号和识别真信号的任务,相关研究成果发表于《皇家天文学会月报》。
艺术想象图。中国科学院上海天文台供图
“终于有了第一份收获”
2015年,人工智能AlphaGo取得重大突破,打败了围棋界的职业高手。
葛健受美国佛罗里达大学计算机系同事李晓林教授的激励和启发,决定试图把AI的深度学习应用在开普勒卫星释放的测光数据中,寻找开普勒卫星使用传统方法没能找到的微弱凌星信号。
“要想使用人工智能在海量的天文数据中‘挖’到极其稀少的新发现,就需要创新的人工智能算法,同时用人工数据集做训练,使之能快速、准确、完备地探寻到这些很难在传统方式下找到的稀少而微弱的信号。”葛健说。
经过5年的努力和创新,研究团队成功开发了结合图形处理器(GPU)相位折叠和卷积神经网络的深度学习的新算法GPFC,其中,在GPU上并行化的快速折叠算法可以提高低信噪比的凌星信号,实现高精度快速搜索,而卷积神经网络架构由19层神经网络组成。
由于已知的凌星信号真实样本太少,不能有效、精确训练神经网络,研究团队根据凌星信号图像的物理特征,创新性地设计和生成了各种可能的凌星信号,然后加入200万个利用开普勒卫星真实光变数据人工合成的光变曲线,并对神经网络进行训练。
接下来,他们将训练后的神经网络再应用于开普勒卫星的数据集中,同时,和GPU快速折叠算法一起使用,搜寻数据中的超短周期凌星信号。
最终,这种GPFC新算法比国际上流行的先进的BLS法搜寻速度提高了约15倍,检测准确度和完备度各提高约7%,帮助团队发现了5颗半径很小的超短周期行星。
“经过近10年的努力,我们终于有了第一份收获。”葛健感慨。
“原以为开普勒数据已被‘挖掘殆尽’”
利用新算法,科研团队在开普勒卫星的数据集中,识别出5颗新的超短周期行星,其中,有4颗位列迄今为止发现的最小超短周期行星中的第一、第二、第三和第五名。
美国普林斯顿大学教授、天体物理学家Josh Winn评论:“我原以为开普勒卫星数据中的凌星信号已被‘挖掘殆尽’,不会再有其他行星发现,听到这些新的潜在行星的消息,我非常兴奋,这项寻找新行星的技术成就让我印象深刻。”
超短周期行星类似于“熔岩世界”,是一种公转周期小于地球一天的行星,它们以极近的距离环绕其主恒星运行,通常体积较小、质量较轻、表面温度极高。
这类行星在类太阳恒星中的出现率大约只有0.5%,行星半径小于2倍地球半径,而在超热木星的情况下,行星半径会大于10倍地球半径。
2011年,科学家从开普勒卫星的测光数据中首次发现了超短周期系外行星。到目前为止,一共只有145颗超短周期行星被找到,其中只有30颗半径小于地球半径。
葛健介绍,由于传统基于太阳系的行星形成理论并未预测轨道比水星更接近的行星,超短周期系外行星的存在给行星形成理论带来了独特的机遇和挑战,也为行星系统的早期演化、行星-行星相互作用以及恒星-行星相互作用的动力学研究提供了重要线索,促使科学家重新审视和完善现有的行星系统形成和演化模型。
“理解超短周期行星的相对丰度及其特性,对于检验理论模型至关重要。然而,已知的超短周期行星样本量太小,它们的统计特征和出现率很难被精确了解。”葛健认为,该研究成果对在高精度光度观测数据中快速、高效搜寻凌星信号提供了新的研究方式,充分显现了AI在天文海量数据中搜寻微弱信号的巨大应用潜力和广泛前景。