近年来,随着技术日益进步,天文学研究中涌现出海量数据。天文学家们要想从郭守敬望远镜、“中国天眼”FAST、LSST大型综合巡天望远镜等遍布世界的大型望远镜捕获的海量数据中找出有价值的信息以资研究,无异于大海捞针。
如何高效地处理这些数据,已成为现代天文学面临的一项重要挑战。由于人工智能在海量数据分析和处理方面所具有的突出优势,它也很自然地走入了天文学家的视野。
日前,云南天文台丽江天文观测站龙潜研究员与云南大学中国西南天文研究所宇宙学研究组尔欣中教授团队合作,利用人工智能深度学习的方法,发现了38个新的强引力透镜候选体,为天体物理学问题的研究提供的新的可靠的“宇宙探针”候选体。英国《皇家天文学会月刊》发表了这项研究成果。
强引力透镜系统为何是重要宇宙学探针?
引力透镜现象,是一种大质量物体改变其周围时空特性,从而使光线在其附近传播时路径发生弯折的现象,是由爱因斯坦的广义相对论所预言的。简单来说,引力透镜就像它的名字一样,是由引力引起的透镜效应,如同我们拿“放大镜”去看遥远的天体,而这个放大镜不是普通的玻璃镜片,而是一个个大质量的天体。
正因如此,星系尺度的强引力透镜系统,也成为宇宙学研究的重要探针,通过它可深入研究宇宙学和天体物理中的诸多科学问题,如暗物质性质、星系形成和演化以及哈勃常数的测量等。然而,目前已证认的强透镜系统数目过少,严重制约了相关天体物理学问题研究的开展。如何搜寻证认更多强透镜样本,也成为当前研究工作中的主要问题。
“通过测量背景天体的形变,我们可以估计中间天体的质量分布。这种方法不依赖于质量的性质或状态,所以我们可以用它来研究暗物质,以及星系的演化等。”尔欣中教授介绍说。
强引力透镜系统中,背景天体常常形成多个像,即多重像。如果背景天体亮度存在变化,由于强透镜多重像之间传播路径和经过引力势的差别,将会看到多重像之间亮度变化的时间差,这个时间差与宇宙的几何性质相关,因此我们就可以利用它来测量哈勃常数,而哈勃常数与宇宙年龄及膨胀速率密切相关。
在引力透镜事件中至少有三个参与者,分别是观测者,非常遥远的发光天体,或者说背景天体,还有处在两者中间的一个天体。在中间的这个天体并不需要会发光,但一定要质量很大,而且恰好在观测者和背景天体的连线附近。因此背景天体发出的光在经过中间天体附近的时候,受到它的引力场的作用,传播路径发生偏折,在科学家看来就像有个放大镜一样。
“弱引力透镜在宇宙天空中几乎无处不在,而强透镜和微透镜却非常稀少。星系和星系团的引力场可以造成非常强的折射,因此我们可以看到背景天体发生非常明显的形变。”尔欣中教授说,比如背景天体是一个星系的话,人们可能看到它被扭曲成一条弧形甚至一个完整的圆环;如果背景天体是致密的点源,比如类星体的话,人们可能看到它的两个像,甚至四个像,这就是强引力透镜现象。
人工智能与天文学碰撞出闪耀星光
通过下一代大规模测光巡天项目的开展,人们期待发现数以万计的强透镜系统。但如何在海量天体图像中快速地找到强透镜候选体?近年来,随着人工智能的快速发展,给人类提供了一种新的可能。
以2009年发射升空的世界首个用于探测太阳系外类地行星的飞行器开普勒太空望远镜为例,仅在起初3年半的任务期内,就监控了超过15万个恒星系统,同时也产生了海量数据。这些数据通常要经由计算机处理,但当计算机识别出一定的信号时,又必须依靠人类分析,判断其是否是行星轨道所产生的,这项巨大的筛查工作单靠美国航空航天局(NASA)的科学家甚至科学小组,都无法有效方法完成。
“如此大的数据量,人工分析在很多时候已经达不到所需要的速度。借助人工智能的优势,我们可以极大地提升对数据的分析速率。”龙潜研究员向科技日报记者介绍,用人工智能手段体现出来的效率和准确性远高于传统方法。
龙潜研究员长期从事人工智能深度学习方面的研究。近期,他与尔欣中教授团队合作,构建并训练了一个卷积神经网络,用来寻找强引力透镜系统。他们把这个网络应用到欧洲南方天文台2.6米巡天望远镜(VST)千平方度巡天数据,并找到了38个新的强透镜候选体。此次构建的神经网络,也可应用于其他大型望远镜的巡天数据。
“在这项工作中,我们用计算机分别模拟了强透镜图像和非强透镜图像,从而来训练计算机。我们发现,很有意思的是在准备训练计算机的图像时,非强透镜图像比强透镜更加重要。”尔欣中教授说,开始的分析中,他们使用简单的规则星系图像作为非强透镜训练样本,发现结果正确率非常低。只有把各种可能的非透镜图像都考虑进来之后,才能得到比较好的结果。
“这就像在教电脑认识什么是狗的时候,还要告诉它猫、羊、牛等等都不是狗。而如果你只告诉它猫不是狗,电脑有非常大的概率把羊、牛认成狗。”龙潜说,目前利用机器学习来对天文学中各种天体分类已经非常普遍,最简单的是把恒星和星系分开,或者把不同行态的星系进行分类,以及利用星系的多重颜色来估计星系的距离等。
人工智能在天文学界应用及开发将成趋势
人眼强透镜系统的图像,最快就是每秒钟看一张图。而计算机每秒钟可以识别成千上万张。
龙潜研究员和尔欣中教授团队此番训练的这个卷积神经网络,可以充分利用GPU进行并行加速,通过装备更多或更强的GPU,可以根据实际需要极大提升搜索速度和效率。
“这个神经网络的训练,主要使用模拟数据,只使用了很少的人工标注数据,由于模拟数据可以任意生成,因此多样性远大于人工标注数据,进一步根据数据的特点调节训练参数和训练算法,使神经网络的泛化能力得到了极大的提高。”龙潜研究员说,此外,他们使用新型科学计算语言Julia完全自定义网络结构,由于Julia语言兼具速度和灵活性,使得网络在CPU和GPU上都有良好的性能,并且可以任意切换,因此非常有利于研究人员实时修改、训练和测试网络。
“我们还通过对引力透镜数据的研究,定制了有针对性的小型网络,有效地抑制了过拟合现象,同时实验证明该网络具有与大型网络相似的准确率。相比大型网络,小型网络在普通PC就可以训练和测试,不需要依赖大型GPU集群,这天文工作者使用和改进网络提供了便利。”龙潜说。
目前,随着技术与装备水平快速发展,人工智能在天文学上的应用还会越来越多。“我们计划对一些变源的多波段光变曲线来进行机器的快速分类,这样在实施大样本巡天的时候,电脑可以自动对所发现的变源进行筛选,并对我们感兴趣的天体做出提示,来让做进一步的后续研究工作。”尔欣中教授说,正因为人工智能的帮助,天文研究者得以从耗时单调的数据筛查分析中解脱出来,当人力“大海捞针”难以招架之日,正是人工智能大显身手之时。
来源:科技日报