(原标题:AI助天文学家寻找星系:像素尺度分析 误报率仅0.09%)
最近,加州大学圣克鲁兹分校的研究人员开发了一款名为“墨菲斯”(Morpheus)的深度学习模型,可以对天文图像数据进行像素级分析,识别并分类所有的星系和恒星。这项研究成果发表在5月12日的《天体物理学杂志增刊》(Astrophysical Journal Supplement Series)。
据论文介绍,在处理天空某一区域的图像时,“墨菲斯”会生成一副新的图像。图中,算法模型根据形态对天体进行颜色编码,将其与背景分离,识别出恒星和不同类型的星系。
准确率方面,论文指出,相对于哈勃太空望远镜的CANDELS项目和3D-HST计划提供的分类目录而言,“墨菲斯”模型的假阳性率(false-positive rate,FPR)仅约为0.09%。假阳性率即实际非天体,但被识别为天体的百分比。
“墨菲斯”对天体进行形态分类后生成的彩色合成图。
上述论文的两位共同作者之一、加州大学圣克鲁斯分校计算天体物理学研究组负责人、天文学教授布兰特・罗伯逊(Brant Robertson)介绍,随着天文学数据集规模的迅速扩大,传统意义上由天文学家完成的任务需要变得自动化。
他表示,“作为人类,有些事情我们根本做不到。因此必须想办法用计算机来处理未来几年内大型天文学项目收集的大量数据”。
以正在智利建设的大型综合巡天望远镜LSST为例,该项目完工后将用32亿像素的相机每晚拍摄800幅全景图像,每周记录天空2次。此类大型天文项目所产生的庞大数据量已经远远超出了天文学家的分析能力。
事实上,已经有天文学家借助深度学习对星系进行分类,但通常使用现成的图像识别算法,需要预先进行额外的数据整理工作。“墨菲斯”的不同点在于,它为处理天文图像数据而生,天文学家可以用标准数字文件格式输入原始图像数据。
“墨菲斯”使用的图像分割和反合成过程。
“墨菲斯”的另一大优势是像素级分类。布兰特・罗伯逊介绍,在使用其他模型时,天文学家必须首先知道图像中含有某些内容,然后再向模型提供图像,模型随后对整个星系进行分类;但“墨菲斯”可以帮助天文学家发现星系,而且是以像素为单位,逐一进行分析。这一特性赋予了“墨菲斯”处理复杂图像的能力。
“墨菲斯”对GOODS-South Field(大天文台宇宙起源深度巡天计划的南天区)局部的分类结果。
与其他大型深度学习模型的训练过程类似,研究人员向模型“投喂”了大量学习资料。主要是哈勃太空望远镜提供的CANDELS巡天观测资料,由数十位专业天文学家进行分析归类,总共分成约10000个星系类目。
“墨菲斯”的神经网络架构。
“墨菲斯”进行自动形态分解的例子。
学习之后,研究人员将“墨菲斯”应用到了迄今最完整最全面的宇宙图谱――“哈勃遗产场”(HLF)当中。该宇宙照片由哈勃太空望远镜在16年间拍摄的7500张星空照片拼接而成,包含约265000个星系。
为帮助深度学习模型快速完成对整个数据集的逐像素分析,研究人员为其配置了加州大学圣克鲁斯分校的超级计算机“lux”。该超算由美国国家科学基金会拨款154.7万美元建成,应用范围包括天体物理学和气候科学。