大数据时代银河系红巨星的“星口普查”
自1953年第一次全国人口普查以来,我国已经开展了7次人口普查,之前的普查工作均是由街道办事处挨家挨户的摸查盘点完成,规模浩荡,费时费力,获取人口的年龄分布更是困难重重。
随着大数据智能时代的到来,人口普查的方法有了很大进步。通过人工智能,大数据可以快速捕捉到人口信息,从而较为便捷地完成人口普查工作,可以说大数据智能化的出现为人口普查的变革提供了一个重要契机。
图1. 人口普查漫画 (图源:网络)
放眼宇宙,天文学家也一直致力于对数不胜数、形形色色的天体做一个统计学意义上的“星口普查”。而恒星们的年龄信息对于天文学家而言更是“天大”的秘密。人工智能可否有助于天体物理大数据背景下的“星口普查”,揭开恒星年龄之谜?天文学家给出了答案。
恒星年龄:“星口普查”的难点
恒星,作为宇宙尺度里的最小基本单元,自上个世纪以来,成为人类探究星系结构、起源和演化的重要工具。我们生活的银河系就有着几千亿颗恒星,这些恒星处于不同的演化阶段,它们的寿命与其质量紧密相连。
图2. 恒星演化示意图(图源:维基百科)
恒星的基本性质主要取决于三个基本量:初始质量、最初各类化学元素的含量(化学丰度)和年龄。然而对这些基本量,尤其是质量和年龄的直接测量十分困难。对于双星而言,我们可以通过物理结构直接得到它们的质量,而单星的质量测量需要依赖于恒星演化模型。由于缺乏精确的宇宙“时钟”,对恒星年龄的直接测量几乎是不可能的,我们只能通过恒星演化模型间接对年龄进行估计。如何更精准的确定恒星年龄也成为了天文学者一直努力探索的研究热点。
观测上,我们主要有两种手段获得大样本恒星的基本信息,一是通过测光或光谱测量分析恒星大气的基本参数,包括表面有效温度、表面重力加速度(或者光度)、各种化学元素丰度等;利用大气参数结合恒星演化模型我们可以进一步对质量、年龄进行估计。这就如同医学上通过测定表面皮肤组织的结构来推断人的年龄。
另一种常用手段是星震学分析,正如地震可以使地理学家了解地球内部构造一样,恒星震动也可以让天文学家推算遥远恒星的内部结构和性质,从而进一步获取恒星的质量、年龄等信息。
相较于第二种方法,第一种方法确定恒星年龄有明显局限性,该方法仅能对处于特殊演化阶段的部分恒星(如主序拐点星、亚巨星)年龄进行估计,且目前估算精度最高可以达到20%。且这一方法很难估计处于主序星和红巨星阶段的恒星年龄。而宇宙中大部分恒星处于主序阶段;由于观测亮度的局限,我们观测到的大部分亮星则是处于红巨星阶段及之后的演化阶段。
相比之下,星震学方法则可以给出类太阳振动恒星相对准确的质量估计,这为推测恒星年龄提供了可能。
红巨星:银河系成长的“见证者”
与人类相似,恒星也有它们的婴儿时期,青年时期,中年阶段以及老年阶段。恒星演化到不同的年龄阶段就会表现出不同的特征。说到恒星演化,我们自然会想到天文学家手里实用的工具之一---赫罗图。通过天文观测我们可以得到恒星的光度(或绝对亮度),以及恒星的有效温度(或者光谱型、色指数),将这两个量作为坐标轴绘制的关系图就是赫罗图。通过赫罗图我们可以较为清晰地看到恒星的演化规律。从赫罗图的右下角到左上角有一条带,大部分恒星都集中在这条带上,称为“主序带”。
图3. 恒星的赫罗图,横坐标为恒星有效温度,纵坐标为代表恒星光度的绝对星等(图源:维基百科)
红巨星是一颗恒星度过漫长的主序星阶段进入“老年”时期的一种状态,也就是恒星燃烧到后期所经历的一个很短的不稳定阶段。红巨星在赫罗图上已离开了主序带沿着右上分支快速移动。也就是说恒星处在红巨星不稳定阶段的时标很短,一般而言需要几百万年,这与恒星几十亿年甚至上百亿年的主序阶段相比是非常短暂的。因此红巨星的年龄主要由主序阶段的寿命决定,而红巨星在主序阶段停留的时长主要取决于其质量大小。观测研究表明,银河系中大部分的红巨星均呈现类太阳的振动模式,这样一来天文学家便可以通过星震学分析得到它们的质量估计,从而利用星震学分析给出的恒星质量进一步推断出这些红巨星的年龄。
图4. 类太阳恒星演化示意图(图源:国家天文台)
另一方面,红巨星的光度很大,可以探测到很远的距离,因此成为了研究银河系结构很好的探针。集“类太阳振动”、“亮度”于一身的红巨星,成为了天文学家绘制银河系结构样貌和追溯银河系精彩过往的重要“见证者”。
大数据时代背景下红巨星的年龄普查
随着各类空间望远镜和地基望远镜的巡天观测,近些年,天文数据量呈现指数级增长,值得一提的是,我国自主创新研制的国家重大科技基础设施、目前世界上光谱获取率最高的LAMOST以发布千万量级的天体光谱,天文学迎来了大数据天体物理时代。这对于天文学家而言即是机遇又是挑战。天文学家竭尽全力寻找最高效、最便捷的方式来完成大规模天文数据的搜索及分类工作。其中机器学习算法成为大数据时代解决问题重要且关键的新兴“工具”,而机器学习方法行之有效的前提则需要构建一个具有广泛性、准确性和完备性的训练样本。 美国开普勒卫星(Kepler)为寻找类地行星对约20万颗恒星(大部分是红巨星和红团簇巨星)进行了高质量测光观测,Kepler数据的释放,迎来了星震学的黄金时代。利用这些数据天文学家可以得到成千上万颗巨星的星震学参数,这些参数为精确得到红巨星质量和年龄提供了很大的帮助。LAMOST是对Kepler目标源进行光谱观测最理想的地基望远镜,它提供了迄今为止数量最多的恒星光谱数据,为描绘红巨星的“容貌”特征给出了丰富又准确的基本信息。这些共同源成为测量大样本红巨星年龄的极佳数据。
新兴的机器学习方法及可靠的红巨星训练样本,使得天文学家获取大样本红巨星的“芳龄”成为可能。
图5. 郭守敬望远镜LAMOST(图源:孔啸)
2019年,国家天文台的武雅倩助理研究员、赵刚研究员以及德国马普天文学研究所向茂盛博士等人利用LAMOST-Kepler红巨星样本,精确确定了6940颗红巨星的质量和年龄,质量的典型精度为7%,年龄的典型精度为25%。利用可靠的训练样本,他们进一步估计了LAMOST DR4中64万红巨星的质量和年龄,典型误差分别为10%和30%。 至此,研究人员通过人工智能,从LAMOST-kepler数据中成功获取了64万红巨星样本的年龄信息,完成了天体物理大数据背景下的一次“星口普查”,成为揭秘恒星年龄的代表性工作。
另一位恒星观测领域的超级“大佬”——欧洲航天局发射的盖亚卫星(Gaia),2018年发布了10亿余颗恒星最精确的距离和自行测量数据。这样一来,除了年龄,天文学家还可以轻松获取红巨星的运动学信息。珠联璧合再出精品,近期,武雅倩等人继续将64万的红巨星样本与Gaia数据交叉,进一步计算了红巨星的运动学参数,描绘出了银盘恒星随着年龄以及空间位置的运动特性。拥有年龄信息的64万红巨星样本使得天文学家突破了仅能捕捉某一瞬间恒星运动特征的局限性,而是从时间维度上对银盘的恒星运动进行了追踪,为还原银盘上恒星运动的演化历史提供了可靠证据。
如此一个数据量够大,拥有质量、年龄等丰富信息的64万红巨星大样本将成为天文学家手中弥足珍贵的数据财富,在进一步理解星族合成和描绘银河系演化的历史画卷等方面有着广泛的应用前景。(赵宇豪)
论文链接:
https://academic.oup.com/mnras/article/484/4/5315/5321195
https://academic.oup.com/mnras/article/501/4/4917/6104314
作者简介:武雅倩,现为国家天文台元素丰度团组助理研究员。研究领域为银河系化学动力学演化、天文大数据等。李双,中国科学院国家天文台工程师,LAMOST运行和发展中心宣传主管。