中国科技信息2023年第7期·CHINASCIENCEANDTECHNOLOGYINFORMATIONApr.2023-104-◎三星推荐白矮星是一种低光度、高密度、高温较度的恒星,主要由碳构成,外部覆盖一层氢气与氦气。颜色一般呈现为白色、拥有较小的体积。白矮星是低质量和中等质量(小于10个太阳质量)恒星演化的产物,存在于所有年龄阶段的星族当中,根据资料分析与观测研究得出中低质量的恒星度过主序星阶段,在结束氢聚变过后,便会在核心发生氦聚变,进而演化到红巨星,经过星风、氦闪等演化过程造成质量的大量损失最后变为白矮星。因为其表面大气成分等因素的不同,将其划分为分DA和DB等不同光谱类型,但可能随着大气层中元素含量的改变而发生变化。近年来不同巡天项目的飞速发展(SDSS、LAMOST等),在他们所搜寻的数据中已经得到了超过40000颗的白矮星样本库。其中占据较大比列约80%的DA型白矮星(H主导),以及大气成分主要为He的DB型白矮星。传统的分类方式都是采用Pipeliner软件与光谱模版进行匹配,以保证结果准确性,但因为信噪比较低的缘故也会出现匹配错误的现象。所以,许多科研工作者对白矮星的分类方法进行了补充完善,例如:Kepler和Kleinman等科学家先根据恒星颜色分布来筛选出候选体,再利用白矮星大气模型拟合得到分类结果。但随着科技的不断进步,机器学习作为人工智能的一个分支在各个科学领域都得到了广泛应用。利用机器学习筛选分类白矮星的方法也得到了充分认可,如:Kong等人采取LASSO方法提取出DB型白矮星光谱与其他类型光谱具有明显的特征,通过该类区别可以有效对DB型白矮星实现分类。基于机器学习分类白矮星是利用算法并使用大量的已知光谱分类的白矮星样本数据进行训练,在训练完成之后得到一个分类模型。当下一次输入新恒星光谱数据时,可以利用此模型对新数据样本进行预测,得到目标分类结果。在本文中,我们将机器学习方法与SDSS-DR3白矮星样本数据相结合利用恒星光谱这一限制条件对白矮星的光谱类型进行预测,在实验过程中我们将整个样本库均分为训练集和测试集两个集合,通过训练集对模型进行训练以及对测试集的精分析对模型进行多次修正以达到高精度和高效率的目标模型。该项工作可以大大提高工作效率,并且能够有效辨别出信噪比低、难以用肉眼区分的样本,对白矮星的科学研究具有较强的推动意义。数据样本处理行业曲线开放度创新度生态度互交度持续度可替代度影响力可实现度行业关联度真实度一种基于SDSS白矮星光谱数据的机器学习分类方法王茜...