大数据文摘出品
作者:Matthew J.Salganik
星系动物园项目是2007年牛津大学天文学研究生凯文·肖文斯基发起的。简单来说,肖文斯基对星系很感兴趣,而人们可以根据星系的形态(椭圆形或螺旋形)和颜色(蓝色或红色)对它们进行分类。当时,天文学家的传统观点是,像我们的银河系这样的螺旋星系的颜色是蓝色的(意味着年轻),而椭圆星系的颜色则是红色的(意味着年老)。
肖文斯基对这一传统观点有所怀疑。他猜想,尽管上述规律一般来讲是正确的,但也可能有相当数量的星系例外,通过研究这些不符合预期规律的不同寻常的星系,他便能对星系的形成过程有所了解。
从志愿者到天文学家的转变只要10分钟
因此,为了推翻传统观点,肖文斯基需要的是大量按形态分类的星系,也就是已被划分为螺旋形或椭圆形的星系。但问题是现有的分类算法还不足以用于科学研究。换句话说,在当时,分类星系对计算机来说是一项很难的任务。因此,肖文斯基需要的是大量人工分类的星系。带着研究生的热忱,肖文斯基开始了分类工作。经过7天每天12小时的马拉松式奋战,他共对5万个星系进行了分类。尽管5万个星系听起来可能很多,但其实仅占斯隆数字天空勘测计划所拍摄的将近100万个星系的大约5%。肖文斯基意识到他需要采取一个更具扩展性的方法。
幸运的是,对星系进行分类并

星系动物园项目利用公民科学家的力量,对100万个星系进行分类,挑战传统天文学观点。通过网站,志愿者经过简单训练后对星系图像进行分类,贡献了高质量的数据。经过数据清洗、消除偏差和加权,整合出一致的星系形态分类。随着数据规模的扩大,研究人员利用这些人工分类数据训练机器学习模型,实现了计算机辅助的星系分类。
最低0.47元/天 解锁文章
816

被折叠的 条评论
为什么被折叠?



