近日,平方公里阵列射电望远镜(Square Kilometre Array, SKA)的首个科学数据竞赛(SKA Science Data Challenge #1, SDC1)成果总结已在MNRAS发表。我作为参赛团队的一员,我们上海天文台在该竞赛中表现突出,名列首位。论文链接可以点击这里。这个首个数据竞赛于2018年启动,2019年4月结束。在全球共有9支团队按时提交结果的情况下,我所在的上海天文台从竞赛启动之初就组织人员进行规划准备,并展开了前期测算。然而,由于数据的重新发布,我们不得不对所有数据进行重新处理和分析。这一过程虽然复杂,但我们保持积极应对,经过半年的努力和反复讨论完善数据分析,最终完成了竞赛。
作为SKA科学准备的一部分,这次的数据竞赛项目旨在通过提供真实或模拟的不同层级数据来帮助研究人员熟悉SKA将发布的数据,对SKA数据处理流程进行考察和完善,并将其作为一个常规项目进行发布。这些层级包括原始数据、校准后的观测产品、更进阶的科学目标研究,以及最终的科学成果。此次首个比赛侧重于第二、三层级,即已校准观测产品与更进阶科学目标研究。
参与此次比赛,我使用了统计分析、算法筛选、交叉验证以及参数调优等路径。我先对所有可用图像开展统计分析,以了解结构和特征,然后确定用于处理输入参数范围。我还基于针对不同先导项目而开发的天体搜索算法测试图像,并评估计算效率与准确度,最终选择表现较好的算法并进行交叉验证以获得最佳结果。
为了识别天体并计算它们大小角度,我采用连续像素岛提取方法,同时通过二维高斯模型拟合亮度分布并修正流量密度。此外,由于庞大数量下的处理工作量巨大,我利用上海天文台原型机系统完成相关任务。
国家天文科学中心为我们提供了重要支持,为我们的设备和计划提供了关键性的技术服务。在这次活动中,我们展示了一幅完整的地平线图,其中包含各项团队结果以及我自己的分析结果由蓝色线条表示。这份成果证明了我的能力与专业知识,在未来的科研探索中,将继续为推动人类知识界限向前迈进贡献力量。