复旦大学计算机科学技术学院池明旻研究团队与国家天文台、腾讯优图实验室组成的“探星团队”,结合人工智能(AI)技术提升脉冲星智能搜索的准确率和效率,在由三方联合启动“探星计划”中基于“中国天眼”——五百米口径球面射电望远镜(FAST)的巡天数据,自动搜索出22颗新脉冲星。脉冲星是大质量恒星演化晚期的致密残留物,对研究天体起源、生命起源有重要价值,也被视为”宇宙中的灯塔”。
“云+AI”技术帮助FAST处理庞大数据,使得脉冲星智能搜索效率跃升。FAST 漂移扫描巡天每天可以产生约130TB的原始观测数据。通过专业的天文软件对信号做图形转化的预处理需要耗费庞大的计算资源,当预处理完成后,每500TB的观测数据预处理后将生成的3千万—1亿张图片,天文专家要花上一年以上的时间才能从中找出脉冲星的候选体。通过开放云+AI技术,研发出用于搜索短周期脉冲星的“多模态+半监督学习”的AI解决方案,以及用于搜索单脉冲和快速射电暴的“AI+动态谱信号”的解决方案,前者对现有脉冲星搜索流程迭代了17个版本,后者的脉冲星信号识别速度提升 120 倍,在一年期内成功发现了 22 颗脉冲星,其中包括7颗高速自转的毫秒脉冲星、3颗长周期脉冲星以及4颗超过银河系电子分布模型的特殊脉冲星。新发现脉冲星分布下图所示,红色星星表示由“探星团队”基于FAST的CRAFTS项目数据搜索到的22颗新脉冲星。
本次“探星计划”新发现的脉冲星分布图
“探星计划”团队设计了多个深度融合网络模型应用在脉冲星搜寻中,由FAST接收到的太空信号转化成图像后,可获取不同维度的信息,比如色散、相位-时间、频率-时间图等。深度融合网络将不同模态的图像/信号在频率或者相位维度进行关联对其分析,提高脉冲周期信号确认的可信度,从而提升了寻找脉冲星效率和准确率。当前训练数据仅有100多个已知脉冲星样本进行监督学习,但存在大量没有确认的脉冲星候选体数据,团队通过设计半监督和主动学习框架,进一步提升了脉冲星搜索的准确性和鲁棒性。以上工作成果分别发表在2022年的国际声学、语音与信号处理会议 (International Conference on Acoustics, Speech and Signal Processing,ICASSP)和IEEE国际计算机视觉与模式识别会议大会(IEEE Conference on Computer Vision and Pattern Recognition,CVPR),复旦大学皆为第一完成单位。另外,该工作还获得2022世界人工智能大会SAIL之星奖(Super AI Leader)。下一步,“探星计划”团队将聚焦在银河系外M31星系的射电信号研究,通过AI+云上的计算有望实现该领域“零到壹”的突破。
另外,复旦大学计算机科学技术学院、腾讯优图实验室、国家天文台和澎湃新闻联合发起了一场别开生面的“脉冲星音乐会”,以“寻找宇宙心跳-脉冲星演奏会”创新科普方式全程于9月23日晚8点在澎湃新闻视频号、知乎、B站、QQ小世界等多个媒体和平台直播,约600万观众在线观看了复旦大学计算机科学技术学院池明旻和王珅(博士毕业于国家天文台)以及腾讯优图王亚彪的“夜话AI for science(天文)”,该活动以露营方式在上海的郊野公园录制完成。观众在线聆听了王珅通过“数据可听化”制作的8颗脉冲星音频以及澎湃新闻和腾讯音乐人基于这些音频二创的音乐。在科学与艺术的碰撞中,更多受众了解到了AI+天文探索的进展与魅力。
以露营方式别开生面的“脉冲星音乐会”暨“夜话AI for science(天文)”活动
(从右到左分别为唐艺(澎湃新闻主持人)、池明旻、王亚彪和王珅)
本次突破是复旦大学计算机科学技术学院池明旻研究团队在该领域的常年积累的缩影。2013年开始,复旦大学计算机科学技术学院和上海市数据科学重点实验室池明旻团队积极参与国际大科学工程——平方公里阵列射电望远镜(Square Kilometre Array,SKA),共同成立中方SKA科学数据处理联盟,并于2016年底承担国家重点研发计划“政府间国际科技创新合作”重点专项—— “SKA科学数据处理关键技术研究”子项目负责人,2017年参与了另外一项国家重点研发项目——“基于FAST漂移扫描巡天的脉冲星、中性氢星系和银河系结构研究”。池明旻团队在SKA和FAST项目研究期间,培养计算机与天文交叉人才十余人(已毕业硕士7人,在读硕士4人),指导新入站博士后1人。