• 新闻速递

一等奖!计算机科学技术学院团队在2024全球人工智能技术创新大赛算法挑战赛中取得优异成绩

2024.07.05


622日,2024全球人工智能技术创新大赛算法挑战赛在杭州市未来科技城圆满落幕。作为2024全球人工智能技术大会的重要组成部分,本次大赛得到了人民日报、新华社、央视网等权威媒体的关注和报道。

学院复旦大学视觉与学习实验室(FVL)的参赛团队“openocr”获得了大赛“无人机视角下的双光目标检测”赛道一等奖。

本次大赛由中国人工智能学会、杭州市委人才办、杭州市余杭区人民政府联合主办。大赛组织了“无人机视角下的双光目标检测”和“无人机视角下的双光人群计数”两个赛道,面向全球开放,不限年龄国籍,高等院校在校学生、科研机构和企业从业人员均可自由组队参赛。大赛于20243月启动报名,分为初赛、复赛、决赛三个阶段。自启动以来,共吸引了海内外1600多支队伍、2000余名选手参赛。


无人机视角下的双光目标检测

在“无人机视角下的双光目标检测”赛道中,FVL团队采用以ViT-L为主干网络的Co-DETR作为基线模型,提出了多尺度双光融合和对称感知双向配准等创新模块,较好的克服了双光图像采集不同步、视觉表观差异大,以及无人机视角变化大、目标尺度差异大等挑战。在线上评测环节中,团队从该赛道的1000余支参赛队伍中脱颖而出,取得了初赛第一、复赛第三的成绩。在621日的线下决赛答辩中,团队的技术方案获得了与会专家的高度认可,最终荣获决赛亚军暨大赛一等奖。在第二天的颁奖环节,中国人工智能学会理事长、清华大学戴琼海院士亲自为团队颁发了决赛一等奖奖杯和证书。

团队苏宇辰同学在答辩汇报(左)和回答专家提问(右)

无人机视角下的双光目标检测”赛道聚焦无人机视角下的车辆检测。配备摄像头的无人机可以收集具有广角视野的图像,有助于更好地捕捉地面目标,从而更好地支撑与机器人等智能体开展空地协作。考虑到红外摄像头在全天时成像中的鲁棒性,大赛除提供可见光图像外,还引入了红外图像作为互补信息。数据采集时间涵盖白天到晚上,采集区域包括了城市道路、农村地区、居住区、停车场等。大赛旨在通过前沿算法创新,让无人机更好地应用于城市安防、应急救援等领域。实验室通过本次大赛积累的技术和经验将有助于更好地实现开放场景下的目标感知和决策等。

竞赛数据及检测结果示例