近日,中国图象图形学学会(CSIG)发布“中国图象图形学学会博士学位论文激励计划”(原“CSIG优博”)入选名单。学院视觉与学习实验室毕业生陈绍祥同学的博士学位论文《视觉与语言结合的视频理解方法研究》入选,导师为姜育刚教授。
CSIG博士学位论文激励计划入选论文《视觉与语言结合的视频理解方法研究》
该论文致力于充分利用视觉与语言的交互来理解视频内容,在视频内容描述和事件定位问题上开展了深入的研究。针对视觉语义粒度粗、视觉与文本交互差、视频特征表示弱等瓶颈问题,提出了通用的视频多模态特征编码方法并应用于视频描述和视频事件定位,有效提升了描述生成质量和事件定位精度。此外,该论文还在弱监督的视频高密度内容描述中首次统一了描述生成与事件定位两个任务,进一步深入挖掘了视觉与语言的关联。
陈绍祥同学共发表CVPR、ICCV等中国计算机学会推荐的A类会议论文8篇,其中第一作者6篇。相关方法在ActivityNet视频描述竞赛、谷歌视频识别挑战赛等多个国际竞赛中获优异名次。
“中国图象图形学学会博士学位论文激励计划”为推动相关领域的科技进步,鼓励创新性研究,促进青年人才成长而设立。2023年,CSIG共收到推荐论文80篇。经遴选,共有10篇论文入选2023年度CSIG博士学位论文激励计划,7篇论文获得2023年度CSIG博士学位论文激励计划提名。