• 科研快讯

第三期AI安全专题“研究生顶会论文宣讲报告会”圆满举行

2022.04.17

4月13日下午,由智能系统安全,多媒体智能安全学科方向联合承办的第三期“研究生顶会论文宣讲报告”(FudanCSF3-TVP)通过腾讯会议成功在线举行。5位硕博士生分享了他们近期录用在ICDE 2022、USENIX Security 2022、ACM MM 2021和AAAI 2022等顶级学术会议上的论文成果,吸引了近120余位学生积极参与,并与报告同学进行热烈互动。

丁岱宗同学介绍了基于深度学习时序分类模型存在上述的后门攻击威胁。与其他任务(如CV、NLP等)不同,现有后门攻击技术在这个任务上效果很差,攻击成功率和隐蔽性都得不到保障。针对这个问题,该工作提出了基于流形理论的建模框架,深入研究后门攻击在时序上的工作机理,并进一步提出了攻击策略TimeTrojan,通过进化搜索策略来寻找高效且隐蔽的模型后门。

潘旭东同学介绍了神经网络数据泄露程度与独占神经元个数之间的理论联系,并提出基于神经元状态分析的梯度破解算法,实现从深度学习模型在公网传输中传输的平均训练梯度对原始训练批次实现像素级重建,精度超国际最高水平400%,将可重建训练批次容量从8张提升至真实训练批次大小(32张及以上),影响包括VGGNet、ResNet在内的多种主流图像分类模型架构,证实了训练数据在新型分布式训练模式下存在的泄漏隐患。

钟楠同学介绍了兼顾模型参数与拓扑结构信息的神经网络哈希技术,提出利用 “试纸图像”输入神经网络并提取网络的末尾层的列向量将其作为表示该模型的特征向量。同时还提出一种对模型输入反向构造的方法,以反向构造结果作为模型的表示特征。最后通过最小化三元组损失更新“试纸图像”或反向构造结果来实现模型检索的任务。

应祺超同学介绍了一种图像免疫架构对图像进行扰动嵌入、篡改定位与内容恢复,并提出了一个有效的攻击层,对常见图像篡改攻击与图像后处理进行建模,提升免疫图像的鲁棒性与稳健性。该工作通过大量人工篡改测试验证了图像免疫对于篡改定位以及高保真内容恢复的有效性,能够有效帮助数字图像免疫常见数字攻击,使接收者可以获取真实图像内容。即使免疫图像受到较大面积修改,或者攻击者使用图像后处理(例如JPEG压缩等)掩盖篡改痕迹,图像免疫技术也可以在提取端有效定位篡改区域并恢复原始图像。

王皓月同学针对现有虚假人脸图像检测方法对于轻微篡改痕迹的分析不够充分的局限性,介绍了一种基于局部痕迹扩散的虚假人脸图像检测方法。该方法根据图像块中存在的篡改痕迹和块与块之间包含的关系,设计损失函数深入挖掘图像块之间的差异性,并结合基于注意力机制的图网络进行局部篡改痕迹扩散,进一步增强图像块的特征表示。该方法可集成为一个通用的虚假人脸图像检测模块,嵌入到现有的方法中并提升最终的分类性能。

通过本次报告会,同学们了解了AI安全领域的前沿工作,收获满满,大家都期待下次报告会的召开。