• 科研快讯

  • 复旦大学计算机科学技术学院冯瑞、张玥杰团队在国际多媒体顶级会议ACM Multimedia上发表新成果2023-02-21

    在2022国际多媒体顶级会议ACMMultimedia中,由我院冯瑞老师和张玥杰老师带领的复旦大学跨媒体智能计算实验室(CMIT)发表的论文《IDEA:IncreasingTextDiversityviaOnlineMulti-LabelRecognitionforVision-LanguagePre-training》入选。ACMMultimedia是计算机学科多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议。论文《IDEA:IncreasingTextDiversityviaOnlineMulti-LabelRecognitionforVision-LanguagePre-training》(黄新宇,张又才,程颖,田维维,赵瑞玮,冯瑞*,张玥杰*,李亚乾,郭彦东,张晓波*)中的研究是与OPPO研究院合作完成。近年来,利用大规模图像-文本对数据的视觉-语言预训练模型(如CLIP等)在各个领域都表现出了优异的性能。虽然这些图像-文本数据可以从互联网上大量地获取,但这些数据普遍缺乏足够的对齐信息。主观的文本描述往往只能对应图像的部分内容,因此只能为
  • 复旦大学计算机学院张奇、黄萱菁团队论文获自然语言处理和计算语言学国际顶级会议COLING Outstanding Paper奖2023-01-09

    复旦大学计算机科学技术学院自然语言处理实验室(FudanNLP)的研究论文《AMulti-FormatTransferLearningModelforEventArgumentExtractionviaVariationalInformationBottleneck》被COLING2022以长文oral形式录用,并获得OutstandingPaper,论文第一作者为博士后周杰,指导老师为张奇教授和黄萱菁教授。国际计算语言学会议(InternationalConferenceOnComputationalLinguistics,COLING),是自然语言处理和计算语言学领域的顶级会议(CCF-B类),每两年举办一次。本次COLING会议共吸引了超过2000的投稿,最终共录用522篇长文、112篇短文,我院FudanNLP团队的论文获得了杰出论文奖。本文主要关注结构化抽取任务的统一迁移学习框架。近年来,基于深度学习的结构化抽取任务(如事件抽取)取得了巨大成功。然而目前大部分工作针对不同的数据集设定特定的模型结构。同时,由于结构化抽取任务的复杂性,标注空间较大,标注规范不统一,标注一个新的数
  • 复旦大学计算机科学技术学院王鹏、汪卫团队论文被国际顶级数据库会议SIGMOD录用2022-12-08

    由复旦大学计算机科学技术学院王鹏老师、汪卫老师、王泽宇同学和法国巴黎大学的ThemisPalpanas教授、王齐童同学合作的论文《Dumpy:ACompactandAdaptiveIndexforLargeDataSeriesCollections》被ACMSIGMOD2023(InternationalConferenceonManagementofData)接收,ACMSIGMOD会议关注数据库管理系统和数据管理技术的原理、技术和应用,是数据库领域具有最高学术地位的国际性学术会议。论文针对超大规模(TB级)的时间序列数据相似性索引提出新方法,大幅提高了索引的近似查询精度、查询性能和构建速度。相似性查询是许多基于距离的时间序列数据挖掘算法的基础,论文方法的提出将直接增强这些算法的精确性、效率和可扩展性,并使得未来在大数据集上基于距离的新方法的提出成为可能。论文首次指出了当前时间序列数据相似性查询索引的两个结构性问题:(1)固定扇出的树结构不能在索引节点的质量和紧凑性上达到最优的权衡,严重限制了索引的准确性和效率;(2)不能有效处理倾斜数据。为了克服这些问题,论文创新性地设自适应多叉索
  • 复旦大学计算机科学技术学院顾宁、卢暾、张鹏团队在国际人机交互顶级学术会议ACM CSCW上发表多项新成果2022-12-03

    近日,ACMCSCW2022(The25thACMConferenceonComputer-SupportedCooperativeWorkandSocialComputing)在线开幕,复旦大学计算机科学技术学院协同信息与系统实验室的张鹏青年副研究员、卢暾教授、顾宁教授等完成的3篇长文在该会议发表。ACMCSCW是人机交互领域的顶级学术会议,也是中国计算机学会推荐的A类国际学术会议。论文《BuildingUser-orientedPersonalizedMachineTranslatorbasedonUser-GeneratedTextualContent》针对当前机器翻译难以满足用户意义构建的问题,提出了一个个性化的机器翻译模型,旨在从用户在社会媒体环境下生成的文本内容中学习用户个性化的语言风格,并利用Transformer等深度学习技术生成个性化翻译结果。论文将微博个性化文本内容先翻译成目标语言,再回译为原始输入语言,得到个性化机器翻译配对数据集。然后基于预训练-微调思想,从该数据集学习不同用户的语言风格,生成个性化翻译结果。实验结果表明,该文构建的模型在个性化指标上取得了优于普
  • 聚焦产学研用协同创新,提升关键软件供给能力 | 2022 CCF中国软件大会圆满落幕2022-11-30

    我国软件领域规模和影响最大的会议—CCF中国软件大会(ChinaSoft2022)圆满落幕。大会包括学术、工业、教育以及竞赛四大类近40场活动;13位院士莅临,近10万人次参与,共同聚焦产教研用协同创新、提升关键软件供给能力,推动中国软件事业发展。2022CCF中国软件大会(ChinaSoft2022)经历了11月25日~27日三天会期,圆满落幕。本届大会由CCF主办,CCF软件工程专委会、系统软件专委会、形式化方法专委会、复旦大学承办,上海交通大学、华东师范大学、东华大学、上海计算机软件技术开发中心协办。大会赞助单位包括华为、航天宏图、百度、汇丰科技、荣耀、轩宇信息、上海控安、科大国创。本次大会以全线上的方式举行。其中,11月25日举行学术论坛和工业论坛活动,11月26日举行开幕式、特邀报告和NASAC青年软件创新奖论坛,11月27日举行学术论坛、工业论坛和教育论坛以及闭幕式(含颁奖环节)等。陆汝钤、林惠民、陈左宁、邬江兴、何积丰、梅宏、吕建、柴洪峰、廖湘科、王怀民、郑纬民、蒋昌俊、王自力等13位两院院士莅临大会指导。大会开幕式由大会共同主席、CCF软件工程专委会主任李宣东教授主持。
  • 复旦大学计算机科学技术学院章忠志教授团队荣获2022年度中国计算机学会自然科学二等奖2022-11-28

    2022年11月8日,中国计算机学会(CCF)公布了2022年度CCF科技成果奖评选结果,复旦大学计算机科学技术学院的章忠志教授与陈翌佳教授合作完成的项目“图的算法与计算理论若干问题研究”荣获2022年度CCF自然科学二等奖。复旦大学为唯一完成单位,主要完成人为章忠志教授、陈翌佳教授、李寰(章忠志教授的硕士,目前在宾夕法尼亚大学攻读博士学位,从事理论计算机领域的相关研究)。随着大数据、云计算、互联网等领域的快速发展,人们获得数据越来越方便。其中许多数据可以用图来表示,如社交网络、脑网络等。伴随大图数据的可得性及其在不同领域的广泛应用,产生了一系列关于图的计算理论与算法方面的巨大挑战。获奖项目对图的计算理论与算法方面的若干问题进行了系统的研究,取得了系列创新性的成果。基于项目的研究成果发表在FOCS、SODA、LICS、SICOMP、TIT等多个国际顶级会议与期刊上。成果丰富、完善了图的计算理论与算法领域的知识,填补了若干方向的研究空白,扩大了中国学者在相关领域的国际影响力。
  • 复旦大学计算机科学技术学院韩伟力教授等荣获2022年度“CCF科技成果奖”自然科学二等奖2022-11-27

    近日,CCF奖励委员会授予复旦大学计算机科学技术学院数据分析与安全实验室团队“用户口令的脆弱性建模与应对方法”项目2022年度“CCF科技成果奖”自然科学二等奖,该项目由韩伟力、徐铭、徐文渊、张凯、王晓阳合作完成。“CCF科技成果奖”授予在计算机科学、技术或工程领域具有重要发现、发明、原始创新,在相关领域有一定国际影响的优秀成果。“用户口令的脆弱性建模与应对方法”项目针对口令认证系统安全性问题,对用户口令的构成特征和行为规律进行研究,由此分析识别其弱点并有效应对。该项目建模并量化了中文语境下用户口令的构成特征;首次建模站内重用和跨站重用这两种用户口令重用行为,并量化其特征;构造个人自动白名单方法,精准保护口令免受钓鱼攻击,提升网络空间中的口令安全。韩伟力教授基于上述项目成果撰写专著《用户口令:系统安全的最前线》。▲专著:《用户口令:系统安全的最前线》该项目研究得到国内外知名学者的广泛关注,对缓解当前日益严峻的网络空间安全具有重要的理论意义与实际应用价值。在USENIXSecurity2014上发表的代表性论文为该顶尖会议首篇由大陆学者独立完成并发表的文章,并于2016年获上海市计算机学
  • 复旦大学计算机科学技术学院CodeWisdom团队在软件工程领域顶级会议ESEC/FSE 2022上发表多项研究成果2022-11-24

    在刚刚结束的2022年国际软件工程领域顶级会议ESEC/FSE2022上,由我院彭鑫教授、赵文耘教授、陈碧欢副教授、吴毅坚副教授等带领的CodeWisdom团队(复旦大学软件工程实验室)发表了多项研究成果,其中包括4篇主会论文(ResearchPapers)。关于深度学习系统(DL系统)性能问题的研究论文《UnderstandingPerformanceProblemsinDeepLearningSystems》系统分析了DL系统中的224个性能缺陷,总结了10类症状(如执行时间过慢、内存泄漏、GPU利用率异常等)和15类根因(如API误用、模型参数不合理、DL库版本不匹配、数据处理低效、硬件不匹配等)。在此基础上,构建了包含58个性能缺陷的数据集并评估了现有的性能缺陷分析方法,发现现有方法只能检测最多12个性能缺陷。最后,提出并实现了一个基于规则的性能缺陷检测工具,在130个开源DL系统中检测到了488个新的性能缺陷,其中105个性能缺陷已经被开发人员确认。关于开源软件漏洞问题的研究论文《TrackingPatchesforOpenSourceSoftwareVulnerabilit
  • 复旦大学计算机科学技术学院周喆等老师发表的论文被OSDI会议录用2022-11-17

    近日由复旦大学计算机科学技术学院周喆老师、周扬帆老师、毕研翔和万俊鹏同学以及加州大学尔湾分校李洲老师合作的1篇论文被OSDI2023(17thUSENIXSymposiumonOperatingSystemsDesignandImplementation)提前批次接收,这是复旦大学首次在OSDI会议上以第一作者发表的论文,OSDI会议将于2023年7月10日至12日在美国波士顿召开。OSDI(操作系统设计与实现研讨会)是计算机系统领域最顶级的国际学术会议之一,被誉为计算机系统领域的“奥斯卡”,汇集了全球学术界和产业界系统领域专业人士的前沿思考和突破性成果,拥有极高的学术地位和业界影响力。谷歌、哈佛大学、斯坦福大学等都曾有高质量论文被该会议收录。论文针对如何加速高频I/O任务这一问题展开研究,提出了用户态穿透(UserspaceBypass,UB)方案。该方案不仅能够大大加速高频I/O任务还能够适配现有的软件系统,具有极强的实用性。操作系统在内核态与用户态之间的切换会对高频I/O任务产生非常大的开销。这类开销在KPTI等安全防御机制打开后变得更大。现阶段的多种优化方案将内核从I/O路径中
  • 复旦大学计算机科学技术学院颜波、谭伟敏团队在国际多媒体顶级会议ACM Multimedia上发表多项新成果2022-11-14

    2022年国际多媒体顶级会议ACMMultimedia中,由我院颜波教授和谭伟敏青年研究员带领的复旦大学数字媒体实验室发表的3篇论文《Geometry-AwareReferenceSynthesisforMulti-ViewImageSuper-Resolution》、《LearningParallaxTransformerNetworkforStereoImageJPEGArtifactsRemoval》和《Co-CompletionforOccludedFacialExpressionRecognition》入选。ACMMultimedia是计算机学科多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议。《Geometry-AwareReferenceSynthesisforMulti-ViewImageSuper-Resolution》针对多视图多媒体应用难以同时满足用户高分辨率视觉体验和存储、带宽需求等问题,提出了一种多视图图像超分辨率任务,旨在提高从同一场景捕获的多视角图像的分辨率。现存问题的一种解决方案是应用图像或视频超分辨率方法从低分辨
  • 复旦大学计算机科学技术学院池明旻团队在“探星计划”中搜索到22颗新脉冲星2022-11-08

    复旦大学计算机科学技术学院池明旻研究团队与国家天文台、腾讯优图实验室组成的“探星团队”,结合人工智能(AI)技术提升脉冲星智能搜索的准确率和效率,在由三方联合启动“探星计划”中基于“中国天眼”——五百米口径球面射电望远镜(FAST)的巡天数据,自动搜索出22颗新脉冲星。脉冲星是大质量恒星演化晚期的致密残留物,对研究天体起源、生命起源有重要价值,也被视为”宇宙中的灯塔”。“云+AI”技术帮助FAST处理庞大数据,使得脉冲星智能搜索效率跃升。FAST漂移扫描巡天每天可以产生约130TB的原始观测数据。通过专业的天文软件对信号做图形转化的预处理需要耗费庞大的计算资源,当预处理完成后,每500TB的观测数据预处理后将生成的3千万—1亿张图片,天文专家要花上一年以上的时间才能从中找出脉冲星的候选体。通过开放云+AI技术,研发出用于搜索短周期脉冲星的“多模态+半监督学习”的AI解决方案,以及用于搜索单脉冲和快速射电暴的“AI+动态谱信号”的解决方案,前者对现有脉冲星搜索流程迭代了17个版本,后者的脉冲星信号识别速度提升120倍,在一年期内成功发现了22颗脉冲星,其中包括7颗高速自转的毫秒脉冲星、3
  • 复旦大学计算机科学技术学院自然语言处理科研团队14篇长文被EMNLP 2022录用2022-11-03

    EMNLP2022(The2022ConferenceonEmpiricalMethodsinNaturalLanguageProcessing)是自然语言处理领域的顶级国际会议,由国际语言学会SIGDAT小组在世界范围内每年召开一次。在本次会议中,复旦大学自然语言处理实验室FudanNLP共计14篇长文被录用,其中包括9篇主会文章和篇Findings文章。2022年冬季,EMNLP2022将以混合形式在阿联酋阿布扎比(AbuDhabi)举行,所有参与者都可以在会场现场或虚拟加入。9篇主会文章简介1、ProofInfer:GeneratingProofviaIterativeHierarchicalInference作者:费子楚,张奇,周鑫,桂韬,黄萱菁文章针对证明树生成任务提出一个通过迭代层次推理生成证明树的模型并采用分治算法,将证明树递归地编码为纯文本,同时预测层中的所有节点且不会丢失结构信息。2、Kernel-Whitening:OvercomeDatasetBiaswithIsotropicSentenceEmbedding作者:高颂杨,窦士涵,张奇,黄萱菁文章针对数据集偏差问
  • 复旦大学计算机科学技术学院冯瑞、张玥杰团队在国际多媒体顶级会议ACM Multimedia上发表新成果2022-10-28

    2022年国际多媒体顶级会议ACMMultimedia中,由我院冯瑞教授和张玥杰教授带领的复旦大学跨媒体智能计算实验室(CMIT)发表的论文《MM-Pyramid:MultimodalPyramidAttentionalNetworkforAudio-VisualEventLocalizationandVideoParsing》入选。ACMMultimedia是计算机学科多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议。论文针对视听事件解析任务展开研究。该任务需要分类并时序定位出一段视频内所有的视觉事件、听觉事件和视听事件,且任务是以弱监督的方式进行训练,因此极其具有挑战性。现有的大部分工作都试图从整体的角度来分析视频,忽略了其中的多尺度语义信息,使得模型难以定位不同长度的视听事件。为了解决这些问题,该研究团队提出了一种多模态金字塔注意力网络(MM-Pyramid)。该网络由两个模块组成,首先注意力特征金字塔模块通过几个堆叠的金字塔单元捕获时间金字塔特征,每个金字塔单元由一个固定大小的注意力块和扩张卷积块组成;然后自适应语义融合模块利用单元级注意
  • 复旦大学计算机科学技术学院承办的第七届IEEE SmartCloud国际会议成功举办2022-10-15

    2022年10月8日-9日,由复旦大学计算机科学技术学院承办的第七届IEEESmartCloud(智能云)国际会议(IEEESmartCloud2022)在上海区块链生态谷以线上线下结合的方式圆满举办。IEEESmartCloud2022国际会议从智能计算和云计算理论与应用的角度出发,以特邀主题报告、企业技术讲座和大会论文报告的形式,分析探索智能计算、云计算理论研究前沿和应用研究创新,推动了学术界成果与工业界需求的结合并向更高目标迈进。本次国际会议由复旦大学计算机科学技术学院吕智慧教授担任会议总主席,邀请了来自学术界和工业界的专家和学者,共同交流智能计算和云计算领域的研究成果及研发经验。本次大会设置了2场特邀主题报告,5个企业技术讲座和10场大会论文报告,与会人员围绕智能计算和云计算理论与应用广泛展开学术交流,报告最新研究成果。本次会议共收到论文152篇,录用36篇。会议论文及大会报告主要汇报和交流了智能计算、云计算理论研究前沿,和应用研究创新。在特邀主题报告中,德克萨斯大学达拉斯分校的BhavaniThurasingham教授和复旦大学计算机科学技术学院王晓阳教授受邀作大会主题报告。
  • 复旦大学计算机科学技术学院冯瑞、张玥杰团队论文被国际多媒体顶级会议ACM Multimedia录用2022-10-14

    2022年国际多媒体顶级会议ACMMultimedia中,由复旦大学计算机科学技术学院冯瑞老师和张玥杰老师所在跨媒体智能计算实验室(CMIT)团队发表的论文《Modality-AwareContrastiveInstanceLearningwithSelf-DistillationforWeakly-SupervisedAudio-VisualViolenceDetection》入选。ACMMultimedia是计算机学科多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议。论文针对弱监督视听暴力检测任务展开研究,旨在通过视频级别的标签识别包含多模态暴力事件的视频片段。现有的大部分工作在模型早期或中期建模音频和视频特征的融合与交互,但忽略了弱监督场景下的模态异质性,即音频事件和视频事件可能不一致的情况。为了解决这些问题,该论文提出了具有自蒸馏功能的模态感知对比性实例学习框架(MACIL-SD),利用一个轻量级的双流网络来生成音频和视觉包,其中单模态的背景、暴力和正常的实例以无监督的方式被聚类到半包中。音频和视觉的暴力片段的半包特征被视成正样本对,而暴
  • 复旦大学计算机科学技术学院王晓阳教授担任人工智能服务平台及应用技术专题论坛主席并获CAAI会士荣誉称号2022-10-05

    2022年9月17日-18日,由中国人工智能学会主办的第十一届中国智能产业高峰论坛(CIIS2022)在厦门圆满举办。CIIS2022从产业应用需求角度出发,解构人工智能商业实践现状,探索智能产业未来发展路径,为区域经济发展、产业布局和智能生态建设注入了新动能。18日下午,特设“人工智能服务平台及应用技术专题论坛”,由复旦大学计算机科学技术学院王晓阳教授担任论坛主席并全程担任论坛主持人,邀请了学界、企业界代表分享成果,探索人工智能计算体系及应用。论坛中首先中国科学院院士、国防科技大学王怀民教授做了“复杂智能软件系统的构造与演化”的主题报告,之后由浙江大学计算机学院院长陈刚教授就“大数据智能普适化——技术、平台及生态”的内容做了分享。湖南大学副校长李肯立教授、中星微集团联席总裁周大良先生、联通数字科技有限公司首席AI科学家廉士国先生、北京华宇软件股份有限公司首席人工智能官李东海先生分别就“基于异构计算的医学超声影像AI质控云平台”,“多维智联网融合与数字孪生协同技术及应用”,“AI+工业互联网:联通实践分享”,“人工智能在法律行业的落地应用”等内容做了分享。最后厦门云知芯总工程师曹齐先生
  • 复旦大学计算机科学技术学院池明旻团队在ACM国际多媒体会议提出图像和近红外信号联合建模解决纺织品成分鉴别问题的新思路2022-09-26

    在2022年举办的ACM国际多媒体会议(ACMInternationalConferenceonMultimedia)中,复旦大学计算机科学技术学院的池明旻老师及其博士生彭博等人针对当前纺织品纤维成分鉴别技术存在的短板,率先提出了结合近红外信号与显微图像联合建模的新思路。为了有效地结合近红外光谱信号和图像数据的特征,解决纺织品纤维成分定性和定量分析问题,团队提出了一种融合近红外信号和高清图像的信号与图像关联网络(ISiC-Net)。其设计灵感来自于纺织领域专家的传统成分鉴别过程:即网络可以学习不同材料的近红外信号对应的敏感波段,并在图像中找到与之相关联的局部特征。具体来说,应用多分支CNN来获得层次化NIR特征,同时使用Transformer编码器来提取子图像的视觉序列。然后将特征输入图像-信号相关感知模块(ISiCP),该感知模块由候选区域生成(CRG)模块和图像-信号双向相关注意力(ISiCA)模块组成。其中候选区域生成模块通过相似度计算与NIR特征进行成对匹配,捕获能够有效反映纺织品物理成分的候选图像区域;在图像信号双向相关注意力模块中,候选图像和近红外特征首先通过评分模块进行匹
  • 复旦大学计算机科学技术学院杨珉教授、张谧教授团队在USENIX安全研讨会上提出首个高隐蔽性的隐式文本后门攻击2022-09-17

    2022年8月,在举办的USENIX安全研讨会(USENIXSecuritySymposium)中,复旦大学计算机科学技术学院的杨珉教授和张谧教授等人率先提出基于文本风格的隐式NLP模型后门攻击技术,能有效绕过几乎所有已知后门检测方法。近年来,深度文本表征模型已广泛应用于舆情分析、内容安全、搜索引擎等实际应用场景,很大程度影响着网络生态安全。随着谷歌、OpenAI、百度等大型IT公司发布了多种预训练深度文本表征模型(如BERT、GPT-2等),从公开模型仓库下载、整合并部署预训练模型逐步成为下游服务商青睐的主要应用范式。然而,基于对深度文本表征模型的隐式后门行为进行检测,项目组发现潜在攻击者能利用文本风格实施高隐蔽性后门攻击,使目标文本表征模型被有效注入受特定文本风格(例如,诗歌体)触发的后门功能,并在实际攻击过程中,基于文本迁移技术将违规文本以这种特定风格改写,以绕过注有该后门功能的内容安全系统(图1)。已有研究工作主要面向文本分类模型,分析其中是否存在基于特定插入内容触发的后门行为。然而,由于在这类后门行为中,特定的插入内容通常能直接导致被篡改的模型具有攻击者指定的分类行为,因此,