2022年5月25日下午,学院校庆周系列学术报告第2期、“复旦计算机未来前沿系列学术报告”(FudanCS F3系列报告)总第18期,由大数据与数据科学、人机交互与协同计算学科方向承办的,以“表示学习与数据管理” 为主题的第六期“国内外知名学者学术报告”(FudanCSF3-GLS)取得圆满成功。
此次报告活动总共包含四场,由来自大数据与数据科学、人机交互与协同计算学科方向的四位硕士/博士研究生介绍了发表/录用于SIGIR 2022、ICLR 2022、ICSE 2022以及ICDE 2022等顶会上的前沿工作。本次报告由大数据与数据科学学科方向负责人汪卫老师主持。
第一场报告由人机交互与协同计算方向的2018级博士研究生汪方野介绍了发表于SIGIR 2022上的论文 “Enhancing CTR Prediction with Context-Aware Feature Representation Learning”,其导师为顾宁教授。报告介绍了点击率(CTR) 预测任务目前遇到的瓶颈,过渡关注特征交互结构的设计而忽视了学习更准确、更灵活的特征表示。并且提出了一个轻量级的、通用的特征精练模块FRNet。该模块可以以一种即插即用的方式应用于现有的CTR模型中,通过学习可以感知上下文环境的特征表示进一步提高基础模型的表现。实验表明FRNet具有极强的有效性、高效性以及兼容性。
第二场报告是由人机交互与协同计算学科方向的2022级博士研究生陈一萱为带来的ICLR 2022 “Recursive Disentanglement Network”论文报告,其导师为尚笠教授。在解耦表示学习中,很多工作都将解耦的限制施加在了最终的隐变量空间,而忽视了特征空间的组合性质。报告介绍了如何利用特征空间的组合性,将解耦表示的性质设立为学习的目标函数,同时详细描述了适用的递归解耦网络。最后,通过实验验证,论文证明了该算法可以学习到更好的解耦表示,同时在下游任务中表现出了更好的泛化能力。
第三场报告由大数据与数据科学方向王鹏教授和汪卫教授的学生、2017级博士研究生陈佳介绍了发表于ICSE 2022上的论文“Online Summarizing Alerts through Semantic and Behavior Information”。告警记录了系统的详细信息,是监控系统的关键数据。由于系统组件之间复杂的调用关系,一个系统故障通常会引发多条告警,使得人工处理告警十分低效。因此,自动化的对系统告警进行汇总是一个亟待解决的实际问题。论文基于有监督学习模型提出了在线告警压缩方法(OAS)来解决该问题。OAS首先分别从告警中学习两种告警信息:语义信息和行为信息。然后OAS利用学习得到的告警的语义信息和行为信息来判断不同告警是否属于同一故障,从而在线地对告警进行汇总。针对商业银行的真实告警数据的实验证明了OAS的效率和有效性。
第四场报告由大数据与数据科学方向汪卫教授的学生、2020级硕士研究生赵京介绍了发表于ICDE 2022上的论文“Constructing Compact Time Series Index for Efficient Window Query Processing”。近年来,时间序列的分析和挖掘在学术界和工业界都得到了广泛的研究。给定一组长时间序列,人们通过基于窗口的相似性搜索来探索时间窗口的子序列。现有技术对于基于窗口的查询效率不高,特别是全匹配索引方式,需要为每个窗口进行独立的索引构建,造成了巨大的空间成本。同时,现有的基于窗口的方法只能对相邻窗口进行聚类,这导致索引的边界松散,从而降低了查询处理效率。为了解决以上问题,论文提出了一种紧凑的时间序列索引(WinIdx),用于高效的窗口查询处理。
正值复旦大学117周年校庆周,学院精心组织了此次系列校庆周系列学术报告,本次报告是第二期。“疫情阻挡不了科研的热情”,在本次线上顶会论文报告活动中,各位报告者准备充分,讲解细致,是一场干货满满、精彩纷呈的学术报告。参会的同学们积极讨论,深入交流,收获颇丰。