• 新闻速递

学院校庆周系列学术报告|上海市数据科学重点实验室“数据科学校友论坛专场”成功举办

2024.06.12

春光流淌,首夏清和;卿云烂漫,奏鸣相辉。在复旦大学119周年校庆之际,计算机科学技术学院组织了校庆周系列学术报告会。525日,由学院上海市数据科学重点实验室主办的“数据科学校友论坛”在江湾校区二号交叉学科楼A3009会议室举行。本次论坛聚焦数据科学领域的最新研究与实践,邀请了多位专家校友返校进行交流与探讨。

厦门大学的林琛教授以“鲁棒索引推荐”为题作报告,在报告中强调了索引在提升数据库处理效率中的关键作用,并指出索引推荐是数据库研究的重点。她提出当前索引推荐方法分为启发式和学习型两大类,但这些方法在鲁棒性方面存在不足,包括自适应性评估不足、学习型方法可靠性问题以及自适应能力优化的缺失。林教授介绍了他们课题组在鲁棒索引推荐方面的研究,提出了TRAPPIPA两种新方法,旨在提升索引推荐系统的评估和性能,并探讨了如何利用动态和异构工作负载知识进一步提高这些系统的性能。

厦门大学林琛教授

东华大学徐波副教授汇报了题为“基于大语言模型的运维代码理解及生成”的报告,在报告中讨论了运维领域中代码的关键作用,以及大语言模型如何提升运维代码的理解和生成。他提出,尽管传统方法面临挑战,大模型的多项能力为解决这些问题提供了新途径。在日志理解方面,小模型结合大模型的背景知识可以提升性能;而在代码生成方面,微调开源大模型,借助闭源大模型的能力,并通过思维链提示增强处理复杂问题的能力,正成为主流趋势。徐波副教授的报告为运维领域的创新提供了新方向,并突显了大语言模型在该领域的应用潜力。

东华大学徐波副教授

上海理工大学的张明西特聘教授以“大规模图数据的单源相似度查询”为题作报告。相似度查询的目标是发现相似的实体,这是推荐系统、链路预测等现实网络应用的重要依据。为了降低查询效率,提出一种基于路径聚合的单源SimRank相似度查询方法VecSim,仅需要在内存中维护少数向量即可实现高效精准的单源相似度查询。实验表明,在精确度相当的前提下,VecSim在查询效率方面显著领先现有方法,并在每个测试数据集上都能够以0.1秒或更低时间开销达到级别的平均误差。

上海理工大学张明西特聘教授

江苏第二师范学院计算机工程学院院长朱辉生教授以“计算机类专业产教融合的探索与实践----以江苏第二师范学院为例”为题作报告。在报告中探讨了江苏第二师范学院在计算机类专业产教融合方面的实践。他阐述了产教融合的概念,随后从四个维度介绍了学院与企业的合作成果:专业共建、平台搭建、项目研发和人才培养。展示了在产教融合试点、产教融合基地建设、教育部和省级产学合作及研究项目等方面的成就,突显了产教融合在提升教育质量和学生实践能力方面的积极作用。

江苏第二师范学院计算机工程学院院长朱辉生教授

上海财经大学的崔万云副教授以“基于参数异质性的大模型高效推理”为题作主题报告,在报告中,崔教授揭示了大型语言模型(LLMs)中参数异质性的现象。一小部分"核心"参数对模型性能有着不成比例的巨大影响,而绝大多数参数的影响微乎其微。这种异质性广泛存在于不同规模、类型和家族的LLMs中。受此观察启发,崔教授团队提出了CherryQ,一种统一优化混合精度参数的新量化方法,识别并保留高精度的关键核心参数,同时将其余参数大幅量化为低精度。CherryQ在困惑度和下游任务性能上都优于现有的量化方法。值得注意的是,崔教授团队的3比特量化Vicuna-1.5模型展现出与16比特模型相媲美的性能。

上海财经大学崔万云副教授

报告结束后,与会师生踊跃提问、积极互动,深入探讨数据科学领域的前沿议题。正值复旦大学119周年校庆周,各位专家学者带来的学术大餐,进一步激发了学院师生的学术热情,对促进数据科学的发展具有重要意义。