人工智能技术浪潮下,自然科学与社会科学如何形成新科研范式?5月29日,庆祝建校119周年相辉校庆系列学术报告会“AI4S(AI for Science)与AI4SS(AI for Social Science)的对话:双轮驱动的科学智能”于江湾校区二号交叉学科楼举行。两位来自不同领域的学者,进行了一场关于AI赋能科学研究的思想碰撞。
三角对话,数说社科
社会智能研究中心首席科学家傅晓明教授从“理论、数据与模型的三角对话”这一主题出发,探讨了社会科学研究的范式转变。他介绍说,社会科学理论、大数据分析及机器学习模型的有机结合正成为社会科学研究的重要新范式。
“数据不仅可以用来验证已有理论,还可以揭示新的社会现象和趋势,从而引发理论的更新和发展。”傅晓明说,计算社会学通过理论指导数据收集和模型选择,形成一个互补和强化的框架,更好地赋能社会科学研究。
作为案例,他介绍了所属团队开展的一项针对中国人际关系的研究。传统的邓巴理论认为人的社交圈分为五层,团队对其进行了本土化阐释,利用机器学习模型,开展数据收集与挖掘,并不断对话、调试、修正。通过三轮修正,团队发现,中国一线城市十八岁到二十八岁年轻人分人脉可分为四圈。
通过三角对话,社会科学研究者能够更好地分析复杂的人际互动模式。团队还基于多维时空大数据挖掘、预测性模型、可解释性人工智能等研究方法,研究了在线教育对教育公平的影响、跨地区人群在线购物行为特点、农村的发展情况等等课题。
“三角对话把大数据的探索性、模型的可计算性、社会科学的可验证性相结合,这是我们期待的跨学科互动。”傅晓明强调了跨学科合作的重要性。人工智能技术加强计算机科学与社会科学的有机融合,将为未来的研究带来前所未有的机遇和挑战。
人机融合,以智取胜
什么是AI for Science(科学智能)的核心?计算机科学技术学院教授颜波首先回顾了科学研究的几次范式变革——从实验科学范式到理论研究、计算仿真、数据科学,AI for Science时代的来临,引发科学研究“第五范式”的探索。
“AI for Science强调的是机理与算法的深度融合,为复杂科学场景提供研究新线索、科学新假设。”颜波认为,AIGC(生成式人工智能)在其中的潜力十分显著,其能够对多类别、高维度、跨尺度的海量科学大数据进行建模、推理和分析,从而发现新物质、合成新材料、构建新机理。以往科学研究中的原始数据需要很多时间训练,融合AIGC后,可以提前激发涌现能力。颜波总结道,融合知识的AIGC已经成为AI4S的新引擎。“人有人智,机有机智,人机融合,以智取胜!”
AIGC的孪生、编辑、衍生三大前沿能力在科研中发挥了重要作用。颜波举例,AIGC的孪生能力能够实现数字媒体智能再生的多域性分析,解决智慧终端拍摄时“看不清”的问题,孪生出高清的图片。这种AI Zoom技术已应用于某知名品牌旗舰系列手机,团队基于AIGC研发的荧光显微成像增强基础大模型也获得超万次下载。
同时,AIGC的编辑能力,应用于连贯性分析,能解决视频监控人脸识别“算不准”的问题。他所在实验室研发的“全浓缩”监控视频浓缩系统,将长时间的监控视频浓缩成短片段,实现了条件语义快速定位、快速识别,达到快速破案的目的。
大模型需要大数据,而大数据往往存在长尾分布的难题。AIGC生成数据不但自带标签,还避免了隐私问题。“AIGC的衍生能力,使数据化繁为简、以少增多,最终能实现‘小数据、小算力、大模型’的高效目标。”以往科学研究中的原始数据需要很多时间训练,融合AIGC后,可以提前激发涌现能力。“人有人智,机有机智,人机融合,以智取胜!”颜波总结道,融合知识的AIGC已经成为AI4S的新引擎。