计算与智能创新学院近期科研速递

作者:发布时间:2026-02-23浏览量:10




成果上新!

我院科技工作者新创佳绩

获一系列重要成果

小编整理了121月部分科研亮点

邀您共览




科研奖励

1、杨珉教授团队荣获上海市决策咨询研究成果奖一等奖


第十五届上海市决策咨询研究成果奖评选结果正式公布。学院杨珉教授团队携手上海市大数据中心联合攻关,凭借在政务数字化安全领域的突破性研究成果,荣获一等奖殊荣。

报道链接:

https://mp.weixin.qq.com/s/bW_Quue2wNmE78mhwp78TA


2、谢涛教授斩获国际软件领域“大满贯”殊荣


国际计算机学会(ACM)软件工程特别兴趣组(SIGSOFT)公布了2026年度SIGSOFT奖项评选结果。复旦大学双聘顶尖人才、复旦大学先进计算系统研究院院长、上海开放计算系统研究院院长谢涛教授荣获2026年度SIGSOFT杰出研究奖,以表彰其“在软件测试和软件解析学(Software Analytics)领域作出的杰出研究贡献,这些贡献对行业实践产生了广泛影响”。


报道链接:

https://mp.weixin.qq.com/s/cOFu_NBdbEjNhq22NeAsAQ


3、系统软件与安全实验室获ACM CCS 2025杰出论文奖

学院系统软件与安全实验室与香港中文大学合作完成的研究成果"BACScan: Automatic Black-Box Detection of Broken-Access-Control Vulnerabilities in Web Applications"入选网络安全国际顶级会议ACM CCS 2025CCF-A类),并荣获杰出论文奖(Distinguished Paper Award)。论文第一作者刘丰毓,复旦大学21级硕博连读生,白泽CTF战队队长,导师为张源教授、杨珉教授。

该研究针对长期位居 OWASP Top 10 首位的 Broken Access Control (越权) 漏洞,提出了首个反馈驱动(feedback-driven)黑盒检测框架,显著提升了黑盒扫描器对越权漏洞的检测精度,在理论创新与实证成果上均有突出的表现。


报道链接:

https://mp.weixin.qq.com/s/g-KiJK34kzMXCjPNZTEM5w?scene=1&click_id=7


科研进展


1、语音模型升级|模思智能团队发布新一代语音生成模型


多人说话场景的语音转录是语音识别领域的落地痛点问题。由复旦大学计算与智能创新学院、上海创智学院教授邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4oGemini、豆包等一众模型。

语音处理目前面临一个经典且极具挑战的问题:SATS,即「带说话人归属和时间戳的转录」。MOSS-Transcribe-Diarize 一扫现有 SATS 方案的不足,一举解决了三大核心瓶颈,即长上下文窗口受限、长时记忆脆弱和缺乏原生时间戳。其支持 128K 的长上下文窗口,可以一次性输入并处理长达 90 分钟的音频,突出了复杂场景下的抗干扰能力。在 AISHELL-4PodcastMovies 等多个语音基准测试中,模型均取得了业界最优(SOTA)的整体表现。

图 影视剧背景下该模型实现了最低的 CER(字错误率)与 cpCER(最优排列字错误率)、最佳的 Δcp 指标(说话人分离性能)

报道链接:

https://mp.weixin.qq.com/s/LcpUuUf_EHoQkA2GjqIvwQ


2、推荐系统革新|CISL实验室构建在线社区推荐通用模拟框架

为了解决现有模拟方法模拟智能推荐算法对在线社区的影响研究上通用性、建模精度与计算可扩展性之间难以兼顾的问题,学院卢暾、张鹏、顾宁团队在信息系统领域国际顶级期刊ACM Transactions on Information SystemsACM TOISCCF A类国际学术期刊)发表研究论文“RECOSIM: A Universal, Accurate, and Scalable Simulation Framework for Online Community Recommendations”

该工作基于大模型多智能体协同与使用满足理论(UGT)提出了一种面向在线社区推荐系统的通用模拟基础框架RECOSIM,为在虚拟环境中系统研究“推荐算法-用户行为-社区结构”的协同演化提供了可扩展的实验平台,标志着在线社区智能传播生态系统方向上的重要原创性进展。

作为一项面向在线社会的智能传播生态系统的基础性研究成果,RECOSIM为在“可控虚拟社会”中系统研究推荐算法的社会影响提供了新的技术路径,具有重要的方法论意义。

图:RECOSIM 模拟框架


报道链接:

https://mp.weixin.qq.com/s/3nd2K4kMmFby2E_m6K8f0Q

论文链接:

https://dl.acm.org/doi/10.1145/3768342


3、小样本分割突破|戈维峰团队提出图像掩码去噪学习范式DeFSS

学院戈维峰团队在领域顶会ICCV 2025上发表题为《DeFSS: Image - to - Mask Denoising Learning for Few - shot Segmentation》的研究论文。该工作创新性地提出了一种图像-掩码的去噪学习范式,将传统的分割解码过程重构为图像加噪与掩码去噪两个阶段,有效利用了扩散模型(Diffusion Model)的强大分布学习能力,显著降低了对支持样本的依赖,提升了模型在复杂场景下的分割性能。

该方法设计了一种基于区域语义的自适应加噪策略,通过先验掩码精准地引导噪声在图像不同区域的强度,既保持了目标语义,又扰动了潜在的干扰背景;该方法还提出了一个以支撑样本为条件、单次前向去噪的Transformer网络,并引入可学习的类别代理替代传统独热编码,结合创新的随机交叉嵌入正则化,有效增强了模型在不同类别间的判别能力,实现了高效且确定性的分割预测,且无需在推理阶段提供额外类别标注,具有更高的泛化性。该方法在两个权威小样本分割基准测试上均取得了当前最优性能。特别是在数据更稀缺的单样本设定和场景更复杂的COCO - 20i数据集上,性能提升更为显著,验证了其在应对类偏差问题上的优越性。

DeFSS模型结构图

该研究为自动驾驶、医学影像分析、机器人视觉理解等数据稀缺或标注成本高昂的场景,提供了一种高效、鲁棒且无需额外标注的少样本图像分割新范式,推动了生成模型与判别式视觉理解任务的深度融合,为复杂开放环境下的小样本智能感知系统开辟了新的技术路径。


论文链接:

https://openaccess.thecvf.com/content/ICCV2025/html/Qin_DeFSS_Image-to-Mask_Denoising_Learning_for_Few-shot_Segmentation_ICCV_2025_paper.html



4AI风险治理|前沿团队受邀联合国研讨AI欺骗风险防控

由联合国秘书长技术特使、副秘书长Amandeep Gill与图灵奖得主Yoshua Bengio共同牵头主办的AI欺骗专家圆桌会议以线上形式召开。学院前沿AI风险研究团队(由杨珉教授领衔,潘旭东,戴嘉润,洪赓三位青年学者组成),因相关研究在国际上起步早、实证发现丰富,受到联合国秘书长科学顾问委员会的高度关注。潘旭东老师作为代表分享团队在AI Deception领域的最新研究成果,得到Yoshua Bengio认可,以实证发现为全球AI治理贡献中国智慧。


本次圆桌有全球30位顶尖学者与机构代表(包括DeepMindAnthropicOxfordCambridgeUC Berkeley等)参与,围绕AI欺骗的关键问题、应重点关注的技术路径、未来最需警惕的风险以及联合国在下一阶段应优先考虑的政策与治理议题进行开放讨论,旨在为联合国秘书长科学顾问委员会即将发布的科学简报 (Science Brief) 提供技术支撑。



5、大模型训练统一理论|邱锡鹏团队揭示SFTDPO本质关联

学院邱锡鹏团队在人工智能顶会NeurIPS 2025上发表题为《Implicit Reward as the Bridge: A Unified View of SFT and DPO Connections》的研究论文。该工作创新性地构建了一个统一的理论框架,将监督微调(SFT)和基于偏好的优化(如DPO)纳入同一“策略-奖励子空间”进行解释,首次通过严格数学推导证明SFT本质是隐式奖励学习的特例,从而弥合了两种方法的理论鸿沟。

该研究在偏好学习阶段隐式奖励解释DPO的基础上,从分布匹配目标出发,通过严格数学推导证明传统SFT目标本质是隐式奖励学习的特例,将SFTDPO纳入同一“策略–奖励子空间”进行解释。研究揭示了目标中KL项可能为零阶常数项、不产生梯度约束的关键现象,提出通过降低学习率等启发式方法缓解训练不稳,并给出可保留KL项的替代目标,在指令遵循任务上得到与理论一致的实证结果。此外,研究还证明LLM logits可视为对应隐式奖励的Q函数结构,将此前DPO场景的相关联系扩展到SFT阶段。

图:SFTDPO都在最优奖励空间中调整隐式奖励


论文链接:

https://openreview.net/pdf?id=xUx2B2NHvj


6、推理加速引擎|吕智慧团队推出Token对齐解码框架GRIFFIN

学院智慧团队在人工智能顶会NeurIPS 2025上发表题为《GRIFFIN: Effective Token Alignment for Faster Speculative Decoding》的研究论文。该工作创新性地构建了一个解决推测式解码中token错位问题的框架GRIFFIN,通过Token-Alignable TrainingToken-Alignable Draft Model设计,显著提升了草稿token的接受率,从而加速大语言模型的推理过程。

在金融科技应用中,大语言模型的推理时延是规模化部署的关键瓶颈,推测式解码虽能通过轻量草稿模型并行验证加速推理,但训练与解码阶段的输入差异导致token错位和误差累积,严重制约多步推测的实际加速收益。GRIFFIN框架包含两项核心创新:Token-Alignable Training通过top-k可预测性判定与动态loss掩码机制,屏蔽错位token的负面优化信号;Token-Alignable Draft Model设计Token-Guided FusionToken-Enhanced Head模块,将token嵌入显式融入特征生成与预测头。实验覆盖主流模型与三大任务,结果表明GRIFFIN平均接受长度提升超8%,相较EAGLE-2加速约18%、相较HASS加速约7%,实现当前最优性能。


图:GRIFFIN Token-Alignable Draft Model架构设计


论文链接:

https://arxiv.org/abs/2502.11018


7、自适应推理控制|肖仰华团队发布动态路径选择模型ARM

学院肖仰华团队在人工智能顶会NeurIPS 2025上发表题为《ARM: Adaptive Reasoning Model》的研究论文。该工作创新性地提出了一种自适应推理模型ARM,通过两阶段训练策略实现推理效率与准确率的协同优化。研究首创性引入改进型强化学习算法Ada-GRPO,在保留高精度长链思维能力的同时,动态激活直接回答、短链思维等多种推理路径,有效缓解“过度思考”问题。实验表明,ARM在多类任务中平均减少30% Token消耗(简单任务最高节省70%),准确率与现有最强方法持平甚至更优,且训练时间可降低至传统推理模型的1/2


图:ARM 自适应推理模型示例

论文链接:

https://arxiv.org/abs/2505.20258



8、观点动力学计算优化|章忠志团队实现FJ模型极速求解

学院章忠志团队在人工智能顶会NeurIPS 2025上发表题为《Fast computation and optimization for opinion-based quantities of Friedkin-Johnsen model》的研究论文。该工作系统研究Friedkin–JohnsenFJ)模型中观点相关量的快速计算与优化问题,提出一套统一、高效且具有理论保证的新方法。研究引入部分根森林这一新概念,突破以往依赖全图随机游走或拉普拉斯方程求解的计算范式,构建基于局部采样的高效估计框架。在此基础上,提出多种亚线性时间算法,可快速估计关键观点指标,还能解决观点最小化及极化–分歧联合最小化问题。实验表明,该方法在保证高精度的同时,相较现有最优方法实现数量级加速,可稳定扩展至数千万节点级别的真实社交网络。


图:新算法(PF-QE)在观点相关量估计结果任务中的效率与效果对比,显著优于现有方法


论文链接:

https://openreview.net/pdf?id=lCsVtkMusN


9、社交网络干预算法|章忠志团队提出观点最大化精准优化方案

学院章忠志团队在人工智能顶会NeurIPS 2025上发表题为《Opinion maximization in social networks by modifying internal opinions》的研究论文。该工作创新性地提出了一种通过策略性修改固定数量节点内部观点来实现社会网络总体观点最大化的方法,开发了基于随机游走和森林采样的高效近似算法(RWBFOREST),有效克服传统方法计算复杂度高的瓶颈;更为重要的是,受随机游走解释启发,团队建立结构中心性与吸收随机游走之间的等价关系,开发确定性异步算法(MIS),通过异步更新操作和渐进式精化精确识别最优节点集合,在保证效率的同时实现理论上的精确性。实验表明,在数千万节点的真实网络数据集上,所提方法均显著优于基线算法,其中异步算法MIS在所有测试场景下均展现出卓越的效率和精度。

图:算法在不同网络上的运行效果对比



论文链接:

https://openreview.net/pdf?id=YStO2i0oyK


10AI水印攻防|张谧团队提出下一帧预测去除技术NFPA

学院张谧团队在人工智能顶会NeurIPS 2025上发表题为《The Future Unmarked: Watermark Removal in AI-Generated Images via Next-Frame Prediction》的研究论文。该工作创新性地提出了一种基于下一帧预测的语义级水印去除攻击NFPA,通过将水印去除任务重新建模为下一帧图像预测问题,实现精细语义操纵,有效降低水印检测率,同时保持高水平时空一致性和视觉质量。

该方法将含水印图像视为“初始帧”,在潜在空间构建受限光流变换矩阵模拟视频运动轨迹,生成语义一致但特征分布远离水印信号的“下一帧”图像。

: NFPA攻击流程示意图,通过光流变换与帧注意力机制预测下一帧无水印图像

基于预训练文生图模型设计零样本、无需微调的下一帧图像预测框架,通过帧级注意力机制替代标准自注意力,确保攻击后图像维持高水平时空一致性和视觉质量。实验显示,NFPA在针对多种最先进图像水印方案的评估中,不仅显著降低水印检测率,还在图像质量指标上优于现有基准攻击方法,且处理单张图像仅需1秒。该方法还具备普适性、黑盒性、无数据依赖、无查询需求等优势。


论文链接:

https://openreview.net/forum?id=yO2zE1yIYZ



11、可控图像生成|张军平团队研发实例组装注意力机制

学院张军平团队在人工智能顶会NeurIPS 2025上发表题为《InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention》的研究论文。该工作创新性地提出了一个布局可控图像生成框架InstanceAssemble,通过实例组装注意力机制和级联式结构,有效解决了复杂布局下多实例建模冲突问题,显著提升了空间对齐精度与语义一致性。该方法采用轻量级LoRA适配,仅引入基础模型3%的额外参数,在保持生成质量的同时实现高效布局控制,并构建高密度场景评测基准DenseLayout及综合指标Layout Grounding ScoreLGS),为公平评估提供新标准。

图:InstanceAssemble 方法整体框架示意图



论文链接:

https://arxiv.org/abs/2509.16691





12、图学习新范式|张军平团队构建多视图统一框架GMV

学院张军平团队在人工智能顶会NeurIPS 2025上发表题为《GMV: A Unified and Efficient Graph Multi-View Learning Framework》的研究论文。该工作创新性地提出统一且高效的图多视图学习框架(GMV),受“彩票假设”启发,旨在通过单一GNN模型激活内部多样化的子网络。框架从数据、模型和优化三个视角协同扩展“视图”:数据视角提出结构增强的子图混合技术(ST-SubMix),生成混合视图的同时保留关键拓扑结构和语义节点;模型视角引入轻量级双输出预测头,在单次前向传播中实现多视图分解,避免传统集成学习的多模型开销;优化视角设计多视图与混合视图损失函数,协同监督子网络的差异化学习。

实验表明,GMV在推理阶段仅需简单的预测头平均,即可达到集成学习的效果。在多个基准数据集上,GMVGNNGraph Transformer架构上均取得超越现有增强及集成方法的SOTA性能,实现了计算效率与模型准确率的最佳平衡。

图:准确率与显存/速度的权衡对比



论文链接:

https://openreview.net/forum?id=LfncIaLHnI


13、时序图语义建模|熊贇团队实现文本与图结构跨模态融合

学院熊贇团队在人工智能顶会NeurIPS 2025上发表题为《Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models》的研究论文。该工作创新性地提出了一个结构-语义统一建模框架,通过大语言模型(LLMs)增强时序推理能力,实现文本语义与图结构的深度融合,显著提升下游任务性能。框架包含时序语义抽取器和语义-结构协同编码器:前者构建时间推理链驱动LLMs动态总结节点邻域语义演化规律;后者通过分层传播与双向交换机制促进语义表示与结构表示的协同强化,生成统一跨模态节点表示。在四个公开数据集上的实验结果表明,所提出的框架在链路预测任务上平均取得24.7%MRR绝对提升,验证了LLMs和细粒度融合机制在时序文本属性图表征学习中的有效性。

图:(左)时序文本属性图中语义随时间演化规律的示例;(右)所提出框架与现有方法的对比示意图



论文链接:

https://neurips.cc/virtual/2025/loc/san-diego/poster/119521



14、极地预报突破|杨卫东团队提出多粒度海冰预测模型SIFusion

学院杨卫东团队在人工智能顶会NeurIPS 2025上发表题为《SIFusion: A Unified Fusion Framework for Multi-granularity Arctic Sea Ice Forecasting》的研究论文。该工作创新性地提出了一个多粒度融合框架SIFusion,首次实现多时间尺度海冰变化的统一表征,通过引入共享空间编码器,先完成多个时间尺度海冰密集度的隐式特征提取,并在该时间尺度内部进行显式序列建模。随后,将不同时间尺度内的海冰变化统一映射到多粒度融合的表征空间,利用注意力机制构建跨时间尺度的关联,通过共享空间解码器同时完成不同尺度的海冰密集度预报。

对比实验表明,SIFusion多粒度融合框架既能够有效捕捉单一时间尺度内的海冰变化趋势,也能通过引入显式跨尺度建模提升整体预报性能,为次季节-季节时间尺度下的北极海冰预报提供了新的基线和建模思路。



图:SIFusion多粒度融合统一表征框架



论文链接:

https://neurips.cc/virtual/2025/loc/san-diego/poster/119730


15、脉冲神经网络进化|郑骁庆团队攻克位置编码关键技术

学院郑骁庆团队在人工智能顶会NeurIPS 2025上发表题为《Toward Relative Positional Encoding in Spiking Transformers》的研究论文。该工作创新性地提出了Gray-PELog-PE两种脉冲相对位置编码方法,在严格保持脉冲二值计算特性的前提下,有效解决了脉冲Transformer中相对位置信息建模的难题,实现了跨任务、跨架构的一致性能提升。其中,Gray-PE利用格雷码在二进制空间的恒定汉明距离性质实现相对位置信息的近似编码;Log-PE将对数形式的相对距离直接注入脉冲注意力图,在长序列建模中表现出更强的稳定性。与传统直接移植Transformer中相对位置编码的方法相比,该方法在时间序列分析、自然语言处理等任务中实现了显著性能提升,为低功耗智能硬件与算法协同设计提供了新思路。

图:Gray-PE基于格雷码的相对位置编码示意,展示了在脉冲注意力机制中稳定刻画相对距离的原理;Log-PE 将对数相对距离直接注入脉冲注意力图,在长序列任务中显著提升预测性能。


论文链接:

https://openaccess.thecvf.com/content/ICCV2025/html/Qin_DeFSS_Image-to-Mask_Denoising_Learning_for_Few-shot_Segmentation_ICCV_2025_paper.html