由复旦大学计算机科学技术学院彭鑫教授领导的智能化软件开发 CodeWisdom 团队与北京大学谢涛教授、新加坡管理大学孙军副教授合作完成的关于微服务故障分析和调试的研究论文《Fault Analysis and Debugging of Microservice Systems: Industrial Survey, Benchmark System, and Empirical Study》(作者:周翔、彭鑫、谢涛、孙军、冀超、李文海、丁丹)被评选为软件工程领域的国际旗帜期刊、CCF A 类期刊《IEEE Transactions on Software Engineering》2018 年唯一的最佳论文。该奖项由评选委员会从该期刊 2018 年录用的 109 篇论文中评选而出。此奖项本次是第一次颁发,隶属于 IEEE 计算机学会 2019 年发起资助的最佳论文奖计划。这个计划的目的在于表彰和奖励 IEEE 计算机学会旗下每个期刊杂志在上一年度发表的最佳论文。
微服务架构已经成为云计算软件应用的主流选择,但是其复杂、多变的运行环境和服务交互使得微服务故障分析和调试成为企业面临的一个重要挑战。此外,由于缺少公开可用的基准系统,学术界在微服务故障分析和调试方面的研究工作还比较少。针对这些问题,研究组首先针对微服务系统的典型故障及其调试过程开展了面向工业界的调查研究,总结了一系列有代表性的微服务系统故障以及常用的故障分析和调试方法,并在自主研发的开源微服务系统 TrainTicket(https://github.com/FudanSELab/train-ticket/)上进行了迁移性的故障复现。在此基础上,研究组针对企业广泛使用的微服务故障分析和调试方法开展了经验研究,并提出了一种基于轨迹日志追踪和可视化分析的改进方法。该研究系统总结了工业界微服务系统的典型故障及故障调试的实践方法,同时为后续的微服务技术研究提供了一个开源基准系统 TrainTicket 以及基于 TrainTicket 复现的 22 个典型故障。此外,该研究还针对智能化的微服务轨迹日志分析和可视化提出了相应的技术思路。
撰稿:彭鑫