摘要:开源软件开发过程中包含大量有价值的数据,针对其数据规模巨大、碎片分散、快速膨胀的特点,研究了软件工程开源生态大数据体系,提出了一种自生长的采集处理框架与汇聚共享环境,阐述了基于软件工程开源生态大数据的智能化软件开发,以及基于软件工程开源生态大数据分析挖掘的典型应用,为面向智能化软件开发的开源生态大数据研究与应用提供相关指导。
关键词: 智能化软件开发 ; 开源软件 ; 开源生态 ; 大数据
1 引言
自20世纪末以来,开源软件在现代社会的各个领域得到了广泛的应用,取得了令人瞩目的成就。Black Duck公司2017年的调查报告显示,全球86%的企业在搭建业务时全部或部分使用了开源软件,其中60%的公司还在增加开源软件的使用比重。开源软件的开发活动以互联网软件社区为平台,其开发过程和制品数据对外开放,允许不同类型的开发者参与其中,形成一种大众参与的开源模式,给开源世界带来了强大的生产力。开源模式中大众贡献者可以自由地实践分布式协同,