基于文件粒度的多目标软件缺陷预测方法实证研究被引量：13

Empirical Studies on Multi-objective File-level Software Defect Prediction Method

下载PDF

导出

摘要软件缺陷预测技术通过挖掘和分析软件库训练出软件缺陷预测模型,随后利用该模型来预测出被测软件项目内的缺陷程序模块,因此可以有效地优化测试资源的分配.在基于代价感知的评测指标下,有监督学习方法与无监督学习方法之间的预测性能比较是最近的一个热门研究话题.其中在基于文件粒度的缺陷预测问题中,Yan等人最近对Yang等人考虑的无监督学习方法和有监督学习方法展开了大规模实证研究,结果表明存在一些无监督学习方法,其性能要优于有监督方法.基于来自开源社区的10个项目展开了实证研究.结果表明:在同项目缺陷预测场景中,若基于ACC评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有105.81%和123.84%的提高;若基于POPT评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有35.61%和38.70%的提高.在跨项目缺陷预测场景中,若基于ACC评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有22.42%和34.95%的提高.若基于POPT评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有11.45%和17.92%的提高.同时,基于Huang等人提出的PMI和IFA评测指标,MULTI方法的表现与代价感知的指标相比存在一定的折衷问题,但仍好于在ACC和POPT评测指标下表现最好的两种无监督学习方法.除此之外,将MULTI方法与最新提出的OneWay和CBS方法进行了比较,结果表明,MULTI方法在性能上仍然可以显著优于这两种方法.同时,基于F1评测指标的结果也验证了MULTI方法在预测性能上的显著优越性.最后,通过分析模型构建的时间开销,表明MULTI方法的模型构建开销对开发人员来说处于可接受的范围之内. By mining software repositories,software defect prediction can construct models to predict potential defective modules of projects under testing in advance and then optimize the allocation of test resources.When considering effort-aware performance measures,the performance comparison between supervised methods and unsupervised methods has been a recent hot topic.In the recent study for file-level defect prediction problem,Yan et al.conducted empirical studies by using unsupervised and supervised methods considered by Yang et al.and obtained the conclusion that some unsupervised methods can outperform the supervised methods.The empirical studies based on 10 projects from the open source community were conducted.Final results show that under the within-project defect prediction scenario,MULTI method can improve 105.81%and 123.84%respectively on average when compared to the best unsupervised method and the best supervised method based on ACC performance measure.While MULTI method can improve 35.61%and 38.70%respectively on average when compared to the best unsupervised method and the best supervised method based on POPT performance measure.Under the cross-project defect prediction scenario,MULTI method can improve 22.42%and 34.95%respectively on average when compared to the best unsupervised method and the best supervised method based on ACC performance measure.While MULTI method can improve 11.45%and 17.92%respectively on average when compared to the best unsupervised method and the best supervised method based on POPT performance measure.Based on PMI and IFA performance measures proposed by Huang et al.,it is found that MULTI method has the issue of trade-off,but it is still better than the best two unsupervised methods when considering ACC and POPT performance measures.Besides,MULTI method is compared with the recently proposed OneWay and CBS methods.The results show that MULTI performs significantly better than these two methods.Based on F1 performance measure,MULTI method also shows the superiority.Finally,the

作者陈翔赵英全顾庆倪超王赞 CHEN Xiang;ZHAO Ying-Quan;GU Qing;NI Chao;WANG Zan(School of Information Science and Technology,Nantong University,Nantong 226019,China;State Key Laboratory for Novel Software Technology(Nanjing University),Nanjing 210023,China;Guangxi Key Laboratory of Trusted Software(Guilin University of Electronic Technology),Guilin 541004,China;School of Computer Software,Tianjin University,Tianjin 300072,China)

机构地区南通大学信息科学技术学院计算机软件新技术国家重点实验室(南京大学) 广西可信软件重点实验室(桂林电子科技大学) 天津大学软件学院

出处《软件学报》 EI CSCD 北大核心 2019年第12期3694-3713,共20页 Journal of Software

基金国家自然科学基金(61702041,61602267,61202006) 南京大学计算机软件新技术国家重点实验室开放课题(KFKT2019B14) 广西可信软件重点实验室研究课题(kx201610) 南通市应用研究计划(JC2018134) 江苏省政府留学奖学金~~

关键词软件质量保障软件缺陷预测有监督学习无监督学习多目标优化 software quality assurance software defect prediction supervised learning unsupervised learning multi-objective optimization

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：123
2刘望舒,陈翔,顾庆,刘树龙,陈道蓄.软件缺陷预测中基于聚类分析的特征选择方法[J].中国科学：信息科学,2016,46(9):1298-1320. 被引量：25
3陈翔,王莉萍,顾庆,王赞,倪超,刘望舒,王秋萍.跨项目软件缺陷预测方法研究综述[J].计算机学报,2018,41(1):254-274. 被引量：44

二级参考文献188

1王青,伍书剑,李明树.软件缺陷预测技术.软件学报,2008,19(7):1565—1580.http://www.jos.org.cn/1000—9825/19/1565.htm. 被引量：1
2Hall T, Beecham S, Bowes D, Gray D, Counsell S. A systematic literature review on fault prediction performance in software engineering. IEEE Trans. on Software Engineering, 2012,38(6): 1276-1304. [doi: 10.1109/TSE.2011.103 ]. 被引量：1
3Radjenovic D, Hericko M, Torkar R, Zivkovic A. Software fault prediction metrics: A systematic literature review. Information and Software Technology, 2013,55(8): 1397-1418. [doi: 10.1016/j.infsof.2013.02.009]. 被引量：1
4Akiyama E. An example of software system debugging. In: Proc. of the Int'1 Federation of Information Proc. Societies Congress. New York: Springer Science and Business Media, 1971. 353-359. 被引量：1
5Halstead MH. Elements of Software Science (Operating and Programming Systems Series). New York: Elsevier Science Inc., 1977. 被引量：1
6McCabe TJ. A complexity measure. IEEE Trans. on Software Engineering, 1976,2(4):308-320. [doi: 10.1109/TSE.1976.233837]. 被引量：1
7Chidamber SR, Kemerer CF. A metrics suite for object oriented design. IEEE Trans. on Software Engineering, 1994,20(6): 476-493. [doi: 10.1109/32.295895]. 被引量：1
8Basili VR, Briand LC, Melo WL. A validation of object-oriented design metrics as quality indicators. IEEE Trans. on Software Engineering, 1996,22(10):751-761. [doi: 10.1109/32.544352]. 被引量：1
9Subramanyam R, Krishnan MS. Empirical analysis of CK metrics for object-oriented design complexity: Implications for software defects. IEEE Trans. on Software Engineering, 2003,29(4):297-310. [doi: 10.1109/TS E.2003.1191795]. 被引量：1
10Zhou YM, Xu BW, Leung H. On the ability of complexity metrics to predict fault-prone classes in object-oriented systems. Journal of Systems and Software, 2010,83(4):660-674. [doi: 10.1016/j.jss.2009.11.704]. 被引量：1

共引文献158

1郭肇强,周慧聪,刘释然,李言辉,陈林,周毓明,徐宝文.基于信息检索的缺陷定位:问题、进展与挑战[J].软件学报,2020(9):2826-2854. 被引量：14
2陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
3贾燕华,李英梅.基于自适应聚类过采样的软件缺陷预测研究[J].哈尔滨师范大学自然科学学报,2023,39(2):45-50. 被引量：1
4郑继栋.训练扎实指导有序──第十册《基础训练6》第五六七题教学设计[J].小学语文教学,2000(6):57-57.
5武玉英,孙平,何喜军,蒋国瑞.基于迁移学习的新产品销量预测模型[J].系统工程,2018,36(6):124-132. 被引量：2
6呙明辉.组态软件测试下电力系统程序缺陷检测仿真[J].计算机仿真,2018,35(12):325-328. 被引量：2
7陈翔.地方高等院校计算机专业本科生的科研能力培养方法研究[J].计算机教育,2016(6):17-21. 被引量：2
8刘望舒,陈翔,顾庆,刘树龙,陈道蓄.软件缺陷预测中基于聚类分析的特征选择方法[J].中国科学：信息科学,2016,46(9):1298-1320. 被引量：25
9王星,何鹏,陈丹,曾诚.跨项目缺陷预测中训练数据选择方法[J].计算机应用,2016,36(11):3165-3169. 被引量：3
10甘露,臧洌,李航.基于DA-SVM的软件缺陷预测模型[J].计算机与现代化,2017(2):36-39. 被引量：3

同被引文献70

1王丽娟,刘全周,晏江华,刘铁山,王通.基于ASPICE及ISO26262的软件测试技术研究[J].中国测试,2020,46(S01):139-143. 被引量：5
2陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
3王青,伍书剑,李明树.软件缺陷预测技术[J].软件学报,2008,19(7):1565-1580. 被引量：149
4朱明辉,张会清.基于RSSI的室内测距模型的研究[J].传感器与微系统,2010,29(8):19-22. 被引量：82
5李勇,黄志球,房丙午,王勇.代价敏感分类的软件缺陷预测方法[J].计算机科学与探索,2014,8(12):1442-1451. 被引量：14
6陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：123
7林永峰,陈亮.面向安全性分析的嵌入式软件测试方法研究[J].现代电子技术,2016,39(13):80-83. 被引量：28
8王婧宇,张欣,邹卫琴.基于分类的软件缺陷严重性预测[J].计算机与数字工程,2016,44(8):1532-1534. 被引量：2
9徐毅,范会敏.谱聚类与混沌免疫相结合的软件缺陷分析算法[J].吉林大学学报（理学版）,2016,54(5):1082-1086. 被引量：2
10刘望舒,陈翔,顾庆,刘树龙,陈道蓄.软件缺陷预测中基于聚类分析的特征选择方法[J].中国科学：信息科学,2016,46(9):1298-1320. 被引量：25

引证文献13

1李叶飞,官国飞,葛崇慧,陈翔,倪超,钱柱中.FSDNP:针对软件缺陷数预测的特征选择方法[J].计算机工程与应用,2019,55(14):61-68. 被引量：9
2张明亮.基于源文件可疑度的静态软件缺陷检测方法研究[J].黑龙江工业学院学报（综合版）,2020,20(6):55-59. 被引量：1
3李佩,张红.基于机器学习的计算机软件缺陷预测模型研究[J].信息通信,2020(10):48-49. 被引量：1
4张瑞,李学威.基于大数据的静态软件缺陷预测方法研究[J].信息与电脑,2020,32(19):43-44.
5陈勇,徐超,何炎祥,沈凡凡.基于编译优化的软件缺陷预测研究[J].电子学报,2021,49(2):216-224. 被引量：8
6曲豫宾,陈翔,李龙.可缓解类重叠问题的跨版本软件缺陷预测方法[J].吉林大学学报（理学版）,2021,59(2):372-378. 被引量：2
7丁晓梅.基于集成学习的静态软件缺陷预测模型构建[J].成都工业学院学报,2021,24(1):12-16. 被引量：1
8贾焱鑫,陈翔,葛骅,杨光,林浩.ORESP:基于有序回归的软件缺陷严重程度预测方法[J].计算机应用研究,2021,38(6):1815-1818. 被引量：1
9高晶.基于代价敏感半监督的跨项目软件缺陷数预测模型[J].沈阳工程学院学报（自然科学版）,2022,18(1):75-80.
10黄燕,徐贤,虞慧群,杨星光.一种特征转移和域自适应的异质缺陷预测方法[J].小型微型计算机系统,2022,43(1):186-192. 被引量：1

二级引证文献29

1张明亮.基于源文件可疑度的静态软件缺陷检测方法研究[J].黑龙江工业学院学报（综合版）,2020,20(6):55-59. 被引量：1
2李莉,纪欣沅,宋嵩.回环软件缺陷数量预测模型[J].计算机工程与应用,2021,57(7):158-163. 被引量：3
3马辉.基于改进神经网络的静态软件缺陷自动分配方法[J].信息与电脑,2021,33(4):68-70.
4刘国庆,王兴起,魏丹,方景龙,邵艳利.基于最大信息系数的软件缺陷数目预测特征选择方法[J].电信科学,2021,37(5):133-147. 被引量：2
5黎家乐.基于朴素贝叶斯的软件缺陷预测[J].科学大众（科技创新）,2021(10):253-254.
6高晶.基于代价敏感半监督的跨项目软件缺陷数预测模型[J].沈阳工程学院学报（自然科学版）,2022,18(1):75-80.
7LEI Tianwei,XUE Jingfeng,WANG Yong,NIU Zequn,SHI Zhiwei,ZHANG Yu.WCM-WTrA:A Cross-Project Defect Prediction Method Based on Feature Selection and Distance-Weight Transfer Learning[J].Chinese Journal of Electronics,2022,31(2):354-366. 被引量：1
8李芳,郜书锴.自媒体突发舆情情绪识别的可解释性深度学习方法[J].新闻知识,2021(11):20-27. 被引量：1
9李阿红.基于混合神经网络的Android软件缺陷精准预测研究[J].自动化与仪器仪表,2022(8):33-36. 被引量：1
10侯正波.基于BP神经网络的计算机软件缺陷预测方法[J].信息与电脑,2022,34(13):86-88.

1邱少健,蔡子仪,陆璐.基于卷积神经网络的代价敏感软件缺陷预测模型[J].计算机科学,2019,46(11):156-160. 被引量：8
2朱蓓.运用Scratch软件，打造小学信息“生本”课堂[J].学苑教育,2019,0(22):80-80.
3刘月.机器学习技术在软件测试领域的应用分析[J].计算机产品与流通,2019,0(10):29-29.
4牛志刚,无.区块链技术联盟一览[J].中国周刊,2019,0(11):46-47.
5刘成斌,郑巍,樊鑫,杨丰玉.基于网络表征学习的混合缺陷预测模型[J].计算机应用,2019,39(12):3633-3638. 被引量：4
6杨东海,林敏敏,张文杰,杨敬民.无监督混阶栈式稀疏自编码器的图像分类学习[J].计算机应用,2019,39(12):3420-3425. 被引量：5
7李龙贤,丁振晓,吴玉珍.基于热力学效应修正的诱导轮空化模型研究[J].火箭推进,2019,45(5):52-58. 被引量：5
8方家尉.区域性的医疗卫生信息化开源社区模式[J].今日健康,2016,15(11):372-373.
9王翎,孙涵.基于域适应的多场景车辆检测[J].计算机技术与发展,2019,29(12):158-161.
10张萌.数据挖掘在变电站设备运维中的应用[J].电力大数据,2019,22(11):44-49. 被引量：10

软件学报

2019年第12期

浏览历史

内容加载中请稍等...

基于文件粒度的多目标软件缺陷预测方法实证研究被引量：13

参考文献3

二级参考文献188

共引文献158

同被引文献70

引证文献13

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于文件粒度的多目标软件缺陷预测方法实证研究 被引量：13

参考文献3

二级参考文献188

共引文献158

同被引文献70

引证文献13

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于文件粒度的多目标软件缺陷预测方法实证研究被引量：13