核字典学习在软件缺陷预测中的应用被引量：3

Kernel Dictionary Learning for Software Defect Prediction

下载PDF

导出

摘要提出一种基于核字典学习的软件缺陷预测方法,首先根据软件缺陷历史数据结构复杂、类不平衡的特点,利用核方法将软件缺陷历史数据映射到一个能代表原始数据分布的高维特征空间.然后在核空间中,通过学习得到一个核字典,利用这个核字典判定软件模块的属性,对软件模块进行缺陷预测.在核字典学习过程中,为了解决缺陷预测中的类不平衡问题,采用了一种核字典基选择策略,构造出一个类别平衡的核字典.在NASA数据集上的对比实验表明,核字典学习方法取得了较高的Fmeasure值和AUC值,有效地解决了缺陷预测中的类不平衡问题,取得了较好的预测效果. Propose a kernel dictionary learning approach for software defect classification and prediction. The historical defect data used in software detect prediction has a complicated structure and a marked characteristic of class-imbalance which will leads to negative influence on decision of classifiers. Kernel trick can map the historical defect data to a higher-dimensional feature space where the defect data can be well represented. By using the characteristics of the metrics mined from the open source software, we get a kernel dictionary learning classifier, which can predict software defect efficiently. Considering the class-imbalance problem in software defect prediction, we build a class-balance kernel dictionary with the same number of defective modules and non-defective modules. We employ the widely used NASA datasets as test data to evaluate the performance of all compared methods, and experimental results show that kernel dictionary learning outperforms several representative state-of-the-art defect prediction methods.

作者王铁建吴飞荆晓远

机构地区武汉大学计算机学院软件工程国家重点实验室南京邮电大学自动化学院

出处《小型微型计算机系统》 CSCD 北大核心 2017年第7期1501-1505,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61272273)资助

关键词缺陷预测核字典学习类不平衡问题 software detect prediction kernel dictionary learning class-imbalance problem

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1王瑞,杜林峰,孙督,万旺根.复杂场景下结合SIFT与核稀疏表示的交通目标分类识别[J].电子学报,2014,42(11):2129-2134. 被引量：9
2陈思宝,赵令,罗斌.基于局部保持的核稀疏表示字典学习[J].自动化学报,2014,40(10):2295-2305. 被引量：3
3练秋生,石保顺,陈书贞.字典学习模型、算法及其应用研究进展[J].自动化学报,2015,41(2):240-260. 被引量：122
4陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：124

二级参考文献311

1张海,王尧,常象宇,徐宗本.L_(1/2)正则化[J].中国科学：信息科学,2010,40(3):412-422. 被引量：15
2Wright J, Yang A Y, Ganesh A, Sastry S S. Robust face recognition via sparse representation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227. 被引量：1
3Engan K, Aase S O, Hakon H J. Method of optimal directions for frame design. In: Proceedings of Acoustics, Speech, and Signal Processing. Arizona, USA: IEEE, 1999, 5: 2443-2446. 被引量：1
4Aharon M, Elad M, Bruckstein M A. The K-SVD: an algorithm for designing of overcomplete dictionaries for sparse representation. IEEE Transactions on Signal Processing, 2006, 54(11): 4311-4322. 被引量：1
5Yang M, Zhang L, Feng X. Fisher discrimination dictionary learning for sparse representation. In: Proceedings of 2011 IEEE International Conference on Computer Vision(ICCV). Barcelona, Spain: IEEE, 2011. 543-550. 被引量：1
6He X F, Niyogi P. Locality preserving projections. Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2003. 152-160. 被引量：1
7Scholkopf B, Smola A, Muller K R. Nonlinear component analysis as a kernel eigenvalue problem. Neural Computation, 1998, 10(5): 1299-1319. 被引量：1
8Mike S, Ratsch G, Scholkopf B, Weston J, Muller R K. Fisher discriminant analysis with kernels. In: Proceedings of the 1999 IEEE Signal Processing Society Workshop. Madison, WI: IEEE, 1999. 41-48. 被引量：1
9Lu J W, Plataniotis K N, Venetsanopoulos A N. Face recognition using kernel direct discriminant analysis algorithms. IEEE Transactions on Neural Networks, 2003, 14(1): 117-126. 被引量：1
10Gao S, Tsang I, Chia L T. Sparse representation with kernels. IEEE Transactions on Image Processing, 2013, 22(2): 423-434. 被引量：1

共引文献253

1程德强,陈杰,寇旗旗,聂帅杰,张剑英.融合层次特征和注意力机制的轻量化矿井图像超分辨率重建方法[J].仪器仪表学报,2022,43(8):73-84. 被引量：33
2李帅永,毛维培,程振华,韩明秀,夏传强.基于VMD和K-SVD字典学习的供水管道泄漏振动信号压缩感知方法[J].仪器仪表学报,2020,41(3):49-60. 被引量：25
3郭肇强,周慧聪,刘释然,李言辉,陈林,周毓明,徐宝文.基于信息检索的缺陷定位:问题、进展与挑战[J].软件学报,2020(9):2826-2854. 被引量：14
4陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
5张光雅,李江坤,李兵海,张翔,张伟,武雷超.K-SVD字典在航空伽马谱数据降噪中的应用研究[J].核电子学与探测技术,2023,43(1):56-63. 被引量：1
6贾燕华,李英梅.基于自适应聚类过采样的软件缺陷预测研究[J].哈尔滨师范大学自然科学学报,2023,39(2):45-50. 被引量：1
7郑继栋.训练扎实指导有序──第十册《基础训练6》第五六七题教学设计[J].小学语文教学,2000(6):57-57.
8呙明辉.组态软件测试下电力系统程序缺陷检测仿真[J].计算机仿真,2018,35(12):325-328. 被引量：2
9殷晓辉.基于改进K-SVD算法的傅里叶叠层成像识别技术研究[J].生命科学仪器,2018,16(6):46-49.
10范引娣.基于分布结构约束稀疏表示的图像分类方法[J].计算机与现代化,2015(7):73-76. 被引量：1

同被引文献31

1吴俊,谭跃进,邓宏钟,朱大智.无标度网络拓扑结构非均匀性研究[J].系统工程理论与实践,2007,27(5):101-105. 被引量：36
2李鹏,赵逢禹.软件缺陷关联分析与缺陷排除研究[J].计算机科学,2013,40(10):159-161. 被引量：4
3汪北阳,吕金虎.复杂软件系统的软件网络结点影响分析[J].软件学报,2013,24(12):2814-2829. 被引量：16
4吴方君.软件缺陷预测经验共享:一种迁移学习方法[J].小型微型计算机系统,2014,35(11):2416-2421. 被引量：5
5卢红敏,周毓明,徐宝文.类规模对面向对象度量易变性预测能力的潜在混和效应:一个元分析[J].计算机学报,2015,38(5):1069-1081. 被引量：2
6戴翔,毛宇光.跨机构的软件缺陷集成采样预测研究[J].小型微型计算机系统,2015,36(8):1700-1705. 被引量：5
7迪可新,魏平,柯钧,蒋作琛,王雅.基于压缩感知的空间稀疏目标成像方法研究[J].微电子学与计算机,2015,32(10):98-104. 被引量：1
8陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：124
9毛发贵,李碧雯,沈备军.基于实例迁移的跨项目软件缺陷预测[J].计算机科学与探索,2016,10(1):43-55. 被引量：7
10程铭,毋国庆,袁梦霆.基于迁移学习的软件缺陷预测[J].电子学报,2016,44(1):115-122. 被引量：23

引证文献3

1孙登第,孟欠欠,马云鹏.核迁移稀疏编码算法在跨域图像分类中的应用[J].微电子学与计算机,2018,35(10):29-35. 被引量：1
2王倩,胡松旺,郭嘉伟,任家东,赵小林.有向复杂网络结构熵的软件动态执行关键节点挖掘算法[J].小型微型计算机系统,2019,40(4):884-889. 被引量：6
3吴方君.静态软件缺陷预测研究进展[J].计算机科学与探索,2019,13(10):1621-1637. 被引量：13

二级引证文献20

1张晓峰.软件缺陷预测研究综述[J].信息通信,2020(4):125-127.
2张明亮.基于源文件可疑度的静态软件缺陷检测方法研究[J].黑龙江工业学院学报（综合版）,2020,20(6):55-59. 被引量：1
3张瑞,李学威.基于大数据的静态软件缺陷预测方法研究[J].信息与电脑,2020,32(19):43-44.
4丁晓梅.基于集成学习的静态软件缺陷预测模型构建[J].成都工业学院学报,2021,24(1):12-16. 被引量：1
5马辉.基于改进神经网络的静态软件缺陷自动分配方法[J].信息与电脑,2021,33(4):68-70.
6郑小萌,高猛,滕俊元.航天器软件缺陷预测数据集构建方法研究[J].计算机科学,2021,48(S01):575-580. 被引量：2
7张晓芳.基于机器学习的多源网络数据跨源分类算法研究[J].自动化与仪器仪表,2021(9):199-203. 被引量：3
8尤姗姗,刘雪娇.基于非线性集成深度学习的软件模块风险预测[J].计算机仿真,2021,38(11):305-308.
9黄涛.基于工具的移动应用代码缺陷静态检测研究[J].武汉工程职业技术学院学报,2022,34(1):22-26. 被引量：2
10周丽娜,常笑,胡枫.利用邻接结构熵确定超网络关键节点[J].计算机工程与应用,2022,58(8):76-82. 被引量：10

1杨泰.搜索引擎的3种核心算法[J].计算机与网络,2017,43(12):44-45.
2胡启国,汪文珺.核最小均方算法的特征映射和参数选择[J].南方农机,2017,48(13):136-137. 被引量：2
3谢晓丹,李伯虎,柴旭东.计算和存储空间受限下的数据稀疏核分析方法[J].电子学报,2017,45(6):1362-1366. 被引量：1
4袁小艳,王安志,潘刚,王明辉.多尺度下幅度谱与相位谱相融合的视觉注意建模[J].计算机科学,2017,44(7):293-298.
5孙汉博,冯国灿.基于改进的Porter Stemmer词干提取与核方法的垃圾邮件过滤算法[J].计算机科学,2017,44(S1):61-67. 被引量：1
6刘明明,孙伟,刘兵.基于谱回归的边缘Fisher分析维数约简算法[J].中国科技论文,2017,12(8):922-928.
7朱昌明,张默.基于核聚类的K-均值聚类(英文)[J].上海海事大学学报,2017,38(2):88-94. 被引量：1
8高杨,张燕平,钱付兰,赵姝.结合节点度和节点聚类系数的链路预测算法[J].小型微型计算机系统,2017,38(7):1436-1441. 被引量：15
9谢云开,廖建华,徐晓晗.结构化消息传递控制模型[J].软件导刊,2017,16(7):33-35.
10张兴春,孙寿健.基于贝叶斯分类器的图像隐写分析[J].液晶与显示,2017,32(7):560-566. 被引量：1

小型微型计算机系统

2017年第7期

浏览历史

内容加载中请稍等...

核字典学习在软件缺陷预测中的应用被引量：3

参考文献4

二级参考文献311

共引文献253

同被引文献31

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

核字典学习在软件缺陷预测中的应用 被引量：3

参考文献4

二级参考文献311

共引文献253

同被引文献31

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

核字典学习在软件缺陷预测中的应用被引量：3