-
题名基于LDA主题模型的软件缺陷分派方法
被引量:11
- 1
-
-
作者
黄小亮
郁抒思
关佶红
-
机构
复旦大学计算机科学技术学院
同济大学计算机科学与技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第21期46-48,共3页
-
基金
国家自然科学基金资助项目(60873040)
-
文摘
传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。
-
关键词
软件缺陷分派
隐含狄利克雷分配模型
马尔可夫链蒙特卡洛方法
吉布斯采样
文本分类
向量空间模型
-
Keywords
software bug triage
Latent Dirichlet Allocation(LDA) model
Markov-Chain Monte Carlo(MCMC) method
Gibbs sampling
text classification
Vector Space Model(VSM)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于统计抽样和模糊支持向量机的缺陷分派研究
- 2
-
-
作者
王存伟
-
机构
四川大学计算机学院
-
出处
《现代计算机(中旬刊)》
2016年第3期46-50,共5页
-
文摘
传统软件缺陷分派往往将其转化为分类问题,从历史数据和机器学习算法的使用两方面解决。然而,软件缺陷报告数据经常是非均衡的,且数据中蕴含着模糊的信息,使传统的分类方法达不到好的预测效果。提出基于统计抽样的方法,克服缺陷报告数据存在的非均衡性,采用模糊支持向量机处理数据中所蕴含的模糊信息。实验表明,采用统计抽样和模糊支持向量机,确实对缺陷分派是有效的,与以往的方法相比,提高缺陷分派的准确率。
-
关键词
软件缺陷分派
机器学习
统计抽样
模糊支持向量机
-
Keywords
software bug triage
Machine Learning
Statistical Sampling
Fuzzy Support Vector Machine
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-