期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
DeepTriage:一种基于深度学习的软件缺陷自动分配方法 被引量:10
1
作者 宋化志 马于涛 《小型微型计算机系统》 CSCD 北大核心 2019年第1期126-132,共7页
在软件开发和维护过程中,缺陷修复工作有一项必不可少的任务,那就是缺陷分配.在大规模的软件项目中,基于文本分类的自动分配技术已被用于提高缺陷分配的效率,从而减少人工分配的等待时间和成本.考虑到缺陷报告文本内容的复杂性,本文提... 在软件开发和维护过程中,缺陷修复工作有一项必不可少的任务,那就是缺陷分配.在大规模的软件项目中,基于文本分类的自动分配技术已被用于提高缺陷分配的效率,从而减少人工分配的等待时间和成本.考虑到缺陷报告文本内容的复杂性,本文提出了一种基于深度学习的缺陷自动分配方法,在词向量化后通过卷积神经网络对缺陷报告文本进行特征提取,然后完成分类任务.在Eclipse和Mozilla两个数据集上的结果表明,与传统的支持向量机和基于递归神经网络的方法相比,文本所提方法在准确率指标上均优于上述基准方法,而且多层平行的卷积神经网络结构比单层的卷积神经网络结构在预测效果上更好. 展开更多
关键词 缺陷分配 深度学习 卷积神经网络 递归神经网络 支持向量机
下载PDF
一种基于文本分类和评分机制的软件缺陷分配方法 被引量:7
2
作者 史小婉 马于涛 《计算机科学》 CSCD 北大核心 2018年第11期193-198,219,共7页
开源软件项目的缺陷管理和修复是保障软件质量及软件开发效率的重要手段,而提高软件缺陷分配的效率是其中亟需解决的一个关键问题。文中提出了一种基于文本分类和评分机制的开发者预测方法,其核心思想是综合考虑基于机器学习的文本分类... 开源软件项目的缺陷管理和修复是保障软件质量及软件开发效率的重要手段,而提高软件缺陷分配的效率是其中亟需解决的一个关键问题。文中提出了一种基于文本分类和评分机制的开发者预测方法,其核心思想是综合考虑基于机器学习的文本分类和基于软件缺陷从属特征的评分机制来构建预测模型。针对大型开源软件项目Eclipse和Mozilla的十万级已修复软件缺陷的实验表明,在"十折"增量验证模式下,所提方法的最好平均准确率分别达到了78.39%和64.94%,比基准方法(机器学习分类+再分配图)的最高平均准确率分别提升了17.34%和10.82%,从而验证了其有效性。 展开更多
关键词 缺陷分配 文本分类 评分 预测模型 支持向量机
下载PDF
基于图卷积神经网络的软件缺陷分派方法 被引量:6
3
作者 李元香 董夏磊 +2 位作者 项正龙 喻飞 吴泓润 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2020年第3期244-252,共9页
软件缺陷的高效自动分派是保障开源软件质量的重要手段。已有研究多基于机器学习技术,从缺陷报告的文本内容和开发者之间的关系入手,研究软件缺陷的自动分派,而对缺陷报告之间的相关关系和基于深度学习技术的缺陷自动分派关注甚少。针... 软件缺陷的高效自动分派是保障开源软件质量的重要手段。已有研究多基于机器学习技术,从缺陷报告的文本内容和开发者之间的关系入手,研究软件缺陷的自动分派,而对缺陷报告之间的相关关系和基于深度学习技术的缺陷自动分派关注甚少。针对此问题,本文提出了一种基于图卷积神经网络的开发者推荐方法。该方法利用带权重的余弦相似度构建缺陷报告网络,再在增量学习方法下训练图卷积神经网络模型用于开发者推荐。将近年提出的3种方法设置为实验对照组,在大型开源软件项目Eclipse和Mozilla数据集平台上分别进行实验,结果表明本文提出的方法平均推荐准确率比其他3种方法最高提升了60%和70%左右。 展开更多
关键词 缺陷分派 图卷积神经网络 开发者推荐 开源软件
原文传递
基于大数据的开源项目 缺陷报告智能预检技术
4
作者 席圣渠 徐锋 +1 位作者 陈鑫 李宣东 《大数据》 2021年第1期48-63,共16页
缺陷报告预检目标在于确定优先级和修复措施,是保障软件可信的关键环节。然而,在日益普及的开源项目中,由于缺陷数量众多、缺乏组织管理等特性,人工预检难以及时完成,迫切需要基于大数据的自动化、智能化预检技术。结合工业界、学术界... 缺陷报告预检目标在于确定优先级和修复措施,是保障软件可信的关键环节。然而,在日益普及的开源项目中,由于缺陷数量众多、缺乏组织管理等特性,人工预检难以及时完成,迫切需要基于大数据的自动化、智能化预检技术。结合工业界、学术界对缺陷报告预检的认知,提出了一种智能化缺陷报告预检技术框架,全面系统地归纳了缺陷报告预检中存在的3个关键任务:缺陷优先级分类、缺陷分派、缺陷再分派,并结合开源项目的特点提出了相关技术。实验结果初步验证了上述技术的合理性和有效性。 展开更多
关键词 缺陷报告预检 缺陷优先级 缺陷分派 缺陷再分派
下载PDF
一种针对软件缺陷自动分派的开发者推荐方法 被引量:3
5
作者 刘海洋 马于涛 《小型微型计算机系统》 CSCD 北大核心 2017年第12期2747-2753,共7页
开源软件的缺陷管理是其软件质量保障的一种重要手段,而缺陷的高效分派是大型开源软件缺陷管理的一个棘手问题.为了提高缺陷分派的效率,本文提出了一种简单易用的针对软件缺陷自动分派的开发者推荐方法,其核心思想是利用LDA主题模型(刻... 开源软件的缺陷管理是其软件质量保障的一种重要手段,而缺陷的高效分派是大型开源软件缺陷管理的一个棘手问题.为了提高缺陷分派的效率,本文提出了一种简单易用的针对软件缺陷自动分派的开发者推荐方法,其核心思想是利用LDA主题模型(刻画开发者技能)、开发者合作网络(刻画开发者之间的合作关系)构造(内容+关系)混合策略.针对大型开源软件项目Eclipse和Mozilla的十万级已修复缺陷的实验表明,在选取合适的参数和分派策略情况下,本文所提方法的开发者推荐的准确率分别达到了46.7%和33.4%,比基准的LDA+k NN方法的推荐准确率分别提高了209.3%和131.9%,从而验证了其有效性. 展开更多
关键词 缺陷分派 开源社区 开发者合作网络 主题模型 混合策略
下载PDF
基于多头自注意力机制的深度缺陷分派模型
6
作者 万发洋 于旭 徐其江 《计算机与现代化》 2021年第11期39-43,共5页
当前,缺陷跟踪系统通过缺陷报告实现缺陷与修复者的匹配。然而,以往的缺陷分派模型过于依赖缺陷报告的文本质量,引入自然语言中大量的冗余信息,并忽略了缺陷报告的元字段作为标签属性时存在于修复者之间的社区关系,使得模型结果表现较... 当前,缺陷跟踪系统通过缺陷报告实现缺陷与修复者的匹配。然而,以往的缺陷分派模型过于依赖缺陷报告的文本质量,引入自然语言中大量的冗余信息,并忽略了缺陷报告的元字段作为标签属性时存在于修复者之间的社区关系,使得模型结果表现较差。针对以上问题,本文提出一种基于多头自注意力机制的深度缺陷分派模型MSDBT(Multi-head Self-attention Deep Bug Triage)。对缺陷报告的文本内容以及根据元字段生成的修复者序列进行向量化;通过多头自注意力机制在内部的输入元素之间进行并行注意力计算。在4个开源软件项目上的实验结果表明,MSDBT在召回率指标上较之前模型具有明显的优势。 展开更多
关键词 缺陷跟踪系统 缺陷分派 深度学习 修复者社区 多头自注意力机制
下载PDF
BUTTER:一种基于主题模型和异构网络的缺陷分发方法 被引量:1
7
作者 韩广乐 张文 王青 《计算机系统应用》 2014年第10期125-131,共7页
当软件缺陷被提交到缺陷跟踪系统并经过确认之后,它会被分发给开发人员进行缺陷修复.这个过程就叫做缺陷分发.随着被提交到系统的缺陷报告日益增多,手工分发缺陷报告会变得越来越困难.提出了一种自动分发缺陷的方法 BUTTER.与其他方法... 当软件缺陷被提交到缺陷跟踪系统并经过确认之后,它会被分发给开发人员进行缺陷修复.这个过程就叫做缺陷分发.随着被提交到系统的缺陷报告日益增多,手工分发缺陷报告会变得越来越困难.提出了一种自动分发缺陷的方法 BUTTER.与其他方法不同的是,BUTTER不仅利用主题模型分析缺陷报告中的文本信息,而且创新性地建立了一个包含提交者、缺陷和开发者三种节点及其相互关系的异构网络,从该异构网络中抽取了更多的结构信息.实验证明,BUTTER进行自动缺陷分发较其他缺陷自动分发方法要好. 展开更多
关键词 缺陷分发 主题模型 异构网络
下载PDF
基于LDA主题模型的软件缺陷分派方法 被引量:11
8
作者 黄小亮 郁抒思 关佶红 《计算机工程》 CAS CSCD 北大核心 2011年第21期46-48,共3页
传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维... 传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。 展开更多
关键词 软件缺陷分派 隐含狄利克雷分配模型 马尔可夫链蒙特卡洛方法 吉布斯采样 文本分类 向量空间模型
下载PDF
基于统计抽样和模糊支持向量机的缺陷分派研究
9
作者 王存伟 《现代计算机(中旬刊)》 2016年第3期46-50,共5页
传统软件缺陷分派往往将其转化为分类问题,从历史数据和机器学习算法的使用两方面解决。然而,软件缺陷报告数据经常是非均衡的,且数据中蕴含着模糊的信息,使传统的分类方法达不到好的预测效果。提出基于统计抽样的方法,克服缺陷报告数... 传统软件缺陷分派往往将其转化为分类问题,从历史数据和机器学习算法的使用两方面解决。然而,软件缺陷报告数据经常是非均衡的,且数据中蕴含着模糊的信息,使传统的分类方法达不到好的预测效果。提出基于统计抽样的方法,克服缺陷报告数据存在的非均衡性,采用模糊支持向量机处理数据中所蕴含的模糊信息。实验表明,采用统计抽样和模糊支持向量机,确实对缺陷分派是有效的,与以往的方法相比,提高缺陷分派的准确率。 展开更多
关键词 软件缺陷分派 机器学习 统计抽样 模糊支持向量机
下载PDF
基于混合神经网络和注意力机制的软件缺陷自动分派方法 被引量:15
10
作者 刘烨 黄金筱 马于涛 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期461-473,共13页
软件缺陷修复是软件质量保证的一个重要环节.在互联网上开源、开放的群智化软件开发环境中,提升缺陷分派的效率和效果,有助于提高缺陷修复率并降低维护成本.目前,基于机器学习的缺陷自动分派方法已成为主流技术,但也存在特征人工构建、... 软件缺陷修复是软件质量保证的一个重要环节.在互联网上开源、开放的群智化软件开发环境中,提升缺陷分派的效率和效果,有助于提高缺陷修复率并降低维护成本.目前,基于机器学习的缺陷自动分派方法已成为主流技术,但也存在特征人工构建、文本表示能力不足等问题.近年来,鉴于深度学习在自然语言处理领域的成功应用,研究者尝试将深度学习技术引入缺陷分派任务中,使得缺陷修复者的预测效果有了显著提高.然而,不同类型的神经网络亦存在各自的局限性.针对上述问题,将缺陷自动分派任务视为文本分类问题,结合卷积神经网络、循环神经网络和注意力机制各自的优势,提出了一种基于混合神经网络和注意力机制的缺陷自动分派方法Atten-CRNN,能更有效地捕获缺陷报告的重要文本特征和序列特征,从而提供更精准的缺陷修复者推荐服务.在Eclipse和Mozilla两个大型的知名软件开源项目中进行了实证研究,在20万量级的缺陷报告上的实验结果表明:无论是否考虑注意力机制,Atten-CRNN的预测准确率要高于基于卷积神经网络和基于循环神经网络的基准模型. 展开更多
关键词 缺陷分派 文本分类 卷积神经网络 循环神经网络 注意力
下载PDF
基于循环神经网络的缺陷报告分派方法 被引量:5
11
作者 席圣渠 姚远 +1 位作者 徐锋 吕建 《软件学报》 EI CSCD 北大核心 2018年第8期2322-2335,共14页
随着开源软件项目规模的不断增大,人工为缺陷报告分派合适的开发人员(缺陷分派)变得越来越困难.而不合适的缺陷分派往往会严重影响缺陷修复的效率,为此,迫切需要一种缺陷分派辅助技术帮助项目管理者更好地完成缺陷分派任务.当前,大部分... 随着开源软件项目规模的不断增大,人工为缺陷报告分派合适的开发人员(缺陷分派)变得越来越困难.而不合适的缺陷分派往往会严重影响缺陷修复的效率,为此,迫切需要一种缺陷分派辅助技术帮助项目管理者更好地完成缺陷分派任务.当前,大部分研究工作都基于缺陷报告文本以及相关元数据信息分析来刻画开发者的特征,忽略了对开发者活跃度的考虑,使得对具有相似特征的开发者进行缺陷报告分派预测时表现较差.提出一个基于循环神经网络的深度学习模型DeepTriage,一方面,利用双向循环网络加池化方法提取缺陷报告的文本特征;另一方面,利用单向循环网络提取特定时刻的开发者活跃度特征,并融合两者,利用已修复的缺陷报告进行监督学习.在Eclipse等4个不同的开源项目数据集上的实验结果表明,DeepTriage较之同类工作在缺陷分派预测准确率上有显著提升. 展开更多
关键词 缺陷分派 循环神经网络 深度学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部