-
题名一种面向软件配置管理制品的层次分类方法
- 1
-
-
作者
徐培兴
陈伟
吴国全
高楚舒
魏峻
-
机构
中国科学院软件研究所
中国科学院大学
计算机科学国家重点实验室(中国科学院软件研究所)
-
出处
《软件学报》
EI
CSCD
北大核心
2017年第6期1389-1404,共16页
-
基金
国家自然科学基金(61402453)
国家重点研发计划(2016YFB1000803)~~
-
文摘
配置管理工具(configuration management tool,简称CMT)作为运维自动化的组成部分,是实现开发运维一体化(development and operations,简称Dev Ops)的重要支撑技术.当前,互联网开源社区中存在数量众多的CMT脚本制品,但是缺乏有效的层次分类管理,给快速检索和高效利用CMT脚本制品带来困难.针对该问题,提出一种面向CMT制品的基于在线非结构化描述文档分析的层次分类方法.该方法利用标签共现性关系(tag co-occurrence)建立层次类别体系,基于描述属性特征,实现对CMT制品的层次分类器;并使用混合的样本划分方式针对数据倾斜问题进行了改进.对超过11 000例训练数据和1 000例测试数据进行实验,结果表明:改进的样本划分方式得到的最佳查准率、查全率、调和平均值分别达到0.81、0.88、0.85,较传统方式查全率提高0.15,调和平均值提高0.06.该结果验证了层次分类方法的有效性.
-
关键词
cmt制品
层次分类
开源社区
开发运维一体化(DevOps)
-
Keywords
cmt artifact
hierarchical categorization
open source community
development and operations (DevOps)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-