-
题名大粒度Pull Request描述自动生成
被引量:2
- 1
-
-
作者
邝砾
施如意
赵雷浩
张欢
高洪皓
-
机构
中南大学计算机学院
上海大学计算机工程与科学学院
-
出处
《软件学报》
EI
CSCD
北大核心
2021年第6期1597-1611,共15页
-
基金
国家重点研发计划(2018YFB1003800)
国家自然科学基金(61772560)。
-
文摘
在GitHub平台中,许多项目贡献者在提交Pull Request(PR)时往往会忽略提交PR描述,这使得提交的PR容易被评审者忽略或者拒绝.因此,自动生成PR描述以帮助项目贡献者提高PR通过率是很有必要的.然而,现有PR描述生成方法的表现会受到PR粒度影响,无法有效为大粒度的PR生成描述.因此,该工作专注于大粒度PR描述的自动生成.首先对PR中的文本信息进行预处理,将文本中的单词作为辅助节点构建词-句异质图,以建立PR语句间的联系;随后对异质图进行特征提取,并将提取后的特征输入至图神经网络进行图表示学习,通过节点间的消息传递,使句子节点学习到更丰富的内容信息;最后,选择带有关键信息的句子组成PR描述.此外,针对PR数据集缺少人工标注的真实标签而无法进行监督学习的问题,使用强化学习指导PR描述的生成,以最小化获得奖励的负期望为目标训练模型,该过程与标签无关,并且直接提升了生成结果的表现.在真实的数据集上进行了实验,实验结果表明,提出的大粒度PR描述生成方法在F1值和可读性上优于现有方法.
-
关键词
Pull
Request描述
异质图神经网络
强化学习
非结构性文档
摘要生成
-
Keywords
Pull Request description
heterogeneous graph neural network
reinforcement learning
unstructured document
summarization generation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-