-
题名软件问答社区的问题删除预测方法
- 1
-
-
作者
蒋竞
苗萌
赵丽娴
张莉
-
机构
北京航空航天大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2022年第5期1699-1710,共12页
-
基金
科技创新2030-“新一代人工智能”重大项目(2018AAA0102304)
国家自然科学基金(62177003)
中央高校基本科研业务费(YWF-20-BJ-J-1018)。
-
文摘
Stack Overflow是最受欢迎的软件问答社区之一,用户可以在该网站发布问题并得到其他用户的回答.为了保证问题质量,网站需要尽快发现并删除低质量或者不符合社区主题的问题.当前,Stack Overflow主要采用人工检查的方式发现需要被删除的问题.然而这种方式往往不能保证问题被及时发现、删除,而且加重了社区管理员的负担.为了快速发现需要删除的问题,提出了自动化预测问题删除的方法MulPredictor.该方法提取问题的语义内容特征、语义统计特征和元特征,使用随机森林分类器计算问题会被删除的概率.实验结果表明:与现有方法DelPredictor和NLPPredictor相比,MulPredictor的准确率在平衡测试集上分别提升了16.34%和12.78%,在随机测试集上分别提升了12.38%和14.14%.此外,分析了影响问题删除的重要特征,发现代码段、问题的标题和正文第1段的特征对问题删除有重要的影响.
-
关键词
问题删除预测
问题质量
问题分类
软件问答社区
Stack
Overflow
-
Keywords
prediction of question deletion
question quality
question classification
software question and answer community
Stack Overflow
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-