-
题名基于K近邻的众包数据分类算法
被引量:3
- 1
-
-
作者
李佳烨
余浩
-
机构
广西师范大学广西多源信息挖掘与安全重点实验室
中南大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第4期973-976,共4页
-
基金
国家重点研发计划资助项目(2016YFB1000905)
国家自然科学基金资助项目(61170131,61263035,61573270,90718020)
+2 种基金
国家“973”计划资助项目(2013CB329404)
中国博士后科学基金资助项目(2015M570837)
广西自然科学基金资助项目(2015GXNSFCB139011,2015GXNSFAA139306)。
-
文摘
针对众包数据处理中的质量控制问题,提出了一种加权K近邻投票分类方法。该方法不单单只是考虑了某个样例的标记来返回一个答案,而是通过综合考虑样例的近邻来得到更加准确的答案。同时对样例的近邻加以适当的权重来进一步提高算法的性能,并保持了传统多数投票分类的简单性。K近邻投票分类算法可以有效地解决缺乏标记的情况,通过对近邻加以权重可以解决不平衡标记造成的影响,从而使算法的泛化性更强。通过各种场景下的实验,结果表明加权K近邻投票分类方法取得了很好的效果。
-
关键词
众包数据
质量控制
k近邻投票
多数投票
-
Keywords
crowdsourcing data
quality control
k-nearest neighbor voting
majority voting
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-