基于样本空间分解的kNN分类器设计原理被引量：1

kNN classifier design theory research based on sample space decomposition

下载PDF

导出

摘要针对k NN分类器在海量数据集中搜索k近邻计算复杂、耗时长、存储空间大等缺点,提出以单元属性赋值为基础的分类器设计原理和实施方案.分类器将待分类点映射到其所在单元,对待识别单元内的点在其相应窗口内生成k近邻集,并按kNN准则做出类属决策或拒绝决策.对某类样本占明显优势属性单元内的点直接按该类做出类属决策;对具有与给定样本集弱关联以及任一类样本不占优势属性单元内的点和待识型单元内可拒绝决策点给出相应处理办法.同时,对提高分类速度和精度,解决单元分割问题,选定有关参数,估计错分率等进行讨论并提出相应对策.通过仿真实验,与kNN分类器对比分析,进一步证明本文方法的有效性. Focusing on k nearest neighbor classifier with drawbacks of complex calculations, time consumption and large storage space of, a criterion for unacceptable decision point and unit properties of sample space is described and a k NN classifier based on unit properties assignment is proposed. Firstly, test sample is mapped into its unit by the classifier proposed and calculate its k nearest neighbor set. Secondly, decision result of the test sample is obtained by k NN method. In the unit as proposed, if there are most samples which belong to the same class, the test sample will be set as the same class; else, it will be rejected. Lastly, the method on improving speed, accuracy of k NN classifier and how to select parameter are discussed. By a simulation case in semiconductor batch process, the effectiveness of the method proposed is demonstrated.

作者逄玉俊徐涛李元张成

机构地区沈阳化工大学计算机科学与技术学院沈阳化工大学过程故障诊断研究中心东北大学信息工程学院

出处《辽宁工程技术大学学报（自然科学版）》 CAS 北大核心 2017年第11期1218-1223,共6页 Journal of Liaoning Technical University (Natural Science)

基金国家自然科学基金(61673279) 辽宁省教育厅基金(L2015432) 辽宁省自然科学基金(2015020164)

关键词数据挖掘 KNN分类器大数据样本空间分解模式识别 data mining k nearest neighbor classifier big data sample space decomposition pattern recognition

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1李元,刘亚东,张成.扩散映射K近邻在工业过程故障检测中的应用[J].辽宁工程技术大学学报（自然科学版）,2015,34(12):1370-1376. 被引量：6
2童先群,周忠眉.基于属性值信息熵的KNN改进算法[J].计算机工程与应用,2010,46(3):115-117. 被引量：32
3陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：52
4张成,李秀玉,逄玉俊,李元.基于GMM的马氏距离kNN故障检测方法研究[J].测控技术,2014,33(9):13-17. 被引量：14

二级参考文献66

1王维彬,钟润添.一种基于贪心EM算法学习GMM的聚类算法[J].计算机仿真,2007,24(2):65-68. 被引量：15
2魏孝章,豆增发.一种基于信息增益的K-NN改进算法[J].计算机工程与应用,2007,43(19):188-191. 被引量：9
3Wu Xindong,Kumar V,Quinlan J R,et al.Top 10 algorithms in data mining[J].Knowledge and Information Systems,2008,14(1 ): 1-37. 被引量：1
4COVER T M,HART P E. Nearest neighbor pattern classification [J]. In Trans IEEE Inform Theory, 1967,IT- 13:21 - 27.?A 被引量：1
5CHO T H,CONNERS R W,ARAMAN P A. A comparison of rule-based, K-nearest neighbor, and neural net classifiers for automation [ C ]. Proceedings, Developing and Managing Expert System Programs, 1991, 202 - 209.?A 被引量：1
6DUDANI S A. The distance-weighted k-nearest-neighbor rule [J]. IEEE Trans Syst Man Cyber, 1976, 6:325-327.?A 被引量：1
7VAPNIK V N. The nature of statistical learningtheory[M].NewYork:Springer-Verlag,1995.张学工,译.统计学习理论的本质[M].北京:清华大学出版社,1999.?A 被引量：1
8BURGES J C. A tutorial on support vector machines for pattern recognition [ M ]. Bell Laboratories, Lucent Technologies, Boston, 1997.?A 被引量：1
9KEERTHI S S, SHEVADE S K, BHATTACHARYYA C, et al. Improvements to Platt's SMO algorithm for SVM classifier design[J]. Neural Computation,2001,13(3):637 - 649.?A 被引量：1
10LIN C J. A formal analysis of stopping criteria of decomposition methods for support vector machines[J]. IEEE Transaction on Neural Networks 2002, 13 (5): 1045 - 1052.?A 被引量：1

共引文献94

1张成,郑晓芳,郭青秀,冯立伟,戴絮年,李元.邻域保持嵌入—加权k近邻故障检测算法及其在半导体蚀刻过程中的应用[J].信息与控制,2019,48(6):738-744.
2宋臻,骆潇.李银河:三十岁找到了我的所爱[J].职业,2005(9):7-8.
3杨丽华,戴齐,郭艳军.KNN文本分类算法研究[J].微计算机信息,2006,22(07X):269-270. 被引量：24
4白小明,邱桃荣.基于SVM和KNN算法的科技文献自动分类研究[J].微计算机信息,2006(12X):275-276. 被引量：10
5孙岩,吕世聘,王秀坤,唐一源.基于结构学习的KNN分类算法[J].计算机科学,2007,34(12):184-186. 被引量：22
6金自翔,戴新宇,陈家骏.一种基于贪婪算法的KNN参数选择策略[J].广西师范大学学报（自然科学版）,2008,26(1):182-185. 被引量：1
7桑应宾,刘琼荪.一种基于特征加权的K Nearest Neighbor算法[J].海南大学学报（自然科学版）,2008,26(4):352-355. 被引量：6
8张建明,杨忠,李巍.改进KNN-SVM的性别识别[J].计算机工程与应用,2009,45(4):177-179. 被引量：7
9赵培,牛纪桢,史金艳.改进的SVM在语音识别文本分类中的应用[J].广西师范大学学报（自然科学版）,2009,27(1):137-140. 被引量：1
10孙知信,张震伟,宫婧.P2P安全重叠网络模型研究[J].通信学报,2009,30(5):99-104. 被引量：1

同被引文献10

1王娟,慈林林,姚康泽.特征选择方法综述[J].计算机工程与科学,2005,27(12):68-71. 被引量：64
2何清,李宁,罗文娟,史忠植.大数据下的机器学习算法综述[J].模式识别与人工智能,2014,27(4):327-336. 被引量：330
3路永和,陈泳珊.基于二进制烟花算法的特征选择方法[J].情报学报,2017,36(3):249-259. 被引量：5
4董灵波,孙云霞,刘兆刚.基于森林空间收获问题的模拟退火算法邻域搜索技术比较[J].北京林业大学学报,2017,39(8):24-32. 被引量：4
5连小利,张莉.面向软件产品线中特征选择的多目标优化算法[J].软件学报,2017,28(10):2548-2563. 被引量：6
6刘慧珺,苏红军,赵波.基于改进萤火虫算法的高光谱遥感多特征优化方法[J].遥感技术与应用,2018,33(1):110-118. 被引量：6
7范洪华,付应雄,罗志成,陈芬.基于KNN分类器的分层图像特征提取[J].湖北大学学报（自然科学版）,2019,41(1):44-47. 被引量：5
8吴耕锐,郭三学,吴虎胜,薄鸟.改进多目标蚁群算法在动态路径优化中的应用[J].计算机应用与软件,2019,36(5):249-254. 被引量：12
9林达坤,黄世国,林燕红,洪铭淋.基于差分进化和森林优化混合的特征选择[J].小型微型计算机系统,2019,40(6):1210-1214. 被引量：7
10郎春博,贾鹤鸣,邢致恺,彭晓旭,李金夺,康立飞.基于改进正余弦优化算法的多阈值图像分割[J].计算机应用研究,2020,37(4):1215-1220. 被引量：29

引证文献1

1贾鹤鸣,姜子超,李瑶,孙康健,李金夺,彭晓旭.基于模拟退火斑点鬣狗优化算法的特征选择[J].应用科技,2020,47(1):74-79. 被引量：4

二级引证文献4

1戴天虹,孙春雪,黄建平,谢千程,丛士杰,黄新望,李克新.基于黄金正弦混沌斑鬣狗优化算法的高光谱波段选择[J].激光与光电子学进展,2022,59(10):509-518. 被引量：5
2张军,温秀平,陈巍.融合改进鬣狗优化和Tsallis熵的图像分割[J].计算机工程与设计,2022,43(12):3493-3502. 被引量：5
3李彦苍,李晶霞,杜尊峰,朱海涛,韩沐轩.混合多策略改进的斑点鬣狗优化算法及应用[J].计算机工程与设计,2023,44(11):3335-3344.
4王晓峰,莫淳惠,张霖,杨澜.一种求解小规模CVRP问题的新型斑点鬣狗智能算法[J].华中科技大学学报（自然科学版）,2024,52(2):77-83.

1聂昌腾,何志英.营销学领域中的产品属性研究:回顾、应用与展望[J].湖北经济学院学报,2017,15(6):87-92. 被引量：1
2赵玉焕,李浩,刘娅,曹叶,张中华,王淞.京津冀CO_2排放的时空差异及影响因素研究[J].资源科学,2018,40(1):207-215. 被引量：29
3崔伟,夏汛,孙瑜鲁.基于随机KNN特征选择的高质量移动通信用户预测[J].现代计算机（中旬刊）,2017(9):9-12. 被引量：2
4白晨,顾昕.中国社会安全网的横向不平等——以城镇最低生活保障为例[J].中国行政管理,2018(1):109-115. 被引量：9
5黄满珍.离婚案件中夫妻共有的有限责任公司股权的分割问题[J].职工法律天地（下）,2016,0(2):166-166.
6王萍,刘敏.基于人口加权变异系数山西省区域经济差异的空间和产业分解[J].生产力研究,2017(12):65-69. 被引量：2
7赵转萍.Hilbert空间中—广义幂等算子方程的解[J].太原师范学院学报（自然科学版）,2017,16(4):22-25.
8林雅婷,钟一文,陈永乐.结合差分算子的改进渔夫搜索过程[J].福建电脑,2018,34(1):62-64.
9邹宗兰.线性变换的零化多项式与线性空间的直和分解[J].四川职业技术学院学报,2017,27(6):163-165.
10李策,申天良,彭勇,王永峰,王春雷.陆军合同战斗方案仿真实验自动控制研究[J].指挥控制与仿真,2018,40(1):86-92. 被引量：1

辽宁工程技术大学学报（自然科学版）

2017年第11期

浏览历史

内容加载中请稍等...

基于样本空间分解的kNN分类器设计原理被引量：1

参考文献4

二级参考文献66

共引文献94

同被引文献10

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于样本空间分解的kNN分类器设计原理 被引量：1

参考文献4

二级参考文献66

共引文献94

同被引文献10

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于样本空间分解的kNN分类器设计原理被引量：1