期刊文献+
共找到2,189篇文章
< 1 2 110 >
每页显示 20 50 100
中文文本分类中特征抽取方法的比较研究 被引量:228
1
作者 代六玲 黄河燕 陈肇雄 《中文信息学报》 CSCD 北大核心 2004年第1期26-32,共7页
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机 (SVM )和KNN两种不同的分类器以考察不同抽取方法的有效性。实验结果表明 ... 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机 (SVM )和KNN两种不同的分类器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法 (IG、MI和CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征抽取方法的有效性。 展开更多
关键词 计算机应用 中文信息处理 文本自动分类 特征抽取 支持向量机 knn
下载PDF
基于密度的kNN文本分类器训练样本裁剪方法 被引量:98
2
作者 李荣陆 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2004年第4期539-545,共7页
随着WWW的迅猛发展 ,文本分类成为处理和组织大量文档数据的关键技术 kNN方法作为一种简单、有效、非参数的分类方法 ,在文本分类中得到广泛的应用 但是这种方法计算量大 ,而且训练样本的分布不均匀会造成分类准确率的下降 针对kNN... 随着WWW的迅猛发展 ,文本分类成为处理和组织大量文档数据的关键技术 kNN方法作为一种简单、有效、非参数的分类方法 ,在文本分类中得到广泛的应用 但是这种方法计算量大 ,而且训练样本的分布不均匀会造成分类准确率的下降 针对kNN方法存在的这两个问题 ,提出了一种基于密度的kNN分类器训练样本裁剪方法 ,这种方法不仅降低了kNN方法的计算量 ,而且使训练样本的分布密度趋于均匀 ,减少了边界点处测试样本的误判 实验结果显示 。 展开更多
关键词 文本分类 knn 快速分类
下载PDF
森林生物量遥感估算与应用分析 被引量:68
3
作者 徐新良 曹明奎 《地球信息科学》 CSCD 2006年第4期122-128,共7页
遥感图像光谱信息具有良好的综合性和现势性,利用遥感信息和GIS技术进行森林生物量估算及碳过程的研究已经成为一种全新的手段。本文对森林生物量遥感估算方法及其应用进行了深入分析,总结了利用遥感信息进行森林生物量估算的四种主要方... 遥感图像光谱信息具有良好的综合性和现势性,利用遥感信息和GIS技术进行森林生物量估算及碳过程的研究已经成为一种全新的手段。本文对森林生物量遥感估算方法及其应用进行了深入分析,总结了利用遥感信息进行森林生物量估算的四种主要方法:遥感信息参数与生物量拟合关系的方法、遥感数据与过程模型融合的方法、基准样地法(KNN方法)以及人工神经网络模型方法,并在此基础上分析了当前该领域研究的不足,以及今后利用遥感方法进行森林生物量估算的主要发展方向。 展开更多
关键词 森林生物量 遥感信息 模型 knn 人工神经网络
下载PDF
基于聚类改进的KNN文本分类算法 被引量:68
4
作者 周庆平 谭长庚 +1 位作者 王宏君 湛淼湘 《计算机应用研究》 CSCD 北大核心 2016年第11期3374-3377,3382,共5页
传统的KNN文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法。但是KNN算法在处理文本分类的过程中需要不断地计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KNN算法在文... 传统的KNN文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法。但是KNN算法在处理文本分类的过程中需要不断地计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KNN算法在文本分类中的效率,提出一种基于聚类的改进KNN算法。算法开始之前采用改进χ~2统计量方法进行文本特征提取,再依据聚类方法将文本集聚类成几个簇,最后利用改进的KNN方法对簇类进行文本分类。实验对比与分析结果表明,该方法可以较好地进行文本分类。 展开更多
关键词 文本分类 knn 聚类化 训练集
下载PDF
用于大数据分类的KNN算法研究 被引量:61
5
作者 耿丽娟 李星毅 《计算机应用研究》 CSCD 北大核心 2014年第5期1342-1344,1373,共4页
针对KNN算法在处理大数据时的两个不足对其进行了研究,提出多层差分KNN算法。算法对已知样本根据类域进行分层,既避免了传统改进算法中剪辑样本带来的判别误差,又大大降低了无效的计算量;同时在最后一层采用差分的方法进行决策,而不是... 针对KNN算法在处理大数据时的两个不足对其进行了研究,提出多层差分KNN算法。算法对已知样本根据类域进行分层,既避免了传统改进算法中剪辑样本带来的判别误差,又大大降低了无效的计算量;同时在最后一层采用差分的方法进行决策,而不是直接根据最近邻进行分类,大大提高了分类的准确性。实验结果表明,该算法在对样本容量大、涉及邻域多的大数据样本进行分类时能取得较好的分类效果。 展开更多
关键词 大数据 knn 差分多层
下载PDF
KNN数据挖掘算法在北京地区霾等级预报中的应用 被引量:52
6
作者 熊亚军 廖晓农 +6 位作者 李梓铭 张小玲 孙兆彬 赵秀娟 赵普生 马小会 蒲维维 《气象》 CSCD 北大核心 2015年第1期98-104,共7页
利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度... 利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度、露点温度、U风、V风分量以及PM_(2.5)浓度作为7个属性特征,以霾等级做为标志量构建训练样本集,结合KNN(KNearest Neighbor)数据挖掘算法构建疆等级预报分类器,并开展霾等级客观识别实验。结果表明K=3时该分类器的分类预报效果最佳,其13个站点的分类准确率高达88.2%。基于该算法构建的KNN模型预报无霾时的漏报概率很小,准确率高达91.8%;预报有轻度霾、中度霾以及重度霾时,空报的概率仅分别为4.7%、1.4%和2.6%。2014年8月29日至9月2日北京地区一次霾天气过程的预报结果表明:南郊观象台、密云和延庆3站的预报准确率分别达到74%、64%和84%,但霾等级的精度方面还有待于进一步提高。 展开更多
关键词 数据挖掘 knn 预报
下载PDF
一种融合Kmeans和KNN的网络入侵检测算法 被引量:40
7
作者 华辉有 陈启买 +2 位作者 刘海 张阳 袁沛权 《计算机科学》 CSCD 北大核心 2016年第3期158-162,共5页
网络入侵检测算法是网络安全领域研究的热点和难点内容之一。目前许多算法如KNN、TCMKNN等处理的训练样本集都比较小,在处理大样本集时仍然非常耗时。因此,提出了一种适应大样本集的网络入侵检测算法(Cluster-KNN算法)。该算法分为离线... 网络入侵检测算法是网络安全领域研究的热点和难点内容之一。目前许多算法如KNN、TCMKNN等处理的训练样本集都比较小,在处理大样本集时仍然非常耗时。因此,提出了一种适应大样本集的网络入侵检测算法(Cluster-KNN算法)。该算法分为离线数据预处理(数据索引)和在线实时分类两个阶段:离线预处理阶段建立大样本集的聚簇索引;在线实时分类阶段则利用聚簇索引搜索得到近邻,最终采用KNN算法得出分类结果。实验结果表明:与传统的KNN算法相比,Cluster-KNN算法在分类阶段具有很高的时间效率,同时在准确率、误报率和漏报率方面与其它同领域入侵检测方法相比也具有相当的优势。Cluster-KNN能够很好地区分异常和正常场景,且在线分类速度快,因而更适用于现实的网络应用环境。 展开更多
关键词 网络入侵检测 Kmeans knn KDDCUP99
下载PDF
基于语义距离的K-最近邻分类方法 被引量:31
8
作者 杨立 左春 王裕国 《软件学报》 EI CSCD 北大核心 2005年第12期2054-2062,共9页
最近邻分类方法中对距离机制的研究大都集中在根据何种计算方法将不同属性取值的差异集中起来,而未考虑到同一属性间取值的语义差异所带来的影响;而且传统算法的分类准确率对于不同抽象层次描述的数据集带来的数据不完整性相当敏感.针... 最近邻分类方法中对距离机制的研究大都集中在根据何种计算方法将不同属性取值的差异集中起来,而未考虑到同一属性间取值的语义差异所带来的影响;而且传统算法的分类准确率对于不同抽象层次描述的数据集带来的数据不完整性相当敏感.针对这两个问题,提出一种基于语义距离的最近邻分类方法SDkNN(semanticdistancebasedk-nearestneighbor).该方法分析了同一属性内取值的语义差异,说明了如何基于领域本体计算语义距离,并将其应用到kNN算法中.经过在UCI数据集以及实际应用数据集中验证,SDkNN的整体性能要优于传统方法,在数据不完整的情况下效果更为明显,实践证明,SDkNN有较好的应用价值. 展开更多
关键词 本体 语义距离 最近邻 分类
下载PDF
KNN文本分类算法研究 被引量:24
9
作者 杨丽华 戴齐 郭艳军 《微计算机信息》 北大核心 2006年第07X期269-270,185,共3页
KNN(K-NearestNeighbour)是向量空间模型中最好的文本分类算法之一。文中介绍了KNN算法的基本思想,归纳了针对KNN算法的不足而提出的改进算法。对KNN文本分类算法的理论研究和实际应用起了指导作用。
关键词 文本分类 knn 向量空间模型
下载PDF
kNN文本分类器类偏斜问题的一种处理对策 被引量:33
10
作者 郝秀兰 陶晓鹏 +1 位作者 徐和祥 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2009年第1期52-61,共10页
类偏斜问题(class i mbalance problem)是数据挖掘领域的常见问题之一,人们提出了各种策略来处理这个问题.当训练样本存在类偏斜问题时,kNN分类器会将小类中的样本错分到大类,导致分类的宏F1指标下降.针对kNN存在的这个缺陷,提出了文本... 类偏斜问题(class i mbalance problem)是数据挖掘领域的常见问题之一,人们提出了各种策略来处理这个问题.当训练样本存在类偏斜问题时,kNN分类器会将小类中的样本错分到大类,导致分类的宏F1指标下降.针对kNN存在的这个缺陷,提出了文本训练集的临界点(critical point,CP)的概念并对其性质进行了探讨,给出了求CP,CP的下近似值LA、上近似值UA的算法.之后,根据LA或UA及训练样本数对传统的kNN决策函数进行修改,这就是自适应的加权kNN文本分类.为了验证自适应的加权kNN文本分类的有效性,设计了2组实验进行对比:一组为不同的收缩因子间进行对比,可看做是与Tan的工作进行对比,同时用来证实在LA或UA上分类器的宏F1较好;另一组则是与随机重取样进行实验对比,其中,传统kNN方法作为对比的基线.实验表明,所提的自适应加权kNN文本分类优于随机重取样,使得宏F1指标明显上升.该方法有点类似于代价相关学习. 展开更多
关键词 文本分类 knn 类偏斜 文本训练集的临界点 权重调节 随机重取样
下载PDF
基于KNN方法的大兴安岭地区森林地上碳储量遥感估算 被引量:34
11
作者 戚玉娇 李凤日 《林业科学》 EI CAS CSCD 北大核心 2015年第5期46-55,共10页
【目的】采用KNN方法进行碳储量估测,并对估测后的数据进行各种校正处理,绘制森林地上碳储量的空间分布图,为我国森林碳储量和固碳潜力的研究提供基础数据和科学依据。【方法】以黑龙江省大兴安岭为研究区(50°05'—53°33&... 【目的】采用KNN方法进行碳储量估测,并对估测后的数据进行各种校正处理,绘制森林地上碳储量的空间分布图,为我国森林碳储量和固碳潜力的研究提供基础数据和科学依据。【方法】以黑龙江省大兴安岭为研究区(50°05'—53°33'N,121°11'—127°01'E),基于2010年森林资源连续清查固定样地和同年Landsat5 TM影像数据,利用k-邻近法(KNN)在像素级水平上对森林地上碳储量进行估算。采用多准则方法分东、南、北和中4个区域对样地坐标和其对应的影像光谱值进行坐标重配准,并根据实测样地数据对坐标重配置前后不同林分类型地上碳储量估测精度进行评价;针对KNN方法像素级估测结果存在明显的高值区域低估和低值区域高估现象,应用直方图匹配方法对估测结果进行变动范围调整;并根据样地实测碳储量和KNN估测值间的回归关系对调整后的结果分区域进行进一步匹配校正后处理,绘制森林碳储量的空间分布图。【结果】总体来说,本研究区域像元尺度KNN估测的欧式距离优于马氏距离,均方根误差随着最邻近值k的增大而降低,当k大于6时变化缓慢,并逐渐趋于稳定;坐标误差校正后,各林分类型森林地上碳储量的估测精度均显著提高,平均均方根误差由17.23降低到14.3 t·hm-2;直方图匹配后,各区域样地点高值区域低估和低值区域高估现象均有很大程度改善,实测值和估测值间的相关关系明显增强,然而高值地区(碳储量大于20 t·hm-2)出现过高估计现象;经匹配校正后处理的均值、标准差、直方图和累积频率分布图更接近样地实测值,均方根误差也明显降低,高值地区过高估计现象得到很好校正。【结论】森林资源清查数据、遥感数据及KNN方法相结合逐渐成为区域尺度森林参数空间连续估测的重要手段。同利用光谱值和森林参数建立的回归模型相比,KNN方法能够更多地考虑到森� 展开更多
关键词 knn 森林地上碳储量 遥感 坐标配准 直方图匹配
下载PDF
基于电子鼻技术的碧螺春茶叶品质等级检测研究 被引量:38
12
作者 陈哲 赵杰文 《农机化研究》 北大核心 2012年第11期133-137,共5页
采用由12个金属氧化物传感器组成阵列的电子鼻,对3种等级碧螺春茶的茶水和茶底气味进行检测。筛选了9个对茶叶挥发香气敏感的传感器阵列,并分别提取了各个传感器所获取茶水和茶底数据的最大值、最小值和平均值作为特征变量,进行主成分分... 采用由12个金属氧化物传感器组成阵列的电子鼻,对3种等级碧螺春茶的茶水和茶底气味进行检测。筛选了9个对茶叶挥发香气敏感的传感器阵列,并分别提取了各个传感器所获取茶水和茶底数据的最大值、最小值和平均值作为特征变量,进行主成分分析,再利用K最邻近(KNN)和误差反向神经网络(BP-ANN)对数据进行分析与识别。KNN结果显示,采用茶水和茶底特征融合信息对不同等级碧螺春茶的识别效果较茶水和茶底更佳,KNN模型对独立样本的判别率达到83.33%;设计拓扑结构为10-7-3的BP-ANN模型对信息融合的茶叶样本判别率则达到了100%。 展开更多
关键词 碧螺春茶 电子鼻 K最邻近 BP神经网络
下载PDF
用于Web文本分类的快速KNN算法 被引量:33
13
作者 王煜 白石 王正欧 《情报学报》 CSSCI 北大核心 2007年第1期60-64,共5页
KNN算法是一种简单、有效、非参数的web文本分类方法。传统KNN方法的明显缺陷是样本相似度的计算量很大,使其在具有大量高维样本的web文本分类中缺乏实用性。本文提出一种快速查找精确的k个最近邻的FKNN(Fast-k-Nearest-Neighbor)算... KNN算法是一种简单、有效、非参数的web文本分类方法。传统KNN方法的明显缺陷是样本相似度的计算量很大,使其在具有大量高维样本的web文本分类中缺乏实用性。本文提出一种快速查找精确的k个最近邻的FKNN(Fast-k-Nearest-Neighbor)算法。FKNN算法首先选择一个样本作为基准点,并将所有样本按照距基准样本的距离进行排序并建立索引表,然后根据索引表和有序队列查找k个最近邻,减小了查找范围,极大降低了相似度计算量。 展开更多
关键词 knn 文本分类 相似度
下载PDF
基于改进KNN的文本分类方法 被引量:19
14
作者 钱晓东 王正欧 《情报科学》 CSSCI 北大核心 2005年第4期550-554,共5页
本文针对VSM (向量空间模型)中KNN (K最近邻算法)在文本处理环境下的不足,根据SOM (自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法。应用特征选取和模式聚合理论以降低特征空间维数。传统的VSM模... 本文针对VSM (向量空间模型)中KNN (K最近邻算法)在文本处理环境下的不足,根据SOM (自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法。应用特征选取和模式聚合理论以降低特征空间维数。传统的VSM模型各维相同的权重并不适应于文本处理的环境,本文提出应用SOM神经网络进行VSM模型各维权重的计算。结合两种改进,有效地降低了向量空间的维数,提高了文本分类的精度和速度。 展开更多
关键词 文本分类 特征提取 自组织神经网络 向量空间模型 K最近邻算法 模式聚合
下载PDF
基于K最近邻分类的无线传感器网络定位算法 被引量:32
15
作者 石欣 印爱民 张琦 《仪器仪表学报》 EI CAS CSCD 北大核心 2014年第10期2238-2247,共10页
针对无线传感器网络中,大部分节点硬件配置低,缺少自定位能力的问题,提出一种基于K最近邻分类的分布式算法LKNN。将定位问题转换成为分类问题,根据信标节点的位置信息和相距跳数计算节点间的相似度,利用K最近邻(KNN)二分分类横纵坐标... 针对无线传感器网络中,大部分节点硬件配置低,缺少自定位能力的问题,提出一种基于K最近邻分类的分布式算法LKNN。将定位问题转换成为分类问题,根据信标节点的位置信息和相距跳数计算节点间的相似度,利用K最近邻(KNN)二分分类横纵坐标,确定未知节点的坐标,经过质点弹簧算法MSO进一步优化节点的估计位置。仿真研究表明,LKNN算法定位过程中,K最近邻算法分类准确度高,质点弹簧算法可以改善边界效应,提高边缘区域节点的定位精度。相比于DV-Hop算法,LKNN定位效果更为理想,尤其是在C形随机分布的不规则网络中,平均误差和误差的标准差减小20%~50%。进一步实验结果验证了LKNN算法的有效性和实用性。 展开更多
关键词 无线传感器网络 位置估计 定位算法 K最近邻算法 质点弹簧优化
下载PDF
考虑多因素的城市道路交通拥堵指数预测研究 被引量:31
16
作者 韦清波 何兆成 +2 位作者 郑喜双 陈昶佳 杨敬锋 《交通运输系统工程与信息》 EI CSCD 北大核心 2017年第1期74-81,共8页
在分析城市道路交通拥堵指数总体变化规律的基础上,综合考虑天气、节假日、重大活动等因素对交通的影响,以未来3 h、第2天24 h每5 min的交通拥堵指数明细为预测目标函数,建立基于K近邻的城市道路交通拥堵指数预测模型,确定了模型的状态... 在分析城市道路交通拥堵指数总体变化规律的基础上,综合考虑天气、节假日、重大活动等因素对交通的影响,以未来3 h、第2天24 h每5 min的交通拥堵指数明细为预测目标函数,建立基于K近邻的城市道路交通拥堵指数预测模型,确定了模型的状态向量、距离计算方法、预测值计算方法等,并根据实际采集数据对模型各参数进行标定,实现了对广州市宏观交通拥堵指数的短期、中期预测.最后,以2016年1~2月的数据为例,对模型进行测试验证.结果表明,预测模型对于普通日、特殊日的预测效果理想,且具有较强的可操作性,基本达到工程应用效果. 展开更多
关键词 城市交通 中短期预测 K近邻 交通拥堵指数 多因素
下载PDF
基于KNN与自动检索的迭代近邻法在自动分类中的应用 被引量:18
17
作者 杨建良 王永成 《情报学报》 CSSCI 北大核心 2004年第2期137-141,共5页
本文研究了一种基于KNN与自动检索的自动分类算法--迭代近邻法(Iterative KNN,I-KNN),用以解决KNN算法在小样本库的环境下分类效果不佳的问题.在无法得到足够的定类样本时,通过检索的方法将待分样本的局部主题特征放大,进而得到足够定... 本文研究了一种基于KNN与自动检索的自动分类算法--迭代近邻法(Iterative KNN,I-KNN),用以解决KNN算法在小样本库的环境下分类效果不佳的问题.在无法得到足够的定类样本时,通过检索的方法将待分样本的局部主题特征放大,进而得到足够定类的相似样本.实验证明,迭代近邻法既增加了获取相似样本的几率,同时也有效地控制了样本相似度条件限制放宽后可能引入的分类噪声,在实际应用中能较好地提升自动分类系统的查全率和查准率. 展开更多
关键词 knn 自动检索 自动分类 迭代近邻法 检索效率
下载PDF
基于KNN的合成孔径雷达目标识别 被引量:27
18
作者 郝岩 白艳萍 张校非 《火力与指挥控制》 CSCD 北大核心 2018年第9期111-113,118,共4页
针对合成孔径雷达(SAR)目标的识别问题,提出了一种基于K近邻方法(KNN)的SAR图像目标识别方法。首先,有别于传统的图像特征提取方法,采用逆向思维,通过剪裁和去噪方法对图像的冗余信息进行"剔除",从而尽可能保留图像的原有信息... 针对合成孔径雷达(SAR)目标的识别问题,提出了一种基于K近邻方法(KNN)的SAR图像目标识别方法。首先,有别于传统的图像特征提取方法,采用逆向思维,通过剪裁和去噪方法对图像的冗余信息进行"剔除",从而尽可能保留图像的原有信息,并将其作为待分类特征。然后分别用KNN和支持向量机(SVM)在MSTAR(Moving and Stationary Target Acquisition and Recognition)数据集上进行了仿真对比实验。实验结果表明,此方法下KNN的分类效果明显优于SVM,其精度均达到94%以上,证明了所提方法的有效性。 展开更多
关键词 SAR 目标识别 剪裁 去噪 knn SVM
下载PDF
一种基于快速k-近邻的最小生成树离群检测方法 被引量:28
19
作者 朱利 邱媛媛 +1 位作者 于帅 原盛 《计算机学报》 EI CSCD 北大核心 2017年第12期2856-2870,共15页
离群检测也称异常点检测,是数据挖掘领域很有意义的热点问题之一,在很多方面都有广泛应用,如入侵行为、欺诈行为、医学上疾病前期的征兆等.基于k-近邻的算法能够很好的运用到大数据集上,因此在基于距离和基于密度的离群检测技术方面得... 离群检测也称异常点检测,是数据挖掘领域很有意义的热点问题之一,在很多方面都有广泛应用,如入侵行为、欺诈行为、医学上疾病前期的征兆等.基于k-近邻的算法能够很好的运用到大数据集上,因此在基于距离和基于密度的离群检测技术方面得到广泛应用.然而k-近邻算法的时间复杂度为O(N^2),随着数据集规模的增加,时间开销大大增加.基于最小生成树的聚类算法在使用Prim或者Kruskal算法构建最小生成树时空间复杂度和时间复杂度均为O(N^2),聚类结果依赖于用户参数的选择,而且容易漏检稠密簇中的局部离群点.针对以上问题,融合基于密度和基于聚类方法的优势,提出一种新的离群检测方法.该方法具有以下优点:(1)计算k-近邻的时间复杂度为O(kN)(k<<N);(2)构建最小生成树的时间复杂度为O(NlogN);(3)自适应识别聚类数目;(4)能够检测出多种类型的离群数据.最后通过大量实验验证了文中所提的KDNS算法,FkNN算法和ADC算法的有效性.实验结果表明,相对于现有算法,文中算法可以大幅度降低时间复杂度并显著提高离群检测率. 展开更多
关键词 良分割对 最小生成树 K-近邻 自适应聚类 离群检测 数据挖掘
下载PDF
SVM-KNN组合改进算法在专利文本分类中的应用 被引量:23
20
作者 李程雄 丁月华 文贵华 《计算机工程与应用》 CSCD 北大核心 2006年第20期193-195,212,共4页
提出了基于支持向量机的专利文本分类器的总体设计方案和实现方法;提出并分析了该分类器的改进算法SVM-KNN组合改进算法。文章对两种算法进行了大量的实验并对实验结果进行比较分析,在此基础上得出了三个结论。
关键词 支持向量机 knn 专利分类 最优分类面
下载PDF
上一页 1 2 110 下一页 到第
使用帮助 返回顶部