期刊文献+
共找到401篇文章
< 1 2 21 >
每页显示 20 50 100
使用KNN算法的文本分类 被引量:99
1
作者 张宁 贾自艳 史忠植 《计算机工程》 EI CAS CSCD 北大核心 2005年第8期171-172,185,共3页
介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。
关键词 数据挖掘 文本分类 knn算法 向量空间模型
下载PDF
基于改进的皮尔逊相关系数的低压配电网拓扑结构校验方法 被引量:127
2
作者 肖勇 赵云 +2 位作者 涂治东 钱斌 常润勉 《电力系统保护与控制》 EI CSCD 北大核心 2019年第11期37-43,共7页
针对低压配电网拓扑结构人工校验成本高、实时性不强的问题,提出了一种基于皮尔逊相关系数和KNN算法的低压配电网拓扑结构纯软件在线校验方法。首先用皮尔逊相关系数判断用户电压序列曲线的相似性,通过相关系数算法校验台区户变关系的... 针对低压配电网拓扑结构人工校验成本高、实时性不强的问题,提出了一种基于皮尔逊相关系数和KNN算法的低压配电网拓扑结构纯软件在线校验方法。首先用皮尔逊相关系数判断用户电压序列曲线的相似性,通过相关系数算法校验台区户变关系的正确性,找出户变关系不正确的用户,进行再校验。对于需再校验的用户,基于GIS系统的数据和《配电网规划设计技术导则》剪辑生成用户样本集,运用KNN算法分析剪辑生成用户样本集,然后找出校验用户所属的正确台区。最后根据人工现场校验结果,判断算法校验的正确性。 展开更多
关键词 低压拓扑校验 皮尔逊相关系数 电压曲线相似性 样本集 knn算法
下载PDF
应用特征聚合进行中文文本分类的改进KNN算法 被引量:60
3
作者 张晓辉 李莹 +1 位作者 王华勇 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期229-232,共4页
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传... 针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 。 展开更多
关键词 改进knn算法 中文文本分类 分类贡献模式 特征聚合
下载PDF
基于T型灰色关联度和KNN算法的低压配电网台区拓扑识别方法 被引量:43
4
作者 陈招安 黄纯 +1 位作者 张志丹 江亚群 《电力系统保护与控制》 EI CSCD 北大核心 2021年第1期163-169,共7页
针对目前低压配电网台区拓扑存在记录不准确,人工排查成本高,准确率低的问题。提出了一种基于T型灰色关联度和K-最近邻(K-nearest Neighbor,KNN)算法的低压配电网拓扑自动识别方法。首先计算用户与所属台区电压的T型灰色关联度,对低于... 针对目前低压配电网台区拓扑存在记录不准确,人工排查成本高,准确率低的问题。提出了一种基于T型灰色关联度和K-最近邻(K-nearest Neighbor,KNN)算法的低压配电网拓扑自动识别方法。首先计算用户与所属台区电压的T型灰色关联度,对低于设定阈值的可疑用户用KNN算法判断所属台区,完成户变关系识别工作。然后计算新户变关系下用户之间电压的T型灰色关联度,结合拓扑结构图识别馈线中的可疑用户。最后找出与可疑用户最相关的用户,依据电压沿着馈线逐渐降低定位可疑用户在馈线中的位置。算例分析结果表明,该方法能自动识别用户所属台区和馈线,准确率高,实用性好。 展开更多
关键词 低压配电网 拓扑结构 T型灰色关联度 knn算法 台区
下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:27
5
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 knn算法 k-最近邻图 小样本 图划分 分类算法
下载PDF
基于属性值相关距离的KNN算法的改进研究 被引量:28
6
作者 肖辉辉 段艳明 《计算机科学》 CSCD 北大核心 2013年第11A期157-159,187,共4页
样本距离机制的定义直接影响到KNN算法的准确性和效率。针对传统KNN算法在距离的定义及类别决定上的不足,提出了利用属性值对类别的重要性进行改进的KNN算法(FCD-KNN)。首先定义两个样本间的距离为属性值的相关距离,此距离有效度量了样... 样本距离机制的定义直接影响到KNN算法的准确性和效率。针对传统KNN算法在距离的定义及类别决定上的不足,提出了利用属性值对类别的重要性进行改进的KNN算法(FCD-KNN)。首先定义两个样本间的距离为属性值的相关距离,此距离有效度量了样本间的相似度。再根据此距离选取与待测试样本距离最小的K个近邻,最后根据各类近邻样本点的平均距离及个数判断待测试样本的类别。理论分析及仿真实验结果表明,FCD-KNN算法较传统KNN及距离加权-KNN的分类准确性要高。 展开更多
关键词 knn算法 相关距离 属性值 样本距离机制
下载PDF
基于改进快速密度峰值聚类算法的电力大数据异常值检测 被引量:28
7
作者 刘凤魁 邓春宇 +1 位作者 王晓蓉 王新迎 《电力信息与通信技术》 2017年第6期36-41,共6页
异常值检测是数据挖掘的一个重要分支。在电力行业,异常值检测可用于电网故障检测、设备故障检测、用电异常检测等领域。文章根据电力大数据的特点,研究适用于电力大数据的异常值检测算法。针对快速密度峰值聚类算法用于异常值检测时未... 异常值检测是数据挖掘的一个重要分支。在电力行业,异常值检测可用于电网故障检测、设备故障检测、用电异常检测等领域。文章根据电力大数据的特点,研究适用于电力大数据的异常值检测算法。针对快速密度峰值聚类算法用于异常值检测时未考虑数据的局部特点以及局部密度依赖于截断距离选取的不足,利用KNN(K-Nearest Neighbors)思想重新定义局部密度和距离,提出了基于KNN的快速密度峰值异常值检测算法,从而实现更加准确的异常值检测,并基于某省配电变压器的日负荷数据异常检测仿真实验证明了该算法的有效性。 展开更多
关键词 电力大数据 异常值检测 knn算法 密度聚类
下载PDF
基于改进K-modes聚类的KNN分类算法 被引量:23
8
作者 王志华 刘绍廷 罗齐 《计算机工程与设计》 北大核心 2019年第8期2228-2234,共7页
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出... 为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。 展开更多
关键词 K-modes算法 knn算法 分类 簇中心 K-modes-knn算法 字符串核函数
下载PDF
基于改进快速密度峰值算法的电力负荷曲线聚类分析 被引量:24
9
作者 陈俊艺 丁坚勇 +4 位作者 田世明 卜凡鹏 朱炳翔 黄事成 周凯 《电力系统保护与控制》 EI CSCD 北大核心 2018年第20期85-93,共9页
为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法。首先应用主成分分析法对归一... 为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法。首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作。然后利用kd树算法对降维后的数据进行快速K近邻搜索生成KNN矩阵。最后以KNN矩阵代替原算法的距离矩阵作为输入数据。在基于KNN改进的样本局部密度和距离计算准则的基础上,运用快速密度峰值算法对负荷曲线进行聚类分析。通过实验和算例分析验证了所提改进算法的实用性和有效性。 展开更多
关键词 电力大数据 负荷曲线聚类 快速密度峰值算法 主成分分析 KD树 knn算法
下载PDF
用于文本分类的改进KNN算法 被引量:15
10
作者 王煜 王正欧 白石 《中文信息学报》 CSCD 北大核心 2007年第3期76-82,共7页
最近邻分类器是假定局部的类条件概率不变,而这个假定在高维特征空间中无效。因此在高维特征空间中使用k最近邻分类器,不对特征权重进行修正就会引起严重的偏差。本文采用灵敏度法,利用前馈神经网络获得初始特征权重并进行二次降维。在... 最近邻分类器是假定局部的类条件概率不变,而这个假定在高维特征空间中无效。因此在高维特征空间中使用k最近邻分类器,不对特征权重进行修正就会引起严重的偏差。本文采用灵敏度法,利用前馈神经网络获得初始特征权重并进行二次降维。在初始权重下,根据样本间相似度采用SS树方法将训练样本划分成若干小区域,以此寻找待分类样本的近似k0个最近邻,并根据近似k0个最近邻和Chi-square距离原理计算新权重,搜索出新的k个最近邻。此方法在付出较小时间代价的情况下,在文本分离中可获得较好的分类精度的提高。 展开更多
关键词 计算机应用 中文信息处理 文本分类 神经网络 Chi—square距离 knn算法
下载PDF
基于岩石类型约束的碳酸盐岩油藏地质建模方法——以扎格罗斯盆地碳酸盐岩油藏A为例 被引量:21
11
作者 谭学群 廉培庆 +2 位作者 邱茂君 李艳华 董广为 《石油与天然气地质》 EI CAS CSCD 北大核心 2013年第4期558-563,共6页
对于成岩作用较强的碳酸盐岩油藏,沉积相约束下的储层建模方法已不适用。为此,提出了基于岩石类型约束的油藏地质建模方法。应用取心样品的孔隙度、渗透率和毛细管压力曲线等数据,采用Winland R35方法,划分油藏岩石类型,建立不同岩石类... 对于成岩作用较强的碳酸盐岩油藏,沉积相约束下的储层建模方法已不适用。为此,提出了基于岩石类型约束的油藏地质建模方法。应用取心样品的孔隙度、渗透率和毛细管压力曲线等数据,采用Winland R35方法,划分油藏岩石类型,建立不同岩石类型下的孔隙度和渗透率关系。通过取心井建立测井曲线与岩石类型的关系,以测井曲线为纽带预测未取心井的岩石类型;并通过序贯指示模拟预测井间岩石类型,建立三维岩石类型模型。基于岩石类型和地震波阻抗数据体协同约束,建立孔隙度模型;再利用不同岩石类型下的孔-渗关系确定渗透率,建立渗透率模型。经过抽稀验证,地质模型精度较高。这种方法对于埋藏较深、成岩作用较强的碳酸盐岩油藏尤为适用。 展开更多
关键词 地震波阻抗 岩石类型 knn算法 Winland R35方法 碳酸盐岩 地质建模
下载PDF
基于改进的kNN算法的中文网页自动分类方法研究 被引量:20
12
作者 胡燕 吴虎子 钟珞 《武汉大学学报(工学版)》 CAS CSCD 北大核心 2007年第4期141-144,共4页
概述了中文网页分类的一般过程,重点论述了在分类过程中特征词提取、训练库建立和文本分类算法等关键问题,针对向量空间模型的文本特征表示方法中特征词数量的多少与分类算法的效率有着密切关系的特点,提出了基于词性的特征词提取方法,... 概述了中文网页分类的一般过程,重点论述了在分类过程中特征词提取、训练库建立和文本分类算法等关键问题,针对向量空间模型的文本特征表示方法中特征词数量的多少与分类算法的效率有着密切关系的特点,提出了基于词性的特征词提取方法,并且在文本相似度计算时,融入传统的特征向量的比较方法来对kNN算法进行改进,提出了基于特征词减少的改进kNN算法,提高了分类算法的效率和性能. 展开更多
关键词 特征词 训练库 文本相似度 knn算法
下载PDF
粗糙集近似集的KNN文本分类算法研究 被引量:20
13
作者 杨帅华 张清华 《小型微型计算机系统》 CSCD 北大核心 2017年第10期2192-2196,共5页
在中文文本分类中,KNN文本分类算法因具有算法简单、有效以及准确率高等特点,被认为是一种较好的文本分类算法.但KNN算法有一个明显缺陷,当样本数据规模较大时,该算法的分类效率明显降低.通过引入粗糙集的近似集模型,计算训练样本集中... 在中文文本分类中,KNN文本分类算法因具有算法简单、有效以及准确率高等特点,被认为是一种较好的文本分类算法.但KNN算法有一个明显缺陷,当样本数据规模较大时,该算法的分类效率明显降低.通过引入粗糙集的近似集模型,计算训练样本集中各个样本类别的上近似空间和λ近似空间,在分类中根据待分类文本向量在样本空间中的分布位置,可以直接判定一些文本的类别,减少分类时间.实验表明,在阈值λ取值合适的情况下,该算法可以保持KNN算法分类精度基本不变,同时显著的提高分类效率. 展开更多
关键词 knn算法 文本分类 粗糙集 分类效率
下载PDF
基于语义的微博短信息分类 被引量:18
14
作者 崔争艳 《现代计算机》 2010年第8期18-20,24,共4页
基于研究微博作者兴趣挖掘问题,探讨微博中短信息的分类,结合《知网》本体库,将关键词映射到语义概念,并用语义KNN分类算法实现对短信息的分类,经过实验证明,基于语义扩展后的分类比传统分类技术有很好的准确率和召回率。
关键词 微博 短信息 知网 语义扩展 knn算法
下载PDF
基于语义与最大匹配度的短文本分类研究 被引量:18
15
作者 孙建旺 吕学强 张雷瀚 《计算机工程与设计》 CSCD 北大核心 2013年第10期3613-3618,共6页
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出... 为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类。实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高。 展开更多
关键词 短文本分类 义原相似度 词语相似度 语义 最大匹配度 knn算法
下载PDF
考虑历史缺陷文本信息的断路器状态评价研究 被引量:17
16
作者 马润泽 王龙响 +2 位作者 余佳文 王慧芳 邱剑 《机电工程》 CAS 2015年第10期1375-1379,共5页
针对当前断路器进行状态评价基于其运行信息,但未涉及能反映断路器部件可靠性的断路器历史缺陷情况的特点,以及断路器中文缺陷文本的处理分析问题,提出了融合运行信息与历史缺陷信息的断路器状态综合评价模型,即在现有评价导则基础上添... 针对当前断路器进行状态评价基于其运行信息,但未涉及能反映断路器部件可靠性的断路器历史缺陷情况的特点,以及断路器中文缺陷文本的处理分析问题,提出了融合运行信息与历史缺陷信息的断路器状态综合评价模型,即在现有评价导则基础上添加了专门针对历史缺陷文本的评价规则,并提出了基于KNN算法的缺陷文本分类方法,方法先通过分词、词频统计、去停用词和文本向量化等适合短文本的处理步骤进行中文文本预处理,然后采用KNN分类算法对缺陷文本进行归类计算。通过算例,对缺陷文本分类方法以及考虑历史缺陷信息后的断路器状态综合评价模型进行了验证。研究结果表明,缺陷文本分类方法是可行的,且加入历史缺陷信息后,断路器的状态评价结果得到合理性的提升。 展开更多
关键词 断路器 状态评价 缺陷文本 knn算法
下载PDF
基于KNN算法的可变权值室内指纹定位算法 被引量:17
17
作者 戴志诚 李小年 +1 位作者 陈增照 何秀玲 《计算机工程》 CAS CSCD 北大核心 2019年第6期310-314,共5页
针对基于静态权值的室内指纹定位算法存在定位精度低、定位结果不稳定以及环境适应性差等问题,提出一种以欧氏距离为权值参考的可变权值室内指纹定位算法。该算法分为离线采样阶段和在线定位阶段。离线采样阶段对接收信号强度指示(RSSI... 针对基于静态权值的室内指纹定位算法存在定位精度低、定位结果不稳定以及环境适应性差等问题,提出一种以欧氏距离为权值参考的可变权值室内指纹定位算法。该算法分为离线采样阶段和在线定位阶段。离线采样阶段对接收信号强度指示(RSSI)值进行高斯滤波去噪构建指纹库。在线定位阶段引入权值指数α、β,分别以RSSI、欧氏距离为权值参考计算最近邻点及其加权质心,得出待测节点的坐标。实验结果表明,相比KNN和RW算法,该算法定位精度高,其平均误差为0.965m,且定位误差波动小。 展开更多
关键词 接收信号强度指示 knn算法 可变权值 加权质心 指纹定位
下载PDF
基于投影寻踪的中文网页分类算法 被引量:11
18
作者 万中英 王明文 廖海波 《中文信息学报》 CSCD 北大核心 2005年第4期60-67,共8页
随着Web信息迅猛发展,网络用户对网页自动分类器的需求日益增长。为了提高分类精度,本文提出了一种新的基于投影寻踪(ProjectionPursuit,简称PP)的中文网页分类算法。我们首先利用遗传算法找到一个最好的投影方向,然后将已被表示成为n... 随着Web信息迅猛发展,网络用户对网页自动分类器的需求日益增长。为了提高分类精度,本文提出了一种新的基于投影寻踪(ProjectionPursuit,简称PP)的中文网页分类算法。我们首先利用遗传算法找到一个最好的投影方向,然后将已被表示成为n维向量的网页投影到一维空间。最后采用KNN分类算法对其进行分类。此方法能解决“维数灾难”问题。实验结果表明,我们提出的算法是可行而且是有效的。 展开更多
关键词 计算机应用 中文信息处理 投影寻踪 网页分类 遗传算法 knn算法
下载PDF
基于改进KNN算法的交通流异常数据修复方法 被引量:15
19
作者 秦一菲 马明辉 +2 位作者 王岩松 郭辉 张亮 《计算机测量与控制》 2018年第12期180-184,共5页
交通流数据分析是交通规划、控制、管理等工作实施的基础;交通流数据异常会给交通状态辨识及交通管理和控制带来困扰,不利于交通领域各方面研究及工作的开展;因此,对异常数据进行修复具有必要性;为了提高交通流异常数据修复精度,进一步... 交通流数据分析是交通规划、控制、管理等工作实施的基础;交通流数据异常会给交通状态辨识及交通管理和控制带来困扰,不利于交通领域各方面研究及工作的开展;因此,对异常数据进行修复具有必要性;为了提高交通流异常数据修复精度,进一步改善交通数据质量,构建了基于改进K近邻(K-Nearest Neighbor,KNN)算法的交通流异常数据修复模型;通过对KNN基础模型中k值和状态向量进行优选、提出距离占比的近邻值权重选取方式,实现对其模型的改进;为了验证模型的有效性,采用实测交通流数据进行实验分析;实验结果表明,改进的KNN数据修复模型具有更高的修复精度,其平均相对误差为9.88%,能够有效改善数据质量,为智能交通控制体系提供基础数据支持。 展开更多
关键词 交通流 异常数据修复 knn算法 近邻值
下载PDF
基于KNN-PointNet的点云语义分割 被引量:15
20
作者 杨晓文 王爱兵 +2 位作者 韩燮 赵融 靳瑜昕 《激光与光电子学进展》 CSCD 北大核心 2021年第24期264-271,共8页
针对深度神经网络PointNet未引入局部特征以及分割精度有待提高的问题,在PointNet的基础上提出一种结合改进K近邻(KNN)算法的局部特征提取方法,将引入局部特征提取方法的神经网络命名为KNNPointNet。首先将局部区域划分为k个圆形邻域,... 针对深度神经网络PointNet未引入局部特征以及分割精度有待提高的问题,在PointNet的基础上提出一种结合改进K近邻(KNN)算法的局部特征提取方法,将引入局部特征提取方法的神经网络命名为KNNPointNet。首先将局部区域划分为k个圆形邻域,根据局部区域中样本数据分布密度的差异来确定权值以计算待测点的分类情况;其次将局部邻域特征结合单点全局特征作为输入进行特征提取,通过调节网络深度来提取局部特征以增强局部邻域中点与点的相互关联;最后将改进的KNN算法应用于KNN-PointNet点云分割网络进行实验对比。实验结果表明,相比于当前一些先进的分割网络,采用改进KNN算法的分割网络KNN-PointNet具有更高的分割精度。 展开更多
关键词 图像处理 knn算法 局部特征 PointNet 密度差异 点云分割
原文传递
上一页 1 2 21 下一页 到第
使用帮助 返回顶部