期刊文献+
共找到157篇文章
< 1 2 8 >
每页显示 20 50 100
基于密度的kNN文本分类器训练样本裁剪方法 被引量:98
1
作者 李荣陆 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2004年第4期539-545,共7页
随着WWW的迅猛发展 ,文本分类成为处理和组织大量文档数据的关键技术 kNN方法作为一种简单、有效、非参数的分类方法 ,在文本分类中得到广泛的应用 但是这种方法计算量大 ,而且训练样本的分布不均匀会造成分类准确率的下降 针对kNN... 随着WWW的迅猛发展 ,文本分类成为处理和组织大量文档数据的关键技术 kNN方法作为一种简单、有效、非参数的分类方法 ,在文本分类中得到广泛的应用 但是这种方法计算量大 ,而且训练样本的分布不均匀会造成分类准确率的下降 针对kNN方法存在的这两个问题 ,提出了一种基于密度的kNN分类器训练样本裁剪方法 ,这种方法不仅降低了kNN方法的计算量 ,而且使训练样本的分布密度趋于均匀 ,减少了边界点处测试样本的误判 实验结果显示 。 展开更多
关键词 文本分类 kNN 快速分类
下载PDF
一种改进的kNN方法及其在文本分类中的应用 被引量:36
2
作者 孙丽华 张积东 李静梅 《应用科技》 CAS 2002年第2期25-27,共3页
介绍了基于kNN的文本分类方法 ,分析了kNN方法实质 ,指出了该方法的不足 ,然后提出了一种改进方法。改进方法是基于文本属性关联和概念共现等基础上提出来的。它实质上是强化了文本中语义链属性因子的作用 ,修正了次要因素的噪声影响 ,... 介绍了基于kNN的文本分类方法 ,分析了kNN方法实质 ,指出了该方法的不足 ,然后提出了一种改进方法。改进方法是基于文本属性关联和概念共现等基础上提出来的。它实质上是强化了文本中语义链属性因子的作用 ,修正了次要因素的噪声影响 ,使文本分类结果更加理想 ,已有的测试结果证明了这一点 ,尤其在测试文本与训练文本集中的某些文本直观上较相似时 。 展开更多
关键词 属性关联 改进kNN 文本分类
下载PDF
基于BP神经网络决策的KNN改进算法 被引量:19
3
作者 路敦利 宁芊 臧军 《计算机应用》 CSCD 北大核心 2017年第A02期65-67,88,共4页
针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进... 针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进行改进优化。首先,通过对训练样本使用K值不同的K近邻算法进行初步分类,同一数据会得到多个不同的初步分类结果集;然后将初步分类结果集作为BP神经网络的输入,再对BP神经网络进行训练分类。在多个数据集上的实验表明,基于BP神经网络决策的K近邻改进算法降低了K值对算法精度的影响,同时极大地提高了分类的准确率。 展开更多
关键词 k近邻 BP神经网络 算法精度 分类算法 k
下载PDF
隧道岩体质量智能动态分级KNN方法 被引量:18
4
作者 马世伟 李守定 +3 位作者 李晓 马立纲 李增林 张玉锋 《工程地质学报》 CSCD 北大核心 2020年第6期1415-1424,共10页
施工期隧道岩体质量动态分级,是评价隧道工作面围岩质量最直接的方法,也是预防隧道施工地质灾害,决定施工开挖工法与支护措施的重要依据。由于传统的Q值法和国标BQ岩体质量分级评价方法需要进行现场和室内试验及分析,岩体质量评价时间滞... 施工期隧道岩体质量动态分级,是评价隧道工作面围岩质量最直接的方法,也是预防隧道施工地质灾害,决定施工开挖工法与支护措施的重要依据。由于传统的Q值法和国标BQ岩体质量分级评价方法需要进行现场和室内试验及分析,岩体质量评价时间滞后,常常降低施工效率,或错过预防突发性施工地质灾害的窗口时间,快速准确地对隧道工作面进行岩体质量分级,成为施工期公路隧道岩体质量动态分级需要解决的重要问题。人工智能算法为解决隧道岩体质量实时快速准确评价提供了方法和手段。以北京冬奥会延庆—崇礼高速公路为例,提出了工作面采用隧道掌子面图片人工智能岩体结构参数辨识,建立7个指标参数体系,采用KNN智能算法对隧道岩体质量进行评价,选取8条隧道40个工作面150个样本进行训练学习,另外选取50个样本进行岩体质量评价校验,与BQ岩体质量评价结果相比,准确率达到了90%,得出如下结论:(1)公路隧道岩体质量智能动态分级KNN方法——一种利用人工智能技术快速高效进行岩体质量动态分级的方法,能够在现场实时获得岩体质量评价结果;(2)KNN分级方法中选用了7个判定指标,综合考虑了隧道围岩体的赋存环境、岩体构造、地质结构等特性,并体现了这些指标在实际工程评判中的可操作性和适用性;(3)KNN分级方法误判率很低,在判别分类中排除了评分时人为因素的干扰,具有较强的判别能力,为TBM围岩实时分级做方法储备。 展开更多
关键词 k近邻 隧道工程 岩体质量 分类
下载PDF
基于ELM-KNN算法的网络入侵检测模型 被引量:16
5
作者 顾兆军 李冰 刘涛 《计算机工程与设计》 北大核心 2018年第8期2412-2416,2421,共6页
针对传统神经网络算法在处理入侵检测问题时易陷入局部极小导致分类正确率不高的问题,提出基于极限学习机(ELM)特征映射的K最近邻(KNN)算法的网络入侵检测模型。利用ELM算法将低维输入空间中复杂线性不可分的样本投影到高维特征空间,使... 针对传统神经网络算法在处理入侵检测问题时易陷入局部极小导致分类正确率不高的问题,提出基于极限学习机(ELM)特征映射的K最近邻(KNN)算法的网络入侵检测模型。利用ELM算法将低维输入空间中复杂线性不可分的样本投影到高维特征空间,使其线性可分,用KNN算法对投影到高维特征空间的样本进行分类,建立入侵检测分类器。采用KDD Cup99数据集的仿真结果表明,相比其它入侵检测方法,基于ELM-KNN算法的入侵检测模型提高了入侵检测正确率。 展开更多
关键词 入侵检测 极限学习机 k最近邻算法 特征空间 分类问题
下载PDF
基于隐含语义的kNN文本分类研究 被引量:8
6
作者 李永平 程莉 叶卫国 《计算机工程与应用》 CSCD 北大核心 2004年第6期71-73,共3页
介绍了传统的kNN的文本分类方法,分析其实质,指出其不足,提出了一种基于隐含语义的改进方案,并结合实际给出实验结果。
关键词 kNN 奇异值分解 文本分类
下载PDF
基于改进贝叶斯分类法的电能质量扰动分类方法 被引量:8
7
作者 张文涛 王成山 《电网技术》 EI CSCD 北大核心 2007年第7期22-25,共4页
基于改进贝叶斯分类法提出了2种改进的暂态电能质量扰动分类方法。该分类方法保留了原贝叶斯分类法“最优分类”的性质,使原贝叶斯分类法转化为非参数分类法,扩大了分类法的适用范围,可对数量有限的交叉样本进行最优分类。采用交流暂态... 基于改进贝叶斯分类法提出了2种改进的暂态电能质量扰动分类方法。该分类方法保留了原贝叶斯分类法“最优分类”的性质,使原贝叶斯分类法转化为非参数分类法,扩大了分类法的适用范围,可对数量有限的交叉样本进行最优分类。采用交流暂态仿真软件对5种典型的电能质量扰动信号如电压振荡、电压中断等进行仿真和分类识别。对暂态电压扰动的分类结果表明,上述改进的暂态电能质量扰动分类方法分类特性良好、适用范围较广。 展开更多
关键词 电能质量 小波变换 贝叶斯分类法 k近邻法 扰动分类 交流暂态仿真软件
下载PDF
一种基于近邻元分析的文本分类算法 被引量:10
8
作者 刘丛山 李祥宝 杨煜普 《计算机工程》 CAS CSCD 2012年第15期139-141,共3页
在近邻元分析(NCA)算法的基础上,提出K近邻元分析分类算法K-NCA。利用NCA算法完成对训练样本集的距离测度学习和降维,定义类偏斜因子,引入K近邻思想,得到测试样本的类条件概率估计,并通过该概率进行类别判定,实现文本分类器功能。实验... 在近邻元分析(NCA)算法的基础上,提出K近邻元分析分类算法K-NCA。利用NCA算法完成对训练样本集的距离测度学习和降维,定义类偏斜因子,引入K近邻思想,得到测试样本的类条件概率估计,并通过该概率进行类别判定,实现文本分类器功能。实验结果表明,K-NCA算法的分类效果较好。 展开更多
关键词 近邻元分析 距离测度学习 降维 k近邻 文本分类
下载PDF
针对不平衡数据的改进的近邻分类算法 被引量:9
9
作者 王彩文 杨有龙 《计算机工程与应用》 CSCD 北大核心 2020年第7期30-38,共9页
针对不平衡数据分类问题,一种基于密度的近邻分类算法(DNN)被提出。它利用核密度估计敏锐地捕捉不平衡数据的局部分布特征,由此产生更好的分类结果。用核密度估计方法估计查询实例的各类别密度,以此对其进行密度定位;将原始数据空间中... 针对不平衡数据分类问题,一种基于密度的近邻分类算法(DNN)被提出。它利用核密度估计敏锐地捕捉不平衡数据的局部分布特征,由此产生更好的分类结果。用核密度估计方法估计查询实例的各类别密度,以此对其进行密度定位;将原始数据空间中的点映射到由类别密度和距离信息构成的空间;在这个映射空间中动态地选择近邻并对查询实例进行分类。实验结果表明,DNN算法在15个不平衡数据集上分类性能良好。 展开更多
关键词 k近邻算法 不平衡数据 分类算法 核密度估计
下载PDF
基于类标感知的KNN分类算法 被引量:5
10
作者 卞则康 张进 王士同 《模式识别与人工智能》 CSCD 北大核心 2021年第10期873-884,共12页
许多传统分类算法都以训练数据和测试数据具有相同或至少非常相似的分布为前提,但是在实际应用中,该前提很难得到保证,这降低支持向量机等传统分类算法的分类精度.因此,文中提出基于类标感知的KNN分类算法(CA-KNN).CA-KNN给出稀疏表示模... 许多传统分类算法都以训练数据和测试数据具有相同或至少非常相似的分布为前提,但是在实际应用中,该前提很难得到保证,这降低支持向量机等传统分类算法的分类精度.因此,文中提出基于类标感知的KNN分类算法(CA-KNN).CA-KNN给出稀疏表示模型,基于任何测试数据都可使用训练数据集进行稀疏表示的假设.CA-KNN可有效利用数据集上的类标信息,提升稀疏表示的准确性.引入KNN的最近邻分类思想,进一步提升CA-KNN的泛化能力,并且从理论上证明CA-KNN分类器与最小误差的Bayes决策规则关联.实验和理论分析的结果表明,CA-KNN具有较好的分类性能. 展开更多
关键词 类标感知 稀疏表示 k近邻分类 最小误差的Bayes决策规则
下载PDF
基于迭代分类的聚类结果改进方法 被引量:1
11
作者 王小华 楼佳 《计算机工程》 CAS CSCD 北大核心 2010年第13期27-29,共3页
综合考虑聚类、分类的特点,从聚类结果出发,学习并利用初始聚类结构信息形成训练集,结合迭代分类思想重新划分原数据集,提出一种基于迭代分类的聚类结果改进方法。实验结果表明该方法具有更高准确率,为获得良好的聚类效果提供了新思路。
关键词 聚类 聚类结果 迭代分类 k近邻分类
下载PDF
基于关系相似性的蛋白质交互作用识别 被引量:3
12
作者 王宇伟 牛耘 《计算机技术与发展》 2015年第2期42-46,共5页
针对目前蛋白质提取方法仅以单句信息为依据的不足,文中提出了以相似性为框架基于大规模文本的蛋白质交互关系识别方法。首先通过搜索医学文献数据库建立蛋白质对的签名档,然后提取签名档中的重要特征建立蛋白质对的向量空间模型,最后通... 针对目前蛋白质提取方法仅以单句信息为依据的不足,文中提出了以相似性为框架基于大规模文本的蛋白质交互关系识别方法。首先通过搜索医学文献数据库建立蛋白质对的签名档,然后提取签名档中的重要特征建立蛋白质对的向量空间模型,最后通过K近邻分类方法判断蛋白质对的交互关系。实验比较了向量空间模型下不同的距离度量策略对分类效果的影响,得出了比较合理的衡量相似性的函数。结果表明基于大规模文本采用基于余弦距离度量相似性的近邻方法识别蛋白质交互关系取得了较高且均衡的精确度和召回率,并且此方法直接利用了已有的交互信息,从而免除了额外的人工标注负担。 展开更多
关键词 关系相似性 蛋白质交互 空间向量模型 k近邻分类
下载PDF
基于K近邻分类算法的网络敏感信息自动过滤 被引量:2
13
作者 石小兵 《河北北方学院学报(自然科学版)》 2021年第11期1-6,共6页
目的为了提高网络敏感信息过滤能力,提出基于K近邻分类算法的网络敏感信息自动过滤方法。方法采用混合云构架技术对网络敏感信息云存储结构进行分析,根据敏感信息结构特征建立信息特征融合和空间特征压缩模型,采用自相关特征匹配方法实... 目的为了提高网络敏感信息过滤能力,提出基于K近邻分类算法的网络敏感信息自动过滤方法。方法采用混合云构架技术对网络敏感信息云存储结构进行分析,根据敏感信息结构特征建立信息特征融合和空间特征压缩模型,采用自相关特征匹配方法实现对网络敏感信息滤波和特征点标定,通过模糊度检测和云融合技术实现对信息的融合处理,采用K近邻分类算法构建网络敏感信息聚类和网格分块重组模型,实现对网络敏感信息自动过滤。结果仿真结果表明,该方法的网络敏感信息检测精度始终保持在90%以上,检测精度较高,且网络敏感信息过滤的吞吐量较高。结论可以有效提升网络敏感信息过滤能力,实际应用效果好。 展开更多
关键词 k近邻分类 网络敏感信息 自动过滤 自相关特征匹配方法
下载PDF
基于多阶导数拉曼光谱组合技术的矿物油模式分类 被引量:2
14
作者 卫辰洁 王继芬 +2 位作者 张波 董泽 管建皓 《分析测试学报》 CAS CSCD 北大核心 2021年第5期747-753,共7页
为了实现对法庭科学领域重质矿物油物证的快速、准确、无损的鉴定,该文基于光谱分析技术提出了一种多阶导数光谱数据组合分析的方法。收集了80种不同型号、不同厂家的重质矿物油样本,利用傅里叶变换拉曼光谱分析法采集样本的原始光谱数... 为了实现对法庭科学领域重质矿物油物证的快速、准确、无损的鉴定,该文基于光谱分析技术提出了一种多阶导数光谱数据组合分析的方法。收集了80种不同型号、不同厂家的重质矿物油样本,利用傅里叶变换拉曼光谱分析法采集样本的原始光谱数据和导数光谱数据,并通过结合化学计量学构建分类模型。在构建的主成分分析(PCA)结合径向基函数神经网络(RBF)分类模型中,对单独的原始光谱、一阶导数谱和二阶导数谱数据的训练集准确率分别为80.0%、86.7%和86.2%,测试集准确率分别为73.3%、80.0%和72.7%;对组合后的原始光谱+一阶导数谱、原始光谱+二阶导数谱和一阶导数谱+二阶导数谱数据的分类中,训练集准确率分别为97.0%、96.7%和100%,测试集准确率分别为85.7%、90.0%和100%。结果表明,对组合后的导数光谱与原始光谱构建分类模型,准确率更高。其中,基于一阶导数谱+二阶导数谱数据构建的PCA结合RBF分类模型的结果最为理想,准确率达100%。而K最近邻算法模型由于受到样本不均匀的影响,整体分类准确率均较低。利用组合的导数光谱与原始光谱数据构建分类模型能够实现对重质矿物油样本的快速、准确、无损鉴别,可为光谱组合技术在法庭科学及其他分析测试领域的应用提供一定的借鉴和参考。 展开更多
关键词 光谱学 重质矿物油 拉曼光谱 径向基函数神经网络(RBF) k最近邻算法 分类
下载PDF
基于CFS-KNN的双能X射线废金属特征优选与分类 被引量:1
15
作者 陈煜昊 叶文华 +1 位作者 徐祥 符杰 《有色金属工程》 CAS 北大核心 2023年第1期86-92,共7页
在基于双能X射线透射技术的废金属分选中,识别效果很大程度上受所选物料特征影响。已有废金属物料识别算法所用特征不够全面且各特征数据间冗余性较大,识别准确度不高。针对该问题,充分考虑特征间冗余性和特征与类别间关联性提出相关性... 在基于双能X射线透射技术的废金属分选中,识别效果很大程度上受所选物料特征影响。已有废金属物料识别算法所用特征不够全面且各特征数据间冗余性较大,识别准确度不高。针对该问题,充分考虑特征间冗余性和特征与类别间关联性提出相关性特征选择方法(CFS),在众多物料特征中确定由特征I_(H)、I_(L)、x、T_(ML)和T_(MH)组成的最优特征子集。通过采用不同物料特征组合方法进行对比实验,并选择最优特征子集下K-最近邻(KNN)作为最优分类模型。实验结果表明:基于相关性特征选择K-最近邻(CFS-KNN)的废有色金属物料识别分类方法与已有分类方法相比用相对较少的特征获得更高的识别准确度(96.13%)。 展开更多
关键词 特征选择 相关性 k-最近邻 废金属 分类
下载PDF
改进样本加权K近邻分类器用于垃圾网页检测 被引量:1
16
作者 吴俊华 谭博觉 +1 位作者 高切 陈木生 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第7期283-290,共8页
针对垃圾网页检测过程中的"维数灾难"和不平衡分类问题,提出一种融合最优Fisher特征选择的样本加权K近邻分类器用于垃圾网页检测。首先,针对训练数据集进行Fisher特征选择,按Fisher Score从大到小排序,依次选择Fisher Score... 针对垃圾网页检测过程中的"维数灾难"和不平衡分类问题,提出一种融合最优Fisher特征选择的样本加权K近邻分类器用于垃圾网页检测。首先,针对训练数据集进行Fisher特征选择,按Fisher Score从大到小排序,依次选择Fisher Score更大的特征对训练数据集进行样本加权的K近邻分类,根据训练数据集分类结果的AUC值是否增加以确定是否保留某个特征,最后基于保留的最优特征子集对测试数据集进行样本加权的K近邻分类。在WEBSPAM UK-2006数据集上的实验表明:该方法明显优于决策树、支持向量机、朴素贝叶斯、K近邻等传统分类器。与其他相关方法相比,该方法在准确率、F1测度和AUC指标上接近最优结果。 展开更多
关键词 垃圾网页检测 特征选择 k近邻 不平衡数据分类 代价敏感分析
下载PDF
基于压缩感知的^(252)Cf源驱动核材料浓度识别技术研究 被引量:1
17
作者 李鹏程 魏彪 +4 位作者 冯鹏 何鹏 周密 米德伶 任勇 《强激光与粒子束》 EI CAS CSCD 北大核心 2015年第7期172-177,共6页
针对252Cf源驱动噪声分析测量法中核材料浓度识别问题,采用压缩感知理论,在K最近邻(KNN)识别算法基础上,研究了一种基于压缩采样的K最近邻(CSKNN)分类识别方法,进而研究并分析了CSKNN方法的识别概率。实验结果表明,CSKNN分类识别方法只... 针对252Cf源驱动噪声分析测量法中核材料浓度识别问题,采用压缩感知理论,在K最近邻(KNN)识别算法基础上,研究了一种基于压缩采样的K最近邻(CSKNN)分类识别方法,进而研究并分析了CSKNN方法的识别概率。实验结果表明,CSKNN分类识别方法只需少量的观测值(观测比M/N≥0.1),即可达到分类识别的目的;当信噪比提高时,识别概率将会以更快的速度收敛至100%,且对K值的敏感程度也会随之降低。这样,不仅提高了核军控核查的实时性,而且还有效降低了采样成本,为核材料浓度的在线判读提供了一种新的理论基础和实现方法。 展开更多
关键词 252Cf源噪声分析法 压缩采样 观测比 k最近邻识别算法 识别概率
下载PDF
基于Haar小波变换的快速k-近邻分类算法 被引量:1
18
作者 乔玉龙 赵春晖 潘正祥 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第1期231-234,共4页
提出了一种新的快速k-近邻分类算法,通过研究Haar小波系数所包含的重要信息,确定向量经Haar小波变换得到的小波系数与向量方差间的关系,由此得出关于小波系数的不等式,并利用此不等式提高k-近邻分类中的k-近邻搜索效率。在搜索k-近邻的... 提出了一种新的快速k-近邻分类算法,通过研究Haar小波系数所包含的重要信息,确定向量经Haar小波变换得到的小波系数与向量方差间的关系,由此得出关于小波系数的不等式,并利用此不等式提高k-近邻分类中的k-近邻搜索效率。在搜索k-近邻的过程中,首先判断每个训练向量是否满足该不等式,由此排除许多不可能成为k-近邻的向量,从而可以快速找到待分类样本的k-近邻,使得在保持k-近邻法分类性能不变的情况下,分类的效率得到很大提高。最后,通过纹理分类验证了算法的有效性。 展开更多
关键词 通信技术 信号处理 小波变换 k-近邻分类器 纹理分类
下载PDF
基于异类近邻的支持向量机加速算法 被引量:1
19
作者 陈景年 胡顺祥 徐力 《计算机工程》 CAS CSCD 北大核心 2018年第5期19-24,共6页
支持向量机的训练时间随样本增多而明显增加。为了在保持训练效果的同时提高训练速度,给出精简训练数据集的一种算法。对每个样本,通过选择异类近邻来构成训练集,利用异类近邻来选择边界样本。实验结果表明,与FCNN算法和NPPS算法相比,... 支持向量机的训练时间随样本增多而明显增加。为了在保持训练效果的同时提高训练速度,给出精简训练数据集的一种算法。对每个样本,通过选择异类近邻来构成训练集,利用异类近邻来选择边界样本。实验结果表明,与FCNN算法和NPPS算法相比,该算法在保持甚至增进支持向量机分类效果的同时,能大幅提高训练效率。 展开更多
关键词 支持向量机 样本选择 k近邻 异类 分类
下载PDF
基于P-trees kNN算法的毒物分类方法
20
作者 曾志浩 胡积平 《软件》 2012年第4期105-107,111,共4页
中毒是一种发生机率较大、对人体危害大的病症,而及时明确诊断,正确、规范的治疗既是抢救成功的关键,又是至今没有很好解决的难题。毒物层出不穷,基层急救医生的毒物知识和中毒抢救知识又明显不足,因此临床急需一种辅助系统以帮助各级... 中毒是一种发生机率较大、对人体危害大的病症,而及时明确诊断,正确、规范的治疗既是抢救成功的关键,又是至今没有很好解决的难题。毒物层出不穷,基层急救医生的毒物知识和中毒抢救知识又明显不足,因此临床急需一种辅助系统以帮助各级急救医生提高中毒诊治水平及中毒抢救成功率。利用不同中毒表现对应不同毒物的权值向量构成"中毒表现加权向量表",并将它作为训练数据集的属性值。构建中毒表现加权向量表的P树,并选择HOBBit距离作为距离度量标准,运用P-trees kNN分类算法进行毒物分类。将该方法应用到毒物分类系统中,运行效果良好。 展开更多
关键词 k近邻算法 中毒分析系统 中毒表现加权向量表 P-树
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部