期刊文献+
共找到345篇文章
< 1 2 18 >
每页显示 20 50 100
文本分类中的特征降维方法综述 被引量:79
1
作者 陈涛 谢阳群 《情报学报》 CSSCI 北大核心 2005年第6期690-695,共6页
文本分类的关键是对高维的特征集进行降维.降维的主要方法是特征选择和特征提取.本文综述了已有的特征选择和特征抽取方法,评价了它们的优缺点和适用范围.
关键词 文本分类 特征 特征选择 特征提取
下载PDF
一类基于信息熵的多标签特征选择算法 被引量:62
2
作者 张振海 李士宁 +1 位作者 李志刚 陈昊 《计算机研究与发展》 EI CSCD 北大核心 2013年第6期1177-1184,共8页
在多标签分类问题中,特征选择是提升多标签分类器性能的一种重要手段.针对目前多标签特征选择算法计算复杂度大和无法给出一个合理的特征子集的问题,提出了一种基于信息熵的多标签特征选择算法.该算法假设特征之间相互独立,使用特征与... 在多标签分类问题中,特征选择是提升多标签分类器性能的一种重要手段.针对目前多标签特征选择算法计算复杂度大和无法给出一个合理的特征子集的问题,提出了一种基于信息熵的多标签特征选择算法.该算法假设特征之间相互独立,使用特征与标签集合之间的信息增益来衡量特征与标签集合之间的重要程度,并据此提出一种信息增益阈值选择方法.首先计算每一个特征与标签集合之间的信息增益,然后使用信息增益阈值选择算法得到一个合理的阈值,最后根据阈值删除不相关的特征,得到一组合理的特征子集.在2个不同分类器和4个多标签数据集上的实验结果表明:特征选择算法能够有效地提升多标签分类器的分类性能. 展开更多
关键词 物联网 数据处理 信息论 多标签分类 特征选择 信息增益 特征
下载PDF
基于自编码网络特征降维的轻量级入侵检测模型 被引量:57
3
作者 高妮 高岭 +1 位作者 贺毅岳 王海 《电子学报》 EI CAS CSCD 北大核心 2017年第3期730-739,共10页
基于支持向量机(SVM)的入侵检测方法受时间和空间复杂度约束,在高维特征空间计算时面临"维数灾害"的问题.为此,本文提出一种基于自编码网络的支持向量机入侵检测模型(AN-SVM).首先,该模型采用多层无监督的限制玻尔兹曼机(RBM... 基于支持向量机(SVM)的入侵检测方法受时间和空间复杂度约束,在高维特征空间计算时面临"维数灾害"的问题.为此,本文提出一种基于自编码网络的支持向量机入侵检测模型(AN-SVM).首先,该模型采用多层无监督的限制玻尔兹曼机(RBM)将高维、非线性的原始数据映射至低维空间,建立高维空间和低维空间的双向映射自编码网络结构,进而运用基于反向传播网络的自编码网络权值微调算法重构低维空间数据的最优高维表示,从而获得原始数据的相应最优低维表示;最后,采用SVM分类算法对所学习到的最优低维表示进行入侵识别.实验结果表明,AN-SVM模型降低了入侵检测模型中分类的训练时间和测试时间,并且分类效果优于传统算法,是一种可行且高效的轻量级入侵检测模型. 展开更多
关键词 特征 自编码网络 限制玻尔兹曼机 支持向量机 入侵检测
下载PDF
面向电力大数据的用户负荷特性和可调节潜力综合聚类方法 被引量:53
4
作者 孙毅 毛烨华 +2 位作者 李泽坤 张旭东 李飞 《中国电机工程学报》 EI CSCD 北大核心 2021年第18期6259-6270,共12页
深度探索用户负荷特性及可调节潜力是电力大数据背景下电力市场精细化发展的迫切需求。该文提出一种考虑用户负荷特性和可调节潜力的用户用电行为综合分类方法,适用于电力系统负荷数据量大、用户用电行为影响因素较多的情况。首先,通过... 深度探索用户负荷特性及可调节潜力是电力大数据背景下电力市场精细化发展的迫切需求。该文提出一种考虑用户负荷特性和可调节潜力的用户用电行为综合分类方法,适用于电力系统负荷数据量大、用户用电行为影响因素较多的情况。首先,通过面向电力大数据的用户用电行为影响因素多维分析,提出考虑用户负荷特性和可调节潜力的用电行为综合分析实施架构。其次,为实现考虑用户用电行为多维影响因素作用下的精准聚类,该文设计一种融合K-means和SOM进行二次聚类以及BP神经网络进行反向调整修正的综合聚类方法。最后,通过选取爱尔兰地区实测负荷数据及用户用电行为相关影响因素数据,验证该文所提分类方法的有效性和实用性,同时也证明该方法对于多场景下所具有的泛化能力。 展开更多
关键词 电力大数据 负荷特性 特征 神经网络 可调节潜力
下载PDF
文本分类中的特征降维方法研究 被引量:36
5
作者 张玉芳 万斌候 熊忠阳 《计算机应用研究》 CSCD 北大核心 2012年第7期2541-2543,共3页
特征降维是文本分类过程中的一个重要环节,为了提高特征降维的准确率,选出能有效区分文本类别的特征词,提高文本分类的效果,提出了结合文本类间集中度、文本类内分散度和词频类间集中度的特征降维方法。当获取特征词在文本集上的整体评... 特征降维是文本分类过程中的一个重要环节,为了提高特征降维的准确率,选出能有效区分文本类别的特征词,提高文本分类的效果,提出了结合文本类间集中度、文本类内分散度和词频类间集中度的特征降维方法。当获取特征词在文本集上的整体评价时,提出了一种新的全局评估函数,用最大值与次大值之差作为最终的评价函数值。实验比较了该方法与传统的特征降维方法,结果表明该方法在中文文本分类中具有较好的降维效果。 展开更多
关键词 文本分类 特征 集中度 分散度 评估函数
下载PDF
顾及空间上下文关系的JointBoost点云分类及特征降维 被引量:33
6
作者 郭波 黄先锋 +1 位作者 张帆 王晏民 《测绘学报》 EI CSCD 北大核心 2013年第5期715-721,共7页
针对较复杂场景的点云自动分类方法中目标类别为地面、植被、建筑物、电力塔、电力线等的问题,在对数据进行粗差剔除的基础上,首先归纳、定义了点云分类所需的关键特征,并利用JointBoost实现地物分类;同时,考虑到点云数据量大,其分类速... 针对较复杂场景的点云自动分类方法中目标类别为地面、植被、建筑物、电力塔、电力线等的问题,在对数据进行粗差剔除的基础上,首先归纳、定义了点云分类所需的关键特征,并利用JointBoost实现地物分类;同时,考虑到点云数据量大,其分类速度较慢,通过结合地物空间上的相互关联关系,提出一种序列化的点云分类及特征降维方法。该方法在保证分类精度的前提下,使分类所需特征维数降低,缩短了分类所需时间。激光扫描点云数据分类试验证明了该分类方法的有效性。 展开更多
关键词 LIDAR 点云分类 Joi ntBoost 空间上下文 特征
下载PDF
语音情感特征提取及其降维方法综述 被引量:30
7
作者 刘振焘 徐建平 +5 位作者 吴敏 曹卫华 陈略峰 丁学文 郝曼 谢桥 《计算机学报》 EI CSCD 北大核心 2018年第12期2833-2851,共19页
情感智能是人工智能的重要发展方向,随着人工智能的迅速发展,情感智能已成为当前人机交互领域的研究热点.语音情感是人们相互情感交流最直接、最高效的途径,越来越多的研究者投入到语音情感识别的研究中.该文综述了国内外近几年语音情... 情感智能是人工智能的重要发展方向,随着人工智能的迅速发展,情感智能已成为当前人机交互领域的研究热点.语音情感是人们相互情感交流最直接、最高效的途径,越来越多的研究者投入到语音情感识别的研究中.该文综述了国内外近几年语音情感特征提取及降维领域的最新进展.首先,介绍了语音情感识别中常用的特征,将语音特征分为韵律特征、基于谱的特征等,并提出以个性化与非个性化的方式对语音情感特征进行分类.然后,对其中广泛应用的特征提取方法进行了详细地比较与分析,阐述了各类方法的优缺点,并对最新的基于深度学习方法的语音特征提取的相关研究进行了介绍.同时,介绍了常用的语音情感特征降维方法,并在此基础上分析了这些特征降维方法时间复杂度,对比了各类方法的优缺点.最后,对当前语音情感识别领域的研究现状与难点进行了讨论与展望. 展开更多
关键词 语音 情感特征提取 非个性化特征 特征分类 特征 情感智能
下载PDF
KNN分类算法改进研究进展 被引量:28
8
作者 奉国和 吴敬学 《图书情报工作》 CSSCI 北大核心 2012年第21期97-100,118,共5页
指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征项以及近邻样本,影响分类准确程度。针对第一点不足,提出三种改进策略,分别为:基于特征降维的改进、基于... 指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征项以及近邻样本,影响分类准确程度。针对第一点不足,提出三种改进策略,分别为:基于特征降维的改进、基于训练集的改进和基于近邻搜索方法的改进;针对第二点不足,提出两种改进策略,分别为:基于特征加权的改进和基于类别判断策略的改进。对每种改进策略中的代表方法进行介绍并加以评述。 展开更多
关键词 KNN分类 特征 特征加权 训练集优化 快速算法
原文传递
一种改进的KNN文本分类 被引量:27
9
作者 钟将 刘荣辉 《计算机工程与应用》 CSCD 2012年第2期142-144,共3页
在文本分类中,文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题,提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理;利用基于样本密度的改进的KNN分类器进行分类。实验结果表... 在文本分类中,文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题,提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理;利用基于样本密度的改进的KNN分类器进行分类。实验结果表明提出的方法能够收到较好的分类效果。 展开更多
关键词 特征 潜在语义分析 K-最近邻法 文本分类
下载PDF
利用PCA进行深度学习图像特征提取后的降维研究 被引量:25
10
作者 杨博雄 杨雨绮 《计算机系统应用》 2019年第1期279-283,共5页
深度学习是当前人工智能领域广泛使用的一种机器学习方法.深度学习对数据的高度依赖性使得数据需要处理的维度剧增,极大地影响了计算效率和数据分类性能.本文以数据降维为研究目标,对深度学习中的各种数据降维方法进行分析.在此基础上,... 深度学习是当前人工智能领域广泛使用的一种机器学习方法.深度学习对数据的高度依赖性使得数据需要处理的维度剧增,极大地影响了计算效率和数据分类性能.本文以数据降维为研究目标,对深度学习中的各种数据降维方法进行分析.在此基础上,以Caltech 101图像数据集为实验对象,采用VGG-16深度卷积神经网络进行图像的特征提取,以PCA主成分分析方法为例来实现高维图像特征数据的降维处理.在实验阶段,采用欧氏距离作为相似性度量来检验经过降维处理后的精度指标.实验证明:当提取VGG-16神经网络fc3层的4096维特征后,使用PCA法将数据维度降至64维,依然能够保持较高的特征信息. 展开更多
关键词 深度学习 卷积神经网络 主成分分析法 特征
下载PDF
基于改进的稀疏去噪自编码器的入侵检测 被引量:22
11
作者 郭旭东 李小敏 +1 位作者 敬如雪 高玉琢 《计算机应用》 CSCD 北大核心 2019年第3期769-773,共5页
针对传统浅层的入侵检测方法无法有效解决高维网络入侵数据的问题,提出了一种基于堆叠稀疏去噪自编码器(SSDA)的入侵检测方法。首先,利用SSDA对入侵数据进行降维操作;然后,将高度抽象后的低维数据作为输入,利用softmax分类器进行入侵检... 针对传统浅层的入侵检测方法无法有效解决高维网络入侵数据的问题,提出了一种基于堆叠稀疏去噪自编码器(SSDA)的入侵检测方法。首先,利用SSDA对入侵数据进行降维操作;然后,将高度抽象后的低维数据作为输入,利用softmax分类器进行入侵检测;最后,又在SSDA方法的基础之上提出了一种改进模型(ISSDA),即在传统稀疏去噪自编码器的基础上增加新的约束条件,以此来提高深度网络对原始入侵数据的解码能力以及模型的入侵检测性能。实验结果证明,ISSDA方法与SSDA方法相比,对4种类型的攻击的检测准确率提高了将近5%,也有效地降低了误报率。 展开更多
关键词 自编码网络 稀疏去噪 入侵检测 特征 softmax
下载PDF
文本分类研究综述 被引量:21
12
作者 汪岿 刘柏嵩 《数据通信》 2019年第3期37-47,共11页
在大数据时代,网络上的文本数据日益增长。采用文本分类技术对海量数据进行科学地组织和管理显得尤为重要。文本分类算法的研究起源于上个世纪50年代,一直受到科研人员的广泛关注。本文围绕文本分类的关键技术和基本流程进行重点阐述,... 在大数据时代,网络上的文本数据日益增长。采用文本分类技术对海量数据进行科学地组织和管理显得尤为重要。文本分类算法的研究起源于上个世纪50年代,一直受到科研人员的广泛关注。本文围绕文本分类的关键技术和基本流程进行重点阐述,主要包括文本预处理、词和文本的分布式表示、特征降维、分类算法等多个模块。其中详细分析了几种分类模型与分类方法,如深度学习、迁移学习、强化学习等等。此外,本文简单介绍了文本分类的评价指标与应用场景,并对当前面临的挑战及未来的发展趋势进行总结、预测。 展开更多
关键词 文本分类 特征 机器学习
下载PDF
基于知网语义相似度计算的特征降维方法研究 被引量:16
13
作者 唐歆瑜 乐文忠 +1 位作者 李志成 李军义 《科学技术与工程》 2006年第21期3442-3446,共5页
针对文本分类处理中的高维度问题,结合知网语义词典,提出了一种新的特征降维处理方法。通过计算特征词汇之间的语义相似度,将原有特征集分成若干特征词集;同一词集内的特征词语义彼此间相似;而不同词集的特征词彼此间相似度比较小。将... 针对文本分类处理中的高维度问题,结合知网语义词典,提出了一种新的特征降维处理方法。通过计算特征词汇之间的语义相似度,将原有特征集分成若干特征词集;同一词集内的特征词语义彼此间相似;而不同词集的特征词彼此间相似度比较小。将同一特征词集内的词汇权重相加,从而突出同义词以及近义词对文本分类的贡献,并可以大大降低文本比较的特征维数。实验结果表明,利用该方法在文本分类中得到了较好的分类准确率和分类性能。 展开更多
关键词 特征 文本分类 知网
下载PDF
基于多维气象数据和PCA-BP神经网络的光伏发电功率预测 被引量:21
14
作者 刘俊 王旭 +4 位作者 郝旭东 陈业夫 丁坤 汪宁渤 牛拴保 《电网与清洁能源》 北大核心 2017年第1期122-129,共8页
太阳能光伏发电受很多随机因素的影响,这使得光伏系统输出功率具有不确定性的特点。光伏系统输出功率的精确预测对电力系统的未来规划、调度管理和运行控制有着重要意义。通过多个渠道搜集多维数的历史气象数据,同时将天气类型分为无云... 太阳能光伏发电受很多随机因素的影响,这使得光伏系统输出功率具有不确定性的特点。光伏系统输出功率的精确预测对电力系统的未来规划、调度管理和运行控制有着重要意义。通过多个渠道搜集多维数的历史气象数据,同时将天气类型分为无云、有云、多云和雨天4类;然后基于反向传播(back propagation,BP)神经网络建立不同气象条件下的光伏发电功率预测模型;最后利用主成分分析(principal component analysis,PCA)对原始气象特征数据进行降维分析和处理,以提高计算速度和精度。仿真算例结果验证了所建立的光伏发电功率预测模型的有效性,而且PCA降维能够降低训练,减少预测的计算时间,并提高预测精度,这表明PCA能适用于未来海量气象大数据下光伏电站短期、超短期的分钟级实时功率预测。 展开更多
关键词 BP神经网络 光伏发电功率预测 气象大数据 特征 主成分分析
下载PDF
结合注意力机制的深度学习图像目标检测 被引量:19
15
作者 孙萍 胡旭东 张永军 《计算机工程与应用》 CSCD 北大核心 2019年第17期180-184,共5页
利用卷积神经网络进行目标检测时,提取的卷积特征具有很强的平移不变性,这将削弱模型的定位性能。事实上,目标对象通常具有不同的子区域特征和宽高比特性,但在目前流行的两阶段目标检测框架中,很少考虑这些具有平移尺度敏感性的特征成... 利用卷积神经网络进行目标检测时,提取的卷积特征具有很强的平移不变性,这将削弱模型的定位性能。事实上,目标对象通常具有不同的子区域特征和宽高比特性,但在目前流行的两阶段目标检测框架中,很少考虑这些具有平移尺度敏感性的特征成分。为了优化模型的特征表达,将在两阶段目标检测框架中引入与子区域特征和宽高比特性相关的注意力特征库,并生成注意力特征图对原始的ROI池化特征进行优化。另外,在注意力特征图的辅助下,模型特征维度可以有效地进行缩减。实验结果表明,引入注意力模块后,模型的检测精度和检测速度有明显提升。 展开更多
关键词 目标检测 卷积神经网络(CNN) 注意力机制 特征
下载PDF
基于类别分布的特征选择框架 被引量:18
16
作者 靖红芳 王斌 +1 位作者 杨雅辉 徐燕 《计算机研究与发展》 EI CSCD 北大核心 2009年第9期1586-1593,共8页
目前已有很多种特征选择方法,但就目前所知,没有一种方法能够在非平衡语料上取得很好的效果.依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能够利用特征的分布信息选出具有较强区分能力的特征,同时允许给类别灵... 目前已有很多种特征选择方法,但就目前所知,没有一种方法能够在非平衡语料上取得很好的效果.依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能够利用特征的分布信息选出具有较强区分能力的特征,同时允许给类别灵活地分配权重,分配较大的权重给稀有类别则提高稀有类别的分类效果,所以它适用于非平衡语料,也具有很好的扩展性.另外,OCFS和基于类别分布差异的特征过滤可以看作该框架的特例.实现该框架得到了具体的特征选择方法,Retuers-21578语料及复旦大学语料等两个非平衡语料上的实验表明,它们的Macro和Micro F1效果都优于IG,CHI和OCFS. 展开更多
关键词 特征选择 非平衡语料 特征 文本分类 数据挖掘
下载PDF
基于高光谱成像的青梅酸度检测方法 被引量:18
17
作者 赵茂程 杨君荣 +2 位作者 陆丹丹 曹瑾 陈一鸣 《农业机械学报》 EI CAS CSCD 北大核心 2017年第9期318-323,共6页
针对传统理化分析的青梅酸度检测方法破坏性大、耗时长、无法实现在线检测的不足,对基于高光谱成像技术的青梅酸度快速无损检测方法进行研究。采集了487个青梅样本在550~1 000 nm波段内的高光谱图像,经过光谱相对反射率校正和6种不同滤... 针对传统理化分析的青梅酸度检测方法破坏性大、耗时长、无法实现在线检测的不足,对基于高光谱成像技术的青梅酸度快速无损检测方法进行研究。采集了487个青梅样本在550~1 000 nm波段内的高光谱图像,经过光谱相对反射率校正和6种不同滤波后,分别利用连续投影算法(SPA)、遗传算法(GA)以及连续投影结合遗传算法(SPA+GA)3种光谱降维方法,提取了反映青梅内部酸度信息的特征波长,并建立波长与青梅p H值的偏最小二乘(PLS)预测模型,研究不同滤波和不同降维方法下的预测精度。研究结果表明:同一预测模型,Savitzky-Golay(S-G)平滑滤波预测精度最高;相比SPA或GA单一算法降维,经5点S-G平滑滤波后SPA+GA光谱降维的方法,可显著降低模型复杂度,提高模型预测精度,预测集的均方根误差为0.070 6,相关系数为0.792 5。 展开更多
关键词 青梅 酸度 高光谱图像 遗传算法 连续投影法 特征
下载PDF
一种面向主题的领域服务聚类方法 被引量:17
18
作者 李征 王健 +3 位作者 张能 李昭 何成万 何克清 《计算机研究与发展》 EI CSCD 北大核心 2014年第2期408-419,共12页
随着互联网上服务资源规模的快速增长,如何高效、准确地发现服务成为一个亟待解决的关键问题.服务聚类是促进服务发现的一种重要技术.但是,现有服务聚类方法只对单一类型的服务文档进行聚类,并且没有考虑服务的领域特性.针对该问题,在... 随着互联网上服务资源规模的快速增长,如何高效、准确地发现服务成为一个亟待解决的关键问题.服务聚类是促进服务发现的一种重要技术.但是,现有服务聚类方法只对单一类型的服务文档进行聚类,并且没有考虑服务的领域特性.针对该问题,在对服务进行领域分类的基础上,提出了一种基于概率、融合领域特性的服务聚类模型——领域服务聚类模型(domain service clustering model,DSCM),然后基于该模型提出了一种面向主题的服务聚类方法.最后通过ProgrammableWeb网站提供的真实服务集对提出的方法进行了验证.实验结果表明,该方法可以准确地对不同类型的服务文档进行聚类.与经典的潜在狄利克雷分配(latent Dirichlet allocation,LDA),K-means等方法相比,该方法在聚类纯度和F-measure指标上均具有更好的效果,从而为按需服务发现与服务组合提供更好的支持. 展开更多
关键词 服务聚类 潜在狄利克雷分配 主题 概率 特征
下载PDF
文本分类特征降维研究综述 被引量:16
19
作者 奉国和 郑伟 《图书情报工作》 CSSCI 北大核心 2011年第9期109-113,共5页
特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每... 特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每种方法的优势与不足,总结出相应改进算法。 展开更多
关键词 文本分类 特征 特征选择 特征抽取
原文传递
语音情感识别研究综述 被引量:16
20
作者 高庆吉 赵志华 +1 位作者 徐达 邢志伟 《智能系统学报》 CSCD 北大核心 2020年第1期1-13,共13页
针对语音情感识别研究体系进行综述。这一体系包括情感描述模型、情感语音数据库、特征提取与降维、情感分类与回归算法4个方面的内容。本文总结离散情感模型、维度情感模型和两模型间单向映射的情感描述方法;归纳出情感语音数据库选择... 针对语音情感识别研究体系进行综述。这一体系包括情感描述模型、情感语音数据库、特征提取与降维、情感分类与回归算法4个方面的内容。本文总结离散情感模型、维度情感模型和两模型间单向映射的情感描述方法;归纳出情感语音数据库选择的依据;细化了语音情感特征分类并列出了常用特征提取工具;最后对特征提取和情感分类与回归的常用算法特点进行凝练并总结深度学习研究进展,并提出情感语音识别领域需要解决的新问题、预测了发展趋势。 展开更多
关键词 深度学习 情感语音数据库 情感描述模型 语音情感特征 特征提取 特征 情感分类 情感回归
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部