期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
高维数据的降维方法研究及其应用 被引量:3
1
作者 杨质敏 《长沙大学学报》 2003年第2期58-61,共4页
讨论了高维数据的降维方法及应用 ,采用进制分解的方法将数字图像无损转化为二值图像 ,从而将原图像的处理转化为对二值图像的处理 .从理论上 ,论证了二值图像的无损性 ,以此为根据对二值图像进行了相应的分析 ,包括压缩、图像分析。
关键词 高维数据 降维 二值图像 进制分解
下载PDF
基于降维BP神经网络的高维数据分类研究 被引量:7
2
作者 康辉英 李明亮 《计算机工程与应用》 CSCD 2013年第20期183-187,共5页
为确保高维数据的神经网络分类精度,提出了先降维后分类的方法。采用主成分分析(PCA)法实现高维数据的降维。通过分析传统BP算法,提出分两步来更新网络权值的扰动BP学习方法。采用MATLAB对降维分类算法的分类精度和误差收敛速度进行分... 为确保高维数据的神经网络分类精度,提出了先降维后分类的方法。采用主成分分析(PCA)法实现高维数据的降维。通过分析传统BP算法,提出分两步来更新网络权值的扰动BP学习方法。采用MATLAB对降维分类算法的分类精度和误差收敛速度进行分析。仿真结果显示:先降维再采用扰动BP网络进行高维数据分类可大大提高数据的分类精度和训练速度。 展开更多
关键词 高维数据 神经网络 反向传播(BP)算法 高阶微分 扰动反向传播(BP)
下载PDF
一种适合于科学数据的聚类算法 被引量:3
3
作者 李欣宇 傅彦 《成都信息工程学院学报》 2006年第3期327-330,共4页
聚类是科学数据挖掘中的核心问题。在已提出的聚类算法中大都是基于“距离”的概念,这类算法的缺点在于处理数据量大和维数高的科学数据时不够有效,因此提出迭代网格算法。这个算法与基于距离的损法有根本不同,它抛弃了距离的概念,而采... 聚类是科学数据挖掘中的核心问题。在已提出的聚类算法中大都是基于“距离”的概念,这类算法的缺点在于处理数据量大和维数高的科学数据时不够有效,因此提出迭代网格算法。这个算法与基于距离的损法有根本不同,它抛弃了距离的概念,而采取一种新的思路。它不仅能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;而且它能很好的处理维数高和数据量大的科学数据。 展开更多
关键词 科学数据挖掘 聚类分析 网格 密度 高维数据
下载PDF
基于投影最近邻的海量高维数据查询算法 被引量:1
4
作者 李晓飞 赵成伟 韩松任 《信息记录材料》 2017年第12期1-2,共2页
高维大数据中如何快速查询有用信息是目前面临的问题之一。为了解决维度灾难带来的问题,本文分析了传统的相似性度量函数,然后进行了改进,提出了的新算法能够应用到高维数据空间,仿真实验表明,该算法在高维空间中查询的精确度优于其他... 高维大数据中如何快速查询有用信息是目前面临的问题之一。为了解决维度灾难带来的问题,本文分析了传统的相似性度量函数,然后进行了改进,提出了的新算法能够应用到高维数据空间,仿真实验表明,该算法在高维空间中查询的精确度优于其他传统距离函数,并对噪音有抵抗性。 展开更多
关键词 数据查询 高维数据 最近邻
下载PDF
Unsupervised Feature Selection Using Structured Self-Representation
5
作者 Yanbei Liu Kaihua Liu +2 位作者 Xiao Wang Changqing Zhang Xianchao Tang 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2018年第3期62-73,共12页
Unsupervised feature selection has become an important and challenging problem faced with vast amounts of unlabeled and high-dimension data in machine learning. We propose a novel unsupervised feature selection method... Unsupervised feature selection has become an important and challenging problem faced with vast amounts of unlabeled and high-dimension data in machine learning. We propose a novel unsupervised feature selection method using Structured Self-Representation( SSR) by simultaneously taking into account the selfrepresentation property and local geometrical structure of features. Concretely,according to the inherent selfrepresentation property of features,the most representative features can be selected. Mean while,to obtain more accurate results,we explore local geometrical structure to constrain the representation coefficients to be close to each other if the features are close to each other. Furthermore,an efficient algorithm is presented for optimizing the objective function. Finally,experiments on the synthetic dataset and six benchmark real-world datasets,including biomedical data,letter recognition digit data and face image data,demonstrate the encouraging performance of the proposed algorithm compared with state-of-the-art algorithms. 展开更多
关键词 unsupervised feature selection local geometrical structure self-representation property high-dimension data
下载PDF
高维数据下MANOVA检验 被引量:1
6
作者 曹明响 徐兴忠 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第8期868-871,共4页
对于高维MANOVA假设检验问题,文章提出了一种新的检验统计量,且对数据的维数和个数的关系没有限制;在一般条件下,分别得到了新检验统计量在原假设和局部备择假设下的渐近分布.模拟结果表明新的检验具有一定的优势.
关键词 高维数据 MANOVA 假设检验 渐近分布
下载PDF
基于L0约束的稀疏子空间聚类 被引量:1
7
作者 帅惠 袁晓彤 刘青山 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第1期23-30,共8页
大数据时代背景下,随着所获数据数量和维度的不断增加,高维数据的处理成为聚类分析的重点和难点.基于同一类别高维数据通常分布在高维环绕空间的低维子空间这一事实,子空间聚类成为高维数据聚类分析领域的重要方法.稀疏子空间聚类(Spars... 大数据时代背景下,随着所获数据数量和维度的不断增加,高维数据的处理成为聚类分析的重点和难点.基于同一类别高维数据通常分布在高维环绕空间的低维子空间这一事实,子空间聚类成为高维数据聚类分析领域的重要方法.稀疏子空间聚类(Sparse Space Clustering,SSC)通过交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)对数据矩阵的稀疏自表达系数进行求解,发现分布于低维子空间并集中的数据的稀疏表示并进行聚类.但是ADMM参数多、收敛速度慢,其效率难以满足对大规模数据库进行聚类分析的要求.针对这一问题提出了基于L_0约束的稀疏子空间聚类方法,该方法使用正交匹配追踪(Orthogonal Matching Pursuit,OMP)算法求解L_0约束的自表达稀疏重建问题,构建数据集中各数据之间的相关性矩阵,最终对相关性矩阵应用谱聚类方法得到聚类结果.根据OMP算法每次迭代之间的耦合关系对其进行优化,进一步降低了计算复杂度,提高了算法效率.在生成数据和Extended Yale B database人脸数据库的实验结果表明,该算法与SSC相比,在显著减少计算时间的基础上,取得了与SSC相当的聚类准确率. 展开更多
关键词 高维数据处理 稀疏子空间聚类 交替方向乘子法 谱聚类 L0约束 正交匹配追踪
下载PDF
考虑稳定性要求的特征选择方法
8
作者 季金胜 郭艺友 +1 位作者 霍宏 方涛 《高技术通讯》 CAS CSCD 北大核心 2014年第11期1203-1209,共7页
为了提高特征选择的稳定性和降低因样本数据变化引起的选择结果波动,提出了一种考虑稳定性要求的过滤式特征选择方法。不同于集成特征选择等现有的增强稳定性方法,该方法将特征的稳定性与相关性、冗余性一起作为特征评价准则,通过产生... 为了提高特征选择的稳定性和降低因样本数据变化引起的选择结果波动,提出了一种考虑稳定性要求的过滤式特征选择方法。不同于集成特征选择等现有的增强稳定性方法,该方法将特征的稳定性与相关性、冗余性一起作为特征评价准则,通过产生多个数据集来减少样本数据扰动,不断将新产生的选择结果迭代计算稳定性因子,并同时提高其在准则中的比重以使迭代收敛。最终将融合多次迭代信息的特征排序作为最终结果输出。实验表明,该方法能够在保持相当分类精度的基础上,能够较大幅度地提高选择结果的稳定性,达到兼顾分类精度与稳定性的目的。 展开更多
关键词 特征选择 相关性 冗余性 稳定性 高维数据
下载PDF
基于稀疏正则化的高维数据可视化分析技术 被引量:4
9
作者 陈海辉 周向东 施伯乐 《计算机应用与软件》 2017年第6期22-26,119,共6页
高维数据可视化分析是数据分析与可视化领域的研究热点,传统的降维方法得到的低维空间往往难以解释,不利于人们对高维数据的可视化分析与探索。提出一种新的可视化解释器(Explainer)方法,将L1稀疏正则化特征选取引入到高维数据的可视化... 高维数据可视化分析是数据分析与可视化领域的研究热点,传统的降维方法得到的低维空间往往难以解释,不利于人们对高维数据的可视化分析与探索。提出一种新的可视化解释器(Explainer)方法,将L1稀疏正则化特征选取引入到高维数据的可视化处理过程中,建立起高层语义标签与少量的关键特征之间的联系。通过可视化设计与实验验证了该方法可以有效改善高维数据的可视化分析性能。 展开更多
关键词 高维数据 特征选取 稀疏学习 可视化分析 降维 投影
下载PDF
采用高维数据聚类的目标跟踪(英文) 被引量:2
10
作者 邵春艳 丁庆海 +1 位作者 罗海波 李玉莲 《红外与激光工程》 EI CSCD 北大核心 2016年第4期258-267,共10页
根据刚体各部位具有变换一致性这一特性,提出一种采用高维数据聚类的目标跟踪方法。从数学理论方面证明提出的度量方法可以应用于目标跟踪,称其为高维数据聚类跟踪器(HDDCtracker)。该算法框架如下,首先,采用Harris检测器对模板与跟踪... 根据刚体各部位具有变换一致性这一特性,提出一种采用高维数据聚类的目标跟踪方法。从数学理论方面证明提出的度量方法可以应用于目标跟踪,称其为高维数据聚类跟踪器(HDDCtracker)。该算法框架如下,首先,采用Harris检测器对模板与跟踪区域进行特征提取;然后利用这些特征的空间信息对所提取的特征进行编组;接着计算模板特征组与跟踪区域特征组间的仿射变换阵;最后,采用高维数据聚类对这些仿射变换阵进行度量,将那些相似仿射阵对应的跟踪区域作为跟踪目标。实验表明:HDDC tracker能够有效地跟踪具有仿射形变的目标,并且性能优于先进跟踪算法。 展开更多
关键词 高维数据聚类 仿射形变 目标跟踪 刚体
下载PDF
基于概要数据结构的高维数据流聚类算法
11
作者 王冬秀 李辉 《广西工学院学报》 CAS 2011年第4期59-64,共6页
为了在高维数据流中有效地形成聚类,针对经典算法CELL-Tree存在的问题,提出一种新的概要数据结构PL-Tree以及基于此数据结构的算法PLStream,并采取衰减窗口模式来适应数据流的变化,采用剪枝策略控制内存中聚类模型的规模.实验表明,PLStr... 为了在高维数据流中有效地形成聚类,针对经典算法CELL-Tree存在的问题,提出一种新的概要数据结构PL-Tree以及基于此数据结构的算法PLStream,并采取衰减窗口模式来适应数据流的变化,采用剪枝策略控制内存中聚类模型的规模.实验表明,PLStream算法能较好地适应高维数据流,比CELL-Tree算法具有更好的时间和空间效率. 展开更多
关键词 概要数据结构 高维数据流 聚类
下载PDF
数据降维技术研究现状及其进展 被引量:24
12
作者 毕达天 邱长波 张晗 《情报理论与实践》 CSSCI 北大核心 2013年第2期125-128,共4页
数据挖掘主要用于从原始数据资料中挖掘有用的信息,而这些数据资料的维数已经对目前大多数数据挖掘算法的效率造成了严重的阻碍,这种阻碍被称之为"维数灾难"。数据降维技术可以有效地解决这一问题。文章以数据降维方法为主线... 数据挖掘主要用于从原始数据资料中挖掘有用的信息,而这些数据资料的维数已经对目前大多数数据挖掘算法的效率造成了严重的阻碍,这种阻碍被称之为"维数灾难"。数据降维技术可以有效地解决这一问题。文章以数据降维方法为主线,对数据降维问题的分类进行了描述,对数据降维方法的研究现状及主要算法进行了详细的阐述,对数据降维算法最新研究进展进行了简要介绍,并指出其优缺点,最后提出了数据降维技术今后的研究方向。 展开更多
关键词 数据挖掘 高维数据 降维 研究现状 研究进展
原文传递
一种基于局部密度的分布式聚类挖掘算法 被引量:19
13
作者 倪巍伟 陈耿 +1 位作者 吴英杰 孙志挥 《软件学报》 EI CSCD 北大核心 2008年第9期2339-2348,共10页
分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的... 分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的分布式聚类算法——LDBDC(local density based distributed clustering).算法适用于含噪声数据和数据分布异常情况,对高雏数据有着良好的适应性.理论分析和实验结果表明,LDBDC算法在聚类质量和算法效率方面优于已有的DBDC算法和SDBDC(scalable dellsity-based distributed clustering)算法.算法是有效、可行的. 展开更多
关键词 分布式聚类 局部密度聚类局部聚类模型 密度吸引子 高维数据
下载PDF
基于LSH的中文文本快速检索 被引量:13
14
作者 蔡衡 李舟军 +1 位作者 孙健 李洋 《计算机科学》 CSCD 北大核心 2009年第8期201-204,230,共5页
目前,高维数据的快速检索问题已经受到越来越多的关注。当向量空间的维度高于10时,R-tree,Kd-tree,SR-tree的检索效率反而不如线性检索,而位置敏感的哈希(Locality Sensitive Hashing,缩写为LSH)算法成功地解决了高维近邻数据的快速检... 目前,高维数据的快速检索问题已经受到越来越多的关注。当向量空间的维度高于10时,R-tree,Kd-tree,SR-tree的检索效率反而不如线性检索,而位置敏感的哈希(Locality Sensitive Hashing,缩写为LSH)算法成功地解决了高维近邻数据的快速检索问题,因而受到国内外学术界的高度关注。首先介绍了LSH算法的基本原理和方法,然后使用多重探测的方法对二进制向量的LSH算法做了进一步改进。最后实现了这两种LSH算法,并通过详细的实验验证表明:在改进后的算法中,通过增加偏移量可以提高检索的召回率,而在不提高时间复杂度的情况下则可降低空间复杂度。 展开更多
关键词 高维数据 相似性检索 位置敏感的哈希 近邻 多重探测
下载PDF
大数据环境下高维数据的快速重复检测方法 被引量:12
15
作者 朱蔚恒 印鉴 +2 位作者 邓玉辉 龙舜 邱诗定 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期559-570,共12页
大数据时代多源、异构、海量的数据正逐渐成为各种应用的主流.多源异构不可避免地会使数据出现重复,同时庞大的数据量对重复检测的效率提出了极高的要求,传统技术在大数据环境下并不能很好地对高维数据进行重复检测,就此问题展开研究,... 大数据时代多源、异构、海量的数据正逐渐成为各种应用的主流.多源异构不可避免地会使数据出现重复,同时庞大的数据量对重复检测的效率提出了极高的要求,传统技术在大数据环境下并不能很好地对高维数据进行重复检测,就此问题展开研究,分析了传统SNM类方法的不足,将重复问题概化为一类特殊的聚类问题,利用R-树建立了高效的索引,利用聚类簇的特性减少了在R-树叶子中比较的次数,利用重复检测的Apriori性质实现了对高维数据集并行处理.实验结果表明,提出的算法能有效地提高高维数据的重复检测效率. 展开更多
关键词 大数据 高维数据 数据挖掘 数据预处理 重复检测
下载PDF
基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤 被引量:13
16
作者 曹玉东 刘艳洋 +1 位作者 贾旭 王冬霞 《计算机应用研究》 CSCD 北大核心 2016年第6期1693-1696,共4页
提出一种快速的图像型垃圾邮件过滤方案,结合半监督机器学习技术改进局部敏感哈希(LSH)算法,基于改进的LSH算法构建垃圾图像特征库索引,提高图像的查找速度。搜集并构造了60 000个垃圾图像样本,实验结果表明,利用改进的LSH算法能有效地... 提出一种快速的图像型垃圾邮件过滤方案,结合半监督机器学习技术改进局部敏感哈希(LSH)算法,基于改进的LSH算法构建垃圾图像特征库索引,提高图像的查找速度。搜集并构造了60 000个垃圾图像样本,实验结果表明,利用改进的LSH算法能有效地提高垃圾图像的过滤速度。 展开更多
关键词 垃圾图像过滤 局部敏感哈希 图像特征提取 高维数据索引
下载PDF
离群点检测算法研究 被引量:5
17
作者 张宁 《桂林电子科技大学学报》 2009年第1期22-25,共4页
离群点检测是数据挖掘中一项重要内容,通过对当前有代表性的离群点检测算法的分析和比较,对各算法的优缺点进行了总结。针对高维数据中离群点检测算法进行了分析和研究,提出了高维数据中离群点检测需要注意的一些问题,从而便于研究者以... 离群点检测是数据挖掘中一项重要内容,通过对当前有代表性的离群点检测算法的分析和比较,对各算法的优缺点进行了总结。针对高维数据中离群点检测算法进行了分析和研究,提出了高维数据中离群点检测需要注意的一些问题,从而便于研究者以这些算法为基础,在此基础上提出新的改进算法。 展开更多
关键词 离群点 高维数据 数据流 异常检测
下载PDF
基于相似性度量的高维聚类算法的研究 被引量:4
18
作者 黄斯达 陈启买 《微计算机信息》 2009年第27期187-188,198,共3页
针对高维数据相似度难以定义的问题,本文提出了一种新的高维数据聚类算法。该算法基于一个能够更准确表达高维数据对象之间相似性的度量函数,首先计算对象两两之间的相似度并得出一个相似度矩阵,然后根据该相似度矩阵自底向上对数据进... 针对高维数据相似度难以定义的问题,本文提出了一种新的高维数据聚类算法。该算法基于一个能够更准确表达高维数据对象之间相似性的度量函数,首先计算对象两两之间的相似度并得出一个相似度矩阵,然后根据该相似度矩阵自底向上对数据进行聚类分析。实验显示,该算法能够获得质量更高的聚类结果,并且不受孤立点影响,对数据输入顺序也不敏感。 展开更多
关键词 高维数据 聚类分析 相似性度量
下载PDF
一种基于SAE和BP网络相结合的人脸识别模型 被引量:3
19
作者 李森林 石元泉 黄隆华 《怀化学院学报》 2017年第5期78-82,共5页
基于浅层BP网络的模式识别在诸多领域有着广泛的应用,但对于稀疏高维度的数据,在网络模型训练时计算量大、参数繁多、训练慢、准确率低.提出了一种基于稀疏自动编码器(Sparse auto-Encoder,SAE)和浅层BP网络相结合的人脸识别模型.在深度... 基于浅层BP网络的模式识别在诸多领域有着广泛的应用,但对于稀疏高维度的数据,在网络模型训练时计算量大、参数繁多、训练慢、准确率低.提出了一种基于稀疏自动编码器(Sparse auto-Encoder,SAE)和浅层BP网络相结合的人脸识别模型.在深度SAE模型中,通过设置隐藏节点数少于输入输出节点数方法,自动学习样本的多种特征表示,来实现数据的降维和去稀疏性,将该方法产生的特征表示作为输入新样本数据,用于BP网络模型进行图像识别.通过人脸识别实验表明,第一通过SAE模型得到的特征表示进行人脸识别是可行的;第二SAE模型获得的多种表示分别进行人脸识别,并非第j层表示比第i层表示(j>i)效果一定好;第三该方法比单纯浅层BP网络进行人脸识别在效果上有一定程度的改善和提高. 展开更多
关键词 稀疏自动编码器 神经网络 人脸识别 高维度数据 维度约减
下载PDF
稀疏约束的嵌入式模糊均值聚类算法 被引量:3
20
作者 王继奎 杨正国 +3 位作者 易纪海 刘学文 王会勇 聂飞平 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期725-733,共9页
降维作为聚类问题的关键预处理步骤被用来抽取高维数据潜在的低维子空间结构.面对高维数据聚类,传统的策略是首先采用降维技术提取高维数据嵌入在低维空间的潜在数据结构,然后利用一个聚类算法完成数据聚类.然而,这种两阶段优化策略的... 降维作为聚类问题的关键预处理步骤被用来抽取高维数据潜在的低维子空间结构.面对高维数据聚类,传统的策略是首先采用降维技术提取高维数据嵌入在低维空间的潜在数据结构,然后利用一个聚类算法完成数据聚类.然而,这种两阶段优化策略的聚类性能往往不如直接优化统一的目标函数.因此,在模糊聚类算法的基础上,本文提出了一种稀疏约束的嵌入式模糊均值聚类算法(EFSC),该方法结合线性正交投影技术在对高维数据降维的同时完成聚类.EFSC模型对模糊矩阵施加了稀疏约束来提升聚类性能.理论分析与实验结果证明了本文提出的EFSC算法的有效性. 展开更多
关键词 高维数据 降维 模糊聚类 稀疏约束
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部