-
题名不确定噪声下海量文本数据的模糊挖掘算法研究
被引量:2
- 1
-
-
作者
潘大胜
-
机构
百色学院信息工程学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2017年第9期129-132,共4页
-
文摘
针对传统的数据挖掘方法一直存在挖掘精度低、运行时间长的问题,提出基于小波变换与关联规则的不确定噪声下海量文本数据的模糊数据挖掘算法,首先利用小波变换对不确定噪声下海量文本数据的模糊数据进行预处理,将模糊海量文本数据时间序列转换至频谱空间中,获得频谱空间内距离最小、类间聚类最大的变换基系数,并将其作为海量文本模糊数据特征系数,利用数据特征系数计算出其从属于各类别的隶属度,确定模糊文本数据集的关联规则,依据多维海量数据集之间的相关程度进行区间划分,由此实现对不确定噪声下海量文本数据的有效挖掘.实验结果证明,所提算法能有效提高海量文本数据挖掘精度,且挖掘效率较高.
-
关键词
不确定噪声
海量文本数据
模糊数据挖掘算法
特征系数
关联规则
-
Keywords
key words: uncertain noise
massive text data
the fuzzy data mining algorithm
characteristics of the coefficient of
association rules
-
分类号
TN391
[电子电信—物理电子学]
-