期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
多尺度数据挖掘方法 被引量:28
1
作者 柳萌萌 赵书良 +3 位作者 韩玉辉 苏东海 李晓超 陈敏 《软件学报》 EI CSCD 北大核心 2016年第12期3030-3050,共21页
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了... 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的. 展开更多
关键词 多尺度 频繁项集 关联规则 尺度转换 多尺度关联规则挖掘
下载PDF
基于概念复合的对偶三支概念格及其概念约简 被引量:1
2
作者 刘津 米据生 +1 位作者 李仲玲 李美争 《计算机科学》 CSCD 北大核心 2023年第6期122-130,共9页
三支概念格通过正负算子相结合,既表示出了共同拥有的信息,又表示出了共同不拥有的信息,是对经典概念格的扩展。但在处理一些实际问题时,人们也会从反向出发,考虑集合的补集可能不拥有的信息和可能拥有的信息,对偶三支概念格应运而生。... 三支概念格通过正负算子相结合,既表示出了共同拥有的信息,又表示出了共同不拥有的信息,是对经典概念格的扩展。但在处理一些实际问题时,人们也会从反向出发,考虑集合的补集可能不拥有的信息和可能拥有的信息,对偶三支概念格应运而生。文中提出了一种基于形式背景的对偶概念及其补背景中对偶概念的复合来构造对偶三支概念格的方法,经验证,通过概念复合方法得到的对偶三支概念与通过对偶三支算子得到的概念相同。进一步讨论了基于可辨识矩阵求解对偶三支概念格的属性约简方法,并借助此思想,给出了基于概念可辨识矩阵的对偶三支概念约简方法。 展开更多
关键词 概念格 对偶三支概念 属性约简 概念约简 辨识矩阵
下载PDF
多粒度模糊粗糙近似算子的信任结构与属性约简 被引量:5
3
作者 胡谦 米据生 李磊军 《山东大学学报(理学版)》 CAS CSCD 北大核心 2017年第7期30-36,共7页
多粒度是近年来粗糙集领域研究的一个热点方向,为使多粒度模型更适用于实际数据,提高模型的可用性,模糊思想被引入到多粒度粗糙集模型中。本文构建了基于模糊相似关系下的多粒度模糊粗糙集模型,并建立了模糊信任结构。在该信任结构下根... 多粒度是近年来粗糙集领域研究的一个热点方向,为使多粒度模型更适用于实际数据,提高模型的可用性,模糊思想被引入到多粒度粗糙集模型中。本文构建了基于模糊相似关系下的多粒度模糊粗糙集模型,并建立了模糊信任结构。在该信任结构下根据多粒度模糊粗糙集的上、下近似构造信任函数与似然函数。研究多粒度模糊粗糙集在模糊等价关系下的属性约简,并给出相关算法。 展开更多
关键词 多粒度 模糊粗糙集 信任函数 似然函数 属性约简
原文传递
基于概念格的多值属性关联规则可视化 被引量:2
4
作者 郭晓波 赵书良 +1 位作者 赵娇娇 刘军丹 《计算机应用》 CSCD 北大核心 2013年第8期2198-2203,2211,共7页
针对传统关联规则可视化方法无法展现数据间的频繁模式和关联关系,表示形式比较单一,缺乏多模式展现形式等问题,提出了一种新的多值属性关联规则可视化表示算法。该算法运用概念格理论对多值属性数据进行了重新定义和分类,将频繁项集和... 针对传统关联规则可视化方法无法展现数据间的频繁模式和关联关系,表示形式比较单一,缺乏多模式展现形式等问题,提出了一种新的多值属性关联规则可视化表示算法。该算法运用概念格理论对多值属性数据进行了重新定义和分类,将频繁项集和关联规则中的多值数据项分别以概念格结构进行表示,实现了频繁项集可视化展示和一对一、一对多、多对一、多对多及概念分层的多模式关联规则可视化展示。最后,以某省全员人口数据为基础对算法进行了具体实现和分析,同时实现了对人口数据的源数据、频繁模式以及关联关系的可视化展示。实验结果表明,所提出的可视化形式和已有成果相比具有良好的频繁项集与多模式关联规则展现效果。 展开更多
关键词 多值属性 概念格 关联规则 可视化 人口数据
下载PDF
基于亲属关系网络的特定家庭结构匹配方法研究 被引量:1
5
作者 张霞 郭瑞强 +2 位作者 高静伟 王国强 薛少彤 《软件》 2016年第9期34-38,共5页
随着数据规模的增大以及人与人之间关系复杂性的提高,在亲属关系网络中查询特定的家庭结构已经成为研究的难点之一。传统的关系型数据库并不擅长处理关系复杂、结构多变的数据。因此,本文基于图数据库构造了H省的亲属关系网络。针对亲... 随着数据规模的增大以及人与人之间关系复杂性的提高,在亲属关系网络中查询特定的家庭结构已经成为研究的难点之一。传统的关系型数据库并不擅长处理关系复杂、结构多变的数据。因此,本文基于图数据库构造了H省的亲属关系网络。针对亲属关系网络中数据庞大、结构复杂、难以批量匹配数据中的特定结构等问题,本文提出了基于亲属关系网络的特定家庭结构匹配方法。此外,本文还根据人口学中家庭结构的分类标准,对不同类型的家庭进行查询;实验结果表明,该方法简化了复杂数据的查询工作,提高了查询正确率,实现用户查询友好性提升。 展开更多
关键词 亲属关系网络 图数据库 特定结构 特定家庭结构匹配
下载PDF
教学评价数据的离群点检测算法研究 被引量:1
6
作者 李慧 王国强 +2 位作者 郭瑞强 高静伟 暴延敏 《软件》 2017年第4期18-25,共8页
教学评价是大学教学活动中不可缺少的环节,可能出现故意抬高或压低评分及虚假评分的现象,应该找出这些离群数据并加以清除,以提高学生评教数据的正确性。离群点检测问题是数据挖掘技术的重要研究领域之一,本文实验所用教学评价数据属于... 教学评价是大学教学活动中不可缺少的环节,可能出现故意抬高或压低评分及虚假评分的现象,应该找出这些离群数据并加以清除,以提高学生评教数据的正确性。离群点检测问题是数据挖掘技术的重要研究领域之一,本文实验所用教学评价数据属于分类型数据,目前针对分类型数据的离群点检测算法常用的有基于信息熵的贪婪算法和基于频率的AVF算法。针对贪婪算法时间复杂度较高,AVF算法不够准确的问题,本文提出一种改进的基于频率的离群点检测算法。本文算法首先采用改进的k-modes算法对教学评价数据进行聚类,并提出应用调整的余弦相似度公式作为相似性度量,筛选出远离簇中心的候选离群点,最后通过基于频率的离群点检测算法对候选集进行检测。在真实数据集上的实验表明算法在精确度和效率方面均具有优势。 展开更多
关键词 离群点检测 k-modes聚类 余弦相似度 分类型数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部