期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种优化的基于网格的聚类算法 被引量:6
1
作者 刘俊岭 孙焕良 +1 位作者 王大玲 牛志成 《小型微型计算机系统》 CSCD 北大核心 2006年第10期1927-1930,共4页
聚类是数据挖掘领域中一个重要的研究课题.与其它算法相比,基于网格的聚类算法可以高效处理低维的海量数据.然而,由于划分的单元数与数据的维数呈指数增长,因此对于维数较高的数据集,生成的单元数过多,导致算法的效率较低.本文基于CD-T... 聚类是数据挖掘领域中一个重要的研究课题.与其它算法相比,基于网格的聚类算法可以高效处理低维的海量数据.然而,由于划分的单元数与数据的维数呈指数增长,因此对于维数较高的数据集,生成的单元数过多,导致算法的效率较低.本文基于CD-Tree设计了新的基于网格的聚类算法,该算法的效率远高于传统的基于网格聚类算法的效率.此外,本文设计了一种剪枝优化策略,以提高算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法在数据集的大小及维度的可伸缩性方面均有显著提高. 展开更多
关键词 数据挖掘 聚类分析 cdtree 基于网格的算法
下载PDF
一种基于磁盘的大数据集快速异常检测算法 被引量:1
2
作者 赵法信 鲍玉斌 +2 位作者 孙焕良 于戈 王大玲 《小型微型计算机系统》 CSCD 北大核心 2005年第11期1938-1941,共4页
异常点检测是数据挖掘的一个重要研究方向,基于Cell的异常点检测算法生成的Cell(单元)数与维数成指数增长.当生成的单元数增多及数据量增大时,基于Cell的算法不能有效工作.分析发现这些单元中存在很多无用的空单元.本文采用CD-Tree结构... 异常点检测是数据挖掘的一个重要研究方向,基于Cell的异常点检测算法生成的Cell(单元)数与维数成指数增长.当生成的单元数增多及数据量增大时,基于Cell的算法不能有效工作.分析发现这些单元中存在很多无用的空单元.本文采用CD-Tree结构对非空单元进行索引,并采用聚簇技术,将每个单元中的数据点存放在同一个磁盘页链中.实验表明,采用CD-Tree以及聚簇技术设计的异常点检测磁盘算法的效率,以及所能处理的数据集维数较原基于Cell的磁盘算法都有显著的提高. 展开更多
关键词 数据挖掘 异常点检测 cd-tree 聚簇
下载PDF
一种基于CD-Tree的高效聚类算法
3
作者 孙焕良 刘俊岭 +2 位作者 于戈 鲍玉斌 王大玲 《计算机研究与发展》 EI CSCD 北大核心 2006年第z3期371-375,共5页
基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计了新的基于网格的聚类算法,利用CD-Tree的优点提高了传统的基... 基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计了新的基于网格的聚类算法,利用CD-Tree的优点提高了传统的基于网格的聚类算法的效率.此外,该算法聚类时只需访问稠密单元,设计了优化策略,在聚类之前剪枝掉非稠密单元,进一步提高了算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法有更好的可伸缩性. 展开更多
关键词 数据挖掘 聚类分析 cd-tree 基于网格的算法
下载PDF
一种基于划分的孤立点检测算法 被引量:16
4
作者 孙焕良 鲍玉斌 +2 位作者 于戈 赵法信 王大玲 《软件学报》 EI CSCD 北大核心 2006年第5期1009-1016,共8页
孤立点是不具备数据一般特性的数据对象.划分的方法是通过将数据集中的数据点分布的空间划分为不相交的超矩形单元集合,匹配数据对象到单元中,然后通过各个单元的统计信息来发现孤立点.由于大多真实数据集具有较大偏斜,因此划分后会产... 孤立点是不具备数据一般特性的数据对象.划分的方法是通过将数据集中的数据点分布的空间划分为不相交的超矩形单元集合,匹配数据对象到单元中,然后通过各个单元的统计信息来发现孤立点.由于大多真实数据集具有较大偏斜,因此划分后会产生影响算法性能的大量空单元.由此,提出了一种新的索引结构——CD-Tree(celldimensiontree),用于索引非空单元.为了优化CD-Tree结构和指导对数据的划分,提出了基于划分的数据偏斜度(skewofdata,简称SOD)概念.基于CD-Tree与SOD,设计了新的孤立点检测算法.实验结果表明,该算法与基于单元的算法相比,在效率及有效处理的维数方面均有显著提高. 展开更多
关键词 数据挖掘 孤立点检测 划分 cd-tree(cell DIMENSION tree) 基于单元的算法
下载PDF
基于数据分区和网格的离群点挖掘算法 被引量:2
5
作者 唐成龙 邢长征 《计算机应用》 CSCD 北大核心 2012年第8期2193-2197,共5页
针对已有的基于网格的离群点挖掘算法挖掘效率低和对于大数据集适应性差的问题,提出基于数据分区和网格的离群点挖掘算法。算法首先将数据进行分区,以单元为单位筛选非离群点,并把中间结果暂存起来;然后采用改进的维单元树结构维护数据... 针对已有的基于网格的离群点挖掘算法挖掘效率低和对于大数据集适应性差的问题,提出基于数据分区和网格的离群点挖掘算法。算法首先将数据进行分区,以单元为单位筛选非离群点,并把中间结果暂存起来;然后采用改进的维单元树结构维护数据点的空间信息,以微单元为单位进行非离群点筛选,并通过两个优化策略进行高效操作;最后以数据点为单位挖掘离群点,从而得到离群数据集合。理论分析和实验结果表明了该方法是有效可行的,对大数据集和高维数据具有更好的伸缩性。 展开更多
关键词 数据挖掘 离群数据 网格 数据分区 单元 微单元 维单元树
下载PDF
人和猴T淋巴细胞表面TRBC受体及其配体不同于E2分子和CD2的配体 被引量:1
6
作者 郑永唐 贲昆龙 《实验生物学报》 CSCD 1990年第3期357-362,共6页
T淋巴细胞表面的TRBC受体不同介导E花结形成的E受体(CD2)和E2分子。CD2的配体,人红细胞表面的CD58(LFA-3)和绵羊红细胞表面的T11 TS,S42,S14及S110-220,与TRBC受体的配体无关,TRBC玫瑰花结的形成是通过不同于E花结和人自身玫瑰花结的受... T淋巴细胞表面的TRBC受体不同介导E花结形成的E受体(CD2)和E2分子。CD2的配体,人红细胞表面的CD58(LFA-3)和绵羊红细胞表面的T11 TS,S42,S14及S110-220,与TRBC受体的配体无关,TRBC玫瑰花结的形成是通过不同于E花结和人自身玫瑰花结的受体-配体相互作用来实现的,进一步表明,人和猴T淋巴细胞表面和TRBC表面,可能都有独特的蛋白质分子介导TRBC玫瑰花结的形成。 展开更多
关键词 T细胞 TRBC 受体 cd2 配体
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部