期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于反洗钱应用的一种有效的增量聚类算法 被引量:7
1
作者 孙小林 卢正鼎 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第11期85-87,共3页
为了更及时、清晰地发现洗钱的踪迹 ,减少反洗钱的工作量 ,基于增量层次算法聚类以及划分算法聚类的思想 ,将中心点的思想应用到BIRCH算法中聚类特征 (CF)的计算 ,用核心树代替CF树 ,可以更加适用于类似金融数据这样数据类型复杂 ,含有... 为了更及时、清晰地发现洗钱的踪迹 ,减少反洗钱的工作量 ,基于增量层次算法聚类以及划分算法聚类的思想 ,将中心点的思想应用到BIRCH算法中聚类特征 (CF)的计算 ,用核心树代替CF树 ,可以更加适用于类似金融数据这样数据类型复杂 ,含有“噪音” 展开更多
关键词 反洗钱 增量聚类 中心点 核心树
下载PDF
基于DBSCAN的批量更新聚类算法 被引量:6
2
作者 易宝林 伍仪强 +1 位作者 丰大洋 张小莉 《计算机工程》 CAS CSCD 北大核心 2009年第2期63-64,67,共3页
为更新批量数据,提出一种基于DBSCAN的新聚类方法。该算法通过扫描原对象确定它们同增量对象间的关系,得到一个相关对象集,同时根据该相关对象和增量对象之间的关系获得新的聚类结果。实验结果表明,该算法与DBSCAN是等价的,能更有效地... 为更新批量数据,提出一种基于DBSCAN的新聚类方法。该算法通过扫描原对象确定它们同增量对象间的关系,得到一个相关对象集,同时根据该相关对象和增量对象之间的关系获得新的聚类结果。实验结果表明,该算法与DBSCAN是等价的,能更有效地解决批量数据更新时的增量聚类问题。 展开更多
关键词 空间数据挖掘 增量聚类 空间数据库 批量更新聚类算法
下载PDF
数字遥感图像解译分类方法研究 被引量:3
3
作者 孟海东 姚继营 《金属矿山》 CAS 北大核心 2010年第6期139-141,166,共4页
遥感技术的发展,使人类能够获得非常丰富的知识,扩大人们观察大自然的视野。但面临的问题是如何处理大量的数据,使之成为有用的信息。随着卫星遥感数据获取方法的飞跃发展,传统的遥感图像分类方法不但导致分类精度降低,而且会造成空间... 遥感技术的发展,使人类能够获得非常丰富的知识,扩大人们观察大自然的视野。但面临的问题是如何处理大量的数据,使之成为有用的信息。随着卫星遥感数据获取方法的飞跃发展,传统的遥感图像分类方法不但导致分类精度降低,而且会造成空间数据大量冗余浪费资源。因此,提出了一种利用基于密度和自适应密度可达聚类算法(CADD)的数字遥感图像分类方法。理论分析和实验结果证明这种方法能够有效地对遥感图像进行分类。 展开更多
关键词 数字遥感图像 增量聚类 分类
下载PDF
蛋白质结构型预测的研究
4
作者 贾孟文 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第3期276-279,共4页
以 nα、nβ、nβαβ、n4α、n4β等五个二级结构参数为基础 ,用离散增量研究了蛋白质的聚类和蛋白质的结构型预测 .α型 ,β型和 αβ型可以很好地分别聚在三个大支中 .蛋白质结构型预测总体预测正确率为 82 % ,用 Self-consistency和... 以 nα、nβ、nβαβ、n4α、n4β等五个二级结构参数为基础 ,用离散增量研究了蛋白质的聚类和蛋白质的结构型预测 .α型 ,β型和 αβ型可以很好地分别聚在三个大支中 .蛋白质结构型预测总体预测正确率为 82 % ,用 Self-consistency和 Jake-knife这两种方法测试的结果没有明显的差别 .从结果可以看出利用蛋白质的二级结构参数能较好地体现出各种结构型蛋白质的特点 . 展开更多
关键词 二级结构参数 离散增量 蛋白质 聚类 结构型预测 二级结构序列 Α螺旋 Β折叠
下载PDF
基于核心树的增量聚类算法研究
5
作者 丁一 付弦 《湖北师范学院学报(自然科学版)》 2011年第2期18-23,共6页
传统的聚类分析方法一般都没有考虑大容量数据集合的问题,而数据挖掘技术的研究重点之一就是如何从海量数据中高效率地获取知识。结合基于分类方法的K-means中心点算法以及基于层次方法的BIRCH增量算法提出核心树(Core-Tree)的思想来弥... 传统的聚类分析方法一般都没有考虑大容量数据集合的问题,而数据挖掘技术的研究重点之一就是如何从海量数据中高效率地获取知识。结合基于分类方法的K-means中心点算法以及基于层次方法的BIRCH增量算法提出核心树(Core-Tree)的思想来弥补两个算法的缺点,使用中心点的思想来表示BIRCH算法中汇总信息,利用类核心的思想来提高确定中心点的效率。因此,提出一种聚类算法,主要集中在如何提高大型数据集合的聚类效率、如何处理具有各种特征的数据集合。 展开更多
关键词 增量聚类 核心树 中心点 聚类特征
下载PDF
AFPⅡ与昆虫AFP的相似性研究
6
作者 其木格 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2004年第1期29-31,共3页
用离散增量法对PDB库中45个抗冻蛋白分别进行氨基酸含量和规则二级结构片段数Nα、N310的信息聚类.聚类结果显示,在氨基酸含量和规则二级结构片段数上AFPⅡ和昆虫AFP都有明显的相似性.
关键词 抗冻蛋白 离散增量 信息聚类 昆虫 氨基酸含量 规则二级结构片段
下载PDF
基于小世界模型的复合关键词提取方法研究 被引量:14
7
作者 马力 焦李成 +2 位作者 白琳 周雅夫 董洛兵 《中文信息学报》 CSCD 北大核心 2009年第3期121-128,共8页
该文提出了一种新的基于小世界网络特性的关键词提取算法。首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络。引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集。利用侯选关... 该文提出了一种新的基于小世界网络特性的关键词提取算法。首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络。引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集。利用侯选关键词集词语位置关系和汉语词性搭配关系,提取出复合关键词。实验结果表明该方法是可行和有效的,获取复合关键词比一般关键词所表达的含义更便于人们对文本的理解。 展开更多
关键词 计算机应用 中文信息处理 小世界网络 词语网络 平均最短路径变化量 聚类系数变化量 复合关键词
下载PDF
基于SWN理论提取复合关键字系统的设计与实现 被引量:4
8
作者 周雅夫 马力 董洛兵 《西安邮电学院学报》 2007年第5期82-86,共5页
实现了一个利用小世界网络模型(SWN)提取中文文档的关键字的系统。小世界网络模型具有两个统计性质:平均路径长度和聚类系数。本系统使用的算法首先对文档进行分词,以分词之间的相邻关系为边、以分词为节点构造文档结构图。然后计算每... 实现了一个利用小世界网络模型(SWN)提取中文文档的关键字的系统。小世界网络模型具有两个统计性质:平均路径长度和聚类系数。本系统使用的算法首先对文档进行分词,以分词之间的相邻关系为边、以分词为节点构造文档结构图。然后计算每一个分词的平均路径长度变化量和聚类系数变化量,并且使用这两个变化量作为提取关键字的标准,最后按照一定策略合并关键字成复合关键字。本文首先详细介绍了小世界网络模型的概念和在关键字提取方面的应用,然后介绍了本系统的设计与实现,最后通过实验证明了该算法的正确性和有效性。 展开更多
关键词 小世界网络 关键字提取 平均路径长度变化量 聚类系数变化量
下载PDF
基于差异性聚类的选择性集成人体行为识别模型 被引量:3
9
作者 王忠民 张爽 贺炎 《计算机科学》 CSCD 北大核心 2018年第1期307-312,共6页
为了提高基于智能手机的人体行为识别率,优化多分类器集成系统的泛化性能及个体分类器的差异性,提出了基于差异性增量聚类(Diversity Measure Increment-Affinity Propagation clustering,DMI-AP)的选择性集成人体行为识别模型。首先对... 为了提高基于智能手机的人体行为识别率,优化多分类器集成系统的泛化性能及个体分类器的差异性,提出了基于差异性增量聚类(Diversity Measure Increment-Affinity Propagation clustering,DMI-AP)的选择性集成人体行为识别模型。首先对训练集的所有样本进行bootstrap抽样并训练基分类器,选出大于平均识别率的基分类器构成分类器集合;然后将集合的基分类器作为聚类对象进行分组,通过计算基分类器间的双误差异性值求出表征个体分类器特征的双误差异性增量值,输入近邻传播聚类算法得到k个类簇,选取每簇的中心分类器构成多分类器集成系统;最后使用等概率均值法融合k个分类器的输出结果。实验表明,该模型算法使个体分类器的差异性增大、分类器搜索空间缩小;与传统的Bagging,Adaboost以及RF方法相比,该模型的识别准确率平均提高了8.11%。 展开更多
关键词 选择性集成 差异性增量 近邻传播聚类 行为识别
下载PDF
基于对象多属性差异的灰色发展聚类方法及应用 被引量:3
10
作者 刘勇 周婷 +1 位作者 全冰婷 刘思峰 《运筹与管理》 CSSCI CSCD 北大核心 2018年第12期57-63,共7页
在现实决策问题中,决策对象在不同时期行为状态和所属类型往往呈现一定的发展规律,而现有聚类方法难以充分挖掘聚类对象的发展信息、对象间的关系信息和发展属性的差异信息。为有效处理此类问题,考虑到研究对象的发展趋势、发展行为和... 在现实决策问题中,决策对象在不同时期行为状态和所属类型往往呈现一定的发展规律,而现有聚类方法难以充分挖掘聚类对象的发展信息、对象间的关系信息和发展属性的差异信息。为有效处理此类问题,考虑到研究对象的发展趋势、发展行为和发展绝对量与增长量的属性差异,采用GM(1,1)和灰色定权聚类方法,构建了基于对象多属性差异的灰色发展聚类方法,并以我国区域高新技术产业化聚类评估问题为例验证了模型的有效性与合理性。结果表明,所构建模型能够有效描述研究对象呈现发展趋势或未来行为,并实现对研究对象的有效聚类。 展开更多
关键词 属性差异 绝对量 增长量 灰色发展聚类
下载PDF
一种基于信息理论的距离系数
11
作者 陈超英 《生物数学学报》 CSCD 北大核心 2007年第4期725-730,共6页
给出了一种基于信息理论的距离系数,这一新的信息系数是通过对信息论中的离散增量系数改进而得,并证明其满足距离系数的三个性质.将其应用于一组同源辅助蛋白的聚类分析,表明是可行的.与离散增量系数及经典的欧氏距离系数的聚类结果进... 给出了一种基于信息理论的距离系数,这一新的信息系数是通过对信息论中的离散增量系数改进而得,并证明其满足距离系数的三个性质.将其应用于一组同源辅助蛋白的聚类分析,表明是可行的.与离散增量系数及经典的欧氏距离系数的聚类结果进行比较,应用相干系数对聚类结果进行评价,结果表明由新信息距离系数所确定的聚类结构与聚类数据间的拟合程度最好. 展开更多
关键词 信息理论 距离系数 离散增量 辅助蛋白 信息聚类分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部