期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
基于分布式数据流的大数据分类模型和算法 被引量:54
1
作者 毛国君 胡殿军 谢松燕 《计算机学报》 EI CSCD 北大核心 2017年第1期161-175,共15页
大数据是需求驱动的概念.随着数据库系统的普及和因特网服务的扩张,企业或者个人可用的数据正在膨胀,已有的技术很难满足大数据时代的数据分析需求,因此需要探索新的理论和方法来支撑大数据的应用.虽然大数据的4V属性已经被广泛讨论,但... 大数据是需求驱动的概念.随着数据库系统的普及和因特网服务的扩张,企业或者个人可用的数据正在膨胀,已有的技术很难满足大数据时代的数据分析需求,因此需要探索新的理论和方法来支撑大数据的应用.虽然大数据的4V属性已经被广泛讨论,但是它们大多描述的仍然是大数据的表象,所以很难从中抽象出统一的数据格式,因而进一步寻找可用于数据格式化的技术特征是必要的.面向于以分布式和流动性为主要技术特征的大数据应用需求,文中以分布式数据流为数据表达载体,在此基础上设计对应的大数据分类模型和挖掘算子.同时针对大数据的分类挖掘需要解决的关键问题来构建关键步骤对应的算法.理论上证明了文中给出的微簇合并技术和样本数据重构方法的合理性.实验表明:文中提出的基于分布式数据流的大数据的分类模型及算法不仅能大幅度地减少网络节点间的通讯代价,而且可以获得平均10%左右的全局挖掘精度的提升(对比已有的典型算法DS-means);虽然时间花费略高于DS-means,但是两者在不同的数据容量测试下相差很小、且时间攀升趋势相当. 展开更多
关键词 大数据 数据挖掘 分布式数据流 微簇 集成分类
下载PDF
基于近邻传播与密度相融合的进化数据流聚类算法 被引量:34
2
作者 邢长征 刘剑 《计算机应用》 CSCD 北大核心 2015年第7期1927-1932,1949,共7页
针对目前数据流离群点不能很好地被处理、数据流聚类效率较低以及对数据流的动态变化不能实时检测等问题,提出一种基于近邻传播与密度相融合的进化数据流聚类算法(I-APDen Stream)。此算法使用传统的两阶段处理模型,即在线与离线聚类两... 针对目前数据流离群点不能很好地被处理、数据流聚类效率较低以及对数据流的动态变化不能实时检测等问题,提出一种基于近邻传播与密度相融合的进化数据流聚类算法(I-APDen Stream)。此算法使用传统的两阶段处理模型,即在线与离线聚类两部分。不仅引进了能够体现数据流动态变化的微簇衰减密度以及在线动态维护微簇的删减机制,而且在对模型采用扩展的加权近邻传播(WAP)聚类进行模型重建时,还引进了异常点检测删除机制。通过在两种类型数据集上的实验结果表明,所提算法的聚类准确率基本能保持在95%以上,其纯度对比实验等其他相关测试都有较好结果,能够高实效、高质量、高效率地处理数据流数据聚类。 展开更多
关键词 离群点 数据流聚类 近邻传播 微簇
下载PDF
创新创业微型集群——“众创空间”研究综述及其趋势 被引量:15
3
作者 何铮 魏莞月 《电子科技大学学报(社科版)》 2018年第1期50-55,共6页
随着新时代互联网技术和共享经济理念的普及和发展,"众创空间"不仅在世界范围成为新趋势,在中国更成为创新驱动战略的重要载体。首先对现有的国内外相关文献进行了总结梳理,然后在此基础上,提出"众创空间"本质上是... 随着新时代互联网技术和共享经济理念的普及和发展,"众创空间"不仅在世界范围成为新趋势,在中国更成为创新驱动战略的重要载体。首先对现有的国内外相关文献进行了总结梳理,然后在此基础上,提出"众创空间"本质上是一类新兴的创新创业微型集群,并分析了"众创空间"集群特征以及与传统集群的区别所在,最后探讨了"众创空间"进一步的研究趋势。 展开更多
关键词 众创空间 文献综述 微型集群 创新创业
下载PDF
HD_2^+通过超薄碳膜的“尾流”效应 被引量:6
4
作者 朱洲森 缪竟威 +1 位作者 廖雪花 师勉恭 《原子与分子物理学报》 CAS CSCD 北大核心 2007年第4期699-703,共5页
快分子离子穿过固体时会产生库仑爆炸(Coulomb Explosion),尾流效应是库仑爆炸中的一个显著特性.HD2+的爆炸能谱在实测中发现了一些引人注目的特性:1)H+的尾流效应特别显著;2)H+的能谱结构非常类似HeH+中H+的能谱;3)尾流效应在D+的能谱... 快分子离子穿过固体时会产生库仑爆炸(Coulomb Explosion),尾流效应是库仑爆炸中的一个显著特性.HD2+的爆炸能谱在实测中发现了一些引人注目的特性:1)H+的尾流效应特别显著;2)H+的能谱结构非常类似HeH+中H+的能谱;3)尾流效应在D+的能谱中体现得很弱.这些特性对分析了解HD2+的结构和物理化学性质有很大的帮助.本文依照“尾流”效应(Wake Effect)的等离子体模型,将爆炸中两个D+产物的尾流场近似认为一个He+的尾流场,模拟计算了1.4977 MeV HD2在100 nm碳膜中分解后0°方向的能谱形式.给出了相同条件下的实验结果,得到了非常接近的结果,并将两者作了比较和分析.文中同时给出了D+的实验能谱,对D+的尾流效应相对较弱作了分析,指出对不同产物分辨的差异、产物的非直线运动等是造成D+尾流效应弱的原因. 展开更多
关键词 尾流效应 库仑爆炸 高斯分布 微团蔟
下载PDF
一种基于Hadoop平台的新聚类算法 被引量:6
5
作者 缪裕青 张锦杏 +2 位作者 刘少兵 文益民 明媚 《计算机科学》 CSCD 北大核心 2014年第4期269-272,共4页
针对现有很多聚类算法不能有效处理大规模数据的问题,基于微簇和等价连接关系,提出一种能在Hadoop平台实现高效并行化的聚类算法bigKClustering。算法将紧凑的数据抽象成一个向量,然后通过等价关系对这些向量进行连接,得到最终的聚类结... 针对现有很多聚类算法不能有效处理大规模数据的问题,基于微簇和等价连接关系,提出一种能在Hadoop平台实现高效并行化的聚类算法bigKClustering。算法将紧凑的数据抽象成一个向量,然后通过等价关系对这些向量进行连接,得到最终的聚类结果。实验结果表明,bigKClustering算法不仅具有良好的时间效率和聚类效果,而且具有良好的可伸缩性、加速比和时间稳定性。 展开更多
关键词 微簇 等价连接 HADOOP平台 聚类
下载PDF
便利体和障碍物下基于网格的空间聚类算法 被引量:2
6
作者 杨仕海 傅鹂 《计算机应用研究》 CSCD 北大核心 2010年第1期117-119,共3页
为了降低计算代价,在CLIQUE算法的基础上引入了便利网格和障碍网格等概念,提出了便利体和障碍物下基于网格的聚类算法(GBSCFO)。GBSCFO首先利用CLIQUE算法生成微簇,然后在微簇的粒度上计算障碍距离。通过理论分析和实验验证,GBSCFO具有... 为了降低计算代价,在CLIQUE算法的基础上引入了便利网格和障碍网格等概念,提出了便利体和障碍物下基于网格的聚类算法(GBSCFO)。GBSCFO首先利用CLIQUE算法生成微簇,然后在微簇的粒度上计算障碍距离。通过理论分析和实验验证,GBSCFO具有较好的时间复杂度和聚类效果。 展开更多
关键词 空间 聚类 网格 障碍物 便利体 微簇
下载PDF
工业物联网数据流自适应聚类方法 被引量:2
7
作者 朱维富 曾智霞 肖如良 《计算机系统应用》 2022年第3期169-177,共9页
5G通讯技术的迅猛发展使工业物联网得到了全面提升,工业物联网数据规模将越来越大、数据维度也越来越高,如何高效利用流聚类进行工业物联网数据挖掘工作是一个亟需解决的问题.提出了一种基于工业物联网数据流自适应聚类方法.该算法利用... 5G通讯技术的迅猛发展使工业物联网得到了全面提升,工业物联网数据规模将越来越大、数据维度也越来越高,如何高效利用流聚类进行工业物联网数据挖掘工作是一个亟需解决的问题.提出了一种基于工业物联网数据流自适应聚类方法.该算法利用微簇之间的高密性,计算各微簇节点的局部密度峰值以自适应产生宏簇数;采用引力能量函数对微集群进行递归在线更新;并且去除边缘相交微簇之间的计算以达到降低维护宏簇所需的计算量.理论分析和实验对比表明所提出的方法跟当前主流的流聚类算法相比有着更高质量的聚类效果. 展开更多
关键词 工业物联网 流数据 自适应流聚类 微簇
下载PDF
一种基于CF树的k-medoids聚类算法 被引量:3
8
作者 曹丹阳 杨炳儒 +1 位作者 李广原 刘英华 《计算机应用研究》 CSCD 北大核心 2011年第9期3260-3263,共4页
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,... 当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类。当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍。实验表明,改进算法具有较高的性能和可伸缩性。 展开更多
关键词 聚类 K-中心点 CF树 微簇
下载PDF
HD^+核间距及基态势能曲线的排列通道量子力学计算 被引量:2
9
作者 朱洲森 缪竟威 +2 位作者 杨百方 师勉恭 唐阿友 《原子与分子物理学报》 CAS CSCD 北大核心 1994年第3期232-238,共7页
依据排列通道量子力学(ACQM)的基本原理,对分子离子HD+的核间距和基态势能曲线以及离解能De做了理论计算,得到了HD+的核间距为2.0725a0,并求得HD+按两种方式离解时的势能曲线,认为多数HD+应按H++D... 依据排列通道量子力学(ACQM)的基本原理,对分子离子HD+的核间距和基态势能曲线以及离解能De做了理论计算,得到了HD+的核间距为2.0725a0,并求得HD+按两种方式离解时的势能曲线,认为多数HD+应按H++D的方式离解。通过比较计算,文章认为HD+比更容易激发和离解,也更不稳定。同时文章对用ACQM解决非对称的同位素微团簇的一般方法做了简明阐述。 展开更多
关键词 库仑爆炸 核间距 分子离子 ACQM
下载PDF
Experimental determination of the internuclear separation of HD^+ ion micro-cluster 被引量:2
10
作者 SHI Miangon TANG Ayou +2 位作者 ZHU Zhousen YANG Beifang MIAO Jingwei(Institute of Nuclear Science and Technology, Sichuan University, Chengdu 610064, China) 《Nuclear Science and Techniques》 SCIE CAS CSCD 1999年第2期74-77,共4页
Measurements of zero-degree breakup fragment energy distribution fromthe Coulomb-Explosions of 1.50965 MeV HD+ ion inicro-cluster beam are reported.Mean value of the internuclear separation of HD+ is found to be 0.125... Measurements of zero-degree breakup fragment energy distribution fromthe Coulomb-Explosions of 1.50965 MeV HD+ ion inicro-cluster beam are reported.Mean value of the internuclear separation of HD+ is found to be 0.12510.003 urn. Aset of high-resolution experimental arrangement and improvement of the Van-de-Graaffaccelerator are described briefly. 展开更多
关键词 HD^+离子 微观团簇 原子核间分离 实验
下载PDF
基于微簇的无线传感器网络能量均衡路由协议 被引量:1
11
作者 李戈阳 曹阳 +1 位作者 高洵 邹学玉 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第3期12-15,共4页
设计了两种能量均衡策略,提出基于微簇策略的能量均衡路由协议.该协议将相邻两节点联合成微簇,微簇内的节点基于剩余能量进行负载调配,以实现局部的能量均衡;对节点间的梯度值进行模糊分级,并将模糊等级选择策略与质量评价函数相结合进... 设计了两种能量均衡策略,提出基于微簇策略的能量均衡路由协议.该协议将相邻两节点联合成微簇,微簇内的节点基于剩余能量进行负载调配,以实现局部的能量均衡;对节点间的梯度值进行模糊分级,并将模糊等级选择策略与质量评价函数相结合进行下一跳节点选择,以实现全局的能量均衡.仿真表明该协议能更均衡地利用有限能量,降低节点的平均能耗和传输时延,延长无线传感器网络的寿命. 展开更多
关键词 传感器 微簇 梯度 模糊分级 能量均衡
原文传递
移动数据预估聚类分析算法 被引量:1
12
作者 欧阳浩 肖建华 《计算机工程与应用》 CSCD 北大核心 2008年第2期197-201,共5页
研究了一种移动数据的预估聚类分析算法。首先建立移动数据的数学模型,然后在此模型的基础上,提出一个基于微簇的移动数据的聚类分析算法,并对移动微簇的相交和分裂事件进行了详细地分析。提出的新算法可以预测一定时间段内的任意时刻... 研究了一种移动数据的预估聚类分析算法。首先建立移动数据的数学模型,然后在此模型的基础上,提出一个基于微簇的移动数据的聚类分析算法,并对移动微簇的相交和分裂事件进行了详细地分析。提出的新算法可以预测一定时间段内的任意时刻数据的聚类情况。 展开更多
关键词 移动数据 数据挖掘 聚类 网格 微簇
下载PDF
一种Hadoop平台下的树形聚类算法 被引量:1
13
作者 张波 徐蔚鸿 +1 位作者 陈沅涛 朱玲 《小型微型计算机系统》 CSCD 北大核心 2016年第8期1770-1774,共5页
针对现有算法在大数据背景下聚类效果差,以及由于迭代等原因导致处理性能低等问题,提出一种在Hadoop平台高效并行的聚类算法PAClustering.先提出一种基于权重的方法,将整体数据按分布划分成若干数据块,并针对每个数据块将紧凑的数据抽... 针对现有算法在大数据背景下聚类效果差,以及由于迭代等原因导致处理性能低等问题,提出一种在Hadoop平台高效并行的聚类算法PAClustering.先提出一种基于权重的方法,将整体数据按分布划分成若干数据块,并针对每个数据块将紧凑的数据抽象成一个向量,形成微团,最后通过树形合并进行聚类,在提高聚类准确度的同时有效避免了传统算法在聚类过程中的迭代运算.在不同大小数据集上的实验表明,PAClustering算法不仅具有较高的聚类准确度和稳定性,同时具有良好的处理性能. 展开更多
关键词 大数据 HADOOP 并行聚类 微团 树形合并
下载PDF
基于微簇的在线网络异常检测方法 被引量:1
14
作者 肖三 杨雅辉 沈晴霓 《计算机工程与应用》 CSCD 2013年第6期86-90,共5页
针对大流量骨干网的在线网络异常检测是目前网络安全研究的热点之一,提出一种网络异常检测方法,有效在线处理大数据流,利用密度聚类算法把大数据流转换成微簇,通过微簇提高处理效率,定时调用孤立点检测算法发现攻击行为。方法具有不需... 针对大流量骨干网的在线网络异常检测是目前网络安全研究的热点之一,提出一种网络异常检测方法,有效在线处理大数据流,利用密度聚类算法把大数据流转换成微簇,通过微簇提高处理效率,定时调用孤立点检测算法发现攻击行为。方法具有不需线下训练、能发现任意行为模式、支持大数据流、可以平衡检测精度与系统资源要求、处理效率高等优点。实验表明,原型系统在20s完成2000年LLS_DDOS_1.0数据集分析,检测率为82%,误报率为6%,效果与K-means相当。 展开更多
关键词 密度聚类 微簇 数据流 孤立点检测
下载PDF
三层流数据聚类框架与最优2k近邻聚类算法 被引量:1
15
作者 沈仙桥 黄德才 陆亿红 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2451-2455,共5页
面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人为摸索.针对这些不足和流数据环境普遍采用的两层聚类框架,... 面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人为摸索.针对这些不足和流数据环境普遍采用的两层聚类框架,提出了基于微簇优化的三层流数据聚类框架,并在此基础上提出了基于最优2k近邻的流数据聚类算法.该算法的在线层不断地凝聚微簇的密集状态,优化微簇并自适应地调整微簇半径,而离线聚类层还利用先验聚类结果调整聚类参数.实验结果表明,所提出的算法提高了流数据聚类的稳定性、精确性和可扩展性,具有良好的聚类效果. 展开更多
关键词 流数据 框架 聚类 微簇
下载PDF
基于静电分析器的全自动高精度能谱测量系统
16
作者 李敏 朱洲森 +5 位作者 韩纪锋 师勉恭 周茂蕾 陈桎远 刘东 曲国峰 《原子能科学技术》 EI CAS CSCD 北大核心 2018年第4期705-709,共5页
本文实现了一种基于静电分析器的全自动高精度能谱测量系统,并成功用于微团簇离子束同石墨烯薄膜相互作用的实验研究。基于该高精度能谱测量系统,研究了1.8 MeV的H+2微团簇同4层石墨烯薄膜的相互作用过程,测量了库仑爆炸后的质子能谱和... 本文实现了一种基于静电分析器的全自动高精度能谱测量系统,并成功用于微团簇离子束同石墨烯薄膜相互作用的实验研究。基于该高精度能谱测量系统,研究了1.8 MeV的H+2微团簇同4层石墨烯薄膜的相互作用过程,测量了库仑爆炸后的质子能谱和透射的H+2能谱,实现了全自动的能谱采集,极大提高了数据获取速度,降低了实验误差。测量结果表明,该系统在H+2的入射能量1.8 MeV处的能量分辨约为0.6keV,对于下一步开展基于加速器的高精度能谱测量研究具有重要意义。 展开更多
关键词 微团簇 90°静电分析器 测量系统 能谱测试 石墨烯
下载PDF
一种中心权值流数据聚类算法
17
作者 华峥 杜韬 曲守宁 《通信技术》 2021年第10期2334-2337,共4页
近年来,不确定的聚类中心使得传统的聚类算法面临着巨大的挑战,例如导致了丢失历史数据信息、数据边界不清晰、时间复杂度高等问题。因此,提出了中心加权数据流聚类(Center-Weighted algorithm for clustering data streams,CW-Stream)... 近年来,不确定的聚类中心使得传统的聚类算法面临着巨大的挑战,例如导致了丢失历史数据信息、数据边界不清晰、时间复杂度高等问题。因此,提出了中心加权数据流聚类(Center-Weighted algorithm for clustering data streams,CW-Stream)算法,旨在提高聚类中心的实时性。为了保留历史数据的瞬态特征,并尽可能少地占用存储空间,聚类中心被分配了不同的权重,并使用中心权重算法代替传统的欧几里得距离来调整微簇信息,改进了模糊可扩展策略。此外,采用模糊隶属度矩阵记录动态的数据流信息。与其他经典算法相比,该算法在聚类纯度和效率方面有较好的性能。 展开更多
关键词 数据流 模糊聚类 微簇 中心权值
下载PDF
地震微相分析技术在大港滩海探区的应用 被引量:25
18
作者 张延章 廖前进 +1 位作者 范军侠 赵海宽 《石油勘探与开发》 SCIE EI CAS CSCD 北大核心 2003年第4期58-60,共3页
在大港滩海探区 ,依据复杂构造和复杂储集层分布区的不同地震 地质条件 ,优化选取地震微相聚类分析、地震沿层相干分析、地震属性信息优化、神经网络地震波形分类、全三维储集层特征反演等多种地球物理技术 ,进行地震微相分析和沉积微... 在大港滩海探区 ,依据复杂构造和复杂储集层分布区的不同地震 地质条件 ,优化选取地震微相聚类分析、地震沿层相干分析、地震属性信息优化、神经网络地震波形分类、全三维储集层特征反演等多种地球物理技术 ,进行地震微相分析和沉积微相划分 ,并结合构造背景资料 ,预测岩性圈闭可能发育的区带 ,获得了很好的钻探效果 ,证明在当前技术条件下 ,以宏观沉积相模型为指导 ,应用多种地震微相分析技术进行砂体和岩性油藏分布的预测研究是行之有效的。图 4参 展开更多
关键词 地震微相聚类分析 沿层相干分析 地震属性信息优化 神经网络地震波形分类 储集层特征反演
下载PDF
密度峰值聚类算法研究综述 被引量:2
19
作者 王森 邢帅杰 刘琛 《华东交通大学学报》 2023年第1期106-116,共11页
密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标... 密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标签分配存在链式问题,时间复杂度较高等。文章对DPC算法的研究现状进行了总结与整理,首先介绍了DPC的算法原理和流程;其次,针对DPC算法的不足对DPC算法的优化进行概括和分析,指出了优化算法的核心技术以及优缺点;最后,对DPC算法未来可能面对的挑战和发展趋势进行展望。 展开更多
关键词 聚类算法 密度峰值 截断距离 初始聚类中心 微簇合并 时间复杂度
下载PDF
二阶自然最近邻和多簇合并的密度峰值聚类算法
20
作者 张紫丹 徐华 杨重阳 《计算机应用研究》 CSCD 北大核心 2023年第12期3559-3565,共7页
密度峰值聚类(density peaks clustering, DPC)算法基于局部密度和相对距离识别簇中心,忽视了样本所处环境对样本点密度的影响,因此不容易发现低密度区域的簇中心;DPC算法采用的单步分配策略的容错性差,一旦一个样本点分配错误,将导致... 密度峰值聚类(density peaks clustering, DPC)算法基于局部密度和相对距离识别簇中心,忽视了样本所处环境对样本点密度的影响,因此不容易发现低密度区域的簇中心;DPC算法采用的单步分配策略的容错性差,一旦一个样本点分配错误,将导致后续一系列样本点分配错误。针对上述问题,提出二阶自然最近邻和多簇合并的密度峰值聚类算法(TNMM-DPC)。首先,引入二阶自然邻居的概念,同时考虑样本点的密度与样本点所处的环境,重新定义了样本点的局部密度,以降低类簇的疏密对类簇中心选择的影响;其次,定义了核心点集来选取初始微簇,依据样本点与微簇间的关联度对样本点进行分配;最后引入了邻居边界点集的概念对相邻的子簇进行合并,得到最终的聚类结果,避免了分配错误连带效应。在人工数据集和UCI数据集上,将TNMM-DPC算法与DPC及其改进算法进行了对比,实验结果表明,TNMM-DPC算法能够解决DPC算法所存在的问题,可以有效聚类人工数据集和UCI数据集。 展开更多
关键词 密度峰值 自然邻居 局部密度 核心点集 子簇合并
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部