期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于SVM的并行网络流量分类方法 被引量:7
1
作者 裴杨 王勇 +1 位作者 陶晓玲 李平红 《计算机工程与设计》 CSCD 北大核心 2013年第8期2646-2650,共5页
针对SVM(support vector machine)算法应用到大规模网络流量分类中存在计算复杂度高、训练速度慢等问题,提出一种基于云计算平台进行并行网络流量分类的SVM方法,以提高对大数据集的分类训练速度。该方法是一种采用云计算平台构建多级SV... 针对SVM(support vector machine)算法应用到大规模网络流量分类中存在计算复杂度高、训练速度慢等问题,提出一种基于云计算平台进行并行网络流量分类的SVM方法,以提高对大数据集的分类训练速度。该方法是一种采用云计算平台构建多级SVM和映射规约(MapReduce)模型的方法。它将训练数据集划分为多个子训练数据集,通过对所有子训练数据集进行并行训练,得到支持向量集,进而训练出流量分类模型。实验结果表明,与传统的SVM方法相比,并行SVM网络流量分类方法在保持较高分类精度的前提下,有效地减少了训练时间,提高了大规模网络流量分类的速度。 展开更多
关键词 网络流量分类 支持向量机 并行 映射规约 云计算
下载PDF
基于粒计算的决策树并行算法的应用 被引量:5
2
作者 周浩 刘萍 +1 位作者 邱桃荣 白小明 《计算机工程与设计》 北大核心 2015年第6期1504-1509,共6页
针对传统的决策树分类算法不能有效解决海量数据挖掘的问题,结合并行处理模型MapReduce,研究基于粒计算的ID3决策树分类的并行化处理方法。基于信息粒的二进制表示来构建属性的二进制信息粒向量,给出数据集的二进制信息粒关联矩阵表示;... 针对传统的决策树分类算法不能有效解决海量数据挖掘的问题,结合并行处理模型MapReduce,研究基于粒计算的ID3决策树分类的并行化处理方法。基于信息粒的二进制表示来构建属性的二进制信息粒向量,给出数据集的二进制信息粒关联矩阵表示;基于二进制信息粒关联矩阵,提出属性的信息增益的计算方法,设计基于MapReduce的粒计算决策树并行分类算法。通过使用标准数据集和实际气象领域的雷电真实数据集进行测试,验证了该算法的有效性。 展开更多
关键词 粒计算 并行 映射规约 决策树 信息增益
下载PDF
一种基于Hadoop架构的网络舆情热点话题挖掘方法 被引量:3
3
作者 周建华 《河北北方学院学报(自然科学版)》 2014年第6期19-24,共6页
为解决在海量数据中实时、精准挖掘网络舆情热点话题的问题,提出一种基于Hadoop的网络舆情数据分析模型。对于话题发现核心模块,给出一种WCGFMR网络舆情热点话题挖掘算法,采用Map(映射)和Reduce(规约)规则进行舆情文本特征分组加权策略... 为解决在海量数据中实时、精准挖掘网络舆情热点话题的问题,提出一种基于Hadoop的网络舆情数据分析模型。对于话题发现核心模块,给出一种WCGFMR网络舆情热点话题挖掘算法,采用Map(映射)和Reduce(规约)规则进行舆情文本特征分组加权策略。实验结果表明,采用基于Hadoop架构的WCGFMR算法进行热点话题挖掘,热点话题的平均召回率达到85.32%,平均话题类纯度达到95.36%。随舆情数据集增大到2GB后,在Map数一定的条件下,多任务数Reduce执行时间相比少任务数Reduce大大缩短,数据中热点话题挖掘速度显著提高。 展开更多
关键词 网络舆情 HADOOP 热点话题 模糊聚类 映射规约
下载PDF
基于电网大数据调度支撑电能质量数据治理应用体系研究 被引量:2
4
作者 李炜 马乐 +2 位作者 袁昊 李兴 宋芳 《电子测试》 2019年第1期88-90,共3页
随着信息技术的发展与数据量的膨胀,将现场数据采集传输形成大数据进行分析,已经成为电能质量数据治理的时下趋势,传统的数据存储、数据处理体系与方法已经不能满足数据治理的要求,为此,结合大数据技术,提出了基于大数据调度支撑的电能... 随着信息技术的发展与数据量的膨胀,将现场数据采集传输形成大数据进行分析,已经成为电能质量数据治理的时下趋势,传统的数据存储、数据处理体系与方法已经不能满足数据治理的要求,为此,结合大数据技术,提出了基于大数据调度支撑的电能质量数据治理应用体系。引入Hadoop云平台,将传统的数据分析转换为大数据存储分析调度,设计出具有Hbase数据存储的电能质量大数据治理体系,又提出基于映射规约分离器的电能质量数据调度方法,对电能质量数据进行解析挖掘。最后通过搭建实验平台,验证大数据调度电能质量数据治理的有效性与可行性。 展开更多
关键词 大数据 电能质量 映射规约 分离器
下载PDF
分布式集群环境下基于并行计算的图聚类信息高效处理方案 被引量:2
5
作者 张博 《自动化技术与应用》 2016年第3期29-35,67,共8页
针对人工智能领域图聚类数据分析与处理能力无法适应于日益复杂的分布式集群环境等问题,提出一种基于并行计算的高效率图聚类信息处理方案。在分布式集群计算环境下对超大规模、超大区域范围图数据信息的稀疏化分析与处理机制上,通过对M... 针对人工智能领域图聚类数据分析与处理能力无法适应于日益复杂的分布式集群环境等问题,提出一种基于并行计算的高效率图聚类信息处理方案。在分布式集群计算环境下对超大规模、超大区域范围图数据信息的稀疏化分析与处理机制上,通过对Minhash算法以Map Reduce架构理论进行改进,使其实现对数据的并行化分析处理,确保能够在日益复杂的分布式集群计算环境下高效处理图聚类数据信息。实验表明,改进方案不仅可行,而且能够对图聚类数据信息进行快速稀疏化处理,具有一定的高效性。 展开更多
关键词 人工智能 数据挖掘 映射规约 图聚类 最小哈希算法
下载PDF
基于云平台的软件服务流的实现机制的研究 被引量:2
6
作者 陈亮 东韩 +2 位作者 徐凌宇 蔡茂 杜金峰 《计算机工程与设计》 CSCD 北大核心 2012年第11期4196-4199,共4页
简单的SaaS模型已经无法满足用户日益增长的功能需要,SaaS模型正由简单的软件复用向流的形式发展。为此结合工作流与SaaS的思想,提出了软件服务流的概念。在对用户的需求进行了研究的基础上,发现大规模访问,高并发以及单位时间的密集访... 简单的SaaS模型已经无法满足用户日益增长的功能需要,SaaS模型正由简单的软件复用向流的形式发展。为此结合工作流与SaaS的思想,提出了软件服务流的概念。在对用户的需求进行了研究的基础上,发现大规模访问,高并发以及单位时间的密集访问在软件服务流平台上是一种常态。因为平台要提供Web端的用户访问,因而平台要对Web端提供直接的访问接口,并提供监控支持。同时作为云平台,其在使用时支持用户的透明访问,并支持映射规约(MapReduce)程序及其分布式存储。结合实例,对平台进行了实验分析,表明了平台的可用性和高效性。 展开更多
关键词 云计算 软件服务流 HADOOP分布式文件系统 映射规约 数据处理
下载PDF
PetroV分布式数据存储与分析框架设计 被引量:4
7
作者 盛秀杰 金之钧 彭成 《石油地球物理勘探》 EI CSCD 北大核心 2017年第4期875-883,共9页
随着三维地震数据采集、油气田开发等系列新技术带来的快速数据更新,大数据背景下三维数据体的高效存储与处理分析变得越来越复杂。在参考GFS(Google File System,谷歌文件系统)设计理念和消化其关键分布式处理技术的基础上,本文设计了P... 随着三维地震数据采集、油气田开发等系列新技术带来的快速数据更新,大数据背景下三维数据体的高效存储与处理分析变得越来越复杂。在参考GFS(Google File System,谷歌文件系统)设计理念和消化其关键分布式处理技术的基础上,本文设计了PetroV(Petroleum Valuation,勘探部署决策一体化软件系统)最新软件架构并研发了系列大数据存储与分析的关键软件技术。利用三维空间下八叉树结构与编码的快速空间定位和多分辨率机制,实现对三维大数据体的结构分层、分块存储与二级内存缓存框架,支持并发访问和不同分辨率流式显示。由数据存取客户端、元数据服务和子数据块存取服务组成的八叉树分布式存储框架,屏蔽了基于八叉树切分后子体数据块在上百台计算机的后台冗余或备份存储事实,实现了几乎与单机文件系统接口一致的分布式文件存取接口;由任务执行客户端、任务管理服务和面向地震、数字岩心或测井数据的系列专业解释算法服务组成的分布式大数据分析框架,利用八叉树分块存储的特点实现"分而治之"并行编程模型,显著降低并行编程模型实现的复杂度。大数据下PetroV软件体系架构设计及衍生的系列专业软件版本,最终目的是希望能够推动应用导向与新技术发展深度结合,持续追求卓越,增强自主创新能力。 展开更多
关键词 分布式存储与计算 八叉树 映射规约(Map-Reduce) PetroV
下载PDF
中压配电网规划中供电分区划分方法研究 被引量:1
8
作者 何丽娟 贺洁 金鑫 《微型电脑应用》 2022年第5期116-119,共4页
针对中压配电网规划中输电能力较弱,分区划分困难的问题,采用映射规约技术将各中压用户复杂的电力数据进行梳理,并根据梳理结果划分为各区域供电等值模型,完成配电网的自动划分;通过建立的等值模型对供电分区电力进行线路规划,应用三角... 针对中压配电网规划中输电能力较弱,分区划分困难的问题,采用映射规约技术将各中压用户复杂的电力数据进行梳理,并根据梳理结果划分为各区域供电等值模型,完成配电网的自动划分;通过建立的等值模型对供电分区电力进行线路规划,应用三角形联结的方式将供电区域电路划分为等值的线路,提高输电能力的同时增加电网稳定性;利用动态规划检测前跟踪(Dynamic Programming-Track Before Detect DP-TBD)对等值模型输电情况进行分析。通过试验,提出方案供电等值模型最大输电量为10 kV,运行稳定性达到85%以上。 展开更多
关键词 中压配电网 供电分区 映射规约技术 供电分区等值模型 DP-TBD算法
下载PDF
中压配电网规划中供电分区划分方法研究
9
作者 阿力木江·艾尔肯 《中文科技期刊数据库(全文版)工程技术》 2022年第9期172-175,共4页
技术的进步使电力事业得到发展,而智能电网技术可以推动电力实业的发展,能够进一步保证电网在运行过程中的安全性、可靠性,为用户提供良好的效果。在新时期,配电技术要与科学进行有效结合,并在现代配电网规划中不断适应社会发展的要求,... 技术的进步使电力事业得到发展,而智能电网技术可以推动电力实业的发展,能够进一步保证电网在运行过程中的安全性、可靠性,为用户提供良好的效果。在新时期,配电技术要与科学进行有效结合,并在现代配电网规划中不断适应社会发展的要求,重视配电网技术的有效应用,提高配电网的安全性,这样才能进一步推动我国经济水平的增长,满足人们日常工作生活所需,为我国经济发展建设作出贡献。 展开更多
关键词 中压配电网 供电分区 映射规约技术 供电分区等值模型
下载PDF
基于文档数据库的全栈式地理空间数据传播模型
10
作者 梅继赟 杜震洪 刘仁义 《计算机应用研究》 CSCD 北大核心 2010年第9期3390-3394,共5页
针对基于关系型数据库的地理信息传播模型在互联网虚拟计算环境下的不足,提出了一种基于文档数据库的全栈式地理信息传播模型。该模型以多粒度地理特征的映射规约分析计算和文档数据库的多版本并发控制为框架,用统一的内建域指定语言作... 针对基于关系型数据库的地理信息传播模型在互联网虚拟计算环境下的不足,提出了一种基于文档数据库的全栈式地理信息传播模型。该模型以多粒度地理特征的映射规约分析计算和文档数据库的多版本并发控制为框架,用统一的内建域指定语言作为传播媒介描述载体,结合数据的运行时元编程和地理服务的REST风格部署,实现地理空间数据的动态开放式传播,证明非结构化地理空间数据的传播模型能满足逻辑语义和物理存储双重易扩展性。 展开更多
关键词 文档数据库 内建域指定语言 动态映射规约计算 资源描述框架 全栈式地理服务
下载PDF
基于云计算的智能电网大数据处理平台 被引量:44
11
作者 李佳 徐胜超 《计算机工程与设计》 北大核心 2018年第10期3073-3079,共7页
提出基于云计算的智能电网大数据处理平台SP-DPP(smart power system big data processing platform in cloud environment)。讨论智能电网大数据处理的数学模型与电网大数据的任务划分方式。SP-DPP云平台由大数据存储与管理模块、任务... 提出基于云计算的智能电网大数据处理平台SP-DPP(smart power system big data processing platform in cloud environment)。讨论智能电网大数据处理的数学模型与电网大数据的任务划分方式。SP-DPP云平台由大数据存储与管理模块、任务分配与调度模块、大数据执行模块和客户端模块组成。描述SP-DPP云平台处理智能电网大数据的编码方式,以IEEE118节点的电网作为智能电网大数据处理的案例程序。测试结果表明,针对海量的智能电网潮流计算的状态安全大数据的分析需求,SP-DPP平台具有较好的吞吐量与加速比。 展开更多
关键词 智能电网 大数据 映射-规约 云计算 潮流计算
下载PDF
基于Map/Reduce的分布式搜索引擎研究 被引量:9
12
作者 吴宝贵 丁振国 《现代图书情报技术》 CSSCI 北大核心 2007年第8期52-55,共4页
在对Map/Reduce算法进行分析的基础上,利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎,以面对搜索引擎对海量数据的处理和存储问题。
关键词 映射/规约 分布式搜索引擎 HADOOP
下载PDF
基于MapReduce的关联规则增量更新算法 被引量:15
13
作者 朱晓峰 李玲娟 +1 位作者 徐小龙 陈建新 《计算机技术与发展》 2012年第4期115-118,122,共5页
云计算以其强大的存储和计算能力而成为解决海量数据挖掘问题的有效途径。经典的关联规则增量更新算法FUP需要频繁扫描原数据集,不适用于海量数据的处理。文中以提高海量数据上关联规则增量更新效率为目标,将FUP算法与云计算的MapReduc... 云计算以其强大的存储和计算能力而成为解决海量数据挖掘问题的有效途径。经典的关联规则增量更新算法FUP需要频繁扫描原数据集,不适用于海量数据的处理。文中以提高海量数据上关联规则增量更新效率为目标,将FUP算法与云计算的MapReduce编程模式相结合,提出了一种基于MapReduce的关联规则增量更新算法MRFUP。该算法只需扫描原数据集一次,并能充分利用云计算强大的存储和并行计算能力。基于Hadoop的实验结果表明,MRFUP算法可提高对海量数据的处理能力和效率,适用于海量数据的关联规则挖掘。 展开更多
关键词 海量数据挖掘 云计算 映射/规约 关联规则 增量更新
下载PDF
基于MapReduce并行关联挖掘的网络入侵检测 被引量:7
14
作者 徐胜超 宋娟 潘欢 《计算机技术与发展》 2021年第6期123-128,共6页
随着海量大数据的出现,关联数据挖掘算法需要新型计算模式来提高计算速度与运行效率。提出了基于MapReduce并行关联挖掘的网络入侵检测方法Cloud-Apriori。Apriori是一种基于频繁项集的关联规则数据挖掘算法,Cloud-Apriori是经MapReduc... 随着海量大数据的出现,关联数据挖掘算法需要新型计算模式来提高计算速度与运行效率。提出了基于MapReduce并行关联挖掘的网络入侵检测方法Cloud-Apriori。Apriori是一种基于频繁项集的关联规则数据挖掘算法,Cloud-Apriori是经MapReduce云计算并行化后的新算法。Cloud-Apriori利用开源的Hadoop分布式计算框架,采用Hadoop分布式文件系统存储海量数据;结合MapReduce的映射,规约操作,可以把关联挖掘的数据流和任务组成一个有向无环图,方便专业技术人员按照映射-规约的方式进行分布式计算的编程。分析了基于MapReduce的并行关联挖掘的模块组成与实现过程。Cloud-Apriori利用Kddcup的案例数据和网络入侵检测这种大数据应用来仿真算法的效果。实验结果表明:与存在的网络入侵检测算法相比,Cloud-Apriori在检测精度、运行时间上有很好的优势。 展开更多
关键词 云计算 网络入侵检测 关联数据挖掘 映射-规约 并行化
下载PDF
Spark on Yarn模式的电信大数据处理平台 被引量:6
15
作者 杨玉 张远夏 《福建电脑》 2019年第3期34-38,共5页
为了提高电信大数据处理的性能,提出了一种Spark on Yarn模式的电信大数据处理平台SY-TPP(Spark on Yarn Telecommunication Big Data Processing Platform)。SY-TPP平台的实现采用Hadoop2.0的Yarn规范,运用了Spark分布式内存计算框架,... 为了提高电信大数据处理的性能,提出了一种Spark on Yarn模式的电信大数据处理平台SY-TPP(Spark on Yarn Telecommunication Big Data Processing Platform)。SY-TPP平台的实现采用Hadoop2.0的Yarn规范,运用了Spark分布式内存计算框架,使SY-TPP平台数据集的处理尽量在内存中进行。以分级聚类算法为案例分析了SY-TPP平台的编程步骤;测试结果表明:电信运营商的上GB级的用户数据能够半个工作日内完成,32物理节点的SY-TPP平台比同等配置的MapReduce平台的加速比从9.5提升10.25。 展开更多
关键词 云计算 电信大数据 映射-规约 Yarn规范 Spark内存计算
下载PDF
基于Yarn云平台的生物基因多序列比对并行算法 被引量:4
16
作者 邓小燕 徐胜超 《基因组学与应用生物学》 CAS CSCD 北大核心 2019年第7期3009-3015,共7页
为了解决生物信息学中基因多序列比对的计算速度慢和软件陈旧的问题,提出了基于Yarn(Yet Another Resource Negotiator)云平台的生物基因多序列比对并行计算方法Yarn_clustalW。分析了clustalW算法的数学模型及其面向MapReduce的任务划... 为了解决生物信息学中基因多序列比对的计算速度慢和软件陈旧的问题,提出了基于Yarn(Yet Another Resource Negotiator)云平台的生物基因多序列比对并行计算方法Yarn_clustalW。分析了clustalW算法的数学模型及其面向MapReduce的任务划分方式,Yarn_clustalW中综合考虑了基因的长度和数目,采用一种基于阈值刻度的任务划分方式。利用NCBI的GenBank生物基因数据作为案例程序进行了测试。实验结果表明:Yarn_clustalW比起多序列比对clustalW串行计算方法具有更快的运行时间与加速比,可以使生物科研人员节省很多时间与精力,方便对于药物靶标的发现,缩短生物药物的开发周期。 展开更多
关键词 多序列比对 云计算 映射-规约 Yarn框架 生物信息学
原文传递
基于云计算的蛋白质折叠模拟计算 被引量:2
17
作者 徐胜超 《基因组学与应用生物学》 CAS CSCD 北大核心 2019年第6期2551-2557,共7页
为了解决生物信息学中蛋白质折叠模拟计算的速度慢和软件老旧的问题,提出了基于云计算的蛋白质折叠并行化算法Cloud_PERM。分析了PERM算法的运行流程及其面向MapReduce的子任务划分方式。Cloud_PERM算法实现采用Hadoop云计算环境作为工... 为了解决生物信息学中蛋白质折叠模拟计算的速度慢和软件老旧的问题,提出了基于云计算的蛋白质折叠并行化算法Cloud_PERM。分析了PERM算法的运行流程及其面向MapReduce的子任务划分方式。Cloud_PERM算法实现采用Hadoop云计算环境作为工作平台,其蛋白质序列数据的存储与管理、子任务调度及工作单元的执行都由MapReduce规范来透明的完成;实验结果表明:Cloud_PERM比PERM串行计算具有更快的计算速度,在吞吐量和可扩展性上也有明显的优势。Cloud_PERM可以使生物科研人员节省很多时间与精力,有益于新型蛋白质结构预测与生物特性的研究。 展开更多
关键词 蛋白质折叠 云计算 映射规约 并行计算 生物信息学
原文传递
面向云环境的蛋白质折叠模拟计算并行化算法 被引量:1
18
作者 宋华 闫会峰 《科学技术与工程》 北大核心 2018年第5期258-263,共6页
提出了面向云环境Yarn(yet another resource negotiator)规范的蛋白质折叠模拟计算并行化算法Yarn_PERM。分析了蛋白质折叠的格点模型PERM算法的运行流程及其面向MapReduce的子任务划分方式。Yarn_PERM算法实现采用Hadoop2.0的Yarn框... 提出了面向云环境Yarn(yet another resource negotiator)规范的蛋白质折叠模拟计算并行化算法Yarn_PERM。分析了蛋白质折叠的格点模型PERM算法的运行流程及其面向MapReduce的子任务划分方式。Yarn_PERM算法实现采用Hadoop2.0的Yarn框架作为工作平台,其资源的分配与调度、应用子任务的申请和子任务的具体执行都由Yarn来透明地完成;描述了Yarn_PERM算法的Map程序与Reduce程序及主控程序的功能实现。实验结果表明:在相同的时间内Yarn_PERM比PERM串行计算、MapReduce的PERM计算在能量最低寻优的吞吐量上明显增加,加速比和可扩展性上也有明显的优势。 展开更多
关键词 蛋白质折叠 云计算 映射-规约 Yarn规范 生物信息学
下载PDF
基于可拓展机器学习的失真图像视觉复原仿真 被引量:1
19
作者 孙国娇 李长硕 《计算机仿真》 北大核心 2023年第8期240-244,共5页
以获取优质的失真图像复原效果,并提升失真图像复原过程在嵌入环境中的适用性为目的,研究基于可拓展机器学习的失真图像视觉复原方法。基于图像的失真模型,采用机器学习算法中的最小二乘支持向量机的非线性映射能力,选取邻域对像素方法... 以获取优质的失真图像复原效果,并提升失真图像复原过程在嵌入环境中的适用性为目的,研究基于可拓展机器学习的失真图像视觉复原方法。基于图像的失真模型,采用机器学习算法中的最小二乘支持向量机的非线性映射能力,选取邻域对像素方法,构建失真图像与初始图像间的映射关系,依据该关系构建用于失真图像复原的回归模型,将失真图像和初始图像,分别作为回归模型的输入图像与目标图像,通过训练样本对的学习与训练过程,复原失真图像。利用映射—规约模型构建最小二乘支持向量机失真图像复原算法的可拓展架构,分析确定最小二乘支持向量机算法的图像复原并行性,并映射至多个并行失真图像复原处理模块,实现并行化失真图像视觉复原。仿真结果显示,所研究方法复原的失真图像视觉传达均方误差均值低于1.0,复原效果好,具有良好的可拓展性。 展开更多
关键词 可拓展 机器学习 失真图像 视觉复原 支持向量机 映射规约模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部