期刊文献+
共找到46,954篇文章
< 1 2 250 >
每页显示 20 50 100
基于R语言的负荷预测ARIMA模型并行化研究 被引量:62
1
作者 麦鸿坤 肖坚红 +1 位作者 吴熙辰 陈驰 《电网技术》 EI CSCD 北大核心 2015年第11期3216-3220,共5页
自回归求和移动平均(autoregressive integrated moving average,ARIMA)模型常在R语言环境下被用于电力负荷数据的分析和预测。然而,面对海量数据背景下的工程应用,R环境下ARIMA模型的运行效率无法达到令人满意的程度。针对此问题,通过J... 自回归求和移动平均(autoregressive integrated moving average,ARIMA)模型常在R语言环境下被用于电力负荷数据的分析和预测。然而,面对海量数据背景下的工程应用,R环境下ARIMA模型的运行效率无法达到令人满意的程度。针对此问题,通过JAVA与R的实时通信,充分利用JAVA丰富的开源资源与R强大的统计计算功能,在JAVA中进行程序的逻辑判断,在R中进行数值计算,采用混合编程,最后完成ARIMA模型接口的封装,实现了基于负荷数据预测的ARIMA模型的串行化程序。在串行程序完成的基础上,根据电力负荷特性,对数据进行划分,结合JAVA多线程技术,实现了ARIMA模型的并行化。最后,结合文中提出的复合评价指标,对安徽地区随机获取的用户电力负荷进行了测试。结果表明,ARIMA模型并行算法预测准确率好,代码执行效率高。 展开更多
关键词 电力负荷预测 ARIMA JAVA R语言 并行化
下载PDF
程序自动并行化系统 被引量:34
2
作者 朱传琪 臧斌宇 陈彤 《软件学报》 EI CSCD 北大核心 1996年第3期180-186,共7页
有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术... 有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术.测试结果表明AFT系统在功能上已超越了传统的自动并行化系统. 展开更多
关键词 程序并行化 并行计算机 自动并行化系统
下载PDF
基于Hadoop平台的海量文本分类的并行化 被引量:35
3
作者 向小军 高阳 +1 位作者 商琳 杨育彬 《计算机科学》 CSCD 北大核心 2011年第10期184-188,共5页
文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据。在Ha-doop分布式平台下实现了一简单... 文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据。在Ha-doop分布式平台下实现了一简单有效的文本分类算法——TFIDF分类算法,即一种基于向量空间模型的分类算法,它用余弦相似度得到分类结果。在两个数据集上做了实验,结果表明,这一并行化算法在大数据集上很有效并可以在实际领域中得到良好的应用。 展开更多
关键词 文本分类 并行化 海量数据 HADOOP
下载PDF
基于FPGA的卷积神经网络加速器 被引量:36
4
作者 余子健 马德 +1 位作者 严晓浪 沈君成 《计算机工程》 CAS CSCD 北大核心 2017年第1期109-114,119,共7页
现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能... 现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能够完成20次乘累加,从而提升运算效率。针对MNIST手写数字字符识别的实验结果表明,在75 MHz的工作频率下,该加速器可使FPGA峰值运算速度达到0.676 GMAC/s,相较通用CPU平台实现4倍加速,而功耗仅为其2.68%。 展开更多
关键词 卷积神经网络 现场可编程门阵列 加速器 流水线 并行化
下载PDF
并行化遗传算法研究综述 被引量:34
5
作者 冯智莉 易国洪 +2 位作者 李普山 黎慧源 代瑜 《计算机应用与软件》 北大核心 2018年第11期1-7,80,共8页
说明遗传算法的基本思想和特点。根据近五年国内遗传算法的研究现状,分析遗传算法当前发展的潜力与不足。对遗传算法未来的发展和研究热点进行了推理,指出遗传算法的主要发展方向是并行化,研究热点将集中在早熟机理和参数设置等方面,并... 说明遗传算法的基本思想和特点。根据近五年国内遗传算法的研究现状,分析遗传算法当前发展的潜力与不足。对遗传算法未来的发展和研究热点进行了推理,指出遗传算法的主要发展方向是并行化,研究热点将集中在早熟机理和参数设置等方面,并且遗传算法未来会跟其他的技术进一步结合。从遗传算法的主要环节入手,分析遗传算法的并行化策略和4种常见的并行化模型,并分析不同模型使用的硬件环境和模型的优缺点。对并行化遗传算法的评价模型进行讨论,说明了常见的评价模型和改进之处。 展开更多
关键词 经典遗传算法 并行化 性能评估
下载PDF
基于SMP集群的多层次并行编程模型与并行优化技术 被引量:25
6
作者 单莹 吴建平 王正华 《计算机应用研究》 CSCD 北大核心 2006年第10期254-256,260,共4页
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行... 详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行优化技术,并指出单处理器性能优化是提高并行程序性能一个不容忽视的问题。 展开更多
关键词 SMP集群 MPI/OpenMP 并行 优化 单处理器性能优化
下载PDF
基于云计算和改进K-means算法的海量用电数据分析方法 被引量:29
7
作者 张承畅 张华誉 +1 位作者 罗建昌 何丰 《计算机应用》 CSCD 北大核心 2018年第1期159-164,共6页
针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进K-means算法的海量用电数据分析方法研究。针对传统K-means算法中存在初始聚类中心和K值难确定的问题,提出一种基于密度的Kmeans改进算法。首先,定义样本密度、... 针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进K-means算法的海量用电数据分析方法研究。针对传统K-means算法中存在初始聚类中心和K值难确定的问题,提出一种基于密度的Kmeans改进算法。首先,定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,通过最大权值积法依次确定聚类中心,提高了聚类的准确率;然后,基于MapReduce模型实现改进算法的并行化,提高了聚类的效率;最后,以小区400户家庭用电数据为基础,进行海量电力数据的挖掘分析实验。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明提出的改进K-means算法运行稳定、可靠,具有很好的聚类效果。 展开更多
关键词 用电数据 云计算 改进K-MEANS算法 MAPREDUCE模型 并行化
下载PDF
基于MapReduce模型的并行遗传k-means聚类算法 被引量:22
8
作者 贾瑞玉 管玉勇 李亚龙 《计算机工程与设计》 CSCD 北大核心 2014年第2期657-660,共4页
为了提高遗传k-means算法时间效率和聚类结果的正确率,利用遗传算法的粗粒度并行化设计思想,提出了在Hadoop平台下将遗传k-means算法进行并行化设计。将各个子种群编号作为个体区分,个体所包含的各个聚类中心和其适应度作为值共同作为... 为了提高遗传k-means算法时间效率和聚类结果的正确率,利用遗传算法的粗粒度并行化设计思想,提出了在Hadoop平台下将遗传k-means算法进行并行化设计。将各个子种群编号作为个体区分,个体所包含的各个聚类中心和其适应度作为值共同作为个体的输入;在并行化过程中,设计了较优的种群迁移策略来避免早熟现象的发生。实验对不同的数据集进行处理,实验结果表明,并行化的遗传k-means算法在处理较大数据集时比传统的串行算法在时间上和最后的结果上都具有明显的优越性。 展开更多
关键词 遗传算法 K-MEANS算法 MAPREDUCE模型 HADOOP平台 并行化
下载PDF
Parallel naive Bayes algorithm for large-scale Chinese text classification based on spark 被引量:21
9
作者 LIU Peng ZHAO Hui-han +3 位作者 TENG Jia-yu YANG Yan-yan LIU Ya-feng ZHU Zong-wei 《Journal of Central South University》 SCIE EI CAS CSCD 2019年第1期1-12,共12页
The sharp increase of the amount of Internet Chinese text data has significantly prolonged the processing time of classification on these data.In order to solve this problem,this paper proposes and implements a parall... The sharp increase of the amount of Internet Chinese text data has significantly prolonged the processing time of classification on these data.In order to solve this problem,this paper proposes and implements a parallel naive Bayes algorithm(PNBA)for Chinese text classification based on Spark,a parallel memory computing platform for big data.This algorithm has implemented parallel operation throughout the entire training and prediction process of naive Bayes classifier mainly by adopting the programming model of resilient distributed datasets(RDD).For comparison,a PNBA based on Hadoop is also implemented.The test results show that in the same computing environment and for the same text sets,the Spark PNBA is obviously superior to the Hadoop PNBA in terms of key indicators such as speedup ratio and scalability.Therefore,Spark-based parallel algorithms can better meet the requirement of large-scale Chinese text data mining. 展开更多
关键词 Chinese text classification naive Bayes SPARK HADOOP resilient distributed dataset parallelization
下载PDF
基于大数据集的协同过滤算法的并行化研究 被引量:19
10
作者 李改 潘嵘 +1 位作者 李章凤 李磊 《计算机工程与设计》 CSCD 北大核心 2012年第6期2437-2441,共5页
通过对基于ALS的协同过滤算法及分布式Hadoop平台的相关特性进行深入研究,将基于ALS的协同过滤算法在Hadoop上进行并行化,解决了传统的基于ALS的协同过滤算法在大规模数据集上的运算问题。经过实验验证,在Ha-doop平台上实现的并行化的AL... 通过对基于ALS的协同过滤算法及分布式Hadoop平台的相关特性进行深入研究,将基于ALS的协同过滤算法在Hadoop上进行并行化,解决了传统的基于ALS的协同过滤算法在大规模数据集上的运算问题。经过实验验证,在Ha-doop平台上实现的并行化的ALS协同过滤算法不仅能够保证实验结果的准确性,而且与单节点上实现的算法相比,运算效率显著提高。 展开更多
关键词 推荐系统 协同过滤 HADOOP 交叉最小二乘法 并行化
下载PDF
融合气象数据的并行化航班延误预测模型 被引量:19
11
作者 吴仁彪 李佳怡 屈景怡 《信号处理》 CSCD 北大核心 2018年第5期505-512,共8页
针对航空数据呈现高维化、海量化趋势但传统模型处理大数据时单机计算资源不足的问题,本文提出一种基于Spark并融合气象数据的并行化航班延误预测模型。该模型利用数据框完成航班数据和气象数据的融合,从而在单个航班数据后加入不同小... 针对航空数据呈现高维化、海量化趋势但传统模型处理大数据时单机计算资源不足的问题,本文提出一种基于Spark并融合气象数据的并行化航班延误预测模型。该模型利用数据框完成航班数据和气象数据的融合,从而在单个航班数据后加入不同小时的气象数据。然后,采用并行化方式进行随机森林的特征划分和树的生成,可快速进行航班延误预测。实验结果表明融入气象数据后查全率和正确率均有提高,针对不同阈值的延误时间进行预测时,大阈值的预测准确率更高。同时,并行化模型分类强度高、相关性弱,具有较好的模型泛化误差,较单机模型更快收敛,具有较强的加速比。 展开更多
关键词 航班延误预测 随机森林 并行化 数据融合
下载PDF
Improvement and performance of parallel multilevel fast multipole algorithm 被引量:16
12
作者 Zhanhe Liu Peilin Huang +1 位作者 Zhe Wu Xu Gao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2011年第1期164-169,共6页
The method of establishing data structures plays an important role in the efficiency of parallel multilevel fast multipole algorithm(PMLFMA).Considering the main complements of multilevel fast multipole algorithm(M... The method of establishing data structures plays an important role in the efficiency of parallel multilevel fast multipole algorithm(PMLFMA).Considering the main complements of multilevel fast multipole algorithm(MLFMA) memory,a new parallelization strategy and a modified data octree construction scheme are proposed to further reduce communication in order to improve parallel efficiency.For far interaction,a new scheme called dynamic memory allocation is developed.To analyze the workload balancing performance of a parallel implementation,the original concept of workload balancing factor is introduced and verified by numerical examples.Numerical results show that the above measures improve the parallel efficiency and are suitable for the analysis of electrical large-scale scattering objects. 展开更多
关键词 multilevel fast multipole algorithm(MLFMA) electromagnetic scattering parallelization radar cross section(RCS).
下载PDF
基于Hadoop的多维关联规则挖掘算法研究及应用 被引量:18
13
作者 杨青 张亚文 +1 位作者 张琴 袁佩玲 《计算机工程与科学》 CSCD 北大核心 2019年第12期2127-2133,共7页
传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分... 传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分布式框架相结合,实现了多维关联规则挖掘算法的并行化。将IPApriori算法运用到手机用户行为预测关联分析中,分析影响手机用户行为的一些主要因素,挖掘出手机用户行为与年龄维度、性别维度、时间维度、地点维度和手机品牌维度属性之间可能存在的某种关联。最后通过实验证明,算法的并行化和建立结构的方法可以降低系统的I/O负荷,提高算法的执行效率。 展开更多
关键词 APRIORI算法 HADOOP 多维关联规则 并行化
下载PDF
共享信息素矩阵:一种新的并行ACO方法 被引量:11
14
作者 吕强 高彦明 钱培德 《自动化学报》 EI CSCD 北大核心 2007年第4期418-421,共4页
提出并实现了一种新的蚁群优化(ACO)并行化策略SHOP(Sharing one pheromone matrix).主要思想是基于多蚁群在解的构造过程和信息素更新过程中共享同一个信息素矩阵.以ACS和MMAS的SHOP并行实现为例,简要描述了SHOP设计思想和实现过程,... 提出并实现了一种新的蚁群优化(ACO)并行化策略SHOP(Sharing one pheromone matrix).主要思想是基于多蚁群在解的构造过程和信息素更新过程中共享同一个信息素矩阵.以ACS和MMAS的SHOP并行实现为例,简要描述了SHOP设计思想和实现过程,尝试了ACS和MMAS并行混合.以对称TSP测试集为对象,将SHOP的实现与相应串行算法在相同计算环境下的实验结果比较,以及与现有的并行实现进行比较,结果表明SHOP并行策略相对于串行ACO及现有的并行策略具有一定的优势. 展开更多
关键词 蚁群优化 并行 共享信息素矩阵
下载PDF
大数据环境下基于SVM-WNB的网络舆情分类研究 被引量:17
15
作者 张宸 韩夏 《统计与决策》 CSSCI 北大核心 2017年第14期45-48,共4页
当前网络舆情信息存在数据量大、流动快及数据非结构化等特点,难以实现对其快速、准确的分类。SVM算法和朴素贝叶斯算法都是性能优秀的传统分类算法,但无法满足快速处理海量数据。文章利用Ha-doop平台可并行处理分布式数据存储的优良特... 当前网络舆情信息存在数据量大、流动快及数据非结构化等特点,难以实现对其快速、准确的分类。SVM算法和朴素贝叶斯算法都是性能优秀的传统分类算法,但无法满足快速处理海量数据。文章利用Ha-doop平台可并行处理分布式数据存储的优良特性,提出了HSVM_WNB分类算法,将采集的舆情文档依照HDFS架构进行本地化存储,并通过MapReduce进程完成并行分类处理。最后利用实验验证,本算法能够有效提升网络舆情分类能力与分类效率。 展开更多
关键词 大数据 网络舆情 Hadoop云平台 SVM-WNB算法 并行处理
下载PDF
Web应用前后端融合的遗传算法并行化测试用例生成 被引量:17
16
作者 王微微 李奕超 +1 位作者 赵瑞莲 李征 《软件学报》 EI CSCD 北大核心 2020年第5期1314-1331,共18页
Web应用测试用例生成并行化是提升Web应用测试生成效率的一个有效手段.Web应用的前后端分离、事件驱动等特性,导致传统的并行化技术难以直接应用于Web应用的测试用例自动生成中.因此,如何针对Web应用进行并行化测试用例生成,是一项具有... Web应用测试用例生成并行化是提升Web应用测试生成效率的一个有效手段.Web应用的前后端分离、事件驱动等特性,导致传统的并行化技术难以直接应用于Web应用的测试用例自动生成中.因此,如何针对Web应用进行并行化测试用例生成,是一项具有挑战性的工作.将种群并行化计算引入到基于遗传算法的Web应用前后端融合的测试用例生成中,通过线程池及调度逻辑设计、多浏览器进程管理及后端覆盖路径获取,实现种群个体在多浏览器上的并行化执行及基于后端路径覆盖的适应度值并行化计算,以更高效地生成Web应用的测试用例.实验结果表明:相对于Web应用的GA串行化测试用例生成方法,所提的并行化测试生成方法能够更充分地利用系统资源,极大地提升Web应用测试用例的生成效率. 展开更多
关键词 WEB应用测试 测试用例生成 遗传算法 并行化 敏感路径
下载PDF
基于电力大数据的多源异构数据融合技术研究与应用 被引量:17
17
作者 毛先胤 文屹 +3 位作者 马晓红 黄欢 张辉 余容 《电力大数据》 2020年第8期33-39,共7页
为解决当前电力系统存在自动化系统繁多.数据标准多祥,信息内容重复等问题,进一步提高电力大数据的鲜活性、现势性和准确性,降低数据采集成本,提高数据利用价值。本文通过分析电力大数据存在的问题,选取基于MapReduce框架下的Hermite正... 为解决当前电力系统存在自动化系统繁多.数据标准多祥,信息内容重复等问题,进一步提高电力大数据的鲜活性、现势性和准确性,降低数据采集成本,提高数据利用价值。本文通过分析电力大数据存在的问题,选取基于MapReduce框架下的Hermite正交基前向神经网络算法。本方法利用MapReduce框架将大样本并行化处理,解决了BP神经网络存在的收敛速度慢、局部极小点、网络结构不确定等缺点。本文实验首先从教据集的选取,以Hadop为基础搭建实验平台,将风电场历史监测数据作为源数据,并将其分为几组容量不同的数据分别进行风电场功率预测的实验分析。通过实验结果的对比表明本文提出的基于MapReduce框架下的Hermite正交基前向神经网络算法较传统的BP神经网络算法在功率预测上精度更准确、效率更高。 展开更多
关键词 电力大数据 数据融合 并行化 神经网络算法 分布式系统基础架构
下载PDF
基于CUDA的并行全搜索运动估计算法 被引量:15
18
作者 甘新标 沈立 王志英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第3期457-460,共4页
为了提高H.264视频编码效率,基于计算统一设备架构(CUDA)的并行全搜索运动估计算法,并利用GPU强大的计算能力和CUDA优化的存储层次结构,以加速H.264编码中的运动估计.与传统的以牺牲视频质量来提升运动估计性能的方法不同,该算法在保证... 为了提高H.264视频编码效率,基于计算统一设备架构(CUDA)的并行全搜索运动估计算法,并利用GPU强大的计算能力和CUDA优化的存储层次结构,以加速H.264编码中的运动估计.与传统的以牺牲视频质量来提升运动估计性能的方法不同,该算法在保证视频质量的同时,结合运动估计计算密集、计算量大等特点,充分利用CUDA架构的并行性加快运动估计的速度,从而达到提高实时编码速度的目的.在GTX280实验平台上的实验结果显示,采用文中算法比优化的CPU实现可获得高达70倍的加速比. 展开更多
关键词 图形处理器 运动估计 并行 CUDA
下载PDF
基于网络等效的配电网快速供电恢复策略并行化实现 被引量:16
19
作者 茅逸斐 韩蓓 +3 位作者 李国杰 张利军 徐晨博 孙轶恺 《电力系统保护与控制》 EI CSCD 北大核心 2018年第11期99-108,共10页
现代智能配电网在故障后可以调度需求侧的"灵活源"实现快速供电恢复。针对智能配电网的特点,提出了一种基于网络等效和并行化实现的快速供电恢复策略,能够灵活地利用电网资源以应对不同的失电情况。算法将支援线路等效为电源... 现代智能配电网在故障后可以调度需求侧的"灵活源"实现快速供电恢复。针对智能配电网的特点,提出了一种基于网络等效和并行化实现的快速供电恢复策略,能够灵活地利用电网资源以应对不同的失电情况。算法将支援线路等效为电源节点(称为等效源点),采用离线等效源点预存储与实时等效源点并行计算相结合的模式:保存并优先使用离线数据;在失电负荷较大时,调取实时数据对不同的调度可能进行并行计算。为进一步提升算法的时效性,利用改进邻接矩阵记录和维护电网拓扑结构,实现网络的高效重构。通过若干个算例,验证了该供电恢复策略在面对不同程度失电时均能合理高效地运用电网的各类支援资源,实现快速供电恢复。 展开更多
关键词 供电恢复 智能配电网 网络等效 并行化 邻接矩阵
下载PDF
基于Isolation Forest的并行化异常探测设计 被引量:15
20
作者 侯泳旭 段磊 +2 位作者 秦江龙 秦攀 唐常杰 《计算机工程与科学》 CSCD 北大核心 2017年第2期236-244,共9页
异常探测具有广泛的应用,受到了工业界和学术界的共同关注。在众多异常探测方法中,Isolation Forest算法具有执行效率高、探测准确度好的特点,获得了众多应用。但是,传统Isolation Forest算法难以处理大规模数据。为解决此问题,设计了... 异常探测具有广泛的应用,受到了工业界和学术界的共同关注。在众多异常探测方法中,Isolation Forest算法具有执行效率高、探测准确度好的特点,获得了众多应用。但是,传统Isolation Forest算法难以处理大规模数据。为解决此问题,设计了一种基于云计算平台的算法。具体地,使用Hadoop分布式存储系统和MapReduce分布式计算框架设计并实现了基于Isolation Forest的并行化异常探测算法PIFH。通过将探测模型构建和数据异常评价的过程并行化,提升了PIFH算法探测异常的执行效率,扩展了其应用范围。利用真实世界数据集验证了所提算法的执行效率和可扩展性。 展开更多
关键词 异常探测 云计算 并行化
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部