-
题名基于双重并行计算模型的TFIDF算法
被引量:2
- 1
-
-
作者
孙玉强
巢碧霞
-
机构
常州大学信息科学与工程学院
-
出处
《计算机工程与设计》
北大核心
2016年第11期3016-3021,共6页
-
文摘
针对大数据集下文本分类算法在单机上实现效率低下的问题,提出基于GPU(graphic processing unit)和MapReduce技术的双重并行计算的云计算框架。通过构造双重并行计算的自适应计算过程,结合TFIDF(term frequency inverse document frequency)改进算法的特点,实现基于双重并行自适应计算模型的改进TFIDF算法。实验中,在不同的运行环境下对改进TFIDF算法的运行效率进行对比分析,比较不同计算节点下算法的执行效率,实验结果表明,改进TFIDF算法可实现对海量数据的高速有效处理,随着节点数量的增加,双重并行自适应计算下,算法执行效率更加高效。
-
关键词
tfidf改进算法
MAPREDUCE模型
图形处理器
并行计算
自适应
-
Keywords
improved tfidf algorithm
MapReduce model
GPU
parallel computing
adaptive
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-