期刊文献+

基于Hadoop的微博信息挖掘 被引量:9

Micro-blogs Information Mining Based on Hadoop
下载PDF
导出
摘要 论文设计了基于Hadoop的微博信息挖掘系统。该系统针对单一节点在分析微博海量数据的性能瓶颈问题,利用分布式和虚拟化技术的优势,将微博信息获取和相关数据分析进行有机整合,实现了一个基于Hadoop的微博信息挖掘平台。为验证该平台运行的有效性,论文采用获取热点话题做实验,展示了系统对微博信息的挖掘结果。实验结果表明,该系统能有效获取微博相关信息,高效的处理海量微博数据,得到有价值的数据信息。 This paper designed micro-blogs information mining system based on hadoop.Considering the single node problem,the system uses the advantage of cloud computing—distributed processing and virtualization,organics integration of micro-blogs information and data analysis,implements the micro-blogs information mining platform.To verify the effectiveness and efficiency of the platform,this paper makes an experiment on hot topic and shows the mining results.The experiment results show that the system can get micro-blogs information efficiency,efficient process mass data,and get valuable data information.
作者 林大云
出处 《计算机光盘软件与应用》 2012年第1期7-8,共2页 Computer CD Software and Application
关键词 微博 HADOOP 海量数据 数据挖掘 Micro-blogs Hadoop Mass Data Data Mining
  • 相关文献

参考文献4

二级参考文献17

  • 1王文平,刘希玉,韩杰.基于并行遗传算法的关联规则挖掘[J].山东师范大学学报(自然科学版),2006,21(4):29-31. 被引量:7
  • 2范明,孟小峰.数据挖掘概念与技术[M].北京:北京机械工业出版社,2001. 被引量:2
  • 3李岚.数据挖掘技术在电子商务中的应用[J].通信技术,2007,40(8):74-76. 被引量:6
  • 4http:/Iblog.sina.com.cn/s/blog_48aba5b90100kdu3.html. 被引量:1
  • 5《微博客为什么会成功》,http://hi.baidu.com/soune/blog/item/57bf972b8546abf0e6cd4097.html. 被引量:1
  • 6Sitaram Asur, Bernardo A. Hu- berman, 《Predicting the Future With Social Media》,March, 2009,http://p- apers. ssrn. com/so13/papers. cfm?ab- stract_id=1579522. 被引量:1
  • 7Paul Barle,Michelle Guy,Rich-ard Buckmaster, Chris Ostrum, Scott Horvath,Amy Vaughan: [SRL]OMG Eart- hquake!Can Twitter Improve Earthqu- ake Response?,http://www. seismosoc. org/publications/SRL/SRL_81/sr1_81- 2_es/. 被引量:1
  • 8LAMMEL R.Google's MapReduce Programming Model-Revisited[J].Science of Computer Programming,2008,70(01):1-30. 被引量:1
  • 9GILLICK D,FARIA A,DENERO J.MapReduce:Distributed Computing for Machine Learning[J].UC Berkeley's Computer Science Department,2006(09):51-63. 被引量:1
  • 10Savasere A,Omiecinski E,Navathe S.An Efficient Algorithm for Mining Association Rules in Large Databases[C] //Proceedings of the 21st VLDB Conference.Zurich,Switzerland:[s.n.] ,1995:432-444. 被引量:1

共引文献95

同被引文献61

  • 1周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量:153
  • 2游文,叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展,2006,16(9):70-72. 被引量:54
  • 3AFRATI F,ULLMAN J.Optimizing joins in a map-reduce environment[C]//Proceedings of 2010 EDBT.New York:ACM,2010:99-110. 被引量:1
  • 4JIANG Da-wei,TUNG A,CHEN Gang.Map-join-reduce:towards scalable and efficient data analysis on large clusters[J].IEEE Transactions on Knowledge and Data Engineering,2010,23(9):1299-1311. 被引量:1
  • 5LIN Yu-ting,AGRAWAL D,CHEN Chun,et a1.Llama:leveraging columnar storage for scalable join[C]//Proceedings of2011 ACM SIGMOD International Conference on Management of Data.New York:ACM,2011:861-972. 被引量:1
  • 6赵保学,李战怀,陈群,等.可扩展Hadoop任务分配模块的研究与实现[C]//第29届中国数据库学术会议论文集(B辑)(NDBC2012).合肥:知识与数据工程实验室,2012:83-85. 被引量:1
  • 7DEAN J,GHEMAWAT S.MapReduce:simplified data processing on large cluster[J].Communications of the ACM,2008,51(1):107-113. 被引量:1
  • 8PAPADIMITRIOU A,SYMEONIDIS P,MANOLOPOULOS Y. Fast and ac- create link prediction in social networking systems[J]. Journal of Systems and Software,2012,85(9) :2119 -2132. 被引量:1
  • 9CHA M, HADDADI H, BENEVENUTO F, et al. Measuring user influence in twitter :The million follower fallacy [ C ]//AAAI. Washington, DC, USA: ICWSM .2010:11 - 13. 被引量:1
  • 10BAKSHY E,HOFMAN J M,MASON W A,et al. Everyone' s an influen- cer:Quantifying influence on twitter [ C ]HWSDM. Hong Kong. China, 2011:67 -69. 被引量:1

引证文献9

二级引证文献29

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部