期刊文献+

R软件的数据挖掘应用 被引量:15

Data Mining Application Based on R
下载PDF
导出
摘要 开源R软件集成了各种的数据分析和可视化方法,具备强大的数据分析功能和良好的可扩展性,适用于数据挖掘;结合城市主要经济指标的数据挖掘案例,给出了R软件在挖掘过程中各主要阶段的应用方法;数据准备阶段包括数据抽取、数据选择与统计分析应用;挖掘建模阶段给出了聚类和分类的典型挖掘应用;模型评估阶段给出了决策树的评估方法;从简洁的R语言脚本设计和良好的分析效果,展示了R软件的基本特点和在数据挖掘应用中的优势。 R is open source software integrated with various data analysis and visualization methods. It has powerful data analysis ability and good extendibility; therefore it is adapted to data mining. Through the cities' major economic indicators of mining case, the application methods are presented to complete the main data mining procedures. Data preparation includes data extraction, selection and statistic analysis; mining modeling includes cluster and classification application; model evaluation includes the assessing approach for decision tree. From the concise R script design style and excellent analysis effects, the general features of R and its application advantage in data mining are revealed.
作者 陈荣鑫
出处 《重庆工商大学学报(自然科学版)》 2011年第6期602-607,共6页 Journal of Chongqing Technology and Business University:Natural Science Edition
基金 福建省自然科学基金项目(2008J04005)
关键词 R软件 数据准备 挖掘建模 模型评估 R data preparation mining modeling model evaluation
  • 相关文献

参考文献8

  • 1HANJ KAMBERM.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.. 被引量:45
  • 2VENABLES W N, SMITH D M. R Development Core Team. An introduction to R [EB/OL]. (2011-04-13) [2011-05-01]. http://cran, r-project, org/doc/manuals. 被引量:1
  • 3邵峰晶,于忠清编著..数据挖掘原理与算法[M].北京:中国水利水电出版社,2003:322.
  • 4中国资讯行.中国2009年省会城市和计划单列市主要经济指标统计(中国统计年鉴)[EB/OL].(2009-12-31)[2011-05-01].http://www.bjinfobank.com. 被引量:1
  • 5薛毅,陈立萍编著..统计建模与R软件[M].北京:清华大学出版社,2007:526.
  • 6谢益辉.基于R软件rpart包的分类与回归树应用[J].统计与信息论坛,2007,22(5):67-70. 被引量:37
  • 7WILLIAMS G. Rattle: a data mining GUI for R [J]. The R Journal, 2009(1) : 45-55. 被引量:1
  • 8FOX J. Getting Started With the R Commander: A Basic-Statistics Graphical User Interface to R [ J]. Journal of Statistical Software, 2005, 14(9): 1-42. 被引量:1

二级参考文献4

  • 1BREIMA NL,FRIEDMANJ,OLSHENR,STONEC.Classification and Regression Trees[M].Wadsworth,1984. 被引量:1
  • 2VENABLES W N,RIPLEY B D.Modern Applied Statistics with S[J].Springer,edition,2002(4):251-269,URL http://www.stats.ox.ac.uk/pub/MASS4/,ISBN 0387-95457-0. 被引量:1
  • 3BRIAN S Everitt,TORSTEN Hothorn.A Handbook of Statistical Analyses Using R[S].Chapman & Hall/CRC,2006:131-142. 被引量:1
  • 4THERNEAU T M,ATKINSON E J.An introduction to recursive partitioning using the rpart routine[J].Technical Report 61,Mayo Clinic.Section of Statistics,1997. 被引量:1

共引文献80

同被引文献93

引证文献15

二级引证文献54

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部