基于统计方法的数据挖掘算法研究被引量：6

Study of Data Mining Algorithms Based on Statistical Method

下载PDF

导出

摘要在统计方法的基础上提出了一种根据数据集合本身的统计特性数据挖掘算法.该算法利用数据本身的统计特性对数据仓库中的数据进行分析,在给定重要性比例程度的前提下,经过系列的统计运算,得到简化的数据仓库集,并根据分析得到了数据挖掘算法的流程图.提出了比例大小关系函数,反映了数据自身的统计特性,分析表明:这种算法极大的提高了数据的有效水平. On the basis of statistical method, this paper put forward one data mining algorithm according to statistics characteristic of the data′s set itself. This algorithm utilizes the statistical characteristic of data to analyze the data in the data warehouse, on the premise of giving definitely degree of proportion of importance, through a series of statistics operation, get the simple data warehouse set, and gained the flow chart of data mining algorithms according to analysis. The paper proposed the relation function of the proportion that reflects the statistical characteristic of data itself. The analysis th9at shows this algorithm has improved greatly the effective level of data.

作者王政霞黄大荣

机构地区重庆交通学院理学院重庆交通学院计算机学院

出处《湖北民族学院学报（自然科学版）》 CAS 2005年第1期42-44,共3页 Journal of Hubei Minzu University(Natural Science Edition)

基金交通部基础研究专项基金项目(20031981408).

关键词数据仓库统计特性数据挖掘量纲的统一 data warehouse statistical characteristic data mining dimension unification

分类号 TP182 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1刘同明等编著..数据挖掘技术及其应用[M].北京:国防工业出版社,2001:251.
2张方明.人工神经网络的模型及应用[M].上海:复旦大学出版社,1992.. 被引量：1
3于海防,解福.基于Agent的数据挖掘在CRM中的应用[J].山东师范大学学报（自然科学版）,2004,19(1):82-85. 被引量：7
4黄大荣,李劲.基于粗糙集理论的数据清洗模型[J].自动化技术与应用,2004,23(3):11-13. 被引量：6
5张兆功,李建中,张艳秋.海量数据上挖掘关联规则的并行算法[J].哈尔滨工业大学学报,2004,36(5):561-565. 被引量：5
6徐泽柱,王林.基于粗糙集理论和BP神经网络的数据挖掘算法[J].计算机工程与应用,2004,40(31):169-172. 被引量：16
7Martin T Hagan,Howard B Demuth,Mark Beal.Neural Network Design[M].北京:机械工业出版社,中信出版社,2002. 被引量：1
8David Hard,Herki Mannila,Padhraic Smyth. Principles of Data Mining[M].北京:机械工业出版社,2003. 被引量：1
9Pawlak Z. Rough set theory and its application to data analysis[J].Cybernetics and System, 1998(29): 661～668. 被引量：1

二级参考文献33

1PAWLAK Z. ROUGH set theory and its applications to data analysis[J]. Cybernetics and Systems, 1998,29: 661 - 668 被引量：1
2张文修吴伟志梁吉业.粗糙集理论与方法[M].北京:科学出版社,2003.107-112. 被引量：104
3MartinTHagan 戴葵译.Neural Network Design[M].北京:机械工业出版社,2002.227. 被引量：14
4MANNILA H,TOIVONEN H, INKERI A Verkamo.Efficient algorithms for discovering association rules,Knowledge Discovery in Databases [ A ]. The 1994AAAI Workshop ( KDD' 94 ) [ C ]. Seattle: AAAI Press, 1994. 181 - 192. 被引量：1
5BAYARDO R J. Efficiently mining long patterns from databases[ A]. Proceedings of ACM SIGMOD International Conference on Management of Data (SIGMOD'98) [ C]. Seattle:ACM Press, 1998. 85 -93. 被引量：1
6BAYARDO R J, AGRAWAL R, GUNOPULOS D.Constraint-based rule mining on large, dense data sets[A]. Proceedings of 1999 International Conference on Data Engineering ( ICDE' 99) [ C ]. Sydney: IEEE Computer Society Press, 1999. 188 - 197. 被引量：1
7HAN J, PEI J, YIN Y. Mining frequent patterns without candidate generation [ A ]. Proceedings of ACM SIGMOD International Conference on Management of Data ( SIGMOD' 2000 ) [ C ], San Diego:ACM Press, 2000. 1 -12. 被引量：1
8AGRAWAL R,SHAFER J C. Parallel mining of association rules [ J ]. IEEE Transactions on Knowledge and Data Engineering, 1996,8 (6): 962 - 969. 被引量：1
9HAN E H,KARYPIS G,KUMAR V. Scalable parallel data mining for association rules[ A]. Proceedings of ACM SIGMOD International Conference on Management of Data (SIGMOD' 97) [ C ]. Tucson: ACM Press, 1997. 277-288. 被引量：1
10AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large database[ A]. Proceedings of ACM SIGMOD International Conference on Management of Data ( SIGMOD' 93 )[C]. Washington D C: ACM Press, 1993. 207 -216. 被引量：1

共引文献29

1伍长荣,叶明全.基于粗糙集和RBF神经网络的分类模型研究[J].宿州学院学报,2008,23(4):103-105.
2白秋颖,张继生,王枞.企业CRM系统中联机分析挖掘的应用与实现[J].辽宁科技大学学报,2006,30(5):494-497.
3丁艳辉,王洪国,高明,谷建军.一种发现有价值的稀有数据关联规则的算法[J].山东师范大学学报（自然科学版）,2005,20(4):17-19. 被引量：1
4盛立,刘希玉,高明.挖掘关联规则中AprioriTid算法的改进[J].山东师范大学学报（自然科学版）,2005,20(4):20-22. 被引量：9
5卢金秋,叶枫.基于BP神经网络的海关企业风险评估研究与应用[J].计算机应用,2005,25(B12):333-335. 被引量：4
6王宗军,李红侠,邓晓岚.粗糙集理论研究的最新进展及发展趋势[J].武汉理工大学学报（信息与管理工程版）,2006,28(1):43-48. 被引量：12
7曹啸,梁云川.基于属性重要度的粗糙集规则提取方法[J].咸宁学院学报,2005,25(6):52-54.
8莫礼平,樊晓平.BP神经网络在数据挖掘分类中的应用[J].吉首大学学报（自然科学版）,2006,27(1):59-62. 被引量：5
9杨晓娟.基于网络的多媒体教育资源检索策略[J].山东师范大学学报（自然科学版）,2006,21(2):144-145.
10夏富春,苗夺谦,李道国.信息系统属性增量约简算法的设计与实现[J].计算机工程与应用,2006,42(21):149-152. 被引量：1

同被引文献40

1孙维,林振辉,舒华英.电信运营业客户全生命周期管理方法探讨[J].移动通信,2005,29(2):107-110. 被引量：4
2王紫生,边馥苓.利用“缓冲法”进行空间数据的插补和知识挖掘[J].测绘信息与工程,2005,30(1):25-27. 被引量：1
3王成亮,顾宝炎.差异化客户细分模型的建立和应用[J].上海管理科学,2005,27(1):37-38. 被引量：3
4邬金涛,赵汴.基于终身价值的客户细分与关系战略选择[J].山东财政学院学报,2005(1):37-40. 被引量：3
5Jiawei Han, Micheline Kambr. Data Mining Concepts and Technuques[ J]. Morgan Kaufmann Publishers,2000 被引量：1
6Fayad U M, Simoudis E. Data Mining and Knowledge Discovery. Proceedings of 1st International cord[J]. KDD and Data Mining, 1997 被引量：1
7Pawlak Z. Rough Set Theory and Its Application to Data Analysis [ J ]. Cybemetica and System, 1998; (29) 被引量：1
8Quinlan J R. Induction of Decision Trees[J ]. Machine Learning, 1986,62( 1 ) 被引量：1
9[1]Chan E P F.Buffer Queries[J].IEEE Transactions on Knowledge and Data Engineering,2003,15 (4):895-910 被引量：1
10[2]Leutenegger S T,Lopez M A.The Effect of Buffering on the Performance of R-Trees[J].IEEE Transactions on Knowledge and Data Engineering,2000,12 (1):33-43 被引量：1

引证文献6

1王紫生,边馥苓.基于applet的数据挖掘信息可视化[J].地理空间信息,2007,5(1):46-49. 被引量：1
2陆瑶,张杰,冯英俊.基于判定树的项目R＆D中的数据挖掘质量测评研究[J].情报杂志,2009,28(5):48-51.
3吴昌钱.信用分析中常用数据挖掘算法[J].硅谷,2011,4(6):35-35.
4陈望学,鲁春林,王连文,钱文舒.聚类分析的一个基本应用[J].湖北民族学院学报（自然科学版）,2016,34(2):170-172. 被引量：3
5高潮.大数据时代用户消费型数据的分级分类隐私保护策略研究[J].广东通信技术,2016,36(9):10-12. 被引量：5
6古险峰.一种基于数据挖掘的网络入侵检测系统设计与实现[J].河南科技学院学报（自然科学版）,2020,48(6):54-58. 被引量：8

二级引证文献17

1周成林,黄长江,黄坤,李超.基于XML可配置图形样式的数据可视化工具的设计与实现[J].电子技术与软件工程,2015(10):75-75. 被引量：2
2陈博,吴委林,郑大浩,冯月,王蕾,朴世领.人工诱发条件下41份烟草品种(系)对PVY的抗性鉴定及抗性分类[J].延边大学农学学报,2017,39(1):9-15. 被引量：5
3杨国颖.基于聚类分析和神经网络模型对平均工资研究[J].自动化与仪器仪表,2017(7):28-30. 被引量：1
4杜宇骁,龚城,伏安娜,汪东伟,殷沈琴,张计龙.哈佛大学Datatags数据分级系统研究及启示[J].图书馆杂志,2019,38(8):17-26. 被引量：10
5陶镇威.企业敏感涉密数据分级分类管理策略探讨[J].现代工业经济和信息化,2019,9(10):79-80. 被引量：4
6高萍,刘松,程顺,欧阳福生,赵明洋.基于BP神经网络和遗传算法优化S Zorb装置汽油辛烷值损失[J].石油炼制与化工,2021,52(7):88-95. 被引量：6
7王志.基于Spark框架的网络大数据分类处理方法研究[J].信息与电脑,2021,33(10):49-51. 被引量：3
8赵好好.数据挖掘技术在网络入侵检测中的应用[J].科技创新导报,2021,18(14):112-115.
9杨毅.基于云计算的数据库入侵检测系统设计[J].信息与电脑,2021,33(15):205-207. 被引量：2
10程艳艳.基于深度卷积神经网络的入侵检测系统设计[J].西安文理学院学报（自然科学版）,2022,25(1):75-79. 被引量：3

1胡光辉,刘晔,张国林,卢景芬,江枫,韩俊鹏.基于信息融合理论的双光路光纤位移传感器的研究[J].传感技术学报,2004,17(4):672-674. 被引量：1
2马晓燕,李云,聂海新.泰安市新农村建设进程监测信息平台的构建[J].泰山学院学报,2013,35(3):6-13.
3唐兴峰.ASP与电子表格EXCEL的交互操作[J].自动化技术与应用,2001,20(4):44-45. 被引量：1
4刘涛,赵建霞,黄娓娓.医院信息管理与单机版统计系统的网络化升级[J].管理观察,2011(31):36-37.
5电源管理要超越芯片层面[J].通信电源技术,2006,23(3):37-37.
6沈未名,魏小莉.一种基于小波多分辨率特征的彩色纹理图像检索[J].武汉理工大学学报（交通科学与工程版）,2012,36(3):467-470. 被引量：1
7杨萍,谢慧清.虚拟装配中碰撞检测的研究[J].科学技术与工程,2007,7(6):1057-1061. 被引量：5
8王威,陈梅.基于位集合的Apriori算法的改进[J].计算机技术与发展,2011,21(12):70-72. 被引量：4
9吴晓朝,吴捷,李全国.一种基于满意度的PID参数整定方法[J].华南理工大学学报（自然科学版）,2005,33(2):39-42. 被引量：15
10孟凡丽.运用Excel统计运算实现实验室检测质量监控[J].石油仪器,2011,25(2):86-88.

湖北民族学院学报（自然科学版）

2005年第1期

浏览历史

内容加载中请稍等...

基于统计方法的数据挖掘算法研究被引量：6

参考文献9

二级参考文献33

共引文献29

同被引文献40

引证文献6

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于统计方法的数据挖掘算法研究 被引量：6

参考文献9

二级参考文献33

共引文献29

同被引文献40

引证文献6

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于统计方法的数据挖掘算法研究被引量：6