基于GSP算法的Web用户访问序列模式挖掘
摘要
该文以某电子商务网站的Web访问日志为研究对象,利用SQL Server提供的SSIS服务和T-SQL语句进行数据预处理,得到序列数据库,然后用java语言编程实现GSP算法对其进行序列模式的挖掘测试分析,通过对结果分析可以做出对该网站布局和内容(或产品)调整提供参考,使其更好为其用户提供针对性的服务。
出处
《电脑知识与技术》
2015年第10X期217-218,共2页
Computer Knowledge and Technology
参考文献9
-
1邵峰晶,于忠清编著..数据挖掘原理与算法[M].北京:中国水利水电出版社,2003:322.
-
2毛国君等编著..数据挖掘原理与算法[M].北京:清华大学出版社,2005:314.
-
3汪莉栋..Web日志挖掘中数据预处理算法的研究及实现[D].贵州大学,2008:
-
4赵畅,杨冬青,唐世渭.Web日志序列模式挖掘[J].计算机应用,2000,20(9):13-16. 被引量:6
-
5朱琳玲,胡学钢,穆斌.基于Web的数据挖掘研究综述[J].电脑与信息技术,2002,10(6):45-48. 被引量:5
-
6李林,崔志明.用户Web日志序列模式挖掘研究[J].微机发展,2005,15(5):119-121. 被引量:4
-
7刘沛骞,郭海儒,袁玲玲.Web日志挖掘中的用户访问模式识别[J].雁北师范学院学报,2006,22(2):23-25. 被引量:2
-
8王新,马万青,潘文林.基于Web日志的用户访问模式挖掘[J].计算机工程与应用,2006,42(21):156-158. 被引量:15
-
9王璟.Web使用记录挖掘技术综述[J].四川经济管理学院学报,2008,19(1):49-50. 被引量:1
二级参考文献22
-
1[1]Agrawal R,Faloutes C,Swanmi A.Efficient Similarity Search in Sequence Databases.Proceedings of the 4th Intl.conf.on Foundations of Data Organization and Algorithms,October,2001.116-122. 被引量:1
-
2[2]Agrawal R,Ghosh S,Imielinski T,An Interval Classifier for Database Mining Applications.Proceedings of the 18th International Conference on Very Large Data Bases,pages 1998.560-573. 被引量:1
-
3[3]December J,Randall N.The World Wide Web Unleashed.Seattle:SAMS Publishing,1994. 被引量:1
-
4Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[C].In:Proceedings of the ACM SIGMOD Conference on Management of Data,Washington D C,1993:207 ~216 被引量:1
-
5Cooley R,Mobasher B,Srivastava J.Web mining:information and pattern discovery on the World Wide Web[C].In:Tools with Artificial Intelligence,Proceedings,Ninth IEEE International Conference,1997:558~567 被引量:1
-
6Wang J ch,Huang Y,Wu G sh et al.Web mining:knowledge discovery on the Web[C].In:Systems,Man,and Cybernetics,IEEE SMC '99Conference Proceedings,1999 IEEE International Conference,1999:137~141 被引量:1
-
7De S K,Krishan P R.Clustering web transactions using rough approximation[J].Fuzzy Sets and Systems,2004;148:131~138 被引量:1
-
8Zaiane R,ProceedingsofAdvancesinDigitalLibrariesConference(ADL′ 98),1998年,19页 被引量:1
-
9Agrawal R, Srikant R. Mining Sequential Patterns[ A]. Proc International Conference on Data Engineering [ C ]. Taipei, Taiwan: [s. n.], 1995.3 - 14. 被引量:1
-
10Chen Ming - Syan, Park J S, Yu P S. Data Mining for Path Traversal Patterns in a Web Environment[A]. Proceedings of the 16th International Conference on Distributed Computing Systems[C]. Yorktown,NY: [s. n.] ,1996. 被引量:1
共引文献25
-
1赵娜,臧景才.多标记传播聚类算法在电子商务中的应用[J].青海大学学报(自然科学版),2009,27(1):85-88.
-
2习慧丹,严晖.概念格在Web日志挖掘中的应用[J].计算机系统应用,2006,15(9):21-24. 被引量:1
-
3吴荣.基于Web的数据挖掘技术[J].福建电脑,2007,23(4):17-18.
-
4周豫苹,陈东.一类基于模式分类算法的入侵检测系统[J].漳州师范学院学报(自然科学版),2007,20(3):25-29.
-
5吴雅双,张东站.基于BIPL的Web频繁访问模式挖掘[J].计算机工程与应用,2008,44(23):136-138.
-
6刘莉.数据仓库及数据挖掘技术在电信CRM中的应用[J].福建电脑,2008,24(12):150-151.
-
7褚红丹,焦素云,马威.用户访问兴趣路径挖掘方法[J].计算机工程与应用,2008,44(35):135-137. 被引量:8
-
8姬朝阳,陈建军.WebLog在电子商务个性化中的应用研究[J].商场现代化,2009(7):160-161. 被引量:1
-
9王毅,王锁柱,杜华.基于马尔可夫链的电子商店顾客行为预测模型[J].计算机工程与设计,2009,30(4):906-908. 被引量:3
-
10王燕.基于Web日志的序列模式挖掘应用研究[J].信息技术,2009,33(9):12-15.
-
1刘立军,崔杰,梅红岩.GSP与PrefixSpan算法的比较与分析[J].辽宁工学院学报,2006,26(5):300-302. 被引量:4
-
2李斌,韩坤.混合型入侵检测引擎技术及其应用[J].宁波职业技术学院学报,2008,12(5):44-47.
-
3吕橙,张兵.序列模式挖掘的两种典型算法及比较[J].湖北师范学院学报(自然科学版),2006,26(4):33-37. 被引量:1
-
4陈荣宝.浅析CSS+DIV与TABLE布局的异同[J].福建电脑,2011,27(4):124-125.
-
5鄂义元,姜轶涵.网站开发中Photoshop的运用[J].中央民族大学学报(自然科学版),2014,23(2):50-54. 被引量:6
-
6陈晓春.基于Apriori算法的Web日志挖掘研究[J].福建电脑,2014,30(7):80-81. 被引量:2
-
7宋世杰,胡华平,胡笑蕾.关联规则和序列模式算法在入侵检测系统中的应用[J].成都信息工程学院学报,2004,19(1):1-6. 被引量:8
-
8胡笑蕾,胡华平,宋世杰.数据挖掘算法在入侵检测系统中的应用[J].计算机应用研究,2004,21(7):88-90. 被引量:7
-
9李川川,刘衍珩,田大新.基于序列模式的网络入侵检测系统[J].吉林大学学报(工学版),2007,37(1):121-125. 被引量:7
-
10余啸,马传香,李伟亮,金聪.基于MapReduce的序列模式挖掘算法[J].计算机应用研究,2015,32(11):3312-3314. 被引量:5