基于Web挖掘的信息抽取系统的研究

下载PDF

导出

摘要文章讨论了Web挖掘的一些基本概念,针对Web数据的特点提出了一个基于Web挖掘的信息抽取系统的结构模型。模型通过对XML文档的解析生成DOM树,在此基础上,通过对样本页的DOM树的先序遍历生成抽取规则,再以此规则对Web页进行数据抽取,所抽取的数据保存在数据库中,以便利用数据库技术进一步利用这些数据。

作者方少卿胡学钢

机构地区合肥工业大学铜陵职业技术学院

出处《铜陵学院学报》 2010年第4期66-68,共3页 Journal of Tongling University

关键词 WEB挖掘信息抽取抽取规则

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1郭璐青,任锦.关联规则挖掘算法的研究[J]科技信息(学术研究),2008(36). 被引量：1
2付国瑜.Web文本分类挖掘[J].科学咨询,2008(5):56-56. 被引量：1
3韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量：356
4卢睿..基于XML的Web信息抽取研究[D].大连海事大学,2005:
5XML中国论坛编著..XML实用进阶教程[M].北京:清华大学出版社,2001:386.

二级参考文献6

1Han J，Data Mining:Concepts and Techniques，2000年被引量：1
2Wang K，Proc of VLDB'97，1999年，363页被引量：1
3Zaiane O R，Proc Int Workshop Web Information and Data Management（WIDM'98），1998年，9页被引量：1
4Mobasher B，Tech Rep:TR96 0 5 0，1996年被引量：1
5Zaiane O R，Proc KDD'95，1995年，331页被引量：1
6韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量：356

共引文献355

1杨洋.Web数据挖掘的分析与探讨[J].装备制造技术,2006(5):63-64. 被引量：1
2王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量：2
3阿静.政企互动打假树维权典范——爱普生打印机胜诉“骗保门”事件[J].办公自动化,2006(14):10-11.
4董德民.面向电子商务的Web使用挖掘及其应用研究[J].中国管理信息化（综合版）,2006,9(10):83-85. 被引量：1
5杜志文,曾文华.网格计算在文本分类中的应用[J].微电子学与计算机,2006,23(z1):221-222.
6张克君,李伯群,李欣,杨炳儒.基于DWLMS模型的分布式Web用户访问模式挖掘[J].清华大学学报（自然科学版）,2005,45(S1):1762-1766. 被引量：2
7万君,耿东辉.浅说电子商务中的数据挖掘技术[J].东北大学学报（自然科学版）,2004,25(z1):194-196. 被引量：1
8许亮,李明,梁素田,侯耕.数据挖掘技术在电子商务中的应用[J].甘肃科学学报,2002,14(S1):17-20. 被引量：1
9王丽娜.Web日志挖掘技术研究[J].光盘技术,2008(4):34-36. 被引量：2
10李慧.数据挖掘技术探讨及其基于web的应用研究[J].硅谷,2008,1(22):71-71.

1万洪莉.SOAP消息的非递归先序解析算法研究[J].软件工程师,2009(11):52-53.
2李昆,赵刚.先序和后序序列恢复二叉树的非递归算法[J].南昌航空大学学报（自然科学版）,2010,24(3):30-32. 被引量：1
3张亚萍,陈得宝,侯俊钦.二叉树遍历教学方法研究[J].牡丹江师范学院学报（自然科学版）,2010,36(4):69-70. 被引量：8
4王家聚,汤岩.二叉树先序遍历的非递归算法讨论[J].集美大学学报（自然科学版）,2001,6(1):69-71. 被引量：3
5陈德军,马英哲,周祖德.一种动态目录树快速生成算法[J].武汉理工大学学报（交通科学与工程版）,2008,32(1):40-42. 被引量：5
6章晓勤.二叉树后序遍历非递归算法的改进研究[J].佳木斯大学学报（自然科学版）,2013,31(6):926-928.
7张磊,付殿晶,庄智.对由二叉树的遍历序列还原二叉树算法的研究与实现[J].才智,2012,0(12):51-52.
8王防修,周康.基于二叉排序树的二叉树建立[J].武汉工业学院学报,2013,32(3):53-57. 被引量：4
9田旺兰.二叉树中序、后序遍历的递归算法讨论[J].凉山大学学报,2003,5(3):3-3.
10郭金华,占明.浅议二叉树的遍历[J].科技信息,2010(17):65-65. 被引量：5

铜陵学院学报

2010年第4期

浏览历史

内容加载中请稍等...

基于Web挖掘的信息抽取系统的研究

参考文献5

二级参考文献6

共引文献355

相关作者

相关机构

相关主题

浏览历史