基于.NET的Web信息抽取系统关键技术研究

The Critical Technology Research on Web Information Extraction System Based on .NET

下载PDF

导出

摘要随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。 With the Web information extraction researchment and development,and in the extraction technology has gradually matured through the software from a Web page to extract the required information is possible.Based on.NET technology for Web information extraction system for research,analysis and put forward the document to download and clean up HTML,HTML to XML format,data location and extraction,extraction of data preservation needs to study and solve key technical problems and to explore the corresponding solutions.

作者谭锋李天真崔亮亮

机构地区湖州职业技术学院机电工程分院浙江久立集团股份有限公司

出处《软件导刊》 2010年第12期120-122,共3页 Software Guide

基金浙江省教育厅科研项目(Y200803750)

关键词 .NET WEB信息抽取应用软件 HTML XML .NET Web Information Extraction Application Software HTML XML

分类号 TP311.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1刘华.网页信息抽取及建库系统C#实现[J].计算机工程,2006,32(16):49-51. 被引量：5
2张金霞编著..HTML网页设计参考手册[M].北京:清华大学出版社,2006:350.

二级参考文献5

1张普.关于大规模真实文本语料库的几点理论思考[J].语言文字应用,1999(1):35-44. 被引量：49
2黄昌宁李涓子.语料库语言学[M].北京:商务印书馆,2002.. 被引量：20
3朱凯.因特网语料自动下载分析软件的设计[C]..第一届学生计算语言学研讨会论文集[C].北京,2002.. 被引量：2
4Simon Robinson K，Allen S，C#高级编程[M]．北京：清华大学出版社，2002．被引量：2
5冯是聪,单松巍,龚笔宏,张志刚,李晓明.“天网”目录导航服务研究[J].计算机研究与发展,2004,41(4):653-659. 被引量：8

共引文献4

1刘华.基于分类标注语料库的关键词标引知识自动获取[J].图书情报工作,2007,51(7):41-43. 被引量：6
2施洋,张奇,黄萱菁.含有语义特征的网页新闻自动抽取[J].计算机工程,2010,36(7):173-175. 被引量：5
3王超,徐杰锋.基于CURE算法的网页分块及正文块提取研究[J].微型机与应用,2012,31(12):11-14. 被引量：1
4谢天保,张晓雯,仵凯博.微博社会网络重要用户节点筛选及舆情引导[J].计算机科学,2014,41(S1):400-405. 被引量：10

1贡正仙,支丽艳,朱巧明,李培峰.基于网格的Web信息抽取系统的设计与实现[J].计算机应用与软件,2007,24(11):50-51. 被引量：2
2谭锋.基于.NET实现HTML文档的下载与清理[J].科技资讯,2011,9(7):5-5.
3谭锋,李天真,崔亮亮.Web信息抽取系统研究综述[J].科技创新导报,2010,7(34):2-2. 被引量：3
4关辉.利用XSLT实现XML文档格式的转换[J].福建电脑,2009,25(3):181-181. 被引量：2
5孙阳.WEB信息的抽取与集成研究[J].中国电子商务,2009(8):38-38.
6王宗良,高静,阿木古楞.Web信息抽取系统分类方法研究[J].内蒙古农业大学学报（自然科学版）,2012,33(4):218-222.
7詹沐清.基于陶瓷类电子商务网站的Web信息抽取系统的研究[J].电脑知识与技术,2014,10(8X):5799-5802.
8傅骞,温晓辉.开放式Web信息抽取系统研究与实现[J].北京师范大学学报（自然科学版）,2005,41(6):594-598. 被引量：3
9刘伟,贺露.基于本体的Web信息抽取系统的研究[J].软件,2013,34(12):211-212. 被引量：7
10蒋邵衡.WEB信息的抽取与集成研究[J].电脑知识与技术,2009,5(10X):8357-8358.

软件导刊

2010年第12期

浏览历史

内容加载中请稍等...

基于.NET的Web信息抽取系统关键技术研究

参考文献2

二级参考文献5

共引文献4

相关作者

相关机构

相关主题

浏览历史