检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

Web信息抽取技术综述被引量：22: 1; 作者陈钊张冬梅《计算机应用研究》 CSCD 北大核心 2010年第12期4401-4405,共5页; 快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统计理论的、基于视觉特征的、基于DOM树结构的和基于模板的几类。由于网页文本本身具有树结构并且具有一... 展开更多; 关键词 web信息抽取网页噪声 URL聚类 DSE算法 RoadRunner系统 MDR 视觉特征模板; 下载PDF 职称材料

针对开源论坛网页的信息抽取研究被引量：11: 2; 作者刘春梅郭岩 +3 位作者俞晓明赵岭刘悦程学旗《计算机科学与探索》 CSCD 北大核心 2017年第1期114-123,共10页; 互联网上大量论坛使用开源软件生成,针对这类论坛,提出了针对论坛网页信息抽取的基于模板的信息抽取方法。首先给出了基于网页结构相似度的簇划分策略,并通过实验证明了该策略优于直接基于软件版本号等直观类别的划分策略;其次提出了基... 展开更多; 关键词记录定位网页聚类模板抽取; 下载PDF 职称材料

基于动态网页的Word报告自动生成方法被引量：8: 3; 作者刘鹏秦巍 +1 位作者周永辉郭义琪《计算机工程》 CAS CSCD 2012年第5期279-280,284,共3页; 为减少日常工作中Word报告编制的工作量,提出一种基于动态网页的可扩展Word报告自动生成方法。将数据处理方法封装为数据占位符,并插入Word文档中定制报告模板。利用报告模板生成ASPX动态网页,根据用户操作调用相应的数据处理方法进行... 展开更多; 关键词动态网页 Word报告报告模板占位符; 下载PDF 职称材料

结合有监督广度优先搜索策略的通用垂直爬虫方法被引量：7: 4; 作者高峰刘震高辉《计算机工程》 CAS CSCD 北大核心 2018年第11期289-299,共11页; 垂直爬虫程序无法直接移植到其他网站并且程序设计需要大量人工干预。为此,提出一种高可移植性的通用型垂直爬虫设计方法。自动识别目标主题和目录页面URL,并利用URL聚类生成URL正则表达式过滤器,以解决垂直爬虫中需人工维护初始URL队... 展开更多; 关键词垂直爬虫 URL聚类赋权网页路径模板解析有监督广度优先搜索策略; 下载PDF 职称材料

一种统一的Web新闻对象自动抽取方法被引量：4: 5; 作者刘伟严华梁《计算机工程》 CAS CSCD 2012年第11期167-169,共3页; 提出一种统一的Web新闻对象自动抽取方法。通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自动抽取。实验结果表明,... 展开更多; 关键词 web数据抽取视觉特征序列标注网页模板新闻属性新闻对象; 下载PDF 职称材料

一种基于页面赋权的网页内容提取方法被引量：1: 6; 作者余杨奎王旅 +2 位作者李婉茹程振林刘洁《通化师范学院学报》 2021年第10期20-28,共9页; 提出一种基于页面赋权的网页内容提取方法,准确地提取WEB内容存储到数据库中.提取方法分为两部分,一是带权的前置搜索算法,将正则表达式与广度优先搜索策略进行结合,建立针对网页页面URL与链接的规则筛选工具;二是利用基于模板的网页内... 展开更多; 关键词 web页面模板技术页面赋权正则表达式; 下载PDF 职称材料

多模式精品课程项目申报系统的设计与实现被引量：1: 7; 作者喻小光陈霞陈维斌《华侨大学学报（自然科学版）》 CAS 北大核心 2009年第4期403-405,共3页; 提出一种C/S(客户机和服务器)与B/S(浏览器/服务器)相结合的,基于网页模板的精品课程项目申报系统.系统的主要组成部分包括申报子系统、申报管理发布子系统和精品课程申报网站.其中,申报管理发布子系统使用B/S模式,申报子系统使用带有... 展开更多; 关键词管理系统精品课程网页模板多模式; 下载PDF 职称材料

一种基于网页元素构件的电子商务网页可视化创建技术被引量：1: 8; 作者陈维斌梁少文吴清江《计算机应用》 CSCD 北大核心 2002年第6期16-19,共4页; 针对电子商务的应用需求 ,在分析了商务网页特性的基础上 ,提取网页基本元素和修饰元素设计成可以复用的构件 ,并在某些构件中加入与数据库访问有关的功能 ;设计了一种用来存放网页格式描述的中间文件—ECM文件 ;; 关键词模板 ECM文件计算机网络网页元素构件电子商务网页可视化创建; 下载PDF 职称材料

一个RSS级别的网页主题内容抽取方法与系统: 9; 作者张艳《图书情报工作》 CSSCI 北大核心 2010年第14期107-110,130,共5页; 提出一个RSS级别的网页主题内容抽取方法与系统,利用RSSfeed中的少量entry信息训练得到主题内容模板,通过模板可以对RSSfeed下的所有网页进行主题内容抽取。该方法支持分别抽取网页的标题、正文、类别等信息;另外,该方法有自适应机制,... 展开更多; 关键词网页主题内容抽取 RSS 模板自适应机制; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部