检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种有效的网页噪声消除的方法被引量：3: 1; 作者罗成李弼程张先飞《计算机工程》 CAS CSCD 北大核心 2007年第8期89-91,共3页; 大多数网页都有如广告、版权、导航链接等噪声,影响Web应用系统的工作质量,因此快速准确地清除网页中的噪声内容是提高Web应用程序性能的关键技术之一。提出了一种网页净化方法,通过用模式树(PT)表示网页的布局结构,根据模式树中节点的... 展开更多; 关键词文档树模式树基本节点风格节点网页净化; 下载PDF 职称材料

基于语义关联和结构分析的WEB到WAP转换器的研究被引量：1: 2; 作者赵立娟许志伟吴赵杰《计算机工程与科学》 CSCD 北大核心 2012年第5期45-48,共4页; 随着3G移动通信等无线传输技术的迅猛发展,越来越多的用户开始利用无线设备上网获取所需信息。现有的WEB系统信息量大、费流量,版面复杂,不利于手机浏览。作为面向无线环境定制的一套协议,WAP解决了以上问题。而针对所有现有互联网信息... 展开更多; 关键词 web到WAP转换网页去噪语义关联版面布局页面重组; 下载PDF 职称材料

基于DOM和神经网络的网页净化应用被引量：2: 3; 作者李剑《电子科技》 2012年第1期105-107,共3页; 为能够高效地把网页中的噪音信息过滤掉,采用基于改进的DOM树和BP神经网络的网页净化方法。根据DOM树和网页内容的特征,用HTMLParser建立内容块树,把网页中的内容按照一定的相关性分割成多个子块,从而把整个内容块的处理简化为处理各个... 展开更多; 关键词网页净化 DOM树内容块神经网络; 下载PDF 职称材料

网页净化及去重研究综述被引量：1: 4; 作者罗元《现代计算机》 2013年第10期3-7,12,共6页; 随着互联网的快速发展与搜索引擎的广泛使用,网页数据已经成为各种应用与研究的重要数据源之一。然而由于网页的特殊性,它所包含的信息并非都是各种应用所必需,例如:广告,导航条等。它们的存在会对各种应用产生不利影响。此外,网页检索... 展开更多; 关键词网页去重网页净化信息检索万维网; 下载PDF 职称材料

基于模式匹配的网页净化方法: 5; 作者曾蒸马燕《重庆师范大学学报（自然科学版）》 CAS CSCD 北大核心 2015年第6期103-108,共6页; 新闻网页主要由大量文字描述构成,相比网页其他区域的噪音内容,其主题内容含有大段连贯的文字。根据这一特点提出一种基于模式匹配的网页净化方法,即在网页源代码中匹配最长文字字符串,从而准确定位主题内容源代码在网页源代码中位置,... 展开更多; 关键词网页噪音网页净化信息提取; 原文传递

一种新的用于数据挖掘工具的网页净化算法: 6; 作者孙楠张华伟《郑州轻工业学院学报（自然科学版）》 CAS 2011年第3期85-87,91,共4页; 为了更好地消除网页噪声,有效地提取网页的主题内容,提出了一种新的网页净化算法.该算法认为网页的主题内容主要包含在<table>标记和<p>标记里面,并据此对网页噪声进行预处理,然后与相关网页进行内容匹配,通过计算节点重要... 展开更多; 关键词网页净化网页噪声文档对象模型阈值; 下载PDF 职称材料

一种基于单模型的网页净化方法: 7; 作者干文敏李俊李剑《计算机与现代化》 2012年第2期128-130,共3页; 为了能够更好地获得和处理网页中的正文信息,本文提出基于改进的DOM树和BP神经网络的网页净化算法。该算法根据DOM树和网页内容的特征用HTMLParser把网页转换成一棵内容块树。因网页子内容块具有相当明显的数值特征,可以通过BP神经网络... 展开更多; 关键词网页净化 DOM树内容块神经网络; 下载PDF 职称材料

基于局部最优标签树的网页净化方法: 8; 作者胡飞杨华千 +2 位作者韦鹏程彭涛蒲昌玖《科学技术与工程》北大核心 2012年第35期9556-9561,共6页; 新闻网页里面包含大量文字分段标签,相比网页其它区域的噪音内容,其主题内容区域的文字分段标签较多。根据这一特点引入局部最优标签树搜索算法。通过搜寻同级节点中分段标签最多的容器节点,消除其它容器节点,从而实现网页净化方法。实... 展开更多; 关键词网页净化信息提取 HTML标签局部最优网页噪音; 下载PDF 职称材料

基于统计的网页净化模板生成算法: 9; 作者胡飞黄军建 +2 位作者成平广席海李军《科学技术与工程》北大核心 2013年第4期1060-1063,共4页; 同一个站点的大部分网页拥有几乎相同的DOM标签树,处理后的标签树作为一个模板,该站点的所有网页只保留这个模板中叶子节点包含的内容,由此可以实现这个站点的所有网页的净化。首先对一个站点内的一组样本网页提取内容块树,针对每个树... 展开更多; 关键词网页净化信息提取单边子树; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部