期刊文献+
共找到20,422篇文章
< 1 2 250 >
每页显示 20 50 100
模板化网页主题信息的提取方法 被引量:70
1
作者 欧健文 董守斌 蔡斌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1743-1747,共5页
为了消除网页噪音,有效地提取基于模板的网页主题信息,提出了一种新的信息提取方法。该方法采用机器自动学习方式生成网页集的模板;以网页链接关系中的锚点文本作为提取目标对模板进行标记,生成对应模板的提取规则;依据模板的提取规则... 为了消除网页噪音,有效地提取基于模板的网页主题信息,提出了一种新的信息提取方法。该方法采用机器自动学习方式生成网页集的模板;以网页链接关系中的锚点文本作为提取目标对模板进行标记,生成对应模板的提取规则;依据模板的提取规则对网页主题信息进行提取。对国内2 588个新闻网页进行了检测。实验结果表明,该方法可以快速、有效地提取模板生成的网页集主题信息,准确率达99.5%。将该方法应用于搜索引擎系统(木棉检索)中,与原来的检索系统相比较,索引文件的大小减少约50%,检索的速度和精确度也得到提高。 展开更多
关键词 万维网 网页 信息提取 模板 搜索引擎
原文传递
用Naive Bayes方法协调分类Web网页 被引量:53
2
作者 范焱 郑诚 +2 位作者 王清毅 蔡庆生 刘洁 《软件学报》 EI CSCD 北大核心 2001年第9期1386-1392,共7页
WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息... WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法 .经实验验证 ,与只用单种方法对超文本进行分类的方法相比 ,综合分类法有效地提高了分类的正确率 . 展开更多
关键词 超文本 Web 机器学习 互联网 数据挖掘 信息检索 WWW 网页 NaiveBayes方法
下载PDF
Struts在实现MVC架构中的应用 被引量:17
3
作者 郭梅 江红 《计算机与现代化》 2004年第1期106-108,共3页
主要叙述了基于MVC架构的Struts的应用,详细介绍了Struts的结构和将它用于Web应用的实现机制。
关键词 网页 MVC架构 JSP STRUTS WEB 计算机网络
下载PDF
高校网页英文翻译的调查 被引量:72
4
作者 张新军 杨慧 《上海科技翻译》 2003年第4期56-58,共3页
译文读者的接受性,决定着译文信息传播的有效性。本文通过调查外国受试者对中国高校英文网页的反应和态度,对翻译中的一些普遍的问题进行了分析,并提出了建议。
关键词 网页 翻译 译文读者 可接受性
原文传递
用JSP/Servlet技术构建Web应用 被引量:32
5
作者 吴晨清 荣震华 《计算机工程》 CAS CSCD 北大核心 2001年第1期170-172,共3页
JSP/Servlet是Java技术在Web上的扩展,支持Web服务器端的应用开发.介绍了JSP/Servlet技术的主要特点,并分析了其在Web应用开发中两种典型的软件体系结构.
关键词 网页 Web JSP/SERVLET技术 JAVA语言 浏览器
下载PDF
对网页PageRank算法的改进 被引量:40
6
作者 宋聚平 王永成 +1 位作者 尹中航 滕伟 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第3期397-400,共4页
分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信... 分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信息 ,在 href、title等标记中文字对网页主题有重要作用 ,利用结构标记可以辅助判断网页的主题内容 .试验结果表明 。 展开更多
关键词 搜索引擎 网页 超链分析 PAGERANK
下载PDF
Web搜索引擎综述 被引量:30
7
作者 张卫丰 徐宝文 +2 位作者 周晓宇 许蕾 李东 《计算机科学》 CSCD 北大核心 2001年第9期24-28,共5页
With the explosive increase of the network information,people can find information more and more difficultly. The occurrence of the Web search engine overcomes this problem in some degree. This paper tells about the h... With the explosive increase of the network information,people can find information more and more difficultly. The occurrence of the Web search engine overcomes this problem in some degree. This paper tells about the history of the search engine ,the current state of the search engine. Some guidelines about the search engine are analysed and the related checking methods are also given. In this basis, we introduce the trend of the search engine. 展开更多
关键词 INTERNET WEB 搜索引擎 网页 信息检索
下载PDF
基于Web-Log Mining的N元预测模型 被引量:14
8
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期136-141,共6页
随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请... 随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请求进行预测.这种模型会选择性地对用户可预测的请求进行预测,从而大大提高了预测精度.实验证明,在自然语言中普遍适用的N元预测模型同样适用于网页预测.同时,采用了一种有效的简化手段,大大压缩了模型的大小,使得5元模型和传统的2元模型大小基本相同,而预测精度提高了1倍.该结果可以广泛地运用到Web上,包括网页的预发送、预取、推荐以及Web上的caching机制.试验是建立在真实的Web日志上的,该算法无论在预测精度上还是在可适用度上都优于以往的算法. 展开更多
关键词 数据挖掘 INTERNET Web-LogMining N元预测模型 网页
下载PDF
中文网页标引源主题表达能力的调查统计 被引量:29
9
作者 丁璇 侯汉清 章成志 《大学图书馆学报》 CSSCI 北大核心 2002年第6期70-72,共3页
通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,... 通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据。 展开更多
关键词 标引源 主题表达能力 汉语 网页 主题标引 加权 自动标引 调查
下载PDF
基于可视布局信息的网页噪音去除算法 被引量:21
10
作者 荆涛 左万利 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期84-87,98,共5页
主要探讨了网页中的噪音去除问题.针对单一页面中包含的丰富的可视信息,提出了一个更加精确的噪音去除算法:首先获得页面中各元素标记的布局信息,然后利用布局信息对页面进行划分,最后在此基础上去除噪音.与采用"布局信息"的... 主要探讨了网页中的噪音去除问题.针对单一页面中包含的丰富的可视信息,提出了一个更加精确的噪音去除算法:首先获得页面中各元素标记的布局信息,然后利用布局信息对页面进行划分,最后在此基础上去除噪音.与采用"布局信息"的算法相比,本文提出的算法对页面布局信息的提取更加准确,并能处理动态HTML页面.实验结果表明,该算法优于同类算法,可有效地去除网页噪音. 展开更多
关键词 网页 噪音 页面布局
下载PDF
扁平化风格在网页界面设计中的应用 被引量:41
11
作者 秦岁明 何梦楠 《包装工程》 CAS CSCD 北大核心 2015年第6期41-44,54,共5页
目的研究扁平化风格在网页界面设计中的应用。方法探讨扁平化风格在网页设计中的核心问题,并在扁平化网页设计中应用图形抽象法、图片去底法、情感色彩导向法、色彩层级搭配法以及特定字体等。结论以提高用户体验为出发点,运用"少... 目的研究扁平化风格在网页界面设计中的应用。方法探讨扁平化风格在网页设计中的核心问题,并在扁平化网页设计中应用图形抽象法、图片去底法、情感色彩导向法、色彩层级搭配法以及特定字体等。结论以提高用户体验为出发点,运用"少即是多"的设计理念,有效整合图形、色彩、文字三者间的关系,既达到界面设计的美观性,又保持界面设计的功能性。设计师要理性对待扁平化设计风格,抓住其精髓,而不是盲目追求新的设计潮流。 展开更多
关键词 扁平化风格 网页 界面设计 信息层级
下载PDF
Web对象模型及在多层结构Web开发中的应用 被引量:10
12
作者 卢孟余 楚春波 张世永 《计算机工程》 EI CAS CSCD 北大核心 1999年第12期36-37,64,共3页
讨论了多层结构Web概念、特点,并从面向对象软件工程的角度分析多层结构Web开发流程,进一步提出了Web对象模型开发模式,并且分析它的特点以及它在多层结构Web工程中的应用,最后,以实际应用开发加以例证和说明。
关键词 面向对象 软件工程 Web 对象模型 网页
下载PDF
网络课程中网页的视觉设计研究 被引量:24
13
作者 李启色 《电化教育研究》 CSSCI 北大核心 2004年第7期30-33,共4页
随着网络教育的发展 ,网络课程越来越多地运用于教学 ,网络课程的质量也逐渐被网络课程开发者所注重。而优化网页的视觉设计便是提高网络课程质量的一项重要内容。本文论述网络课程网页视觉设计的主要因素、优化网络课程网页视觉设计的... 随着网络教育的发展 ,网络课程越来越多地运用于教学 ,网络课程的质量也逐渐被网络课程开发者所注重。而优化网页的视觉设计便是提高网络课程质量的一项重要内容。本文论述网络课程网页视觉设计的主要因素、优化网络课程网页视觉设计的思想。 展开更多
关键词 网络课程 网页 视觉设计
下载PDF
Web超链分析算法研究 被引量:20
14
作者 朱炜 王超 +1 位作者 李俊 潘金贵 《计算机科学》 CSCD 北大核心 2003年第9期89-93,140,共6页
1.引言 万维网WWW(World Wide Web)是一个巨大的、分布全球的信息服务中心,正在以飞快的速度扩展.1998年WWW上拥有约3.5亿个文档[14],每天增加约1百万的文档[6],不到9个月的时间文档总数就会翻一番[14].
关键词 WEB 超链分析算法 搜索引擎 信息检索 网页 WWW
下载PDF
PageRank算法的原理简介 被引量:34
15
作者 吴淑燕 许涛 《图书情报工作》 CSSCI 北大核心 2003年第2期55-60,51,共7页
在介绍PageRank算法基本思想、基本公式和计算实例的基础上,介绍如何利用PageR— ank算法提高网页PR的方法,最后指出PageRank算法存在的不足,并对其发展趋势进行分析。
关键词 GOOGLE PAGERANK 排序算法 网页 链接 发展趋势
原文传递
利用XML DOM创建强大的XML应用 被引量:13
16
作者 李京 庄成三 +1 位作者 徐彧 陈华英 《计算机应用研究》 CSCD 北大核心 2002年第2期62-64,共3页
介绍了DOM产生的背景和DOM规范 ,并讨论了利用XMLDOM技术来实现动态地创建文档 ,以及遍历文档结构 ,添加、修改、删除文档内容 ,改变文档的显示方式等方法。
关键词 DOM API XML DOM对象模型 XML语法树 网页
下载PDF
一种嵌入式浏览器的核心技术及特色 被引量:16
17
作者 周正勇 阳富民 胡贯荣 《计算机工程与设计》 CSCD 2003年第3期21-23,共3页
随着嵌入式系统广泛应用于消费电子和通信领域,嵌入式浏览器成为嵌入式网络应用的热点。介绍了设计并实现的嵌入式浏览器的主要特点,描述了浏览器核心模块主要功能的实现技术。
关键词 嵌入式浏览器 软件代码 解析模块 网页
下载PDF
语义Web的标记语言和体系结构 被引量:23
18
作者 潘小进 林子禹 +1 位作者 张月强 贺春辉 《计算机工程》 CAS CSCD 北大核心 2003年第5期99-101,182,共4页
当前WWW上的信息主要是为人类阅读而设计的,而语义Web试图将WWW上的海量信息以一种机器可理解的方式组织起来,提供数据的语义关系的表达手段,以满足日益增加的Web应用对数据互操作性的要求。XML提供了对数据表达的语法的统一描述,RD... 当前WWW上的信息主要是为人类阅读而设计的,而语义Web试图将WWW上的海量信息以一种机器可理解的方式组织起来,提供数据的语义关系的表达手段,以满足日益增加的Web应用对数据互操作性的要求。XML提供了对数据表达的语法的统一描述,RDF和RDF Schema提供了对数据语义的表达手段。本体论(Ontology)是关于领域内共享概念的形式化的规格说明,在语义Web中起重要作用,本体论语言形成关于本体的逻辑描述。这样从下到上形成了语义Web的层次体系结构。 展开更多
关键词 标记语言 体系结构 HTML语言 XML语言 语义WEB RDFSchema WWW 本体论 网页
下载PDF
网络著作权若干问题研究 被引量:24
19
作者 李永明 叶慧霖 《浙江大学学报(人文社会科学版)》 CSSCI 北大核心 2001年第6期117-125,共9页
网络著作权问题不仅涉及到激励创作和繁荣科学文化的问题 ,而且还关系到网络业界和整个信息产业的发展 ,对此问题予以深入的研究 ,可为我国修订著作权法提供理论思路和依据 ,具有十分重要的意义。网页及网页集合可以构成汇编作品 ;在线... 网络著作权问题不仅涉及到激励创作和繁荣科学文化的问题 ,而且还关系到网络业界和整个信息产业的发展 ,对此问题予以深入的研究 ,可为我国修订著作权法提供理论思路和依据 ,具有十分重要的意义。网页及网页集合可以构成汇编作品 ;在线交互式作品是网络条件下特有的作品新形式 ,其权利应归属于投资者 ;可以由网络服务商提供证明资料来确定网络作品的作者身份 ;在著作财产权中应增设一项网络传输权 ;此外 ,还应增加著作人身权应当善意行使等原则 。 展开更多
关键词 在线交互式作品 网络传输权 著作人身权 网络著作权 网页 作品性 网络作品 著作权法
下载PDF
分布式Web Crawler的研究:结构、算法和策略 被引量:23
20
作者 叶允明 于水 +2 位作者 马范援 宋晖 张岭 《电子学报》 EI CAS CSCD 北大核心 2002年第12A期2008-2011,共4页
本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageR... 本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页. 展开更多
关键词 WEB爬虫 爬行策略 分布式系统 计算机网络 网页
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部