期刊文献+
共找到381篇文章
< 1 2 20 >
每页显示 20 50 100
聚焦爬虫技术研究综述 被引量:156
1
作者 周立柱 林玲 《计算机应用》 CSCD 北大核心 2005年第9期1965-1969,共5页
因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。... 因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。至今,聚焦爬虫已成为有关万维网的研究热点之一。文中对这一热点研究进行综述,给出聚焦爬虫(Focused Crawler)的基本概念,概述其工作原理;并根据研究的发展现状,对聚焦爬虫的关键技术(抓取目标描述,网页分析算法和网页搜索策略等)作系统介绍和深入分析。在此基础上,提出聚焦爬虫今后的一些研究方向,包括面向数据分析和挖掘的爬虫技术研究,主题的描述与定义,相关资源的发现,W eb数据清洗,以及搜索空间的扩展等。 展开更多
关键词 聚焦爬虫 信息检索 链接分析 文本检索 数据抽取 协作抓取 本体描述 元搜索
下载PDF
中国大学网站链接分析及网络影响因子探讨 被引量:93
2
作者 邱均平 陈敬全 段宇锋 《中国软科学》 CSSCI 北大核心 2003年第6期151-155,共5页
本文对中国主要大学网站的总链接量、外部链接量和网络影响因子(WIF)作了深入研究,分析了它们与大学排名中的总得分和科研得分的相关关系,指出了网络影响因子在测度中国大学网站网络影响力上的不足之处,提出外部链接量是测度大学网站网... 本文对中国主要大学网站的总链接量、外部链接量和网络影响因子(WIF)作了深入研究,分析了它们与大学排名中的总得分和科研得分的相关关系,指出了网络影响因子在测度中国大学网站网络影响力上的不足之处,提出外部链接量是测度大学网站网络影响力的有效手段之一。文章对研究中所用的搜索引擎的数据作了比较分析,指出AltaVista的数据比AllTheWeb更稳定。 展开更多
关键词 大学网站:链接分析 网络影响因子 搜索引擎 链接量 大学排名 学术声誉
下载PDF
Web社区发现技术综述 被引量:35
3
作者 杨楠 弓丹志 +1 位作者 李忺 孟小峰 《计算机研究与发展》 EI CSCD 北大核心 2005年第3期439-447,共9页
Web是一个复杂超文本所组成的巨大的信息源,而且以很快的速度在不断的扩大.针对这样一个不断变化的信息源,如何利用和发现Web中的有用信息变得具有挑战性.Web在发展过程中存在着大量的社区,这些社区是Web组织中非常重要的信息.通过对社... Web是一个复杂超文本所组成的巨大的信息源,而且以很快的速度在不断的扩大.针对这样一个不断变化的信息源,如何利用和发现Web中的有用信息变得具有挑战性.Web在发展过程中存在着大量的社区,这些社区是Web组织中非常重要的信息.通过对社区信息的认识可以帮助我们总览Web的全貌.而将Web按照社区来组织有许多优点.社区可以引导用户找到感兴趣的信息;社区可以帮助Internet/Intranet服务提供者有效地组织门户;社区可以帮助制造商准确地找到消费者.社区还代表了Web的社会活动,因为Web就是一个社会性的网络.目前,许多社区的发现和维护是依靠人工来完成的,维护成本较高,修改也困难;此外,还存在着许多不为人知或者称为潜在的社区,而这些社区是无法通过人工来发现的.因此,许多研究都在致力于社区的自动或半自动发现技术.社区的发现主要采用基于Web图形的链接分析技术.在方法上大致上分为两类,一类是面向某个主题的社区发现,而另一个是无主题的社区发现技术.对于社区的发现技术做了较为全面的分析,并且总结了社区发现技术中依然存在的、挑战性的问题和未来的研究趋势. 展开更多
关键词 Web资源发现 社区 链接分析 WEB模型
下载PDF
智库网站影响力评价指标体系研究 被引量:44
4
作者 陈媛媛 李刚 《图书馆论坛》 CSSCI 北大核心 2016年第5期25-33,62,共10页
文章以我国知名智库为研究对象,以智库媒体宣传特性为基础,运用链接分析方法和因子分析统计方法建立智库网站综合评价指标体系。研究发现:高校智库网站建设能力较低;智库网站影响力排名和全球智库综合排名的结果具有相关性,提高智库综... 文章以我国知名智库为研究对象,以智库媒体宣传特性为基础,运用链接分析方法和因子分析统计方法建立智库网站综合评价指标体系。研究发现:高校智库网站建设能力较低;智库网站影响力排名和全球智库综合排名的结果具有相关性,提高智库综合影响力需要提高智库门户网站建设能力;要提高智库网站网络影响力,需要加强资源建设,以及与其它网站间交流合作。 展开更多
关键词 智库 智库网站 影响力 链接分析 评价指标 因子分析
下载PDF
主题爬虫技术研究综述 被引量:44
5
作者 潘晓英 陈柳 +2 位作者 余慧敏 赵逸喆 肖康泞 《计算机应用研究》 CSCD 北大核心 2020年第4期961-965,972,共6页
随着移动互联网的普及以及网络信息指数的增长,如何有效地提取和利用这些信息面临巨大挑战。介绍了主题爬虫的工作原理、分类;回顾了近年来国内外关于主题爬虫的研究状况,分析了各种主题相似度的方法以及搜索策略,得出相比于普通的爬虫... 随着移动互联网的普及以及网络信息指数的增长,如何有效地提取和利用这些信息面临巨大挑战。介绍了主题爬虫的工作原理、分类;回顾了近年来国内外关于主题爬虫的研究状况,分析了各种主题相似度的方法以及搜索策略,得出相比于普通的爬虫系统,基于网页内容和基于链接分析的爬虫系统的查准率、查全率都大幅提升;最后分析比较了主题网络爬虫两种动态搜索策略并指出了未来研究方向。 展开更多
关键词 网络爬虫 主题爬虫 相似度 网页内容 链接分析
下载PDF
中外企业网站的链接分析与网络影响力评价 被引量:35
6
作者 陈太洋 任全娥 《情报理论与实践》 CSSCI 北大核心 2008年第4期614-619,共6页
以《2006中国企业500强名单》和《〈财富〉2006年度世界五百强公司排行榜》中选取出的34家中外信息技术企业与消费类电子企业为研究样本,以Google和AltaVista为搜索工具,得到相关网站的17个链接分析指标。通过对这些指标数据进行分类处... 以《2006中国企业500强名单》和《〈财富〉2006年度世界五百强公司排行榜》中选取出的34家中外信息技术企业与消费类电子企业为研究样本,以Google和AltaVista为搜索工具,得到相关网站的17个链接分析指标。通过对这些指标数据进行分类处理与综合分析,展示并评价我国企业网站的网络影响力以及各指标的相对排序位置,同时探索中外商业网站、不同行业网站、信息展示网站与网上交易网站等因素是否与网站网络影响力之间存在着有意义的相关关系,并从所得数据的处理结果对链接指标与链接分析工具做了讨论。 展开更多
关键词 企业 网站评价 链接分析 网络影响力
下载PDF
基于网页链接和内容分析的改进PageRank算法 被引量:25
7
作者 钱功伟 倪林 +1 位作者 MIAO Yuan 曹荣 《计算机工程与应用》 CSCD 北大核心 2007年第21期160-164,共5页
结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选... 结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选择合适的参数EPR算法可以获得优于传统PageRank算法的排序结果。 展开更多
关键词 PAGERANK 网页排序 链接分析 相关性分析
下载PDF
我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例 被引量:30
8
作者 陈太洋 《图书馆杂志》 CSSCI 北大核心 2007年第3期43-49,共7页
文摘以我国“211工程”大学图书馆作为研究样本,以Google和Altavista为搜索工具,得到相关网站的12个链接分析指标。通过对这些指标数据进行分类处理与综合分析,全方位展示并评价我国重点大学图书馆网站的规模、影响以及各指标的相对排... 文摘以我国“211工程”大学图书馆作为研究样本,以Google和Altavista为搜索工具,得到相关网站的12个链接分析指标。通过对这些指标数据进行分类处理与综合分析,全方位展示并评价我国重点大学图书馆网站的规模、影响以及各指标的相对排序位置,为我国大学图书馆网站的建设提供借鉴性信息,并从所得数据的处理结果对链接指标与链接分析工具进行了讨论。 展开更多
关键词 大学图书馆 网站 链接分析
下载PDF
搜索引擎页面排序算法研究综述 被引量:21
9
作者 李绍华 高文宇 《计算机应用研究》 CSCD 北大核心 2007年第6期4-7,共4页
系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业搜索引擎集成在一起,形成一个基于网格... 系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业搜索引擎集成在一起,形成一个基于网格的搜索引擎,从而更好地满足不同背景不同偏好的用户需求。 展开更多
关键词 搜索引擎 页面排序 链接分析
下载PDF
基于主题和链接分析的微博社区发现算法 被引量:28
10
作者 闫光辉 舒昕 +1 位作者 马志程 李祥 《计算机应用研究》 CSCD 北大核心 2013年第7期1953-1957,共5页
针对传统社区发现方法大多基于链接或主题关系,且没有考虑获取微博用户社会信息时的限制,无法有效识别微博中多个社区的问题,提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及... 针对传统社区发现方法大多基于链接或主题关系,且没有考虑获取微博用户社会信息时的限制,无法有效识别微博中多个社区的问题,提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及博文主题特性,定义了链接相关度和主题相关度公式;然后推出用户总相关度公式,以此来计算节点间的传递概率,用改进后的标签传递算法对用户分类;最终划分出兴趣相似且社会联系紧密的用户群。真实数据集上的仿真实验验证了该方法的合理性和有效性。 展开更多
关键词 微博 社区发现 潜层Dirichlet分配 主题模型 链接分析 标签传递算法
下载PDF
基于链接分析法的高校图书馆网站影响力评价研究 被引量:24
11
作者 刘文云 翟羽佳 王文颖 《情报科学》 CSSCI 北大核心 2013年第6期99-102,106,共5页
良好的网站建设有利于高校图书馆的信息发布、业务办理及扩大自身宣传。文章利用链接分析法对我国排名靠前的15个高校图书馆网站的影响力进行评价,并结合其评价结果,分析我国高校图书馆网站影响力现状及存在问题,提出改进策略。
关键词 高校图书馆网站 链接分析 影响力评价
原文传递
超短波通信链路分析 被引量:19
12
作者 罗一锋 李含辉 黄继进 《现代电子技术》 2006年第9期41-44,共4页
主要从通信系统设计的角度出发,对超短波通信链路分析进行了初步探索,介绍了能量传播分析法和链路余量分析法以及多径条件下的考虑。结合工程实践,给出了超短波通信链路分析示例,这将有助于系统工程师预知系统设计性能、控制技术风险、... 主要从通信系统设计的角度出发,对超短波通信链路分析进行了初步探索,介绍了能量传播分析法和链路余量分析法以及多径条件下的考虑。结合工程实践,给出了超短波通信链路分析示例,这将有助于系统工程师预知系统设计性能、控制技术风险、进一步提高信道估值的可信度。 展开更多
关键词 超短波 通信链路 链路余量 链路预算 有效区域 视距
下载PDF
主题爬虫的解决方案 被引量:10
13
作者 刘林 汪涛 樊孝忠 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期137-141,共5页
对传统的综合性搜索引擎召回率和精确率低的问题,可以用主题爬虫取代其中的普通爬虫构建主题搜索引擎,为用户提供信息检索服务,满足用户伴随信息多元化的增长而不断扩展的信息需求.文中研究了主题爬虫设计中的相关度分析、概念分析和链... 对传统的综合性搜索引擎召回率和精确率低的问题,可以用主题爬虫取代其中的普通爬虫构建主题搜索引擎,为用户提供信息检索服务,满足用户伴随信息多元化的增长而不断扩展的信息需求.文中研究了主题爬虫设计中的相关度分析、概念分析和链接分析等关键技术,通过实验给出了一系列解决方案.结果表明,主题爬虫的精度高于普通爬虫,具有可行性与实用性,并有助于主题搜索引擎的设计和主题信息的采集. 展开更多
关键词 搜索引擎 主题爬虫 相关度分析 概念分析 链接分析 信息采集
下载PDF
当前链接分析工具的缺陷及其解决方案 被引量:17
14
作者 邱均平 李江 《情报科学》 CSSCI 北大核心 2007年第5期641-647,共7页
链接分析自诞生至今的十余年里,蓬勃发展的同时,遭受了重重质疑,重要原因之一便是当前链接分析工具存在种种缺陷,以致统计数据准确度低。本文以链接分析的相关研究为基础,分析了当前链接分析工具(商业搜索引擎、自制软件和SEO工具)的缺... 链接分析自诞生至今的十余年里,蓬勃发展的同时,遭受了重重质疑,重要原因之一便是当前链接分析工具存在种种缺陷,以致统计数据准确度低。本文以链接分析的相关研究为基础,分析了当前链接分析工具(商业搜索引擎、自制软件和SEO工具)的缺陷,并针对这些缺陷提出了两套解决方案:其一,从搜索引擎工作原理的角度完善商业搜索引擎的链接分析功能;其二,参照引文分析工具开发专业链接分析工具。 展开更多
关键词 链接分析 链接分析工具 商业搜索引擎 SEO 引文分析工具
下载PDF
链接分析领域的作者合作网络及其分析 被引量:17
15
作者 郑曦 孙建军 《图书情报工作》 CSSCI 北大核心 2009年第4期29-32,105,共5页
介绍复杂网络中的科研合作网络在情报学领域的研究成果,详细分析部分网络参数的情报学意义。构建出基于Web of Science数据库的1998年1月至2008年1月链接分析领域的作者合作网络。同时,运用复杂网络理论及社会网络分析法对作者合作网络... 介绍复杂网络中的科研合作网络在情报学领域的研究成果,详细分析部分网络参数的情报学意义。构建出基于Web of Science数据库的1998年1月至2008年1月链接分析领域的作者合作网络。同时,运用复杂网络理论及社会网络分析法对作者合作网络进行详细分析,得出链接分析领域合作的一些特性,并提出有待进一步解决的问题,以期探索和推进复杂网络在情报学领域的实际应用。 展开更多
关键词 科研合作网络 链接分析 社会网络分析 共现分析
原文传递
一种更稳定的链接分析算法——子空间HITS算法 被引量:9
16
作者 石晶 龚震宇 +1 位作者 裘杭萍 张毓森 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第1期49-53,共5页
在给定超链接情况下,Kleinberg的HITS算法采用特征向量的办法来确定页面的权威性等级.通过分析当链接模式发生小的变化时算法的稳定性,提出一种新的算法——子空间HITS算法,并通过Web超链接数据作为实验数据对其性能进行研究.
关键词 链接分析算法 子空间HITS算法 WEB挖掘 稳定性 超链接 链接模式 信息检索
下载PDF
基于链接分析法的我国省级知识产权局网站的网络影响力分析 被引量:16
17
作者 黄微 李吉 王文韬 《情报科学》 CSSCI 北大核心 2012年第2期264-267,共4页
本文运用链接分析法对我国省级知识产权局网站的网络影响力进行分析;根据统计结果深入分析我国省级知识产权局网站建设的优点与不足。
关键词 知识产权局网站 网络影响力 链接分析法
原文传递
基于PageRank和HITS的Web搜索 被引量:12
18
作者 常庆 周明全 耿国华 《计算机技术与发展》 2008年第7期77-79,共3页
介绍了目前应用较为广泛的两种算法——PageRank算法和HITS算法。PageRank算法是基于用户随机的向前浏览网页的直觉知识,HITS算法考虑的是Authoritive网页和Hub网页间的加强关系。PageRank算法的基本思想是:如果一个页面被许多其他页面... 介绍了目前应用较为广泛的两种算法——PageRank算法和HITS算法。PageRank算法是基于用户随机的向前浏览网页的直觉知识,HITS算法考虑的是Authoritive网页和Hub网页间的加强关系。PageRank算法的基本思想是:如果一个页面被许多其他页面引用,则这个页面很可能是重要页面;一个页面尽管没有被多次引用,但被一个重要页面引用,那么这个页面很可能也是重要页面;一个页面的重要性被均分并传递到它所引用的页面。而HITS算法则专注于改善泛指主题检索的结果,通过一定的计算(迭代计算)方法以得到针对某个检索提问的最具价值的网页,即排名最高的authority。 展开更多
关键词 PAGERANK HITS 特征向量 检索主题 链按分析
下载PDF
时空维度下的我国链接分析研究现状分析 被引量:15
19
作者 赵蓉英 魏绪秋 《情报科学》 CSSCI 北大核心 2017年第4期3-8,共6页
【目的/意义】链接分析是网络计量学主要研究内容之一。新网络时代,及时了解我国链接分析研究现状,对促进我国链接分析深入研究和长远发展具有重要的意义。【方法/过程】本研究基于CNKI数据库和维普数据库,运用统计与可视化方法对我国... 【目的/意义】链接分析是网络计量学主要研究内容之一。新网络时代,及时了解我国链接分析研究现状,对促进我国链接分析深入研究和长远发展具有重要的意义。【方法/过程】本研究基于CNKI数据库和维普数据库,运用统计与可视化方法对我国链接分析的相关文献进行统计分析与可视化以发现我国链接分析研究的时空间分布特征。【结果/结论】研究发现:我国链接分析研究处于稳定增长阶段,新网络时代的到来为其提供了新的发展机遇期;链接分析研究学科领域较为集中;南京大学、武汉大学、中国科学院是链接分析研究的集散地,且机构合作群规模较小;作者合作群有一位或多位领军人物,他们大多为博硕士生导师,且合作群的抗毁性差;链接分析算法研究、科学评价与服务、数据提取与知识发现、分析方法与研究工具是我国链接分析研究的重点。以期上述发现有助于我国链接分析的发展。 展开更多
关键词 链接分析 研究现状 计量分析 可视化
原文传递
链接分析研究综述 被引量:14
20
作者 李江 殷之明 《大学图书馆学报》 CSSCI 北大核心 2008年第2期51-58,共8页
在调研近十余年国内外链接分析研究的相关文献的基础上,归纳了链接分析研究的四大视角,即网络计量学视角、检索优化视角、Web结构挖掘视角和Web结构图建模的视角,并详细分析了各个研究视角的现状,然后在此基础上提出了链接分析发展中的... 在调研近十余年国内外链接分析研究的相关文献的基础上,归纳了链接分析研究的四大视角,即网络计量学视角、检索优化视角、Web结构挖掘视角和Web结构图建模的视角,并详细分析了各个研究视角的现状,然后在此基础上提出了链接分析发展中的问题及发展趋势。 展开更多
关键词 链接分析 网络计量学 检索优化 WEB结构挖掘 web结构图建模
下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部