-
题名搜索引擎综合分析
被引量:18
- 1
-
-
作者
方志坚
张瑞林
童小素
-
机构
浙江理工大学软件工程研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第16期4038-4041,共4页
-
文摘
随着互联网的广泛应用,搜索引擎成为了越来越多的用户从海量信息中获取知识必不可少的工具。说明了搜索引擎当前发展的现状,简述了搜索引擎的分类,基本原理和工作机制,重点分析了搜索引擎的检索技术及页面排序方法,最后介绍了搜索引擎面临的挑战和未来发展趋势。
-
关键词
搜索引擎
信息检索
排序算法
链接分析算法
超链引导的主题搜索
-
Keywords
search engine
information retrieval
ranking algorithms
PageRank
HITS
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于PageRank的页面排序改进算法
被引量:18
- 2
-
-
作者
王冬
雷景生
-
机构
琼州学院计算机系
海南大学信息学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2009年第4期210-213,共4页
-
基金
海南省自然科学基金项目(80546)
海南省教育厅高校科研项目(Hj2008-117)
琼州学院科研项目(QY200815)
-
文摘
首先对PageRank算法进行了分析,探讨了国外现有的基于链接结构的改进算法.在此基础上,指出PageRank算法平均分配PageRank值影响了网页的排序质量,提出了一种不平均分配PageRank值的改进算法NPR,并对改进算法进行测试及分析.实验证明,NPR的排序结果比PageRank提高了约11.2%的相关度.
-
关键词
搜索引擎
信息检索
排序算法
数据挖掘
PAGERANK
-
Keywords
search engine
information retrieval
ranking algorithm
data mining
PageRank
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于PageRank的页面排序改进算法
被引量:11
- 3
-
-
作者
王冬
雷景生
李壮
-
机构
琼州学院计算机系
海南大学信息学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第22期5921-5923,F0003,共4页
-
基金
海南省自然科学基金项目(80546)
海南省教育厅高校科研基金项目(Hj2008-117)
琼州学院科研基金项目(QY200815)
-
文摘
首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法。在此基础上,指出PageRank算法给不同网页分配相同的PageRank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行了相应测试和比较。实验结果表明,HCPR的排序结果比PageRank提高了约15.3%的相关度。
-
关键词
搜索引擎
信息检索
排序算法
数据挖掘
页面等级
-
Keywords
search engine
information retrieval
ranking algorithm
data mining
PageRank
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名Web页面排序算法研究
被引量:3
- 4
-
-
作者
郑建华
赵政
-
机构
天津大学计算机科学与技术系
-
出处
《微处理机》
2003年第5期33-35,共3页
-
文摘
随着 Internet的迅猛发展 ,网络信息呈爆炸式增长。Web信息检索是一个从 Web海量数据中检索用户感兴趣信息的综合技术 ,它从一定程度上满足了用户对信息的需求 ,但返回页面的数量依然十分巨大。如何对搜索结果进行排序已成为影响搜索质量的一个重要问题。本文介绍了两种页面排序算法 Page Rank和 HITS,并对网页排序算法的若干改进进行了讨论。
-
关键词
INTERNET
WEB
页面排序算法
信息检索
搜索引擎
-
Keywords
search Engine
Information retrieval
Web Structure Mining
Web Page ranking
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-
-
题名Nutch搜索引擎的页面排序修改方法研究
被引量:2
- 5
-
-
作者
李村合
吕克强
-
机构
中国石油大学(华东)计算机与通信工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第6期1343-1345,共3页
-
基金
中国石油大学(华东)研究生创新基金项目(S2007-23)
-
文摘
Nutch是一个优秀的开放源代码的Web搜索引擎。虽然Nutch的页面排序方法比较合理,但是很多情况下仍然不能满足需要。分析开源搜索引擎Nutch代码,研究了Nutch的页面排序方法。在Nutch原有的结构基础上提出了3种修改Nutch排序的方法,对每种方法的实现进行了阐述,最后对这些方法的特点进行了比较。
-
关键词
搜索引擎
检索机制
页面排序
网页检索
修改方法
-
Keywords
search engine
retrieval mechanism
page-ranking
web search
modifying method
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名搜索引擎点击模型综述
被引量:4
- 6
-
-
作者
王超
刘奕群
马少平
-
机构
清华大学计算机系
-
出处
《智能系统学报》
CSCD
北大核心
2016年第6期711-718,共8页
-
基金
国家自然科学基金项目(61532011
61672311)
-
文摘
搜索引擎用户在与搜索引擎的交互过程中反映出的隐性反馈信息(主要是点击行为信息)是搜索引擎用来改进结果排序的重要影响因素。然而,由于结果位置、展现形式等各种因素的影响,将反馈信息直接应用于搜索排序任务往往难以取得较好的效果。针对这一问题,研究人员提出了构建描述用户点击行为的点击模型,并基于不同的点击模型估计用户对展现结果的浏览概率,进而尝试去除结果展现位置等因素对用户行为的偏置性影响,以达到更好利用隐性反馈信息的目的。作为一种用户交互信息的有效利用方法,点击模型在学术界得到了充分关注,并在工业界得到了广泛的应用。本文是一篇针对点击模型发展过程的综述性文章,对点击模型发展过程中有代表性的多种模型进行了介绍。
-
关键词
搜索引擎
信息检索
结果排序
用户行为分析
点击模型
-
Keywords
search engine
information retrieval
result ranking
user behavior analysis
click model
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名语义检索排序方法研究进展
- 7
-
-
作者
李慧
-
机构
南京邮电大学图书馆
-
出处
《现代情报》
CSSCI
北大核心
2015年第2期159-164,共6页
-
文摘
排序算法的好坏很大程度上影响了搜索引擎的用户体验,尤其是近些年随着语义检索技术的发展,使其检索和排序的对象不仅仅局限于文档和网页,更包括了实体和关系等。在对现有研究与应用调研的基础上,对当前语义检索研究进行了综述,并按照排序的阶段将其分为实体排序、关系排序和本体文档排序,并详细阐述了每种排序算法的研究进展,最后指出,将用户的社会网络因素同已有的排序算法相结合,是未来语义排序的发展趋势之一。
-
关键词
语义检索
检索排序
本体
关系
实体
-
Keywords
semantic retrieval
search retrieval ranking
ontology
relationship
entity
-
分类号
G250
[文化科学—图书馆学]
-
-
题名搜索引擎工作原理浅析
- 8
-
-
作者
王玉芳
毛晓菊
桑健
-
机构
西安通信学院
河南农业大学华豫学院
中兴通讯
-
出处
《中国电子商务》
2010年第9期81-82,共2页
-
文摘
随着因特网的迅猛发展,搜索引擎成为浏览者获取信息的主要途径之一。本文通过对搜索引擎5个主要环节的分析,介绍了搜索引擎的工作原理。
-
关键词
搜索引擎
信息检索
结果排序
-
Keywords
search engine
Information retrieval
Result ranking
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名面向用户意图的智能搜索引擎框架研究
被引量:8
- 9
-
-
作者
郑炜
梁战平
梁建
-
机构
北京大学信息管理系
中国科学技术信息研究所
科学技术部信息中心
-
出处
《现代图书情报技术》
CSSCI
北大核心
2014年第3期65-72,共8页
-
文摘
【目的】提出一套基于用户搜索意图的智能搜索引擎系统框架理念,并研究核心排序算法。【方法】基于用户搜索意图从内容存储、内容检索以及内容排名三个方面出发对搜索引擎算法进行重构,并在内容排名算法中综合考虑内容的相关性、可靠性、多样性以及热度等因素。【结果】实验表明基于意图的智能搜索算法与传统的基于关键字的搜索算法相比返回结果的相关度更高,而且高相关度表现具有较高的稳定性,处于对传统方法的支配地位。【局限】构建智能搜索引擎是一个庞大的工程,还有诸多技术和工程问题没有深入研究和解决。搜索排序算法还需要进行大量的实验进行验证和改进。【结论】本研究为构建新一代基于意图的智能搜索引擎奠定基础。
-
关键词
智能搜索
用户建模
检索
排序
-
Keywords
Intelligent search User modeling retrieval ranking
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-