期刊文献+
共找到276篇文章
< 1 2 14 >
每页显示 20 50 100
WWW上Meta-Search的研究与实现 被引量:6
1
作者 陈智健 《计算机科学》 CSCD 北大核心 1999年第4期38-42,共5页
1 引言 World Wide Web是目前全球最大的信息系统,在WWW上查询Web文档主要依赖于Internet上的索引信息系统,如Yahoo、Infoseek、AltaVista、WebCrawler、Excite、Lycos等等。由于WWW太大又没有良好的结构且Web服务器的自治性,所以Web文... 1 引言 World Wide Web是目前全球最大的信息系统,在WWW上查询Web文档主要依赖于Internet上的索引信息系统,如Yahoo、Infoseek、AltaVista、WebCrawler、Excite、Lycos等等。由于WWW太大又没有良好的结构且Web服务器的自治性,所以Web文档的查询难以做到全面而精确。衡量Web文档查询的质量主要有两个方面:①是否能把所有相关的文档资源找出来,不要有所遗漏。 展开更多
关键词 WWW 元搜索 INTERNET网 信息资源
下载PDF
领域相关的Web网站抓取方法 被引量:5
2
作者 李刚 周立柱 +1 位作者 郭奇 林玲 《计算机科学》 CSCD 北大核心 2007年第2期137-140,148,共5页
本文提出了一种抓取领域相关的Web站点的方法,可以在较小的代价下准确地收集用户所关心领域内的网站。这种方法主要改进了传统的聚焦爬虫(Focused Crawler)技术,首先利用Meta-Search技术来改进传统Crawler的通过链接分析来抓取网页的方... 本文提出了一种抓取领域相关的Web站点的方法,可以在较小的代价下准确地收集用户所关心领域内的网站。这种方法主要改进了传统的聚焦爬虫(Focused Crawler)技术,首先利用Meta-Search技术来改进传统Crawler的通过链接分析来抓取网页的方法,而后利用启发式搜索大大降低了搜索代价,通过引入一种评价领域相关性的打分方法,达到了较好的准确率。本文详细地描述了上述算法并通过详细的实验验证了算法的效率和效果。 展开更多
关键词 meta-search 聚焦爬虫(Focused Crawler) 启发式搜索
下载PDF
个性化元搜索引擎模型研究 被引量:7
3
作者 孟星 丁振国 《计算机工程与应用》 CSCD 北大核心 2008年第36期150-152,共3页
在分析了传统搜索引擎以及现有元搜索引擎不足之后,提出了基于Agent的个性化元搜索引擎模型,与传统的元搜索引擎系统相比改进了系统的运行效率,同时给出了基于用户反馈的个性化QR-加权重排序算法,将检索结果的排序质量以及文档的相关度... 在分析了传统搜索引擎以及现有元搜索引擎不足之后,提出了基于Agent的个性化元搜索引擎模型,与传统的元搜索引擎系统相比改进了系统的运行效率,同时给出了基于用户反馈的个性化QR-加权重排序算法,将检索结果的排序质量以及文档的相关度在重排序中加以考虑,与传统的线性重排序算法相比提高了查询的准确程度。 展开更多
关键词 AGENT 个性化 元搜索 用户反馈
下载PDF
基于关联规则挖掘的垂直元搜索引擎研究 被引量:4
4
作者 王新 刘晓霞 《计算机工程》 CAS CSCD 北大核心 2011年第4期76-77,80,共3页
针对目前全文搜索引擎中存在的查准率较低、不能充分满足专业用户对搜索引擎的搜索需求的问题,设计一种基于元搜索技术的垂直搜索引擎系统结构。利用关联规则挖掘用户关注度较高的信息,提取这些信息中与关键词相关的隐形关键词,并用于... 针对目前全文搜索引擎中存在的查准率较低、不能充分满足专业用户对搜索引擎的搜索需求的问题,设计一种基于元搜索技术的垂直搜索引擎系统结构。利用关联规则挖掘用户关注度较高的信息,提取这些信息中与关键词相关的隐形关键词,并用于扩展搜索。设计基于多关键词组搜索的改进的元搜索引擎位置排序算法。实验结果表明,与以前搜索引擎系统相比,该系统的专业相关度有了一定提高。 展开更多
关键词 元搜索 垂直搜索 结果排序 隐形关键词
下载PDF
基于自适应隐反馈用户行为模型的数据源选择 被引量:1
5
作者 李鹏 阳小华 《计算机工程与设计》 CSCD 北大核心 2007年第12期2949-2950,2970,共3页
当前搜索引擎用户个性化的研究是搜索引擎优化的一个研究分支。当前检索模型的主要弊端就是搜索引擎用户提供的信息很少。目前主要借助于用户在和元搜索引擎交互的过程中提供的隐反馈信息对成员搜索引擎的数据源选择算法进行优化,利用... 当前搜索引擎用户个性化的研究是搜索引擎优化的一个研究分支。当前检索模型的主要弊端就是搜索引擎用户提供的信息很少。目前主要借助于用户在和元搜索引擎交互的过程中提供的隐反馈信息对成员搜索引擎的数据源选择算法进行优化,利用语言模型对用户检索行为建模,用户与元搜索引擎交互的过程中动态更新用户行为模型,自适应的满足不同检索动机的用户的信息需求。 展开更多
关键词 语言模型 元搜索 隐式相关反馈 数据源选择 用户个性化
下载PDF
农业信息资源整合系统研究与应用 被引量:3
6
作者 孙素芬 罗长寿 +2 位作者 张峻峰 于峰 张树亮 《安徽农业科学》 CAS 北大核心 2007年第22期6993-6994,6997,共3页
应用中间件、元搜索及网络爬虫等技术与思想构建农业信息资源整合系统,以期对已有的农业信息资源进行整合,从而为用户提供方便服务。
关键词 农业信息资源 整合 中间件 元搜索 爬虫
下载PDF
元搜索引擎结果集成算法 被引量:3
7
作者 韩宇彬 薛贺 《微处理机》 2008年第5期104-107,共4页
对于元搜索引擎的集成方法有很多,但是多数只考虑到客观因素,而没有考虑到用户因素。不管生成的结果在数据上有多么好,只有用户在最靠前的位置找到自己需要结果的集成方法,才是好的算法。本篇文章介绍了一种新算法,该算法在考虑到用户... 对于元搜索引擎的集成方法有很多,但是多数只考虑到客观因素,而没有考虑到用户因素。不管生成的结果在数据上有多么好,只有用户在最靠前的位置找到自己需要结果的集成方法,才是好的算法。本篇文章介绍了一种新算法,该算法在考虑到用户所查询条目同独立搜索引擎返回结果的相关性和搜索引擎数据库的影响因子的情况下,加入了用户反馈因素。用户反馈因素的加入使得该算法产生的结果更贴近用户的需要,可以根据用户对所搜索出来的结果的关注程度来调整结果的排序,使排序的结果更加优化。 展开更多
关键词 搜索引擎 元搜索 结果集成 相关度 兴趣度
下载PDF
A ranking SVM based fusion model for cross-media meta-search engine 被引量:2
8
作者 Ya-li CAO 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2010年第11期903-910,共8页
Recently,we designed a new experimental system MSearch,which is a cross-media meta-search system built on the database of the WikipediaMM task of ImageCLEF 2008.For a meta-search engine,the kernel problem is how to me... Recently,we designed a new experimental system MSearch,which is a cross-media meta-search system built on the database of the WikipediaMM task of ImageCLEF 2008.For a meta-search engine,the kernel problem is how to merge the results from multiple member search engines and provide a more effective rank list.This paper deals with a novel fusion model employing supervised learning.Our fusion model employs ranking SVM in training the fusion weight for each member search engine. We assume the fusion weight of each member search engine as a feature of a result document returned by the meta-search engine. For a returned result document,we first build a feature vector to represent the document,and set the value of each feature as the document's score returned by the corresponding member search engine.Then we construct a training set from the documents returned from the meta-search engine to learn the fusion parameter.Finally,we use the linear fusion model based on the overlap set to merge the results set.Experimental results show that our approach significantly improves the performance of the cross-media meta-search(MSearch) and outperforms many of the existing fusion methods. 展开更多
关键词 Information fusion meta-search CROSS-MEDIA RANKING
原文传递
元搜索引擎的结果去重及排序研究 被引量:3
9
作者 杨春明 何天翔 《软件》 2012年第6期51-53,共3页
结果去重和排序是提高元搜索引擎结果质量的两个关键问题,文章分析余弦相似度、基于TF-IDF的文本相似度三种去重算法,利用URL、标题和计算摘要相似度三方面去重;研究了Board排序、星星排序、轮询法、位置排序和概念可行度对检索结果的影... 结果去重和排序是提高元搜索引擎结果质量的两个关键问题,文章分析余弦相似度、基于TF-IDF的文本相似度三种去重算法,利用URL、标题和计算摘要相似度三方面去重;研究了Board排序、星星排序、轮询法、位置排序和概念可行度对检索结果的影响,提出了一种综合排序算法。实验结果表明,综合排序算法在准确率、召回率等方面都优于其他算法。 展开更多
关键词 元搜索 相似度 去重 排序
下载PDF
RESEARCH ON OPTIMIZING THE MERGING RESULTS OF MULTIPLE INDEPENDENT RETRIEVAL SYSTEMS BY A DISCRETE PARTICLE SWARM OPTIMIZATION 被引量:1
10
作者 XieXingsheng ZhangGuoliang XiongYan 《Journal of Electronics(China)》 2012年第1期111-119,共9页
The result merging for multiple Independent Resource Retrieval Systems (IRRSs), which is a key component in developing a meta-search engine, is a difficult problem that still not effectively solved. Most of the existi... The result merging for multiple Independent Resource Retrieval Systems (IRRSs), which is a key component in developing a meta-search engine, is a difficult problem that still not effectively solved. Most of the existing result merging methods, usually suffered a great influence from the usefulness weight of different IRRS results and overlap rate among them. In this paper, we proposed a scheme that being capable of coalescing and optimizing a group of existing multi-sources-retrieval merging results effectively by Discrete Particle Swarm Optimization (DPSO). The experimental results show that the DPSO, not only can overall outperform all the other result merging algorithms it employed, but also has better adaptability in application for unnecessarily taking into account different IRRS's usefulness weight and their overlap rate with respect to a concrete query. Compared to other result merging algorithms it employed, the DPSO's recognition precision can increase nearly 24.6%, while the precision standard deviation for different queries can decrease about 68.3%. 展开更多
关键词 Multiple resource retrievals Result merging meta-search engine Discrete ParticleSwarm Optimization (DPSO)
下载PDF
同质Mashup构件池动态构造机制 被引量:2
11
作者 赵星 刘譞哲 +1 位作者 王旭东 黄罡 《计算机科学与探索》 CSCD 2013年第1期14-24,共11页
互联网上存在大量"同质"的网站或服务,以其封装而成的Mashup构件往往提供相同或相似的功能,为了获取最佳服务,用户不得不逐一浏览每个Mashup构件,花费大量的时间和精力。从用户视角出发,提出了一种同质Mashup构件动态聚合机... 互联网上存在大量"同质"的网站或服务,以其封装而成的Mashup构件往往提供相同或相似的功能,为了获取最佳服务,用户不得不逐一浏览每个Mashup构件,花费大量的时间和精力。从用户视角出发,提出了一种同质Mashup构件动态聚合机制。基于元数据搜索和表单匹配技术,该机制将多个同质Mashup构件组成一个构件池,再按照用户当前的数据请求,动态发现最佳服务,从而实现服务资源的整合和优化,提高整体服务质量。最后,基于富客户端构件组装与验证框架iMashup实现了上述机制,并进行了实验验证。 展开更多
关键词 Mashup构件 表单匹配 元搜索
下载PDF
搜索与处理技术在公共信息监控管理中的设计与研究 被引量:1
12
作者 涂敏 《江西公安专科学校学报》 2009年第3期121-124,共4页
目前,我国公共信息监控管理的实际情况不容乐观。为此,基于"元搜索"的公共信息安全搜索引擎的设计十分必要。同时,对于其研究内容、设计框架和流程、研究目标及设计应用中的关键问题进行了介绍。如将该搜索引擎应用到公共信... 目前,我国公共信息监控管理的实际情况不容乐观。为此,基于"元搜索"的公共信息安全搜索引擎的设计十分必要。同时,对于其研究内容、设计框架和流程、研究目标及设计应用中的关键问题进行了介绍。如将该搜索引擎应用到公共信息监控管理中,将解决公安机关网监部门对互联网网页信息采集能力不足的问题,提高网监部门对于特定信息全面掌握的能力。 展开更多
关键词 元搜索 信息检索 搜索引擎 公共信息监控 互联网
下载PDF
基于多中文搜索引擎的可扩展网络混合爬虫 被引量:1
13
作者 潘志舟 赵靖 《安徽科技学院学报》 2012年第6期70-75,共6页
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的信息资源,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,设计一个统一的搜索引擎查询界面,并能快速智能合并查询结果是... 由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的信息资源,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,设计一个统一的搜索引擎查询界面,并能快速智能合并查询结果是一个挑战。针对现有单个引擎搜索的限制,提出了基于行块的正文摘要提取方法和基于词频的相似度模型实现了一个可扩展的多WEB源的网络爬虫,将现各搜索引擎上的网页信息进行抽取,过滤、去重、排序、信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。系统的测试结果表明我们的方法是比较有效的。 展开更多
关键词 元搜索引擎 网络爬虫 搜索引擎 网页相似度
下载PDF
搜索引擎的技术局限及改进策略研究
14
作者 李振龙 《台州学院学报》 2005年第3期34-36,47,共4页
随着Web的不断发展,对高速而有效的信息检索系统需求日渐追切。本文对信息检索的核心技术-搜索引擎进行了分析,找出其表现不佳的原因并提出了基于Web社区和基于语义的改进策略。
关键词 Web 搜索引擎 元搜索 移动代理 WEB社区
下载PDF
The Result Integration Algorithm Based on Matching Strategy
15
作者 XU Jia-shu YE Zhi-qiang QIN Zheng 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期113-116,共4页
The following paper provides a new algorithm: a result integration algorithm based on matching strategy. The algorithm extracts the title and the abstract of Web pages, calculates the relevance between the query stri... The following paper provides a new algorithm: a result integration algorithm based on matching strategy. The algorithm extracts the title and the abstract of Web pages, calculates the relevance between the query string and the Web pages, decides the Web pages accepted, rejected and sorts them out in user interfaces. The experiment results in dieate obviously that the new algorithms improve the precision of meta-search engine. This technique is very useful to metasearch engine. 展开更多
关键词 meta-search engine RELEVANCE Web page
下载PDF
多智能体在元搜索引擎中的应用研究
16
作者 李广进 寇净磊 《电脑知识与技术》 2009年第5期3495-3495,3498,共2页
随着网络信息的指数增长和用户对检索质量要求的日益提高,传统搜索引擎的查全率和准确率都开始下降,已无法满足用户信息检索的需求。该文从搜索引擎技术的概念入手,分析了元搜索引擎和多智能体的基本原理,并利用多Agent系统自治智... 随着网络信息的指数增长和用户对检索质量要求的日益提高,传统搜索引擎的查全率和准确率都开始下降,已无法满足用户信息检索的需求。该文从搜索引擎技术的概念入手,分析了元搜索引擎和多智能体的基本原理,并利用多Agent系统自治智能和分布协同的特性.提出了基于多智能体的元搜索引擎。 展开更多
关键词 AGENT 多智能体 搜索引擎 元搜索 智能搜索
下载PDF
用户定制主题爬虫的设计与实现 被引量:1
17
作者 吴经伟 刘学亮 《山西科技》 2016年第2期135-140,共6页
目的:主题爬虫是用户获取领域知识的一种有效途径。为实现此方法用户首要解决的问题是主题向量的训练数据的选择和初始URLs的选择。但传统的主题爬虫对于初始URLs的选取并没有过多论述,为此,本文探讨了初始URLs对于主题爬虫的影响,并提... 目的:主题爬虫是用户获取领域知识的一种有效途径。为实现此方法用户首要解决的问题是主题向量的训练数据的选择和初始URLs的选择。但传统的主题爬虫对于初始URLs的选取并没有过多论述,为此,本文探讨了初始URLs对于主题爬虫的影响,并提出了一种基于元搜索和本体结合的算法来选择并确定初始URLs。方法:采用元搜索方法获取与主题相关的初始URLs,然后根据返回结果采用本体领域知识进行重排序,选择前排的URLs。自动而不是人工地进行初始URLs的确定,同时将页面信息作为训练主题向量的语料。结果:通过对比实验,本文选取的初始URLs比随机选择的要有更高的收获比。从获取总量上看,本文的方法能获得更多的相关网页。结论:通过实验证明主题团的存在,通过本文方法能够选择质量更好的初始URLs,获取主题向量训练语料,发现更多主题团,并且方便用户对于主题爬虫的定制。 展开更多
关键词 主题爬虫 元搜索 本体 重排序 初始URL
下载PDF
小议智能信息检索的智能性 被引量:1
18
作者 宋博 《农业图书情报学刊》 2013年第5期127-130,共4页
智能信息检索是信息检索的高级阶段,是在进行智能研究和尝试,寻找更为人性化、个性化的信息检索方式,其实质是在信息检索过程中实现"智能性"。文章重点讨论智能信息信息检索系统各组成要素及其智能实现:本体论给智能信息检索... 智能信息检索是信息检索的高级阶段,是在进行智能研究和尝试,寻找更为人性化、个性化的信息检索方式,其实质是在信息检索过程中实现"智能性"。文章重点讨论智能信息信息检索系统各组成要素及其智能实现:本体论给智能信息检索系统以强大的知识保证;元搜索不仅扩大信息检索的广度,更是根据用户需求偏好处理信息检索结果;智能代理协调智能信息系统各组成要素;机器学习在智能信息检索中加入人的因素,使智能信息检索更加的个性化,它们共同支持着信息检索的智能化。 展开更多
关键词 智能信息检索 智能 本体论 元搜索 智能代理 机器学习
下载PDF
农村图书馆检索系统研究 被引量:1
19
作者 姜晓刚 《安徽农业科学》 CAS 北大核心 2010年第13期7122-7123,7133,共3页
针对农村图书馆的现状,借助农村信息化,设计了充分利用互联网资源和本地资源的检索系统,方便农民利用互联网及本地图书资源来发展致富。
关键词 农村图书馆 元搜索 MVC 检索系统 农业信息化
下载PDF
基于伪爬行器的主题式元搜索引擎研究与设计
20
作者 马奕平 庄敏 +1 位作者 叶延风 张霞 《计算机工程》 CAS CSCD 北大核心 2008年第22期70-72,76,共4页
为提高搜索的查准率和查全率,设计一个主题式的元搜索引擎和一个类似于爬行器的伪爬行器,通过调用通用搜索引擎采集信息,查全率高于通用搜索引擎。利用反馈机制,参考用户查询历史记录,搜索结果更加接近用户的要求。通过采用主题式策略,... 为提高搜索的查准率和查全率,设计一个主题式的元搜索引擎和一个类似于爬行器的伪爬行器,通过调用通用搜索引擎采集信息,查全率高于通用搜索引擎。利用反馈机制,参考用户查询历史记录,搜索结果更加接近用户的要求。通过采用主题式策略,改进文档相似度算法,提高分类的正确率和搜索引擎的查准率与搜索范围,同时减少系统响应时间,降低对服务器性能的要求。 展开更多
关键词 元搜索 主题式 搜索引擎 伪爬行器
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部