期刊文献+
共找到10,138篇文章
< 1 2 250 >
每页显示 20 50 100
知识图谱构建技术综述 被引量:928
1
作者 刘峤 李杨 +2 位作者 段宏 刘瑶 秦志光 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期582-600,共19页
谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明... 谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明,并给出了构建知识图谱的技术框架,按照输入的知识素材的抽象程度将其划分为3个层次:信息抽取层、知识融合层和知识加工层;2)分别对每个层次涉及的关键技术的研究现状进行分类说明,逐步揭示知识图谱技术的奥秘,及其与相关学科领域的关系;3)对知识图谱构建技术当前面临的重大挑战和关键问题进行了总结. 展开更多
关键词 知识图谱 语义网 信息检索 语义搜索引擎 自然语言处理
下载PDF
个性化服务技术综述 被引量:394
2
作者 曾春 邢春晓 周立柱 《软件学报》 EI CSCD 北大核心 2002年第10期1952-1961,共10页
对个性化服务技术中用户描述文件的表达与更新、资源描述文件的表达、个性化推荐技术、个性化服务体系结构以及该领域的主要研究成果进行了综述.通过比较现有原型系统的实现方式,详细讨论了实现个性化服务的关键技术.此外,分析了3个具... 对个性化服务技术中用户描述文件的表达与更新、资源描述文件的表达、个性化推荐技术、个性化服务体系结构以及该领域的主要研究成果进行了综述.通过比较现有原型系统的实现方式,详细讨论了实现个性化服务的关键技术.此外,分析了3个具有代表性的个性化服务系统.最后对个性化服务技术进一步研究工作的方向进行了展望. 展开更多
关键词 个性化服务 信息过滤 信息检索 协作过滤 推荐系统 WEB
下载PDF
Web文本挖掘技术研究 被引量:275
3
作者 王继成 潘金贵 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2000年第5期513-520,共8页
作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在理论上开展更多的讨论 .同时 ,Web挖掘系统的开发对其研究也... 作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在理论上开展更多的讨论 .同时 ,Web挖掘系统的开发对其研究也将起到很大推进作用 .首先探讨了 Web挖掘的有关理论 ,从 Web挖掘的定义、Web挖掘与 Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述 .然后重点分析了 Web文本挖掘的方法 ,包括 :文本的特征表示、文本分类与文本聚类 .在此基础上简单介绍了一个 Web文本挖掘系统原型Web Miner.Web Miner采用了多 agent体系结构 ,将多维文本分析与文本挖掘这两种技术有机地结合起来 ,以帮助用户快速、有效地挖掘 Web上的 HTML 文档 . 展开更多
关键词 文本挖掘 文本分类 文本聚类 信息检索 WEB
下载PDF
信息抽取研究综述 被引量:178
4
作者 李保利 陈玉忠 俞士汶 《计算机工程与应用》 CSCD 北大核心 2003年第10期1-5,66,共6页
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹—... 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。 展开更多
关键词 自然语言处理 信息抽取 信息检索 命名实体识别 计算机 信息处理
下载PDF
Web信息检索研究进展 被引量:118
5
作者 王继成 萧嵘 +1 位作者 孙正兴 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期187-193,共7页
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,... Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。 展开更多
关键词 WEB 信息检索 搜索引擎 元搜索引擎 INTERNET
下载PDF
自动问答综述 被引量:165
6
作者 郑实福 刘挺 +1 位作者 秦兵 李生 《中文信息学报》 CSCD 北大核心 2002年第6期46-52,共7页
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取... 自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。 展开更多
关键词 自动问答 问题分类 信息检索 答案抽取 自然语言处理 问题分析
下载PDF
聚焦爬虫技术研究综述 被引量:153
7
作者 周立柱 林玲 《计算机应用》 CSCD 北大核心 2005年第9期1965-1969,共5页
因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。... 因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。至今,聚焦爬虫已成为有关万维网的研究热点之一。文中对这一热点研究进行综述,给出聚焦爬虫(Focused Crawler)的基本概念,概述其工作原理;并根据研究的发展现状,对聚焦爬虫的关键技术(抓取目标描述,网页分析算法和网页搜索策略等)作系统介绍和深入分析。在此基础上,提出聚焦爬虫今后的一些研究方向,包括面向数据分析和挖掘的爬虫技术研究,主题的描述与定义,相关资源的发现,W eb数据清洗,以及搜索空间的扩展等。 展开更多
关键词 聚焦爬虫 信息检索 链接分析 文本检索 数据抽取 协作抓取 本体描述 元搜索
下载PDF
基于内容过滤的个性化搜索算法 被引量:118
8
作者 曾春 邢春晓 周立柱 《软件学报》 EI CSCD 北大核心 2003年第5期999-1004,共6页
传统信息检索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求.提出了一种基于内容过滤的个性化搜索算法.利用领域分类模型上的概率分布表达了用户的兴趣模型,然后给出了相似性计算... 传统信息检索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求.提出了一种基于内容过滤的个性化搜索算法.利用领域分类模型上的概率分布表达了用户的兴趣模型,然后给出了相似性计算和用户兴趣模型更新的方法.对比实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化. 展开更多
关键词 个性化搜索算法 内容过滤 用户模型 计算机网络 信息检索 兴趣模型
下载PDF
主题网络爬虫研究综述 被引量:131
9
作者 刘金红 陆余良 《计算机应用研究》 CSCD 北大核心 2007年第10期26-29,47,共5页
首先给出了主题网络爬虫的定义和研究目标;然后系统分析了近年来国内外主题爬虫的研究方法和技术,包括基于文字内容的方法、基于超链分析的方法、基于分类器预测的方法以及其他主题爬行方法,并比较了各种方法优缺点;最后对未来的研究方... 首先给出了主题网络爬虫的定义和研究目标;然后系统分析了近年来国内外主题爬虫的研究方法和技术,包括基于文字内容的方法、基于超链分析的方法、基于分类器预测的方法以及其他主题爬行方法,并比较了各种方法优缺点;最后对未来的研究方向进行了展望。 展开更多
关键词 主题网络爬虫 信息检索 WEB挖掘
下载PDF
本体论在基于内容信息检索中的应用 被引量:65
10
作者 万捷 滕至阳 《计算机工程》 CAS CSCD 北大核心 2003年第4期122-123,152,共3页
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽视了关键字本身所含的语义内容。该文提出的信息检索原型系统,利用本体论中概念规范、语义丰富的特点,将用户的检索要求扩充成... 网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽视了关键字本身所含的语义内容。该文提出的信息检索原型系统,利用本体论中概念规范、语义丰富的特点,将用户的检索要求扩充成语义集。并且将检索到的文档通过文档分析器进一步过滤,使用户最终得到与检索要求内容匹配度较高的文档。 展开更多
关键词 本体论 信息检索 计算机网络 搜索引擎 INTERNET INTRANET 网络文档
下载PDF
基于语义理解的文本相似度算法 被引量:79
11
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包... 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. 展开更多
关键词 语义理解 相似度算法 相似度计算 计算方法 文本相似度 语义相似度 信息检索 实例验证 计算公式 准确性 文档 知网
下载PDF
Internet上的文本数据挖掘 被引量:60
12
作者 王伟强 高文 段立娟 《计算机科学》 CSCD 北大核心 2000年第4期32-36,共5页
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的I... 1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。 展开更多
关键词 信息检索 文本数据挖掘 INTERNET网 数据库
下载PDF
MOOC背景下信息素养教育的变革 被引量:111
13
作者 黄如花 李白杨 《图书情报知识》 CSSCI 北大核心 2015年第4期14-25,共12页
文章采用文献调查法、实证研究法和网络调查法,调查了UNESCO、IFLA、ACRL等机构对信息素养概念的最新定义与要求;以笔者在爱课程网开设的"信息检索"MOOC为案例,分析了世界范围的MOOC平台中与信息素养有关的课程,以佐证作者的... 文章采用文献调查法、实证研究法和网络调查法,调查了UNESCO、IFLA、ACRL等机构对信息素养概念的最新定义与要求;以笔者在爱课程网开设的"信息检索"MOOC为案例,分析了世界范围的MOOC平台中与信息素养有关的课程,以佐证作者的观点。研究表明,信息素养的概念和内容正在泛化,现已包括了媒介与信息素养、视觉素养、数据素养等内容。在MOOC背景下,信息素养教育的内容应有所调整,呈现出宽泛化、定制化、碎片化的特征;教学方式也宜有所创新,体现出合作化、混合式、游戏化、趣味化的特征。此外,在信息素养教育中教学资源、教师能力、学生素质也应有相应的变革。 展开更多
关键词 大规模开放在线课程 MOOC 信息素养教育 信息检索
下载PDF
论信息资源整合 被引量:99
14
作者 苏新宁 章成志 卫平 《现代图书情报技术》 CSSCI 北大核心 2005年第9期54-61,共8页
信息资源整合的目标是将分散的资源集中起来,把无序的资源变为有序,使之方便用户查找信息、方便信息服务于用户。如何提高信息资源的整合效率,满足用户对信息日益增长的需求,提升资源整合实施者的素质,使他们了解信息资源整合的概念、... 信息资源整合的目标是将分散的资源集中起来,把无序的资源变为有序,使之方便用户查找信息、方便信息服务于用户。如何提高信息资源的整合效率,满足用户对信息日益增长的需求,提升资源整合实施者的素质,使他们了解信息资源整合的概念、整合的理论基础、整合的方法和途径、整合涉及的技术、资源整合后引发的信息服务变革等知识是当前信息资源整合急待解决的关键问题。 展开更多
关键词 信息资源整合 信息组织 信息检索 信息服务
下载PDF
一种HTML网页净化方法 被引量:57
15
作者 张志刚 陈静 李晓明 《情报学报》 CSSCI 北大核心 2004年第4期387-393,共7页
Web网页中的"噪音"是影响基于网页内容的Web应用系统工作质量的一个重要因素,快速准确地清除网页中的噪音内容是提高Web应用服务质量的关键技术之一.本文提出一种网页净化的方法及相应算法.该方法以一组启发式规则为基础,利... Web网页中的"噪音"是影响基于网页内容的Web应用系统工作质量的一个重要因素,快速准确地清除网页中的噪音内容是提高Web应用服务质量的关键技术之一.本文提出一种网页净化的方法及相应算法.该方法以一组启发式规则为基础,利用信息检索的技术以及Web网页的特征,提取网页的主题以及和主题相关的内容,从而达到网页净化的目的.该方法已经应用于搜索引擎系统(天网)的网页消重过程以及一个网页自动分类系统.通过网页净化对原有系统质量的改进验证了本文提出方法的正确性和有效性. 展开更多
关键词 网页净化 信息检索 搜索引擎 HTML 算法
下载PDF
因特网用户信息检索与浏览行为研究 被引量:91
16
作者 邓小昭 《情报学报》 CSSCI 北大核心 2003年第6期653-658,共6页
分别揭示了因特网用户信息检索、信息浏览行为的特点,比较了网上信息浏览与检索行为中的用户信息需求认知建构过程,并在此基础上提出了浏览/检索整合式的网上信息查寻模式.
关键词 因特网 信息用户 信息行为 信息检索 信息浏览 信息需求
下载PDF
搜索引擎技术研究与发展 被引量:53
17
作者 印鉴 陈忆群 张钢 《计算机工程》 EI CAS CSCD 北大核心 2005年第14期54-56,104,共4页
介绍搜索引擎技术。首先以工作方式作分类介绍,接着介绍各部分工作原理和技术研究,包括如搜索器策略、检索策略、搜索结果处理、信息检索Agent、多媒体搜索引擎等关键技术。最后展望搜索引擎发展重要方向。
关键词 搜索引擎 多媒体搜索引擎 信息检索
下载PDF
命名实体识别研究进展综述 被引量:98
18
作者 孙镇 王惠临 《现代图书情报技术》 CSSCI 北大核心 2010年第6期42-47,共6页
介绍命名实体识别的研究背景和意义,总结国内外命名实体识别研究历史,详细介绍目前主流的技术方法和评估方法,讨论命名实体识别技术的发展趋势。
关键词 命名实体识别 信息抽取 信息检索 机器翻译 评估方法
原文传递
基于区分类别能力的高性能特征选择方法 被引量:83
19
作者 徐燕 李锦涛 +1 位作者 王斌 孙春明 《软件学报》 EI CSCD 北大核心 2008年第1期82-89,共8页
特征选择在文本分类中起着重要作用.文档频率(document frequency,简称DF)、信息增益(informationgain,简称IG)和互信息(mutualin formation,简称MI)等特征选择方法在文本分类中广泛应用.已有的实验结果表明,IG是最有效的特征选择算法之... 特征选择在文本分类中起着重要作用.文档频率(document frequency,简称DF)、信息增益(informationgain,简称IG)和互信息(mutualin formation,简称MI)等特征选择方法在文本分类中广泛应用.已有的实验结果表明,IG是最有效的特征选择算法之一,DF稍差,而MI效果相对较差.在文本分类中,现有的特征选择函数性能的评估均是通过实验验证的方法,即完全是基于经验的方法.特征选择是选择部分最有区分类别能力的特征,为此,给出了两个特征选择函数需满足的基本约束条件,并提出了一种构造高性能特征选择的通用方法.依此方法构造了一个新的特征选择函数KG(knowledge gain).分析发现,IG和KG完全满足该构造方法,在Reuters-21578,OHSUMED和News Group这3个语料集上的实验表明,IG和KG性能最好,在两个语料集上,KG甚至超过了IG.验证了提出的构造高性能特征选择函数方法的有效性,同时也在理论上给出了一个评价高性能特征选择算法的标准. 展开更多
关键词 特征选择 文本分类 信息检索
下载PDF
基于开放网络知识的信息检索与数据挖掘 被引量:95
20
作者 王元卓 贾岩涛 +2 位作者 刘大伟 靳小龙 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期456-474,共19页
网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.... 网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望. 展开更多
关键词 网络大数据 开放网络知识 本体 信息检索 数据挖掘
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部