期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5,598
篇文章
<
1
2
…
250
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
知识图谱构建技术综述
被引量:
928
1
作者
刘峤
李杨
+2 位作者
段宏
刘瑶
秦志光
《计算机研究与发展》
EI
CSCD
北大核心
2016年第3期582-600,共19页
谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明...
谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明,并给出了构建知识图谱的技术框架,按照输入的知识素材的抽象程度将其划分为3个层次:信息抽取层、知识融合层和知识加工层;2)分别对每个层次涉及的关键技术的研究现状进行分类说明,逐步揭示知识图谱技术的奥秘,及其与相关学科领域的关系;3)对知识图谱构建技术当前面临的重大挑战和关键问题进行了总结.
展开更多
关键词
知识图谱
语义网
信息检索
语义搜索引擎
自然语言处理
下载PDF
职称材料
信息抽取研究综述
被引量:
178
2
作者
李保利
陈玉忠
俞士汶
《计算机工程与应用》
CSCD
北大核心
2003年第10期1-5,66,共6页
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹—...
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
展开更多
关键词
自然语言处理
信息抽取
信息检索
命名实体识别
计算机
信息处理
下载PDF
职称材料
Web信息检索研究进展
被引量:
118
3
作者
王继成
萧嵘
+1 位作者
孙正兴
张福炎
《计算机研究与发展》
EI
CSCD
北大核心
2001年第2期187-193,共7页
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,...
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。
展开更多
关键词
WEB
信息检索
搜索引擎
元搜索引擎
INTERNET
目
下载PDF
职称材料
自动问答综述
被引量:
165
4
作者
郑实福
刘挺
+1 位作者
秦兵
李生
《中文信息学报》
CSCD
北大核心
2002年第6期46-52,共7页
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取...
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。
展开更多
关键词
自动问答
问题分类
信息检索
答案抽取
自然语言处理
问题分析
下载PDF
职称材料
聚焦爬虫技术研究综述
被引量:
153
5
作者
周立柱
林玲
《计算机应用》
CSCD
北大核心
2005年第9期1965-1969,共5页
因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。...
因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。至今,聚焦爬虫已成为有关万维网的研究热点之一。文中对这一热点研究进行综述,给出聚焦爬虫(Focused Crawler)的基本概念,概述其工作原理;并根据研究的发展现状,对聚焦爬虫的关键技术(抓取目标描述,网页分析算法和网页搜索策略等)作系统介绍和深入分析。在此基础上,提出聚焦爬虫今后的一些研究方向,包括面向数据分析和挖掘的爬虫技术研究,主题的描述与定义,相关资源的发现,W eb数据清洗,以及搜索空间的扩展等。
展开更多
关键词
聚焦爬虫
信息检索
链接分析
文本检索
数据抽取
协作抓取
本体描述
元搜索
下载PDF
职称材料
认识信息素养
被引量:
165
6
作者
孙平
曾晓牧
《大学图书馆学报》
CSSCI
北大核心
2004年第4期34-37,共4页
文章分析了信息素养的实质,及其内容、发展和走向,探讨了我国开展信息素养教育和研究的基础和目标,提出了基于文献检索课在高校推进信息素养教育的现实性和必要性,并讨论了信息素养对我们实施信息教育的指导意义。
关键词
高校
信息素养教育
文献检索课
图书馆
下载PDF
职称材料
快速开采最大频繁项目集
被引量:
113
7
作者
路松峰
卢正鼎
《软件学报》
EI
CSCD
北大核心
2001年第2期293-297,共5页
发现最大频繁项目集是多种数据开采应用中的关键问题 .提出一种快速开采最大频繁项目集的算法 DM-FI( discovery maximum frequent itemsets) .该算法把自底向上和自顶向下的搜索策略进行了合并 .通过其独特的排序方法和有效的剪枝策略 ...
发现最大频繁项目集是多种数据开采应用中的关键问题 .提出一种快速开采最大频繁项目集的算法 DM-FI( discovery maximum frequent itemsets) .该算法把自底向上和自顶向下的搜索策略进行了合并 .通过其独特的排序方法和有效的剪枝策略 ,大大减少了候选项目集的生成 ,从而显著地降低了 CPU时间 .
展开更多
关键词
数据开采
知识发现
关联规则
最大频繁项目集
数据库
下载PDF
职称材料
主题网络爬虫研究综述
被引量:
131
8
作者
刘金红
陆余良
《计算机应用研究》
CSCD
北大核心
2007年第10期26-29,47,共5页
首先给出了主题网络爬虫的定义和研究目标;然后系统分析了近年来国内外主题爬虫的研究方法和技术,包括基于文字内容的方法、基于超链分析的方法、基于分类器预测的方法以及其他主题爬行方法,并比较了各种方法优缺点;最后对未来的研究方...
首先给出了主题网络爬虫的定义和研究目标;然后系统分析了近年来国内外主题爬虫的研究方法和技术,包括基于文字内容的方法、基于超链分析的方法、基于分类器预测的方法以及其他主题爬行方法,并比较了各种方法优缺点;最后对未来的研究方向进行了展望。
展开更多
关键词
主题网络爬虫
信息检索
WEB挖掘
下载PDF
职称材料
基于本体论和多主体的信息检索服务器
被引量:
72
9
作者
武成岗
焦文品
+1 位作者
田启家
史忠植
《计算机研究与发展》
EI
CSCD
北大核心
2001年第6期641-647,共7页
Internet技术的发展为人们提供了方便快捷的信息获取手段 ,然而要从如此庞大且瞬息万变的 Internet上检索信息 ,需要快速准确的信息检索工具的协助 .提出了一种利用多智能主体和本体论 (ontology)理论设计的信息检索服务器 .它集成了界...
Internet技术的发展为人们提供了方便快捷的信息获取手段 ,然而要从如此庞大且瞬息万变的 Internet上检索信息 ,需要快速准确的信息检索工具的协助 .提出了一种利用多智能主体和本体论 (ontology)理论设计的信息检索服务器 .它集成了界面主体、预处理主体、管理主体、信息处理主体和具有移动性的信息搜集主体 ,并利用ontology对文档进行领域分类 ,同时对用户的查询信息进行规范 .该系统能够比较及时地反映网络中信息的动态变化 。
展开更多
关键词
本体论
信息检索服务器
主体
INTENET
信息数据库
下载PDF
职称材料
地表不透水面信息遥感的主要方法分析
被引量:
121
10
作者
徐涵秋
王美雅
《遥感学报》
EI
CSCD
北大核心
2016年第5期1270-1289,共20页
全球范围内的城市扩张已使得大量的不透水面取代了以植被为主的地表自然景观,并给生态环境带来了明显的负面影响。不透水面作为一个影响生态环境的关键因子已引起了全社会的广泛关注。如何及时快速地掌握不透水面的空间分布信息,准确无...
全球范围内的城市扩张已使得大量的不透水面取代了以植被为主的地表自然景观,并给生态环境带来了明显的负面影响。不透水面作为一个影响生态环境的关键因子已引起了全社会的广泛关注。如何及时快速地掌握不透水面的空间分布信息,准确无误地量化不透水面的动态变化信息,是城市规划、环境保护亟待解决的现实问题。而遥感以其快速、大范围、多尺度、可重复的对地观测优势为解决这一问题提供了很好的解决方案。不透水面遥感研究经过近十几年的发展已有了长足的进步,多种针对不透水面信息反演的遥感创新技术与方法被相继提出。本文重点分析了这些针对遥感不透水面提出的创新技术,详细地指出了它们的优势和不足,并在此基础上总结了中国遥感工作者在不透水面遥感方面的研究工作。当前许多不透水面信息的反演精度都可以达到85%以上,但是不透水面与裸土和阴影信息的混淆仍是困扰不透水面信息精准反演的主要问题。由于大部分不透水面材料具有和砂土石同源的特点,因此在现有影像光谱分辨率不足的情况下,单靠光谱是很难进一步提高不透水面信息的反演精度,而借助LiDAR等其他辅助数据,将有望帮助解决这一瓶颈问题。
展开更多
关键词
不透水面
遥感
信息反演
影像处理
生态环境
原文传递
基于语义理解的文本相似度算法
被引量:
79
11
作者
金博
史彦军
滕弘飞
《大连理工大学学报》
EI
CAS
CSCD
北大核心
2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包...
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.
展开更多
关键词
语义理解
相似度算法
相似度计算
计算方法
文本相似度
语义相似度
信息检索
实例验证
计算公式
准确性
文档
知网
下载PDF
职称材料
万维网的链接结构分析及其应用综述
被引量:
61
12
作者
王晓宇
周傲英
《软件学报》
EI
CSCD
北大核心
2003年第10期1768-1780,共13页
当今万维网的规模已经快速发展到包含大约80亿个网页和560亿个超链接.此外,对万维网的创建进行全局规划显然是不可能的.这些都对万维网的相关研究提出了挑战.另一方面,互联网环境下通过超链连接起来的网页,为人们的日常和商务用途提供...
当今万维网的规模已经快速发展到包含大约80亿个网页和560亿个超链接.此外,对万维网的创建进行全局规划显然是不可能的.这些都对万维网的相关研究提出了挑战.另一方面,互联网环境下通过超链连接起来的网页,为人们的日常和商务用途提供了非常丰富的信息资源,但前提是必须掌握有效的办法来理解万维网.链接结构分析在万维网的很多研究领域起着越来越重要的作用.全面介绍了万维网链接分析方面的最新研究进展和应用情况,对链接分析在Web信息搜索、万维网潜在社区发现及万维网建模等方面的研究进展和实际应用进行了综述.
展开更多
关键词
链接分析
互联网
WEB搜索
知识发现
下载PDF
职称材料
关键词自动标引的最大熵模型应用研究
被引量:
92
13
作者
李素建
王厚峰
+1 位作者
俞士汶
辛乘胜
《计算机学报》
EI
CSCD
北大核心
2004年第9期1192-1197,共6页
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现...
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现有资源的实际情况 ,作者首先建立了最大熵模型的特征集合 ,然后提出了三种试验方法 ,并给出了相应的试验结果 ,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨 .该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示 .
展开更多
关键词
关键词标引
关键词抽取
最大熵模型
信息抽取
下载PDF
职称材料
搜索引擎技术研究与发展
被引量:
53
14
作者
印鉴
陈忆群
张钢
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第14期54-56,104,共4页
介绍搜索引擎技术。首先以工作方式作分类介绍,接着介绍各部分工作原理和技术研究,包括如搜索器策略、检索策略、搜索结果处理、信息检索Agent、多媒体搜索引擎等关键技术。最后展望搜索引擎发展重要方向。
关键词
搜索引擎
多媒体搜索引擎
信息检索
下载PDF
职称材料
基于区分类别能力的高性能特征选择方法
被引量:
83
15
作者
徐燕
李锦涛
+1 位作者
王斌
孙春明
《软件学报》
EI
CSCD
北大核心
2008年第1期82-89,共8页
特征选择在文本分类中起着重要作用.文档频率(document frequency,简称DF)、信息增益(informationgain,简称IG)和互信息(mutualin formation,简称MI)等特征选择方法在文本分类中广泛应用.已有的实验结果表明,IG是最有效的特征选择算法之...
特征选择在文本分类中起着重要作用.文档频率(document frequency,简称DF)、信息增益(informationgain,简称IG)和互信息(mutualin formation,简称MI)等特征选择方法在文本分类中广泛应用.已有的实验结果表明,IG是最有效的特征选择算法之一,DF稍差,而MI效果相对较差.在文本分类中,现有的特征选择函数性能的评估均是通过实验验证的方法,即完全是基于经验的方法.特征选择是选择部分最有区分类别能力的特征,为此,给出了两个特征选择函数需满足的基本约束条件,并提出了一种构造高性能特征选择的通用方法.依此方法构造了一个新的特征选择函数KG(knowledge gain).分析发现,IG和KG完全满足该构造方法,在Reuters-21578,OHSUMED和News Group这3个语料集上的实验表明,IG和KG性能最好,在两个语料集上,KG甚至超过了IG.验证了提出的构造高性能特征选择函数方法的有效性,同时也在理论上给出了一个评价高性能特征选择算法的标准.
展开更多
关键词
特征选择
文本分类
信息检索
下载PDF
职称材料
改进的多模式匹配算法
被引量:
52
16
作者
王永成
沈州
许一震
《计算机研究与发展》
EI
CSCD
北大核心
2002年第1期55-60,共6页
在有限自动机的多模式匹配算法 (DFSA算法 )的基础上 ,结合 Quick Search算法的优点 ,提出了一个快速的多模式字符串匹配算法 .之后在算法中以连续跳跃的思想 ,给出了另一个更加有效的改进 .在一般情况下 ,这两个算法不需要匹配目标文...
在有限自动机的多模式匹配算法 (DFSA算法 )的基础上 ,结合 Quick Search算法的优点 ,提出了一个快速的多模式字符串匹配算法 .之后在算法中以连续跳跃的思想 ,给出了另一个更加有效的改进 .在一般情况下 ,这两个算法不需要匹配目标文本串中的每个字符 ,并充分利用了匹配过程中本次匹配不成功的信息 ,跳过尽可能多的字符 .在模式串较长和较短的情况下 ,算法都有很好的性能 .实验表明 ,在模式串较短时 ,所提出的算法需要的匹配时间仅为 DFSA算法的 1/2到 1/5 ,在模式串较长时 ,所需时间为 DFSA算法的 1/3至
展开更多
关键词
算法复杂度
多模式匹配算法
有限自动机
计算机
下载PDF
职称材料
本体论与信息检索
被引量:
47
17
作者
廖明宏
《计算机工程》
CAS
CSCD
北大核心
2000年第2期56-58,共3页
试图对本体论做形式化的描述,并在此基础上讨论本体论的一个应用:基于本体论的信息检索方法,它克服了目前基于关键词检索所造成的信息冗余和丢失的不足。其查询方法更符合人类的思维习惯,查询结果也更合理、可用。
关键词
本体论
信息检索
企业知识管理
下载PDF
职称材料
自然语言文档复制检测研究综述
被引量:
69
18
作者
鲍军鹏
沈钧毅
+1 位作者
刘晓东
宋擒豹
《软件学报》
EI
CSCD
北大核心
2003年第10期1753-1760,共8页
复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了...
复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了目前已知各种文本复制检测系统的检测方法和技术特点,并比较了各系统关键技术的异同,最后指出了文本复制检测技术的发展思路.
展开更多
关键词
复制检测
剽窃
知识产权保护
信息检索
下载PDF
职称材料
用Naive Bayes方法协调分类Web网页
被引量:
53
19
作者
范焱
郑诚
+2 位作者
王清毅
蔡庆生
刘洁
《软件学报》
EI
CSCD
北大核心
2001年第9期1386-1392,共7页
WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息...
WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法 .经实验验证 ,与只用单种方法对超文本进行分类的方法相比 ,综合分类法有效地提高了分类的正确率 .
展开更多
关键词
超文本
Web
机器学习
互联网
数据挖掘
信息检索
WWW
网页
NaiveBayes方法
下载PDF
职称材料
基于用户日志的查询扩展统计模型
被引量:
61
20
作者
崔航
文继荣
李敏强
《软件学报》
EI
CSCD
北大核心
2003年第9期1593-1599,共7页
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联...
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.
展开更多
关键词
信息检索
查询扩展
用户日志
日志挖掘
下载PDF
职称材料
题名
知识图谱构建技术综述
被引量:
928
1
作者
刘峤
李杨
段宏
刘瑶
秦志光
机构
电子科技大学信息与软件工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2016年第3期582-600,共19页
基金
国家"八六三"高技术研究发展计划基金项目(2011AA010706)
国家自然科学基金项目(61133016
+1 种基金
61272527)
教育部-中国移动科研基金项目(MCM20121041)~~
文摘
谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明,并给出了构建知识图谱的技术框架,按照输入的知识素材的抽象程度将其划分为3个层次:信息抽取层、知识融合层和知识加工层;2)分别对每个层次涉及的关键技术的研究现状进行分类说明,逐步揭示知识图谱技术的奥秘,及其与相关学科领域的关系;3)对知识图谱构建技术当前面临的重大挑战和关键问题进行了总结.
关键词
知识图谱
语义网
信息检索
语义搜索引擎
自然语言处理
Keywords
knowledge
graph
semantic
Web
information retrieval
semantic
search
engine
natural
language
processing
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
信息抽取研究综述
被引量:
178
2
作者
李保利
陈玉忠
俞士汶
机构
北京大学计算机科学与技术系计算语言学研究所
出处
《计算机工程与应用》
CSCD
北大核心
2003年第10期1-5,66,共6页
基金
国家自然科学基金项目(编号:69973005)
国家973重点基础研究发展规划项目(编号:G1998030507-4)
北大985项目支持
文摘
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
关键词
自然语言处理
信息抽取
信息检索
命名实体识别
计算机
信息处理
Keywords
Natural
Language
Processing,
information
Extraction,
information retrieval
,Named
Entity
Recognization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web信息检索研究进展
被引量:
118
3
作者
王继成
萧嵘
孙正兴
张福炎
机构
南京大学计算机科学与技术系
南京大学软件新技术国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2001年第2期187-193,共7页
基金
国家自然科学基金! (6 0 0 730 30
6 990 30 0 6 )
江苏省"九五"科技重点攻关项目基金 !(BE96 0 17)资助
文摘
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。
关键词
WEB
信息检索
搜索引擎
元搜索引擎
INTERNET
目
Keywords
Web,
information retrieval
,
search
engine,
meta
search
engine,
information
agent,
clustering,
concept
search,
relevance
feedback
分类号
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
自动问答综述
被引量:
165
4
作者
郑实福
刘挺
秦兵
李生
机构
哈尔滨工业大学信息检索实验室
出处
《中文信息学报》
CSCD
北大核心
2002年第6期46-52,共7页
基金
哈尔滨工业大学校自然科学基金项目 (HIT 2 0 0 0 5 0 )
文摘
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。
关键词
自动问答
问题分类
信息检索
答案抽取
自然语言处理
问题分析
Keywords
Question
Answering
question
classification
information retrieval
answer
extraction
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
聚焦爬虫技术研究综述
被引量:
153
5
作者
周立柱
林玲
机构
清华大学计算机科学与技术系
出处
《计算机应用》
CSCD
北大核心
2005年第9期1965-1969,共5页
基金
国家自然科学基金资助项目(60173008)
文摘
因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。至今,聚焦爬虫已成为有关万维网的研究热点之一。文中对这一热点研究进行综述,给出聚焦爬虫(Focused Crawler)的基本概念,概述其工作原理;并根据研究的发展现状,对聚焦爬虫的关键技术(抓取目标描述,网页分析算法和网页搜索策略等)作系统介绍和深入分析。在此基础上,提出聚焦爬虫今后的一些研究方向,包括面向数据分析和挖掘的爬虫技术研究,主题的描述与定义,相关资源的发现,W eb数据清洗,以及搜索空间的扩展等。
关键词
聚焦爬虫
信息检索
链接分析
文本检索
数据抽取
协作抓取
本体描述
元搜索
Keywords
focused
crawler
information retrieval
link
analysis
text
retrieval
data
extraction
collaborative
crawling
ontology
metaseareh
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
认识信息素养
被引量:
165
6
作者
孙平
曾晓牧
机构
清华大学图书馆
出处
《大学图书馆学报》
CSSCI
北大核心
2004年第4期34-37,共4页
文摘
文章分析了信息素养的实质,及其内容、发展和走向,探讨了我国开展信息素养教育和研究的基础和目标,提出了基于文献检索课在高校推进信息素养教育的现实性和必要性,并讨论了信息素养对我们实施信息教育的指导意义。
关键词
高校
信息素养教育
文献检索课
图书馆
Keywords
information
Literacy,
College
Library,
information
Instruction,
information retrieval
分类号
G252.7 [文化科学—图书馆学]
G642
下载PDF
职称材料
题名
快速开采最大频繁项目集
被引量:
113
7
作者
路松峰
卢正鼎
机构
华中理工大学计算机学院
出处
《软件学报》
EI
CSCD
北大核心
2001年第2期293-297,共5页
基金
国家"九五"国防预研基金&&
文摘
发现最大频繁项目集是多种数据开采应用中的关键问题 .提出一种快速开采最大频繁项目集的算法 DM-FI( discovery maximum frequent itemsets) .该算法把自底向上和自顶向下的搜索策略进行了合并 .通过其独特的排序方法和有效的剪枝策略 ,大大减少了候选项目集的生成 ,从而显著地降低了 CPU时间 .
关键词
数据开采
知识发现
关联规则
最大频繁项目集
数据库
Keywords
Algorithms
Associative
processing
information retrieval
Knowledge
acquisition
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
主题网络爬虫研究综述
被引量:
131
8
作者
刘金红
陆余良
机构
解放军电子工程学院网络系
出处
《计算机应用研究》
CSCD
北大核心
2007年第10期26-29,47,共5页
文摘
首先给出了主题网络爬虫的定义和研究目标;然后系统分析了近年来国内外主题爬虫的研究方法和技术,包括基于文字内容的方法、基于超链分析的方法、基于分类器预测的方法以及其他主题爬行方法,并比较了各种方法优缺点;最后对未来的研究方向进行了展望。
关键词
主题网络爬虫
信息检索
WEB挖掘
Keywords
topic-focused
crawler
information retrieval
Web
mining
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于本体论和多主体的信息检索服务器
被引量:
72
9
作者
武成岗
焦文品
田启家
史忠植
机构
中国科学院计算技术研究所智能信息处理开放研究实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2001年第6期641-647,共7页
基金
国家"八六三"高技术研究发展计划项目! (863 -3 0 6-ZT0 2 -0 1-3 )
国家自然科学基金重大项目! (69790 0 80 )
文摘
Internet技术的发展为人们提供了方便快捷的信息获取手段 ,然而要从如此庞大且瞬息万变的 Internet上检索信息 ,需要快速准确的信息检索工具的协助 .提出了一种利用多智能主体和本体论 (ontology)理论设计的信息检索服务器 .它集成了界面主体、预处理主体、管理主体、信息处理主体和具有移动性的信息搜集主体 ,并利用ontology对文档进行领域分类 ,同时对用户的查询信息进行规范 .该系统能够比较及时地反映网络中信息的动态变化 。
关键词
本体论
信息检索服务器
主体
INTENET
信息数据库
Keywords
ontology,
agent,
information retrieval
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.4 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
地表不透水面信息遥感的主要方法分析
被引量:
121
10
作者
徐涵秋
王美雅
机构
福州大学环境与资源学院
出处
《遥感学报》
EI
CSCD
北大核心
2016年第5期1270-1289,共20页
基金
国家自然科学基金(编号:41501469)
福建省教育厅重点项目(编号:JA13030)~~
文摘
全球范围内的城市扩张已使得大量的不透水面取代了以植被为主的地表自然景观,并给生态环境带来了明显的负面影响。不透水面作为一个影响生态环境的关键因子已引起了全社会的广泛关注。如何及时快速地掌握不透水面的空间分布信息,准确无误地量化不透水面的动态变化信息,是城市规划、环境保护亟待解决的现实问题。而遥感以其快速、大范围、多尺度、可重复的对地观测优势为解决这一问题提供了很好的解决方案。不透水面遥感研究经过近十几年的发展已有了长足的进步,多种针对不透水面信息反演的遥感创新技术与方法被相继提出。本文重点分析了这些针对遥感不透水面提出的创新技术,详细地指出了它们的优势和不足,并在此基础上总结了中国遥感工作者在不透水面遥感方面的研究工作。当前许多不透水面信息的反演精度都可以达到85%以上,但是不透水面与裸土和阴影信息的混淆仍是困扰不透水面信息精准反演的主要问题。由于大部分不透水面材料具有和砂土石同源的特点,因此在现有影像光谱分辨率不足的情况下,单靠光谱是很难进一步提高不透水面信息的反演精度,而借助LiDAR等其他辅助数据,将有望帮助解决这一瓶颈问题。
关键词
不透水面
遥感
信息反演
影像处理
生态环境
Keywords
impervious
surface,
remote
sensing,
information retrieval
,
image
processing,
ecological
environment
分类号
TP79 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
基于语义理解的文本相似度算法
被引量:
79
11
作者
金博
史彦军
滕弘飞
机构
大连理工大学机械工程学院
出处
《大连理工大学学报》
EI
CAS
CSCD
北大核心
2005年第2期291-297,共7页
基金
国家自然科学基金资助项目(60073036
50275019)派生研究.
文摘
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.
关键词
语义理解
相似度算法
相似度计算
计算方法
文本相似度
语义相似度
信息检索
实例验证
计算公式
准确性
文档
知网
Keywords
Algorithms
information retrieval
Knowledge
representation
Semantics
Statistical
methods
Text
processing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
C931 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
万维网的链接结构分析及其应用综述
被引量:
61
12
作者
王晓宇
周傲英
机构
复旦大学计算机科学与工程系
复旦大学智能信息处理开放实验室
出处
《软件学报》
EI
CSCD
北大核心
2003年第10期1768-1780,共13页
基金
国家自然科学基金
教育部跨世纪优秀人才培养计划
霍英东教育基金青年教师基金~~
文摘
当今万维网的规模已经快速发展到包含大约80亿个网页和560亿个超链接.此外,对万维网的创建进行全局规划显然是不可能的.这些都对万维网的相关研究提出了挑战.另一方面,互联网环境下通过超链连接起来的网页,为人们的日常和商务用途提供了非常丰富的信息资源,但前提是必须掌握有效的办法来理解万维网.链接结构分析在万维网的很多研究领域起着越来越重要的作用.全面介绍了万维网链接分析方面的最新研究进展和应用情况,对链接分析在Web信息搜索、万维网潜在社区发现及万维网建模等方面的研究进展和实际应用进行了综述.
关键词
链接分析
互联网
WEB搜索
知识发现
Keywords
information retrieval
Knowledge
based
systems
Online
searching
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
关键词自动标引的最大熵模型应用研究
被引量:
92
13
作者
李素建
王厚峰
俞士汶
辛乘胜
机构
北京大学计算语言学研究所
人民日报社新闻信息中心
出处
《计算机学报》
EI
CSCD
北大核心
2004年第9期1192-1197,共6页
基金
国家"八六三"高技术研究发展计划项目基金 (2 0 0 1AA1 1 4 2 1 0 0 5)
国家"九七三"重点基础研究发展规划项目基金 (G1 9980 30 50 4 0 1
G1 9980 30 50 7 4)资助
文摘
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现有资源的实际情况 ,作者首先建立了最大熵模型的特征集合 ,然后提出了三种试验方法 ,并给出了相应的试验结果 ,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨 .该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示 .
关键词
关键词标引
关键词抽取
最大熵模型
信息抽取
Keywords
Entropy
information retrieval
Mathematical
models
Natural
language
processing
systems
Probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
搜索引擎技术研究与发展
被引量:
53
14
作者
印鉴
陈忆群
张钢
机构
中山大学计算机科学系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第14期54-56,104,共4页
基金
国家自然科学基金资助项目(60205007)
广东省自然科学基金资助项目(001264
+1 种基金
031558)
广东省科技计划基金资助项目(2003C50118)
文摘
介绍搜索引擎技术。首先以工作方式作分类介绍,接着介绍各部分工作原理和技术研究,包括如搜索器策略、检索策略、搜索结果处理、信息检索Agent、多媒体搜索引擎等关键技术。最后展望搜索引擎发展重要方向。
关键词
搜索引擎
多媒体搜索引擎
信息检索
Keywords
Search
engine
Multimedia
search
engine
information retrieval
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于区分类别能力的高性能特征选择方法
被引量:
83
15
作者
徐燕
李锦涛
王斌
孙春明
机构
中国科学院计算技术研究所
出处
《软件学报》
EI
CSCD
北大核心
2008年第1期82-89,共8页
基金
Supported by the National Natural Science Foundation of China under Grant Nos.60473002, 60603094 (国家自然科学基金)
the Beijing Natural Science Foundation of China under Grant No.4051004 (北京市自然科学基金)
文摘
特征选择在文本分类中起着重要作用.文档频率(document frequency,简称DF)、信息增益(informationgain,简称IG)和互信息(mutualin formation,简称MI)等特征选择方法在文本分类中广泛应用.已有的实验结果表明,IG是最有效的特征选择算法之一,DF稍差,而MI效果相对较差.在文本分类中,现有的特征选择函数性能的评估均是通过实验验证的方法,即完全是基于经验的方法.特征选择是选择部分最有区分类别能力的特征,为此,给出了两个特征选择函数需满足的基本约束条件,并提出了一种构造高性能特征选择的通用方法.依此方法构造了一个新的特征选择函数KG(knowledge gain).分析发现,IG和KG完全满足该构造方法,在Reuters-21578,OHSUMED和News Group这3个语料集上的实验表明,IG和KG性能最好,在两个语料集上,KG甚至超过了IG.验证了提出的构造高性能特征选择函数方法的有效性,同时也在理论上给出了一个评价高性能特征选择算法的标准.
关键词
特征选择
文本分类
信息检索
Keywords
feature
selection
text
categorization
information retrieval
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
改进的多模式匹配算法
被引量:
52
16
作者
王永成
沈州
许一震
机构
上海交通大学计算机科学与工程系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第1期55-60,共6页
基金
国家"八六三"高技术研究发展计划基金资助 (863 -3 0 6-ZD0 3 -0 4-1)
文摘
在有限自动机的多模式匹配算法 (DFSA算法 )的基础上 ,结合 Quick Search算法的优点 ,提出了一个快速的多模式字符串匹配算法 .之后在算法中以连续跳跃的思想 ,给出了另一个更加有效的改进 .在一般情况下 ,这两个算法不需要匹配目标文本串中的每个字符 ,并充分利用了匹配过程中本次匹配不成功的信息 ,跳过尽可能多的字符 .在模式串较长和较短的情况下 ,算法都有很好的性能 .实验表明 ,在模式串较短时 ,所提出的算法需要的匹配时间仅为 DFSA算法的 1/2到 1/5 ,在模式串较长时 ,所需时间为 DFSA算法的 1/3至
关键词
算法复杂度
多模式匹配算法
有限自动机
计算机
Keywords
pattern
match,
string,
finite
state
automata,
multiple
pattern
match,
computational
complexity,
information retrieval
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
本体论与信息检索
被引量:
47
17
作者
廖明宏
机构
哈尔滨工业大学计算机科学与工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2000年第2期56-58,共3页
文摘
试图对本体论做形式化的描述,并在此基础上讨论本体论的一个应用:基于本体论的信息检索方法,它克服了目前基于关键词检索所造成的信息冗余和丢失的不足。其查询方法更符合人类的思维习惯,查询结果也更合理、可用。
关键词
本体论
信息检索
企业知识管理
Keywords
Ontology
information retrieval
Enterprise
knowledge
managemnt
分类号
B016 [哲学宗教—哲学理论]
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
自然语言文档复制检测研究综述
被引量:
69
18
作者
鲍军鹏
沈钧毅
刘晓东
宋擒豹
机构
西安交通大学计算机科学与技术系
出处
《软件学报》
EI
CSCD
北大核心
2003年第10期1753-1760,共8页
基金
国家自然科学基金
西安交通大学科学研究基金~~
文摘
复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了目前已知各种文本复制检测系统的检测方法和技术特点,并比较了各系统关键技术的异同,最后指出了文本复制检测技术的发展思路.
关键词
复制检测
剽窃
知识产权保护
信息检索
Keywords
copy
detection
plagiarism
intellectual
property
protection
information retrieval
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
用Naive Bayes方法协调分类Web网页
被引量:
53
19
作者
范焱
郑诚
王清毅
蔡庆生
刘洁
机构
中国科学技术大学计算机科学与技术系
出处
《软件学报》
EI
CSCD
北大核心
2001年第9期1386-1392,共7页
基金
国家自然科学基金资助项目 (6 96 75 0 16 )~~
文摘
WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法 .经实验验证 ,与只用单种方法对超文本进行分类的方法相比 ,综合分类法有效地提高了分类的正确率 .
关键词
超文本
Web
机器学习
互联网
数据挖掘
信息检索
WWW
网页
NaiveBayes方法
Keywords
Calculations
Classification
(of
information
)
Data
mining
Hypertext
systems
information retrieval
Internet
Learning
systems
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于用户日志的查询扩展统计模型
被引量:
61
20
作者
崔航
文继荣
李敏强
机构
天津大学系统工程研究所
微软亚洲研究院
出处
《软件学报》
EI
CSCD
北大核心
2003年第9期1593-1599,共7页
基金
国家自然科学基金~~
文摘
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.
关键词
信息检索
查询扩展
用户日志
日志挖掘
Keywords
information retrieval
query
expansion
user
log
log
mining
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
知识图谱构建技术综述
刘峤
李杨
段宏
刘瑶
秦志光
《计算机研究与发展》
EI
CSCD
北大核心
2016
928
下载PDF
职称材料
2
信息抽取研究综述
李保利
陈玉忠
俞士汶
《计算机工程与应用》
CSCD
北大核心
2003
178
下载PDF
职称材料
3
Web信息检索研究进展
王继成
萧嵘
孙正兴
张福炎
《计算机研究与发展》
EI
CSCD
北大核心
2001
118
下载PDF
职称材料
4
自动问答综述
郑实福
刘挺
秦兵
李生
《中文信息学报》
CSCD
北大核心
2002
165
下载PDF
职称材料
5
聚焦爬虫技术研究综述
周立柱
林玲
《计算机应用》
CSCD
北大核心
2005
153
下载PDF
职称材料
6
认识信息素养
孙平
曾晓牧
《大学图书馆学报》
CSSCI
北大核心
2004
165
下载PDF
职称材料
7
快速开采最大频繁项目集
路松峰
卢正鼎
《软件学报》
EI
CSCD
北大核心
2001
113
下载PDF
职称材料
8
主题网络爬虫研究综述
刘金红
陆余良
《计算机应用研究》
CSCD
北大核心
2007
131
下载PDF
职称材料
9
基于本体论和多主体的信息检索服务器
武成岗
焦文品
田启家
史忠植
《计算机研究与发展》
EI
CSCD
北大核心
2001
72
下载PDF
职称材料
10
地表不透水面信息遥感的主要方法分析
徐涵秋
王美雅
《遥感学报》
EI
CSCD
北大核心
2016
121
原文传递
11
基于语义理解的文本相似度算法
金博
史彦军
滕弘飞
《大连理工大学学报》
EI
CAS
CSCD
北大核心
2005
79
下载PDF
职称材料
12
万维网的链接结构分析及其应用综述
王晓宇
周傲英
《软件学报》
EI
CSCD
北大核心
2003
61
下载PDF
职称材料
13
关键词自动标引的最大熵模型应用研究
李素建
王厚峰
俞士汶
辛乘胜
《计算机学报》
EI
CSCD
北大核心
2004
92
下载PDF
职称材料
14
搜索引擎技术研究与发展
印鉴
陈忆群
张钢
《计算机工程》
EI
CAS
CSCD
北大核心
2005
53
下载PDF
职称材料
15
基于区分类别能力的高性能特征选择方法
徐燕
李锦涛
王斌
孙春明
《软件学报》
EI
CSCD
北大核心
2008
83
下载PDF
职称材料
16
改进的多模式匹配算法
王永成
沈州
许一震
《计算机研究与发展》
EI
CSCD
北大核心
2002
52
下载PDF
职称材料
17
本体论与信息检索
廖明宏
《计算机工程》
CAS
CSCD
北大核心
2000
47
下载PDF
职称材料
18
自然语言文档复制检测研究综述
鲍军鹏
沈钧毅
刘晓东
宋擒豹
《软件学报》
EI
CSCD
北大核心
2003
69
下载PDF
职称材料
19
用Naive Bayes方法协调分类Web网页
范焱
郑诚
王清毅
蔡庆生
刘洁
《软件学报》
EI
CSCD
北大核心
2001
53
下载PDF
职称材料
20
基于用户日志的查询扩展统计模型
崔航
文继荣
李敏强
《软件学报》
EI
CSCD
北大核心
2003
61
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
250
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部