期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
文本挖掘技术综述 被引量:29
1
作者 梅馨 邢桂芬 《江苏大学学报(自然科学版)》 EI CAS 2003年第5期72-76,共5页
文本挖掘,是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程 对其进行深入的研究势必将极大地提高人们从海量的文本数据中提取信息的能力,具有很高的商业价值 首先介绍了文本数据挖掘的研究情况,然后给出了文本... 文本挖掘,是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程 对其进行深入的研究势必将极大地提高人们从海量的文本数据中提取信息的能力,具有很高的商业价值 首先介绍了文本数据挖掘的研究情况,然后给出了文本挖掘的框架,对文本挖掘中信息的抽取技术以及文本挖掘中使用的相关技术、评估方法等都作了详细的介绍,最后指出了文本挖掘在知识发现中的重要意义。 展开更多
关键词 文本挖掘 信息提取 信息检索 数据挖掘 知识发现
下载PDF
一个面向Internet的个性化信息检索系统模型 被引量:24
2
作者 韩立新 陈贵海 谢立 《电子学报》 EI CAS CSCD 北大核心 2002年第2期240-244,共5页
随着Internet上的信息量急剧增加 ,如何使用户获得有用的信息已成为信息检索系统急需解决的问题 .文中提出了一个个性化信息检索系统模型 (Parch) .该模型结合用户访问模式和类层次结构来检索用户需要的信息 .文中还提出了多个算法 ,这... 随着Internet上的信息量急剧增加 ,如何使用户获得有用的信息已成为信息检索系统急需解决的问题 .文中提出了一个个性化信息检索系统模型 (Parch) .该模型结合用户访问模式和类层次结构来检索用户需要的信息 .文中还提出了多个算法 ,这些算法综合运用数据挖掘、情报检索和机器学习等技术 ,较好地解决了在生成用户访问模式时人工干预较多、自适应性较差。 展开更多
关键词 个性化信息检索 系统模型 用户访问模式 因特网 计算机网络
下载PDF
WEB信息检索与WEB数据挖掘 被引量:13
3
作者 刘振岩 王万森 陈立平 《微机发展》 2003年第7期66-68,100,共4页
首先分析了WEB信息检索的现状,主要针对WEB信息检索的局限性,引出WEB数据挖掘,并对WEB数据挖掘技术作了概要的介绍。然后,讨论了WEB数据挖掘与WEB信息检索之间的关系,最后阐述了如何将WEB数据挖掘的研究成果应用到WEB信息检索领域中,从... 首先分析了WEB信息检索的现状,主要针对WEB信息检索的局限性,引出WEB数据挖掘,并对WEB数据挖掘技术作了概要的介绍。然后,讨论了WEB数据挖掘与WEB信息检索之间的关系,最后阐述了如何将WEB数据挖掘的研究成果应用到WEB信息检索领域中,从而提高WEB信息检索的效率和质量。 展开更多
关键词 Web 信息检索 数据挖掘 网站 INTERNET 搜索引擎 智能搜索
下载PDF
人工智能与法律结合的现状及发展趋势 被引量:21
4
作者 黄俏娟 罗旭东 《计算机科学》 CSCD 北大核心 2018年第12期1-11,共11页
人工智能并没有一个统一的定义,但若一个计算机系统能做人需要智能才能做的事,一般便认为这样的计算机系统具有人工智能。因此,人工智能被广泛应用于许多需要人类智能的领域,如法律、医疗、金融、电子商务等,其中法律是当前的一个重要... 人工智能并没有一个统一的定义,但若一个计算机系统能做人需要智能才能做的事,一般便认为这样的计算机系统具有人工智能。因此,人工智能被广泛应用于许多需要人类智能的领域,如法律、医疗、金融、电子商务等,其中法律是当前的一个重要应用领域。因此,文中主要从立法(人工智能系统辅助立法以及立法监管人工智能系统,特别是自主驾驶汽车)、知法守法(法律信息的检索、法律文书的生成和审核)、司法(证据收集、法律推理以及在线纠纷解决)等方面综述了人工智能和法律结合的研究现状以及发展趋势,希望能引导更多人投入这个研究领域。 展开更多
关键词 人工智能 法律 信息的检索 推理 自主驾驶汽车 自然语言处理 数据挖掘
下载PDF
一种基于PageRank的页面排序改进算法 被引量:18
5
作者 王冬 雷景生 《微电子学与计算机》 CSCD 北大核心 2009年第4期210-213,共4页
首先对PageRank算法进行了分析,探讨了国外现有的基于链接结构的改进算法.在此基础上,指出PageRank算法平均分配PageRank值影响了网页的排序质量,提出了一种不平均分配PageRank值的改进算法NPR,并对改进算法进行测试及分析.实验证明,NP... 首先对PageRank算法进行了分析,探讨了国外现有的基于链接结构的改进算法.在此基础上,指出PageRank算法平均分配PageRank值影响了网页的排序质量,提出了一种不平均分配PageRank值的改进算法NPR,并对改进算法进行测试及分析.实验证明,NPR的排序结果比PageRank提高了约11.2%的相关度. 展开更多
关键词 搜索引擎 信息检索 排序算法 数据挖掘 PAGERANK
下载PDF
Web数据挖掘技术研究 被引量:13
6
作者 薛鸿民 《现代电子技术》 2006年第15期99-101,共3页
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等... Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。 展开更多
关键词 信息检索 数据挖掘 WEB内容挖掘 WEB结构挖掘 WEB访问信息挖掘
下载PDF
网络环境下的信息检索技术 被引量:15
7
作者 柳群英 《现代情报》 2003年第9期76-78,共3页
讨论了网络环境下数字图书馆信息检索中基于内容的文本、图形图像、音频、视频检索技术 ,介绍了信息检索的研究方向 -智能检索和数据挖掘技术。
关键词 网络环境 信息检索 检索技术 信息组织 数字图书馆 智能检索 数据挖掘 多媒体信息 视频信息 文本信息 图像信息
下载PDF
基于Internet的个性化信息检索技术的研究 被引量:12
8
作者 刘艳青 田萱 苏桂莲 《计算机工程与设计》 CSCD 2004年第5期772-775,共4页
对搜索引擎个性化模式的提取方式进行了分类探讨,对当今流行的个性化检索技术进行了分类比较,指出了它们的特点差别;最后在此基础上讨论搜索引擎个性化技术所面临的问题以及其发展趋势。
关键词 INTERNET 个性化模式 信息检索技术 数据挖掘 本体论 AGENT
下载PDF
基于爬虫技术的关键词关联推荐算法优化与实现 被引量:16
9
作者 刘爱琴 王友林 尚珊 《情报理论与实践》 CSSCI 北大核心 2018年第4期134-138,共5页
随着信息化技术的不断提高,知识性数据库不断向集成化、智能化的方向发展,信息检索功能不断发展和完善,在满足用户信息需求的便捷性方面有很大的提升。信息资源的极大丰富,使得信息查全率得到很大提高,但随之带来用户检索、筛选时间的增... 随着信息化技术的不断提高,知识性数据库不断向集成化、智能化的方向发展,信息检索功能不断发展和完善,在满足用户信息需求的便捷性方面有很大的提升。信息资源的极大丰富,使得信息查全率得到很大提高,但随之带来用户检索、筛选时间的增加,以及查准率的降低。为了解决这一矛盾,本研究融合网络爬虫技术和学术资源网站结构化数据的特征,将网站网页数据进行爬取、加工、整合,用结构化、可视化的图像数据辅助检索,实现了在缩小用户的筛查范围,提升用户检索的准确度的同时,以关联推荐方式提升用户在学术资源网站中信息检索的效率。 展开更多
关键词 信息检索 数据挖掘 网络爬虫 信息推荐 算法
原文传递
基于PageRank的页面排序改进算法 被引量:11
10
作者 王冬 雷景生 李壮 《计算机工程与设计》 CSCD 北大核心 2008年第22期5921-5923,F0003,共4页
首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法。在此基础上,指出PageRank算法给不同网页分配相同的PageRank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行... 首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法。在此基础上,指出PageRank算法给不同网页分配相同的PageRank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行了相应测试和比较。实验结果表明,HCPR的排序结果比PageRank提高了约15.3%的相关度。 展开更多
关键词 搜索引擎 信息检索 排序算法 数据挖掘 页面等级
下载PDF
免疫阴性选择分类器在信息恢复中的应用 被引量:7
11
作者 莫宏伟 唐娜 +3 位作者 金鸿章 徐立芳 吕淑萍 管凤旭 《计算机学报》 EI CSCD 北大核心 2005年第8期1314-1319,共6页
文中的信息恢复系统是基于网络获取文本信息的系统,利用基于熵的信息抽取技术将获得的网络文本转换成特征向量文件.免疫阴性选择分类器是基于免疫系统T细胞选择原理设计检测器,利用协同进化算法进化检测器,进化得到的检测器对信息恢复... 文中的信息恢复系统是基于网络获取文本信息的系统,利用基于熵的信息抽取技术将获得的网络文本转换成特征向量文件.免疫阴性选择分类器是基于免疫系统T细胞选择原理设计检测器,利用协同进化算法进化检测器,进化得到的检测器对信息恢复系统中的文本特征向量进行分类.分类后得到的有用文件用于系统中的信息恢复.实验结果表明,与传统的朴素贝叶斯分类器比较,该方法具有更高的分类准确性,不仅验证了免疫阴性选择分类器的良好性能,同时也提高了信息恢复准确性. 展开更多
关键词 自然免疫系统 人工免疫系统 阴性选择分类器 信息恢复 数据挖掘
下载PDF
从信息检索到搜索引擎 被引量:8
12
作者 王斌 《术语标准化与信息技术》 2009年第4期38-43,共6页
信息检索是研究对大规模信息进行快速准确全面的获取、组织、挖掘和提供访问的一门学科,它的目标是从大规模文档集合中返回满足用户需求的文档子集。信息检索涉及自然语言处理、机器学习、数据挖掘、并行分布式处理等多个领域的相关技... 信息检索是研究对大规模信息进行快速准确全面的获取、组织、挖掘和提供访问的一门学科,它的目标是从大规模文档集合中返回满足用户需求的文档子集。信息检索涉及自然语言处理、机器学习、数据挖掘、并行分布式处理等多个领域的相关技术。搜索引擎是信息检索的一个具有代表性的应用,也是目前互联网中最重要的应用之一。搜索引擎特别是Web搜索引擎在与一般信息检索系统拥有诸多共性的同时,也具有自己的特点。本文主要介绍信息检索这门学科的一般知识,然后以搜索引擎为例介绍信息检索技术的应用。 展开更多
关键词 信息检索 搜索引擎 自然语言处理 机器学习 数据挖掘
下载PDF
基于数据挖掘技术的检索可视化系统的研究 被引量:8
13
作者 孙洁丽 朱智清 《现代情报》 北大核心 2008年第3期106-109,共4页
本文给出了检索可视化系统的需求和系统设计,并分析了检索可视化系统的关键技术。检索可视化系统采用数据挖掘技术,可以对检索结果进行聚类分析,用多种可视化技术显示检索结果。
关键词 可视化 信息检索 数据挖掘 聚类
下载PDF
基于决策树方法的特定主题Web搜索策略 被引量:3
14
作者 李新安 石冰 《计算机应用》 CSCD 北大核心 2006年第1期223-226,共4页
基于数据挖掘中决策树方法提出了一种新的W eb搜索策略。在该策略中,通过对预先采集的W eb页面进行学习得到一棵决策树,然后对其进行剪枝,得到简化布尔表达式形式的主题内在规律性信息,在其基础上进行查询修改,把修改后的查询转发到通... 基于数据挖掘中决策树方法提出了一种新的W eb搜索策略。在该策略中,通过对预先采集的W eb页面进行学习得到一棵决策树,然后对其进行剪枝,得到简化布尔表达式形式的主题内在规律性信息,在其基础上进行查询修改,把修改后的查询转发到通用搜索引擎上,最终得到查询结果。实验结果表明,提出的查询策略对于特定主题的W eb搜索,查询结果的质量有明显的改善和提升。 展开更多
关键词 查询修改 决策树 信息检索 数据挖掘 机器学习
下载PDF
网络环境下的信息检索与数据挖掘技术 被引量:7
15
作者 陈维 阮海红 《现代情报》 2009年第5期144-146,151,共4页
首先对网络环境下信息检索的现状进行分析,主要介绍网络信息检索的代表工具—搜索引擎的工作原理、缺陷及发展方向,引出数据挖掘技术,并进一步对WEB数据挖掘技术作了概要的介绍,阐明WEB数据挖掘技术是网络信息检索智能化的重要发展方向... 首先对网络环境下信息检索的现状进行分析,主要介绍网络信息检索的代表工具—搜索引擎的工作原理、缺陷及发展方向,引出数据挖掘技术,并进一步对WEB数据挖掘技术作了概要的介绍,阐明WEB数据挖掘技术是网络信息检索智能化的重要发展方向之一。最后,提出一个结合数据挖掘技术的新的搜索引擎结构模型。 展开更多
关键词 信息检索 搜索引擎 WEB数据挖掘
下载PDF
一种基于暗网的威胁情报主动获取框架 被引量:7
16
作者 黄莉峥 刘嘉勇 +1 位作者 郑荣锋 李孟铭 《信息安全研究》 2020年第2期131-138,共8页
暗网信息相比于表网往往具有更强时新性,可用于威胁情报获取和研究.针对安全研究人员难以从海量暗网数据中迅速获取强时新性威胁情报的问题,提出一种基于暗网的威胁情报主动获取框架.框架包括暗网数据获取、数据筛选和威胁情报获取3个模... 暗网信息相比于表网往往具有更强时新性,可用于威胁情报获取和研究.针对安全研究人员难以从海量暗网数据中迅速获取强时新性威胁情报的问题,提出一种基于暗网的威胁情报主动获取框架.框架包括暗网数据获取、数据筛选和威胁情报获取3个模块,针对暗网中的“恶意软件”、“黑客工具”和“数据泄露”3类信息,提出并使用信息量计算方法I@n(information at n),利用暗网和表网信息出现的时间差,计算暗网信息在表网中的信息量.通过表网中的信息量与信息的时新性之间的规律,主动获取暗网中的强时新性威胁情报.实验表明,通过该框架可以从暗网中获取威胁情报,帮助安全分析人员及时应对未知网络威胁. 展开更多
关键词 暗网 威胁情报 机器学习 多分类 信息检索 数据挖掘
下载PDF
基于数据挖掘的主题种子站点提取器的研究 被引量:6
17
作者 胡晟 季志远 程晓荣 《软件》 2013年第2期56-57,64,共3页
近年来,主题搜索引擎由于其在主题上的高相关性,使搜索结果的查准率得到了极大的提高,然而由于受到主题爬虫的限制,可选的种子站点的有效数量较少,使得搜索反馈的结果的数量不够多,直接影响到了搜索引擎的查全率。本文为解决这个问题,... 近年来,主题搜索引擎由于其在主题上的高相关性,使搜索结果的查准率得到了极大的提高,然而由于受到主题爬虫的限制,可选的种子站点的有效数量较少,使得搜索反馈的结果的数量不够多,直接影响到了搜索引擎的查全率。本文为解决这个问题,结合元搜索引擎的优势,提出一种通过多搜索引擎来为主题爬虫提供种子站点的方法,并通过计算相关度,更有效地去除噪音链接,使得种子站点的相关性得到保障,最后通过Nutch1.2的主题爬虫功能,验证了本种子站点提取器能够高效地获得大量相关度较高的种子站点。 展开更多
关键词 WEB信息检索 数据挖掘 主题搜索
下载PDF
数据挖掘技术在互联网信息检索中的应用研究 被引量:6
18
作者 单冬红 史玉珍 《科技通报》 北大核心 2014年第3期161-164,共4页
互联网信息检索能否快速而又高效依赖于检索技术的智能化程度,而利用数据挖掘技术能够大大提高互联网信息的检索功能。本文主要讲述数据挖掘技术在互联网信息检索中的应用,并采用叶斯网络算法进行相关数据的关联。在进行应用之前,需要... 互联网信息检索能否快速而又高效依赖于检索技术的智能化程度,而利用数据挖掘技术能够大大提高互联网信息的检索功能。本文主要讲述数据挖掘技术在互联网信息检索中的应用,并采用叶斯网络算法进行相关数据的关联。在进行应用之前,需要对检索平台进行简单的阐述,之后对数据挖掘的关联规则进行阐述分析,最后在贝叶斯算法的基础上进行实例的仿真分析。最终得到的实验结果是:结合使用贝叶斯网络算法的数据挖掘技术能够在互联网信息检索中起到智能以及个性化的作用,因此具有很大的研究价值。 展开更多
关键词 互联网信息检索 数据挖掘 贝叶斯网络 关联规则
下载PDF
面向创新的科技情报智能化服务系统构建——以陕西省科技情报一体化服务平台为例 被引量:5
19
作者 辛一 李鹏 +2 位作者 杨阳 殷春连 矫锐 《计算机技术与发展》 2022年第9期180-187,共8页
创新驱动战略的实施以及网络信息技术的迭代演化催生科技情报工作持续向数据化、流程化、系统化、智能化方向发展,构建以大数据、云计算以及移动互联网等信息技术为支撑的科技情报服务系统成为创新科技情报服务模式、提升科技情报服务... 创新驱动战略的实施以及网络信息技术的迭代演化催生科技情报工作持续向数据化、流程化、系统化、智能化方向发展,构建以大数据、云计算以及移动互联网等信息技术为支撑的科技情报服务系统成为创新科技情报服务模式、提升科技情报服务效能的重要方式。该文以陕西省科技情报一体化平台为例,从框架设计整合、业务流程再造、系统功能优化以及关键技术支撑四个维度出发,构建了一个以专业数据资源为基础,以数据检索分析挖掘技术为手段,以业务流程为依托,以面向创新的科技情报产品为输出的智能化平台。着重叙述了基于互联网的服务流程设计、异构数据的统一表示、海量数据检索技术、新一代情报分发技术以及情报挖掘技术在平台的应用。提出科技情报服务未来将不断地向着规范化、网络化、智能化的发展,从海量数据中更为全面、精准、快速的聚合资源,对数据进行高效、精准、深入的分析解读仍是科技情报服务系统优化改进的方向。建议平台在特色数据资源的集成、对不同情报分析工具的集成和综合运用、不同层次科技情报服务产品开发、移动端优化等方面继续提升改造,以期为其他科技情报智能化系统的研发应用提供借鉴。 展开更多
关键词 科技情报 智能化 一体化 服务平台 服务系统 大数据 数据检索 数据挖掘
下载PDF
Web数据挖掘系统的设计及关键技术研究 被引量:4
20
作者 刘敏钰 薛鸿民 《航空计算技术》 2005年第1期59-62,共4页
Web数据挖掘是一种新兴的边缘科学技术,它涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。本文在对Web数据挖掘技术详细研究的基础上,提出了一个Web数据挖... Web数据挖掘是一种新兴的边缘科学技术,它涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。本文在对Web数据挖掘技术详细研究的基础上,提出了一个Web数据挖掘的通用系统框架,并对信息收集、信息选择和预处理、模式的提取和用户接口等各个组成部分所使用的技术和存在的问题及解决的方法进行了讨论。本文结合Web自身的特点,提出了一个智能网页收集器WebCrawler,它除具有一般WebRobot的基本功能外,还采用了一种既考虑文本重要性又考虑链接结构的URL排序方法,从而确保收集的Web页面是Web比较优秀的部分。 展开更多
关键词 信息检索 数据挖掘 WEB
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部