期刊文献+
共找到348篇文章
< 1 2 18 >
每页显示 20 50 100
一个复杂度为max(O(|C||U|),O(|C^2|U/C|))的快速属性约简算法 被引量:234
1
作者 徐章艳 刘作鹏 +1 位作者 宋威 《计算机学报》 EI CSCD 北大核心 2006年第3期391-399,共9页
以基数排序的思想设计了一个新的求U/C的算法,其时间复杂度被降为O(|C||U|).经研究发现,以近似质量作为启发信息并非十分理想,故以快速缩小搜索空间为目的设计了一个新的较为合理的度量属性重要性的计算公式,并给出了该公式的递归计算公... 以基数排序的思想设计了一个新的求U/C的算法,其时间复杂度被降为O(|C||U|).经研究发现,以近似质量作为启发信息并非十分理想,故以快速缩小搜索空间为目的设计了一个新的较为合理的度量属性重要性的计算公式,并给出了该公式的递归计算公式.计算该公式的算法复杂度被降低到O(|C-P||U′-UP′|).用新公式作为启发信息,设计了一个时间复杂度为max(O(|C||U|,O(|C|2|U/C|))的快速属性约简算法,并用一个实例说明了算法.实验结果表明新算法不仅具有高效性而且能处理大型决策表. 展开更多
关键词 粗糙集 正区域 属性重要性 属性约简 计算复杂度 近似质量
下载PDF
基于Web挖掘的智能门户搜索引擎的研究 被引量:36
2
作者 李岩 陈新中 《计算机工程与应用》 CSCD 北大核心 2002年第4期34-36,共3页
搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首... 搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了Web挖掘的定义、分类和应用。最后,详细讨论了Web挖掘技术在智能搜索引擎的重要应用。 展开更多
关键词 搜索引擎 WEB 智能搜索 数据挖掘 INTERNET 信息检索
下载PDF
Web挖掘研究 被引量:34
3
作者 陈新中 李岩 +1 位作者 谢永红 《计算机工程与应用》 CSCD 北大核心 2002年第13期42-44,共3页
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数... Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数据的多样性、丰富和动态的超链接信息以及Web用户访问信息,详细阐述了Web内容挖掘、Web结构挖掘和Web用户访问信息挖掘的概念、定义、主要的挖掘算法及最新研究进展,文章最后介绍了Web挖掘的研究方向和发展趋势。 展开更多
关键词 数据挖掘 WEB 数据库 INTERNET 信息服务
下载PDF
利用标准SQL查询挖掘多值型关联规则及其评价 被引量:26
4
作者 孙海洪 熊范纶 《计算机研究与发展》 EI CSCD 北大核心 2002年第3期307-312,共6页
关联规则是数据挖掘中一种重要的模式 ,目前对布尔型关联规则的挖掘算法研究得比较多 .利用标准SQL功能强、易于开发、运行速度快、安全可靠性强等优点 ,来实现多值型关联规则的挖掘具有比较好的性能 .首先利用语言场理论对连续属性进... 关联规则是数据挖掘中一种重要的模式 ,目前对布尔型关联规则的挖掘算法研究得比较多 .利用标准SQL功能强、易于开发、运行速度快、安全可靠性强等优点 ,来实现多值型关联规则的挖掘具有比较好的性能 .首先利用语言场理论对连续属性进行离散化 ,然后利用 SQL对 Apriori算法进行改进来实现关联规则的挖掘 .另外利用主观 Bayes方法中的 L S充分性因子对挖掘出来的假设规则进行评价 .该算法应用于庐江虫害数据库 ,结果显示它具有快速、有效、易开发。 展开更多
关键词 多值型关联规则 SQL语言 评价 标准 数据挖掘 数据库
下载PDF
句子相似度计算新方法及在问答系统中的应用 被引量:45
5
作者 周法国 《计算机工程与应用》 CSCD 北大核心 2008年第1期165-167,178,共4页
计算句子的相似度在机器问答、机器翻译、文本分类等系统中有着非常重要的作用。该文对基于相同关键词的句子相似模型作了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形。并以此为基础,实现了一个... 计算句子的相似度在机器问答、机器翻译、文本分类等系统中有着非常重要的作用。该文对基于相同关键词的句子相似模型作了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形。并以此为基础,实现了一个基于常问问题集的中文自动问答系统,对用户以自然语言输入的问题,该系统能够自动地在FAQ(Frequently-Asked Question)库中寻找候选问题集,通过计算句子相似度,将匹配的答案返回给用户。该系统还能够自动地更新和维护FAQ库。实验结果表明,这种新方法在问答系统中匹配问句时比其他方法具有较高的准确率。 展开更多
关键词 自然语言处理 句子相似度 常问问题集 问答系统
下载PDF
理工科课堂KM教学法研究 被引量:45
6
作者 张桃红 《现代大学教育》 CSSCI 北大核心 2006年第4期83-85,共3页
在全球化的信息时代,知识爆炸的态势下,如何在有限的时间内快速、牢固地掌握越来越多的知识,是高等教育为培养复合型、创新性人才所面临的难题。本文提出基于知识逻辑结构融入思维导图的KM教学法,将知识按逻辑结构化,经由思维微观演绎,... 在全球化的信息时代,知识爆炸的态势下,如何在有限的时间内快速、牢固地掌握越来越多的知识,是高等教育为培养复合型、创新性人才所面临的难题。本文提出基于知识逻辑结构融入思维导图的KM教学法,将知识按逻辑结构化,经由思维微观演绎,得到反映知识本质的逻辑结构图与思维导图。在教学过程(区别于单纯的学习过程)中,知识经过“薄—厚—薄”的过程后,从而深层地“吃透”了知识,达到高效的教学目的。本文以“高等数学”的教学知识为例,详解基于知识逻辑结构融入思维导图的KM教学法的实施要点。 展开更多
关键词 知识逻辑结构 思维导图 KM教学法 理工科课 高等数学 教学目的 高校
下载PDF
基于Web的文本挖掘 被引量:28
7
作者 唐菁 张前 +2 位作者 陈泓婕 刘宁 《计算机工程与应用》 CSCD 北大核心 2002年第21期198-201,共4页
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。在茫茫的信息海洋如何快速有效地获取所需要的信息,一直是困绕着网上用户的难题。而Web挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上... 万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。在茫茫的信息海洋如何快速有效地获取所需要的信息,一直是困绕着网上用户的难题。而Web挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上解决了用户的困绕。该文主要介绍了Web挖掘基本情况,并在此基础上对基于Web的文本挖掘进行了分析研究;给出了一个基于Web的文本挖掘的结构模型图。同时,在Web挖掘和数据挖掘研究的基础上,提出了一个智能化、个性化的现代远程教育系统结构模型。它比传统的远程教育系统具有更大的发展前景。 展开更多
关键词 WEB 文本挖掘 数据挖掘 INTERNET WWW
下载PDF
基于支持向量机的复杂时间序列预测研究 被引量:32
8
作者 曲文龙 樊广佺 《计算机工程》 EI CAS CSCD 北大核心 2005年第23期1-3,共3页
介绍了相空间重构和基于支持向量机的时间序列预测建模技术,提出了复杂时间序列的多尺度分解方法,对支持向量机回归与预测的各项参数设置进行了试验分析。对股票数据进行建模和预测,结果表明支持向量机对复杂时间序列具有较好的预测效果。
关键词 时间序列预测 支持向量机 多尺度 数据挖掘
下载PDF
关联规则的综合评价方法研究与实例验证 被引量:27
9
作者 苏占东 游福成 《计算机应用》 CSCD 北大核心 2004年第10期17-20,共4页
分别讨论了关联规则的客观评价指标(支持度、可信度和相关强度)和主观评价指标(新颖性、用户感兴趣性和简洁性),在此基础上给出了一种关联规则的综合自动评价方法,并结合实例验证了该方法的有效性。
关键词 关联规则 评价指标 新颖性 简洁性 用户感兴趣性
下载PDF
Web结构挖掘 被引量:20
10
作者 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 WEB结构挖掘 PAGERANK HITS SALSA 超链接 网页排序
下载PDF
不平衡类数据挖掘研究综述 被引量:37
11
作者 翟云 曲武 《计算机科学》 CSCD 北大核心 2010年第10期27-32,共6页
综述了近年来国内外对不平衡类数据挖掘的主要研究进展。首先分析了不平衡类数据挖掘的本质。其次,详细探讨了处理不平衡类数据挖掘的各种技术,并根据其本质区别,从数据层次和算法层次分别对目前存在的各种技术方法进行了深入剖析和全... 综述了近年来国内外对不平衡类数据挖掘的主要研究进展。首先分析了不平衡类数据挖掘的本质。其次,详细探讨了处理不平衡类数据挖掘的各种技术,并根据其本质区别,从数据层次和算法层次分别对目前存在的各种技术方法进行了深入剖析和全面比较。最后,指出当前不平衡类数据挖掘研究的热点以及将来需要重点关注的主要问题。 展开更多
关键词 机器学习 不平衡类数据 重采样 代价敏感学习
下载PDF
知识发现及其应用研究回顾 被引量:9
12
作者 黄绍君 谢永红 《计算机应用研究》 CSCD 北大核心 2001年第4期1-5,8,共6页
介绍了知识发现的背景,描述了知识发现的发展过程、知识类型、所使用的数据库,重点介绍了知识发现在各个领域的应用如:农业、医学、环保、天文、金融、零售、军事、Internet等.
关键词 知识发现 机器学习 数据发掘 数据库
下载PDF
KDD中双库协同机制的研究(Ⅰ) 被引量:33
13
作者 王建新 《中国工程科学》 2002年第4期41-51,57,共12页
针对KDD (基于数据库的知识发现 )主流发展中存在的典型问题提出了用知识库去制约与驱动数据库 ,并通过数据库改善知识库结构的知识发现的新思想 ,形成了具有双库协同机制的KDD的开放系统KDD ,从而提高了知识发现的速度、精度和认知自主... 针对KDD (基于数据库的知识发现 )主流发展中存在的典型问题提出了用知识库去制约与驱动数据库 ,并通过数据库改善知识库结构的知识发现的新思想 ,形成了具有双库协同机制的KDD的开放系统KDD ,从而提高了知识发现的速度、精度和认知自主性 ,并使知识库在结构上具备了实时维护与自我进化的能力 。 展开更多
关键词 KDD 数据库 知识发现 知识结点 本原知识库 本原数据库 数据子类结构 双库协同机制
下载PDF
Web日志挖掘技术进展 被引量:17
14
作者 陈新中 李岩 +2 位作者 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 AI 万维网 WEB挖掘 WEB日志挖掘
下载PDF
基于Web的文本挖掘系统的研究与实现 被引量:22
15
作者 唐菁 沈记全 《计算机科学》 CSCD 北大核心 2003年第1期60-62,共3页
With the development of network technology, the spread of information on Internet becomes more andmore quick. There are many types of complicated data in the information ocean. How to acquire useful knowledgequickly f... With the development of network technology, the spread of information on Internet becomes more andmore quick. There are many types of complicated data in the information ocean. How to acquire useful knowledgequickly from the information ocean is the very difficult. The Text Mining based on Web is the new research fieldwhich can solve the problem effectively. In this paper, we present a structure model of Text Mining and research thecore arithmetic - Classification arithmetic. We have developed the Text Mining system based on Web and appliedit in the modern long-distance education. This system can automatically classify the text information of education fieldwhich is collected from education site on Internet and help people to browser the important information quickly andacquire knowledge. 展开更多
关键词 WEB 文本挖掘系统 数据库 知识发现 数据挖掘
下载PDF
基于簇的K最近邻(KNN)分类算法研究 被引量:27
16
作者 潘丽芳 《计算机工程与设计》 CSCD 北大核心 2009年第18期4260-4262,共3页
传统K最近邻(KNN)分类算法为了找出待分类文本的k个邻居,需要与样本空间中的每个样本向量作比较,当训练样本较多时,导致相似度计算次数过多,分类速度下降。为此,改进了传统KNN算法,将训练文本中相似度大的文本合并,称为一簇,并计算簇的... 传统K最近邻(KNN)分类算法为了找出待分类文本的k个邻居,需要与样本空间中的每个样本向量作比较,当训练样本较多时,导致相似度计算次数过多,分类速度下降。为此,改进了传统KNN算法,将训练文本中相似度大的文本合并,称为一簇,并计算簇的中心向量。待分类文本先与每一簇的中心向量计算相似度,当相似度达到某个阈值时,再与簇中的每个文本计算相似度,在一定程度上减少了相似度计算次数,降低了算法的时间复杂度。根据同一特征出现在文本中的位置不同应具有不同的权重改进了传统的TF-IDF计算公式。 展开更多
关键词 KNN算法 相似度计算次数 中心向量 TF_IDF算法
下载PDF
非线性时间序列的相空间重构技术研究 被引量:25
17
作者 秦奕青 蔡卫东 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第11期2969-2973,共5页
分析了混沌时间序列相空间重构中常用的C-C方法所存在的四点不足,提出了改进的C-C-2方法。该方法改进了时间序列关联积分的计算方法和参数,利用混沌序列周期N的概念,提出了通过寻找Scor(t)的第一个属于混沌序列周期N的局部极小峰值,来... 分析了混沌时间序列相空间重构中常用的C-C方法所存在的四点不足,提出了改进的C-C-2方法。该方法改进了时间序列关联积分的计算方法和参数,利用混沌序列周期N的概念,提出了通过寻找Scor(t)的第一个属于混沌序列周期N的局部极小峰值,来确定最优延迟时间窗口的判断方式;并只寻找平均?S2(t)的第一个极小值来确定最优时间延迟,所得结果更合适、稳定,而且将原算法的抗噪能力由30%提高到80%。 展开更多
关键词 相空间重构 关联积分 延迟时间窗口 非线性时间序列
下载PDF
Web日志挖掘数据预处理过程技术研究 被引量:17
18
作者 姚洪波 《微计算机信息》 北大核心 2006年第06X期234-236,共3页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。本文介绍了面向Web日志的数据挖掘预处理的一般过程并给出了用户识别的算法实现。
关键词 WEB日志挖掘 数据预处理 用户识别
下载PDF
几种不同属性约简的比较研究 被引量:28
19
作者 徐章艳 +1 位作者 宋威 侯伟 《小型微型计算机系统》 CSCD 北大核心 2008年第5期848-853,共6页
为研究基于HU差别矩阵、信息熵、分布、最大分布、近似和正区域的属性约简的关系,首先构造了HU简化差别矩阵;构造了基于正区域的简化差别矩阵,证明了基于该简化差别矩阵的属性约简与基于正区域的属性约简是等价的.然后利用HU简化差别矩... 为研究基于HU差别矩阵、信息熵、分布、最大分布、近似和正区域的属性约简的关系,首先构造了HU简化差别矩阵;构造了基于正区域的简化差别矩阵,证明了基于该简化差别矩阵的属性约简与基于正区域的属性约简是等价的.然后利用HU简化差别矩阵证明了:若B满足φ≠mij∈M使得mij∩B≠φ(其中M表示HU的差别矩阵),则B一定满足H(D|B)=H(D|C);利用基于正区域的简化差别矩阵和基于近似约简的简化差别矩阵证明了:若B是近似协调集,则B一定满足POSB(D)=POSC(D).结合已有的研究结果,得出了上述不同属性约简之间的关系. 展开更多
关键词 粗糙集 HU差别矩阵 信息熵 分布约简 最大分布约简 近似约简 正区域
下载PDF
KDD中因果关联规则的评价方法 被引量:20
20
作者 綦艳霞 《软件学报》 EI CSCD 北大核心 2002年第6期1142-1147,共6页
在KDD(knowledge discovery in database)中,对所发现的知识进行评价是一个很重要的环节.提出了一种针对KDD中因果关联规则的自动评价方法.该评价方法采用了全新的、有效的知识表示方法(语言场和语言值结构)和推理机制(因果关系定性推... 在KDD(knowledge discovery in database)中,对所发现的知识进行评价是一个很重要的环节.提出了一种针对KDD中因果关联规则的自动评价方法.该评价方法采用了全新的、有效的知识表示方法(语言场和语言值结构)和推理机制(因果关系定性推理机制),并且具有通用性和交互性的特征.给出了此评价方法的理论依据和构造过程,并提供了相应的算法.通过对具体实例的运行检验,证明了此评价方法的有效性.通过与相关工作的比较,证明了其先进性. 展开更多
关键词 KDD 因果关联规则 评价 感兴趣度 数据库
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部