期刊文献+
共找到30,886篇文章
< 1 2 250 >
每页显示 20 50 100
网络大数据:现状与展望 被引量:712
1
作者 王元卓 靳小龙 程学旗 《计算机学报》 EI CSCD 北大核心 2013年第6期1125-1138,共14页
网络大数据是指"人、机、物"三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大... 网络大数据是指"人、机、物"三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大挑战.同时,也为人们深度挖掘和充分利用网络大数据的大价值带来了巨大机遇.因此,迫切需要探讨大数据的科学问题,发现网络大数据的共性规律,研究网络大数据定性、定量分析的基础理论与基本方法.文中分析了网络大数据的复杂性、不确定性和涌现性,总结了网络空间感知与数据表示、网络大数据存储与管理体系、网络大数据挖掘和社会计算以及网络数据平台系统与应用等方面的主要问题与研究现状,并对大数据科学、数据计算需要的新模式与新范式、新型的IT基础架构和数据的安全与隐私等方面的发展趋势进行了展望. 展开更多
关键词 大数据 网络大数据 网络空间感知 大数据存储 数据挖掘 社会计算
下载PDF
Web挖掘研究 被引量:356
2
作者 韩家炜 孟小峰 +1 位作者 王静 李盛恩 《计算机研究与发展》 EI CSCD 北大核心 2001年第4期405-414,共10页
因特网目前是一个巨大、分布广泛、全球性的信息服务中心 ,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务 .Web包含了丰富和动态的超链接信息 ,以及 Web页面的访问和使用信息 ,这为数据挖掘提供了丰... 因特网目前是一个巨大、分布广泛、全球性的信息服务中心 ,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务 .Web包含了丰富和动态的超链接信息 ,以及 Web页面的访问和使用信息 ,这为数据挖掘提供了丰富的资源 .Web挖掘就是从 Web文档和 Web活动中抽取感兴趣的潜在的有用模式和隐藏的信息 .对 Web挖掘最新技术及发展方向做了全面分析 ,包括 Web结构挖掘、多层次 Web数据仓库方法以及Web L 展开更多
关键词 数据挖掘 WEB 数据库 数据仓库 INTERNET
下载PDF
基于大型数据仓库的数据采掘:研究综述 被引量:256
3
作者 胡侃 夏绍玮 《软件学报》 EI CSCD 北大核心 1998年第1期53-63,共11页
本文介绍了数据采掘技术的总体研究情况,包括数据采掘的定义、与其他学科的关系、采掘的主要过程、分类和主要技术手段.作为例子介绍了关联规则采掘的研究,同时介绍了一些原型系统和商业产品以及主要应用领域,指出了数据采掘研究的... 本文介绍了数据采掘技术的总体研究情况,包括数据采掘的定义、与其他学科的关系、采掘的主要过程、分类和主要技术手段.作为例子介绍了关联规则采掘的研究,同时介绍了一些原型系统和商业产品以及主要应用领域,指出了数据采掘研究的挑战性以及目前的局限性.结合当前数据仓库的发展,本文探讨了数据仓库环境下数据采掘的特点和潜力. 展开更多
关键词 数据采掘 数据仓库 数据处理 数据库系统
下载PDF
基于深度学习的推荐系统研究综述 被引量:411
4
作者 黄立威 江碧涛 +2 位作者 吕守业 刘艳博 李德毅 《计算机学报》 EI CSCD 北大核心 2018年第7期1619-1647,共29页
深度学习是机器学习领域一个重要的研究方向,近年来在图像处理、自然语言理解、语音识别和在线广告等领域取得了突破性进展.将深度学习融入推荐系统中,研究如何整合海量的多源异构数据,构建更加贴合用户偏好需求的用户模型,以提高推荐... 深度学习是机器学习领域一个重要的研究方向,近年来在图像处理、自然语言理解、语音识别和在线广告等领域取得了突破性进展.将深度学习融入推荐系统中,研究如何整合海量的多源异构数据,构建更加贴合用户偏好需求的用户模型,以提高推荐系统的性能和用户满意度,成为基于深度学习的推荐系统的主要任务.该文对近几年基于深度学习的推荐系统研究进展进行综述,分析其与传统推荐系统的区别以及优势,并对其主要的研究方向、应用进展等进行概括、比较和分析.最后,对基于深度学习的推荐系统的未来发展趋势进行分析和展望. 展开更多
关键词 推荐系统 深度学习 协同过滤 个性化服务 数据挖掘 多源异构数据
下载PDF
智慧城市中的大数据 被引量:410
5
作者 李德仁 姚远 邵振峰 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2014年第6期631-640,共10页
探讨了智慧城市的概念,总结了其发展历程,剖析了中国建设智慧城市的动力和目标,阐述了智慧城市的支撑技术,并提出了智慧城市的基础架构,即在数字城市的基础上有机地融合物联网和云计算技术,以实现对现实城市中人和物的自动控制和智能服... 探讨了智慧城市的概念,总结了其发展历程,剖析了中国建设智慧城市的动力和目标,阐述了智慧城市的支撑技术,并提出了智慧城市的基础架构,即在数字城市的基础上有机地融合物联网和云计算技术,以实现对现实城市中人和物的自动控制和智能服务。针对无所不在的传感器网对智慧城市的大数据进行了分析,面对智慧城市中大数据将带来的诸多问题和挑战,提出了应对大数据的策略和思路,重点论述了云计算与数据挖掘,并给出了云平台的基础框架,提出了建立智慧城市运营中心的建议,最后展望了智慧城市未来美好的前景。 展开更多
关键词 智慧城市 大数据 数字城市 物联网 云计算 数据挖掘 智能服务
原文传递
关联规则的增量式更新算法 被引量:227
6
作者 冯玉才 冯剑琳 《软件学报》 EI CSCD 北大核心 1998年第4期301-306,共6页
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断... 关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incrementalupdatingalgorithm)和PIUA(paralelincre-mentalupdatingalgorithm),用来解决这一关联规则高效维护问题. 展开更多
关键词 数据开采 知识发现 关联规则 增量式更新 数据库
下载PDF
大数据应用的现状与展望 被引量:375
7
作者 张引 陈敏 廖小飞 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期216-233,共18页
大数据具有规模大、种类多、生成速度快、价值巨大但密度低的特点.大数据应用就是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程.主要介绍了大数据分析方法、分析模式以及常用的分析工具,将大数... 大数据具有规模大、种类多、生成速度快、价值巨大但密度低的特点.大数据应用就是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程.主要介绍了大数据分析方法、分析模式以及常用的分析工具,将大数据应用归纳为6个关键领域———结构化数据分析、文本分析、Web分析、多媒体分析、社交网络分析和移动分析,并列举了6个大数据的典型应用.最后,从基础理论、关键技术、应用实践以及数据安全4个方面总结了大数据的研究现状,并对大数据应用未来的研究进行展望. 展开更多
关键词 大数据 数据分析 数据挖掘 非结构化数据 物联网 社交网络数据 众包
下载PDF
基于Rough Set理论的“数据浓缩” 被引量:239
8
作者 王珏 王任 +4 位作者 苗夺谦 郭萌 阮永韶 袁小红 赵凯 《计算机学报》 EI CSCD 北大核心 1998年第5期393-400,共8页
本文讨论了基于RoushSet(RS)理论数据浓缩的几个问题.首先,介绍了一个基于差别矩阵的属性约简策略,并给出了数据浓缩的测量;然后分析了对UCI机器学习数据库40余个例子的数据浓缩的结果;最后,我们强调了在数据浓缩中例外的重要... 本文讨论了基于RoushSet(RS)理论数据浓缩的几个问题.首先,介绍了一个基于差别矩阵的属性约简策略,并给出了数据浓缩的测量;然后分析了对UCI机器学习数据库40余个例子的数据浓缩的结果;最后,我们强调了在数据浓缩中例外的重要性,并讨论了不一致数据浓缩. 展开更多
关键词 数据浓缩 数据挖掘 RS理论 数据库
下载PDF
Data Processing System (DPS) software with experimental design, statistical analysis and data mining developed for use in entomological research 被引量:351
9
作者 Qi-Yi Tang Chuan-Xi Zhang 《Insect Science》 SCIE CAS CSCD 2013年第2期254-260,共7页
A comprehensive but simple-to-use software package called DPS (Data Pro- cessing System) has been developed to execute a range of standard numerical analyses and operations used in experimental design, statistics an... A comprehensive but simple-to-use software package called DPS (Data Pro- cessing System) has been developed to execute a range of standard numerical analyses and operations used in experimental design, statistics and data mining. This program runs on standard Windows computers. Many of the functions are specific to entomological and other biological research and are not found in standard statistical sottware. This paper presents applications of DPS to experimental design, statistical analysis and data mining in entomology. 展开更多
关键词 data mining DPS entomological research experimental design software statistical analysis
原文传递
数据挖掘综述 被引量:260
10
作者 王光宏 蒋平 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第2期246-252,共7页
从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理... 从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理论、云理论、证据理论、人工神经网络、遗传算法以及归纳学习.列举了当前数据挖掘技术的实际应用场合,并指出其今后的发展趋势以及急需关注的问题. 展开更多
关键词 数据挖掘 数据库中知识发现 人工智能 模式
下载PDF
大数据研究综述 被引量:342
11
作者 陶雪娇 胡晓峰 刘洋 《系统仿真学报》 CAS CSCD 北大核心 2013年第S1期142-146,共5页
2010年,全球数据量跨入了ZB时代,据IDC预测,至2020年全球将拥有35ZB的数据量,大量数据实时地影响我们工作、生活,甚至国家经济、社会发展,大数据时代已经到来。大数据具有数据量巨大、数据类型多样、流动速度快和价值密度低的特点,大数... 2010年,全球数据量跨入了ZB时代,据IDC预测,至2020年全球将拥有35ZB的数据量,大量数据实时地影响我们工作、生活,甚至国家经济、社会发展,大数据时代已经到来。大数据具有数据量巨大、数据类型多样、流动速度快和价值密度低的特点,大数据技术为我们分析问题和解决问题提供了新的思路和方法,其研究渐渐成为热点。阐述了大数据的相关概念、特点、大数据技术特别是在数据挖掘方面国内外发展状况以及我们在大数据时代面临的挑战。通过综述,对大数据有一个全面的认识,为下一步研究打下基础。 展开更多
关键词 大数据 大数据技术 数据挖掘 挑战
下载PDF
人工免疫系统:原理、模型、分析及展望 被引量:209
12
作者 肖人彬 王磊 《计算机学报》 EI CSCD 北大核心 2002年第12期1281-1293,共13页
目前 ,受生物免疫系统启发而产生的人工免疫系统 (Artificial Im mune System,AIS)正在兴起 ,它作为计算智能研究的新领域 ,提供了一种强大的信息处理和问题求解范式 .该文侧重以 AIS的基本原理框架为线索 ,对其研究状况加以系统综述 .... 目前 ,受生物免疫系统启发而产生的人工免疫系统 (Artificial Im mune System,AIS)正在兴起 ,它作为计算智能研究的新领域 ,提供了一种强大的信息处理和问题求解范式 .该文侧重以 AIS的基本原理框架为线索 ,对其研究状况加以系统综述 .首先从 AIS的生物原型入手 ,归纳提炼出其仿生机理 ,主要包括免疫识别、免疫学习、免疫记忆、克隆选择、个体多样性、分布式和自适应等 ,进而对几种典型的 AIS模型和算法分门别类地进行了细致讨论 ,随后介绍了 AIS在若干具有代表性的领域中的应用情况 .最后通过对 AIS的特性和存在问题的分析 ,展望了今后的研究重点和发展趋势 . 展开更多
关键词 人工免疫系统 原理 模型 展望 生物免疫系统 计算智能 仿生机理 算法模型
下载PDF
大数据带给图书馆的影响与挑战 被引量:298
13
作者 韩翠峰 《图书与情报》 CSSCI 北大核心 2012年第5期37-40,共4页
大数据是近两年IT界最为流行的关键词,但对大数据的内涵与认识各大IT厂商、研究机构与科学家都有着不同的见解。在大数据时代,图书馆将在数据存储、数据挖掘、数据分析等方面面临着巨大的挑战与考验,复杂数据的处理也将成为大数据时代... 大数据是近两年IT界最为流行的关键词,但对大数据的内涵与认识各大IT厂商、研究机构与科学家都有着不同的见解。在大数据时代,图书馆将在数据存储、数据挖掘、数据分析等方面面临着巨大的挑战与考验,复杂数据的处理也将成为大数据时代图书馆发展的主旋律,通过大量的非结构化数据、半结构化数据去寻找隐藏在数据背后的世界,进而为图书馆服务的模式、未来发展趋势提供分析与预测将成为大数据时代图书馆的一大主要服务内容。 展开更多
关键词 大数据 非结构化数据 半结构化数据 数据处理 图书馆服务 数据挖掘
下载PDF
数据挖掘中的聚类算法综述 被引量:225
14
作者 贺玲 吴玲达 蔡益朝 《计算机应用研究》 CSCD 北大核心 2007年第1期10-13,共4页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词 数据挖掘 聚类 聚类算法
下载PDF
学习分析:正在浮现中的数据技术 被引量:249
15
作者 顾小清 张进良 蔡慧英 《远程教育杂志》 CSSCI 2012年第1期18-25,共8页
随着教育信息化的普及与逐渐深入,学习管理系统已经获取并存储了大量的有关学生复杂学习行为的数据,从这些数据中挖掘出改进教学系统、提升学习效果的信息,在教育信息化领域一直有着巨大的吸引力。因此,有必要从分析数据以改进学习的角... 随着教育信息化的普及与逐渐深入,学习管理系统已经获取并存储了大量的有关学生复杂学习行为的数据,从这些数据中挖掘出改进教学系统、提升学习效果的信息,在教育信息化领域一直有着巨大的吸引力。因此,有必要从分析数据以改进学习的角度,对日益受到关注的学习分析技术进行解读。首先,学习分析技术是测量、收集、分析和报告有关学生的学习行为以及学习环境的数据,用以理解和优化学习及其产生的环境的技术。接着,综述学习分析技术的发展,指出其在教育中有着广泛的应用前景和巨大的发展潜力:学习分析技术可作为教师教学决策、优化教学的有效支持工具,也可为学生的自我导向学习、学习危机预警和自我评估提供有效数据支持,还可为教育研究者的个性化学习设计和增进研究效益提供数据参考。最后,提出学习分析技术也存在隐私、准确性和兼容性等诸多挑战和问题。 展开更多
关键词 学习分析 学习行为 数据挖掘 教学决策 数据支持
下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
16
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
下载PDF
关联规则挖掘综述 被引量:133
17
作者 蔡伟杰 张晓辉 +1 位作者 朱建秋 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2001年第5期31-33,49,共4页
介绍了关联规则挖掘的研究性况,提出了关联规则的分类方法,对一些典型算法进行了分析和秤价,指出传统关系规则衡量标准的不足,归纳出关联规则的价值衡量方,展望了关联规则挖掘的未来研究方向。
关键词 数据挖掘 关联规则 OLAP 数据库 知识发现
下载PDF
WWW上的信息挖掘技术及实现 被引量:120
18
作者 邹涛 王继成 +2 位作者 朱华宇 金翔宇 张福炎 《计算机研究与发展》 EI CSCD 北大核心 1999年第8期1019-1024,共6页
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源.但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所需信息.文... 随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源.但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所需信息.文中将数据挖掘的思想引入WWW信息处理领域来解决网上信息有效获取的问题,讨论了在WWW上进行信息挖掘所采用的算法和策略,最后简要介绍了一个采用向量空间模型和改进Robot技术的网络信息挖掘系统的设计与实现.经实验表明,系统能够较好地解决WWW上的信息自动获取问题. 展开更多
关键词 信息收集 数据处理 VSM WWW 信息检索系统
下载PDF
面向数据库应用的隐私保护研究综述 被引量:220
19
作者 周水庚 李丰 +1 位作者 陶宇飞 肖小奎 《计算机学报》 EI CSCD 北大核心 2009年第5期847-861,共15页
随着数据挖掘和数据发布等数据库应用的出现与发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战.隐私保护技术需要在保护数据隐私的同时不影响数据应用.根据采用技术的不同,出现了数据失真、数据加密、限制发布等隐私保... 随着数据挖掘和数据发布等数据库应用的出现与发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战.隐私保护技术需要在保护数据隐私的同时不影响数据应用.根据采用技术的不同,出现了数据失真、数据加密、限制发布等隐私保护技术.文中对隐私保护领域已有研究成果进行了总结,对各类隐私保护技术的基本原理、特点进行了阐述,还详细介绍了各类技术的典型应用,并重点介绍了当前该领域的研究热点:基于数据匿名化的隐私保护技术.在对已有技术深入对比分析的基础上,指出了隐私保护技术的未来发展方向. 展开更多
关键词 数据库应用 隐私保护 数据挖掘 数据发布 随机化 多方安全计算 匿名化
下载PDF
挖掘关联规则中Apriori算法的研究 被引量:142
20
作者 陆丽娜 陈亚萍 +1 位作者 魏恒义 杨麦顺 《小型微型计算机系统》 EI CSCD 北大核心 2000年第9期940-943,共4页
文章是基于大型销售数据库研究了关联规则挖掘问题 .分析和探讨了 Apriori算法 ,并给出了该算法的实现思想 。
关键词 数据挖掘 关联规则 APRIORI算法 数据库
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部