期刊文献+
共找到274篇文章
< 1 2 14 >
每页显示 20 50 100
大数据带给图书馆的影响与挑战 被引量:298
1
作者 韩翠峰 《图书与情报》 CSSCI 北大核心 2012年第5期37-40,共4页
大数据是近两年IT界最为流行的关键词,但对大数据的内涵与认识各大IT厂商、研究机构与科学家都有着不同的见解。在大数据时代,图书馆将在数据存储、数据挖掘、数据分析等方面面临着巨大的挑战与考验,复杂数据的处理也将成为大数据时代... 大数据是近两年IT界最为流行的关键词,但对大数据的内涵与认识各大IT厂商、研究机构与科学家都有着不同的见解。在大数据时代,图书馆将在数据存储、数据挖掘、数据分析等方面面临着巨大的挑战与考验,复杂数据的处理也将成为大数据时代图书馆发展的主旋律,通过大量的非结构化数据、半结构化数据去寻找隐藏在数据背后的世界,进而为图书馆服务的模式、未来发展趋势提供分析与预测将成为大数据时代图书馆的一大主要服务内容。 展开更多
关键词 大数据 非结构化数据 半结构化数据 数据处理 图书馆服务 数据挖掘
下载PDF
大数据时代的图书馆服务浅析 被引量:201
2
作者 杨海燕 《图书与情报》 CSSCI 北大核心 2012年第4期120-122,共3页
大数据与云计算是近两年IT界最为流行的两个关键词,各大IT厂商也都看到了大数据所蕴含的商业价值并展开了一定的产品研发与商业应用。在大数据时代,图书馆的数据处理及服务将会发生显著的变化,从大量的数据集中去分析和挖掘潜在的价值,... 大数据与云计算是近两年IT界最为流行的两个关键词,各大IT厂商也都看到了大数据所蕴含的商业价值并展开了一定的产品研发与商业应用。在大数据时代,图书馆的数据处理及服务将会发生显著的变化,从大量的数据集中去分析和挖掘潜在的价值,以便图书馆决策层及时做出相应的建设方案调整将成为图书馆的一大主要业务,图书馆服务也将随着图书馆服务策略的调整而做出服务方式、途径等方面的改变。 展开更多
关键词 大数据 云计算 数据处理 数据分析 信息服务 图书馆服务 数据挖掘
下载PDF
大数据研究综述 被引量:165
3
作者 涂新莉 刘波 林伟伟 《计算机应用研究》 CSCD 北大核心 2014年第6期1612-1616,1623,共6页
主要从大数据的概念着手,对比分析了国内外大数据研究和应用现状,重点分析比较当前大数据主流处理工具的优缺点,并深入归纳总结了基于数据存储的大数据处理技术、基于数据挖掘的大数据处理技术、基于查询的大数据处理技术的优缺点和适... 主要从大数据的概念着手,对比分析了国内外大数据研究和应用现状,重点分析比较当前大数据主流处理工具的优缺点,并深入归纳总结了基于数据存储的大数据处理技术、基于数据挖掘的大数据处理技术、基于查询的大数据处理技术的优缺点和适用场景。最后,在前面比较和分析的基础上给出了大数据研究和发展的方向,为大数据的研究提供有益参考。 展开更多
关键词 大数据 数据处理 数据挖掘
下载PDF
大数据时代下图书馆的挑战及其应对策略 被引量:143
4
作者 朱静薇 李红艳 《现代情报》 CSSCI 2013年第5期9-13,共5页
文章首先阐述了大数据的特征与内涵,指出了大数据在图书馆工作中的重要性及两者之间的关系,分析了大数据所带来的数据管理、数据存储、数据挖掘等方面的挑战。然后研究了图书馆应从数据管理、数据技术及数据队伍建设上所采取的策略。最... 文章首先阐述了大数据的特征与内涵,指出了大数据在图书馆工作中的重要性及两者之间的关系,分析了大数据所带来的数据管理、数据存储、数据挖掘等方面的挑战。然后研究了图书馆应从数据管理、数据技术及数据队伍建设上所采取的策略。最后探讨了大数据驱动下的图书馆服务新模式,如基于数据整合的一站式资源服务,基于数据处理的学科知识服务、信息可视化服务及基于数据挖掘的个性化智慧服务。 展开更多
关键词 大数据 数据处理 数据挖掘 数据服务 图书馆
下载PDF
数据库中加权关联规则的发现 被引量:96
5
作者 欧阳为民 郑诚 蔡庆生 《软件学报》 EI CSCD 北大核心 2001年第4期612-619,共8页
关联规则发现是数据库中知识发现研究中的热点课题 ,有着广泛的应用领域 .在现有的研究中 ,数据库中的各个项目是按平等一致的方式加以处理的 .然而 ,在现实世界数据库中却并非如此 ,不同的项目往往有着不同的重要性 .为了将它们反映出... 关联规则发现是数据库中知识发现研究中的热点课题 ,有着广泛的应用领域 .在现有的研究中 ,数据库中的各个项目是按平等一致的方式加以处理的 .然而 ,在现实世界数据库中却并非如此 ,不同的项目往往有着不同的重要性 .为了将它们反映出来 ,对项目引入权值 ,从而提出了新的加权关联规则问题 .由于项目权值的引入 ,频繁项目集的子集不再一定是频繁的 .为此 ,又提出了项目的 k-支持期望概念 ,并由此提出了加权关联规则的发现算法 . 展开更多
关键词 数据发掘 知识发现 加权关联规则 数据库
下载PDF
个体诊疗临床科研信息一体化平台 被引量:74
6
作者 刘保延 周雪忠 +5 位作者 李平 王映辉 文天才 郭玉峰 张润顺 陈世波 《中国数字医学》 2007年第6期31-36,共6页
介绍面向中医临床诊疗实践的临床科研信息一体化平台,该平台在临床术语规范研究的基础上,实现对中医临床病历数据的结构化采集,并通过临床数据的集成管理,实现囊括海量临床数据存储、数据抽取-转换-装载、数据整理、多维分析和数据挖掘... 介绍面向中医临床诊疗实践的临床科研信息一体化平台,该平台在临床术语规范研究的基础上,实现对中医临床病历数据的结构化采集,并通过临床数据的集成管理,实现囊括海量临床数据存储、数据抽取-转换-装载、数据整理、多维分析和数据挖掘等功能的中医临床数据仓库平台。该平台面向中医临床研究的分析需求,建立了面向三大疾病如糖尿病、中风、冠心病,以及名老中医临床经验分析的多维分析系统,并针对多种中医临床问题进行了多种数据挖掘方法应用研究。该平台有望成为实现中医临床湿干研究模式的技术支撑体系,从而推动中医个体诊疗临床实践和研究的水平。 展开更多
关键词 临床科研信息一体化平台 结构化临床信息采集系统 中医临床数据仓库 多维分析 数据挖掘 个体诊疗
下载PDF
智能交通系统(ITS)共用信息平台构架及解决方案初步分析 被引量:39
7
作者 史其信 郑为中 《交通运输工程与信息学报》 2003年第1期41-47,56,共8页
本文提出了基于信息处理和数据挖掘的智能交通系统共用信息平台的基本构架,并对平台的功能构成、初步解决方案和平台构建当中涉及的关键技术问题进行分析。根据ITS共用信息平台的总体目标——从各ITS子系统中提取各种共性和相关信息,采... 本文提出了基于信息处理和数据挖掘的智能交通系统共用信息平台的基本构架,并对平台的功能构成、初步解决方案和平台构建当中涉及的关键技术问题进行分析。根据ITS共用信息平台的总体目标——从各ITS子系统中提取各种共性和相关信息,采用先进的数据分析、统计、挖掘和关联等技术,为各层次的用户主体提供基于全系统范围内的信息服务和辅助决策,本文不仅提出了ITS共用信息平台的总体构架设计,以及各项功能的构成和要求;而且对构筑信息平台的关键技术,如信息源接口与信息统一标准设计、GIS底层平台、以CORBA为核心的中间件体系、数据挖掘和数据仓库技术、用户服务软件开发与安全措施等,分别进行了论述分析。 展开更多
关键词 智能交通系统 ITS 共用信息平台构架 信息处理 数据挖掘 功能构成 初步解决方案
下载PDF
基于决策树的汉语未登录词识别 被引量:23
8
作者 秦文 苑春法 《中文信息学报》 CSCD 北大核心 2004年第1期14-19,共6页
未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中 ,未登录词是造成分词错识误的一个重要原因。本文首先把未登录词识别问题看成一种分类问题。即分词程序处理后产生的分词碎片分为‘合’(合成未登录词 )和... 未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中 ,未登录词是造成分词错识误的一个重要原因。本文首先把未登录词识别问题看成一种分类问题。即分词程序处理后产生的分词碎片分为‘合’(合成未登录词 )和‘分’(分为两单字词 )两类。然后用决策树的方法来解决这个分类的问题。从语料库及现代汉语语素数据库中共统计出六类知识 :前字前位成词概率、后字后位成词概率、前字自由度、后字自由度、互信息、单字词共现概率。用这些知识作为属性构建了训练集。最后用C4 5算法生成了决策树。在分词程序已经识别出一定数量的未登录词[6 ] 而仍有分词碎片情况下使用该方法 ,开放测试的召回率 ;6 9 4 2 % ,正确率 :4 0 4 1%。实验结果表明 ,基于决策树的未登录词识别是一种值得继续探讨的方法。 展开更多
关键词 人工智能 自然语言处理 未登录词识别 数据挖掘 决策树 C4.5算法
下载PDF
电子病历文本挖掘研究综述 被引量:43
9
作者 吴宗友 白昆龙 +2 位作者 杨林蕊 王仪琦 田英杰 《计算机研究与发展》 EI CSCD 北大核心 2021年第3期513-527,共15页
电子病历是医院信息化发展的产物,其中包含了丰富的医疗信息和临床知识,是辅助临床决策和药物挖掘等的重要资源.因此,如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来,随着计算机技术尤其是机器学习以及深度学习... 电子病历是医院信息化发展的产物,其中包含了丰富的医疗信息和临床知识,是辅助临床决策和药物挖掘等的重要资源.因此,如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来,随着计算机技术尤其是机器学习以及深度学习的蓬勃发展,对电子病历这一特殊领域数据的挖掘有了更高的要求.电子病历综述旨在通过对电子病历研究现状的分析来指导未来电子病历文本挖掘领域的发展.具体而言,综述首先介绍了电子病历数据的特点和电子病历的数据预处理的常用方法;然后总结了电子病历数据挖掘的4个典型任务(医学命名实体识别、关系抽取、文本分类和智能问诊),并且围绕典型任务介绍了常用的基本模型以及研究人员在任务上的部分探索;最后结合糖尿病和心脑血管疾病2类特定疾病,对电子病历的现有应用场景做了简单介绍. 展开更多
关键词 电子病历 自然语言处理 数据挖掘 机器学习 深度学习
下载PDF
数据仓库在证券交易中的研究与应用 被引量:12
10
作者 刘明吉 张晓京 +2 位作者 刘洪杰 王秀峰 王治宝 《计算机工程》 CAS CSCD 北大核心 2000年第2期47-49,94,共4页
着重讨论了数据仓库技术在证券交易中的应用,详细介绍了证券交易系统中数据仓库的设计和建立,并且进一步讨论了如何建立基于数据仓库的证券交易决策支持模型。
关键词 证券交易 数据仓库 联机分析处理 数据挖掘
下载PDF
论空间数据处理与空间数据挖掘 被引量:15
11
作者 王新洲 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2006年第1期1-4,8,共5页
根据现行文献中反复提到的空间数据处理内涵的理解,将空间数据处理分为空间数据处理技术和空间数据处理理论,简要论述了各自的主要内容,讨论了空间数据挖掘的现状和今后研究的重点,比较了空间数据处理与空间数据挖掘的异同。
关键词 空间数据处理 空间数据挖掘 空间数据不确定性
下载PDF
基于数据仓库的企业营销决策支持系统的设计 被引量:9
12
作者 张应利 周霞 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第5期30-34,共5页
通过对目前国内企业决策支持系统现状的调查与分析 ,指出其存在的主要问题 .以设计实例给出了基于数据仓库的企业营销决策支持系统的框架结构模型和数据仓库的建模技术 .简单地介绍了联机分析处理和数据挖掘技术 .
关键词 数据仓库 决策支持系统 联机分析处理 数据挖掘 企业 营销决策
下载PDF
大数据挖掘中的MapReduce并行聚类优化算法研究 被引量:21
13
作者 吕国 肖瑞雪 +1 位作者 白振荣 孟凡兴 《现代电子技术》 北大核心 2019年第11期161-164,共4页
针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据... 针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据分析需求,完成低成本、高性能的数据并行挖掘与处理。 展开更多
关键词 大数据 MAPREDUCE 并行化处理 聚类算法 数据挖掘 Map任务
下载PDF
遥感大数据的智能处理:现状与挑战 被引量:20
14
作者 宋维静 刘鹏 +1 位作者 王力哲 吕科 《工程研究(跨学科视野中的工程)》 CSCD 2014年第3期259-265,共7页
随着遥感技术的发展,遥感数据空间分辨率、时间分辨率、光谱分辨率和辐射分辨率越来越高,数据类型越来越丰富,与此同时,数据量也越来越大。遥感大数据向传统的遥感数据智能处理提出了新的挑战。本文从信息处理的角度论述了遥感大数据的... 随着遥感技术的发展,遥感数据空间分辨率、时间分辨率、光谱分辨率和辐射分辨率越来越高,数据类型越来越丰富,与此同时,数据量也越来越大。遥感大数据向传统的遥感数据智能处理提出了新的挑战。本文从信息处理的角度论述了遥感大数据的海量、异构、多源的外部特征与高维度、多尺度、非平稳的内部特征,阐述了遥感大数据智能处理在算法方面所涉及的关键技术,分析了遥感大数据稀疏表征字典训练与稀疏求解方面的研究现状与存在的问题,讨论了遥感大数据数据挖掘面临的挑战,阐述了遥感大数据知识发现数据降维方面现有的解决方法与难题,并对相应的问题进行了概括性讨论。最后,总结了遥感大数据智能处理目前的研究阶段与研究意义。 展开更多
关键词 遥感大数据 智能处理 稀疏表征 数据挖掘 知识发现
下载PDF
基于数据挖掘的PSO-BP短期电力负荷预测 被引量:19
15
作者 曾德斌 许江淳 +1 位作者 杨杰超 陆万荣 《自动化仪表》 CAS 2020年第5期93-97,共5页
针对海量用电数据环境下,如何提高电力负荷预测精度的问题,采用数据挖掘对电力负荷历史数据进行聚类分析以及异常检测,并利用灰色序列对异常数据进行修正。利用蚁群算法对粒子群优化-反向传播(PSO-BP)算法进行优化,以提高算法的预测精... 针对海量用电数据环境下,如何提高电力负荷预测精度的问题,采用数据挖掘对电力负荷历史数据进行聚类分析以及异常检测,并利用灰色序列对异常数据进行修正。利用蚁群算法对粒子群优化-反向传播(PSO-BP)算法进行优化,以提高算法的预测精度。通过对历史负荷数据进行试验,验证该方法的预测平均误差为3.16%,低于无数据挖掘的PSO-BP算法模型以及PSO-BP算法模型的预测误差。该方法具有一定的实用性以及有效性。 展开更多
关键词 大数据 数据处理 数据挖掘 电力负荷 组合预测 异常检测 负荷预测 数据修正
下载PDF
面向临床决策的电子病历系统概述 被引量:19
16
作者 李国垒 陈先来 夏冬 《中国数字医学》 2014年第12期30-32,36,共4页
电子病历系统作为医院信息化建设的核心,不仅要实现对临床信息的高效管理,还应该满足临床信息利用的需求,实现临床决策支持的功能。对国内外有关电子病历系统在临床决策支持方面的应用进行了文献综述,以求对面向临床决策的电子病历系统... 电子病历系统作为医院信息化建设的核心,不仅要实现对临床信息的高效管理,还应该满足临床信息利用的需求,实现临床决策支持的功能。对国内外有关电子病历系统在临床决策支持方面的应用进行了文献综述,以求对面向临床决策的电子病历系统相关问题有较全面的了解。 展开更多
关键词 电子病历系统 临床决策支持 自然语言处理 数据挖掘
下载PDF
基于数据仓库的综合决策支持系统的设计研究 被引量:15
17
作者 彭晓东 莫东松 +2 位作者 刘勇 夏新初 夏克俭 《电脑开发与应用》 2003年第4期77-78,共2页
侧重介绍了数据仓库、OLAP和模型库的设计,该系统采用了OLAP、DSS模型库等多项新的技术和模型,有机地集成了多个子系统,经武钢等单位实际应用,证明充分利用了前期开发的多个信息系统中的数据源,可不断增加新模型和新知识以适应更多决策... 侧重介绍了数据仓库、OLAP和模型库的设计,该系统采用了OLAP、DSS模型库等多项新的技术和模型,有机地集成了多个子系统,经武钢等单位实际应用,证明充分利用了前期开发的多个信息系统中的数据源,可不断增加新模型和新知识以适应更多决策主题的需要,使模型的参数“自适应”成为事实。 展开更多
关键词 数据仓库 综合决策支持系统 软件设计 联机分析处理 数据挖掘 数据库 知识库
下载PDF
网络文本数据搜索引擎与搜索技术 被引量:3
18
作者 李勇 《情报理论与实践》 CSSCI 北大核心 2001年第4期298-300,共3页
This paper describes the functions,characteristics and operating principles of search engines based on Web text,and the searching and data mining technologies for Web-based text information.Methods of computer-aided t... This paper describes the functions,characteristics and operating principles of search engines based on Web text,and the searching and data mining technologies for Web-based text information.Methods of computer-aided text clustering and abstacting are also given.Finally,it gives some guidelines for the assessment of searching quality. 展开更多
关键词 网络文本数据搜索引擎 搜索技术 文本分类算法 文本质量 查询质量
下载PDF
基于数据仓库的保险管理系统的设计与实现 被引量:9
19
作者 马建红 王万森 《微机发展》 2004年第7期55-58,共4页
为了充分利用保险企业的统计数据,指导公司的业务发展和决策支持,该文提出了一种基于数据仓库、在线分析处理及数据挖掘的保险企业管理系统解决方案。并从实际需求出发,分析了数据仓库的特征和体系结构模型,归纳并设计了保险企业数据仓... 为了充分利用保险企业的统计数据,指导公司的业务发展和决策支持,该文提出了一种基于数据仓库、在线分析处理及数据挖掘的保险企业管理系统解决方案。并从实际需求出发,分析了数据仓库的特征和体系结构模型,归纳并设计了保险企业数据仓库的基本结构框架,创建了一个面向保险业务分析管理的数据仓库系统,并对其具体的实现方法进行了阐述。该系统支持联机分析处理,并将数据挖掘应用于数据仓库的知识发现中,真正意义上运用了数据仓库理论和方法。 展开更多
关键词 数据仓库 保险管理系统 在线分析处理 数据挖掘 信息处理技术
下载PDF
大数据技术研究综述 被引量:15
20
作者 吴亚坤 郭海旭 王晓明 《辽宁大学学报(自然科学版)》 CAS 2015年第3期236-242,共7页
介绍了大数据的起源与发展,阐述了大数据的概念及特征.在此基础上,总结了大数据处理的一般流程和关键技术.最后,指出了大数据技术面临的挑战.
关键词 大数据 数据处理 云计算 数据挖掘
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部