期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
大数据时代高校图书馆受到的挑战及其发展对策 被引量:25
1
作者 李凤念 《农业图书情报学刊》 2014年第3期80-83,共4页
大数据不是对数据量大小的描述,而是在种类繁多、数量庞大的多样数据中进行的快速信息获取,从某种程度上来说大数据是一种数据分析技术。大数据具有大量化、多样化、快速化和价值密度低4大特点。大数据在政治、经济、科技等领域都有应... 大数据不是对数据量大小的描述,而是在种类繁多、数量庞大的多样数据中进行的快速信息获取,从某种程度上来说大数据是一种数据分析技术。大数据具有大量化、多样化、快速化和价值密度低4大特点。大数据在政治、经济、科技等领域都有应用。信息网络技术的发展给高校图书馆带来了海量数据。大数据对高校图书馆的网络结构设计、数据存储和数据处理提出了挑战,高校图书馆需要统一大数据的格式,实现高效率的存储以及对非结构化数据进行处理。 展开更多
关键词 大数据 非结构化数据 数据存储 数据处理 高校图书馆
下载PDF
可撤销属性加密结合快速密度聚类算法的非结构化大数据安全存储方法 被引量:15
2
作者 谷保平 马建红 《计算机应用与软件》 北大核心 2021年第5期337-343,共7页
针对非结构化大数据难以实现安全存储和易遭受安全攻击的问题,提出可撤销属性加密结合快速密度聚类算法的非结构化大数据安全存储方法。利用可撤销属性方法为非结构化大数据提供安全的存储结构,通过区分安全攻击和传输错误来防止大数据... 针对非结构化大数据难以实现安全存储和易遭受安全攻击的问题,提出可撤销属性加密结合快速密度聚类算法的非结构化大数据安全存储方法。利用可撤销属性方法为非结构化大数据提供安全的存储结构,通过区分安全攻击和传输错误来防止大数据的误传和避免安全攻击;利用霍夫曼压缩技术对数据进行快速压缩,节省非结构化大数据处理过程中的时间开销;利用错误控制技术为潜在丢失的数据提供备份系统,并利用快速密度聚类算法有效处理多维大数据文件。实验证明,相比于其他现有非结构化大数据安全存储方法,该方法的执行速度更快,时间开销更小,信息损失百分比更低,信噪比(SNR)和压缩比更高。 展开更多
关键词 可撤销属性加密 快速密度聚类算法 非结构化 大数据 安全存储 安全攻击 霍夫曼压缩
下载PDF
基于层级设计的输变电工程数据存储架构 被引量:14
3
作者 袁兆祥 彭晶 +1 位作者 安增军 张华 《沈阳工业大学学报》 EI CAS 北大核心 2019年第6期601-605,共5页
针对输变电工程数据来源多样、类型复杂、数据量大导致数据存储压力大的问题,提出了一种基于层级设计的输变电工程数据存储架构.将输变电工程数据划分为结构化数据和非结构化数据,使用不同的存储方式以优化配置存储资源;使用基于遗传算... 针对输变电工程数据来源多样、类型复杂、数据量大导致数据存储压力大的问题,提出了一种基于层级设计的输变电工程数据存储架构.将输变电工程数据划分为结构化数据和非结构化数据,使用不同的存储方式以优化配置存储资源;使用基于遗传算法的数据迁移方法实现海量数据的迁移,使用不同配置的数据存储中心进行仿真与测试.结果表明,所提出的存储架构和数据迁移方法能有效解决海量输变电工程数据存储的问题,提升输变电工程数据存储系统的性能. 展开更多
关键词 输变电工程 海量数据 结构化数据 非结构化数据 存储 数据迁移 负载 遗传算法
下载PDF
面向非结构化的分布式存储系统的性能分析系统研究 被引量:12
4
作者 关兆雄 《自动化与仪器仪表》 2018年第2期40-43,共4页
随着各种非结构数据的海量增长,传统的单点主机存储方式已经不能满足需求,取代的是以NoSQL等为代表的非结构化分布式存储方式。因此,加强对非结构性分布式存储系统性能的优化分析,成为当前思考的重点。针对当前非结构化分布存储系统在... 随着各种非结构数据的海量增长,传统的单点主机存储方式已经不能满足需求,取代的是以NoSQL等为代表的非结构化分布式存储方式。因此,加强对非结构性分布式存储系统性能的优化分析,成为当前思考的重点。针对当前非结构化分布存储系统在性能分析方面的需求,构建一个轻量级的面向非结构化数据存储的性能分析系统,并重点构建客户端与服务器端之间数据流的关联活动;在任务执行过程中,将客户端与服务器端之间数据流关联放在同一时间轴上,以此找到潜在的最优优化点,最终更好的调整分布式存储系统性能。最后,通过搭建实验环境,对上述性能分析系统进行验证,取得良好的实验效果。 展开更多
关键词 非结构化数据 分布式存储 性能分析 NoSQL系统 数据流
原文传递
大数据存储技术和标准化 被引量:11
5
作者 李海波 程耀东 《信息技术与标准化》 2013年第5期23-26,共4页
针对目前大数据存储技术的标准化问题和面临的挑战,详述了现有的大数据存储技术以及应用情况,参考并分析现有云存储接口标准,为大数据存储技术的未来发展提出标准化工作建议。
关键词 大数据 非结构化数据 分布式文件系统 云存储
下载PDF
关于大数据非结构化信息存储效率仿真研究 被引量:9
6
作者 柳原 《计算机仿真》 北大核心 2018年第6期198-202,共5页
对大数据下非结构化信息存储效率问题的研究,能够有效提升大数据信息处理速度。对大数据信息进行高效存储,通过对信息的周期调度,对最小的数据传输粒度等指标进行综合分析,完成对非结构化信息的高效率存储。传统方法利用HBase过滤机制... 对大数据下非结构化信息存储效率问题的研究,能够有效提升大数据信息处理速度。对大数据信息进行高效存储,通过对信息的周期调度,对最小的数据传输粒度等指标进行综合分析,完成对非结构化信息的高效率存储。传统方法利用HBase过滤机制实现几何中心坐标点的纵坐标,进而对图层信息进行过滤,但忽略了对数据传输指标的综合性分析,导致信息存储效率较低。提出基于超带宽的非结构化信息存储方法,首先采用分析聚类将错误的数据聚类删除,以防出现死神经元的问题,使得数据的清洗更加高效准确;通过周期调度,对信息存储过程中的最小数据传输粒度等指标进行综合分析;优化信息存储过程梯度,将所得梯度引至非结构化数据传输存储中;对数据进行流量分离式的存储,以减少信息存储错位情况。实验表明,上述方法在冗余数据的清洗,信息存储延时控制方面,均优于当前方法。 展开更多
关键词 大数据 非结构化 信息存储
下载PDF
电力企业的非结构化数据检索研究 被引量:8
7
作者 罗学礼 徐树振 +2 位作者 王森 杨莉 段嘉杰 《计算机与数字工程》 2014年第4期729-733,共5页
电网公司多年来建设了很多业务系统,各业务系统相互孤立应用。随着企业信息化建设的深入,业务系统中数据特别是非结构化数据的数据量急剧增长,人员查找数据信息极为不便。建设面向整个电网公司的分布式非结构化数据检索平台,该平台在Li... 电网公司多年来建设了很多业务系统,各业务系统相互孤立应用。随着企业信息化建设的深入,业务系统中数据特别是非结构化数据的数据量急剧增长,人员查找数据信息极为不便。建设面向整个电网公司的分布式非结构化数据检索平台,该平台在Linux计算机集群上部署Hadoop开发框架以及Solr分布式全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务,使得企业相关人员能够高效、便捷地检索出所需的数据。实现知识服务无处不在,为员工工作提供帮助,为企业提供决策支持。 展开更多
关键词 非结构化数据 分布式 HADOOP SOLR 存储 检索
下载PDF
大规模非结构化数据资源快速存储方法研究
8
作者 闫丽飞 褚宇宁 +2 位作者 赵维伟 何壮壮 刘晓强 《集成电路与嵌入式系统》 2024年第4期77-81,共5页
非结构化数据资源具有较高的研究价值,伴随着信息化技术、互联网技术应用范围的扩大,非结构化数据资源规模随之增大,对其存储技术提出了较大的挑战,因此提出了大规模非结构化数据资源快速存储方法,采用层次聚类算法分组处理非结构化数... 非结构化数据资源具有较高的研究价值,伴随着信息化技术、互联网技术应用范围的扩大,非结构化数据资源规模随之增大,对其存储技术提出了较大的挑战,因此提出了大规模非结构化数据资源快速存储方法,采用层次聚类算法分组处理非结构化数据资源。以某一组非结构化数据资源为对象,结合数据资源传输距离、节点能量、传输方向等因素,确定非结构化数据资源转发路径,描述非结构化数据资源存储过程,制定分层扩展存储机制,从而实现大规模非结构化数据资源的快速存储。实验数据表明,在不同实验工况背景下,应用本文方法后获得的非结构化数据资源存储速率最大值为1920 MB/s,非结构化数据资源存储位置准确性最大值为98%。 展开更多
关键词 数据资源 非结构化 安全存储 存储机制 快速存储
下载PDF
智能电网海量非结构化数据分布式存储研究 被引量:3
9
作者 马海鑫 余杰文 +2 位作者 侯剑 韩吉安 宋学清 《电子设计工程》 2023年第11期116-119,124,共5页
为了加快非结构化电网数据存储的译码速率,从而促进电网主机分布式存储能力的提升,提出智能电网海量非结构化数据分布式存储方法。定义MongoDB数据格式的方法,对电网信息实施复制处理,联合分布式存储架构完成智能电网海量非结构化数据... 为了加快非结构化电网数据存储的译码速率,从而促进电网主机分布式存储能力的提升,提出智能电网海量非结构化数据分布式存储方法。定义MongoDB数据格式的方法,对电网信息实施复制处理,联合分布式存储架构完成智能电网海量非结构化数据库搭建。在此基础上,分析电网数据的特性能力,通过信息增删排查的方式,确定最终的分布式查询语句,搭建智能电网海量非结构化数据分布式存储模型,实现数据的分布式存储。与局部修复型存储编码方法相比,在分布式存储模型作用下,电网主机的存储译码速率最大值能够达到54.5 MB/s,可在实现非结构化电网数据快速转码的同时,提升电网主机分布式存储能力。 展开更多
关键词 智能电网 非结构化数据 分布式存储 MongoDB格式 信息增删 查询语句
下载PDF
一种非结构化数据查询优化存储系统设计 被引量:6
10
作者 王秋琳 宋立华 +1 位作者 闫丽飞 林晖 《电子设计工程》 2017年第13期16-20,共5页
针对电力系统信息运维现状,研究并设计了电力业务非结构化数据查询优化存储系统。首先详述了非结构化数据存储系统的架构方案;针对分布式存储问题,提出了均衡分布优化策略,并在此基础上设计了协同数据查询优化方案。数据集划分时间、数... 针对电力系统信息运维现状,研究并设计了电力业务非结构化数据查询优化存储系统。首先详述了非结构化数据存储系统的架构方案;针对分布式存储问题,提出了均衡分布优化策略,并在此基础上设计了协同数据查询优化方案。数据集划分时间、数据集读取时间、查询正确率、数据节点服务器负载和请求响应时延等实验表明,所搭建的评测环境可满足测试需要,所研制的方案具有一定的优势,满足电力业界主流分布式存储技术的能力特征及适用性。 展开更多
关键词 非结构化数据 查询优化 存储系统 均衡分布
下载PDF
面向大数据的城市轨道交通非结构化数据管理 被引量:5
11
作者 顾伟华 黄天印 郭鹏 《城市轨道交通研究》 北大核心 2016年第11期77-80,共4页
针对城市轨道交通大数据,分析了城市轨道交通非结构化数据的来源、类型和产生方式,讨论了非结构化数据的获取方式和组织策略,结合上海城市轨道交通实际情况提出了适用的城市轨道交通非结构化数据存储架构。
关键词 城市轨道交通 非结构化数据 数据管理 存储架构
下载PDF
非结构化数据管理平台研究与建设 被引量:5
12
作者 冯宇 《电力信息化》 2012年第2期69-72,共4页
为研究非结构化数据管理平台建设的意义,通过分析非结构化数据存储现状和需求,开发建设了非结构化数据管理平台。通过非结构化数据管理平台的使用,提高了企业员工的工作效率,扩大了企业生产及管理相关信息的共享范围,为企业领导层提供... 为研究非结构化数据管理平台建设的意义,通过分析非结构化数据存储现状和需求,开发建设了非结构化数据管理平台。通过非结构化数据管理平台的使用,提高了企业员工的工作效率,扩大了企业生产及管理相关信息的共享范围,为企业领导层提供了决策支持。实践证明,开展非结构化数据管理平台的技术研究与建设,是进一步提高电力企业信息化建设水平的关键措施。 展开更多
关键词 非结构化 海量存储 集中管理 版本控制 安全管控
下载PDF
基于分布式文件电力异构数据存储综述 被引量:5
13
作者 张琦 陈艳 +1 位作者 张春平 刘铭 《计算机系统应用》 2017年第2期30-36,共7页
随着国网公司信息化建设的不断推进,在整个电网的运检和管理的过程中都会产生海量的数据,这些数据中包含各场景产生的视频、图片、传感器数据和一些企业档案信息等非结构(异构)化数据.在面对如此大规模非结构化的数据存储要求时,传统关... 随着国网公司信息化建设的不断推进,在整个电网的运检和管理的过程中都会产生海量的数据,这些数据中包含各场景产生的视频、图片、传感器数据和一些企业档案信息等非结构(异构)化数据.在面对如此大规模非结构化的数据存储要求时,传统关系型数据库已经表现的力不从心了.如何对此类数据进行高效地、廉价地和安全可靠地存储,并且可以快速检索与分析,是当下研究的重要热点课题之一.本文首先分析了电网大数据的产生及特征,然后综述了工业界大数据分布式文件存储技术,最后分析适合国网非结构化数据的分布式文件存储策略. 展开更多
关键词 大数据 非结构化 分布式文件 数据存储
下载PDF
基于递归神经网络的非结构化数据加密存储 被引量:1
14
作者 杨莲 崔永春 王圣芳 《信息技术》 2023年第4期167-172,共6页
为实现非结构化大数据的安全存储并提高其抗攻击能力,提出了基于递归神经网络的非结构化数据加密存储方法。通过分块处理医院非结构化大数据,获得输入、输出张量,构建基于LSTM的递归神经网络,生成医院大数据序列;通过向前反馈和向后反... 为实现非结构化大数据的安全存储并提高其抗攻击能力,提出了基于递归神经网络的非结构化数据加密存储方法。通过分块处理医院非结构化大数据,获得输入、输出张量,构建基于LSTM的递归神经网络,生成医院大数据序列;通过向前反馈和向后反馈获得加密数据,将加密后数据包用加密后源数据包的线性组合代替;再设计基于列不满秩概率存储算法,通过加密存储子节点控制器分配加密存储任务。实验结果表明:该方法具有较强的抗攻击能力,存储效率优势更显著。 展开更多
关键词 递归神经网络 非结构化 加密存储 抗攻击 权值矩阵
下载PDF
大规模非结构化数据资源快速存储方法仿真 被引量:4
15
作者 朱林 郎乾雯 胡劲蓓 《计算机仿真》 北大核心 2019年第8期293-297,共5页
研究一种有效的数据资源快速存储方法,可以减少丢包率,保证存储的稳定性,提高数据存储速度,具备一定的应用价值。针对传统的非结构化数据资源快速存储模式存在能耗均衡性较差、存储延时较长和丢包率较高等问题,提出基于海量存储云调制... 研究一种有效的数据资源快速存储方法,可以减少丢包率,保证存储的稳定性,提高数据存储速度,具备一定的应用价值。针对传统的非结构化数据资源快速存储模式存在能耗均衡性较差、存储延时较长和丢包率较高等问题,提出基于海量存储云调制的非结构化数据资源快速存储方法,该方法将多类别非结构化数据资源集合作为输入,对特征要素进行阈值处理,输出大规模非结构化数据资源关联模型。根据关联模型得到数据资源储存适应的关联强度,将强度与频宽占用概率进行非结构化数据资源储存控制,调节非结构化数据的粒度,依照最小传输粒度频宽梯度传输,加快大规模非结构化数据资源快速存储。通过实验结果验证,上述方法可降低存储延时、减少存储丢包率、保证存储能耗的均衡性,提高大规模非结构化数据资源的存储效率。 展开更多
关键词 非结构化数据 快速存储 存储延时 丢包率 均衡性
下载PDF
基于MapReduce模型的非结构化数据分布式存储方法 被引量:3
16
作者 梁雪青 杜舒明 《微型电脑应用》 2022年第7期106-109,共4页
为了解决传统数据存储方法存在的内存消耗过大、读取效率低等多种问题,提出了基于MapReduce模型的非结构化数据分布式存储方法。设计了非结构化数据垂直分片与水平分片方案,并采用聚类算法对分片处理后的非结构化数据进行聚簇处理,在此... 为了解决传统数据存储方法存在的内存消耗过大、读取效率低等多种问题,提出了基于MapReduce模型的非结构化数据分布式存储方法。设计了非结构化数据垂直分片与水平分片方案,并采用聚类算法对分片处理后的非结构化数据进行聚簇处理,在此基础上构建用于数据分布式存储的MapReduce模型,得到非结构化数据分布式存储结果。实验测试结果表明,与传统非结构化数据存储方法相比,研究方法的内存消耗更小、写入量更大、读取效率更高、访问频率动态调节性能好,由此证明该方法的存储性能更优越,实际应用效果更好。 展开更多
关键词 人工智能 非结构化数据 分布式存储 存储消耗
下载PDF
大数据技术在铁路货运平台中的应用
17
作者 李辉 《电子技术(上海)》 2023年第7期194-195,共2页
阐述铁路货运平台大数据技术应用方案,大数据系统中的关键技术,研究方法及技术路线,包括系统技术架构、非结构数据的存储模型、结构数据的挖掘模型、数据的可视化展示。
关键词 大数据技术 非结构数据 存储模型 数据挖掘模型
原文传递
变电站历史数据分布式存储系统设计与实现 被引量:4
18
作者 任浩 闫卫国 +2 位作者 王强 陈建 郭凌旭 《电气自动化》 2019年第4期83-85,共3页
目前,变电站接入的数据类型越来越多,存在存储分散,结构和访问方式差异大,以及没有建立统一的存储和访问接口等问题。针对以上问题,提出一种基于Key-Value非关系型数据库的"Redis代理机+SSDB存储集群"的变电站历史数据分布式... 目前,变电站接入的数据类型越来越多,存在存储分散,结构和访问方式差异大,以及没有建立统一的存储和访问接口等问题。针对以上问题,提出一种基于Key-Value非关系型数据库的"Redis代理机+SSDB存储集群"的变电站历史数据分布式存储的实现方式,包括Redis代理服务器和SSDB存储集群,在代理服务器端通过历史数据统一导入工具,将不同厂家的变电站SCADA历史数据和非结构化历史数据统一存储在Key-Value网络化缓存库中,再通过代理服务程序,采用一致性哈希分片算法将其分布式转存至存储集群中,对于存储集群的每个存储子机通过LevelDB存储引擎将缓存数据存入磁盘文件中,实现对历史数据的分布式永久性存储。经实验室测试证明,开发出的变电站历史数据分布式存储系统的功能需求和性能指标完全达到预期目标。 展开更多
关键词 非关系型数据库 非结构化数据 REDIS SSDB 分布式存储
下载PDF
非结构化地质数据内容存储方法研究 被引量:4
19
作者 魏东琦 江宝得 张静雅 《西北地质》 CAS CSCD 北大核心 2021年第4期266-273,共8页
地质工作已迈入大数据时代,但地学信息被记录成的报告、图件等非结构化数据,仍按照较为简单的方式组织归类到一起并存储在文件系统中,形成很多个内部构成复杂的数据集。这种方式不能很好的表达非结构化数据承载的丰富地学信息,也不便表... 地质工作已迈入大数据时代,但地学信息被记录成的报告、图件等非结构化数据,仍按照较为简单的方式组织归类到一起并存储在文件系统中,形成很多个内部构成复杂的数据集。这种方式不能很好的表达非结构化数据承载的丰富地学信息,也不便表达信息之间的复杂关系,更不利于发现跨数据集存在的深层知识。为尝试解决这个问题,笔者提出了多粒度级别内容树模型和支持演化的数据建模方式。这些特性使得通过模型可以对数据内容进行不同尺度的拆分,对信息的精确定位,还可以使模型根据数据主体需要,拓展主体特征描述的维度,逐步发现数据包含的信息和建立信息与信息之间的关系。考虑到地质大数据的特点,设计了以HBase为核心的数据模型持久化方式,以达到使用大数据技术体系下技术分析处理数据的目的;最后给出了对成果地质数据进行建模的实例,将文档、图件等非结构化数据以内容实体为最小单元进行拆分和重构,达到了较好的内容组织和信息表达效果。 展开更多
关键词 地质大数据 非结构化数据 数据建模 内容存储
下载PDF
D-Ocean: an unstructured data management system for data ocean environment 被引量:2
20
作者 Yueting ZHUANG Yaoguang WANG +5 位作者 Jian SHAO Ling CHEN Weiming LU Jianling SUN Baogang WEI Jiangqin WU 《Frontiers of Computer Science》 SCIE EI CSCD 2016年第2期353-369,共17页
Together with the big data movement, many organizations collect their own big data and build distinctive applications. In order to provide smart services upon big data, massive variable data should be well linked and ... Together with the big data movement, many organizations collect their own big data and build distinctive applications. In order to provide smart services upon big data, massive variable data should be well linked and organized to form Data Ocean, which specially emphasizes the deep exploration of the relationships among unstructured data to support smart services. Currently, almost all of these applications have to deal with unstructured data by integrating various analysis and search techniques upon massive storage and processing infrastructure at the application level, which greatly increase the difficulty and cost of application development. This paper presents D-Ocean, an unstructured data management system for data ocean environment. D-Ocean has an open and scalable architecture, which consists of a core platform, pluggable components and auxiliary tools. It exploits a unified storage framework to store data in different kinds of data stores, integrates batch and incremental processing mechanisms to process unstructured data, and provides a combined search engine to conduct compound queries. Furthermore, a so-called RAISE process modeling is proposed to support the whole process of Repository, Analysis, Index, Search and Environment modeling, which can greatly simplify application development. The experiments and use cases in production demonstrate the efficiency and usability of D-Ocean. 展开更多
关键词 unstructured data storage analysis INDEX SEARCH RAISE process modeling
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部