期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
支持大数据管理的NoSQL系统研究综述 被引量:195
1
作者 申德荣 于戈 +2 位作者 王习特 聂铁铮 寇月 《软件学报》 EI CSCD 北大核心 2013年第8期1786-1803,共18页
针对大数据管理的新需求,呈现出了许多面向特定应用的NoSQL数据库系统.针对基于key-value数据模型的NoSQL数据库的相关研究进行综述.首先,介绍了大数据的特点以及支持大数据管理系统面临的关键技术问题;然后,介绍了相关前沿研究和研究挑... 针对大数据管理的新需求,呈现出了许多面向特定应用的NoSQL数据库系统.针对基于key-value数据模型的NoSQL数据库的相关研究进行综述.首先,介绍了大数据的特点以及支持大数据管理系统面临的关键技术问题;然后,介绍了相关前沿研究和研究挑战,其中典型的包括系统体系结构、数据模型、访问方式、索引技术、事务特性、系统弹性、动态负载均衡、副本策略、数据一致性策略、基于flash的多级缓存机制、基于MapReduce的数据处理策略和新一代数据管理系统等;最后给出了研究展望. 展开更多
关键词 NOSQL key-value存储 大数据管理
下载PDF
Key-Value型NoSQL本地存储系统研究 被引量:26
2
作者 马文龙 朱妤晴 +4 位作者 蒋德钧 熊劲 张立新 孟潇 包云岗 《计算机学报》 EI CSCD 北大核心 2018年第8期1722-1751,共30页
NoSQL系统因其高性能、高可扩展性的优势在大数据管理中得到广泛应用,而key-value(KV)模型则是NoSQL系统中使用最广泛的一种存储模型.KV型本地存储系统对于以机械磁盘为持久化存储的情形,存在许多性能优化技术,但这些优化技术面对当前... NoSQL系统因其高性能、高可扩展性的优势在大数据管理中得到广泛应用,而key-value(KV)模型则是NoSQL系统中使用最广泛的一种存储模型.KV型本地存储系统对于以机械磁盘为持久化存储的情形,存在许多性能优化技术,但这些优化技术面对当前的硬件发展新趋势,如多核处理器、大内存和低延迟闪存、非易失性内存NVM(Non-Volatile Memory)等,难以充分发挥新硬件的优势,如数据索引、并发控制、事务日志管理等技术在多核架构下存在多核扩展性问题,又如数据存储策略不适应闪存SSD(Solid State Drive)的新存储特性而产生了IO利用率低效的问题.针对多核处理器、大内存和闪存、NVM等硬件发展新趋势,文中面向当前的大数据应用背景,综述了KV型本地存储系统在索引技术、并发控制、事务日志管理和数据放置等核心模块上的最新优化技术和系统研究成果.从处理器、内存和持久化存储的角度概括了KV型本地存储系统当前存在的最优技术,总结了当前研究尚未解决的技术挑战,并对KV型本地存储系统在CPU缓存高效性、事务日志扩展性和高可用性等方面的研究进行了展望. 展开更多
关键词 NOSQL 键值存储 多核扩展性 并发数据结构 日志结构合并型存储 SSD/NVM
下载PDF
MongoDB数据库下文件型数据存储研究 被引量:14
3
作者 谢华成 马学文 《软件》 2015年第11期12-14,共3页
针对云计算和WEB2.0环境下不断增容的文件型数据,采用关系数据库和IIS文件系统存储二进制文档效果不理想,关系数据模型制约了存储服务对海量文件信息快速访问和存取的能力。建立非关系型文档数据库MongoDB数据存储和实验平台,将海量互... 针对云计算和WEB2.0环境下不断增容的文件型数据,采用关系数据库和IIS文件系统存储二进制文档效果不理想,关系数据模型制约了存储服务对海量文件信息快速访问和存取的能力。建立非关系型文档数据库MongoDB数据存储和实验平台,将海量互联网文件数据以<key,value>方式存储结点中实现数据存储。实验表明,该存储系统在文件存储应用中具有较高的可靠性和吞吐性能,易于扩展和开发,为移动云计算中非结构化数据存储提供了一种思路。 展开更多
关键词 MongoDB存储 分布式文件存储 键值存储 非关系型数据库
下载PDF
面向云计算的键值型分布式存储系统研究 被引量:7
4
作者 孙勇 林菲 王宝军 《电子学报》 EI CAS CSCD 北大核心 2013年第7期1406-1411,共6页
对于数据密集型的云计算应用,基于磁盘的存储系统很难同时满足它们对性能与可用性的需求.本文提出了一种以内存为主设备、以磁盘为辅助设备的键值型分布式存储系统M-Cloud,能提供大数据读写、备份及恢复等存储服务功能.M-Cloud通过将数... 对于数据密集型的云计算应用,基于磁盘的存储系统很难同时满足它们对性能与可用性的需求.本文提出了一种以内存为主设备、以磁盘为辅助设备的键值型分布式存储系统M-Cloud,能提供大数据读写、备份及恢复等存储服务功能.M-Cloud通过将数据全部装入服务器集群内存中的方式提高系统整体性能,并设计了分区线性哈希算法以实现负载均衡和高扩展性,设计了相应的数据备份与故障快速恢复策略以保证系统可靠性.仿真实验结果表明,M-Cloud具有较高的性能与可用性,对系统进一步改进和优化后具有应用于实际生产环境中的潜力,可为用户提供高质量的存储服务. 展开更多
关键词 云计算 键值 分布式存储系统 线性哈希 故障恢复
下载PDF
一种基于裸闪存的Key-Value数据库优化方法 被引量:6
5
作者 秦雄军 张佳程 +1 位作者 陆游游 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2017年第6期1326-1336,共11页
近年来,非关系型的key-value数据库得到越来越广泛的应用.然而,目前主流的key-value数据库或者是基于磁盘设计的,或者是传统的基于文件系统和闪存转换层FTL来构建的,难以发挥闪存存储设备的特性,限制了I/O的并发性能,且垃圾回收过程复杂... 近年来,非关系型的key-value数据库得到越来越广泛的应用.然而,目前主流的key-value数据库或者是基于磁盘设计的,或者是传统的基于文件系统和闪存转换层FTL来构建的,难以发挥闪存存储设备的特性,限制了I/O的并发性能,且垃圾回收过程复杂.设计并实现了一种基于裸闪存的keyvalue数据管理架构Flashkv,通过用户态下的管理单元进行空间管理和垃圾回收,充分利用了闪存设备内部的并发特性,并简化了垃圾回收过程,去除了传统文件系统和FTL中的冗余功能,缩短了I/O路径.提出了基于闪存特点的I/O调度技术,优化了闪存的读写延迟,提高了吞吐率;提出了用户态缓存管理技术,降低了数据写入量和频繁系统调用所带来的开销.测试结果表明,Flashkv性能是levelDB的1.9~2.2倍,写入量减少60%~65%. 展开更多
关键词 key-value数据库 闪存 裸设备 数据存储 使用寿命
下载PDF
LSM树中基于热度预测的异构布隆过滤器方案 被引量:6
6
作者 俞加平 陈华辉 +1 位作者 钱江波 董一鸿 《电子学报》 EI CAS CSCD 北大核心 2021年第11期2090-2095,共6页
日志结构合并(Log-Structured-Merge,LSM)树中常使用布隆过滤器减少无效磁盘I/O.但是用户无法无限制地细化布隆过滤器的粒度,原因是在一些数据量庞大而数据项较小的工作流中,这些元数据需要占用大量存储空间.其次在一些内存受限的环境下... 日志结构合并(Log-Structured-Merge,LSM)树中常使用布隆过滤器减少无效磁盘I/O.但是用户无法无限制地细化布隆过滤器的粒度,原因是在一些数据量庞大而数据项较小的工作流中,这些元数据需要占用大量存储空间.其次在一些内存受限的环境下,内存缓冲区无法容纳更多的过滤器数据,造成缓冲区与磁盘的频繁数据交换.针对上述问题本文提出LSM树中的异构布隆过滤器方案,在LSM树的每一层维护热度预测模型,新生成的SSTable通过预测的热度来分配不同粒度的布隆过滤器,然后使用特定缓存管理方案来维护缓存中的过滤器数据并处理工作流热度发生改变的情况.实验证明,本文的方案在保持相同外存占用与内存消耗的情况下,读取吞吐量比采用原始LSM树结构的LevelDB提升22%~53%. 展开更多
关键词 日志结构合并树 键值存储 读取性能 布隆过滤器 存储管理 热度预测
下载PDF
MongoDB存储地图瓦片技术在国情普查建库中的应用 被引量:4
7
作者 马卫春 任家锋 朱清 《测绘地理信息》 2018年第3期66-69,共4页
针对安徽省地理国情普查数据库管理系统建设过程中,遇到的加载大数据量图层时显示速度慢的问题,本文设计了一个基于MongoDB数据库存储地图瓦片,数据库管理系统联动调用库体成果的技术方案。实践证明,该方案很好地解决了地理国情普查数... 针对安徽省地理国情普查数据库管理系统建设过程中,遇到的加载大数据量图层时显示速度慢的问题,本文设计了一个基于MongoDB数据库存储地图瓦片,数据库管理系统联动调用库体成果的技术方案。实践证明,该方案很好地解决了地理国情普查数据库管理系统访问大数据量图层显示慢的问题,同时在遇到瓦片数据文件量急速增大的情况,可以有效地避免数据存储和访问性能间瓶颈问题的产生,具有参考和推广价值。 展开更多
关键词 MongoDB存储 地图瓦片 键值存储 地理国情普查 数据库
原文传递
键值数据库中弱一致性数据存储优化技术 被引量:4
8
作者 张伟 贺泽宇 王宇璐 《科学技术与工程》 北大核心 2018年第28期224-228,共5页
当前数据库中弱一致性数据维护方法存在读写性能低、集群性能差的问题。为此,提出一种键值数据库中弱一致性数据改进方法。采用数学归纳法建立Hash值空间的上下限,利用哈希函数对数据库中的冗余数据进行优化;在此基础之上,通过建立未知... 当前数据库中弱一致性数据维护方法存在读写性能低、集群性能差的问题。为此,提出一种键值数据库中弱一致性数据改进方法。采用数学归纳法建立Hash值空间的上下限,利用哈希函数对数据库中的冗余数据进行优化;在此基础之上,通过建立未知弱数据和己知弱数据之间的回归预测模型,同时利用BP网络算法对数据迁移中的缺失数据进行采集,以保证数据的一致性。实验结果显示,与传统方法相比,其读写性能更好;且对数据块越大,吞吐量越提升。 展开更多
关键词 大数据 键值数据库 海量数据存储 数据一致性 哈希函数
下载PDF
面向键值存储的日志结构合并树优化技术 被引量:4
9
作者 吴尚宇 谢婧雯 王毅 《计算机研究与发展》 EI CSCD 北大核心 2020年第11期2432-2441,共10页
日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效... 日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效率.但LSM-Tree仍存在2个不足:一是数据的流动方向是单向的且固定不变.存储在LSM-Tree底部的数据将被一直保留底部,直到它们成为旧数据被压缩操作删除.访问这些数据将使读放大问题变得更加严重.二是LSM-Tree中的数据分布并未考虑访问频率的影响,这将导致访问延迟不平衡的问题.访问高频的低层数据将产生更高的访问延迟.提出了一种基于访问频率分布的上浮式键值存储结构(floating key-value, FloatKV).FloatKV首先在内存中提出了一种新的数据存储结构(LRU and FIFO, LRFO),其次在外存中设计了一种基于访问频率分布的上浮式键值存储策略.FloatKV记录外存中数据的访问频率,并根据访问频率来调整数据的存储位置,以减少访问延迟.为了验证FloatKV的可行性以及性能,使用标准数据库性能测试工具YSCB(yahoo! cloud serving benchmark)来进行评估,并将FloatKV与当前主流的技术进行比较.实验结果表明,FloatKV能够显著地提高读效率,并有效地减少了读放大问题. 展开更多
关键词 计算机体系结构 键值存储 日志结构合并树 访问频率 数据上浮
下载PDF
APLI:一种基于持久化内存的高性能学习索引
10
作者 王中华 赖必梁 +2 位作者 赵泽阳 鲁凯 万继光 《小型微型计算机系统》 CSCD 北大核心 2024年第9期2110-2118,共9页
持久化内存(Persistent Memory,PM)已成为容量有限的DRAM的最有潜力的补充或者替代品.学习索引(Learned Index,LI)作为一种感知数据分布的索引结构,在大数据集上能够以较小的内存使用量展现远优于B+树的性能而被广泛关注.最近,一些研究... 持久化内存(Persistent Memory,PM)已成为容量有限的DRAM的最有潜力的补充或者替代品.学习索引(Learned Index,LI)作为一种感知数据分布的索引结构,在大数据集上能够以较小的内存使用量展现远优于B+树的性能而被广泛关注.最近,一些研究者尝试将学习索引部署在持久化内存中,然而现有的持久化学习索引存在读写性能次优化、结构扩展性不足、动态负载性能不统一等问题.为此,本文在深入分析了持久化内存和学习索引特性的基础上,提出了一种自适应的持久化学习索引结构APLI.APLI由两部分组成:1)高效的混合介质的持久化学习索引树(EPL-Tree),提供稳定的读写性能和结构扩展;2)轻量级的哈希表(SW-Table),用于快速感知负载变化并提升热点访问的性能.在持久化内存真实设备上的评估表明,相比现有的持久化索引结构,APLI读写性能最高分别提升3.2倍和3.3倍,而且拥有更稳定的结构扩展性能.另外,APLI能在较小的DRAM空间占用前提下,实现各种负载场景下的稳定高性能访问. 展开更多
关键词 非易失内存 索引结构 学习索引 持久化索引 键值存储
下载PDF
基于FPGA的ICN名字解析缓存加速系统
11
作者 李雪彤 陈晓 宋磊 《现代电子技术》 北大核心 2024年第7期109-114,共6页
名字解析服务是ICN网络中获取信息内容的关键。为提升名字解析服务的效率,降低名字解析系统的负载,设计并提出一种基于FPGA的ICN名字解析缓存加速系统。该系统在网络节点的数据面上利用FPGA卸载名字解析功能,实现标识到网络地址的映射存... 名字解析服务是ICN网络中获取信息内容的关键。为提升名字解析服务的效率,降低名字解析系统的负载,设计并提出一种基于FPGA的ICN名字解析缓存加速系统。该系统在网络节点的数据面上利用FPGA卸载名字解析功能,实现标识到网络地址的映射存储,处理需要查找网络地址的转发数据包,同时,该系统支持控制面动态配置映射关系,保证映射存储的更新。实验测试结果表明,该系统在10 Gb/s的测试流量下,对小包的转发率达到4.6 Mpps,并且请求延时低于1.5μs,相较于传统软件实现的键值存储系统处理速度提高了27倍,与使用DPDK内核旁路进行优化的软件相比处理速度提高了4倍。 展开更多
关键词 ICN FPGA 名字解析 键值存储 SDN 哈希表 硬件加速 流水线
下载PDF
NoSQL数据库技术在嵌入式装置中的应用 被引量:3
12
作者 范三龙 秦成虎 《工业仪表与自动化装置》 2020年第5期16-20,35,共6页
在互联网+创新背景下,用信息化技术的成果改造和提升传统的自动化设备,具有重要的前景。NoSQL数据库泛指非关系型数据库,是大数据时代的热点。该文在NoSQL数据库技术基础上,设计实现了一种适合在嵌入式装置中运行的实时数据库。从数据... 在互联网+创新背景下,用信息化技术的成果改造和提升传统的自动化设备,具有重要的前景。NoSQL数据库泛指非关系型数据库,是大数据时代的热点。该文在NoSQL数据库技术基础上,设计实现了一种适合在嵌入式装置中运行的实时数据库。从数据对象的描述,对象的存储和索引,对象的查找、遍历、增删改操作,消息总线中通知的注册和发送四个方面,介绍了数据库的组成,内存的使用,双哈希索引的构成,命令及消息传递机制等。该实时数据库可以完成数据对象的灵活定义和高效访问,进而实现各种自动化功能。 展开更多
关键词 NOSQL数据库 键值数据库 列存储 实时数据库 哈希桶
下载PDF
面向分布式GIS空间数据的Key-value缓存 被引量:2
13
作者 涂振发 孟令奎 +1 位作者 张文 黄长青 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2013年第11期1339-1343,共5页
设计了一种基于Key-value结构的缓存KV-cache,旨在简化数据结构,高效管理缓存数据。KV-cache由Mem-cache和F-cache构成。其中,Mem-cache为第一级缓存,并采用缓存回写机制以异步方式将数据写入F-cache进行持久化存储。F-cache使用大文件... 设计了一种基于Key-value结构的缓存KV-cache,旨在简化数据结构,高效管理缓存数据。KV-cache由Mem-cache和F-cache构成。其中,Mem-cache为第一级缓存,并采用缓存回写机制以异步方式将数据写入F-cache进行持久化存储。F-cache使用大文件存储数据,并构建了基于B树的缓存索引以加快检索速度。数据写入F-cache的位置由基于B树的空闲空间管理器进行分配。在100 Mbps局域网内测试KV-cache读写性能。实验表明,KV-cache读写性能优于传统文件目录方式的缓存,能够安全、高效地管理所缓存的各种空间数据。 展开更多
关键词 分布式GIS 缓存 KV cache keyvalue存储 空闲空间管理
原文传递
面向存储网络的融合I/O模拟器设计与实现 被引量:2
14
作者 魏征 黎斐南 +2 位作者 邢晶 霍志刚 孙凝晖 《高技术通讯》 EI CAS 北大核心 2020年第10期983-997,共15页
在现有计算机系统结构中,要实现跨节点的数据存储操作,数据需要先经过本地网卡、远程网卡、远程内存才能到达远程存储设备。这一过程通常还需要远程节点操作系统和应用软件的参与才能完成。随着硬件技术的发展,存储设备的访问延迟大幅... 在现有计算机系统结构中,要实现跨节点的数据存储操作,数据需要先经过本地网卡、远程网卡、远程内存才能到达远程存储设备。这一过程通常还需要远程节点操作系统和应用软件的参与才能完成。随着硬件技术的发展,存储设备的访问延迟大幅下降。为了进一步降低节点数据传输延迟,充分发挥存储设备的性能优势,本文设计了面向网络与存储的融合I/O设备模型UIO,通过让多个功能模块共享存储设备中的内存和数据通路,以简化跨节点数据存储的传输通路优化。并加入辅助计算功能实现数据处理操作,通过与可编程硬件的结合,可以让用户定制辅助计算模块,提高UIO设备的处理效率,扩展应用场景。设计并实现了面向key-value存储系统的UIO设备模拟器,使用4 kB长度value的情况下,与传统数据通路对比,远程put延迟可以降低31%,远程get延迟减少20%。综合指令延迟和指令使用频率对整体操作延迟进行分析,UIO设备在目标场景中预期可以达到比传统数据通路更低的延迟。 展开更多
关键词 设备融合 模拟器 key-value存储 可编程硬件
下载PDF
基于远程直接内存访问的高性能键值存储系统 被引量:2
15
作者 王成 叶保留 +1 位作者 梅峰 卢文达 《计算机应用》 CSCD 北大核心 2020年第2期316-320,共5页
随着数据与系统规模的不断扩大,网络传输成为了键值存储系统的性能瓶颈。同时,远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为键值存储系统设计提供了新的思路。结合高性能网络中的RDMA技术,设计并实现了高性能、低CP... 随着数据与系统规模的不断扩大,网络传输成为了键值存储系统的性能瓶颈。同时,远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为键值存储系统设计提供了新的思路。结合高性能网络中的RDMA技术,设计并实现了高性能、低CPU负载的键值存储系统Chequer;结合RDMA原语的特性,重新设计了键值存储系统的基本操作工作流程;并设计了基于线性探测的共享hash表,解决客户端缓存失效的问题以及提高hash命中率来减少客户端的读取轮数,进一步提高了系统的性能。在小规模集群上实现了Chequer系统,并通过实验验证了其性能。 展开更多
关键词 远程直接内存访问 哈希表 键值存储 高性能网络
下载PDF
基于键值对存储的水电数据中心编码系统 被引量:2
16
作者 翟桂锋 徐丹 +1 位作者 钱锋 夏晨 《水电与抽水蓄能》 2018年第6期19-22,共4页
当前,水电厂各类业务应用的自动化系统间设备命名和编码方式存在差异,导致建立水电一体化数据中心时各业务系统的数据集成和交互困难。本文提出并实现了一种基于键值对存储的水电数据中心编码系统,对水电厂各业务系统的设备对象进行全... 当前,水电厂各类业务应用的自动化系统间设备命名和编码方式存在差异,导致建立水电一体化数据中心时各业务系统的数据集成和交互困难。本文提出并实现了一种基于键值对存储的水电数据中心编码系统,对水电厂各业务系统的设备对象进行全局编码,并提供统一的微服务接口,解决了设备对象命名和编码的差异问题,为水电厂一体化数据中心融合各业务系统的数据提供了基础保障,更为后续基于数据中心的大数据分析和智能化决策提供了先决条件。 展开更多
关键词 键值对存储 水电数据中心 全局编码 微服务
下载PDF
LI-Tree:一个基于非易失性内存和轻量级B+树的学习索引 被引量:1
17
作者 王中华 舒碧华 +3 位作者 陈书宁 刘瀚阳 崔秋 万继光 《小型微型计算机系统》 CSCD 北大核心 2023年第6期1329-1337,共9页
大数据背景下剧增的数据给经典的内存索引技术带来了巨大挑战,为了实现对海量数据的高性能索引,工业界和学术界分别从设备和结构角度推出了高性能大容量的非易失型内存(Non-Volatile Memory,NVM)和受机器学习启发的学习索引(Learned Ind... 大数据背景下剧增的数据给经典的内存索引技术带来了巨大挑战,为了实现对海量数据的高性能索引,工业界和学术界分别从设备和结构角度推出了高性能大容量的非易失型内存(Non-Volatile Memory,NVM)和受机器学习启发的学习索引(Learned Index,LI).然而目前基于NVM的学习索引结构的相关研究非常稀少,在如何结合NVM和LI来高效地索引海量数据方面还有许多问题需要解决.本文提出了一种基于NVM的新型智能索引结构LI-Tree,充分发挥了两者的优势.具体的,LI-Tree可分为三层:由机器学习模型组成的能够提高LI-Tree单点性能的模型层、由静态数组构成的减少NVM写的数据索引层和由一系列轻量级B+树组成以避免模型层插入时频繁重训练的数据层.在真实设备上评估表明,LI-Tree相比传统B+树,插入、查询和删除性能分别提高了70%、30%和130%.另外,LI-Tree与学习索引结构ALEX,PGM-Index和XIndex对比,插入性能分别提升了80%,130%和150%. 展开更多
关键词 非易失内存 索引结构 学习索引 B+树 键值存储
下载PDF
LevelDB架构与相关改进分析 被引量:2
18
作者 俞加平 《无线通信技术》 2020年第2期12-17,共6页
键值数据库是NoSQL数据库中的一种,LevelDB作为典型的键值数据库,其底层采用LSM树作为存储架构,写入性能十分优异,一直是人们研究和改进键值型数据库性能的基准线。本文首先对LevelDB的整体结构做了剖析,并以LevelDB中的重要数据结构和... 键值数据库是NoSQL数据库中的一种,LevelDB作为典型的键值数据库,其底层采用LSM树作为存储架构,写入性能十分优异,一直是人们研究和改进键值型数据库性能的基准线。本文首先对LevelDB的整体结构做了剖析,并以LevelDB中的重要数据结构和读写操作为轴线,详细分析了LevelDB如何实现快速存取的目标。本文接着对当前以LevelDB为代表,基于LSM树存储结构的数据库改进做了深入调查和分类,在对已有技术分析的基础上,指出了非关系型数据库未来可能的研究方向。 展开更多
关键词 键值数据库 LSM树 数据存储 数据检索
下载PDF
基于D维映射的布谷鸟哈希表 被引量:2
19
作者 朱海婷 李男 +3 位作者 张璐 何高峰 宛俊美 邓莹莹 《南京邮电大学学报(自然科学版)》 北大核心 2022年第1期73-80,共8页
哈希的数据结构和算法是海量信息存储的有效方式,特别是对于与网络流量测量、监控和安全相关的应用。目前存在许多哈希表算法,如布谷鸟哈希、Peacock Hash、Link Hash和Double Hash等,但是这些哈希算法仍存在着一些问题,如占用内存空间... 哈希的数据结构和算法是海量信息存储的有效方式,特别是对于与网络流量测量、监控和安全相关的应用。目前存在许多哈希表算法,如布谷鸟哈希、Peacock Hash、Link Hash和Double Hash等,但是这些哈希算法仍存在着一些问题,如占用内存空间过大、插入查找等操作时间过长以及插入过程中遇到死循环而导致插入失败需要进行重新哈希等。针对这些问题,文中提出了基于D维映射的布谷鸟哈希算法,对哈希表进行属性划分,并增加链表结构,然后与辅助数据结构布隆过滤器和位图进行结合,并通过预先识别踢出操作是否有必要来减少不必要的内存访问次数,提高了哈希表的负载因子和插入查找效率。 展开更多
关键词 布谷鸟哈希 D维映射 哈希算法 键值存储
下载PDF
基于SSD的Key-Value系统优化设计与实现 被引量:1
20
作者 刘峪竹 肖侬 +2 位作者 刘芳 陈志广 唐黎哲 《计算机研究与发展》 EI CSCD 北大核心 2014年第S1期136-141,共6页
随着互联网技术的迅猛发展,越来越多的非结构化数据涌入到人们的生活中,为这些数据建立高效的索引面临极大的挑战.键值数据库Key-Value以其结构简单和高扩展性而引起人们的广泛关注,已成为海量数据存储系统中的重要组成部分.由于Key-Va... 随着互联网技术的迅猛发展,越来越多的非结构化数据涌入到人们的生活中,为这些数据建立高效的索引面临极大的挑战.键值数据库Key-Value以其结构简单和高扩展性而引起人们的广泛关注,已成为海量数据存储系统中的重要组成部分.由于Key-Value系统对吞吐量要求较高,而基于Flash的固态硬盘(solid state drive,SSD)能够提供很高的随机读性能,在SSD上构建Key-Value系统已成为海量数据存储领域的一大研究热点.鉴于Flash具有非定点更新、寿命有限等特性,基于SSD的KeyValue系统必须针对Flash的特性作专门优化.以一种称为SkimpyStash的基于SSD的Key-Value系统为基础,提出了一种新的Key-Value系统低延迟存储系统(low latency store,LLStore).LLStore使用内存文件映射技术来减少针对SSD的IO请求,除此之外,针对SkimpyStash中低效的压缩策略,提出一种改进方法,可以在少量增加内存开销的情况下极大地减少查询时间.通过与原系统的性能比较实验,LLStore在平均查询时间上可以获得至少12%的加速. 展开更多
关键词 key-value SSD 数据存储 内存文件映射 压缩
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部