期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
SimK:A Large-Scale Parallel Simulation Engine 被引量:3
1
作者 许建卫 陈明宇 +3 位作者 郑规 曹政 吕慧伟 孙凝晖 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第6期1048-1060,共13页
Simulation is an important method to evaluate future computer systems. Currently microprocessor architecture has switched to parallel, but almost all simulators remained at sequential stage, and the advantages brought... Simulation is an important method to evaluate future computer systems. Currently microprocessor architecture has switched to parallel, but almost all simulators remained at sequential stage, and the advantages brought by multi-core or many-core processors cannot be utilized. This paper presents a parallel simulator engine (SimK) towards the prevalent SMP/CMP platform, aiming at large-scale fine-grained computer system simulation. In this paper, highly efficient synchronization, communication and buffer management policies used in SimK are introduced, and a novel lock-free scheduling mechanism that avoids using any atomic instructions is presented. To deal with the load fluctuation at light load case, a cooperated dynamic task migration scheme is proposed. Based on SimK, we have developed large-scale parallel simulators HppSim and HppNetSim, which simulate a full supercomputer system and its interconnection network respectively. Results show that HppSim and HppNetSim both gain sound speedup with multiple processors, and the best normalized speedup reaches 14.95X on a two-way quad-core server. 展开更多
关键词 large scale system simulation fine-grained synchronization simulation framework lock-free synchronization
原文传递
改进型锁无关双端队列的设计与实现 被引量:4
2
作者 杨东升 张连法 《计算机系统应用》 2012年第3期125-129,共5页
高性能实时系统对系统性能、确定性和容错性有着更高的要求。非阻塞同步在任务同步方面满足要求,实现方法之一就是设计锁无关数据结构。介绍了设计锁无关数据结构算法的关键技术,通过对已有算法不足的分析提出了一种改进型的锁无关双端... 高性能实时系统对系统性能、确定性和容错性有着更高的要求。非阻塞同步在任务同步方面满足要求,实现方法之一就是设计锁无关数据结构。介绍了设计锁无关数据结构算法的关键技术,通过对已有算法不足的分析提出了一种改进型的锁无关双端队列算法,介绍了对该算法的实验分析和实际应用。实验结果表明,该算法提高了访问双端队列的执行速度,并避免了多任务间同步引发的死锁、优先级逆转、低容错性等缺点。 展开更多
关键词 非阻塞同步 锁无关 双端队列 RTAI
下载PDF
供动态无锁数据结构使用的资源窃取型无锁内存池 被引量:1
3
作者 刘恒 杨小帆 《计算机应用研究》 CSCD 北大核心 2012年第10期3772-3775,共4页
动态内存管理的问题对无锁动态数据结构的性能尤为关键,因为多线程环境下的动态内存管理涉及开销较高的同步操作。提出一种构建用于动态无锁数据结构的内存池的方法来减少动态内存使用和与之相伴的动态内存管理开销。该方法通过平衡线... 动态内存管理的问题对无锁动态数据结构的性能尤为关键,因为多线程环境下的动态内存管理涉及开销较高的同步操作。提出一种构建用于动态无锁数据结构的内存池的方法来减少动态内存使用和与之相伴的动态内存管理开销。该方法通过平衡线程的动态内存消耗来减小内存开销,利用本方法构建的内存池基于线程私有的支持节点窃取的无锁循环队列。本方法具有以下优点:a)用本方法构建的内存池是无锁的;b)能够平衡线程的堆内存消耗;c)可以方便地与动态无锁数据结构集成。实验结果显示,用该方法构造的资源窃取型内存池扩展性较强,且能够在高负载下有效降低无锁数据结构的堆内存消耗和操作执行时间;平衡算法在很大程度上决定内存消耗量,内存池在高负载下的扩展性也受到它所用的数据结构自身多线程访问性能的影响。 展开更多
关键词 资源窃取 无锁内存池 无锁 动态无锁数据结构
下载PDF
一种多核环境中无锁的多进程负载均衡会话保持方案 被引量:3
4
作者 吴和生 王崇骏 谢俊元 《电子与信息学报》 EI CSCD 北大核心 2013年第4期982-987,共6页
负载均衡是云计算的基本问题之一,多核环境中多进程负载均衡会话保持问题得到广泛关注并发展成为研究热点。针对该问题,面向Linux内核,基于Hash化管理内核网络数据包传递的思想,该文提出并实现了一种无锁的多进程负载均衡会话保持方案... 负载均衡是云计算的基本问题之一,多核环境中多进程负载均衡会话保持问题得到广泛关注并发展成为研究热点。针对该问题,面向Linux内核,基于Hash化管理内核网络数据包传递的思想,该文提出并实现了一种无锁的多进程负载均衡会话保持方案。该方案避免了锁的使用,而且不需要对原有单进程负载均衡程序进行结构上的修改,能够快速地将现有单进程负载均衡程序转变为多进程架构。理论分析和实验表明,相较于传统的共享内存式锁机制会话保持解决方案,该方案性能更好、适用性更强,提高了多核环境中负载均衡系统的效率。 展开更多
关键词 云计算 多核 多进程 负载均衡 会话保持 无锁
下载PDF
基于优化的CAS算法实现线程安全的HashMap 被引量:2
5
作者 吴恩慈 《软件》 2019年第6期185-190,共6页
HashMap内存数据结构存在相当广泛的应用场景,通过Hash函数的Key直接获取对应的值,能够确保搜索的时间复杂度为O(1)。HashMap数据结构存在哈希冲突与线程安全问题,悲观锁机制实现线程安全的方法存在很大的性能开销。本文提出了基于优化... HashMap内存数据结构存在相当广泛的应用场景,通过Hash函数的Key直接获取对应的值,能够确保搜索的时间复杂度为O(1)。HashMap数据结构存在哈希冲突与线程安全问题,悲观锁机制实现线程安全的方法存在很大的性能开销。本文提出了基于优化的CAS算法,实现线程安全的哈希映射数据结构,内部采用数组、链表和红黑树实现了高并发环境下读写操作。通过增加版本戳避免CAS算法的ABA问题,CAS算法实现的无锁方式避免了锁竞争的开销,使用红黑树来优化链表,确保大规模数据集的检索时间复杂度保持O(logn)。支持多线程扩容操作,在执行效率方面有良好的表现。通过大规模的并发压力测试,验证了该数据结构在性能上有稳定的提升。 展开更多
关键词 无锁机制 分段锁 CAS算法优化 红黑树 线程安全
下载PDF
基于图形处理器的高性能跳表(Skiplist)数据结构 被引量:2
6
作者 李怀明 邓仰东 《微电子学与计算机》 CSCD 北大核心 2014年第12期1-5,共5页
提出了一种高效率、适合GPU的跳表结构及其相应例程,核心思想是将包含指针的操作转化为数组操作,从而充分发挥GPU的计算能力.实验结果证明,该数据结构的插入和删除操作相对目前最好的GPU结果分别改善6.8倍和9.6倍.
关键词 跳表 图形处理器 并行数据结构 无锁
下载PDF
一种采用消隐技术的锁无关栈算法 被引量:2
7
作者 张连法 杨东升 秦承刚 《小型微型计算机系统》 CSCD 北大核心 2013年第6期1349-1353,共5页
随着对实时系统的实时性和系统服务要求的不断提高,基于多核/多处理器硬件平台的实时系统成为发展趋势.相应的高性能实时操作系统需具有更高的硬实时性和可靠性,并避免优先级逆转、死锁.相比阻塞同步,非阻塞同步在提高实时系统性能、确... 随着对实时系统的实时性和系统服务要求的不断提高,基于多核/多处理器硬件平台的实时系统成为发展趋势.相应的高性能实时操作系统需具有更高的硬实时性和可靠性,并避免优先级逆转、死锁.相比阻塞同步,非阻塞同步在提高实时系统性能、确定性和容错性等方面具有优势,有利于实现上述要求.设计锁无关数据结构是实现非阻塞同步的方法之一.文章介绍了锁无关算法的基本结构,提出一种采用消隐技术的锁无关栈算法及证明锁无关算法正确性的理论方法,并证明了该锁无关栈算法的正确性.实验结果表明,该算法提高了访问共享数据的执行速度,并避免了死锁、优先级逆转、低容错性等缺点. 展开更多
关键词 非阻塞同步 锁无关 消隐技术 状态转换图
下载PDF
基于Transpose规则的无锁自组织链表算法 被引量:2
8
作者 孙静 张亚平 +1 位作者 李鹏飞 张坤龙 《计算机工程》 CAS CSCD 北大核心 2017年第9期23-28,共6页
自组织链表可以依据访问序列动态调整链表结构,提高链表性能。在分析并研究现有自组织链表算法的基础上,结合Transpose规则,提出无锁自组织链表算法。线程可标记被访问的结点并尝试与标记结点前驱相交换,也可直接物理删除已被标记的结点... 自组织链表可以依据访问序列动态调整链表结构,提高链表性能。在分析并研究现有自组织链表算法的基础上,结合Transpose规则,提出无锁自组织链表算法。线程可标记被访问的结点并尝试与标记结点前驱相交换,也可直接物理删除已被标记的结点,同时其他线程发现该标记结点时会辅助该线程完成相应操作,从而保证链表的非阻塞特性。实验结果表明,该算法性能与Harris-Michael链表算法相当,并且其无锁实现方式比粗粒度锁算法更具优势。 展开更多
关键词 并发 自组织 链表 无锁 Transpose规则
下载PDF
无锁并发二叉搜索树的实现 被引量:1
9
作者 刘少东 邢永康 刘恒 《计算机应用》 CSCD 北大核心 2012年第10期2736-2741,共6页
针对异步共享内存模型下的并发搜索二叉树(BST)数据结构,提出了一种新的无锁实现方法。通过一种有效的节点重用策略,使得删除操作是无等待的,插入操作是无锁的。实验数据表明,该数据结构是高度可扩展的而且在高负载下能提供很高的吞吐量。
关键词 无锁搜索二叉树 无锁 无等待 可扩展 高吞吐量
下载PDF
非阻塞同步在嵌入式操作系统中的实现 被引量:1
10
作者 张丽 王兴 +1 位作者 郝身刚 彭蔓蔓 《计算机工程》 EI CAS CSCD 北大核心 2005年第21期84-86,共3页
提出了把非阻塞同步机制应用于嵌入式操作系统的新设想,同时通过修改嵌入式操作系统内核源码的方法对其进行了实现。针对内核中共享资源的不同特点,综合使用了锁自由和等待自由两种不同性质的非阻塞同步策略,同时改进了锁自由的同步算法... 提出了把非阻塞同步机制应用于嵌入式操作系统的新设想,同时通过修改嵌入式操作系统内核源码的方法对其进行了实现。针对内核中共享资源的不同特点,综合使用了锁自由和等待自由两种不同性质的非阻塞同步策略,同时改进了锁自由的同步算法,并对原有的等待自由同步算法进行简化,使新内核具有较小的同步开销和较好的实时性能。 展开更多
关键词 非阻塞同步 嵌入式操作系统 锁自由 等待自由
下载PDF
A New Rectangular Finite Element Formulation Based on Higher Order Displacement Theory for Thick and Thin Composite and Sandwich Plates
11
作者 Sanjib Goswami Wilfried Becker 《World Journal of Mechanics》 2013年第3期194-201,共8页
A new displacement based higher order element has been formulated that is ideally suitable for shear deformable composite and sandwich plates. Suitable functions for displacements and rotations for each node have been... A new displacement based higher order element has been formulated that is ideally suitable for shear deformable composite and sandwich plates. Suitable functions for displacements and rotations for each node have been selected so that the element shows rapid convergence, an excellent response against transverse shear loading and requires no shear correction factors. It is completely lock-free and behaves extremely well for thin to thick plates. To make the element rapidly convergent and to capture warping effects for composites, higher order displacement terms in the displacement kinematics have been considered for each node. The element has eleven degrees of freedom per node. Shear deformation has also been considered in the formulation by taking into account shear strains ( rxz and ryz) as nodal unknowns. The element is very simple to formulate and could be coded up in research software. A small Fortran code has been developed to implement the element and various examples of isotropic and composite plates have been analyzed to show the effectiveness of the element. 展开更多
关键词 Finite Element DISPLACEMENT Approach Plate Bending COMPOSITE Shear Deformation Higher Order THEORY lock-free
下载PDF
面向GPU的内存管理与应用 被引量:1
12
作者 徐延东 华蓓 《电子技术(上海)》 2017年第7期86-90,83,共6页
随着GPU的计算能力、访存能力和设备内存容量的不断提高,将GPU作为独立的数据存储节点来使用正在成为可能。动态内存管理是数据存储节点的必备功能,但是大量的并发线程以及单指令流多数据流的执行方式,使得GPU上的动态内存分配面临冲突... 随着GPU的计算能力、访存能力和设备内存容量的不断提高,将GPU作为独立的数据存储节点来使用正在成为可能。动态内存管理是数据存储节点的必备功能,但是大量的并发线程以及单指令流多数据流的执行方式,使得GPU上的动态内存分配面临冲突率高、线程阻塞严重等问题。本文针对GPU体系结构特点以及数据存储类应用对设备内存管理的需求,在NVIDIA GPU上设计并实现了一个GPU设备内存管理器,可有效降低内存分配竞争,并提高内存分配速度。基于所设计的设备内存管理方案,本文将一个无锁哈希表实现移植到了GPU上,以加速GPU上的索引操作。实验表明,本文实现的GPU内存管理器和无锁哈希表具有较好的性能。 展开更多
关键词 GPU通用计算 内存管理 无锁编程
原文传递
快速时代回收:一种针对无锁编程的快速垃圾回收算法 被引量:1
13
作者 彭建章 顾乃杰 +2 位作者 张旭 张颖楠 魏振伟 《小型微型计算机系统》 CSCD 北大核心 2013年第12期2691-2695,共5页
在多核、众核时代,并行编程模型如软件事务内存、无锁编程等成为研究热点.无锁编程技术使得多个线程无需加锁即可并发访问同一个数据结构成为可能,该技术已被证明能够有效地提升程序的性能.实现无锁算法的一个关键的技术是垃圾回收.时... 在多核、众核时代,并行编程模型如软件事务内存、无锁编程等成为研究热点.无锁编程技术使得多个线程无需加锁即可并发访问同一个数据结构成为可能,该技术已被证明能够有效地提升程序的性能.实现无锁算法的一个关键的技术是垃圾回收.时代回收算法是一种高效、易用的垃圾回收算法,但其回收速度受制于最慢的线程,在极端情况下该算法完全停滞,难以在实际情况下使用.本文针对时代回收算法的不足,在其基础上提出了快速时代回收算法,新算法的回收速度与最快线程保持一致,在测试中回收成功率为100%,实验证明快速时代回收算法一种适用于无锁编程的快速实用的垃圾回收算法. 展开更多
关键词 无锁编程 垃圾回收 CAS 时代回收算法 快速时代回收算法
下载PDF
无锁编程的探索与研究
14
作者 郭加盛 李健 《网络安全技术与应用》 2011年第2期72-73,共2页
在计算机多核技术迅速发展的时代,线程的优势越来越明显,多线程的学习成为每个程序员必备的基础。但在实际开发过程中,越来越多的异常,越来越多的死锁现象让每个程序员崩溃不已,线程与锁的问题凸显在每个程序员的面前。加锁技术大量应... 在计算机多核技术迅速发展的时代,线程的优势越来越明显,多线程的学习成为每个程序员必备的基础。但在实际开发过程中,越来越多的异常,越来越多的死锁现象让每个程序员崩溃不已,线程与锁的问题凸显在每个程序员的面前。加锁技术大量应用于多线程技术的开发中,但由于加锁技术较为复杂,且调试困难,程序员们更加期望从另一个角度来缓解问题。Lock-free概念应运而生。 展开更多
关键词 无锁编程 进程 锁技术 多线程编程 原子操作
原文传递
一个应力边界条件下平面弹性问题的Locking-free有限元方法
15
作者 陈孝平 向中义 《湖北民族学院学报(自然科学版)》 CAS 2007年第3期255-259,共5页
用非协调有限元方法解决应力边界条件下平面弹性问题Locking现象,给出了新的非协调有限元格多,证明了此格式的收敛性,并给出了最优的误差估计.
关键词 非协调有限元 lock-free 平面弹性
下载PDF
ALFHJ:一种面向众核协处理器的自适应无锁哈希连接算法
16
作者 周开来 陈红 +2 位作者 孙辉 李翠平 董兆安 《计算机学报》 EI CSCD 北大核心 2017年第10期2404-2420,共17页
众核协处理器因其良好的并行计算能力和能源效率,正成为当前高性能计算普遍采用的加速设备.无划分哈希连接算法是多核平台上一种简单高效的连接算法,但随着众核上并发线程数的增加,其共享哈希表的锁同步问题正成为算法并行化的瓶颈.为... 众核协处理器因其良好的并行计算能力和能源效率,正成为当前高性能计算普遍采用的加速设备.无划分哈希连接算法是多核平台上一种简单高效的连接算法,但随着众核上并发线程数的增加,其共享哈希表的锁同步问题正成为算法并行化的瓶颈.为解决上述问题,该文提出一种面向众核协处理器的自适应无锁哈希连接算法ALFHJ.该算法通过评估数据集的潜在冲突度动态调整算法参数及处理流程,支持基于CAS(比较与交换)原子操作的无锁共享哈希表构建,并利用SIMD指令进行哈希表探测.同时,该文进行了热点代码分析,讨论了一致性问题、ABA问题以及收敛性问题.在Xeon Phi上的实验结果表明,相比最新的基于锁同步的NPO(优化的无分区哈希连接)算法,ALFHJ算法有以下两点优势:(1)在提高哈希表空间利用率的同时,更能保持性能的相对稳定;(2)并行执行时间对于均匀数据集减少约10%,对于倾斜数据集减少约30%~50%. 展开更多
关键词 哈希连接 无锁 众核 协处理器 比较与交换
下载PDF
C^(++)并发引用计数垃圾收集器实现
17
作者 贺建立 《安庆师范学院学报(自然科学版)》 2014年第3期54-58,共5页
引用计数垃圾收集器通常具有增量式和实时性特征,但存在垃圾收集器中断执行程序时间较长的情况。本文实现了一个并发引用计数垃圾收集器,使得垃圾收集器和工作程序并发执行,避免了垃圾收集器中断执行程序。基于C++的语法标准和应用编程... 引用计数垃圾收集器通常具有增量式和实时性特征,但存在垃圾收集器中断执行程序时间较长的情况。本文实现了一个并发引用计数垃圾收集器,使得垃圾收集器和工作程序并发执行,避免了垃圾收集器中断执行程序。基于C++的语法标准和应用编程接口,无需修改编译器和存储分配器,且收集器和工作程序的同步是锁免除的。Linux操作系统中的实现和实验表明,收集器有极低(低于0.2%)的处理器损失。 展开更多
关键词 引用计数 垃圾收集 工作程序 并发 锁免除
下载PDF
面向高速实时数据处理的无锁内存分配算法
18
作者 李文浩 方景龙 《杭州电子科技大学学报(自然科学版)》 2020年第4期57-62,共6页
为了提高高并发生产环境下内存分配的效率,针对高速实时数据处理程序的高并发、高频内存分配等特点,采用一种无锁内存分配算法(Lock Free Memory Allocation, LFMA)来提高并发度及内存分配效率。针对伙伴(Buddy)算法的不足,使用位图替... 为了提高高并发生产环境下内存分配的效率,针对高速实时数据处理程序的高并发、高频内存分配等特点,采用一种无锁内存分配算法(Lock Free Memory Allocation, LFMA)来提高并发度及内存分配效率。针对伙伴(Buddy)算法的不足,使用位图替代链表,并结合原子操作来达到线程间无锁并发访问,同时降低了缓存未命中的概率。引入多级位图来提高空闲内存块的搜索效率,通过渐进式重合并算法避免Buddy算法频繁拆合带来的效率问题,并降低了外部碎片。实验结果表明,相较于Buddy算法,新算法的分配效率在单线程下提升约31%,在多线程下提升约27%。 展开更多
关键词 Buddy算法 内存分配 无锁 渐进式重合并
下载PDF
多线程应用中的定时器管理算法 被引量:8
19
作者 姚崇华 姜新红 +1 位作者 程凌宇 程永裕 《计算机工程》 CAS CSCD 北大核心 2010年第2期75-77,共3页
针对高性能电信系统中软定时器效率低下的问题,提出一系列优化方案,采用二次散列的时间轮,并结合免锁算法的低粒度互斥锁,从理论上把定时器查询和定时器插入等常用操作的复杂度从O(n)降至最优情况的O(1)。通过真实高负荷进行测试,采用Su... 针对高性能电信系统中软定时器效率低下的问题,提出一系列优化方案,采用二次散列的时间轮,并结合免锁算法的低粒度互斥锁,从理论上把定时器查询和定时器插入等常用操作的复杂度从O(n)降至最优情况的O(1)。通过真实高负荷进行测试,采用SunStudio11性能分析工具对优化前后的性能进行定量分析。实验结果表明,该优化方案能够有效提高系统效率。 展开更多
关键词 时间轮 二次散列 粒度 免锁算法
下载PDF
基于无锁数据结构的FIFO队列算法 被引量:8
20
作者 王俊昌 王振 付雄 《计算机工程》 CAS CSCD 北大核心 2018年第8期315-320,共6页
现代商用多核处理器缺少硬件支持的处理核间通信机制,多个处理核间必须通过加锁保护的共享内存传递数据。为此,设计一种基于软件的无锁队列作为核间通信机制,通过无锁数据结构提高软件队列的性能。当数据到达速率较低时,队列自适应地减... 现代商用多核处理器缺少硬件支持的处理核间通信机制,多个处理核间必须通过加锁保护的共享内存传递数据。为此,设计一种基于软件的无锁队列作为核间通信机制,通过无锁数据结构提高软件队列的性能。当数据到达速率较低时,队列自适应地减小队列长度,从而占用较小的内存空间,进而更好地利用处理器高速缓存;当数据到达速率较高时,队列自适应地增加队列长度,以避免数据丢失。实验结果表明,在数据到达速率变化较大的实际应用场景中,该队列较FastForward、MCRingBuffer和B-Queue队列具有更高的数据处理性能。 展开更多
关键词 无锁数据结构 多核处理 流水线并行 自适应调整 CPU核间通信
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部