期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于推理多线程技术的一种改进模型
1
作者 王成良 吴渝 《沈阳工业大学学报》 EI CAS 2007年第2期197-200,共4页
为了解决多线程处理器不同线程之间并行性低、相互之间数据依赖性高的问题,在推理多线程技术基础上提出了一种新的多线程技术模型(分级多线程Hierarchical Multithreading HMT).该模型采用两种等级处理元的方法,低等级使用指令级并行和... 为了解决多线程处理器不同线程之间并行性低、相互之间数据依赖性高的问题,在推理多线程技术基础上提出了一种新的多线程技术模型(分级多线程Hierarchical Multithreading HMT).该模型采用两种等级处理元的方法,低等级使用指令级并行和细粒度线程级并行;高等级更多地使用间隔并行机制.通过详细的模拟研究,证明分级多线程技术通过对线程的不同粒度采用并行机制能够切实可行地提高线程之间的并行性. 展开更多
关键词 粒度 并行 超任务 处理 处理 任务分配单
下载PDF
一种基于PIM技术的SIMD核设计
2
作者 王光 《中国科学技术大学学报》 CAS CSCD 北大核心 2013年第7期599-602,共4页
基于PIM技术的SIMD核体系结构模型,对微体系进行了详细设计.采用硬件语言Verilog对体系结构各个部分进行了设计实现,并利用Xilinx ISE进行软件仿真,通过仿真波形验证功能的正确性.一方面利用PIM技术提高数据访问带宽,降低了数据访问延时... 基于PIM技术的SIMD核体系结构模型,对微体系进行了详细设计.采用硬件语言Verilog对体系结构各个部分进行了设计实现,并利用Xilinx ISE进行软件仿真,通过仿真波形验证功能的正确性.一方面利用PIM技术提高数据访问带宽,降低了数据访问延时;另一方面充分利用PIM技术所带来的高数据带宽,提高了整个系统性能. 展开更多
关键词 PIM SIMD 控制器 处理 可重构总线
下载PDF
数据缓冲器的低功耗设计
3
作者 李莉 沈绪榜 +2 位作者 钱刚 许琪 王忠 《计算机研究与发展》 EI CSCD 北大核心 2004年第4期761-766,共6页
首先介绍“九五”期间研制的LSMPP协处理器的数据缓冲器的功能与设计 ,并从降低活动因子的角度提出了一种针对低功耗的改进 ,如果阵列的大小为N×N ,则功耗可以降低到“九五”期间方案的 1/N 然后又提出一种针对引出头的减少的改... 首先介绍“九五”期间研制的LSMPP协处理器的数据缓冲器的功能与设计 ,并从降低活动因子的角度提出了一种针对低功耗的改进 ,如果阵列的大小为N×N ,则功耗可以降低到“九五”期间方案的 1/N 然后又提出一种针对引出头的减少的改进方法 ,引出头的减少是与互连方案有关的 ,一路串行互连方案可以减少 4N个 ,两路并行互连方案可以减少 8N个 最后提出了一种新的数据缓冲器的设计方案 ,每一时刻只有一个PE的数据缓冲器是传送数据的 ,功耗降低为“九五”期间方案的 1/ (N×N) 。 展开更多
关键词 数据缓冲器 处理 阵列 低功耗 门控时钟
下载PDF
高性能嵌入式图像处理系统研究 被引量:8
4
作者 段宗涛 沙爱民 张燕妮 《微电子学与计算机》 CSCD 北大核心 2008年第6期38-41,共4页
为了提高计算机视觉中图像处理的速度,深入分析了计算机视觉中图像处理的三个层次的并行计算特征.以数据并行的处理元阵列芯片为基础,通过对其进行不同组合得到高性能嵌入式图像处理系统.该系统为图像处理提供了不同层次的数据并行性和... 为了提高计算机视觉中图像处理的速度,深入分析了计算机视觉中图像处理的三个层次的并行计算特征.以数据并行的处理元阵列芯片为基础,通过对其进行不同组合得到高性能嵌入式图像处理系统.该系统为图像处理提供了不同层次的数据并行性和任务并行性,满足了图像处理对并行计算的需求,为实时嵌入式图像处理提供了较高的计算性能.此外,处理元阵列芯片的实现方式又保证了其具有较小的体积,满足了嵌入性的要求. 展开更多
关键词 嵌入式处理 并行计算 处理阵列 图像处理
下载PDF
嵌入式协处理器中除法和平方根计算的整合设计 被引量:2
5
作者 梁政 沈绪榜 《计算机研究与发展》 EI CSCD 北大核心 2001年第8期1016-1020,共5页
在浮点处理元中串行实现除法和平方根计算虽然速度慢 ,但设计简单规则 ,占用资源少 ,有利于嵌入式的应用 .结合嵌入式协处理器 L SC87的研制 ,给出了串行实现除法和平方根计算的基 4SRT算法 ,介绍了确定 SRT选择常数过程中不确定区域的... 在浮点处理元中串行实现除法和平方根计算虽然速度慢 ,但设计简单规则 ,占用资源少 ,有利于嵌入式的应用 .结合嵌入式协处理器 L SC87的研制 ,给出了串行实现除法和平方根计算的基 4SRT算法 ,介绍了确定 SRT选择常数过程中不确定区域的验证方法 ;给出了除法与平方根计算可共用的基 4SRT查询表设计 ;同时讨论了迭代冗余结果向非冗余二进制的转换 .本协处理器设计最大限度地利用了通用数据路径来完成 SRT算法的实现 ,节约了设计资源 。 展开更多
关键词 超大规模集成电路 除法 平方根 嵌入式协处理 整合设计 浮点处理
下载PDF
基于SIMD—PRAM模型的分块图像匹配算法设计 被引量:2
6
作者 张文君 缪栋 +1 位作者 付光远 杨小冈 《计算机工程与应用》 CSCD 北大核心 2003年第3期75-77,共3页
该文研究了基于SIMD—PRAM计算模型的有限处理元阵列规模的并行计算算法设计,分析了求阵列和的并行算法性能,运用求阵列和、图像分块映射与四邻平移等方法提出了一种根据处理元局部可用资源进行分块计算的图像匹配算法。计算机模拟实验... 该文研究了基于SIMD—PRAM计算模型的有限处理元阵列规模的并行计算算法设计,分析了求阵列和的并行算法性能,运用求阵列和、图像分块映射与四邻平移等方法提出了一种根据处理元局部可用资源进行分块计算的图像匹配算法。计算机模拟实验结果表明,该算法完整、高效地执行了图像匹配,具有良好的并行计算性能。 展开更多
关键词 SIMD-PRAM模型 设计 处理阵列 并行算法 分块图像匹配算法 图像处理 计算机
下载PDF
卷积计算的数据并行实现方法
7
作者 赵晓红 张发存 +1 位作者 王忠 沈绪榜 《微电子学与计算机》 CSCD 北大核心 2003年第B12期4-7,共4页
基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积。对于N×N的图像M×M(M<N)的模板,卷积算法在单处理机上用传统的方法实现需要O(N^2M^2)时间。显然它应当采用数据并行的处理方法来... 基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积。对于N×N的图像M×M(M<N)的模板,卷积算法在单处理机上用传统的方法实现需要O(N^2M^2)时间。显然它应当采用数据并行的处理方法来实现。本文较详细地讨论了卷积算法在局部寄存器个数受限与不受限情况下的两维处理元阵列的数据并行实现方法,提出了一种适用于具有有限局部寄存器的-维处理元阵列的卷积并行算法,并对算法的复杂度进行了分析。 展开更多
关键词 卷积计算 数据并行 二维处理阵列 一维处理阵列 局部线性滤波函数 图像处理 算法 复杂度
下载PDF
列缓冲器和处理元芯片的整合设计
8
作者 李莉 钱刚 沈绪榜 《微电子学与计算机》 CSCD 北大核心 2003年第3期73-76,共4页
文章首先介绍了LSSIMD微处理器的存储器通信指令功能。它作为独立的芯片实现,带来了较难解决的时序和同步问题。文章就两种情况对这个问题进行了较详细的阐述,从而提出整合设计的必要性。并提出了一种列缓冲器与PE芯片的整合设计的方法... 文章首先介绍了LSSIMD微处理器的存储器通信指令功能。它作为独立的芯片实现,带来了较难解决的时序和同步问题。文章就两种情况对这个问题进行了较详细的阐述,从而提出整合设计的必要性。并提出了一种列缓冲器与PE芯片的整合设计的方法,以克服时序问题和同步问题,突出了系统集成的设计思想。 展开更多
关键词 列缓冲器 处理芯片 整合设计 处理 PE芯片
下载PDF
基于LS-SIMD的奇偶比较交换排序算法
9
作者 王馨梅 张翔 +1 位作者 张发存 崔杜武 《计算机工程》 CAS CSCD 北大核心 2004年第13期52-53,F003,共3页
研究并实现了在LS-SIMD计算机上基于奇偶比较方法的按行或按列数据并行排序算法,并对算法的计算复杂性和通信复杂性进行了分析。该研究对于扩展LS SIMD计算机在非数值计算方面的应用有着十分重要的实际意义。
关键词 SIMD 奇偶比较交换 处理阵列
下载PDF
数据并行计算机体系结构研究
10
作者 王鹏飞 张发存 段敬红 《计算机工程》 CAS CSCD 北大核心 2011年第15期249-251,共3页
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能... 通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程。 展开更多
关键词 PIM技术 数据并行体系结构 可重构总线 处理阵列 指令集体系结构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部