期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
10
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于推理多线程技术的一种改进模型
1
作者
王成良
吴渝
《沈阳工业大学学报》
EI
CAS
2007年第2期197-200,共4页
为了解决多线程处理器不同线程之间并行性低、相互之间数据依赖性高的问题,在推理多线程技术基础上提出了一种新的多线程技术模型(分级多线程Hierarchical Multithreading HMT).该模型采用两种等级处理元的方法,低等级使用指令级并行和...
为了解决多线程处理器不同线程之间并行性低、相互之间数据依赖性高的问题,在推理多线程技术基础上提出了一种新的多线程技术模型(分级多线程Hierarchical Multithreading HMT).该模型采用两种等级处理元的方法,低等级使用指令级并行和细粒度线程级并行;高等级更多地使用间隔并行机制.通过详细的模拟研究,证明分级多线程技术通过对线程的不同粒度采用并行机制能够切实可行地提高线程之间的并行性.
展开更多
关键词
粒度
并行
超任务
处理
元
超
处理
元
任务分配单
元
下载PDF
职称材料
一种基于PIM技术的SIMD核设计
2
作者
王光
《中国科学技术大学学报》
CAS
CSCD
北大核心
2013年第7期599-602,共4页
基于PIM技术的SIMD核体系结构模型,对微体系进行了详细设计.采用硬件语言Verilog对体系结构各个部分进行了设计实现,并利用Xilinx ISE进行软件仿真,通过仿真波形验证功能的正确性.一方面利用PIM技术提高数据访问带宽,降低了数据访问延时...
基于PIM技术的SIMD核体系结构模型,对微体系进行了详细设计.采用硬件语言Verilog对体系结构各个部分进行了设计实现,并利用Xilinx ISE进行软件仿真,通过仿真波形验证功能的正确性.一方面利用PIM技术提高数据访问带宽,降低了数据访问延时;另一方面充分利用PIM技术所带来的高数据带宽,提高了整个系统性能.
展开更多
关键词
PIM
SIMD
控制器
处理
元
可重构总线
下载PDF
职称材料
数据缓冲器的低功耗设计
3
作者
李莉
沈绪榜
+2 位作者
钱刚
许琪
王忠
《计算机研究与发展》
EI
CSCD
北大核心
2004年第4期761-766,共6页
首先介绍“九五”期间研制的LSMPP协处理器的数据缓冲器的功能与设计 ,并从降低活动因子的角度提出了一种针对低功耗的改进 ,如果阵列的大小为N×N ,则功耗可以降低到“九五”期间方案的 1/N 然后又提出一种针对引出头的减少的改...
首先介绍“九五”期间研制的LSMPP协处理器的数据缓冲器的功能与设计 ,并从降低活动因子的角度提出了一种针对低功耗的改进 ,如果阵列的大小为N×N ,则功耗可以降低到“九五”期间方案的 1/N 然后又提出一种针对引出头的减少的改进方法 ,引出头的减少是与互连方案有关的 ,一路串行互连方案可以减少 4N个 ,两路并行互连方案可以减少 8N个 最后提出了一种新的数据缓冲器的设计方案 ,每一时刻只有一个PE的数据缓冲器是传送数据的 ,功耗降低为“九五”期间方案的 1/ (N×N) 。
展开更多
关键词
数据缓冲器
处理
元
阵列
低功耗
门控时钟
下载PDF
职称材料
高性能嵌入式图像处理系统研究
被引量:
8
4
作者
段宗涛
沙爱民
张燕妮
《微电子学与计算机》
CSCD
北大核心
2008年第6期38-41,共4页
为了提高计算机视觉中图像处理的速度,深入分析了计算机视觉中图像处理的三个层次的并行计算特征.以数据并行的处理元阵列芯片为基础,通过对其进行不同组合得到高性能嵌入式图像处理系统.该系统为图像处理提供了不同层次的数据并行性和...
为了提高计算机视觉中图像处理的速度,深入分析了计算机视觉中图像处理的三个层次的并行计算特征.以数据并行的处理元阵列芯片为基础,通过对其进行不同组合得到高性能嵌入式图像处理系统.该系统为图像处理提供了不同层次的数据并行性和任务并行性,满足了图像处理对并行计算的需求,为实时嵌入式图像处理提供了较高的计算性能.此外,处理元阵列芯片的实现方式又保证了其具有较小的体积,满足了嵌入性的要求.
展开更多
关键词
嵌入式
处理
器
并行计算
处理
元
阵列
图像
处理
器
下载PDF
职称材料
嵌入式协处理器中除法和平方根计算的整合设计
被引量:
2
5
作者
梁政
沈绪榜
《计算机研究与发展》
EI
CSCD
北大核心
2001年第8期1016-1020,共5页
在浮点处理元中串行实现除法和平方根计算虽然速度慢 ,但设计简单规则 ,占用资源少 ,有利于嵌入式的应用 .结合嵌入式协处理器 L SC87的研制 ,给出了串行实现除法和平方根计算的基 4SRT算法 ,介绍了确定 SRT选择常数过程中不确定区域的...
在浮点处理元中串行实现除法和平方根计算虽然速度慢 ,但设计简单规则 ,占用资源少 ,有利于嵌入式的应用 .结合嵌入式协处理器 L SC87的研制 ,给出了串行实现除法和平方根计算的基 4SRT算法 ,介绍了确定 SRT选择常数过程中不确定区域的验证方法 ;给出了除法与平方根计算可共用的基 4SRT查询表设计 ;同时讨论了迭代冗余结果向非冗余二进制的转换 .本协处理器设计最大限度地利用了通用数据路径来完成 SRT算法的实现 ,节约了设计资源 。
展开更多
关键词
超大规模集成电路
除法
平方根
嵌入式协
处理
器
整合设计
浮点
处理
元
下载PDF
职称材料
基于SIMD—PRAM模型的分块图像匹配算法设计
被引量:
2
6
作者
张文君
缪栋
+1 位作者
付光远
杨小冈
《计算机工程与应用》
CSCD
北大核心
2003年第3期75-77,共3页
该文研究了基于SIMD—PRAM计算模型的有限处理元阵列规模的并行计算算法设计,分析了求阵列和的并行算法性能,运用求阵列和、图像分块映射与四邻平移等方法提出了一种根据处理元局部可用资源进行分块计算的图像匹配算法。计算机模拟实验...
该文研究了基于SIMD—PRAM计算模型的有限处理元阵列规模的并行计算算法设计,分析了求阵列和的并行算法性能,运用求阵列和、图像分块映射与四邻平移等方法提出了一种根据处理元局部可用资源进行分块计算的图像匹配算法。计算机模拟实验结果表明,该算法完整、高效地执行了图像匹配,具有良好的并行计算性能。
展开更多
关键词
SIMD-PRAM模型
设计
处理
元
阵列
并行算法
分块图像匹配算法
图像
处理
计算机
下载PDF
职称材料
卷积计算的数据并行实现方法
7
作者
赵晓红
张发存
+1 位作者
王忠
沈绪榜
《微电子学与计算机》
CSCD
北大核心
2003年第B12期4-7,共4页
基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积。对于N×N的图像M×M(M<N)的模板,卷积算法在单处理机上用传统的方法实现需要O(N^2M^2)时间。显然它应当采用数据并行的处理方法来...
基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积。对于N×N的图像M×M(M<N)的模板,卷积算法在单处理机上用传统的方法实现需要O(N^2M^2)时间。显然它应当采用数据并行的处理方法来实现。本文较详细地讨论了卷积算法在局部寄存器个数受限与不受限情况下的两维处理元阵列的数据并行实现方法,提出了一种适用于具有有限局部寄存器的-维处理元阵列的卷积并行算法,并对算法的复杂度进行了分析。
展开更多
关键词
卷积计算
数据并行
二维
处理
元
阵列
一维
处理
元
阵列
局部线性滤波函数
图像
处理
算法
复杂度
下载PDF
职称材料
列缓冲器和处理元芯片的整合设计
8
作者
李莉
钱刚
沈绪榜
《微电子学与计算机》
CSCD
北大核心
2003年第3期73-76,共4页
文章首先介绍了LSSIMD微处理器的存储器通信指令功能。它作为独立的芯片实现,带来了较难解决的时序和同步问题。文章就两种情况对这个问题进行了较详细的阐述,从而提出整合设计的必要性。并提出了一种列缓冲器与PE芯片的整合设计的方法...
文章首先介绍了LSSIMD微处理器的存储器通信指令功能。它作为独立的芯片实现,带来了较难解决的时序和同步问题。文章就两种情况对这个问题进行了较详细的阐述,从而提出整合设计的必要性。并提出了一种列缓冲器与PE芯片的整合设计的方法,以克服时序问题和同步问题,突出了系统集成的设计思想。
展开更多
关键词
列缓冲器
处理
元
芯片
整合设计
微
处理
器
PE芯片
下载PDF
职称材料
基于LS-SIMD的奇偶比较交换排序算法
9
作者
王馨梅
张翔
+1 位作者
张发存
崔杜武
《计算机工程》
CAS
CSCD
北大核心
2004年第13期52-53,F003,共3页
研究并实现了在LS-SIMD计算机上基于奇偶比较方法的按行或按列数据并行排序算法,并对算法的计算复杂性和通信复杂性进行了分析。该研究对于扩展LS SIMD计算机在非数值计算方面的应用有着十分重要的实际意义。
关键词
SIMD
奇偶比较交换
处理
元
阵列
下载PDF
职称材料
数据并行计算机体系结构研究
10
作者
王鹏飞
张发存
段敬红
《计算机工程》
CAS
CSCD
北大核心
2011年第15期249-251,共3页
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能...
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程。
展开更多
关键词
PIM技术
数据并行体系结构
可重构总线
处理
元
阵列
指令集体系结构
下载PDF
职称材料
题名
基于推理多线程技术的一种改进模型
1
作者
王成良
吴渝
机构
重庆大学软件学院
出处
《沈阳工业大学学报》
EI
CAS
2007年第2期197-200,共4页
文摘
为了解决多线程处理器不同线程之间并行性低、相互之间数据依赖性高的问题,在推理多线程技术基础上提出了一种新的多线程技术模型(分级多线程Hierarchical Multithreading HMT).该模型采用两种等级处理元的方法,低等级使用指令级并行和细粒度线程级并行;高等级更多地使用间隔并行机制.通过详细的模拟研究,证明分级多线程技术通过对线程的不同粒度采用并行机制能够切实可行地提高线程之间的并行性.
关键词
粒度
并行
超任务
处理
元
超
处理
元
任务分配单
元
Keywords
granularity
parallelism
supertask
processing element
superPE
TAU
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于PIM技术的SIMD核设计
2
作者
王光
机构
西安文理学院软件学院
出处
《中国科学技术大学学报》
CAS
CSCD
北大核心
2013年第7期599-602,共4页
基金
陕西省自然科学基础研究计划(2010JM8042)
陕西省教育厅科研项目(2010JK795)资助
文摘
基于PIM技术的SIMD核体系结构模型,对微体系进行了详细设计.采用硬件语言Verilog对体系结构各个部分进行了设计实现,并利用Xilinx ISE进行软件仿真,通过仿真波形验证功能的正确性.一方面利用PIM技术提高数据访问带宽,降低了数据访问延时;另一方面充分利用PIM技术所带来的高数据带宽,提高了整个系统性能.
关键词
PIM
SIMD
控制器
处理
元
可重构总线
Keywords
PIM
SIMD
controller
PE
reconfigurable bus
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
数据缓冲器的低功耗设计
3
作者
李莉
沈绪榜
钱刚
许琪
王忠
机构
西安微电子技术研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第4期761-766,共6页
基金
航天部"九五"课题基金项目 (4 5 7 1)
文摘
首先介绍“九五”期间研制的LSMPP协处理器的数据缓冲器的功能与设计 ,并从降低活动因子的角度提出了一种针对低功耗的改进 ,如果阵列的大小为N×N ,则功耗可以降低到“九五”期间方案的 1/N 然后又提出一种针对引出头的减少的改进方法 ,引出头的减少是与互连方案有关的 ,一路串行互连方案可以减少 4N个 ,两路并行互连方案可以减少 8N个 最后提出了一种新的数据缓冲器的设计方案 ,每一时刻只有一个PE的数据缓冲器是传送数据的 ,功耗降低为“九五”期间方案的 1/ (N×N) 。
关键词
数据缓冲器
处理
元
阵列
低功耗
门控时钟
Keywords
data buffer
processing element
array
low power
gated clock
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
高性能嵌入式图像处理系统研究
被引量:
8
4
作者
段宗涛
沙爱民
张燕妮
机构
长安大学信息学院
长安大学特殊地区公路工程教育部重点实验室
西安市计量测试研究所
出处
《微电子学与计算机》
CSCD
北大核心
2008年第6期38-41,共4页
基金
陕西省自然科学基础研究计划项目(2007F11)
中国博士后科学基金项目(20070421101)
文摘
为了提高计算机视觉中图像处理的速度,深入分析了计算机视觉中图像处理的三个层次的并行计算特征.以数据并行的处理元阵列芯片为基础,通过对其进行不同组合得到高性能嵌入式图像处理系统.该系统为图像处理提供了不同层次的数据并行性和任务并行性,满足了图像处理对并行计算的需求,为实时嵌入式图像处理提供了较高的计算性能.此外,处理元阵列芯片的实现方式又保证了其具有较小的体积,满足了嵌入性的要求.
关键词
嵌入式
处理
器
并行计算
处理
元
阵列
图像
处理
器
Keywords
embedded processor
parallel computing
array processing element
image processor
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
嵌入式协处理器中除法和平方根计算的整合设计
被引量:
2
5
作者
梁政
沈绪榜
机构
西安微电子技术研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2001年第8期1016-1020,共5页
基金
航天科技集团研究项目基金资助 (6 4 .3 .1/B990 771/0 1)
文摘
在浮点处理元中串行实现除法和平方根计算虽然速度慢 ,但设计简单规则 ,占用资源少 ,有利于嵌入式的应用 .结合嵌入式协处理器 L SC87的研制 ,给出了串行实现除法和平方根计算的基 4SRT算法 ,介绍了确定 SRT选择常数过程中不确定区域的验证方法 ;给出了除法与平方根计算可共用的基 4SRT查询表设计 ;同时讨论了迭代冗余结果向非冗余二进制的转换 .本协处理器设计最大限度地利用了通用数据路径来完成 SRT算法的实现 ,节约了设计资源 。
关键词
超大规模集成电路
除法
平方根
嵌入式协
处理
器
整合设计
浮点
处理
元
Keywords
VLSI, computer arithmetic, SRT, division, square root
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于SIMD—PRAM模型的分块图像匹配算法设计
被引量:
2
6
作者
张文君
缪栋
付光远
杨小冈
机构
西安第二炮兵工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2003年第3期75-77,共3页
文摘
该文研究了基于SIMD—PRAM计算模型的有限处理元阵列规模的并行计算算法设计,分析了求阵列和的并行算法性能,运用求阵列和、图像分块映射与四邻平移等方法提出了一种根据处理元局部可用资源进行分块计算的图像匹配算法。计算机模拟实验结果表明,该算法完整、高效地执行了图像匹配,具有良好的并行计算性能。
关键词
SIMD-PRAM模型
设计
处理
元
阵列
并行算法
分块图像匹配算法
图像
处理
计算机
Keywords
Processor Array,Parallel Algorithm,Image Matching
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
卷积计算的数据并行实现方法
7
作者
赵晓红
张发存
王忠
沈绪榜
机构
西安微电子技术研究所
出处
《微电子学与计算机》
CSCD
北大核心
2003年第B12期4-7,共4页
文摘
基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积。对于N×N的图像M×M(M<N)的模板,卷积算法在单处理机上用传统的方法实现需要O(N^2M^2)时间。显然它应当采用数据并行的处理方法来实现。本文较详细地讨论了卷积算法在局部寄存器个数受限与不受限情况下的两维处理元阵列的数据并行实现方法,提出了一种适用于具有有限局部寄存器的-维处理元阵列的卷积并行算法,并对算法的复杂度进行了分析。
关键词
卷积计算
数据并行
二维
处理
元
阵列
一维
处理
元
阵列
局部线性滤波函数
图像
处理
算法
复杂度
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
列缓冲器和处理元芯片的整合设计
8
作者
李莉
钱刚
沈绪榜
机构
西安微电子技术研究所
出处
《微电子学与计算机》
CSCD
北大核心
2003年第3期73-76,共4页
文摘
文章首先介绍了LSSIMD微处理器的存储器通信指令功能。它作为独立的芯片实现,带来了较难解决的时序和同步问题。文章就两种情况对这个问题进行了较详细的阐述,从而提出整合设计的必要性。并提出了一种列缓冲器与PE芯片的整合设计的方法,以克服时序问题和同步问题,突出了系统集成的设计思想。
关键词
列缓冲器
处理
元
芯片
整合设计
微
处理
器
PE芯片
Keywords
Column buffer,Processing Element,Array,Chip design
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于LS-SIMD的奇偶比较交换排序算法
9
作者
王馨梅
张翔
张发存
崔杜武
机构
西安理工大学
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第13期52-53,F003,共3页
基金
西安理工大学在职研究生科研资金资助项目
文摘
研究并实现了在LS-SIMD计算机上基于奇偶比较方法的按行或按列数据并行排序算法,并对算法的计算复杂性和通信复杂性进行了分析。该研究对于扩展LS SIMD计算机在非数值计算方面的应用有着十分重要的实际意义。
关键词
SIMD
奇偶比较交换
处理
元
阵列
Keywords
SIMD
Even-odd transposition
Processor elements array
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
数据并行计算机体系结构研究
10
作者
王鹏飞
张发存
段敬红
机构
西安理工大学计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第15期249-251,共3页
基金
陕西省教育厅基金资助项目(07JK357)
西安理工大学校创新基金资助项目(116-210711)
文摘
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程。
关键词
PIM技术
数据并行体系结构
可重构总线
处理
元
阵列
指令集体系结构
Keywords
PIM technology
data parallel architecture
reconfigurable bus
Processing Element(PE) array
instruction set architecture
分类号
N945 [自然科学总论—系统科学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于推理多线程技术的一种改进模型
王成良
吴渝
《沈阳工业大学学报》
EI
CAS
2007
0
下载PDF
职称材料
2
一种基于PIM技术的SIMD核设计
王光
《中国科学技术大学学报》
CAS
CSCD
北大核心
2013
0
下载PDF
职称材料
3
数据缓冲器的低功耗设计
李莉
沈绪榜
钱刚
许琪
王忠
《计算机研究与发展》
EI
CSCD
北大核心
2004
0
下载PDF
职称材料
4
高性能嵌入式图像处理系统研究
段宗涛
沙爱民
张燕妮
《微电子学与计算机》
CSCD
北大核心
2008
8
下载PDF
职称材料
5
嵌入式协处理器中除法和平方根计算的整合设计
梁政
沈绪榜
《计算机研究与发展》
EI
CSCD
北大核心
2001
2
下载PDF
职称材料
6
基于SIMD—PRAM模型的分块图像匹配算法设计
张文君
缪栋
付光远
杨小冈
《计算机工程与应用》
CSCD
北大核心
2003
2
下载PDF
职称材料
7
卷积计算的数据并行实现方法
赵晓红
张发存
王忠
沈绪榜
《微电子学与计算机》
CSCD
北大核心
2003
0
下载PDF
职称材料
8
列缓冲器和处理元芯片的整合设计
李莉
钱刚
沈绪榜
《微电子学与计算机》
CSCD
北大核心
2003
0
下载PDF
职称材料
9
基于LS-SIMD的奇偶比较交换排序算法
王馨梅
张翔
张发存
崔杜武
《计算机工程》
CAS
CSCD
北大核心
2004
0
下载PDF
职称材料
10
数据并行计算机体系结构研究
王鹏飞
张发存
段敬红
《计算机工程》
CAS
CSCD
北大核心
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部