期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多核架构下的数据处理算法优化策略综述
被引量:
7
1
作者
陈伟
杜凌霞
陈红
《计算机科学与探索》
CSCD
2011年第12期1057-1075,共19页
多核处理器,尤其是单芯片多处理器(chip multi-processor,CMP)能够提供强大的共享内存的并行资源,然而单核处理器上的程序和算法并不能充分利用多核架构提供的并行计算资源,因此必须针对多核体系架构特点,对算法进行改进优化,提高算法...
多核处理器,尤其是单芯片多处理器(chip multi-processor,CMP)能够提供强大的共享内存的并行资源,然而单核处理器上的程序和算法并不能充分利用多核架构提供的并行计算资源,因此必须针对多核体系架构特点,对算法进行改进优化,提高算法的执行性能。以优化程序局部性、减少cache访问冲突、提高线程并行度、充分利用单指令多数据流(single instruction multipledata,SIMD)并行和带宽优化等几方面为出发点,归纳和分析了多核处理器上数据处理算法的相关优化策略,并对多核算法进行了总结评述。最后阐述了该领域亟待解决的诸多问题,展望了未来的研究发展方向。
展开更多
关键词
多
核
单芯片
多
处理器(CMP)
数据
级别并行(DLP)
线程级别并行(TLP)
单指令
多数据流
(
simd
)
下载PDF
职称材料
x86处理器向量条件访存指令安全脆弱性分析
2
作者
李丹萍
朱子元
+1 位作者
史岗
孟丹
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第3期525-543,共19页
单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化...
单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化处理的需求不断提高,这使得SIMD技术愈发重要.为了支持SIMD技术,Intel和AMD等x86处理器厂商从1996年开始在其处理器中陆续引入了MMX(MultiMedia Extensions)、SSE(Streaming SIMD Extensions)、AVX(Advanced Vector eXtensions)等SIMD指令集扩展.通过调用SIMD指令,程序员能够无需理解SIMD技术的硬件层实现细节就方便地使用它的功能.然而,随着熔断、幽灵等处理器硬件漏洞的发现,人们逐渐认识到并行优化技术是一柄双刃剑,它在提高性能的同时也能带来安全风险.本文聚焦于x86 SIMD指令集扩展中的VMASKMOV指令,对它的安全脆弱性进行了分析.本文的主要贡献如下:(1)利用时间戳计数器等技术对VMASKMOV指令进行了微架构逆向工程,首次发现VMASKMOV指令与内存页管理和CPU Fill Buffer等安全风险的相关性;(2)披露了一个新的处理器漏洞EvilMask,它广泛存在于Intel和AMD处理器上,并提出了3个EvilMask攻击原语:VMASKMOVL+Time(MAP)、VMASKMOVS+Time(XD)和VMASKMOVL+MDS,可用于实施去地址空间布局随机化攻击和进程数据窃取攻击;(3)给出了2个EvilMask概念验证示例(Proof-of-Concept,PoC)验证了EvilMask对真实世界的信息安全危害;(4)讨论了针对EvilMask的防御方案,指出最根本的解决方法是在硬件层面上重新实现VMASKMOV指令,并给出了初步的实现方案.
展开更多
关键词
处理器安全
单指令
多数据流
(
simd
)
微体系结构侧信道攻击
VMASKMOV
指令
地址空间布局随机化(ASLR)
下载PDF
职称材料
一种基于HXDSP的移位器查找表技术
被引量:
1
3
作者
叶鸿
顾乃杰
+2 位作者
林传文
张孝慈
陈瑞
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2019年第10期2044-2050,共7页
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提...
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1. 15~1. 20的性能提升效果。
展开更多
关键词
数字信号处理器(DSP)
移位器
查找表(LUT)
单指令
多数据流
(
simd
)
超长
指令
字(VLIW)
下载PDF
职称材料
海量STAP数据的脉冲压缩快速实现
4
作者
任磊
王永良
+1 位作者
母其勇
陈辉
《数据采集与处理》
CSCD
北大核心
2008年第3期342-346,共5页
在空时二维自适应处理系统中对海量数据作脉压处理耗时颇大。本文基于单片数字信号处理器(DSP)从数据级和指令级两个方面进行优化,通过合理调度处理器资源并利用片内并行技术,快速实现了对海量数据的脉冲压缩优化处理。以空时二维自适...
在空时二维自适应处理系统中对海量数据作脉压处理耗时颇大。本文基于单片数字信号处理器(DSP)从数据级和指令级两个方面进行优化,通过合理调度处理器资源并利用片内并行技术,快速实现了对海量数据的脉冲压缩优化处理。以空时二维自适应处理(STAP)系统中单景四重频数据为分析对象,比较了采用商业库优化方法和本文方法优化后的两种情况。实验结果证明,在处理时间上取得了1.801的加速比,误差控制在10-5量级,1 024点脉压处理时间为50.456μs,验证了本文方法的有效性。
展开更多
关键词
脉冲压缩
海量
数据
单指令
多数据流
(
simd
)
超长
指令
字(VLIW)
TS201
下载PDF
职称材料
题名
多核架构下的数据处理算法优化策略综述
被引量:
7
1
作者
陈伟
杜凌霞
陈红
机构
中国人民大学数据工程与知识工程教育部重点实验室
中国人民大学信息学院
出处
《计算机科学与探索》
CSCD
2011年第12期1057-1075,共19页
基金
国家高技术研究发展计划(863)No.2008AA01Z120
国家教育部新世纪优秀人才支持计划
国家教育部博士点基金No.20090004110002~~
文摘
多核处理器,尤其是单芯片多处理器(chip multi-processor,CMP)能够提供强大的共享内存的并行资源,然而单核处理器上的程序和算法并不能充分利用多核架构提供的并行计算资源,因此必须针对多核体系架构特点,对算法进行改进优化,提高算法的执行性能。以优化程序局部性、减少cache访问冲突、提高线程并行度、充分利用单指令多数据流(single instruction multipledata,SIMD)并行和带宽优化等几方面为出发点,归纳和分析了多核处理器上数据处理算法的相关优化策略,并对多核算法进行了总结评述。最后阐述了该领域亟待解决的诸多问题,展望了未来的研究发展方向。
关键词
多
核
单芯片
多
处理器(CMP)
数据
级别并行(DLP)
线程级别并行(TLP)
单指令
多数据流
(
simd
)
Keywords
multi-core
chip multi-processor (CMP)
data level parallelism (DLP)
thread level parallelism (TLP)
single instruction multiple data (
simd
)
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
x86处理器向量条件访存指令安全脆弱性分析
2
作者
李丹萍
朱子元
史岗
孟丹
机构
中国科学院信息工程研究所
中国科学院大学网络空间安全学院
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第3期525-543,共19页
基金
中国科学院战略性先导科技专项(XDC02010400)资助.
文摘
单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化处理的需求不断提高,这使得SIMD技术愈发重要.为了支持SIMD技术,Intel和AMD等x86处理器厂商从1996年开始在其处理器中陆续引入了MMX(MultiMedia Extensions)、SSE(Streaming SIMD Extensions)、AVX(Advanced Vector eXtensions)等SIMD指令集扩展.通过调用SIMD指令,程序员能够无需理解SIMD技术的硬件层实现细节就方便地使用它的功能.然而,随着熔断、幽灵等处理器硬件漏洞的发现,人们逐渐认识到并行优化技术是一柄双刃剑,它在提高性能的同时也能带来安全风险.本文聚焦于x86 SIMD指令集扩展中的VMASKMOV指令,对它的安全脆弱性进行了分析.本文的主要贡献如下:(1)利用时间戳计数器等技术对VMASKMOV指令进行了微架构逆向工程,首次发现VMASKMOV指令与内存页管理和CPU Fill Buffer等安全风险的相关性;(2)披露了一个新的处理器漏洞EvilMask,它广泛存在于Intel和AMD处理器上,并提出了3个EvilMask攻击原语:VMASKMOVL+Time(MAP)、VMASKMOVS+Time(XD)和VMASKMOVL+MDS,可用于实施去地址空间布局随机化攻击和进程数据窃取攻击;(3)给出了2个EvilMask概念验证示例(Proof-of-Concept,PoC)验证了EvilMask对真实世界的信息安全危害;(4)讨论了针对EvilMask的防御方案,指出最根本的解决方法是在硬件层面上重新实现VMASKMOV指令,并给出了初步的实现方案.
关键词
处理器安全
单指令
多数据流
(
simd
)
微体系结构侧信道攻击
VMASKMOV
指令
地址空间布局随机化(ASLR)
Keywords
processor security
Single Instruction stream,Multiple Data streams(
simd
)
microarchitectural side-channel attacks
VMASKMOV instruction
Address Space Layout Randomization(ASLR)
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种基于HXDSP的移位器查找表技术
被引量:
1
3
作者
叶鸿
顾乃杰
林传文
张孝慈
陈瑞
机构
中国科学技术大学计算机科学与技术学院
合肥学院计算机科学与技术系
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2019年第10期2044-2050,共7页
基金
安徽省科技重大专项(18030901011)
合肥学院科研发展基金(19ZR03ZDA)~~
文摘
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1. 15~1. 20的性能提升效果。
关键词
数字信号处理器(DSP)
移位器
查找表(LUT)
单指令
多数据流
(
simd
)
超长
指令
字(VLIW)
Keywords
digital signal processor(DSP)
shifter
look-up table(LUT)
single instruction multiple data(
simd
)
very long instruction word(VLIW)
分类号
TP402 [自动化与计算机技术]
下载PDF
职称材料
题名
海量STAP数据的脉冲压缩快速实现
4
作者
任磊
王永良
母其勇
陈辉
机构
国防科技大学电子工程与科学技术学院
空军雷达学院兵器运用工程军队重点实验室
出处
《数据采集与处理》
CSCD
北大核心
2008年第3期342-346,共5页
基金
国家自然科学基金(60736009)资助项目
总装“十一五”预研(513070503)资助项目
文摘
在空时二维自适应处理系统中对海量数据作脉压处理耗时颇大。本文基于单片数字信号处理器(DSP)从数据级和指令级两个方面进行优化,通过合理调度处理器资源并利用片内并行技术,快速实现了对海量数据的脉冲压缩优化处理。以空时二维自适应处理(STAP)系统中单景四重频数据为分析对象,比较了采用商业库优化方法和本文方法优化后的两种情况。实验结果证明,在处理时间上取得了1.801的加速比,误差控制在10-5量级,1 024点脉压处理时间为50.456μs,验证了本文方法的有效性。
关键词
脉冲压缩
海量
数据
单指令
多数据流
(
simd
)
超长
指令
字(VLIW)
TS201
Keywords
pulse compression
tremendous data
single instruction multiple data (
simd
)
very long instruction word (VLIW)
TS201
分类号
TN957 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多核架构下的数据处理算法优化策略综述
陈伟
杜凌霞
陈红
《计算机科学与探索》
CSCD
2011
7
下载PDF
职称材料
2
x86处理器向量条件访存指令安全脆弱性分析
李丹萍
朱子元
史岗
孟丹
《计算机学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
3
一种基于HXDSP的移位器查找表技术
叶鸿
顾乃杰
林传文
张孝慈
陈瑞
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2019
1
下载PDF
职称材料
4
海量STAP数据的脉冲压缩快速实现
任磊
王永良
母其勇
陈辉
《数据采集与处理》
CSCD
北大核心
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部