期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
定点FFT的DSP向量混洗并行基4算法
1
作者
王书盈
胡勇华
+1 位作者
张鑫
陆
浩
松
《湖南科技大学学报(自然科学版)》
CAS
北大核心
2024年第2期75-86,共12页
基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级...
基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级并行处理模型.该模型充分考虑基4方法下的复数FFT计算过程和蝶形组集合的特征,将SIMD计算、向量混洗、索引DMA等技术与复数FFT的基4变换过程充分融合,有效控制计算过程中存储器和片内缓存之间的数据块搬移需求,提升SIMD计算单元的利用率.在基于自主YHFT-M7002处理器的FT-M7002DSK平台上进行试验研究,验证算法的有效性.试验结果表明:与CCS模拟所得TI的相应TMS320C6678库函数性能相比,所提优化算法的平均加速比达到TI库函数的4.79倍.
展开更多
关键词
基4复数FFT
SIMD技术
向量DSP
向量混洗
索引DMA
原文传递
向量DSP的混合资源启发式循环展开因子选择方法研究
2
作者
陆
浩
松
胡勇华
+2 位作者
王书盈
周新莲
李慧祥
《计算机科学》
CSCD
北大核心
2022年第S01期777-783,共7页
在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重...
在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重要优化的效果。该方法考虑了循环体代码的向量标量属性、基址寄存器和索引寄存器资源使用规则等因素,并且在展开因子选择算法中增加了执行单元使用占比和展开因子按幂次对齐这两种启发式因素。针对3种常用数字信息处理算法开展了实验研究,实验结果表明了该方法的有效性。对于这三种DSP算法,用所提方法获得的循环展开因子进行循环展开处理后,它们的平均性能相比已有方法提升了10%以上。
展开更多
关键词
循环展开
展开因子
超长指令字
向量DSP
编译优化
下载PDF
职称材料
基于弱约束指派的DSP寄存器偶对分配算法研究
3
作者
唐镇
胡勇华
+1 位作者
陆
浩
松
王书盈
《计算机科学》
CSCD
北大核心
2021年第S01期587-595,共9页
在现代高性能数字信号处理器(DSP)中,许多指令把寄存器偶对作为操作数。为了优化寄存器偶对的使用,文中针对寄存器偶对的使用约束条件,提出了一种基于弱约束指派的DSP寄存器偶对分配算法。该算法在寄存器指派过程中优先指派空闲寄存器...
在现代高性能数字信号处理器(DSP)中,许多指令把寄存器偶对作为操作数。为了优化寄存器偶对的使用,文中针对寄存器偶对的使用约束条件,提出了一种基于弱约束指派的DSP寄存器偶对分配算法。该算法在寄存器指派过程中优先指派空闲寄存器偶对给符号寄存器对。如果无法指派寄存器偶对给符号寄存器对,则指派两个不能组成寄存器偶对的寄存器。为了确保目标代码中寄存器偶对操作数最终获得的寄存器偶对符合寄存器偶对的使用约束条件,提供了一种指令操作数修正方法。采用6种经典的算法作为测试用例进行实验,结果表明所提算法的实验效果较好。
展开更多
关键词
DSP
编译优化
全局寄存器分配
图着色方法
寄存器偶对
下载PDF
职称材料
题名
定点FFT的DSP向量混洗并行基4算法
1
作者
王书盈
胡勇华
张鑫
陆
浩
松
机构
湖南科技大学计算机科学与工程学院
出处
《湖南科技大学学报(自然科学版)》
CAS
北大核心
2024年第2期75-86,共12页
基金
湖南省自然科学基金资助项目(2023JJ50019)
湖南省教育厅科研项目资助(20B242,19A169)。
文摘
基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级并行处理模型.该模型充分考虑基4方法下的复数FFT计算过程和蝶形组集合的特征,将SIMD计算、向量混洗、索引DMA等技术与复数FFT的基4变换过程充分融合,有效控制计算过程中存储器和片内缓存之间的数据块搬移需求,提升SIMD计算单元的利用率.在基于自主YHFT-M7002处理器的FT-M7002DSK平台上进行试验研究,验证算法的有效性.试验结果表明:与CCS模拟所得TI的相应TMS320C6678库函数性能相比,所提优化算法的平均加速比达到TI库函数的4.79倍.
关键词
基4复数FFT
SIMD技术
向量DSP
向量混洗
索引DMA
Keywords
Radix-4 complex FFT
SIMD technology
vector DSP
vector shuffling
index DMA
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
向量DSP的混合资源启发式循环展开因子选择方法研究
2
作者
陆
浩
松
胡勇华
王书盈
周新莲
李慧祥
机构
湖南科技大学计算机科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2022年第S01期777-783,共7页
基金
湖南省教育厅科研项目(20B242,19A169)
湖南省自然科学基金(2017JJ3087)
国家自然科学基金(61872138)。
文摘
在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重要优化的效果。该方法考虑了循环体代码的向量标量属性、基址寄存器和索引寄存器资源使用规则等因素,并且在展开因子选择算法中增加了执行单元使用占比和展开因子按幂次对齐这两种启发式因素。针对3种常用数字信息处理算法开展了实验研究,实验结果表明了该方法的有效性。对于这三种DSP算法,用所提方法获得的循环展开因子进行循环展开处理后,它们的平均性能相比已有方法提升了10%以上。
关键词
循环展开
展开因子
超长指令字
向量DSP
编译优化
Keywords
Loop unrolling
Unrolling factor
VLIW
Vector DSP
Compiler optimization
分类号
TP314 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于弱约束指派的DSP寄存器偶对分配算法研究
3
作者
唐镇
胡勇华
陆
浩
松
王书盈
机构
湖南科技大学
出处
《计算机科学》
CSCD
北大核心
2021年第S01期587-595,共9页
基金
湖南省自然科学基金(2017JJ3087)
国家自然科学基金资(61308001,61872138)。
文摘
在现代高性能数字信号处理器(DSP)中,许多指令把寄存器偶对作为操作数。为了优化寄存器偶对的使用,文中针对寄存器偶对的使用约束条件,提出了一种基于弱约束指派的DSP寄存器偶对分配算法。该算法在寄存器指派过程中优先指派空闲寄存器偶对给符号寄存器对。如果无法指派寄存器偶对给符号寄存器对,则指派两个不能组成寄存器偶对的寄存器。为了确保目标代码中寄存器偶对操作数最终获得的寄存器偶对符合寄存器偶对的使用约束条件,提供了一种指令操作数修正方法。采用6种经典的算法作为测试用例进行实验,结果表明所提算法的实验效果较好。
关键词
DSP
编译优化
全局寄存器分配
图着色方法
寄存器偶对
Keywords
DSP
Compiler optimization
Global register allocation
Graph coloring method
Register pairs
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
定点FFT的DSP向量混洗并行基4算法
王书盈
胡勇华
张鑫
陆
浩
松
《湖南科技大学学报(自然科学版)》
CAS
北大核心
2024
0
原文传递
2
向量DSP的混合资源启发式循环展开因子选择方法研究
陆
浩
松
胡勇华
王书盈
周新莲
李慧祥
《计算机科学》
CSCD
北大核心
2022
0
下载PDF
职称材料
3
基于弱约束指派的DSP寄存器偶对分配算法研究
唐镇
胡勇华
陆
浩
松
王书盈
《计算机科学》
CSCD
北大核心
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部