期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
定点FFT的DSP向量混洗并行基4算法
1
作者 王书盈 胡勇华 +1 位作者 张鑫 《湖南科技大学学报(自然科学版)》 CAS 北大核心 2024年第2期75-86,共12页
基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级... 基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级并行处理模型.该模型充分考虑基4方法下的复数FFT计算过程和蝶形组集合的特征,将SIMD计算、向量混洗、索引DMA等技术与复数FFT的基4变换过程充分融合,有效控制计算过程中存储器和片内缓存之间的数据块搬移需求,提升SIMD计算单元的利用率.在基于自主YHFT-M7002处理器的FT-M7002DSK平台上进行试验研究,验证算法的有效性.试验结果表明:与CCS模拟所得TI的相应TMS320C6678库函数性能相比,所提优化算法的平均加速比达到TI库函数的4.79倍. 展开更多
关键词 基4复数FFT SIMD技术 向量DSP 向量混洗 索引DMA
原文传递
向量DSP的混合资源启发式循环展开因子选择方法研究
2
作者 胡勇华 +2 位作者 王书盈 周新莲 李慧祥 《计算机科学》 CSCD 北大核心 2022年第S01期777-783,共7页
在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重... 在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重要优化的效果。该方法考虑了循环体代码的向量标量属性、基址寄存器和索引寄存器资源使用规则等因素,并且在展开因子选择算法中增加了执行单元使用占比和展开因子按幂次对齐这两种启发式因素。针对3种常用数字信息处理算法开展了实验研究,实验结果表明了该方法的有效性。对于这三种DSP算法,用所提方法获得的循环展开因子进行循环展开处理后,它们的平均性能相比已有方法提升了10%以上。 展开更多
关键词 循环展开 展开因子 超长指令字 向量DSP 编译优化
下载PDF
基于弱约束指派的DSP寄存器偶对分配算法研究
3
作者 唐镇 胡勇华 +1 位作者 王书盈 《计算机科学》 CSCD 北大核心 2021年第S01期587-595,共9页
在现代高性能数字信号处理器(DSP)中,许多指令把寄存器偶对作为操作数。为了优化寄存器偶对的使用,文中针对寄存器偶对的使用约束条件,提出了一种基于弱约束指派的DSP寄存器偶对分配算法。该算法在寄存器指派过程中优先指派空闲寄存器... 在现代高性能数字信号处理器(DSP)中,许多指令把寄存器偶对作为操作数。为了优化寄存器偶对的使用,文中针对寄存器偶对的使用约束条件,提出了一种基于弱约束指派的DSP寄存器偶对分配算法。该算法在寄存器指派过程中优先指派空闲寄存器偶对给符号寄存器对。如果无法指派寄存器偶对给符号寄存器对,则指派两个不能组成寄存器偶对的寄存器。为了确保目标代码中寄存器偶对操作数最终获得的寄存器偶对符合寄存器偶对的使用约束条件,提供了一种指令操作数修正方法。采用6种经典的算法作为测试用例进行实验,结果表明所提算法的实验效果较好。 展开更多
关键词 DSP 编译优化 全局寄存器分配 图着色方法 寄存器偶对
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部