期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
定点FFT的DSP向量混洗并行基4算法
1
作者 王书盈 胡勇华 +1 位作者 张鑫 陆浩松 《湖南科技大学学报(自然科学版)》 CAS 北大核心 2024年第2期75-86,共12页
基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级... 基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级并行处理模型.该模型充分考虑基4方法下的复数FFT计算过程和蝶形组集合的特征,将SIMD计算、向量混洗、索引DMA等技术与复数FFT的基4变换过程充分融合,有效控制计算过程中存储器和片内缓存之间的数据块搬移需求,提升SIMD计算单元的利用率.在基于自主YHFT-M7002处理器的FT-M7002DSK平台上进行试验研究,验证算法的有效性.试验结果表明:与CCS模拟所得TI的相应TMS320C6678库函数性能相比,所提优化算法的平均加速比达到TI库函数的4.79倍. 展开更多
关键词 基4复数FFT SIMD技术 向量dsp 向量混洗 索引DMA
原文传递
具有高效混洗模式存储器的可编程混洗单元 被引量:2
2
作者 万江华 刘胜 +2 位作者 周锋 王耀华 陈书明 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第6期31-35,共5页
为向量DSP提出并设计了一种具有高效混洗模式存储器的可编程混洗单元,该结构能够使应用程序的混洗指令在执行时和通用寄存器或访存带宽等系统的关键资源分离,从而提高混洗单元的执行效率。采用区分不同混洗粒度和元素索引等方法对混洗... 为向量DSP提出并设计了一种具有高效混洗模式存储器的可编程混洗单元,该结构能够使应用程序的混洗指令在执行时和通用寄存器或访存带宽等系统的关键资源分离,从而提高混洗单元的执行效率。采用区分不同混洗粒度和元素索引等方法对混洗模式所对应的开关矩阵进行了压缩,我们的存储效率高于当前其他方案。该混洗单元具有可编程的特点,应用程序所需要的混洗模式可以提前由程序员编写并通过DMA等途径加载。对该混洗单元进行了VLSI实现及性能评测,结果显示此方案能够在给系统带来0.6%的额外面积开销基础上使应用程序的性能提升7.4%~17.4%。 展开更多
关键词 向量dsp 混洗单元 混洗模式存储器 混洗指令 存储效率
下载PDF
向量DSP的混合资源启发式循环展开因子选择方法研究
3
作者 陆浩松 胡勇华 +2 位作者 王书盈 周新莲 李慧祥 《计算机科学》 CSCD 北大核心 2022年第S01期777-783,共7页
在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重... 在现代处理器中,具有向量处理单元的VLIW体系结构逐渐成为高性能DSP体系结构的典型代表。基于这类体系结构的寄存器资源丰富、执行单元多等特点,研究了相应的循环展开因子选择问题,提出了一种循环展开因子选择方法来提升循环展开这种重要优化的效果。该方法考虑了循环体代码的向量标量属性、基址寄存器和索引寄存器资源使用规则等因素,并且在展开因子选择算法中增加了执行单元使用占比和展开因子按幂次对齐这两种启发式因素。针对3种常用数字信息处理算法开展了实验研究,实验结果表明了该方法的有效性。对于这三种DSP算法,用所提方法获得的循环展开因子进行循环展开处理后,它们的平均性能相比已有方法提升了10%以上。 展开更多
关键词 循环展开 展开因子 超长指令字 向量dsp 编译优化
下载PDF
高性能向量DSP内核提升无线基站4倍性能
4
作者 丛秋波 《电子设计技术 EDN CHINA》 2011年第1期14-14,共1页
硅产品知识产权(SIP)平台解决方案和数字信号处理器(DSP)内核授权厂商CEVA公司日前推出业界首款用于4G无线基础设施应用的高性能向量DSP内核CEVA—XC323。CEVA公司市场拓展副总裁EranBriman表示,CEVA-XC323DSP的4G处理性能相比现... 硅产品知识产权(SIP)平台解决方案和数字信号处理器(DSP)内核授权厂商CEVA公司日前推出业界首款用于4G无线基础设施应用的高性能向量DSP内核CEVA—XC323。CEVA公司市场拓展副总裁EranBriman表示,CEVA-XC323DSP的4G处理性能相比现有基站侧超长指令字VLIWDSP提升高达4倍,同时支持多核架构。 展开更多
关键词 CEVA-XC323 向量dsp CEVA
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部