-
题名面向FT-M7002平台点积算法的优化实现
- 1
-
-
作者
郭盼盼
陈梦雪
梁祖达
马晓畅
许邦建
-
机构
郑州大学计算机与人工智能学院
国家超级计算郑州中心(郑州大学)
湖南大学电气与信息工程学院
湖南大学信息科学与工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2022年第11期1909-1917,共9页
-
文摘
基于国产的FT-M7002平台高性能DSP,针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势,对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化。该研究充分挖掘了程序的向量并行性,有效地提升了数据传输的速度,提高了程序性能。实验结果表明,输入不同规模大小的数组,不同类型的点积算法在FT-M7002平台上优化后和优化前的平均性能比为12.4166~45.2338。相较于TI官网的dsplib库中不同类型的点积函数在TMS320C6678处理器上运行的性能,FT-M7002平台优化后的性能与TI平台的平均性能比为1.3716~4.5196。实验结果表明了该DSP平台相对于TI主流平台的计算性能优势。
-
关键词
FT-M7002
DSP
点积算法
向量
dma双通道传输
SVR传输
-
Keywords
FT-M7002
digital signal processor(DSP)
dot product algorithm
vector
dma dual channel transmission
SVR transmission
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-