期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
二维矩阵卷积在向量处理器中的设计与实现 被引量:1
1
作者 张军阳 郭阳 《国防科技大学学报》 EI CAS CSCD 北大核心 2018年第3期69-75,共7页
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数... 为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。 展开更多
关键词 卷积神经网络 向量处理器 多核实现 矩阵卷积
下载PDF
LTE-A中UE专用参考信号的解调算法与实现
2
作者 黄菲 丁月友 《无线电通信技术》 2017年第1期94-98,共5页
针对LTE-A新增的UE专用参考信号与小区参考信号映射的时频资源不同,导致传统的解调算法在UE专用参考信号上无法适用的问题。充分研究了UE专用参考信号时频资源映射的特点,即端口间采用了频分复用和码分复用技术区分,而小区参考信号只采... 针对LTE-A新增的UE专用参考信号与小区参考信号映射的时频资源不同,导致传统的解调算法在UE专用参考信号上无法适用的问题。充分研究了UE专用参考信号时频资源映射的特点,即端口间采用了频分复用和码分复用技术区分,而小区参考信号只采用了频分复用技术,结合此特点与传统的解调算法原理,设计了2种利用专用导频信息的解调算法,即LS-UE算法和LMMSE-UE算法。最后,通过在EPA无线信道环境下,对2种解调算法的性能仿真,权衡实现的复杂度,选择一种更适合LTE-A系统的下行解调算法,即LS-UE算法,并对该算法的多核DSP实现,验证了该算法的可行性与高效性。 展开更多
关键词 LTE—A UE专用参考信号 解调算法 多核DSP实现
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部