期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
二维矩阵卷积在向量处理器中的设计与实现
被引量:
1
1
作者
张军阳
郭阳
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2018年第3期69-75,共7页
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数...
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。
展开更多
关键词
卷积神经网络
向量处理器
多核实现
矩阵卷积
下载PDF
职称材料
LTE-A中UE专用参考信号的解调算法与实现
2
作者
黄菲
丁月友
《无线电通信技术》
2017年第1期94-98,共5页
针对LTE-A新增的UE专用参考信号与小区参考信号映射的时频资源不同,导致传统的解调算法在UE专用参考信号上无法适用的问题。充分研究了UE专用参考信号时频资源映射的特点,即端口间采用了频分复用和码分复用技术区分,而小区参考信号只采...
针对LTE-A新增的UE专用参考信号与小区参考信号映射的时频资源不同,导致传统的解调算法在UE专用参考信号上无法适用的问题。充分研究了UE专用参考信号时频资源映射的特点,即端口间采用了频分复用和码分复用技术区分,而小区参考信号只采用了频分复用技术,结合此特点与传统的解调算法原理,设计了2种利用专用导频信息的解调算法,即LS-UE算法和LMMSE-UE算法。最后,通过在EPA无线信道环境下,对2种解调算法的性能仿真,权衡实现的复杂度,选择一种更适合LTE-A系统的下行解调算法,即LS-UE算法,并对该算法的多核DSP实现,验证了该算法的可行性与高效性。
展开更多
关键词
LTE—A
UE专用参考信号
解调算法
多核DSP实现
下载PDF
职称材料
题名
二维矩阵卷积在向量处理器中的设计与实现
被引量:
1
1
作者
张军阳
郭阳
机构
国防科技大学计算机学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2018年第3期69-75,共7页
基金
国家重点基础研究发展计划资助项目(2016YFB0200401)
国家自然科学基金资助项目(61572025)
文摘
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。
关键词
卷积神经网络
向量处理器
多核实现
矩阵卷积
Keywords
convolution
neural
network
vector
processor
multi
-
core
implementation
matrix
convolution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
LTE-A中UE专用参考信号的解调算法与实现
2
作者
黄菲
丁月友
机构
重庆邮电大学移动通信重庆市重点实验室
出处
《无线电通信技术》
2017年第1期94-98,共5页
基金
重庆市教委科学技术研究项目(KJ1500428)
文摘
针对LTE-A新增的UE专用参考信号与小区参考信号映射的时频资源不同,导致传统的解调算法在UE专用参考信号上无法适用的问题。充分研究了UE专用参考信号时频资源映射的特点,即端口间采用了频分复用和码分复用技术区分,而小区参考信号只采用了频分复用技术,结合此特点与传统的解调算法原理,设计了2种利用专用导频信息的解调算法,即LS-UE算法和LMMSE-UE算法。最后,通过在EPA无线信道环境下,对2种解调算法的性能仿真,权衡实现的复杂度,选择一种更适合LTE-A系统的下行解调算法,即LS-UE算法,并对该算法的多核DSP实现,验证了该算法的可行性与高效性。
关键词
LTE—A
UE专用参考信号
解调算法
多核DSP实现
Keywords
LTE-A
UE-specific
reference
signal
demodulation
algorithm
multi
-
core
DSP
implementation
分类号
TN929 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
二维矩阵卷积在向量处理器中的设计与实现
张军阳
郭阳
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2018
1
下载PDF
职称材料
2
LTE-A中UE专用参考信号的解调算法与实现
黄菲
丁月友
《无线电通信技术》
2017
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部