期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
16
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
太赫兹超分辨率成像研究进展
被引量:
7
1
作者
曹丙花
张宇盟
+2 位作者
范孟豹
孙凤山
刘林
《中国光学》
EI
CAS
CSCD
北大核心
2022年第3期405-417,共13页
目前太赫兹(Terahertz,THz)成像技术在许多领域被视为最前沿技术之一,经过20年的发展,取得了巨大进步。随着科研、医疗、军事以及工业应用需求的增长,高分辨率THz图像变得不可或缺。超分辨率成像是目前THz技术的研究热点。本文首先回顾...
目前太赫兹(Terahertz,THz)成像技术在许多领域被视为最前沿技术之一,经过20年的发展,取得了巨大进步。随着科研、医疗、军事以及工业应用需求的增长,高分辨率THz图像变得不可或缺。超分辨率成像是目前THz技术的研究热点。本文首先回顾了THz系统的成像方法,包括连续波成像与脉冲波成像两种方式;在此基础上,详细介绍了THz超分辨率成像系统与THz信号处理技术,其中超分辨率成像系统包括近场成像、超透镜以及太喷射装置等,THz信号处理技术包括超分辨率重建与卷积计算等;最后,通过分析目前超分辨率成像存在的不足,比如系统的制造工艺要求高、采集速度慢以及重建图像使用的学习样本分辨率较低等,从而进一步对超分辨率成像研究方向进行展望。
展开更多
关键词
太赫兹
近场成像
超透镜
光子喷射
超分辨率重建
卷积
下载PDF
职称材料
基于TVM平台的MEC卷积算法优化
2
作者
王朝闻
蒋林
+1 位作者
李远成
朱筠
《计算机工程与应用》
CSCD
北大核心
2023年第1期180-186,共7页
针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部...
针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部分,采用修改数据读取顺序的方式对其进行优化,使读取方式符合算法的访存行为。对于矩阵运算部分,采用更加适合矩阵运算的内存数据布局对卷积核矩阵修改,并利用TVM(tensor virtual machine)平台封装的计算函数,重新设计中间矩阵同卷积核矩阵的计算方式。使用平台自带并行库对运算过程进行加速。实验结果表明,相比传统MEC算法,提出的优化方法可以有效解决缓存命中率低、内存访问延时长等问题,同MEC算法的运算时间对比,在单个卷积层上平均获得了50%的速度提升,在多层神经网络中最低获得了57%以上的速度提升,同空间组合算法的运算时间对比,最高获得了80%的速度提升。
展开更多
关键词
卷积计算
访存行为
缓存技术
MEC算法
下载PDF
职称材料
面向内存受限设备的新型卷积计算方法
被引量:
3
3
作者
孙雁飞
王子牛
+2 位作者
孙莹
亓晋
董振江
《南京邮电大学学报(自然科学版)》
北大核心
2022年第5期54-61,共8页
针对卷积神经网络预测过程中内存使用量大,难以部署在内存受限设备上的问题,提出一种面向内存受限设备的新型卷积计算方法。该方法对输入矩阵中部分数据进行卷积计算,并将计算结果存储在临时内存;然后,将临时内存中的计算结果复制到输...
针对卷积神经网络预测过程中内存使用量大,难以部署在内存受限设备上的问题,提出一种面向内存受限设备的新型卷积计算方法。该方法对输入矩阵中部分数据进行卷积计算,并将计算结果存储在临时内存;然后,将临时内存中的计算结果复制到输入矩阵不再使用的内存并重复上述步骤,从而实现对输入矩阵的卷积计算;最后,对单个卷积计算和LeNet进行验证。实验结果表明,该方法计算速度较直接卷积方法更快,且相比im2col、MEC和直接卷积方法,单个卷积计算内存平均使用量分别下降89.29%、82.60%和57.15%,LeNet内存使用量分别下降89.90%、82.21%和28.07%,有效降低了卷积神经网络的内存使用量,有助于在内存受限设备上部署使用。
展开更多
关键词
深度学习
卷积计算
内存优化
数据复用
边缘设备
下载PDF
职称材料
基于GPU并行计算的雷达杂波模拟研究
被引量:
4
4
作者
徐国伟
陈建
成怡
《计算机工程》
CAS
CSCD
北大核心
2020年第11期306-314,共9页
现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下...
现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下,对相关相干K分布杂波算法进行多任务串-并行分析,采用cuBLAS库对细粒度卷积计算进行优化,利用OpenMP+CUDA多任务调度机制改进粗粒度任务并行计算,以提高CPU-GPU利用率并减少数据等待时间。实验结果表明,该方法生成杂波数据的实时性显著提升,且随着杂波数据量增大其加速效果更好,相较传统GPU方法计算速率提高61%。
展开更多
关键词
雷达杂波
GPU并行计算
球不变随机过程法
卷积计算
cuBLAS库
下载PDF
职称材料
FIR滤波器的高速实现
被引量:
3
5
作者
袁菁
高勇
《数据采集与处理》
CSCD
北大核心
2006年第1期118-122,共5页
介绍了一种实现F IR滤波器高速运算的有效方法。该方法在传统的滤波器系数奇偶对称性的基础上,根据系数经SystemV iew软件量化后成比例的特点,利用加法运算来简化卷积中大量繁琐耗时的乘法运算;同时推导出奇偶对称性的运算规律并给出详...
介绍了一种实现F IR滤波器高速运算的有效方法。该方法在传统的滤波器系数奇偶对称性的基础上,根据系数经SystemV iew软件量化后成比例的特点,利用加法运算来简化卷积中大量繁琐耗时的乘法运算;同时推导出奇偶对称性的运算规律并给出详细运算步骤和计算公式。最后给出该算法分别与仅利用系数对称性、直接卷积两方法相比较的加速比。仿真结果表明,文中所采取的优化措施能够提高信号处理速度。
展开更多
关键词
有限冲击响应滤波器
卷积运算
奇偶对称性
下载PDF
职称材料
测量杆塔冲击接地电阻的研究
被引量:
4
6
作者
李福权
何斌斌
邓世聪
《华中电力》
2007年第6期22-25,共4页
在总结现有的杆塔冲击接地电阻的计算测量方法的基础上,研制了便携式杆塔冲击接地电阻测量系统。它首先向接地体注入波头较缓、幅值较低的冲击电流,接着采集接地体的电压与电流信号,经滤波后再换算到标准雷电流下求出其电压响应,最后求...
在总结现有的杆塔冲击接地电阻的计算测量方法的基础上,研制了便携式杆塔冲击接地电阻测量系统。它首先向接地体注入波头较缓、幅值较低的冲击电流,接着采集接地体的电压与电流信号,经滤波后再换算到标准雷电流下求出其电压响应,最后求出冲击接地电阻。实验室测试结果与传统的冲击接地电阻测量方法对比表明本系统测量方便且可信度高。
展开更多
关键词
杆塔
冲击接地电阻
测量
卷积计算
下载PDF
职称材料
基于矩阵转换的卷积计算优化方法
被引量:
2
7
作者
方玉玲
陈庆奎
《计算机工程》
CAS
CSCD
北大核心
2019年第7期217-221,228,共6页
提出一种基于矩阵转换的高效卷积计算优化方法MCFA。根据输出矩阵的宽度和卷积核大小对输入矩阵进行分块,通过im2col方法转换输入矩阵子块和核函数矩阵,利用计算统一设备架构中封装的矩阵-矩阵乘法加速库提升卷积计算的速度。在此基础上...
提出一种基于矩阵转换的高效卷积计算优化方法MCFA。根据输出矩阵的宽度和卷积核大小对输入矩阵进行分块,通过im2col方法转换输入矩阵子块和核函数矩阵,利用计算统一设备架构中封装的矩阵-矩阵乘法加速库提升卷积计算的速度。在此基础上,将输出子块按序排列,最终得到完整的输出矩阵。实验结果证明,该方法相比im2col方法能节省61.25 %的计算空间,相比MEC方法能提高20.57 %的计算速度,且在分块情况下可以缓解大输入矩阵引起的缓存压力,提高缓存利用率。
展开更多
关键词
深度学习
卷积计算
直接卷积
矩阵分块
计算统一设备架构
卷积优化
下载PDF
职称材料
基于卷积神经网络的数字分类器的研究与优化
被引量:
3
8
作者
杜阔
李亚
《现代电子技术》
北大核心
2019年第16期98-103,共6页
数字识别在邮政编码、车牌数字检测识别等场景有着广泛的应用。以Lenet-5卷积神经网络为基础,研究卷积计算量过大和预测速度慢的问题。对不同的卷积层(首层、中间层、尾层)和网络结构进行了改进和优化,采用不同组合的方案使卷积核连接...
数字识别在邮政编码、车牌数字检测识别等场景有着广泛的应用。以Lenet-5卷积神经网络为基础,研究卷积计算量过大和预测速度慢的问题。对不同的卷积层(首层、中间层、尾层)和网络结构进行了改进和优化,采用不同组合的方案使卷积核连接数减少一定的数量,进行仿真实验。实验结果表明,保证在同一准确率的前提下,综合考虑迭代次数和预测时延,在C3层(中间层)做优化最为合适,总结出的规律和方法也可对复杂卷积神经网络优化提供参考,满足实时性要求高、大数据量的应用场景。
展开更多
关键词
数字分类器
卷积神经网络
卷积计算
数字识别
网络结构优化
仿真实验
下载PDF
职称材料
一维量子卷积计算
被引量:
3
9
作者
闫茜茜
王鹏程
刘兴云
《计算机工程与应用》
CSCD
北大核心
2020年第8期55-59,共5页
研究了一维信息编码为量子态后进行量子卷积计算的量子线路模型。基于量子图像表示和经典信息的卷积算法,设计出了一维量子卷积计算的量子线路结构,表明量子卷积计算可以以O(n^2)的复杂度计算卷积。与经典卷积相比,量子卷积计算由于利...
研究了一维信息编码为量子态后进行量子卷积计算的量子线路模型。基于量子图像表示和经典信息的卷积算法,设计出了一维量子卷积计算的量子线路结构,表明量子卷积计算可以以O(n^2)的复杂度计算卷积。与经典卷积相比,量子卷积计算由于利用量子并行计算在计算速率上达到了指数级的加速,为量子卷积神经网络卷积层的设计实施作铺垫。
展开更多
关键词
量子门
卷积计算
量子线路
下载PDF
职称材料
水体污染时空分布遥感影像要素深度提取方法
被引量:
3
10
作者
冯新翎
张杰
汤嘉立
《计算机仿真》
北大核心
2021年第6期121-124,178,共5页
针对现有方法影像要素提取精准度不高,易丢失细节信息,不能有效提供全面水体信息的问题,提出水体污染时空分布影像要素深度提取方法。借助ArcGIS水文分析模块生成水系图,建立逐步迭代提取流程,利用主成分变换方法对影像块实行最小化重构...
针对现有方法影像要素提取精准度不高,易丢失细节信息,不能有效提供全面水体信息的问题,提出水体污染时空分布影像要素深度提取方法。借助ArcGIS水文分析模块生成水系图,建立逐步迭代提取流程,利用主成分变换方法对影像块实行最小化重构,提取影像的主要特征。通过NSCT变换对原始图像进行采样分解,使用卷积计算方式构建自适应池化模型,提取污染水体的纹理特征。基于数学形态学细化水体图像的主要特征与纹理特征结构,构建反演函数进行大气校正,从而完成水污染遥感影像的深度提取。实验结果证明,所提方法提取的遥感影像具有较高精度,同时包含较多细节信息,实用性强,可在水污染检测中推广应用。
展开更多
关键词
主成分分析
数学形态学
卷积计算
反演函数
下载PDF
职称材料
基于卷积计算的多层脉冲神经网络的监督学习
被引量:
3
11
作者
张玉平
蔺想红
《计算机工程与科学》
CSCD
北大核心
2015年第2期348-353,共6页
针对脉冲神经元基于精确定时的多脉冲编码信息的特点,提出了一种基于卷积计算的多层脉冲神经网络监督学习的新算法。该算法应用核函数的卷积计算将离散的脉冲序列转换为连续函数,在多层前馈脉冲神经网络结构中,使用梯度下降的方法得到...
针对脉冲神经元基于精确定时的多脉冲编码信息的特点,提出了一种基于卷积计算的多层脉冲神经网络监督学习的新算法。该算法应用核函数的卷积计算将离散的脉冲序列转换为连续函数,在多层前馈脉冲神经网络结构中,使用梯度下降的方法得到基于核函数卷积表示的学习规则,并用来调整神经元连接的突触权值。在实验部分,首先验证了该算法学习脉冲序列的效果,然后应用该算法对Iris数据集进行分类。结果显示,该算法能够实现脉冲序列复杂时空模式的学习,对非线性模式分类问题具有较高的分类正确率。
展开更多
关键词
脉冲神经网络
监督学习
卷积计算
梯度下降
下载PDF
职称材料
MCC-SIMD数据并行卷积计算方法的研究
被引量:
1
12
作者
张发存
赵晓红
+1 位作者
王忠
沈绪榜
《计算机工程》
CAS
CSCD
北大核心
2004年第9期34-36,共3页
主要研究卷积计算的数据并行方法在MCC-SIMD计算机的设计和实现问题。在参考国内外现有资料的基础上,从图论的角度用卷积路径的方法对卷积计算的有关概念进行了严格的形式化定义;分析了4-连接卷积路径下数据并行卷积计算时处理元阵列...
主要研究卷积计算的数据并行方法在MCC-SIMD计算机的设计和实现问题。在参考国内外现有资料的基础上,从图论的角度用卷积路径的方法对卷积计算的有关概念进行了严格的形式化定义;分析了4-连接卷积路径下数据并行卷积计算时处理元阵列的移动规律;在此基础上给出了数据并行卷积计算算法;最后对算法的计算复杂性和通信复杂性进行了简要分析。文中还对有关结论进行了证明。
展开更多
关键词
数据并行
卷积计算
卷积路径
MCC-SIMD计算机
下载PDF
职称材料
基于特征线法的A-Line模型的误差分析与研究
被引量:
1
13
作者
刘欣
王志峰
梁贵书
《华北电力大学学报(自然科学版)》
CAS
北大核心
2017年第3期22-29,共8页
传输线模型是电力系统电磁暂态计算的重要组成部分,近几年的研究中提出了几种新的模型,其中A-Line模型是一种基于特征线法的双诺顿模型,相比于J.Marti和ULM模型,由于其计算过程中不需要对传播常数进行拟合,使架空线暂态计算更为简单。然...
传输线模型是电力系统电磁暂态计算的重要组成部分,近几年的研究中提出了几种新的模型,其中A-Line模型是一种基于特征线法的双诺顿模型,相比于J.Marti和ULM模型,由于其计算过程中不需要对传播常数进行拟合,使架空线暂态计算更为简单。然而,该模型在处理频变参数的时域卷积计算中,采用端口电流代替沿线电流,将会产生一定的误差,且该误差与线路参数密切相关,然而现有文献并没有对该模型进行详细的误差分析和适用范围研究。通过对A-Line模型进行特征阻抗和传播常数误差公式推导及线路参数对特征阻抗和传播常数影响的讨论,对A-Line模型的误差及适用范围进行了分析,并通过算例验证了所得分析结论的正确性,为该模型的工程应用提供了理论依据。
展开更多
关键词
传输线
A-Line模型
特征线法
卷积计算
误差分析
下载PDF
职称材料
裂变伽马射线探测器的时间响应特性研究
14
作者
张建华
张传飞
+3 位作者
彭太平
王振通
唐登攀
周刚
《核电子学与探测技术》
CAS
CSCD
北大核心
2010年第9期1207-1211,共5页
根据国内首次研制出的载铀材料裂变伽马射线探测器的工作原理及其输入-输出等效电路,利用M.C建模计算的方法研究获得了探测器的灵敏体在δ辐射脉冲作用下产生并输出的脉冲电流波形g0(t),同时通过实验方法研究获得了其灵敏单元在脉冲射...
根据国内首次研制出的载铀材料裂变伽马射线探测器的工作原理及其输入-输出等效电路,利用M.C建模计算的方法研究获得了探测器的灵敏体在δ辐射脉冲作用下产生并输出的脉冲电流波形g0(t),同时通过实验方法研究获得了其灵敏单元在脉冲射线作用下产生的电信号在输出电路中的时间过程gRLC(t),并最终得到了探测器的时间响应特性:响应波形前沿时间为0.72 ns,后沿时间为3.9ns,半宽为2.08 ns,探测器响应时间很快;最后通过数值计算的方法考察了探测器时间响应对不同宽度源波形的影响。结果表明:源波形时间越慢,探测器对其测量的影响就越小,其中探测器的时间响应对于半宽为100 ns的高斯型源波形的峰值、半宽、前沿以及后沿时间的影响基本上都小于0.2%,所以探测器时间响应特性完全满足这样宽度下的脉冲中子源的测量要求,对测量结果不需要进行逆卷积处理。
展开更多
关键词
裂变伽马射线探测器
脉冲辐射测量
时间响应
M.C模拟计算
卷积计算
下载PDF
职称材料
基于FPGA的SqueezeNet推断加速器设计
15
作者
储萍
倪伟
《电子科技》
2022年第2期20-26,共7页
针对轻量型深度神经网络SqueezeNet存在中间流动数据量大及消耗计算周期长等问题,文中提出以处理块结构划分整个网络来加速计算。每个处理块由Expand层和Squeeze层组成。以Squeeze层结束的处理块结构减少了计算模块与内存间流动的中间...
针对轻量型深度神经网络SqueezeNet存在中间流动数据量大及消耗计算周期长等问题,文中提出以处理块结构划分整个网络来加速计算。每个处理块由Expand层和Squeeze层组成。以Squeeze层结束的处理块结构减少了计算模块与内存间流动的中间数据量,降低了读写消耗。利用激活函数的特性,在核心计算模块引入提前结束卷积计算技术,并为其设计有效索引生存单元、有效索引控制取值单元和卷积判断单元,可跳过卷积计算中无效值占用的计算量和计算周期。实验结果表明,该加速器能减少55.38%的数据流动量,并将无效值所占的计算量和计算周期减少14.68%。
展开更多
关键词
轻量型深度网络
SqueezeNet
处理块
激活函数
提前结束卷积计算
有效索引
无效值
计算周期
下载PDF
职称材料
改进SVM结合决策树的情感语音识别
被引量:
2
16
作者
赵康
《信息技术》
2020年第8期17-22,共6页
针对传统情感语音识别方法整体分类精度不高的问题,提出改进SVM结合决策树的情感语音识别方法。首先,提取能量、过零率、幅度以及线性预测系数共四个时域统计特征,基于互相关技术将中性情感语音作为参考,与其余的情感语音相关联。其次,...
针对传统情感语音识别方法整体分类精度不高的问题,提出改进SVM结合决策树的情感语音识别方法。首先,提取能量、过零率、幅度以及线性预测系数共四个时域统计特征,基于互相关技术将中性情感语音作为参考,与其余的情感语音相关联。其次,从每个得到的互相关序列中提取出质心等五个特征。最后,利用提出的改进SVM与决策树的混合模型完成分类识别。在柏林情感语音数据库上的结果表明,提出的方法能有效完成情感语音信号识别。
展开更多
关键词
情感语音识别
改进SVM分类器
决策树
卷积运算
互相关
下载PDF
职称材料
题名
太赫兹超分辨率成像研究进展
被引量:
7
1
作者
曹丙花
张宇盟
范孟豹
孙凤山
刘林
机构
中国矿业大学信息与控制工程学院
中国矿业大学机电工程学院
北京航天计量测试技术研究所
出处
《中国光学》
EI
CAS
CSCD
北大核心
2022年第3期405-417,共13页
基金
国家自然科学基金(No.62071471)
江苏省自然科学基金(No.BK20211244)。
文摘
目前太赫兹(Terahertz,THz)成像技术在许多领域被视为最前沿技术之一,经过20年的发展,取得了巨大进步。随着科研、医疗、军事以及工业应用需求的增长,高分辨率THz图像变得不可或缺。超分辨率成像是目前THz技术的研究热点。本文首先回顾了THz系统的成像方法,包括连续波成像与脉冲波成像两种方式;在此基础上,详细介绍了THz超分辨率成像系统与THz信号处理技术,其中超分辨率成像系统包括近场成像、超透镜以及太喷射装置等,THz信号处理技术包括超分辨率重建与卷积计算等;最后,通过分析目前超分辨率成像存在的不足,比如系统的制造工艺要求高、采集速度慢以及重建图像使用的学习样本分辨率较低等,从而进一步对超分辨率成像研究方向进行展望。
关键词
太赫兹
近场成像
超透镜
光子喷射
超分辨率重建
卷积
Keywords
terahertz
near
field
imaging
super
lens
photon
jet
super
resolution
reconstruction
convolution
calculation
分类号
O43 [机械工程—光学工程]
下载PDF
职称材料
题名
基于TVM平台的MEC卷积算法优化
2
作者
王朝闻
蒋林
李远成
朱筠
机构
西安科技大学计算机科学与技术学院
西安邮电大学电子工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2023年第1期180-186,共7页
基金
科技创新2030-“新一代人工智能”重大项目(2020AAA0104603)
国家自然科学基金重点项目(61834005)
+1 种基金
陕西省自然科学基金(2020JM-525)
榆林市科技计划项目(2019-133)。
文摘
针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部分,采用修改数据读取顺序的方式对其进行优化,使读取方式符合算法的访存行为。对于矩阵运算部分,采用更加适合矩阵运算的内存数据布局对卷积核矩阵修改,并利用TVM(tensor virtual machine)平台封装的计算函数,重新设计中间矩阵同卷积核矩阵的计算方式。使用平台自带并行库对运算过程进行加速。实验结果表明,相比传统MEC算法,提出的优化方法可以有效解决缓存命中率低、内存访问延时长等问题,同MEC算法的运算时间对比,在单个卷积层上平均获得了50%的速度提升,在多层神经网络中最低获得了57%以上的速度提升,同空间组合算法的运算时间对比,最高获得了80%的速度提升。
关键词
卷积计算
访存行为
缓存技术
MEC算法
Keywords
convolution
calculation
memory
access
mode
cache
technology
memory
efficient
convolution
(MEC)algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向内存受限设备的新型卷积计算方法
被引量:
3
3
作者
孙雁飞
王子牛
孙莹
亓晋
董振江
机构
南京邮电大学物联网学院
南京邮电大学江苏省高性能计算与智能处理工程研究中心
南京邮电大学自动化学院、人工智能学院
南京邮电大学计算机学院
出处
《南京邮电大学学报(自然科学版)》
北大核心
2022年第5期54-61,共8页
基金
国家自然科学基金(62172235)
中国博士后基金(2019M651923)
江苏省自然科学基金(BK20191381)资助项目。
文摘
针对卷积神经网络预测过程中内存使用量大,难以部署在内存受限设备上的问题,提出一种面向内存受限设备的新型卷积计算方法。该方法对输入矩阵中部分数据进行卷积计算,并将计算结果存储在临时内存;然后,将临时内存中的计算结果复制到输入矩阵不再使用的内存并重复上述步骤,从而实现对输入矩阵的卷积计算;最后,对单个卷积计算和LeNet进行验证。实验结果表明,该方法计算速度较直接卷积方法更快,且相比im2col、MEC和直接卷积方法,单个卷积计算内存平均使用量分别下降89.29%、82.60%和57.15%,LeNet内存使用量分别下降89.90%、82.21%和28.07%,有效降低了卷积神经网络的内存使用量,有助于在内存受限设备上部署使用。
关键词
深度学习
卷积计算
内存优化
数据复用
边缘设备
Keywords
deep
learning
convolution
calculation
memory
optimization
data
reuse
edge
device
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于GPU并行计算的雷达杂波模拟研究
被引量:
4
4
作者
徐国伟
陈建
成怡
机构
天津工业大学电气工程与自动化学院
天津工业大学天津市电工电能新技术重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第11期306-314,共9页
基金
天津市自然科学基金(17JCYBJC18500,17JCYBJC19400,18JCYBJC88400,18JCYBJC88300)。
文摘
现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下,对相关相干K分布杂波算法进行多任务串-并行分析,采用cuBLAS库对细粒度卷积计算进行优化,利用OpenMP+CUDA多任务调度机制改进粗粒度任务并行计算,以提高CPU-GPU利用率并减少数据等待时间。实验结果表明,该方法生成杂波数据的实时性显著提升,且随着杂波数据量增大其加速效果更好,相较传统GPU方法计算速率提高61%。
关键词
雷达杂波
GPU并行计算
球不变随机过程法
卷积计算
cuBLAS库
Keywords
radar
clutter
GPU
parallel
computing
Spherically
Invariant
Random
Process(SIRP)method
convolution
calculation
cuBLAS
library
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
FIR滤波器的高速实现
被引量:
3
5
作者
袁菁
高勇
机构
四川大学电子信息学院
出处
《数据采集与处理》
CSCD
北大核心
2006年第1期118-122,共5页
基金
四川大学青年基金(200406)资助项目
文摘
介绍了一种实现F IR滤波器高速运算的有效方法。该方法在传统的滤波器系数奇偶对称性的基础上,根据系数经SystemV iew软件量化后成比例的特点,利用加法运算来简化卷积中大量繁琐耗时的乘法运算;同时推导出奇偶对称性的运算规律并给出详细运算步骤和计算公式。最后给出该算法分别与仅利用系数对称性、直接卷积两方法相比较的加速比。仿真结果表明,文中所采取的优化措施能够提高信号处理速度。
关键词
有限冲击响应滤波器
卷积运算
奇偶对称性
Keywords
FIR
filter
convolution
calculation
odd-even
symmetry
分类号
TN713.70 [电子电信—电路与系统]
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
测量杆塔冲击接地电阻的研究
被引量:
4
6
作者
李福权
何斌斌
邓世聪
机构
深圳供电局
出处
《华中电力》
2007年第6期22-25,共4页
文摘
在总结现有的杆塔冲击接地电阻的计算测量方法的基础上,研制了便携式杆塔冲击接地电阻测量系统。它首先向接地体注入波头较缓、幅值较低的冲击电流,接着采集接地体的电压与电流信号,经滤波后再换算到标准雷电流下求出其电压响应,最后求出冲击接地电阻。实验室测试结果与传统的冲击接地电阻测量方法对比表明本系统测量方便且可信度高。
关键词
杆塔
冲击接地电阻
测量
卷积计算
Keywords
tower
impulse
grounding
resistance
measurement
convolution
calculation
分类号
TM934.1 [电气工程—电力电子与电力传动]
TM930.9
下载PDF
职称材料
题名
基于矩阵转换的卷积计算优化方法
被引量:
2
7
作者
方玉玲
陈庆奎
机构
上海理工大学管理学院
上海理工大学光电信息与计算机工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第7期217-221,228,共6页
基金
国家自然科学基金(61572325,60970012)
高等学校博士学科点专项科研博导基金(20113120110008)
+4 种基金
上海重点科技攻关项目(14511107902,16DZ1203603)
上海市工程中心建设项目(GCZX14014)
上海智能家居大规模物联共性技术工程中心项目(GCZX14014)
上海市一流学科建设项目(XTKX2012)
沪江基金研究基地专项(C14001)
文摘
提出一种基于矩阵转换的高效卷积计算优化方法MCFA。根据输出矩阵的宽度和卷积核大小对输入矩阵进行分块,通过im2col方法转换输入矩阵子块和核函数矩阵,利用计算统一设备架构中封装的矩阵-矩阵乘法加速库提升卷积计算的速度。在此基础上,将输出子块按序排列,最终得到完整的输出矩阵。实验结果证明,该方法相比im2col方法能节省61.25 %的计算空间,相比MEC方法能提高20.57 %的计算速度,且在分块情况下可以缓解大输入矩阵引起的缓存压力,提高缓存利用率。
关键词
深度学习
卷积计算
直接卷积
矩阵分块
计算统一设备架构
卷积优化
Keywords
deep
learning
convolution
calculation
direct
convolution
matrix
blocking
Computing
Unified
Device
Architecture(CUDA)
convolution
optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于卷积神经网络的数字分类器的研究与优化
被引量:
3
8
作者
杜阔
李亚
机构
天津科技大学
出处
《现代电子技术》
北大核心
2019年第16期98-103,共6页
基金
国家自然科学基金青年科学基金项目(61705166)~~
文摘
数字识别在邮政编码、车牌数字检测识别等场景有着广泛的应用。以Lenet-5卷积神经网络为基础,研究卷积计算量过大和预测速度慢的问题。对不同的卷积层(首层、中间层、尾层)和网络结构进行了改进和优化,采用不同组合的方案使卷积核连接数减少一定的数量,进行仿真实验。实验结果表明,保证在同一准确率的前提下,综合考虑迭代次数和预测时延,在C3层(中间层)做优化最为合适,总结出的规律和方法也可对复杂卷积神经网络优化提供参考,满足实时性要求高、大数据量的应用场景。
关键词
数字分类器
卷积神经网络
卷积计算
数字识别
网络结构优化
仿真实验
Keywords
digital
classifier
convolution
al
neural
network
convolution
calculation
digital
recognition
network
structureoptimization
simulation
experiment
分类号
TN761.93-34 [电子电信—电路与系统]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一维量子卷积计算
被引量:
3
9
作者
闫茜茜
王鹏程
刘兴云
机构
湖北师范大学物理与电子科学学院
出处
《计算机工程与应用》
CSCD
北大核心
2020年第8期55-59,共5页
文摘
研究了一维信息编码为量子态后进行量子卷积计算的量子线路模型。基于量子图像表示和经典信息的卷积算法,设计出了一维量子卷积计算的量子线路结构,表明量子卷积计算可以以O(n^2)的复杂度计算卷积。与经典卷积相比,量子卷积计算由于利用量子并行计算在计算速率上达到了指数级的加速,为量子卷积神经网络卷积层的设计实施作铺垫。
关键词
量子门
卷积计算
量子线路
Keywords
quantum
gate
convolution
calculation
quantum
circuit
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
水体污染时空分布遥感影像要素深度提取方法
被引量:
3
10
作者
冯新翎
张杰
汤嘉立
机构
江苏理工学院计算机工程学院
东南大学电气工程学院
出处
《计算机仿真》
北大核心
2021年第6期121-124,178,共5页
基金
江苏省博士后科研资助计划(2019K041)。
文摘
针对现有方法影像要素提取精准度不高,易丢失细节信息,不能有效提供全面水体信息的问题,提出水体污染时空分布影像要素深度提取方法。借助ArcGIS水文分析模块生成水系图,建立逐步迭代提取流程,利用主成分变换方法对影像块实行最小化重构,提取影像的主要特征。通过NSCT变换对原始图像进行采样分解,使用卷积计算方式构建自适应池化模型,提取污染水体的纹理特征。基于数学形态学细化水体图像的主要特征与纹理特征结构,构建反演函数进行大气校正,从而完成水污染遥感影像的深度提取。实验结果证明,所提方法提取的遥感影像具有较高精度,同时包含较多细节信息,实用性强,可在水污染检测中推广应用。
关键词
主成分分析
数学形态学
卷积计算
反演函数
Keywords
Principal
component
analysis
Mathematical
morphology
convolution
calculation
Inversion
function
分类号
TP264 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于卷积计算的多层脉冲神经网络的监督学习
被引量:
3
11
作者
张玉平
蔺想红
机构
西北师范大学计算机科学与工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2015年第2期348-353,共6页
基金
国家自然科学基金资助项目(61165002)
文摘
针对脉冲神经元基于精确定时的多脉冲编码信息的特点,提出了一种基于卷积计算的多层脉冲神经网络监督学习的新算法。该算法应用核函数的卷积计算将离散的脉冲序列转换为连续函数,在多层前馈脉冲神经网络结构中,使用梯度下降的方法得到基于核函数卷积表示的学习规则,并用来调整神经元连接的突触权值。在实验部分,首先验证了该算法学习脉冲序列的效果,然后应用该算法对Iris数据集进行分类。结果显示,该算法能够实现脉冲序列复杂时空模式的学习,对非线性模式分类问题具有较高的分类正确率。
关键词
脉冲神经网络
监督学习
卷积计算
梯度下降
Keywords
spiking
neural
networks
supervised
learning
convolution
calculation
gradient
descent
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
MCC-SIMD数据并行卷积计算方法的研究
被引量:
1
12
作者
张发存
赵晓红
王忠
沈绪榜
机构
西安理工大学计算机学院
西安微电子技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第9期34-36,共3页
文摘
主要研究卷积计算的数据并行方法在MCC-SIMD计算机的设计和实现问题。在参考国内外现有资料的基础上,从图论的角度用卷积路径的方法对卷积计算的有关概念进行了严格的形式化定义;分析了4-连接卷积路径下数据并行卷积计算时处理元阵列的移动规律;在此基础上给出了数据并行卷积计算算法;最后对算法的计算复杂性和通信复杂性进行了简要分析。文中还对有关结论进行了证明。
关键词
数据并行
卷积计算
卷积路径
MCC-SIMD计算机
Keywords
Data
parallel
convolution
calculation
convolution
path
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于特征线法的A-Line模型的误差分析与研究
被引量:
1
13
作者
刘欣
王志峰
梁贵书
机构
华北电力大学电气与电子工程学院
出处
《华北电力大学学报(自然科学版)》
CAS
北大核心
2017年第3期22-29,共8页
基金
国家自然科学基金资助项目(51407073)
文摘
传输线模型是电力系统电磁暂态计算的重要组成部分,近几年的研究中提出了几种新的模型,其中A-Line模型是一种基于特征线法的双诺顿模型,相比于J.Marti和ULM模型,由于其计算过程中不需要对传播常数进行拟合,使架空线暂态计算更为简单。然而,该模型在处理频变参数的时域卷积计算中,采用端口电流代替沿线电流,将会产生一定的误差,且该误差与线路参数密切相关,然而现有文献并没有对该模型进行详细的误差分析和适用范围研究。通过对A-Line模型进行特征阻抗和传播常数误差公式推导及线路参数对特征阻抗和传播常数影响的讨论,对A-Line模型的误差及适用范围进行了分析,并通过算例验证了所得分析结论的正确性,为该模型的工程应用提供了理论依据。
关键词
传输线
A-Line模型
特征线法
卷积计算
误差分析
Keywords
transmission
line
A-Line
model
method
of
characteristics
convolution
calculation
error
analysis
分类号
TM134 [电气工程—电工理论与新技术]
下载PDF
职称材料
题名
裂变伽马射线探测器的时间响应特性研究
14
作者
张建华
张传飞
彭太平
王振通
唐登攀
周刚
机构
中国工程物理研究院核物理与化学研究所
出处
《核电子学与探测技术》
CAS
CSCD
北大核心
2010年第9期1207-1211,共5页
基金
中国工程物理研究院双百人才基金项目(ZX02005)资助
文摘
根据国内首次研制出的载铀材料裂变伽马射线探测器的工作原理及其输入-输出等效电路,利用M.C建模计算的方法研究获得了探测器的灵敏体在δ辐射脉冲作用下产生并输出的脉冲电流波形g0(t),同时通过实验方法研究获得了其灵敏单元在脉冲射线作用下产生的电信号在输出电路中的时间过程gRLC(t),并最终得到了探测器的时间响应特性:响应波形前沿时间为0.72 ns,后沿时间为3.9ns,半宽为2.08 ns,探测器响应时间很快;最后通过数值计算的方法考察了探测器时间响应对不同宽度源波形的影响。结果表明:源波形时间越慢,探测器对其测量的影响就越小,其中探测器的时间响应对于半宽为100 ns的高斯型源波形的峰值、半宽、前沿以及后沿时间的影响基本上都小于0.2%,所以探测器时间响应特性完全满足这样宽度下的脉冲中子源的测量要求,对测量结果不需要进行逆卷积处理。
关键词
裂变伽马射线探测器
脉冲辐射测量
时间响应
M.C模拟计算
卷积计算
Keywords
fission
gamma-ray
detector
pulsed
radiation
detection
time
response
Monte
Carlo
simulation
calculation
m
convolution
calculation
分类号
O571.53 [理学—粒子物理与原子核物理]
O633.5 [理学—物理]
下载PDF
职称材料
题名
基于FPGA的SqueezeNet推断加速器设计
15
作者
储萍
倪伟
机构
合肥工业大学电子科学与应用物理学院
出处
《电子科技》
2022年第2期20-26,共7页
基金
安徽高校协同创新项目(PA2019AGXC0127)。
文摘
针对轻量型深度神经网络SqueezeNet存在中间流动数据量大及消耗计算周期长等问题,文中提出以处理块结构划分整个网络来加速计算。每个处理块由Expand层和Squeeze层组成。以Squeeze层结束的处理块结构减少了计算模块与内存间流动的中间数据量,降低了读写消耗。利用激活函数的特性,在核心计算模块引入提前结束卷积计算技术,并为其设计有效索引生存单元、有效索引控制取值单元和卷积判断单元,可跳过卷积计算中无效值占用的计算量和计算周期。实验结果表明,该加速器能减少55.38%的数据流动量,并将无效值所占的计算量和计算周期减少14.68%。
关键词
轻量型深度网络
SqueezeNet
处理块
激活函数
提前结束卷积计算
有效索引
无效值
计算周期
Keywords
lightweight
deep
neural
network
SqueezeNet
process
block
activation
function
early
termination
of
the
convolution
calculation
effective
index
invalid
value
calculation
period
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN99 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
改进SVM结合决策树的情感语音识别
被引量:
2
16
作者
赵康
机构
商丘职业技术学院
出处
《信息技术》
2020年第8期17-22,共6页
基金
河南省高等学校重点科研项目(15A520118)
河南省科技厅软科学研究计划项目(142400411213)。
文摘
针对传统情感语音识别方法整体分类精度不高的问题,提出改进SVM结合决策树的情感语音识别方法。首先,提取能量、过零率、幅度以及线性预测系数共四个时域统计特征,基于互相关技术将中性情感语音作为参考,与其余的情感语音相关联。其次,从每个得到的互相关序列中提取出质心等五个特征。最后,利用提出的改进SVM与决策树的混合模型完成分类识别。在柏林情感语音数据库上的结果表明,提出的方法能有效完成情感语音信号识别。
关键词
情感语音识别
改进SVM分类器
决策树
卷积运算
互相关
Keywords
emotional
speech
recognition
improved
SVM
classifier
decision
tree
convolution
calcul
ating
cross-correlation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
太赫兹超分辨率成像研究进展
曹丙花
张宇盟
范孟豹
孙凤山
刘林
《中国光学》
EI
CAS
CSCD
北大核心
2022
7
下载PDF
职称材料
2
基于TVM平台的MEC卷积算法优化
王朝闻
蒋林
李远成
朱筠
《计算机工程与应用》
CSCD
北大核心
2023
0
下载PDF
职称材料
3
面向内存受限设备的新型卷积计算方法
孙雁飞
王子牛
孙莹
亓晋
董振江
《南京邮电大学学报(自然科学版)》
北大核心
2022
3
下载PDF
职称材料
4
基于GPU并行计算的雷达杂波模拟研究
徐国伟
陈建
成怡
《计算机工程》
CAS
CSCD
北大核心
2020
4
下载PDF
职称材料
5
FIR滤波器的高速实现
袁菁
高勇
《数据采集与处理》
CSCD
北大核心
2006
3
下载PDF
职称材料
6
测量杆塔冲击接地电阻的研究
李福权
何斌斌
邓世聪
《华中电力》
2007
4
下载PDF
职称材料
7
基于矩阵转换的卷积计算优化方法
方玉玲
陈庆奎
《计算机工程》
CAS
CSCD
北大核心
2019
2
下载PDF
职称材料
8
基于卷积神经网络的数字分类器的研究与优化
杜阔
李亚
《现代电子技术》
北大核心
2019
3
下载PDF
职称材料
9
一维量子卷积计算
闫茜茜
王鹏程
刘兴云
《计算机工程与应用》
CSCD
北大核心
2020
3
下载PDF
职称材料
10
水体污染时空分布遥感影像要素深度提取方法
冯新翎
张杰
汤嘉立
《计算机仿真》
北大核心
2021
3
下载PDF
职称材料
11
基于卷积计算的多层脉冲神经网络的监督学习
张玉平
蔺想红
《计算机工程与科学》
CSCD
北大核心
2015
3
下载PDF
职称材料
12
MCC-SIMD数据并行卷积计算方法的研究
张发存
赵晓红
王忠
沈绪榜
《计算机工程》
CAS
CSCD
北大核心
2004
1
下载PDF
职称材料
13
基于特征线法的A-Line模型的误差分析与研究
刘欣
王志峰
梁贵书
《华北电力大学学报(自然科学版)》
CAS
北大核心
2017
1
下载PDF
职称材料
14
裂变伽马射线探测器的时间响应特性研究
张建华
张传飞
彭太平
王振通
唐登攀
周刚
《核电子学与探测技术》
CAS
CSCD
北大核心
2010
0
下载PDF
职称材料
15
基于FPGA的SqueezeNet推断加速器设计
储萍
倪伟
《电子科技》
2022
0
下载PDF
职称材料
16
改进SVM结合决策树的情感语音识别
赵康
《信息技术》
2020
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部