期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
平行十二面体区域上的快速离散傅立叶变换及其并行实现 被引量:6
1
作者 姚继锋 孙家昶 《数值计算与计算机应用》 CSCD 北大核心 2004年第4期303-314,共12页
In this paper, we propose a fast algorithm for computing the Discrete Generalized Fourier Transforms on parallel dodecahedron domains with 3 dimensions and 4 directions. Our fast algorithm (HFFT) reduces the computati... In this paper, we propose a fast algorithm for computing the Discrete Generalized Fourier Transforms on parallel dodecahedron domains with 3 dimensions and 4 directions. Our fast algorithm (HFFT) reduces the computation complexity of DGFT from O(N^6) to O(N^3log N). A parallel implementation is given and it has been run on a Linux Cluster up to 32 CPUs. 展开更多
关键词 平行十二面体 快速离散傅立叶变换 并行计算 线性无关向量 矩阵
原文传递
一种滚筒BLDC电机电磁仿真分析方法研究及应用 被引量:3
2
作者 柳瑞锋 吴越虹 +1 位作者 冯国平 程云峰 《家电科技》 2021年第S01期381-384,共4页
在振动噪声领域,电磁振动噪声和电磁激励力一直是研究的热点和难点。通过建立电磁力仿真标准模型,得到气隙磁场的三维分布,制订3D FFT的处理流程,确定了电磁力的空间阶次和时间频率两大特性,从而解决了电磁力仿真标准化问题。为了验证... 在振动噪声领域,电磁振动噪声和电磁激励力一直是研究的热点和难点。通过建立电磁力仿真标准模型,得到气隙磁场的三维分布,制订3D FFT的处理流程,确定了电磁力的空间阶次和时间频率两大特性,从而解决了电磁力仿真标准化问题。为了验证本技术的实用性,选取两款电机进行电磁力仿真,测试这两款电机的电磁振动,与电磁力仿真结果趋势进行对比,确定了本方法的准确性。最后在某新品上进行验证,在设计阶段针对性的对原方案进行电磁力优化,最终通过制样电机对比两种方案电磁振动,电机2倍电频电磁振动下降53%,验证了本方法的有效性和实用性。 展开更多
关键词 电磁力 气隙磁场 3D fft 空间阶次 时间频率
下载PDF
Memory Efficient Two-Pass 3D FFT Algorithm for Intel~ Xeon Phi^(TM) Coprocessor 被引量:2
3
作者 刘益群 李焱 +1 位作者 张云泉 张先轶 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第6期989-1002,共14页
Equipped with 512-bit wide SIMD inst d large numbers of computing cores, the emerging x86-based Intel(R) Many Integrated Core (MIC) Architecture ot only high floating-point performance, but also substantial ... Equipped with 512-bit wide SIMD inst d large numbers of computing cores, the emerging x86-based Intel(R) Many Integrated Core (MIC) Architecture ot only high floating-point performance, but also substantial off-chip memory bandwidth. The 3D FFT (three-di fast Fourier transform) is a widely-studied algorithm; however, the conventional algorithm needs to traverse the three times. In each pass, it computes multiple 1D FFTs along one of three dimensions, giving rise to plenty of rided memory accesses. In this paper, we propose a two-pass 3D FFT algorithm, which mainly aims to reduce of explicit data transfer between the memory and the on-chip cache. The main idea is to split one dimension into ensions, and then combine the transform along each sub-dimension with one of the rest dimensions respectively erence in amount of TLB misses resulting from decomposition along different dimensions is analyzed in detail. el parallelism is leveraged on the many-core system for a high degree of parallelism and better data reuse of loc On top of this, a number of optimization techniques, such as memory padding, loop transformation and vectoriz employed in our implementation to further enhance the performance. We evaluate the algorithm on the Intel(R) PhiTM coprocessor 7110P, and achieve a maximum performance of 136 Gflops with 240 threads in offload mode, which ts the vendor-specific Intel(R)MKL library by a factor of up to 2.22X. 展开更多
关键词 3D-fft memory efficie many-core Many Integrated Core Intel(R) Xeon PhiTM
原文传递
基于CORDIC旋转器的基-3 FFT算法高效设计
4
作者 周群群 许思耀 +1 位作者 姚亚峰 付东兵 《电子器件》 CAS 北大核心 2023年第2期342-348,共7页
设计出一种可以用于FPGA高效实现的基-3 FFT算法,采用改进的三端前馈延迟转换器结构,优化了延迟和运算过程。针对蝶形运算中复数乘法器占据大量内存的问题,引入了CORDIC旋转器实现输入与旋转因子相乘的运算,可以降低乘法运算的复杂度,该... 设计出一种可以用于FPGA高效实现的基-3 FFT算法,采用改进的三端前馈延迟转换器结构,优化了延迟和运算过程。针对蝶形运算中复数乘法器占据大量内存的问题,引入了CORDIC旋转器实现输入与旋转因子相乘的运算,可以降低乘法运算的复杂度,该CORDIC旋转器采用改进的高基CORDIC算法,解决了传统的CORDIC算法迭代次数多、延迟大的问题,从而达到高吞吐率要求。该基-3 FFT算法以寻址变序、流水处理的方式,可以满足最高运行频率为404 MHz的FFT处理要求。与基于传统复数乘法器的基-3 FFT算法相比,基于CORDIC旋转器的基-3 FFT算法使功耗平均减少了22%,使总延迟平均减少了29%。 展开更多
关键词 基-3 fft算法 三端前馈延迟转换器 正则有符号数 CORDIC旋转器 FPGA实现
下载PDF
三维向量基快速傅立叶算法 被引量:2
5
作者 吴云峰 徐妮妮 +1 位作者 肖志涛 侯正信 《计算机应用》 CSCD 北大核心 2009年第2期618-621,共4页
给出了三维向量基快速傅立叶变换(3-D Vector Radix FFT)算法。对三维信号采用基2时域抽取,导出了该算法蝶形运算的一般形式。计算量比较结果显示,三维向量基FFT算法比基于行列分解的三维FFT算法计算量低,计算效率高。
关键词 三维向量基fft算法 蝶形运算 行列分解三维fft算法
下载PDF
基于Gauss-FFT技术高精度三维磁异常ΔT正演 被引量:1
6
作者 曾明 柳建新 +2 位作者 陈波 赵广东 陈龙伟 《物探化探计算技术》 CAS 2019年第4期495-502,共8页
三维磁异常傅里叶正演,能够计算整个场源区域内与磁化率分布网格一致的三维磁异常。通过三维傅里叶变换推导了长方体三维磁谱表达式,当源体埋藏较深或者位于反演区域边缘时,标准FFT正演异常场由于强制周期化,边界震荡等原因,使得正演结... 三维磁异常傅里叶正演,能够计算整个场源区域内与磁化率分布网格一致的三维磁异常。通过三维傅里叶变换推导了长方体三维磁谱表达式,当源体埋藏较深或者位于反演区域边缘时,标准FFT正演异常场由于强制周期化,边界震荡等原因,使得正演结果发生较大的畸变,为了减少标准FFT算法引起的误差,引入了3DGauss-FFT技术用于三维磁异常频率域正演。通过简单的模型正演验证,从计算时间、计算精度以及内存需求上与空间域算法及标准3DFFT算法进行比较,结果表明,3DGauss-FFT磁异常正演相比于标准FFT算法在计算精度上有很大提升,显著降低了标准3DFFT由于自身缺陷引起的误差,且在运行时间上,4点3DGauss-FFT磁异常正演算法相对于空间域算法降低了三个数量级,但内存需求有所增加,证明了3DGauss-FFT正演方法在磁异常正演方面的高效性以及准确性。 展开更多
关键词 磁异常ΔT 3DGauss-fft 磁化率 频率域正演
下载PDF
非2-基FFT的素因子算法研究 被引量:1
7
作者 蒋蓝祥 刘昌银 《电视技术》 北大核心 2013年第1期4-7,共4页
提出一种新的非2-基N点FFT的素因子算法。该方案与原素因子分解算法比较,实现了各个小点数DFT的同址顺序运算,并通过简单的地址模加运算得到顺序的输出,省去了多余的整序运算,是一种通用N点FFT算法。设计结构规整简单,利于硬件实现。以... 提出一种新的非2-基N点FFT的素因子算法。该方案与原素因子分解算法比较,实现了各个小点数DFT的同址顺序运算,并通过简单的地址模加运算得到顺序的输出,省去了多余的整序运算,是一种通用N点FFT算法。设计结构规整简单,利于硬件实现。以中国数字电视广播地面传输标准(DTMB)规定的3 780点FFT为例,结合WFTA算法和混合基算法,介绍了算法的具体设计与实现方案。 展开更多
关键词 素因子算法 同址 顺序 3 780点 fft
下载PDF
一种小面积的基-3蝶形单元设计
8
作者 马翠梅 陈禾 杜青 《北京理工大学学报》 EI CAS CSCD 北大核心 2013年第10期1067-1071,共5页
为减少该蝶形单元在硬件实现中的资源消耗,提出了一种基于单精度浮点运算的基-3蝶形单元设计.采用兼容缩放的方法来解决该蝶形单元中乘法运算,其中槡3采用的缩放因子为223.与槡3的乘法操作采用有限个定点加法器来实现.通过理论分析,该... 为减少该蝶形单元在硬件实现中的资源消耗,提出了一种基于单精度浮点运算的基-3蝶形单元设计.采用兼容缩放的方法来解决该蝶形单元中乘法运算,其中槡3采用的缩放因子为223.与槡3的乘法操作采用有限个定点加法器来实现.通过理论分析,该方法减少了加法器的个数,同时减少了寄存器的数量.通过对比得出,本文采用的方法在原有的基础上减少了1个加法器和2个48位寄存器.此外,基-3蝶形单元采用降低乘法操作数目的实现形式,使得与实数相乘的乘法数目由原来的4个降为2个.实验结果表明,本文采用的方法节省了基-3蝶形单元实现所需的硬件资源,为降低基-3FFT实现的资源消耗打下了基础. 展开更多
关键词 单精度浮点 基-3 fft 兼容缩放 硬件资源
下载PDF
LTE系统中基3的FFT设计与FPGA实现
9
作者 史亚维 《电子世界》 2016年第10期67-67,共1页
在LTE系统中存在基3和基5的FFT的情况,但是目前FFT的算法优化和实现主要是基2或基4,很少有研究基3和基5的算法与实现的。因此,本文主要对LTE系统中基3的WFTA算法和FPGA实现进行研究分析,最后对3点FFT进行RTL代码实现综合与后仿真。
关键词 LTE系统 3fft FPGA
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部