期刊文献+
共找到76篇文章
< 1 2 4 >
每页显示 20 50 100
流水线结构FFT/IFFT处理器的设计与实现 被引量:9
1
作者 何星 张铁军 侯朝焕 《微电子学与计算机》 CSCD 北大核心 2007年第4期141-143,147,共4页
针对实时高速信号处理的要求,设计并实现了一种高效的FFT处理器。在分析了FFT算法的复杂度和硬件实现结构的基础上,处理器采用了按频率抽取的基-4算法,分级流水线以及定点运算结构。可以根据要求设置成4P点的FFT或IFFT。处理器可以对多... 针对实时高速信号处理的要求,设计并实现了一种高效的FFT处理器。在分析了FFT算法的复杂度和硬件实现结构的基础上,处理器采用了按频率抽取的基-4算法,分级流水线以及定点运算结构。可以根据要求设置成4P点的FFT或IFFT。处理器可以对多个输入序列进行连续的FFT运算,消除了数据的输入输出对延时的影响,平均每完成一次N点FFT运算仅需要N个时钟周期。整个设计基于Verilog HDL语言进行模块化设计,并在Altera公司的CycloneII器件上实现。 展开更多
关键词 FFT 流水线 基—4 蝶形运算
下载PDF
基于Radix-4 Booth编码的并行乘法器设计
2
作者 范文兵 周健章 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期26-33,共8页
速度和面积是评价乘法器单元性能优劣的两个基本指标。针对当前乘法器设计难以平衡版图面积和传输延时的问题,采用Radix-4 Booth算法,设计了一种新型的16位有符号定点乘法器。在部分积生成过程中,首先改进对乘数的取补码电路,然后优化... 速度和面积是评价乘法器单元性能优劣的两个基本指标。针对当前乘法器设计难以平衡版图面积和传输延时的问题,采用Radix-4 Booth算法,设计了一种新型的16位有符号定点乘法器。在部分积生成过程中,首先改进对乘数的取补码电路,然后优化基数为4的改进Booth编码器和解码器,此结构采用较少的逻辑门资源,并且易对输入比特进行并行化处理。在Wallace压缩电路中,对符号扩展位进行预处理并设计新的压缩器结构,优化整个Wallace压缩模块。在第二级压缩过程中提前对高位使用纹波进位加法器结构计算,减小了多bit伪和的求和位数。在求和电路中,使用两级超前进位加法器结构,在缩短关键路径传输延时的同时避免增大芯片面积,提高了乘法器的运行速度。新型定点乘法器与已有的乘法器结构相比,减少了12.0%的面积,降低了20.5%的延时。 展开更多
关键词 radix-4 Booth编码 面积 传输延时 编码器 解码器 Wallace压缩
一种减小SRT浮点算法时延的优化方法 被引量:2
3
作者 刘华平 胡伟武 《计算机研究与发展》 EI CSCD 北大核心 2003年第11期1650-1656,共7页
基于传统SRT除法算法的实现,提出了一种并行度更大的优化方法,即让传统SRT结构中组成商选择的相对独立两部分(包括计算选择函数表输入值和查找选择函数表)并行执行,从而缩短整体设计的时延.针对SRT算法基数为4,基数为8,基数为16的不同情... 基于传统SRT除法算法的实现,提出了一种并行度更大的优化方法,即让传统SRT结构中组成商选择的相对独立两部分(包括计算选择函数表输入值和查找选择函数表)并行执行,从而缩短整体设计的时延.针对SRT算法基数为4,基数为8,基数为16的不同情况,使用Verilog硬件描述语言分别设计传统结构和相应的优化结构,然后通过DesignCompiler综合工具(采用.18标准单元库)得出时延和面积.实验结果表明,对于基数4的SRT算法,优化结构比传统结构时延大约能减小13.30%(减小的时延大约0.27ns),面积增加了5.02%;对于基数8的SRT算法,时延大约能减小22.31%(减小的时延大约为0.54ns),面积增加了31.94%;而对于基数16的SRT算法.时延大约能减小12.41%(减小的时延大约为0.33ns),但面积增加了259.59%. 展开更多
关键词 SRT 4 基8 基16
下载PDF
基于高速FFT结构的频域抗干扰算法的FPGA实现 被引量:4
4
作者 周景龙 《微电子学与计算机》 CSCD 北大核心 2014年第5期32-35,共4页
提出了一种基于高速FFT结构的算法硬件设计与实现,FFT采用基4算法,旋转因子采用CORDIC算法生成,节省了存储资源,最后在硬件平台上测试,取得了很好的抗干扰效果.
关键词 频域抗干扰算法 FFT 4 CORDIC
下载PDF
VB高速译码算法及其FPGA实现 被引量:1
5
作者 孙猛 《中国有线电视》 北大核心 2004年第3期13-18,共6页
根据DVB -T标准中FEC内码的要求 ,采用FPGA技术实现了R =1/2 ,6 4状态 ,基 4 ,16电平软判决高速Viterbi译码器。通过将原有基 2蝶形运算分裂为基 4蝶形运算 ,构造出 4路ACS单元。由 4个 4路ACS单元构成的基 4ACS模块一次可以得到 4个状... 根据DVB -T标准中FEC内码的要求 ,采用FPGA技术实现了R =1/2 ,6 4状态 ,基 4 ,16电平软判决高速Viterbi译码器。通过将原有基 2蝶形运算分裂为基 4蝶形运算 ,构造出 4路ACS单元。由 4个 4路ACS单元构成的基 4ACS模块一次可以得到 4个状态的两步路径更新 ,使得译码速度提高了 1倍。 展开更多
关键词 FPGA VITERBI译码器 ACS DVB—T VB译码算法
下载PDF
DVB-T接收系统中2k-8k FFT处理器的设计及ROM优化 被引量:1
6
作者 黄秋元 雷艳敏 李卫国 《微电子学与计算机》 CSCD 北大核心 2009年第2期16-20,共5页
结合高速、实时快速傅立叶变换的实际需求,设计并实现了一种采用多级级联的同步流水线结构、基于SRAM、SDF(single-path delay feedback)、DIF等结构与方法的2k与8k共享硬件结构的变模FFT处理器.2k/8kFFT处理分解为5/6级基4蝶形单元与1... 结合高速、实时快速傅立叶变换的实际需求,设计并实现了一种采用多级级联的同步流水线结构、基于SRAM、SDF(single-path delay feedback)、DIF等结构与方法的2k与8k共享硬件结构的变模FFT处理器.2k/8kFFT处理分解为5/6级基4蝶形单元与1级基2蝶形单元的级联,并对存储旋转因子的ROM面积进行了最优化处理.本FFT处理器整体划分为多个模块,RTL电路全部采用Verilog HDL硬件语言描述,并对其进行了功能一致性仿真验证及RTL综合. 展开更多
关键词 DVB-T FFT 旋转因子 ROM radix-4
下载PDF
基于改进滑动窗的Turbo译码算法研究 被引量:2
7
作者 申敏 蔡晓 《通信技术》 2013年第3期1-3,共3页
首先介绍LTE-A系统中Turbo编译码器的结构和译码原理,分析RADIX-4 Turbo译码算法。然后介绍Turbo译码的两种滑动窗算法,并提出一种性能损失较小的改进滑动窗算法。在此基础上,结合并行译码、RADIX-4 Turbo译码算法,提出一种适用于LTE-A... 首先介绍LTE-A系统中Turbo编译码器的结构和译码原理,分析RADIX-4 Turbo译码算法。然后介绍Turbo译码的两种滑动窗算法,并提出一种性能损失较小的改进滑动窗算法。在此基础上,结合并行译码、RADIX-4 Turbo译码算法,提出一种适用于LTE-A系统的Turbo译码算法,并与目前主要的几种Turbo译码算法进行运算复杂度、存储开销方面的比较和性能仿真。比较和仿真结果表明所提出的Turbo译码算法在性能损失较小的同时具有低时延低存储的特性,能够满足LTE-A系统中高速Turbo译码的要求。 展开更多
关键词 TURBO 滑动窗 并行译码 radix-4
原文传递
基于Radix-4实现高速Viterbi译码器设计
8
作者 马力 陈泳恩 《通信技术》 2002年第3X期13-14,17,共3页
使用一种新的Viterbi译码器设计方法来达到高速率、低功耗设计。在传统Viterbi译码器中,ACS(add-compare-select)单元是基于radix-2网格设计的,而这里将介绍一种新的ACS设计方法,即基于radix-4网格的ACS单元设计。每个这样的ACS单元将有... 使用一种新的Viterbi译码器设计方法来达到高速率、低功耗设计。在传统Viterbi译码器中,ACS(add-compare-select)单元是基于radix-2网格设计的,而这里将介绍一种新的ACS设计方法,即基于radix-4网格的ACS单元设计。每个这样的ACS单元将有4路输入,即在每个时钟周期能够处理两级传统的基于radix-2设计的两级网格。同时在这里的Viterbi译码器设计中采用了Top-To-Down设计思想,用Verilog语言来描述RTL电路层。并用QuartusII软件进行电路仿真和综合。用本算法在33.333MHz时钟下实观在Altera公司的APEX20KFPGA的64状态Viterbi译码器译码速率可达8Mbps以上,且仅占用很小的硬件资源。采用此方法设计的高速Viterbi解码器SoftIPCore可应用于需要高速,低功耗译码的多媒体移动通讯上。 展开更多
关键词 VITERBI译码器 radix-4 VERILOG
原文传递
基于FPGA的R-64 FFT处理器的实现 被引量:2
9
作者 覃敏东 梁华国 欧阳一鸣 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第8期1121-1124,共4页
快速傅里叶变换(FFT)处理器是大多数数字信号处理和数字通信系统的关键部件。文章实现了一种4 k(4 096)点改进的R-64(基-64)FFT处理器,相对于其他R-4的流水线结构,具有占用资源更少、控制更简单等特点。该FFT处理器采用浮点数制流水线结... 快速傅里叶变换(FFT)处理器是大多数数字信号处理和数字通信系统的关键部件。文章实现了一种4 k(4 096)点改进的R-64(基-64)FFT处理器,相对于其他R-4的流水线结构,具有占用资源更少、控制更简单等特点。该FFT处理器采用浮点数制流水线结构,能够连续处理输入数据,对R-4处理单元的改进减少了62.5%的复数加法器;该FFT处理器基于FPGA的系统时钟能够达到89 MHz,数据吞吐量为4 096 point/46μs。 展开更多
关键词 快速傅里叶变换 R-4 R-64 浮点 现场可编程门阵列
下载PDF
Design of area and power efficient Radix-4 DIT FFT butterfly unit using floating point fused arithmetic 被引量:2
10
作者 Prabhu E Mangalam H Karthick S 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第7期1669-1681,共13页
In this work, power efficient butterfly unit based FFT architecture is presented. The butterfly unit is designed using floating-point fused arithmetic units. The fused arithmetic units include two-term dot product uni... In this work, power efficient butterfly unit based FFT architecture is presented. The butterfly unit is designed using floating-point fused arithmetic units. The fused arithmetic units include two-term dot product unit and add-subtract unit. In these arithmetic units, operations are performed over complex data values. A modified fused floating-point two-term dot product and an enhanced model for the Radix-4 FFT butterfly unit are proposed. The modified fused two-term dot product is designed using Radix-16 booth multiplier. Radix-16 booth multiplier will reduce the switching activities compared to Radix-8 booth multiplier in existing system and also will reduce the area required. The proposed architecture is implemented efficiently for Radix-4 decimation in time(DIT) FFT butterfly with the two floating-point fused arithmetic units. The proposed enhanced architecture is synthesized, implemented, placed and routed on a FPGA device using Xilinx ISE tool. It is observed that the Radix-4 DIT fused floating-point FFT butterfly requires 50.17% less space and 12.16% reduced power compared to the existing methods and the proposed enhanced model requires 49.82% less space on the FPGA device compared to the proposed design. Also, reduced power consumption is addressed by utilizing the reusability technique, which results in 11.42% of power reduction of the enhanced model compared to the proposed design. 展开更多
关键词 floating-point arithmetic floating-point fused dot product radix-16 booth multiplier radix-4 FFT butterfly fast fouriertransform decimation in time
下载PDF
基于Radix-4 Booth编码的模2^n+1乘法器设计 被引量:1
11
作者 鄢斌 李军 《通信技术》 2015年第10期1168-1173,共6页
模2n+1乘法(n=8、16)在分组密码算法中比较常见,如IDEA算法,但由于其实现逻辑复杂,往往被视为密码算法性能的瓶颈。提出了一种适用于分组密码算法运算特点的基于Radix-4Booth编码的模2n+1乘法器实现方法,其输入/输出均无需额外的转换电... 模2n+1乘法(n=8、16)在分组密码算法中比较常见,如IDEA算法,但由于其实现逻辑复杂,往往被视为密码算法性能的瓶颈。提出了一种适用于分组密码算法运算特点的基于Radix-4Booth编码的模2n+1乘法器实现方法,其输入/输出均无需额外的转换电路,并通过简化部分积生成、采用重新定义的3-2和4-2压缩器等措施以减少路径时延和硬件复杂度。比较其他同类设计,该方法具有较小的面积、时延,可有效提高分组密码算法的加解密性能。 展开更多
关键词 分组密码算法 radix-4 BOOTH编码 3—2和4-2压缩器 模2^n+1乘法
下载PDF
基于FPGA的高速基4FFT设计与实现 被引量:2
12
作者 王金川 高强 高光辉 《物联网技术》 2012年第7期38-40,44,共4页
针对实时高速信号处理要求,设计并实现了一种基于FPGA的高速流水线结构的基4FFT处理器。根据各种不同基算法的运算量、硬件面积和控制复杂度,选定按时间抽取的基4算法,同时采用单路延时反馈(Single-path Delay Feedback,SDF)流水线结构... 针对实时高速信号处理要求,设计并实现了一种基于FPGA的高速流水线结构的基4FFT处理器。根据各种不同基算法的运算量、硬件面积和控制复杂度,选定按时间抽取的基4算法,同时采用单路延时反馈(Single-path Delay Feedback,SDF)流水线结构,提高了处理速度。通过Verilog HDL语言进行模块化描述和验证,结果表明,该FFT处理器具有较高性能。 展开更多
关键词 FFT 流水线 4 蝶形运算
下载PDF
现场可编程门阵列参数化多标准高吞吐率基4Viterbi译码器 被引量:2
13
作者 夏飞 聂晶 +1 位作者 李荣春 王文涛 《国防科技大学学报》 EI CAS CSCD 北大核心 2016年第1期86-92,共7页
为了同时达到高性能和灵活性的目标,提出一种基于现场可编程门阵列的参数化多标准自适应基4 Viterbi译码器。译码器采用3~9可变约束长度,1/2、1/3可变码率,支持任意截断长度的纠错译码,并采用码字无符号量化、加比选单元设计优化和归一... 为了同时达到高性能和灵活性的目标,提出一种基于现场可编程门阵列的参数化多标准自适应基4 Viterbi译码器。译码器采用3~9可变约束长度,1/2、1/3可变码率,支持任意截断长度的纠错译码,并采用码字无符号量化、加比选单元设计优化和归一化判断逻辑分离策略优化关键路径设计,提高译码器工作频率。实验结果表明,该译码器能根据用户设定的参数改变结构,在多种通信标准之间实现动态切换;性能达到了541 Mbps,明显优于相关工作;对GPRS,Wi MAX,LTE,CDMA,3G等通信标准都取得了良好的误码性能,可满足多种通信标准的译码需求。 展开更多
关键词 现场可编程门阵列 VITERBI译码器 参数化 多标准 4
下载PDF
OFDM系统中IFFT/FFT处理器的设计与实现 被引量:2
14
作者 刘洪涛 杨红官 胡赞民 《计算机工程与应用》 CSCD 北大核心 2011年第1期60-63,共4页
提出了Radix-4 FFT的优化算法,采用该优化算法设计了64点流水线IFFT/FFT处理器,该处理器可以在64个时钟周期内仅采用3个复数乘法器获得64点处理结果,提高了运算速度,节约了硬件资源。通过Xilinx XC2S300E Spartan2E系列的xc2s300e器件... 提出了Radix-4 FFT的优化算法,采用该优化算法设计了64点流水线IFFT/FFT处理器,该处理器可以在64个时钟周期内仅采用3个复数乘法器获得64点处理结果,提高了运算速度,节约了硬件资源。通过Xilinx XC2S300E Spartan2E系列的xc2s300e器件进行下载验证,仿真结果与MATLAB计算结果误差小于0.5%,该处理器已经成功应用于某OFDM通信系统中。 展开更多
关键词 正交频分复用(OFDM) 反快速傅里叶变换/快速傅里叶变换(IFFT/FFT) 4算法 现场可编程门阵列(FPGA)
下载PDF
基于RADIX-4的Turbo码全并行译码算法 被引量:1
15
作者 赵瑞祥 潘克刚 王欣婷 《电讯技术》 北大核心 2021年第4期468-475,共8页
针对Turbo码全并行译码算法译码迭代次数多、硬件消耗大的问题,提出了一种基于RADIX-4的改进译码算法。将译码算法中状态转移图的相邻两步状态合并为一步计算,译码时以"比特对"的形式操作进行迭代。在保留译码最大并行度同时... 针对Turbo码全并行译码算法译码迭代次数多、硬件消耗大的问题,提出了一种基于RADIX-4的改进译码算法。将译码算法中状态转移图的相邻两步状态合并为一步计算,译码时以"比特对"的形式操作进行迭代。在保留译码最大并行度同时,译码计算单元使用量减少一半,显著降低了Turbo码全并行译码算法的运算复杂度和存储开销。仿真结果表明,在相同迭代次数条件下,该方法的译码性能较全并行译码算法平均提高约0.5 d B。 展开更多
关键词 TURBO码 全并行译码 radix-4 比特对
下载PDF
基于FPGA的FFT处理器的设计与实现
16
作者 胡其明 曹闹昌 刘东斌 《现代电子技术》 2008年第2期74-76,共3页
对FFT处理器的实现算法-频域抽取基4算法做了介绍。介绍一种以FPGA作为设计载体,设计和实现一套集成于FPGA内部的FFT处理器的方法和设计过程。FFT处理器的硬件试验结果表明该处理器的运算结果正确,并且具有较高运算速度。该方法具有设... 对FFT处理器的实现算法-频域抽取基4算法做了介绍。介绍一种以FPGA作为设计载体,设计和实现一套集成于FPGA内部的FFT处理器的方法和设计过程。FFT处理器的硬件试验结果表明该处理器的运算结果正确,并且具有较高运算速度。该方法具有设计简单灵活,体积小等优点,可用于雷达处理、高速图像处理和数字通信等应用场合。 展开更多
关键词 FFT FPGA 4算法 硬件实验结果
下载PDF
基于WiMax的OFDM模式的低开销FFT设计
17
作者 熊道琪 黑勇 周玉梅 《半导体技术》 CAS CSCD 北大核心 2008年第9期829-832,共4页
研究一种适用于IEEE802.16e(WiMax)正交频分复用(OFDM)模式的256点低开销FFT处理器,采用基于存储器结构和原位计算(in-place)存储方法来减小面积开销,同时采用基4(radix-4)的算法来降低时钟频率从而降低功耗,提出了一种新的门控时钟来... 研究一种适用于IEEE802.16e(WiMax)正交频分复用(OFDM)模式的256点低开销FFT处理器,采用基于存储器结构和原位计算(in-place)存储方法来减小面积开销,同时采用基4(radix-4)的算法来降低时钟频率从而降低功耗,提出了一种新的门控时钟来控制功耗较大的乘法单元,该方法降低了6%的功耗,并且用SMIC 0.13μm的CMOS工艺实现FFT的设计,芯片核大小为585μm×585μm,功耗为4.48 mW@48 MHz,满足低开销的设计要求。 展开更多
关键词 正交频分复用 快速傅里叶变化 4 原位计算 低功耗 门控时钟
下载PDF
基于FPGA的FFT处理器的研究与设计 被引量:1
18
作者 王东光 王勇 《微计算机信息》 2009年第23期141-142,73,共3页
本文利用频域抽取基四算法,运用灵活的硬件描述语言-VerilogHDL作为设计主体,设计并实现一套集成于FPGA内部的FFT处理器。FFT处理器的硬件试验结果表明该处理器的运算结果正确,并且具有较高运算速度。该方法具有设计简单灵活,体积小等优... 本文利用频域抽取基四算法,运用灵活的硬件描述语言-VerilogHDL作为设计主体,设计并实现一套集成于FPGA内部的FFT处理器。FFT处理器的硬件试验结果表明该处理器的运算结果正确,并且具有较高运算速度。该方法具有设计简单灵活,体积小等优点,可用于雷达处理、高速图像处理和数字通信等应用场合。 展开更多
关键词 4 FFT FPGA
下载PDF
高速基-4FFT处理器的设计与实现 被引量:1
19
作者 杜鹏程 张晓林 苏琳琳 《遥测遥控》 2012年第1期64-68,共5页
针对卫星导航基带信号处理应用,基于FPGA技术实现基-4FFT处理器,并对各功能单元进行分析。提出的FFT处理器采用流水型结构,输入单元采用乒乓操作,可实现数据连续输入;每级之间采用延迟整序输出,减少RAM资源的消耗并提高了速度;优化蝶形... 针对卫星导航基带信号处理应用,基于FPGA技术实现基-4FFT处理器,并对各功能单元进行分析。提出的FFT处理器采用流水型结构,输入单元采用乒乓操作,可实现数据连续输入;每级之间采用延迟整序输出,减少RAM资源的消耗并提高了速度;优化蝶形运算采用9个实数乘法器,减少了复数乘法单元的使用,旋转因子寻址方式更简单。实验结果表明,在100MHz时钟下,4096点的FFT转换时间仅为10.335μs,速度比Altera的FFT处理器IP核提高了60%。 展开更多
关键词 FPGA FFT处理器 基-4 流水操作
下载PDF
OFDM系统中流水线型FFT(IFFT)处理器设计
20
作者 钟会新 戴宇杰 +1 位作者 张小兴 吕英杰 《电视技术》 北大核心 2009年第S1期31-32,35,共3页
通过流水线结构和乒乓RAM相结合,改进了时域抽取的Radix-4算法,实现了一种适合于OFDM系统的高效流水线型FFT(IFFT)处理器的VLSI设计。在时钟频率125 MHz下,完成一次1024点16bit位长的复数FFT需时49.57μs。
关键词 正交频分复用 快速傅里叶变换 蝶形运算 流水线
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部