期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
互相关跟踪算法的多核DSP快速实现 被引量:2
1
作者 田立 周付根 +2 位作者 孟偲 白相志 金挺 《高技术通讯》 CAS CSCD 北大核心 2013年第12期1248-1253,共6页
针对光侦系统的目标快速跟踪问题,提出了一种用多核数字信号处理器(DSP)高效实现归一化互相关(NCC)跟踪算法的方案。该方案充分利用德州仪器(TI)最新的6678 DSP的资源和特性,大大提高了跟踪算法实现效率。首先通过增加CPU内核对高速缓存... 针对光侦系统的目标快速跟踪问题,提出了一种用多核数字信号处理器(DSP)高效实现归一化互相关(NCC)跟踪算法的方案。该方案充分利用德州仪器(TI)最新的6678 DSP的资源和特性,大大提高了跟踪算法实现效率。首先通过增加CPU内核对高速缓存(CACHE)控制器的刷新和失效,解决了多核按照可缓存的方式共享图像数据时出现的存储器一致性问题;其次利用CACHE数据预取机制对相关系数NCC的计算方法做了改进,优先访问同一条CACHE线中的图像数据,使效率提升15%以上;最后提出一种多核间并行计算的机制,通过在从核上设置代理任务来处理主核的并行计算请求并反馈计算结果,8核加速比达到7倍以上,优于开放多处理(OpenMP)标准的效果。该方案在100FPS高帧频舰船目标跟踪系统中运行稳定且可以应用于其他需要快速跟踪的场合。 展开更多
关键词 互相关跟踪 多核数字信号处理器(dsp) 多核并行计算 高速缓存(CACHE) 一致性
下载PDF
YHFT-QDSP:High-Performance Heterogeneous Multi-Core DSP
2
作者 陈书明 万江华 +8 位作者 鲁建壮 刘仲 孙海燕 孙永节 刘衡竹 刘祥远 李振涛 徐毅 陈小文 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期214-224,共11页
Multi-core architectures are widely used to in time-to-market and power consumption of the chips enhance the microprocessor performance within a limited increase Toward the application of high-density data signal pro... Multi-core architectures are widely used to in time-to-market and power consumption of the chips enhance the microprocessor performance within a limited increase Toward the application of high-density data signal processing, this paper presents a novel heterogeneous multi-core architecture digital signal processor (DSP), YHFT-QDSP, with one RISC CPU core and 4 VLIW DSP cores. By three kinds of interconnection, YHFT-QDSP provides high efficiency message communication for inner-chip RISC core and DSP cores, inner-chip and inter-chip DSP cores. A parallel programming platform is specifically developed for the heterogeneous nmlti-core architecture of YHFT-QDSP. This parallel programming environment provides a parallel support library and a friendly interface between high level application softwares and multi- core DSP. The 130 nm CMOS custom chip design results benchmarks show that the interconnection structure of in a high speed and moderate power design. The results of typical YHFT-QDSP is much better than other related structures and achieves better speedup when using the interconnection facilities in combing methods. YHFT-QDSP has been signed off and manufactured presently. The future applications of the multi-core chip could be found in 3G wireless base station, high performance radar, industrial applications, and so on. 展开更多
关键词 digital signal processor dsp multi-core ARCHITECTURE parallel programming custom design
原文传递
基于多核DSP的矢量高效QR分解技术
3
作者 张宇帆 陈颖 +1 位作者 方科 费霞 《电讯技术》 北大核心 2023年第4期536-543,共8页
以多核数字信号处理器(Digital Signal Processor,DSP)作为计算节点的多核DSP集群系统成为一大发展趋势。当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟。基于C66x内核丰富的指令集架构以及... 以多核数字信号处理器(Digital Signal Processor,DSP)作为计算节点的多核DSP集群系统成为一大发展趋势。当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟。基于C66x内核丰富的指令集架构以及运算指令编排原则,结合编译器提供的汇编信息,设计并优化了QR分解算法,在充分挖掘DSP单核性能极致的同时减少了矩阵分解的计算时间。根据掌握的优化技术,设计并实现基于多核DSP集群系统的大规模并行QR分解模型,并在分布式计算框架上完成了分解任务。分析结果表明,优化后的QR分解计算效率以及C66x单核硬件资源使用率均提升了二十余倍,随着待分解矩阵规模的成倍增加,多核DSP集群相比于单核的计算性能提升也愈加明显。 展开更多
关键词 多核数字信号处理器(dsp) QR分解 软件优化 分布式计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部