期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
嵌入式Web服务器中CGI的特点及实现 被引量:63
1
作者 张曦煌 《小型微型计算机系统》 CSCD 北大核心 2003年第11期2046-2048,共3页
本文讨论的 CGI基于无操作系统单片机环境的嵌入式 Web服务器 ,在这种环境下 CGI是用户与 Web服务器交互的唯一可行途径 .本文介绍了嵌入式环境中 CGI的特点和设计思想 。
关键词 通用网关接口(CGI) 嵌入式WEB服务器 嵌入式环境
下载PDF
基于TCP/IP套接口的嵌入式Web服务器实现 被引量:13
2
作者 徐明 《华东船舶工业学院学报》 EI 2001年第5期40-43,共4页
介绍了TCP/IP网络套接口 ,提出了一种基于网络套接口的嵌入式Web服务器 ,并说明了这种服务器的具体实现方法和主要功能特点。
关键词 嵌入式WEB服务器 超文本传输协议 通用网关接品 实现方法 TCP/IP网络套接口
下载PDF
基于FPGA的深度学习目标检测系统的设计与实现 被引量:10
3
作者 陈辰 严伟 +1 位作者 夏珺 《电子技术应用》 2019年第8期40-43,47,共5页
针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果... 针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果表明,与CPU相比,CPU+FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,当前设计在性能上超过之前的工作。 展开更多
关键词 深度学习 目标检测 FPGA 硬件加速器
下载PDF
应用于控制系统的嵌入式Web服务器 被引量:2
4
作者 张曦煌 《江南大学学报(自然科学版)》 CAS 2002年第1期42-44,共3页
通过分析传统的工业控制系统 ,提出了一种可用于控制设备的嵌入式Web服务器 ,介绍了这种服务器的具体实现方法和主要功能特点 .该Web服务器基于HTTP协议 ,采用TCP/IP套接子编程技术实现 ,并已在仿真环境下试用成功 .该Web服务器具备必... 通过分析传统的工业控制系统 ,提出了一种可用于控制设备的嵌入式Web服务器 ,介绍了这种服务器的具体实现方法和主要功能特点 .该Web服务器基于HTTP协议 ,采用TCP/IP套接子编程技术实现 ,并已在仿真环境下试用成功 .该Web服务器具备必要的交互功能 。 展开更多
关键词 控制系统 嵌入式WEB服务器 超文本传输协议 通用网关接口
下载PDF
基于HLS的SURF特征提取硬件加速单元设计与实现 被引量:9
5
作者 丁帅帅 《微电子学与计算机》 CSCD 北大核心 2015年第9期133-137,143,共6页
SURF算法广泛用于目标检测、跟踪和匹配等视频图像处理领域,但其计算复杂度高,在通用CPU上计算速度慢、实时性差,但SURF特征提取算法具备良好的可并行性.因此,根据现场可编程门阵列(FPGA)支持细粒度并行的特点,基于HLS(High-level Synth... SURF算法广泛用于目标检测、跟踪和匹配等视频图像处理领域,但其计算复杂度高,在通用CPU上计算速度慢、实时性差,但SURF特征提取算法具备良好的可并行性.因此,根据现场可编程门阵列(FPGA)支持细粒度并行的特点,基于HLS(High-level Synthesis)设计并实现了适合FPGA的SURF特征提取硬件加速单元.实验结果表明,相比通用CPU,基于FPGA的SURF特征提取加速效果明显;相比HDL方式,基于HLS设计算法开发效率高、可移植性好. 展开更多
关键词 SURF特征提取 FPGA HLS 可移植性
下载PDF
移动机器人模糊Q-学习沿墙导航 被引量:7
6
作者 徐明亮 须文波 《电机与控制学报》 EI CSCD 北大核心 2010年第6期83-88,97,共7页
针对在基于行为的移动机器人沿墙导航控制器的设计中缺乏足够的先验知识的问题,采用Q-学习方法让机器人通过学习来自动构建导航控制器。将模糊神经网络和Q-学习相结合,用模糊神经网络直接逼近连续状态和动作空间中的Q值函数。利用对Q值... 针对在基于行为的移动机器人沿墙导航控制器的设计中缺乏足够的先验知识的问题,采用Q-学习方法让机器人通过学习来自动构建导航控制器。将模糊神经网络和Q-学习相结合,用模糊神经网络直接逼近连续状态和动作空间中的Q值函数。利用对Q值函数的优化获得控制输出。模糊神经网络中的节点根据状态动作对的各个分量和时间差分的新颖性进行自适应地添加和构造,这样不仅能克服节点选择的困难还能使网络保持适度的规模。网络中的参数采用扩展卡尔曼滤波方法进行自适应调整。基于Khepera 2机器人的沿墙导航实验验证了该方法的有效性和优越性。 展开更多
关键词 Q-学习 模糊神经网络 沿墙导航 移动机器人
下载PDF
实时Java平台的类预处理器研究 被引量:7
7
作者 苏超云 涂时亮 《计算机工程》 CAS CSCD 北大核心 2010年第7期246-248,251,共4页
设计并实现一种针对32 bit嵌入式实时Java平台的类预处理器,通过把标准class文件转换成适合Java处理器——Jpor32直接执行的内存映像,将在运行时动态装载和解析class的工作交由类预处理器提前完成,从而消除影响运行时实时性的一些操作,... 设计并实现一种针对32 bit嵌入式实时Java平台的类预处理器,通过把标准class文件转换成适合Java处理器——Jpor32直接执行的内存映像,将在运行时动态装载和解析class的工作交由类预处理器提前完成,从而消除影响运行时实时性的一些操作,并降低Java处理器的设计复杂性。 展开更多
关键词 Java实时规范 实时Java平台 类预处理器
下载PDF
基于GPU的图像特征并行计算方法 被引量:6
8
作者 张杰 喻津 《计算机科学》 CSCD 北大核心 2015年第10期297-300,324,共5页
特征提取与描述是众多计算机视觉应用的基础。局部特征提取与描述因像素级处理产生的高维计算而导致其计算复杂、实时性差,影响了算法在实际系统中的应用。研究了局部特征提取与描述中的关键共性计算模块——图像金字塔机制及图像梯度... 特征提取与描述是众多计算机视觉应用的基础。局部特征提取与描述因像素级处理产生的高维计算而导致其计算复杂、实时性差,影响了算法在实际系统中的应用。研究了局部特征提取与描述中的关键共性计算模块——图像金字塔机制及图像梯度计算。基于NVIDIA GPU/CUDA架构设计并实现了共性模块的并行计算,并通过优化全局存储、纹理存储及共享存储的访问方式进一步实现了其高效计算。实验结果表明,基于GPU的图像金字塔和图像梯度计算比CPU获得了30倍左右的加速,将实现的图像金字塔和图像梯度计算应用于HOG特征提取与描述算法,相比CPU获得了40倍左右的加速。该研究对于基于GPU实现局部特征的高速提取与描述具有现实意义。 展开更多
关键词 图像金字塔机制 图像梯度计算
下载PDF
基于DM642的运动目标检测 被引量:6
9
作者 刘军 梁久祯 《计算机工程与科学》 CSCD 北大核心 2013年第1期107-112,共6页
提出了一种高斯混合背景模型和YUV色度空间相结合的运动目标检测算法。高斯混合模型对背景光线变化有较强的鲁棒性,且对背景中的周期性变化有较好的抑制作用,检测出的目标有较好的连通性;但其对于全局亮度的变化及噪声较为敏感,容易误... 提出了一种高斯混合背景模型和YUV色度空间相结合的运动目标检测算法。高斯混合模型对背景光线变化有较强的鲁棒性,且对背景中的周期性变化有较好的抑制作用,检测出的目标有较好的连通性;但其对于全局亮度的变化及噪声较为敏感,容易误判。为此选取对亮度变化不敏感的UV分量来进行运动目标检测,然后再和Y分量的高斯混合背景检测进行"与"运算,从而消除高斯模型的误检,最后针对运动目标的影子问题,采用基于垂直投影图的阴影消除算法除去影子。算法在DM642开发板上实现。实验结果表明,该算法能够实时精确地检测出运动目标,且对全局光照变化不敏感。 展开更多
关键词 运动目标检测 高斯混合模型 YUV 数字图像处理 DM642
下载PDF
基于深度学习的心脏核磁共振图像自动分割算法 被引量:5
10
作者 刘从军 徐佳陈 +1 位作者 《计算机工程与科学》 CSCD 北大核心 2022年第9期1646-1654,共9页
心脏核磁共振成像技术由于其无电离辐射的优点已成为医疗诊断中的主要手段。对左心室、右心室以及左心肌进行准确的分割与识别是心脏手术前的重要一步,手动分割心脏结构耗时且易出错,因此自动分割双心室与心肌至关重要。提出了一种能充... 心脏核磁共振成像技术由于其无电离辐射的优点已成为医疗诊断中的主要手段。对左心室、右心室以及左心肌进行准确的分割与识别是心脏手术前的重要一步,手动分割心脏结构耗时且易出错,因此自动分割双心室与心肌至关重要。提出了一种能充分利用心脏图像信息的多尺度特征融合U型神经网络MFF U-Net。首先,选择以U-Net++作为网络基本框架。其次,为了提高特征复用率,解决网络深度增加导致的过拟合问题,在U-Net++的编码部分提出了密集残差模块,使得网络在下采样过程中学习到更多有用特征。此外,在解码部分,为了使网络的分割结果更加符合目标器官之间的物理特征,用多个卷积核来扩大感受野并利用长距离依赖模块共享全局上下文信息,使得网络在编码还原的过程中尽可能地获取到目标器官之间的关系信息,从而使得分割结果更为精准。最后,考虑到双心室与左心肌的连贯性与唯一性,还添加了获取最大连通域与填充细小孔洞的后处理操作。采用的实验数据为ACDC心脏分割挑战数据集,其包含150位志愿者收缩期末期与舒张期末期的短轴心脏磁共振图像。在该数据集的测试集上进行验证,并通过在线提交的方式获取实验结果。实验结果表明,相较于其他算法,所提出的算法能够有效地分割目标器官,特别是舒张期末期的Dice系数分别达到了左心室0.96、右心室0.94和左心肌0.89,收缩期末期的分割精度达到了0.87,0.86和0.89。 展开更多
关键词 图像处理 医学图像 双心室与心肌 核磁共振图像 深度学习
下载PDF
基于FPGA的图像卷积IP核的设计与实现 被引量:5
11
作者 朱学亮 +1 位作者 钟传杰 张平 《微电子学与计算机》 CSCD 北大核心 2011年第6期188-192,共5页
提出了一种基于FPGA的卷积运算IP核的设计方法.充分利用FPGA的并行体系架构和丰富的块存储资源采用规则的模块化的设计方法并兼顾可扩展的原则完成了二维图像卷积IP核的设计,实现了实时图像卷积运算中卷积窗口大小和卷积系数的灵活调整... 提出了一种基于FPGA的卷积运算IP核的设计方法.充分利用FPGA的并行体系架构和丰富的块存储资源采用规则的模块化的设计方法并兼顾可扩展的原则完成了二维图像卷积IP核的设计,实现了实时图像卷积运算中卷积窗口大小和卷积系数的灵活调整.这种新的卷积IP核在充分节约硬件资源的前提下很好地满足了实际的应用,使得卷积运算在图像处理应用中更加灵活方便. 展开更多
关键词 FPGA 卷积 图像处理 IP核
下载PDF
基于CSD编码的FIR数字滤波器优化设计 被引量:4
12
作者 朱霞 须文波 《计算机工程与设计》 CSCD 北大核心 2009年第2期271-274,共4页
研究数字滤波器的动机就在于它正成为一种主要的DSP操作。乘法运算是数字滤波器中的核心操作,其性能的好坏直接影响整个滤波器的特性。采用CSD编码技术来实现对数字滤波器的优化。实验结果表明,该方法的应用能提高乘累加器的运行性能,... 研究数字滤波器的动机就在于它正成为一种主要的DSP操作。乘法运算是数字滤波器中的核心操作,其性能的好坏直接影响整个滤波器的特性。采用CSD编码技术来实现对数字滤波器的优化。实验结果表明,该方法的应用能提高乘累加器的运行性能,达到减少资源、优化面积的目的。数据还表明在最优状态下,CSD编码占用的资源仅仅是2C编码的26.7%,DA算法的40.7%。 展开更多
关键词 正则有符号数 分布式算法 有限脉冲响应 现场可编程门阵列 常系数乘法
下载PDF
粒子群优化算法的硬件实现及其性能分析 被引量:5
13
作者 蔡瑞 须文波 +2 位作者 王斌 刘凡 《计算机工程》 CAS CSCD 北大核心 2010年第4期166-168,共3页
介绍量子粒子群优化(QPSO)算法的硬件实现方法并对其进行性能分析。将QPSO算法应用于现场可编程门阵列开发板,并对比了不同硬件实现方式的运算速度和资源耗费。采用硬件并行和流水技术缩短算法的运算时间,仿真结果表明,硬件化QPSO的运... 介绍量子粒子群优化(QPSO)算法的硬件实现方法并对其进行性能分析。将QPSO算法应用于现场可编程门阵列开发板,并对比了不同硬件实现方式的运算速度和资源耗费。采用硬件并行和流水技术缩短算法的运算时间,仿真结果表明,硬件化QPSO的运算时间为原Matlab中运算时间的0.032%。 展开更多
关键词 量子粒子群优化 现场可编程门阵列 硬件实现
下载PDF
基于数字图像处理的拼毛比例分析 被引量:5
14
作者 李玉红 潘如如 +2 位作者 高卫东 刘基宏 《纺织学报》 EI CAS CSCD 北大核心 2010年第11期20-24,共5页
为解决毛纺企业拼毛工序中存在的经验性、耗时性问题,提出采用FCM算法统计拼毛毛条中各颜色纤维的比例,以提高拼毛效率。在利用扫描仪完成图像采集的基础上,首先将图像由RGB模式转换为均匀色彩空间L*a*b*模式,然后利用FCM算法对图像中... 为解决毛纺企业拼毛工序中存在的经验性、耗时性问题,提出采用FCM算法统计拼毛毛条中各颜色纤维的比例,以提高拼毛效率。在利用扫描仪完成图像采集的基础上,首先将图像由RGB模式转换为均匀色彩空间L*a*b*模式,然后利用FCM算法对图像中的所有像素进行聚类分析,再对分类结果作统计分析得出各种颜色像素所占百分比,进而得出拼毛比例。另就图像扫描分辨率和扫描区域大小对测试结果的影响进行探讨。结果表明,采集图像其扫描分辨率在不低于3 000 dpi、扫描区域不小于40 mm×40 mm时,分析所得各颜色像素点的百分比才比较稳定,接近实际值。 展开更多
关键词 毛纺 拼毛 L*a*b*颜色空间 FCM算法 聚类分析
下载PDF
嵌入式Web在无操作系统支持环境下的设计及实现 被引量:3
15
作者 张曦煌 《计算机工程与应用》 CSCD 北大核心 2004年第29期175-177,共3页
提出了一种能在8位MCU无操作系统的环境下实现Web服务器的方法,能很好地满足嵌入式系统的要求。该Web服务器不仅提供单纯的CGI功能,而且可方便地实现多页面多CGI,完成浏览器与设备的交互。该文介绍了无操作系统的嵌入式环境中实现Web服... 提出了一种能在8位MCU无操作系统的环境下实现Web服务器的方法,能很好地满足嵌入式系统的要求。该Web服务器不仅提供单纯的CGI功能,而且可方便地实现多页面多CGI,完成浏览器与设备的交互。该文介绍了无操作系统的嵌入式环境中实现Web服务器和CGI的特点和设计思想,并给出了主要实现算法。 展开更多
关键词 嵌入式WEB服务器 通用网关接口(CGI) 超文本传输协议(HTTP)
下载PDF
基于QEMU的SIMD指令替换浮点指令框架
16
作者 刘登峰 李东亚 +2 位作者 周浩杰 丁海峰 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第8期70-77,共8页
现在,几乎每个处理器架构都已经加入了对SIMD(single instruction multiple data)指令的支持,SIMD指令能同时对一组数据执行相同的操作,通过数据并行来提高处理器的处理性能.但是大部分动态二进制翻译器忽略了本地SIMD指令的利用,而是... 现在,几乎每个处理器架构都已经加入了对SIMD(single instruction multiple data)指令的支持,SIMD指令能同时对一组数据执行相同的操作,通过数据并行来提高处理器的处理性能.但是大部分动态二进制翻译器忽略了本地SIMD指令的利用,而是以软件语言实现来模拟浮点计算.本文提出了一种基于QEMU翻译系统的FP-QEMU框架,FP-QEMU框架采用SIMD指令来优化替换浮点计算指令,并在X86和ARM平台上完成了完整的浮点实现.该框架可以识别动态二进制翻译系统中的浮点计算优化机会并利用SIMD指令来提升系统翻译的性能.采用SPEC 2006作为测试基准,实验表明相比QEMU,FP-QEMU跨平台的ARM应用在X86计算机上运行的最高加速比可达51.5%,平均加速比达到37.42%. 展开更多
关键词 SIMD QEMU 动态二进制翻译 浮点计算
下载PDF
软硬件协同的图像放大系统设计
17
作者 樊荣 《科学技术创新》 2024年第2期115-118,共4页
图像放大应用场景广泛,使用插值的图像放大计算速度块,但基于插值的放大处理放大效果一般,基于卷积神经网络模型的图像放大效果优秀,但是处理速度不够,本文采用一种简易的双层模型实现图像放大,并通过FPGA设计实现双层模型硬件加速器,在... 图像放大应用场景广泛,使用插值的图像放大计算速度块,但基于插值的放大处理放大效果一般,基于卷积神经网络模型的图像放大效果优秀,但是处理速度不够,本文采用一种简易的双层模型实现图像放大,并通过FPGA设计实现双层模型硬件加速器,在PYNQ-Z1板卡上通过软件方式调用双层模型加速器进行图像放大,从而实现了软硬件协同的图像放大系统,本文设计的图像放大系统比三次卷积插值处理速度快22%,放大效果上PSNR高0.76,有着明显的视觉提升效果。 展开更多
关键词 图像放大 双层模型 FPGA PYNQ-Z1
下载PDF
基于DM642的KLT跟踪算法的实现及优化 被引量:4
18
作者 刘军 梁久祯 《激光与红外》 CAS CSCD 北大核心 2011年第8期936-940,共5页
Kanade-Lucas-Tomasi(KLT)算法是基于图像特征点的跟踪算法,由目标对象特征点提取,特征点跟踪两部分组成。本文首先阐述了KLT算法的基本原理,分析了影响算法执行速度的主要原因。分析表明KLT算法的操作主要集中在乘加运算和循环,图像卷... Kanade-Lucas-Tomasi(KLT)算法是基于图像特征点的跟踪算法,由目标对象特征点提取,特征点跟踪两部分组成。本文首先阐述了KLT算法的基本原理,分析了影响算法执行速度的主要原因。分析表明KLT算法的操作主要集中在乘加运算和循环,图像卷积运算和循环占用的执行时间比较长。针对TMS320DM642 DSP的硬件平台特点,提出了算法优化的若干策略。通过配置编译环境,合理安排数据类型,消除存储器相关性,使用内联函数以及分解多层循环等方法,对算法的实现进行了优化。实验结果表明,优化后代码执行速度是优化前的3倍多。 展开更多
关键词 DM642 KLT 运动跟踪 优化 图像处理
下载PDF
基于ZYNQ的稠密光流法软硬件协同处理 被引量:4
19
作者 王芝斌 阳文敏 +1 位作者 张圆蒲 《计算机工程与应用》 CSCD 2014年第18期44-49,共6页
光流法是计算机视觉中一个基础性的算法,可广泛应用于运动检测、运动估计、视频分析等领域。但光流法最大的问题是计算复杂、速度慢,限制了它在实际系统尤其是嵌入式系统中的应用。利用最新的高层综合(HLS)语言与传统的硬件描述语言相结... 光流法是计算机视觉中一个基础性的算法,可广泛应用于运动检测、运动估计、视频分析等领域。但光流法最大的问题是计算复杂、速度慢,限制了它在实际系统尤其是嵌入式系统中的应用。利用最新的高层综合(HLS)语言与传统的硬件描述语言相结合,在Xilinx的FPGA异构系统芯片(即ZYNQ)平台上,以软硬件协同的工作方式,设计了基于Horn-Schunck稠密光流法的硬件加速器。实验证明,对于640×480大小的图片,软硬件协同处理比纯软件处理的计算性能提高了34倍,执行时间从24.40 s降低到0.71 s。 展开更多
关键词 光流加速器 ZYNQ 高层综合语言 软硬件协同处理 可编程器件
下载PDF
基于FPGA的数字滤波器乘法模块改进 被引量:4
20
作者 朱霞 须文波 《计算机仿真》 CSCD 北大核心 2009年第1期335-338,共4页
乘法运算是数字滤波器中的核心操作,其性能的好坏直接影响整个滤波器的特性。在数字滤波器理论及常见实现方法的基础上,介绍了能高效实现固定常系数乘法的分布式算法原理,给出了在FPGA中用查找表实现FIR滤波器的算法设计。在乘法设计模... 乘法运算是数字滤波器中的核心操作,其性能的好坏直接影响整个滤波器的特性。在数字滤波器理论及常见实现方法的基础上,介绍了能高效实现固定常系数乘法的分布式算法原理,给出了在FPGA中用查找表实现FIR滤波器的算法设计。在乘法设计模块中,根据分析结果对算法的实现进行了改进,给出了减小误差的设计方案。该设计借助仿真软件对该方案进行验证,其结果表明数字滤波器的实现方法减小了误差,其性能优于传统的数字滤波器。 展开更多
关键词 有限脉冲响应 现场可编程门阵列 分布式算法 常系数乘法
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部