期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于深度卷积神经网络的车型识别方法 被引量:32
1
作者 袁公 汤一平 +1 位作者 韩旺明 陈麒 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第4期694-702,共9页
针对现有车辆车型视觉识别技术中的检测精度不高、难以适应天气环境变化、难以从视频图像中准确提取出用于识别的车辆图像、难以对车辆车型子类进行识别分类、难以兼顾识别精度和检测效率等不足,将深度卷积神经网络引入车辆目标定位、... 针对现有车辆车型视觉识别技术中的检测精度不高、难以适应天气环境变化、难以从视频图像中准确提取出用于识别的车辆图像、难以对车辆车型子类进行识别分类、难以兼顾识别精度和检测效率等不足,将深度卷积神经网络引入车辆目标定位、识别和分类(子类)问题中.利用深度卷积神经网络自动完成车型的深度特征学习,在特征图上进行逻辑回归,从道路复杂背景中提取出感兴趣区域;利用softmax分类器训练特征实现车型识别;为了优化softmax在深度卷积神经网络分类过程中出现的类内间距大的问题,引入中心损失函数对softmax损失函数进行优化,提高类间分散性与类内紧密性.在BIT-Vehicle车型数据集中的实验结果显示,提出方法的平均精度为89.67%,检测和识别时间为159ms;与传统的分类方法相比,识别精度提高约20%,效率提高10倍以上,检测鲁棒性有明显提升;与未改进前的深度卷积神经网络相比,检测精度提高0.6%,速度提高0.29倍. 展开更多
关键词 深度学习 卷积神经网络 特征自动提取 中心损失 车型识别
下载PDF
面向舌体分割的两阶段卷积神经网络设计 被引量:17
2
作者 王丽冉 汤一平 +2 位作者 陈朋 何霞 袁公 《中国图象图形学报》 CSCD 北大核心 2018年第10期1571-1581,共11页
目的由于舌体与周围组织颜色相似,轮廓模糊,传统的分割方法难以精准分割舌体,为此提出一种基于两阶段卷积神经网络的舌体分割方法。方法首先,在粗分割阶段,将卷积层和全连接层相结合构建网络Rsnet,采用区域建议策略得到舌体候选框,从候... 目的由于舌体与周围组织颜色相似,轮廓模糊,传统的分割方法难以精准分割舌体,为此提出一种基于两阶段卷积神经网络的舌体分割方法。方法首先,在粗分割阶段,将卷积层和全连接层相结合构建网络Rsnet,采用区域建议策略得到舌体候选框,从候选框中进一步确定舌体,从而实现对舌体的定位,去除大量的干扰信息;然后,在精分割阶段,将卷积层与反卷积层相结合构建网络Fsnet,对粗分割舌象中的每一个像素点进行分类进而实现精分割;最后,采用形态学相关算法对精分割后的舌体图像进行后续处理,进一步消除噪点和边缘粗糙点。结果本文构建了包含2 764张舌象的数据集,在该数据集上进行五折交叉实验。实验结果表明,本文算法能够取得较为理想的分割结果且具有较快的处理速度。选取了精确度、召回率及F值作为评价标准,与3种常用的传统分割方法相比,在综合指标F值上分别提高了0. 58、0. 34、0. 12,效率上至少提高6倍,与同样基于深度学习思想的MNC(multi-task network cascades)算法相比,在F值上提高0. 17,效率上提高1. 9倍。结论将基于深度学习的方法应用到舌体分割中,有利于实现舌象的准确、鲁棒、快速分割。在分割之前,先对舌体进行定位,有助于进一步减少分割中的错分与漏分。实验结果表明,本文算法有效提升了舌体分割的准确性,能够为后续的舌象自动识别和分析奠定坚实的基础。 展开更多
关键词 卷积神经网络 深度学习 舌体分割 两阶段语义分割 形态学
原文传递
基于CNN的火炮身管全景图像疵病识别方法 被引量:17
3
作者 汤一平 韩国栋 +2 位作者 鲁少辉 胡克钢 袁公 《仪器仪表学报》 EI CAS CSCD 北大核心 2016年第4期871-878,共8页
针对火炮身管内膛疵病种类多、定性定量分析难和检测自动化程度低等问题,本文提出一种以卷积神经网络为基础的疵病识别方法。首先,对全景图像进行预处理,主要包括全景展开、光照强度调整、膛线去除等;其次,通过最优阈值法对图像进行二... 针对火炮身管内膛疵病种类多、定性定量分析难和检测自动化程度低等问题,本文提出一种以卷积神经网络为基础的疵病识别方法。首先,对全景图像进行预处理,主要包括全景展开、光照强度调整、膛线去除等;其次,通过最优阈值法对图像进行二值化处理,并利用四连通域法提取疵病区域;最后,采用卷积神经网络对疵病进行自动的分类识别。实验结果表明,该方法能有效避免人工疵病特征提取和人工特征描述计算等复杂步骤,实现了"采集-识别-判定"全过程的自动运行,真正实现了窥膛检测的自动化,身管疵病的识别率超过92%,识别准确率远高于基于统计学原理及支持向量机的分类方式,具有较高的准确性,为火炮身管修复及寿命预估等奠定了坚实的基础。 展开更多
关键词 全景图像 图像处理 卷积神经网络
下载PDF
基于多任务卷积神经网络的舌象分类研究 被引量:14
4
作者 汤一平 王丽冉 +2 位作者 何霞 陈朋 袁公 《计算机科学》 CSCD 北大核心 2018年第12期255-261,307,共8页
针对现有技术难以并行实现舌象多标签的高效分类和识别,难以利用标签间的相关性进行综合分析等问题,提出了一种基于多任务卷积神经网络的舌象分类方法,构建了一种多任务联合学习模型,尝试实现传统中医舌诊中对舌色、苔色、裂纹和齿痕等... 针对现有技术难以并行实现舌象多标签的高效分类和识别,难以利用标签间的相关性进行综合分析等问题,提出了一种基于多任务卷积神经网络的舌象分类方法,构建了一种多任务联合学习模型,尝试实现传统中医舌诊中对舌色、苔色、裂纹和齿痕等多个标签的同时辨识。首先,在共享网络层对所有标签进行联合学习,从特征提取的角度自动挖掘和利用标签间的相关性;然后,在不同子网络层分别完成特定类别的学习任务,从而消除多标签分类中的歧义性;最后,训练多个Softmax分类器以实现对所有标签的并行预测。研究表明,所提方法能以端到端的方式同时提取舌象的多个特征并直接进行分类识别,在各分类评价指标上的最低值约为0.96,多任务的总体识别时间为34ms,因此该方法在精度和速度上均具有明显优势。 展开更多
关键词 舌象分类 多标签 多任务网络 相关性 迁移学习
下载PDF
适用于管道内形貌检测的3D全景视觉传感器 被引量:10
5
作者 汤一平 吴挺 +2 位作者 袁公 鲁少辉 杨仲元 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第3期726-733,共8页
管道内部缺陷种类繁多、检测困难且自动化程度低,针对这些问题,提出了一种适用于管道形貌检测的3D全景视觉检测方法。首先设计了一种获取管道内部全景颜色纹理信息的全景视觉传感器(ODVS),然后设计了一种能快速并高精度获得管道内壁深... 管道内部缺陷种类繁多、检测困难且自动化程度低,针对这些问题,提出了一种适用于管道形貌检测的3D全景视觉检测方法。首先设计了一种获取管道内部全景颜色纹理信息的全景视觉传感器(ODVS),然后设计了一种能快速并高精度获得管道内壁深度信息的主动式全景视觉传感器(ASODVS),接着将这两种ODVS进行紧凑小型化设计,通过软件将全景3D测量数据与全景颜色纹理数据的快速融合,在对管道内功能性缺陷和结构性缺陷进行全方位自动分析和评估的同时实现管道内部三维建模。实验结果表明,所设计的ASODVS+ODVS能实时获取地下管道内部颜色纹理和几何信息的全景图像,配置在管道机器人上能在狭长管道内边行走、边检测、边识别和边重构。 展开更多
关键词 管道视觉检测 主动式全景视觉 颜色纹理和几何信息的融合 功能性和结构性缺陷 三维重构
下载PDF
基于全景图像CNN的隧道病害自动识别方法 被引量:8
6
作者 汤一平 胡克钢 袁公 《计算机科学》 CSCD 北大核心 2017年第B11期207-211,250,共6页
针对目前隧道衬砌病害检测过程中难以快速、方便地获取隧道内壁全景图像以及难以自动检测识别各种病害等问题,提出一种基于全景图像CNN的隧道病害自动识别方法。首先通过一种全景视觉传感器快速获取隧道内壁的全景图像;然后对全景图像... 针对目前隧道衬砌病害检测过程中难以快速、方便地获取隧道内壁全景图像以及难以自动检测识别各种病害等问题,提出一种基于全景图像CNN的隧道病害自动识别方法。首先通过一种全景视觉传感器快速获取隧道内壁的全景图像;然后对全景图像进行处理,主要通过全景图像展开、图像预处理、二值化处理等操作来提取疑似病害区域;最后,采用卷积神经网络对病害进行自动检测分类识别。实验结果表明,所提方法极大程度地简化了检测装置在获取隧道内壁全景图像的结构,通过端对端的卷积神经网络实现了各种隧道病害特征的自动提取、检测和识别,并具有88%的检测识别精度,为隧道的维护、竣工验收提供了有效的技术支撑。 展开更多
关键词 隧道 全景图像 病害检测 卷积神经网络
下载PDF
基于Faster RCNNH的多任务分层图像检索技术 被引量:8
7
作者 何霞 汤一平 +2 位作者 王丽冉 陈朋 袁公 《计算机科学》 CSCD 北大核心 2019年第3期303-313,共11页
针对已有的以图搜图技术中自动化和智能化水平低、缺乏深度学习、难以获取精确的检索结果、检索技术存储空间消耗大、检索速度慢且难以满足大数据时代的图像检索需求等问题,提出了一种基于Faster RCNNH(Faster RCNN Hash)的多任务分层... 针对已有的以图搜图技术中自动化和智能化水平低、缺乏深度学习、难以获取精确的检索结果、检索技术存储空间消耗大、检索速度慢且难以满足大数据时代的图像检索需求等问题,提出了一种基于Faster RCNNH(Faster RCNN Hash)的多任务分层图像检索方法。首先利用选择性检索网络在特征图上进行逻辑回归,得到图像中各感兴趣区域的概率向量,在此基础上结合紧凑量化网络对其进行编码,得到图像紧凑量化哈希码;其次利用再次筛选网络获取各感兴趣区域中响应最大的区域感知语义特征;接着针对每个感兴趣区域,基于量化哈希h矩阵的精检索策略来对图像进行快速比对;最后选出与查询图像中的对应感兴趣区域最相似的图像。提出的多任务学习方法不仅能同时得到图像紧凑量化哈希码和区域感知语义特征,还能有效去除图像背景和其他对象信息的干扰。实验结果表明:所提方法能实现端到端的训练,自动选出更高质量的感兴趣区域特征,提高了大规模图像检索的自动化和智能化水平,其检索精度(0.9478)与检索速度(0.306s)均明显优于现有的大规模图像检索技术。 展开更多
关键词 深度哈希算法 大规模图像检索 多任务深度学习 感兴趣区域 哈希码
下载PDF
基于多任务Faster R-CNN车辆假牌套牌的检测方法 被引量:7
8
作者 陈朋 汤一平 +2 位作者 何霞 王辉 袁公 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第12期3079-3089,共11页
针对现有车辆假牌套牌各种检测方法存在计算复杂度高、检测精度低、鲁棒性欠缺等问题,提出一种基于多任务的高速区域卷积神经网络(Faster R-CNN)车辆假牌套牌的检测方法。首先利用时空约束得到疑似套牌车辆,接着用Faster R-CNN定位分割... 针对现有车辆假牌套牌各种检测方法存在计算复杂度高、检测精度低、鲁棒性欠缺等问题,提出一种基于多任务的高速区域卷积神经网络(Faster R-CNN)车辆假牌套牌的检测方法。首先利用时空约束得到疑似套牌车辆,接着用Faster R-CNN定位分割出车辆前脸部分图像,然后对疑似套牌车辆的车脸公脸部分(车辆的基本特征)的特征进行比对;在此基础上再对高仿套牌车辆的车脸私脸部分(车检标)的细微特征进行检测比对。这种分层次的、从车辆宏观特征到微观特征的视觉检测方法,具有检测速度快、鲁棒性高、泛化能力强、实施部署方便、检测精度高等优点。实验研究表明,在Vehicle ID数据集和杭州卡口数据集中分别取得了99.39%、99.22%的检测精度。 展开更多
关键词 车辆假牌套牌检测 多任务高速区域卷积神经网络 车辆脸部特征 分层特征比对
下载PDF
主动式全景视觉的隧道全断面变形检测方法 被引量:6
9
作者 汤一平 袁公 +2 位作者 陈麒 韩国栋 胡克钢 《光电工程》 CAS CSCD 北大核心 2017年第4期442-452,462,共12页
针对隧道距离长、运维检测时间跨度长、可检测时间短、形变数据变化小等特点,本文提出了一种基于主动式全景视觉的隧道全断面变形检测方法。首先通过配置在隧道检测装置上的主动式全景视觉传感器对隧道横断面进行全景扫描,获取隧道全景... 针对隧道距离长、运维检测时间跨度长、可检测时间短、形变数据变化小等特点,本文提出了一种基于主动式全景视觉的隧道全断面变形检测方法。首先通过配置在隧道检测装置上的主动式全景视觉传感器对隧道横断面进行全景扫描,获取隧道全景切面扫描图像;接着通过改进的高斯曲线拟合法提取全景切面扫描图像上的亚像素激光中心点,并采用贝塞尔曲线对其进行平滑处理;然后根据全方位视觉传感器的标定结果解析出隧道横断面上内壁的几何信息;再利用隧道横断面上内壁三维点云数据进行三维重建;最后,对重构的隧道模型进行了精度分析。实验研究表明:基于主动式全景视觉的隧道全断面变形的检测方法具有检测速度快、实时性好、数据全面、可视化程度高等优点,能满足对狭长隧道进行快速定性定量分析的需求。 展开更多
关键词 隧道变形检测 隧道横断面 三维重建 主动式全景视觉 亚像素
下载PDF
基于改进矩阵分解和谱聚类的协同过滤算法
10
作者 舒珏淋 谢红韬 袁公 《现代信息科技》 2024年第9期73-76,共4页
针对协同过滤算法中存在的数据稀疏性、可扩展性及准确性问题,提出一种基于改进矩阵分解和谱聚类的协同过滤算法。该算法首先将通过抑制物品流行度和用户活跃度优化的相似度计算融入最小二乘法(ALS),以避免矩阵分解时因子信息的丢失;其... 针对协同过滤算法中存在的数据稀疏性、可扩展性及准确性问题,提出一种基于改进矩阵分解和谱聚类的协同过滤算法。该算法首先将通过抑制物品流行度和用户活跃度优化的相似度计算融入最小二乘法(ALS),以避免矩阵分解时因子信息的丢失;其次结合流形学习的谱聚类算法弥补ALS算法产生的大计算量问题,同时获得全局最优解以提高聚类所得目标用户最近邻居的准确率;最后利用Movielens数据集进行实验。实验结果表明,改进的算法可以有效降低协同过滤算法的平均绝对误差和均方根误差,提高准确率,拥有更优的性能。 展开更多
关键词 协同过滤算法 相似度 谱聚类 全局最优解
下载PDF
基于ASODVS的全景相机运动估计及管网3D重构技术 被引量:4
11
作者 杨仲元 吴挺 +2 位作者 鲁少辉 袁公 汤一平 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第8期2007-2014,共8页
针对地下管网的空间三维测量、三维形貌重构难等问题,提出了一种基于主动式全方位视觉传感器(ASODVS)的相机运动估计及管网3D重构解决方案。通过携带有ASODVS的管道机器人进入管道内部,实时获取管道内壁纹理全景图像和全景激光扫描图像... 针对地下管网的空间三维测量、三维形貌重构难等问题,提出了一种基于主动式全方位视觉传感器(ASODVS)的相机运动估计及管网3D重构解决方案。通过携带有ASODVS的管道机器人进入管道内部,实时获取管道内壁纹理全景图像和全景激光扫描图像;首先对全景激光扫描图像处理解析出投射在管道内壁上的激光中心点,通过计算得到管道横截面的点云数据;另一方面,对全景纹理图像进行处理,首先利用快速鲁棒性特征(SURF)算法快速提取特征点并进行匹配,然后采用随机抽样一致性(RANSAC)算法去除误匹配点,接着利用全景相机的极几何原理估计相机运动位姿,并利用光束法平差(BA)进行优化,最后利用相机运动位姿将相机坐标系下的点云坐标实时转换到世界坐标系下,完成对地下管网的三维重构。实验结果表明,所提出的方案能够精确估计相机运动位姿,实时对管道内部进行三维重构,实现了管道检测机器人边行走、边采集数据、边检测分析处理、边三维建模的设计目标。 展开更多
关键词 管道视觉检测 三维重构 主动式全方位视觉 随机抽样一致性 光束法平差
下载PDF
基于级联多任务深度学习的卡口识别引擎研究 被引量:4
12
作者 何霞 汤一平 +2 位作者 袁公 陈朋 王丽冉 《计算机科学》 CSCD 北大核心 2019年第1期303-308,共6页
针对在将卡口非结构化视频图像数据转化为智能结构化信息的过程中存在环境的复杂性、需求的多样性、任务的关联性和识别的实时性等问题,提出了一种级联多任务深度学习网络的卡口识别引擎方法,其通过充分利用分割、检测、识别等任务之间... 针对在将卡口非结构化视频图像数据转化为智能结构化信息的过程中存在环境的复杂性、需求的多样性、任务的关联性和识别的实时性等问题,提出了一种级联多任务深度学习网络的卡口识别引擎方法,其通过充分利用分割、检测、识别等任务之间的相互联系实现了高精度的、高效的、同步实时的卡口车辆多种基本信息的识别(车型、品牌、车系、车身颜色以及车牌等识别任务)。首先,利用深度卷积神经网络自动完成车型的深度特征学习,在特征图上进行逻辑回归,从卡口道路复杂背景中提取出感兴趣区域(包括多车辆对象);然后,利用多任务深度学习网络对提取出来的车辆对象实现多层次的多任务识别。实验结果表明,提出的方法在识别精度和效率上都明显优于传统计算机视觉方法和现有的基于深度学习的识别引擎技术,该方法对车型、品牌、车系及车牌的识别与检测精度均达到98%以上,检测效率提升了1.6倍。 展开更多
关键词 卡口识别引擎 深度学习 级联网络 多任务深度学习 卷积神经网络
下载PDF
双曲镜面成像单目全景感知三维重构技术研究 被引量:2
13
作者 郭伟青 汤一平 +2 位作者 袁公 鲁少辉 陈麒 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1069-1075,共7页
本文针对基于单目全景立体感知的被测物体三维建模问题,通过研究单目单视点折反射全景成像机理,利用二次双曲面镜的光学特性,实现了一种全景立体感知三维测量与三维重构方法.依据单目全景立体视觉感知理论设计具有统一摄像机内部参数和... 本文针对基于单目全景立体感知的被测物体三维建模问题,通过研究单目单视点折反射全景成像机理,利用二次双曲面镜的光学特性,实现了一种全景立体感知三维测量与三维重构方法.依据单目全景立体视觉感知理论设计具有统一摄像机内部参数和颜色系统的全景感知系统,利用双曲镜面成像技术获取被测物体的激光反射点,得到被测物体全景切面扫描图像,利用空间几何约束关系获取被测物体表面的采样点数据,对采样点进行B样条曲面柔性拟合,改进通用重构方法在拟合非均匀采样点时形状的失真以及运算不稳定现象,避免控制点的大量增加,快速实现被测物体的三维重建.本文提出的基于双曲镜面成像的单目全景立体感知技术可应用于管道、隧道地下交通设施等检测及重构,可满足工程领域全景视觉实时三维测量及几何复制的需要,提高全景视觉几何实体测量及重构效率. 展开更多
关键词 双曲镜面成像 单目全景视觉 三维测量 三维重构
下载PDF
多任务分段紧凑特征的车辆检索方法 被引量:1
14
作者 何霞 汤一平 +2 位作者 陈朋 王丽冉 袁公 《中国图象图形学报》 CSCD 北大核心 2018年第12期1801-1812,共12页
目的随着公共安全领域中大规模图像监控及视频数据的增长以及智能交通的发展,车辆检索有着极其重要的应用价值。针对已有车辆检索中自动化和智能化水平低、难以获取精确的检索结果等问题,提出一种多任务分段紧凑特征的车辆检索方法,有... 目的随着公共安全领域中大规模图像监控及视频数据的增长以及智能交通的发展,车辆检索有着极其重要的应用价值。针对已有车辆检索中自动化和智能化水平低、难以获取精确的检索结果等问题,提出一种多任务分段紧凑特征的车辆检索方法,有效利用车辆基本信息的多样性和关联性实现实时检索。方法首先,利用相关任务之间的联系提高检索精度和细化图像特征,因此构造了一种多任务深度卷积网络分段学习车辆不同属性的哈希码,将图像语义和图像表示相结合,并采用最小化图像编码使学习到的车辆的不同属性特征更具有鲁棒性;然后,选用特征金字塔网络提取车辆图像的实例特征并利用局部敏感哈希再排序方法对提取到的特征进行检索;最后,针对无法获取查询车辆目标图像的特殊情况,采用跨模态辅助检索方法进行检索。结果提出的检索方法在3个公开数据集上均优于目前主流的检索方法,其中在Comp Cars数据集上检索精度达到0. 966,在Vehicle ID数据集上检索精度提升至0. 862。结论本文提出的多任务分段紧凑特征的车辆检索方法既能得到最小化图像编码及图像实例特征,还可在无法获取目标检索图像信息时进行跨模态检索,通过实验对比验证了方法的有效性。 展开更多
关键词 深度哈希算法 车辆检索 多任务 跨模态检索 卷积神经网络
原文传递
基于区域建议策略的视盘定位方法 被引量:1
15
作者 汤一平 王丽冉 +2 位作者 何霞 陈朋 袁公 《中国生物医学工程学报》 CAS CSCD 北大核心 2019年第1期9-17,共9页
视盘定位对利用眼底图像进行眼科疾病的计算机辅助诊疗十分重要。提出一种基于区域建议策略的视盘定位方法。首先,将眼底图像从像素域映射到特征域,在得到的特征图上利用区域建议策略生成视盘的初始候选区域;然后,按照一定准则对候选区... 视盘定位对利用眼底图像进行眼科疾病的计算机辅助诊疗十分重要。提出一种基于区域建议策略的视盘定位方法。首先,将眼底图像从像素域映射到特征域,在得到的特征图上利用区域建议策略生成视盘的初始候选区域;然后,按照一定准则对候选区域进行采样,构建全连接层对其进行深层特征提取,并利用损失函数的约束实现候选区域的位置精修;最后,通过置信度阈值的过滤对视盘可见性进行判断,若视盘可见,则将置信度最大的候选区域中心作为该眼底图像的视盘坐标,从而实现视盘的正确定位。在3个公开的眼底图像数据库(DRIVE(40张)、MESSIDOR(1 200张)和STARE(400张))中进行实验,定位准确率分别为100%、99.9%和98.8%。实验证明,该方法能够实现视盘的准确、快速、鲁棒定位,优于现有的视盘定位方法,且预先进行视盘可见性的判断更符合实际应用的要求,能够辅助眼底疾病的诊断处理。 展开更多
关键词 视盘定位 区域建议策略 眼底图像 深度学习 卷积神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部