期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
基于改进YOLOv8算法的垂钓活动监测方法
1
作者 冯孟雅 《江淮水利科技》 2024年第4期46-50,共5页
为实现对灌区垂钓活动的智能化精准识别,提出一种基于改进YOLOv8算法的垂钓活动监测方法。该方法在YOLOv8的骨干网络中添加多尺度特征融合模块(Conv-M),用来学习来自不同卷积层(Conv)的特征,同时利用自学习的权重系数对特征进行加权融合... 为实现对灌区垂钓活动的智能化精准识别,提出一种基于改进YOLOv8算法的垂钓活动监测方法。该方法在YOLOv8的骨干网络中添加多尺度特征融合模块(Conv-M),用来学习来自不同卷积层(Conv)的特征,同时利用自学习的权重系数对特征进行加权融合,增强网络对垂钓活动的特征提取能力。通过训练网络得到垂钓活动监测模型,实现对视频图像数据中的垂钓活动进行检测和识别。该方法相较于YOLOv8方法的查准率提高了1.1%,查全率提高了1.4%,平均识别精度提高了0.9%。研究成果可提高灌区垂钓活动监管的智能化水平。 展开更多
关键词 YOLOv8算法 conv-M 数字灌区 垂钓活动监管
下载PDF
胎盘超声图像分割
2
作者 徐成 张芸 曾祥进 《计算机与现代化》 2024年第5期115-119,126,共6页
妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合EC... 妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合ECA(Efficient Channel Attention)注意力机制,在不过多引入参数量的同时提高对胎盘细节特征识别的准确度。将交叉注意力机制引入跳跃链接,解决胎盘边界模糊、对比度不均等问题。与普通U-Net网络相比,本文算法分别在交并比(IoU)、召回率(Recall)、精确度(Precision)、Dice系数上提升4.14、9.59、6.2、16.41个百分点。实验结果表明,改进后的网络模型具有较好的分割效果,能够将超声图像中的胎盘进行精确分割。 展开更多
关键词 胎儿超声图像 胎盘检测 Do-conv ECA注意力 MHCA
下载PDF
Computer vision-based six layered ConvNeural network to recognize sign language for both numeral and alphabet signs 被引量:1
3
作者 Muhammad Aminur Rahaman Kabiratun Ummi Oyshe +3 位作者 Prothoma Khan Chowdhury Tanoy Debnath Anichur Rahman Md.Saikat Islam Khan 《Biomimetic Intelligence & Robotics》 EI 2024年第1期45-58,共14页
People who have trouble communicating verbally are often dependent on sign language,which can be difficult for most people to understand,making interaction with them a difficult endeavor.The Sign Language Recognition(... People who have trouble communicating verbally are often dependent on sign language,which can be difficult for most people to understand,making interaction with them a difficult endeavor.The Sign Language Recognition(SLR)system takes an input expression from a hearing or speaking-impaired person and outputs it in the form of text or voice to a normal person.The existing study related to the Sign Language Recognition system has some drawbacks,such as a lack of large datasets and datasets with a range of backgrounds,skin tones,and ages.This research efficiently focuses on Sign Language Recognition to overcome previous limitations.Most importantly,we use our proposed Convolutional Neural Network(CNN)model,“ConvNeural”,in order to train our dataset.Additionally,we develop our own datasets,“BdSL_OPSA22_STATIC1”and“BdSL_OPSA22_STATIC2”,both of which have ambiguous backgrounds.“BdSL_OPSA22_STATIC1”and“BdSL_OPSA22_STATIC2”both include images of Bangla characters and numerals,a total of 24,615 and 8437 images,respectively.The“ConvNeural”model outperforms the pre-trained models with accuracy of 98.38%for“BdSL_OPSA22_STATIC1”and 92.78%for“BdSL_OPSA22_STATIC2”.For“BdSL_OPSA22_STATIC1”dataset,we get precision,recall,F1-score,sensitivity and specificity of 96%,95%,95%,99.31%,and 95.78%respectively.Moreover,in case of“BdSL_OPSA22_STATIC2”dataset,we achieve precision,recall,F1-score,sensitivity and specificity of 90%,88%,88%,100%,and 100%respectively. 展开更多
关键词 conv NeuralSign language CNN Static Feature extraction convolution2D Fully connected layer DROPOUT
原文传递
基于改进LadderNet的视网膜血管分割应用
4
作者 吴亚兰 蒋传健 《信息技术与信息化》 2024年第4期118-121,共4页
视网膜血管的分割有助于辅助医学工作者对眼部或全身性疾病进行诊断和治疗。为进一步提升视网膜血管的分割精度,改进LadderNet架构应用于视网膜血管分割。首先结合DO-Conv,提出改进的池化卷积块替换LadderNet中的池化卷积层,保留强上下... 视网膜血管的分割有助于辅助医学工作者对眼部或全身性疾病进行诊断和治疗。为进一步提升视网膜血管的分割精度,改进LadderNet架构应用于视网膜血管分割。首先结合DO-Conv,提出改进的池化卷积块替换LadderNet中的池化卷积层,保留强上下文特征;其次引入不平衡注意力模块应用在改进LadderNet网络末端,处理血管和背景,以及粗血管和细小血管之间的类不平衡问题。所提的方法在数据集DRIVE上实验得到AUC、SE、SP评价指标值分别为0.9564、0.7863和0.9802。实验结果表明,改进LadderNet对提升视网膜血管分割精度有一定的作用。 展开更多
关键词 视网膜眼底图像 血管分割 LadderNet DO-conv 不平衡注意力模块
下载PDF
基于DO-Conv的DBNet文本检测方法研究 被引量:2
5
作者 曾祥福 钟维良 +1 位作者 郑阳超 陈海钦 《工业控制计算机》 2022年第11期100-101,103,共3页
目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处... 目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处理的步骤和预测的时间。DBNet方法提出可学习阈值并设计了一个二值化函数,简化了后处理的步骤,在文本检测任务中取得了很好的效果。随着越来越多的网络被提出并且在计算机视觉中都有不错的效果,针对基于分割方法的后处理复杂和预测速度慢问题,在DBNet方法上应用了较为新的ResNeSt网络,同时引入了DO-Conv卷积方式。实验结果表明,该方法在多个指标上都要优于DBNet方法,有较好的文本检测性能。 展开更多
关键词 文本检测 DBNet ResNeSt DO-conv
下载PDF
An Accurate FFT-Based Algorithm for Bermudan Barrier Option Pricing
6
作者 Deng Ding Zuoqiu Weng Jingya Zhao 《Intelligent Information Management》 2012年第3期89-93,共5页
An efficient and accurate numerical method, which is called the CONV method, was proposed by Lord et al in [1] to price Bermudan options. In this paper, this method is applied to price Bermudan barrier options in whic... An efficient and accurate numerical method, which is called the CONV method, was proposed by Lord et al in [1] to price Bermudan options. In this paper, this method is applied to price Bermudan barrier options in which the monitored dates may be many times more than the exercise dates. The corresponding algorithm is presented to practical option pricing. Numerical experiments show that this algorithm works very well for different exponential Lévy asset models. 展开更多
关键词 Fast FOURIER TRANSFORM (FFT) Bermudan BARRIER OPTION conv Method.
下载PDF
基于DO-Conv改进的端到端车牌识别算法 被引量:1
7
作者 赖珍向 丁磊 +1 位作者 邓杰航 顾国生 《计算机科学与应用》 2021年第3期588-595,共8页
提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer, DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表... 提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer, DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明:改进后的算法在合成数据集和SYSU数据集上的识别准确率分别为97.42%和95.08%,均优于使用传统卷积的端到端识别算法。 展开更多
关键词 车牌识别 端到端 深度过参数化卷积 DO-conv
下载PDF
如何优化电脑音响
8
作者 Simon Chung Benny Lau 《明日风尚》 2010年第5期124-125,14,共3页
你可有留意到,最近推出的音响组合,和从前的大不同——一般都支援USB记忆体或iPod播放;更有专门的一些内置有硬盘,或数字串流播放。渐渐消失的,是流行了四分之一个世纪的CD盘!简单描述这趋势,可称之为电脑音响年代的到来。
关键词 记忆体 串流 BENCHMARK 伺服器 CHORD 家居设计 网线 suppl 光学原理 conv
原文传递
New Procedure to Derive the Performance Indices Associated with Reservoir Operation Rule
9
作者 王金文 张勇传 张友权 《Journal of Donghua University(English Edition)》 EI CAS 2002年第4期111-114,共4页
Stochastic dynamic programming (SDP) is extensively used in the optimization for long-term reservoir operations. Generally, both of the steady state optimal policy and its associated performance indices (PIs) for mult... Stochastic dynamic programming (SDP) is extensively used in the optimization for long-term reservoir operations. Generally, both of the steady state optimal policy and its associated performance indices (PIs) for multipurpose reservoir are of prime importance. To derive the PIs there are two typical ways: simulation and probability formula. Among the disadvantages, one is that these approaches require the pre-specified operation policy. IHuminated by the convergence of objective function in SDP, a new approach, which has the advantage that its use can be concomitant with the solving of SDP, is proposed to determine the desired PIs. In the case study, its efficiency is also practically tested. 展开更多
关键词 DYNAMIC conv ergence performance index stochastic DYNAMIC programming RESERVOIR operation Markovian characteristic.
下载PDF
Blind Image Deblurring via Adaptive Optimization with Flexible Sparse St rue ture Control
10
作者 Ri-Sheng Liu Cai-Sheng Mao +1 位作者 Zhi-Hui Wang Hao-Jie Li 《Journal of Computer Science & Technology》 SCIE EI CSCD 2019年第3期609-621,共13页
Blind image deblurring is a long-standing ill-posed inverse problem which aims to recover a latent sharp image given only a blurry observation.So far,existing studies have designed many effective priors w.r.t.the late... Blind image deblurring is a long-standing ill-posed inverse problem which aims to recover a latent sharp image given only a blurry observation.So far,existing studies have designed many effective priors w.r.t.the latent image within the maximum a posteriori(MAP)framework in order to narrow down the solution space.These non-convex priors are always integrated into the final deblurring model,which makes the optimization challenging.However,due to unknown image distribution,complex kernel structure and non-uniform noises in real-world scenarios,it is indeed challenging to explicitly design a fixed prior for all cases.Thus we adopt the idea of adaptive optimization and propose the sparse structure control(SSC)for the latent image during the optimization process.In this paper,we only formulate the necessary optiinization constraints in a lightweight MAP model with no priors.Then we develop an inexact projected gradient scheme to incorporate flexible SSC in MAP inference.Besides Zp-norm based SSC in our previous work,we also train a group of denoising convolutional neural networks(CNNs)to learn the sparse image structure automatically from the training data under different noise levels,and we show that CNNs-based SSC can achieve similar results compared with Zp-norm but are more robust to noise.Extensive experiments demonstrate that the proposed adaptive optimization scheme with two types of SSC achieves the state-of-the-art results on both synthetic data and real-world images. 展开更多
关键词 BLIND image DEBLURRING conv olutio nal neural net work(CNN) non-convex optimization SPARSE structure control(SSC)
原文传递
基于时空相关性的短时交通流量预测方法 被引量:13
11
作者 闫杨 孙丽珺 朱兰婷 《计算机工程》 CAS CSCD 北大核心 2020年第1期31-37,共7页
新一代智能交通系统的智能出行、交通大数据智能化决策需要精准及时的短时交通流量预测,深度学习通过机器学习技术自身产生特征,可为短时交通流量预测提供解决方法。以深度学习模型为基础,提出一种结合Conv-GRU和Bi-GRU的短时交通流量... 新一代智能交通系统的智能出行、交通大数据智能化决策需要精准及时的短时交通流量预测,深度学习通过机器学习技术自身产生特征,可为短时交通流量预测提供解决方法。以深度学习模型为基础,提出一种结合Conv-GRU和Bi-GRU的短时交通流量预测方法,利用卷积-门控循环单元提取交通流量的时空特征,通过双向门控循环单元提取交通流量的周期特征,将提取的特征进行融合得到交通流量的预测值。实验结果表明,该方法能够准确地预测短时交通流量,与Conv-LSTM方法相比,收敛速度较快,具有更短的运行时间。 展开更多
关键词 短时交通流量 卷积-门控循环单元 双向门控循环单元 时空特征 周期性特征
下载PDF
多agent系统社会规范研究 被引量:4
12
作者 李常洪 李敏强 寇纪淞 《系统工程学报》 CSCD 2003年第1期43-48,共6页
社会规范是多agent系统中一种重要的协调机制,以往对社会规范的研究都没有系统地分析它的产生背景,因而对社会规范的界定不具有一般性.文章介绍了多agent系统社会规范的研究现状;建立了多agent系统演化过程的模型,并对演化过程做了直观... 社会规范是多agent系统中一种重要的协调机制,以往对社会规范的研究都没有系统地分析它的产生背景,因而对社会规范的界定不具有一般性.文章介绍了多agent系统社会规范的研究现状;建立了多agent系统演化过程的模型,并对演化过程做了直观解释;给出了场景态势以及与场景态势相关的几个概念,进而对社会规范进行了形式化定义;在对agent的认知能力分类的基础上,介绍了社会规范的生成机制,给出了隐式社会规范生成的判定规则;最后用一个仿真实例做了仿真实验. 展开更多
关键词 多AGENT系统 社会规范 场景态势 认知能力 人工智能
下载PDF
复杂场景下基于R-FCN的手势识别 被引量:11
13
作者 桑农 倪子涵 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第10期54-58,共5页
为了解决复杂场景下手势识别的问题,将基于区域的全卷积网络(R-FCN)用于手势识别.为了使网络适应复杂场景,利用在线难例挖掘技术对手势识别过程中产生的难例进行在线学习,并结合手的特征对网络参数进行优化调节.实验结果表明:基于R-FCN... 为了解决复杂场景下手势识别的问题,将基于区域的全卷积网络(R-FCN)用于手势识别.为了使网络适应复杂场景,利用在线难例挖掘技术对手势识别过程中产生的难例进行在线学习,并结合手的特征对网络参数进行优化调节.实验结果表明:基于R-FCN的手势识别方法能准确地从复杂场景中识别手势,识别率达到99.73%. 展开更多
关键词 人机交互 手势识别 深度学习 基于区域的全卷积网络(R-FCN) 在线难例挖掘
原文传递
基于SPD-Conv结构和NAM注意力机制的鱼群小目标检测
14
作者 谌雨章 王诗琦 +1 位作者 周雯 周婉婷 《计算机科学》 CSCD 北大核心 2024年第S01期426-432,共7页
为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有... 为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有的跨步卷积结构,保留了更多的细粒度信息,提升了特征学习的效率,提高了网络对低分辨率图像的检测效果。然后在网络中引入Normalization-based Attention Module(NAM)注意力机制,采用CBAM的模块集成方式,使用BN缩放因子来计算注意力权重,抑制了不显著的特征,提升了小目标检测的准确率。最后针对水下成像退化,对检测图片做反卷积预处理,减小了水下成像退化因素对检测造成的影响。实验结果显示,在WildFish数据集上模型的整体精度达到97.2%,与YOLOv7算法相比提升了7.6%,准确率提升了8.5%,召回率提升了9.8%,与Efficientdet,SSD,YOLOv5及YOLOv8算法相比,所提模型精度分别提升了12.6%,17.8%,4%及2.9%,在Aquarium数据集上模型的整体精度达到80.5%,相比Efficientdet,SSD,YOLOv5,YOLOv7及YOLOv8分别提升了18.4%,11.6%,6.9%,2.0%及2.7%,可以满足水下鱼群识别的需求。 展开更多
关键词 SPD-conv结构 NAM注意力机制 YOLOv7算法 鱼群检测 目标检测
下载PDF
基于YOLOv5的行李运输系统轮对裂纹检测算法
15
作者 方浩楠 李登鹏 《计算技术与自动化》 2024年第2期77-81,共5页
为了检测机场行李运输系统中轮对存在的裂纹,提出了一种基于YOLOv5的机场行李运输系统轮对裂纹检测方法。该方法针对裂纹细小、密集等特点采取了以下措施:在YOLOv5网络的Head部分使用SIoU替换了原有的CIoU;在Backbone部分加入了SE注意... 为了检测机场行李运输系统中轮对存在的裂纹,提出了一种基于YOLOv5的机场行李运输系统轮对裂纹检测方法。该方法针对裂纹细小、密集等特点采取了以下措施:在YOLOv5网络的Head部分使用SIoU替换了原有的CIoU;在Backbone部分加入了SE注意力机制;在Neck部分引入了Swin-Transformer模块;在整个YOLOv5网络中使用SPD-Conv替代了传统的Conv卷积模块;在图像的预处理方面,使用了图像分割与子图反向拼接技术。通过这些改进,有效地改善了YOLOv5对于细小、密集裂纹的特征提取能力,相较于传统的YOLOv5算法,裂纹检测的能力得到了有效提升。 展开更多
关键词 裂纹检测 YOLOv5 SPD-conv(space-to-depth-conv) SIoU 注意力机制 图像预处理
下载PDF
基于CGS-Ghost YOLO的交通标志检测研究 被引量:3
16
作者 赵宏 冯宇博 《计算机工程》 CAS CSCD 北大核心 2023年第12期194-204,共11页
在交通标志检测任务中,YOLOv5检测算法在复杂的环境和路况下存在漏检、错检及模型参数量过大等问题。为此,提出一种改进的CGS-Ghost YOLO检测模型。YOLOv5在图片输入后使用Focus模块进行下采样,增加较多参数,CGS-Ghost YOLO模型使用Stem... 在交通标志检测任务中,YOLOv5检测算法在复杂的环境和路况下存在漏检、错检及模型参数量过大等问题。为此,提出一种改进的CGS-Ghost YOLO检测模型。YOLOv5在图片输入后使用Focus模块进行下采样,增加较多参数,CGS-Ghost YOLO模型使用StemBlock模块替换Focus模块进行采样,能够在维持精度的同时减少参数,并通过引入坐标注意力机制,强化特征中的语义信息和位置信息,提高模型的特征提取能力。设计SMU激活函数与组归一化相结合的CGS卷积模块,避免训练过程中Batch Size大小对模型所造成的影响,在使用GhostConv减少模型参数的同时,提升模型的检测精度。在此基础上,通过α-CIoU Loss+VFocal Loss损失函数,改善交通标志检测任务中正负样本不平衡的问题,提升模型整体性能,Neck部分使用Bi-FPN双向特征金字塔网络,实现检测目标多尺度特征的有效融合。实验结果表明,改进的CGS-Ghost YOLO模型在交通标志检测数据集TT100K中的平均精度均值达到93.1%,相较于原始模型提高了11.3个百分点,模型参数量相较于原始模型降低了21.2个百分点。此外,该网络模型优化了卷积层及下采样部分,在大幅减少模型参数的同时提高了模型检测精度。 展开更多
关键词 深度学习 目标检测 YOLOv5检测算法 注意力机制 CGS conv模块
下载PDF
一种基于Conv-LSTM的滚动轴承故障诊断方法 被引量:7
17
作者 毕鹏远 《机电工程技术》 2021年第11期113-115,共3页
针对轴承传统的故障诊断方法存在辨别故障类型难和预处理步骤多的问题,提出一种基于Conv-LSTM(卷积长短期记忆网络)的模型。该模型以Conv-LSTM单元模块作为处理层,能自识别和自处理故障特征信息;同时该模型可直接处理切片后的原始信号,... 针对轴承传统的故障诊断方法存在辨别故障类型难和预处理步骤多的问题,提出一种基于Conv-LSTM(卷积长短期记忆网络)的模型。该模型以Conv-LSTM单元模块作为处理层,能自识别和自处理故障特征信息;同时该模型可直接处理切片后的原始信号,通过Conv-LSTM模型的分类结果并结合标签可诊断出滚动轴承的故障类型。对SKF6205型轴承进行实验,实验结果表明相对于LSTM,基于Conv-LSTM的诊断模型具有更好的分类效果和更高的分类准确率,且在迭代过程中准确率在0.96以上,可作为诊断滚动轴承故障类型的一种方法。 展开更多
关键词 conv-LSTM 轴承 故障诊断 分类
下载PDF
基于图卷积网络的热轧带钢轧制力预测 被引量:5
18
作者 李维刚 刘玮汲 +1 位作者 谢璐 赵云涛 《钢铁》 CAS CSCD 北大核心 2023年第3期89-96,127,共9页
热连轧生产为多钢种、多规格混杂的带钢连续轧制过程,现有的机器学习方法不能考虑各带钢层的影响,将各带钢的轧制力预测过程视为独立的而不是关联的,这种做法不符合实际情况。提出一种预测带钢轧制力的梯度提升树-图卷积神经网络(gradie... 热连轧生产为多钢种、多规格混杂的带钢连续轧制过程,现有的机器学习方法不能考虑各带钢层的影响,将各带钢的轧制力预测过程视为独立的而不是关联的,这种做法不符合实际情况。提出一种预测带钢轧制力的梯度提升树-图卷积神经网络(gradient boosting decision tree-graph convolutional networks, GBDT-GCN)模型。首先,构建用于轧制力预测的带钢关系图结构,将数据集中的每块带钢作为图结构中的节点,根据带钢的轧制时序、层别关系生成各带钢节点之间的连接边,将连续轧制、相同层别的带钢关联起来;接着,将图结构输入结构调整后的GCN模型,采用平均绝对误差作为损失函数进行模型训练,采用GBDT对轧制力的影响因素进行重要性排序,并根据GCN模型的预测精度变化筛选出重要的因子作为最终的节点特征向量。最后,利用国内某热连轧机组的实际生产数据进行试验验证,结果表明,GBDT-GCN模型在测试集上的平均绝对误差为405.6 kN,相对误差在±10%以内的数据所占比例为91.5%,相较于传统SIMS模型、RF随机森林算法、MLP多层感知机模型,利用带钢关系图结构预测轧制力的GBDT-GCN模型具有更高的预报精度。 展开更多
关键词 热连轧带钢 轧制力预测 特征选择 梯度提升树 图卷积神经网络
原文传递
基于HSV颜色空间特征的视频烟雾检测 被引量:5
19
作者 曹灿灿 龚声蓉 +1 位作者 周立凡 钟珊 《计算机技术与发展》 2022年第5期171-175,共5页
由于烟雾具有形状不规则、扩散缓慢的特性,导致传统烟雾识别方法对烟雾检测存在一定的缺陷,如烟雾检测准确率低、烟雾警报响应时间长等问题。为了满足野外空旷场景下烟雾检测的准确性和实时性,提出了基于HSV(Hue, Saturation, Brightne... 由于烟雾具有形状不规则、扩散缓慢的特性,导致传统烟雾识别方法对烟雾检测存在一定的缺陷,如烟雾检测准确率低、烟雾警报响应时间长等问题。为了满足野外空旷场景下烟雾检测的准确性和实时性,提出了基于HSV(Hue, Saturation, Brightness,色调,饱和,明亮)颜色空间特征和卷积神经将网络相结合的视频烟雾检测的识别方法。通过将烟雾图像的RGB颜色空间特征映射到HSV颜色空间特征后提取烟雾候选区域,提取到的烟雾候选区域经过高斯混合模型进行运动判断,然后将符合运动特征的烟雾候选区域图像送入到训练好的卷积神经网络中进行烟雾识别。针对传统烟雾检测效率问题,设计了卷积神经网络conv-12用于烟雾识别。实验结果表明,基于HSV颜色空间特征和卷积神经网络conv-12相结合的视频烟雾识别方法对视频烟雾检测的准确率为96.45%,烟雾检测率为93.3%,烟雾报警平均响应时间为0.9 s。相较于其他方法,在烟雾检测准确率、烟雾检测率、烟雾警报响应时间都有一定的提升。 展开更多
关键词 烟雾检测 HSV颜色空间特征 卷积神经网络 conv-12 烟雾警报
下载PDF
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
20
作者 兰朝凤 蒋朋威 +4 位作者 陈欢 赵世龙 郭小霞 韩玉兰 韩闯 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1005-1012,共8页
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型... 目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。 展开更多
关键词 语音分离 视听融合 跨模态注意力 双路径递归网络 conv-TasNet
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部