期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于图像放缩增强网络的图像分类方法
1
作者 冯继凡 杨清 石昌鑫 《信息技术与信息化》 2024年第5期181-184,共4页
随着人工智能的快速发展,基于深度神经网络的图像分类任务性能得到了巨大提升,在图像检索、智能安防和自动驾驶等领域具有重要的应用价值。但目前图像分类网络的性能通常会受到输入图像大小的限制,相比于输入较小的图像,增大输入图像大... 随着人工智能的快速发展,基于深度神经网络的图像分类任务性能得到了巨大提升,在图像检索、智能安防和自动驾驶等领域具有重要的应用价值。但目前图像分类网络的性能通常会受到输入图像大小的限制,相比于输入较小的图像,增大输入图像大小可以保留更多的细节信息,保证网络可以提取到更丰富的特征,从而提高分类准确性,但其也会降低网络的推理速度。目前的深度学习算法通常用线性插值的方式调整图像分辨率至固定大小,这种方式往往会限制网络的性能。针对上述图像输入大小和插值方式对分类准确率的影响问题,提出了一种基于图像放缩网络的图像分类方法,以轻量化网络架构Effi cientNet为基准分类网络,引入混合空洞卷积增大特征的感受野,并设计了一种图像放缩增强网络模块对输入图片进行压缩增强,在少量增加网络参数量的情况下,丰富输入图像包含的信息,提升分类网络的分类性能。多组实验证明,所提出方法对图像分类准确率有着显著的提高。 展开更多
关键词 图像分类 混合空洞卷积 感受野 Effi cientnet 图像放缩增强
下载PDF
基于图卷积神经网络的语音情感识别
2
作者 金俊林 于玲 周骁群 《信息技术与信息化》 2022年第8期202-205,共4页
语音情感识别是目前广受关注的人机交互的手段,具有重要的意义。为了解决目前语音情感识别效率低、识别准确率差等问题,通过增强卷积神经网络的特征提取能力,提出了一种基于图卷积神经网络的语音情感分类模型,该模型可以在卷积层之间进... 语音情感识别是目前广受关注的人机交互的手段,具有重要的意义。为了解决目前语音情感识别效率低、识别准确率差等问题,通过增强卷积神经网络的特征提取能力,提出了一种基于图卷积神经网络的语音情感分类模型,该模型可以在卷积层之间进行集成以增强提取的特征。将特征增强模块置于特征提取网络中,提取更密切的谱图相关特征,从而提高复合模型的分类精度。结果表明,该模型与单一模型相比,在IEMOCAP英文情感数据库上的识别精度提升了1.13%~1.51%,F_(1)提升可以达到3左右,验证了模型的有效性。 展开更多
关键词 语音情感识别 图卷积神经网络 深度学习 Effi cientnet LightGBM算法
下载PDF
A Hybrid Deep Learning Model for Real Time Hand Gestures Recognition
3
作者 S.Gnanapriya K.Rahimunnisa 《Intelligent Automation & Soft Computing》 SCIE 2023年第4期1105-1119,共15页
The performance of Hand Gesture Recognition(HGR)depends on the hand shape.Segmentation helps in the recognition of hand gestures for more accuracy and improves the overall performance compared to other existing deep n... The performance of Hand Gesture Recognition(HGR)depends on the hand shape.Segmentation helps in the recognition of hand gestures for more accuracy and improves the overall performance compared to other existing deep neural networks.The crucial segmentation task is extremely complicated because of the background complexity,variation in illumination etc.The proposed mod-ified UNET and ensemble model of Convolutional Neural Networks(CNN)undergoes a two stage process and results in proper hand gesture recognition.Thefirst stage is segmenting the regions of the hand and the second stage is ges-ture identification.The modified UNET segmentation model is trained using resized images to generate a cost effective semantic segmentation model.The Central Processing Unit(CPU)utilization and training time taken by these models with respect to three public benchmark datasets are also analyzed.Recognition is carried out with the ensemble learning model consisting of EfficientNet B0,Effi-cientNet B4 and ResNet V2152.Experimentation on NUS hand posture dataset-II,OUHANDS and HGRI benchmark datasets show that our architecture achieves a maximum recognition rate of 99.07%through semantic segmentation and the Ensemble learning model. 展开更多
关键词 Convolutional neural networks Efficientnet ensemble learning ResNet semantic segmentation UNet
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部