期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Image Rain Removal Using Conditional Generative Networks Incorporating
1
作者 Fangyan Zhang Xinzheng Xu Peng Wang 《Journal of Computer and Communications》 2022年第2期72-82,共11页
The research of removing rain from pictures or videos has always been an important topic in the field of computer vision and image processing. Most noise reduction methods more or less remove texture details in rain-f... The research of removing rain from pictures or videos has always been an important topic in the field of computer vision and image processing. Most noise reduction methods more or less remove texture details in rain-free areas, resulting in an over-smoothing effect in the restored background. The research on image noise removal is very meaningful. We exploit the powerful generative power of a modified generative adversarial network (CGAN) by enforcing an additional condition that makes the derained image indistinguishable from its corresponding ground-truth clean image. An efficient and lightweight attention machine mechanism NAM is introduced in the generator, and an IDN-CGAN model is proposed to capture image salient features through attention operations. Taking advantage of the mutual information in different dimensions of the features to further suppress insignificant channels or pixels to ensure better visual quality, we also introduce a new fine-grained loss function in the generator-discriminator pair, predicting and real data degree of disparity to achieve improved results. 展开更多
关键词 attention mechanism Conditional Production Adversarial Network loss Function Image Deraining
下载PDF
一种基于改进注意力机制的实时鲁棒语音合成方法 被引量:1
2
作者 唐君 张连海 李嘉欣 《信号处理》 CSCD 北大核心 2022年第3期527-535,共9页
针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:1.采用音素嵌入作为输入,以减少一些错误发音问题;2.引入一种注意力损失来指导注意力模型的学习,以实现... 针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:1.采用音素嵌入作为输入,以减少一些错误发音问题;2.引入一种注意力损失来指导注意力模型的学习,以实现其快速、准确的学习能力;3.采用WaveGlow模型作为声码器,以加快语音生成的速度。在LJSpeech数据集上的实验表明,改进后的网络提高了注意力学习的速度和精度,合成语音的错误率相比基线降低了33.4%;同时,整个网络合成语音的速度相比之下提升约523倍,实时因子(Real Time Factor,RTF)为0.96,满足实时性的要求;此外,在语音质量方面,合成语音的平均主观意见分(Mean Opinion Score,MOS)达到3.88。 展开更多
关键词 语音合成 注意力损失机制 Tacotron 2 WaveGlow 序列到序列
下载PDF
基于YOLOv5改进模型的柑橘果实识别方法 被引量:37
3
作者 黄彤镔 黄河清 +4 位作者 李震 吕石磊 薛秀云 代秋芳 温威 《华中农业大学学报》 CAS CSCD 北大核心 2022年第4期170-177,共8页
为实现在自然环境下对柑橘果实的识别,提出一种基于YOLOv5改进模型的柑橘识别方法。通过引入CBAM(convolutional block attention module,卷积注意力模块)注意力机制模块来提高网络的特征提取能力,改善遮挡目标与小目标的漏检问题;采用... 为实现在自然环境下对柑橘果实的识别,提出一种基于YOLOv5改进模型的柑橘识别方法。通过引入CBAM(convolutional block attention module,卷积注意力模块)注意力机制模块来提高网络的特征提取能力,改善遮挡目标与小目标的漏检问题;采用α-IoU损失函数代替GIoU损失函数作为边界框回归损失函数,提高边界框定位精度。结果显示:本研究提出的模型平均精度AP值达到91.3%,在GPU上对单张柑橘果实图像的检测时间为16.7 ms,模型占用内存为14.5 Mb。结果表明,本研究基于YOLOv5的改进算法可实现在自然环境下快速准确地识别柑橘果实,满足实时目标检测的实际应用需求。 展开更多
关键词 YOLOv5 柑橘识别 自动采摘 CBAM 损失函数 注意力机制 α-IoU
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部