-
题名基于多通道特征和混合注意力的环境声音分类
被引量:1
- 1
-
-
作者
周帅
李理
彭章君
黄鹏程
-
机构
西南科技大学计算机科学与技术学院
四川省自主可控人工智能工程技术中心
-
出处
《计算机技术与发展》
2023年第8期43-50,共8页
-
基金
国家自然科学基金(U21A20157)
国家重点研发计划(2019YFB1310501)。
-
文摘
环境声音分类(ESC)已成为非常重要的研究方向,但由于环境声音种类繁多,无法进行统一表征,加之易受噪声的干扰,使得ESC任务变得复杂。为了提高ESC任务的识别精度,提出了基于多通道特征和混合注意力模型的分类方法。首先,将ESC信号进行时频转换并使用多种滤波器提取频谱特征,将其重构为三通道特征图。多通道特征可以利用特征之间的互补性,弥补单一特征信息表征不足的缺点;其次,引入了一种由通道和时频注意力模块组成的混合分类模型,通道注意力模块计算特征图并对不同通道分配权重,含有更多有效信息且对该类声音分辨较好的通道特征则会被分配更多的权重,时频注意力模块会重点关注时域和频域中更有效的信息。该方法可较好地抑制背景噪声,消除冗余,提高收敛速度和分类精度。对比实验表明,在ESC-10,ESC-50数据集上的识别精度分别达到了96.25%和89.56%,在Urbansound8k的数据集上达到98.40%。
-
关键词
环境声音分类
多通道特征
通道注意力
时频注意力
混合注意力模型
深度模型
-
Keywords
environmental sound classification
multi-channel feature
channel attention
time-frequency attention
mixed attention model
deep model
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名高坝枢纽场景的数字孪生仿真系统设计与实现
- 2
-
-
作者
蒋昆宏
韩东轩
刘思敏
柴薪垚
李骧
李理
-
机构
西南科技大学
四川省工业自主可控人工智能工程技术研究中心
-
出处
《计算机技术与发展》
2024年第8期175-180,共6页
-
基金
国家自然科学基金(U21A20157)
国家重点研发计划(2019YFB1310501)
中国高校产学研创新基金(2021ZYA02018)。
-
文摘
针对当前泄洪消能建筑物运行期水流特性多变、地理环境复杂、水利信息散乱、信息处理效率低下等挑战,以高坝枢纽水垫塘为典型场景,提出一种面向该场景的数字孪生仿真系统设计与实现方法。该方法以搭载虚拟摄像头的虚拟无人机巡检作为辅助手段,从建模-数据-交互-仿真模拟-设备孪生体多个维度建立虚拟空间的对应映射关系和交互环境,为高坝枢纽的安全运行提供决策依据。阐述了数字孪生技术在高坝枢纽建筑中的运用,为减少数字孪生模型响应时间,提出在数字孪生仿真系统下使用二次度量误差边折叠算法(QEM)解决网格模型复杂问题,并通过实验结果验证其建筑原型设计的完备性。为下一步的图像处理等智能化应用提供决策参考。
-
关键词
高坝枢纽
数字孪生
场景建模
模型简化
数据交互
虚拟仿真
-
Keywords
high dam hub
digital twin
scene modeling
simplification of models
data exchange
virtual simulation
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名级联离散小波多频带分解注意力图像去噪方法
- 3
-
-
作者
王力
李小霞
秦佳敏
朱贺
周颖玥
-
机构
西南科技大学信息工程学院
四川省工业自主可控人工智能工程技术研究中心
四川绵阳四
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第1期288-295,共8页
-
基金
国家自然科学基金资助项目(62071399)
四川省科技计划资助项目(2023YFG0262,2021YFG0383)。
-
文摘
针对图像去噪网络中下采样导致高频信息损失和细节保留能力差的问题,设计了一种级联离散小波多频带分解注意力图像去噪网络。其中多尺度级联离散小波变换结构将原始图像分解为多个尺度下的高低频子带来代替传统下采样,能减少高频信息损失。多频带特征增强模块使用不同尺度的卷积核并行处理高低频特征,在子网络每一级下重复使用两次,可增强全局和局部的关键特征信息。多频带分解注意力模块通过注意力评估纹理细节成分的重要性并加权不同频带的细节特征,有助于多频带特征增强模块更好地区分噪声和边缘细节。多频带选择特征融合模块融合多尺度多频带特征增强选择性特征,提高模型对于不同尺度噪声的去除能力。在SIDD和DND数据集上,所提方法的PSNR/SSIM指标分别达到了39.35 dB/0.918、39.72 dB/0.955。实验结果表明,该方法的性能优于主流去噪方法,同时具有更清晰的纹理细节和边缘等视觉效果。
-
关键词
图像去噪
高频信息
级联离散小波变换
多频带特征增强
多频带分解注意力
-
Keywords
image denoising
high-frequency information
cascade discrete wavelet transform
multi-band feature enhancement
multi-band decomposition attention
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-