期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于注意力胶囊网络的家庭活动识别 被引量:8
1
作者 王金甲 纪绍男 +2 位作者 崔琳 夏静 杨倩 《自动化学报》 EI CSCD 北大核心 2019年第11期2199-2204,共6页
本文提出了一种注意力胶囊网络的新框架利用录音识别家庭活动.胶囊网络可以通过动态路由算法来选择基于每个声音事件的代表性频带.为了进一步提高其能力,我们在胶囊网络中加入注意力机制,它通过加权来增加对重要时间帧的关注.为了评估... 本文提出了一种注意力胶囊网络的新框架利用录音识别家庭活动.胶囊网络可以通过动态路由算法来选择基于每个声音事件的代表性频带.为了进一步提高其能力,我们在胶囊网络中加入注意力机制,它通过加权来增加对重要时间帧的关注.为了评估我们的方法,我们在声学场景和事件的检测和分类(Detection and Classification of Acoustic Scenes and Events, DCASE)2018挑战任务5数据集上进行测试.结果表明, F1平均得分可达92.1%,优于几个基线方法的F1得分. 展开更多
关键词 DCASE 2018挑战 声音事件分类 家庭活动识别 胶囊网络 注意力
下载PDF
基于注意力门控卷积循环神经网络的通用音频标记
2
作者 王金甲 崔琳 +1 位作者 杨倩 纪绍男 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2020年第3期360-367,共8页
研究了注意力门控卷积循环神经网络的通用音频标记问题.DCASE 2018挑战任务2的音频样本的数据集过少,容易造成过拟合问题.为了减少过拟合问题,采用数据增强方法,dropout策略.采用可学习的上下文门控模块以帮助选择与音频类最相关的特征... 研究了注意力门控卷积循环神经网络的通用音频标记问题.DCASE 2018挑战任务2的音频样本的数据集过少,容易造成过拟合问题.为了减少过拟合问题,采用数据增强方法,dropout策略.采用可学习的上下文门控模块以帮助选择与音频类最相关的特征.采用时间注意力机制关注音频事件的相关帧并且忽略不相关帧.在DCASE2018任务2的数据集上评估了提出的模型,开发集和测试集的平均准确率(MAP@3得分)分别为96.1%和92.4%,远高于此次竞赛的基线系统的平均准确率. 展开更多
关键词 DCASE 2018挑战 音频标记 门控卷积循环网络 上下文门控 注意力模块
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部