期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于深度学习的端到端乐谱音符识别 被引量:10
1
作者 黄志清 贾翔 +1 位作者 郭一帆 张菁 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2020年第6期653-660,共8页
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出... 光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,使得训练出的模型更加鲁棒;在模型设计上,基于darknet53基础网络和特征融合技术,设计端到端的目标检测模型来识别音符.用深度神经网络darknet53提取乐谱图像特征图,让该特征图上的音符有足够大的感受野,之后将神经网络上层特征图和该特征图进行拼接,完成特征融合使得音符有更明显的特征纹理,从而让模型能够检测到音符这类小物体.该模型采用多任务学习,同时学习音高、时值的分类任务和音符坐标的回归任务,提高了模型的泛化能力.最后在Muse Score生成的测试集上对该模型进行测试,音符识别精度高,可以达到0.96的时值准确率和0.98的音高准确率. 展开更多
关键词 光学乐谱识别 音符识别 深度学习 端到端 目标检测
下载PDF
基于部位感知的驾驶场景行人检测方法
2
作者 詹智祺 程艳云 《微电子学与计算机》 2024年第8期31-39,共9页
针对驾驶场景下的行人检测面临的环境复杂、行人密集和尺度跨越大等问题,提出一种智能驾驶场景下的端到端行人检测方法。为减少特征金字塔直接对特征相加造成的信息损失,引入双向特征增强模块(Bidirectional Feature Enhancement Module... 针对驾驶场景下的行人检测面临的环境复杂、行人密集和尺度跨越大等问题,提出一种智能驾驶场景下的端到端行人检测方法。为减少特征金字塔直接对特征相加造成的信息损失,引入双向特征增强模块(Bidirectional Feature Enhancement Module,BFEM),在双向通道上使用级联融合增强各层特征包含的信息。针对检测器在行人遮挡场景下感知力不足的问题,提出一种注意力部位感知模块(Embedding-based Attention Part-aware Module,EAPM),模块使用任务感知注意力增强特征前景特性,同时为人体部位添加了可见性损失,以此来增强模型对人体结构的感知经验。此外,改进任务感知注意力结合空间分组思想,增强子特征信息,减少噪声干扰,以此增强检测器的分类能力。在CrowdHuman和Citypersons数据集上对模型进行评估,实验证明了方法的有效性,在CrowdHuman中与基线相比提升了2.39%的AP值、2.21%的Recall和3.08%的R_(M)^(-2)值,取得了91.55%AP,89.88%Recall和43.90%R_(M)^(-2)的结果,在Citypersons中取得了44.4R_(M)^(-2)的结果。 展开更多
关键词 行人检测 特征融合 端到端目标检测 部位感知 任务感知注意力
下载PDF
融合不确定性估计的端到端视频事件检测算法
3
作者 庞枫骞 赵鸿飞 康营营 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第12期3759-3770,共12页
近年来,视频事件检测在计算机视觉领域受到了越来越多的关注。不确定性估计可以在输出检测结果不可靠时提醒决策系统或人员,从而减少决策失误。将不确定性估计引入事件检测任务,提出一种融合不确定性估计的端到端视频事件检测算法。该... 近年来,视频事件检测在计算机视觉领域受到了越来越多的关注。不确定性估计可以在输出检测结果不可靠时提醒决策系统或人员,从而减少决策失误。将不确定性估计引入事件检测任务,提出一种融合不确定性估计的端到端视频事件检测算法。该算法对预测视频事件的定位不确定性和分类不确定性进行估计,通过降低网络预测的不确定性优化网络性能。将不确定性估计和非极大值抑制策略相结合,进一步筛选出高质量预测框。实验结果表明:添加不确定性分支可提升模型的性能。在J-HMDB-21数据集上,所提算法在m AP50检测指标上相比先进算法提升了0.8%。在时空局部原子视觉(AVA)数据集上与其他的端到端算法相比,mAP50指标也得到了1.3%的提升。 展开更多
关键词 视频事件检测 不确定性估计 端到端学习 视频目标检测 深度神经网络
下载PDF
目标关联学习的端到端多目标检测与跟踪联合方法 被引量:1
4
作者 冯欣 殷一皓 +1 位作者 吴浩铭 石美凤 《重庆理工大学学报(自然科学)》 CAS 北大核心 2022年第4期143-152,共10页
在目前的多目标跟踪方法中,基于tracking-by-detection框架的跟踪方法因其较高的准确性而成为目前最主流的跟踪方法。该类方法通常采用独立的目标检测、特征提取和跟踪方法实现多目标跟踪,但这种多阶段的目标检测与跟踪方法效率低,不适... 在目前的多目标跟踪方法中,基于tracking-by-detection框架的跟踪方法因其较高的准确性而成为目前最主流的跟踪方法。该类方法通常采用独立的目标检测、特征提取和跟踪方法实现多目标跟踪,但这种多阶段的目标检测与跟踪方法效率低,不适合实时的应用场景。针对上述问题,提出了一种基于目标关联学习的端到端目标检测与跟踪方法,通过使用单一网络同时实现目标检测与层间特征融合的可区分特征提取,并采用目标关联网络学习目标间的特征关联性,端到端地实现多目标跟踪结果。实验结果表明:在MOT17数据集上,该方法的多目标跟踪综合准确度指标MOTA达到65.2,整体的预测速度达到9帧/s,比现有先进的多目标跟踪算法在速度和精度上都有明显提升,是一个可满足实际应用的高效目标检测和跟踪方法。 展开更多
关键词 端到端 关联学习 目标检测 目标跟踪
下载PDF
基于视觉自注意力模型的苗期玉米与杂草检测方法
5
作者 唐伯青 赵大勇 +1 位作者 熊锋 李德强 《南京农业大学学报》 CAS CSCD 北大核心 2024年第4期772-781,共10页
[目的]识别作物和杂草是农业智能化中自动除草的关键步骤。本文旨在解决作物与杂草识别精度低、检测模型实时性和鲁棒性差等问题。[方法]以叶龄处于3~8叶期的玉米及其伴生杂草为研究对象,提出一种高效准确的玉米苗与杂草的检测方法。该... [目的]识别作物和杂草是农业智能化中自动除草的关键步骤。本文旨在解决作物与杂草识别精度低、检测模型实时性和鲁棒性差等问题。[方法]以叶龄处于3~8叶期的玉米及其伴生杂草为研究对象,提出一种高效准确的玉米苗与杂草的检测方法。该方法以实时端到端目标检测视觉自注意力模型为基础框架,用小尺度卷积等效替代大尺度深度卷积的思想,以较小的精度损失降低推理耗时。引入一种包含上下文信息的自顶向下注意力机制,强化模型对小目标的检测效果。应用组合图像增强策略,提升模型精度与泛化能力。[结果]改进后模型的平均检测精度为90.11%,推理阶段单张图片耗时33.67 ms,模型参数量44.86 MB。改进后的模型比主流目标检测模型总体精度更高,且推理速度快。[结论]所提方法对于玉米苗与伴生杂草的整体检测性能优秀,能够提高杂草识别的准确性和效率。 展开更多
关键词 玉米 杂草 检测 实时视觉自注意力模型 等效卷积 图像增强
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部