期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于多尺度特征互补和聚合约束的肺结节分类方法 被引量:2
1
作者 张琮昊 +1 位作者 王占全 王喆 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期435-441,共7页
肺结节分类问题是早期肺癌检测与诊断的重要问题之一,针对现有的肺结节分类方法存在多尺度特征融合的信息冗余和缺乏判别性特征表示等问题,提出了一个基于多尺度特征互补与聚合约束(Multi-scale Feature Complementation and Aggregate ... 肺结节分类问题是早期肺癌检测与诊断的重要问题之一,针对现有的肺结节分类方法存在多尺度特征融合的信息冗余和缺乏判别性特征表示等问题,提出了一个基于多尺度特征互补与聚合约束(Multi-scale Feature Complementation and Aggregate Constraint, MFCAC)的肺结节分类方法,并提出了多尺度特征互补模块用于学习相邻尺度特征的差异信息,从而避免特征融合过程中的信息冗余;同时在网络特征层引入了聚合约束损失,实现对同类特征的聚集,提高网络判别性特征表示能力;将两个模块融入在编码器-解码器架构中形成MFCAC,共同作用实现高效分类。本文在LIDC-IDRI数据集上进行了对比实验,并通过消融实验分析了该方法中各组成部分的贡献和影响,结果表明,相较于对比算法,MFCAC在肺结节分类上具有更优的性能。 展开更多
关键词 早期肺癌诊断 肺结节分类 深度学习 多尺度特征 卷积神经网络
下载PDF
基于移动窗口注意力机制和编码解码器的肺结节分类方法 被引量:1
2
作者 张琮昊 +1 位作者 王占全 王喆 《大连工业大学学报》 CAS 2024年第1期73-78,共6页
针对肺结节分类方法仍存在缺乏推理过程的可解释性和判别性特征表示等问题,提出了一个基于移动窗口注意力机制和编码解码器肺结节分类方法(SWAC)来对图像进行特征提取。该模型结合了卷积神经网络(CNN)和移动窗口注意力机制的优势,通过... 针对肺结节分类方法仍存在缺乏推理过程的可解释性和判别性特征表示等问题,提出了一个基于移动窗口注意力机制和编码解码器肺结节分类方法(SWAC)来对图像进行特征提取。该模型结合了卷积神经网络(CNN)和移动窗口注意力机制的优势,通过关注结节分类所必需的区域进行结节分类,有效地提取了结节的浅层特征和深层特征。该卷积神经网络引入了Focal损失函数,对网络主干进行特征约束来关注难分类样本,以此提升网络的判别表征能力。在LIDC-IDRI数据集上通过消融实验分析了该方法中各部分的贡献和影响,结果表明,SWAC分类方法具有优异的性能。 展开更多
关键词 肺结节分类 深度学习 注意力机制
下载PDF
基于伪标签依赖增强与噪声干扰消减的小样本图像分类
3
作者 唐芮琪 肖婷 +1 位作者 王喆 《计算机科学》 CSCD 北大核心 2024年第8期152-159,共8页
深度学习在图像分类领域的成功很大程度上依赖于大规模数据,然而在许多应用场景中,收集足够的数据用于模型的训练是比较困难的。因此,旨在利用有限的数据获得高性能模型的小样本学习成为热点研究方向。在小样本图像分类领域,使用无标签... 深度学习在图像分类领域的成功很大程度上依赖于大规模数据,然而在许多应用场景中,收集足够的数据用于模型的训练是比较困难的。因此,旨在利用有限的数据获得高性能模型的小样本学习成为热点研究方向。在小样本图像分类领域,使用无标签数据来扩充训练数据集是一种常用的方法,但该方法面临两个亟待解决的难题:如何获取无标签数据的伪标签以及如何减轻噪声标签累积的负面影响?首先,为获得高质量的伪标签,需要解决由源域和目标域的分布偏移导致的噪声标签问题,因而提出基于希尔伯特-施密特独立准则(Hilbert-Schmidt Independent Criterion,HSIC)的依赖增强方法,通过最大化图像特征表示与标签之间的相关性,从而提高伪标签的预测可靠度。其次,为克服标签预测误差随着时间推移不断累积的问题,提出噪声标签干扰消减(Noise Label Interference Reduction,NLIR)方法,确保具有正确标签的样本的梯度始终主导着训练动态,从而将模型引向最优解。所提方法在小样本图像分类基准数据集mini-ImageNet和tiered-ImageNet上进行了评估,实验结果表明,该方法能够很好地利用无标签数据提升分类精度,具有良好的分类性能。 展开更多
关键词 深度学习 图像分类 小样本学习 伪标签 噪声标签 希尔伯特-施密特独立准则
下载PDF
基于元学习自适应的小样本语音合成
4
作者 吴郅昊 +1 位作者 肖婷 王喆 《计算机应用》 CSCD 北大核心 2024年第5期1629-1635,共7页
在小样本条件下的语音合成(TTS)要求在仅有少量样本的情况下合成与原说话人相似的语音,然而现有的小样本语音合成面临如下问题:如何快速适配新说话人,并且在保证语音质量的情况下提高生成语音与说话人的相似性。现有模型在适配新说话人... 在小样本条件下的语音合成(TTS)要求在仅有少量样本的情况下合成与原说话人相似的语音,然而现有的小样本语音合成面临如下问题:如何快速适配新说话人,并且在保证语音质量的情况下提高生成语音与说话人的相似性。现有模型在适配新说话人的过程中,很少考虑到在不同适配阶段模型特征的变化规律,导致生成语音不能在保证语音质量的情况下快速提升语音相似性。为了解决上述问题,提出一种使用元学习指导模型适配新说话人的方法,模型中通过元特征模块对适配过程进行指导,在适配新说话人过程中提升语音相似度的同时保证生成语音质量;并通过步数编码器区分不同的适配阶段,以提升模型适配新说话人的速度。在Libri-TTS与VCTK数据集上通过主观与客观评价指标,在不同的适配步数下对现有快速适配新说话人的方法进行了比较,实验结果表明所提方法动态时间规整的梅尔倒谱失真(DTW-MCD)分别为7.4502与6.5243,在合成语音的相似度上优于其他元学习方法,并且能够更快适配新的说话人。 展开更多
关键词 小样本生成 语音合成 元学习 说话人适配 特征提取
下载PDF
面向多标签小样本学习的双流重构网络
5
作者 方仲礼 王喆 《计算机科学》 CSCD 北大核心 2022年第1期212-218,共7页
多标签图像分类问题是计算机视觉领域的重要问题之一,它需要对图像中的所有标签进行预测。而一幅图像中待分类的标签个数往往不止一个,同时图像中对象的大小、位置和姿态的变化都会对模型的分类性能产生影响。因此,如何有效地提高图像... 多标签图像分类问题是计算机视觉领域的重要问题之一,它需要对图像中的所有标签进行预测。而一幅图像中待分类的标签个数往往不止一个,同时图像中对象的大小、位置和姿态的变化都会对模型的分类性能产生影响。因此,如何有效地提高图像特征的准确表达能力是一个亟需解决的难题。针对上述难题,文中提出了一个新颖的双流重构网络来对图像进行特征抽取。具体而言,该模型首先应用一个双流注意力网络来对图像进行基于通道信息和空间信息的特征提取,并经过特征拼接使得图像特征同时兼顾通道特征细节信息和空间特征细节信息。其次,该模型引入了重构损失函数,对双流网络进行特征约束,迫使上述两种分歧特征具有相同的特征表达能力,以此促使提取的双流特征共同向真值特征迫近。在基于VOC 2007和MS COCO多标签图像数据集上的实验结果表明,所提出的双流重构网络能够准确有效地提取出显著特征,并产生更好的分类精度。同时,鉴于重建损失对模型的解拟合作用,将该方法应用在小样本场景上,实验结果显示,所提模型对小样本数据同样具有较好的分类精度。 展开更多
关键词 多标签图像识别 特征重构 深度学习 小样本学习 图像注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部