期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于载荷谱分析和混合深度学习车载储氢气瓶路况载荷模式识别
1
作者 李淳 胡越 +2 位作者 鞠宽 焦玲 高阳 《噪声与振动控制》 CSCD 北大核心 2024年第4期205-210,277,共7页
氢燃料电池汽车在行驶过程中受路况影响产生振动,引起的振动载荷可能导致车载气瓶产生表面损伤,直接影响气瓶的使用安全和效率。针对储氢气瓶路况载荷数据分布不平衡导致载荷识别效果不佳的问题,提出一种改进深度卷积生成模型(Deep Conv... 氢燃料电池汽车在行驶过程中受路况影响产生振动,引起的振动载荷可能导致车载气瓶产生表面损伤,直接影响气瓶的使用安全和效率。针对储氢气瓶路况载荷数据分布不平衡导致载荷识别效果不佳的问题,提出一种改进深度卷积生成模型(Deep Convolutional Generative Adversarial Networks,DCGAN)结合卷积神经网络(Convolutional Neural Network,CNN)的路况振动载荷识别方法。DCGAN可以实现样本扩充,提高模型的识别性能。同时,针对DCGAN的卷积计算只能处理相邻数据特征的问题,将自注意力机制(Self Attention,SA)引入DCGAN中,自注意力机制可以计算样本的特征点之间的关系,帮助DGCAN的生成器充分学习样本的全局特征,增强模型泛化性。最后通过CNN实现载荷识别。通过实验对提出模型进行测试,并与多种模型比较;实验结果表明,提出的模型对路况振动载荷识别准确率达到96.3%,与其他模型相比,该模型表现出更好的性能。 展开更多
关键词 振动与波 路况识别 数据增强 生成对抗网络 自注意力机制 模式识别
下载PDF
基于关联认知网络的语音情感识别模型
2
作者 张培杰 孙颖 +2 位作者 张雪英 贾海蓉 段淑斐 《微电子学与计算机》 2023年第8期1-9,共9页
人们通过语言表达情感是一个不断变化的过程,为了使用语音信号的时间连续性表达具体情感,本文搭建了一种基于关联认知网络的GA-GRUS-ICN模型.首先,对输入的语音特征使用GRUS网络提取深度时序特征;然后,引入自注意力机制给重要的特征片... 人们通过语言表达情感是一个不断变化的过程,为了使用语音信号的时间连续性表达具体情感,本文搭建了一种基于关联认知网络的GA-GRUS-ICN模型.首先,对输入的语音特征使用GRUS网络提取深度时序特征;然后,引入自注意力机制给重要的特征片段赋予更高的权重;最后,使用关联认知网络ICN构建情感之间的关联性,得到情感关联矩阵和最终识别结果,本文中对于超参数使用遗传算法GA进行选择.选用TYUT2.0、EMO-DB和CASIA语音数据库中的“悲伤”、“愤怒”、“高兴”三种基本情感作为实验数据,文章设计了五种实验方案进行两个消融实验,实验结果显示,三种模型在三种语音库的UA分别达到了80.83%、98.61%和88.13%,表明GA-GRUSICN识别模型在情感语音识别方面有较强的普适性,自注意力机制与GRUS-ICN模型比较适配,亦可以较好地进行语音情感识别. 展开更多
关键词 语音情感识别 关联认知网络 门控循环单元 遗传算法 自注意力机制
下载PDF
Hformer:highly efficient vision transformer for low-dose CT denoising
3
作者 Shi-Yu Zhang Zhao-Xuan Wang +5 位作者 Hai-Bo Yang Yi-Lun Chen Yang Li Quan Pan Hong-Kai Wang Cheng-Xin Zhao 《Nuclear Science and Techniques》 SCIE EI CAS CSCD 2023年第4期161-174,共14页
In this paper,we propose Hformer,a novel supervised learning model for low-dose computer tomography(LDCT)denoising.Hformer combines the strengths of convolutional neural networks for local feature extraction and trans... In this paper,we propose Hformer,a novel supervised learning model for low-dose computer tomography(LDCT)denoising.Hformer combines the strengths of convolutional neural networks for local feature extraction and transformer models for global feature capture.The performance of Hformer was verified and evaluated based on the AAPM-Mayo Clinic LDCT Grand Challenge Dataset.Compared with the former representative state-of-the-art(SOTA)model designs under different architectures,Hformer achieved optimal metrics without requiring a large number of learning parameters,with metrics of33.4405 PSNR,8.6956 RMSE,and 0.9163 SSIM.The experiments demonstrated designed Hformer is a SOTA model for noise suppression,structure preservation,and lesion detection. 展开更多
关键词 Low-dose CT Deep learning Medical image Image denoising Convolutional neural networks selfattention Residual network Auto-encoder
下载PDF
Towards better entity linking 被引量:2
4
作者 Mingyang LI Yuqing XING +1 位作者 Fang KONG Guodong ZHOU 《Frontiers of Computer Science》 SCIE EI CSCD 2022年第2期55-67,共13页
As one of the most important components in knowledge graph construction,entity linking has been drawing more and more attention in the last decade.In this paper,we propose two improvements towards better entity linkin... As one of the most important components in knowledge graph construction,entity linking has been drawing more and more attention in the last decade.In this paper,we propose two improvements towards better entity linking.On one hand,we propose a simple but effective coarse-to-fine unsupervised knowledge base(KB)extraction approach to improve the quality of KB,through which we can conduct entity linking more efficiently.On the other hand,we propose a highway network framework to bridge key words and sequential information captured with a self-attention mechanism to better represent both local and global information.Detailed experimentation on six public entity linking datasets verifies the great effectiveness of both our approaches. 展开更多
关键词 entity linking knowledge base extraction selfattention mechanism highway network
原文传递
改进的CRNN模型在警情文本分类中的研究与应用 被引量:1
5
作者 王孟轩 张胜 +2 位作者 王月 雷霆 杜渂 《应用科学学报》 CAS CSCD 北大核心 2020年第3期388-400,共13页
针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环... 针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环神经网络的模型,该模型优化了关键特征提取过程,弥补了现有模型短文本局部特征提取不足的缺陷.实验表明,该模型的准确率比常见分类模型提升了2%~3%,且能够有效保证数据局部特征的关联性,可以对案件描述所对应的案件类型进行准确分类,从而提高公安接处警平台的自动化效率. 展开更多
关键词 警情文本处理 文本分类 卷积神经网络 双向长短时记忆 selfattention
下载PDF
图像与问题双引导注意力机制视觉问答算法
6
作者 陈婷 王玉德 +2 位作者 任志伟 杨昊 高张弛 《通信技术》 2022年第1期36-42,共7页
针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法。模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成。该算法... 针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法。模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成。该算法先针对问题特征和图像特征分别使用自我注意力机制实现特征的自我加强,然后引入图像与问题双引导注意力机制,最后使用线性分类器分类输出。在VQA V2.0数据集上实验验证,该算法表现出较好的性能,准确率达到70.98%。 展开更多
关键词 视觉问答 交互推理 双引导注意力机制 自我注意
下载PDF
面向电网设备故障报告的半监督命名实体识别方法 被引量:8
7
作者 杨祎 崔其会 丁奕齐 《计算机应用》 CSCD 北大核心 2021年第S02期41-47,共7页
针对电网领域命名实体识别(NER)对人工标注的依赖问题,提出了一种面向电网设备故障报告的半监督命名实体识别方法 Semi-supervised PGTBC。首先使用基于多头自注意力机制的深度自注意力网络进行特征抽取,然后结合双向长短记忆神经网络(B... 针对电网领域命名实体识别(NER)对人工标注的依赖问题,提出了一种面向电网设备故障报告的半监督命名实体识别方法 Semi-supervised PGTBC。首先使用基于多头自注意力机制的深度自注意力网络进行特征抽取,然后结合双向长短记忆神经网络(BiLSTM)和条件随机场模型(CRF)建立电网领域命名实体识别模型,最后基于半监督思想,引入基于深度自注意力网络的实体类别综合描述相似度计算,结合PGTBC的置信度作为半监督阈值筛选依据,减少对电网设备故障报告实体标注的依赖。数据集使用来源于1 256篇的电网故障报告的10 301条标注样本数和30 829条无标注样本数。在有标注电网领域数据上的实验结果表明,基于PGTBC模型的预测F1为96.43%,相对于传统的BiLSTM-CRF模型提高了7.09个百分点。在无标注样本上,半监督方法 Semi-supervised PGTBC取得了93.16%的F1,相对半监督CRF模型的F1提高了23.4个百分点,并对无标注样本进行了自动标注,识别出1 661条新实体,有效减少电网设备故障报告命名实体任务对人工标注的依赖。 展开更多
关键词 命名实体识别 电网设备 半监督学习 多头自注意力机制 深度自注意力网络 双向长短记忆神经网络
下载PDF
基于上下文注意力的室外点云语义分割方法 被引量:3
8
作者 苏鸣方 胡立坤 黄润辉 《计算机工程》 CAS CSCD 北大核心 2023年第3期248-256,共9页
基于直接点的语义分割方法能够避免因点云结构化处理所造成的信息损失,但未充分利用多尺度上下文特征,导致行人、自行车等小目标的分割精度降低。提出一种基于上下文注意力的点云语义分割方法,其由双向上下文注意力融合和上下文编码-通... 基于直接点的语义分割方法能够避免因点云结构化处理所造成的信息损失,但未充分利用多尺度上下文特征,导致行人、自行车等小目标的分割精度降低。提出一种基于上下文注意力的点云语义分割方法,其由双向上下文注意力融合和上下文编码-通道自注意力模块组成。通过前向注意力通道进行邻近尺度特征融合,从而获得更多的浅层细粒度信息,而反向注意力通道进一步融合高层语义信息,以增强模型的上下文感知能力。为捕获全局上下文信息,设计上下文编码-通道自注意力模块,通过对多尺度特征进行编码,并为特征通道分配不同的权重,使网络更关注特定的通道特征,以减少特征的冗余。在SemanticKITTI和Semantic3D大规模室外点云数据集上的实验结果表明,该方法的平均交并比分别为55.0%和76.4%,其中在SemanticKITTI数据集上,相比基准方法RandLA-Net的行人和自行车交并比分别提高3.0和6.9个百分点,能有效捕获多尺度上下文信息,提高小目标的分割精度。 展开更多
关键词 语义分割 上下文注意力 室外点云 多尺度特征 通道自注意力 点云小目标
下载PDF
基于点-体素一致性约束的城市激光雷达点云分类
9
作者 李虎辰 管海燕 +2 位作者 雷相达 秦楠楠 倪欢 《中国激光》 EI CAS CSCD 北大核心 2024年第13期243-256,共14页
准确高效的点云分类在场景理解和数字孪生城市建设等任务中发挥着关键作用。利用单一点、体素等视觉结构数据的点云分类方法容易丢失关键几何特征;融合多种结构数据的点云分类方法学习到不同数据的多层次、多尺度特征,但难以平衡不同数... 准确高效的点云分类在场景理解和数字孪生城市建设等任务中发挥着关键作用。利用单一点、体素等视觉结构数据的点云分类方法容易丢失关键几何特征;融合多种结构数据的点云分类方法学习到不同数据的多层次、多尺度特征,但难以平衡不同数据之间的差异,降低了点云分类的准确性。因此,提出一个基于点-体素一致性约束的点云分类网络(PVCC-Net),用于准确分割城市场景中的不同尺寸地物。PVCC-Net采用双分支U-Net结构,体素和点分支分别负责提取粗粒度和细粒度特征,并利用点-体素一致性约束模块对齐粗细粒度特征,以减小不同粒度特征的分布差异。然后,所提网络采用点-体素自注意力机制自适应融合聚合后的粗粒度和细粒度特征,进而提升点云全局特征表达。引入Toronto3D、Semantic3D和SensatUrban三个城市场景点云数据集对PVCC-Net进行性能评估。结果显示,PVCC-Net分别取得了97.97%、93.80%和93.00%的总体精度(OA),以及82.92%、75.70%和55.40%的平均交并比(mIoU)。对比实验结果表明,相比基线方法,所提方法可以有效提升对复杂城市场景点云的分类性能,且获得更优的分类结果。 展开更多
关键词 遥感 点云分类 体素 一致性约束 自注意力机制 城市场景
原文传递
基于自注意力长短期记忆网络的Web软件系统实时剩余寿命预测方法 被引量:5
10
作者 党伟超 李涛 +2 位作者 白尚旺 高改梅 刘春霞 《计算机应用》 CSCD 北大核心 2021年第8期2346-2351,共6页
为了能够实时准确对Web软件系统的剩余使用寿命(RUL)进行预测,考虑Web系统健康状态性能指标的时序特性和指标间的相互依赖特性,提出了一种基于自注意力长短期记忆(Self-Attention-LSTM)网络的Web软件系统实时剩余寿命预测方法。首先,搭... 为了能够实时准确对Web软件系统的剩余使用寿命(RUL)进行预测,考虑Web系统健康状态性能指标的时序特性和指标间的相互依赖特性,提出了一种基于自注意力长短期记忆(Self-Attention-LSTM)网络的Web软件系统实时剩余寿命预测方法。首先,搭建加速寿命测试实验平台来收集反映Web软件系统老化趋势的性能指标数据;然后,根据该性能指标数据的时序特性来构建长短期记忆(LSTM)循环神经网络以提取性能指标的隐含层特征,并使用自注意力机制建模特征间的依赖关系;最后,得到系统RUL的实时预测值。在三组测试集上,把所提模型与反向传播(BP)网络和常规的循环神经网络(RNN)做了对比。实验结果表明,所提模型的平均绝对误差(MAE)比长短期记忆(LSTM)网络平均低16.92%,相对准确率(Accuracy)比LSTM网络平均高5.53%,验证了Self-Attention-LSTM网络剩余寿命预测模型的有效性。可见所提方法能为优化系统抗衰决策提供技术支撑。 展开更多
关键词 Web软件系统 剩余使用寿命 长短期记忆网络 自注意力机制 抗衰决策
下载PDF
融合残差网络与自注意力机制的心律失常分类 被引量:1
11
作者 袁成成 刘自结 +1 位作者 王常青 杨飞 《生物医学工程学杂志》 EI CAS 北大核心 2023年第3期474-481,共8页
在心血管疾病的诊断中,心电信号的分析一直起到至关重要的作用。目前如何利用算法有效识别出信号中的异常心拍,仍然是心电信号分析领域中的难点。本文将深度残差网络与自注意力机制相结合,提出了一种能够自动识别出异常心拍的分类模型,... 在心血管疾病的诊断中,心电信号的分析一直起到至关重要的作用。目前如何利用算法有效识别出信号中的异常心拍,仍然是心电信号分析领域中的难点。本文将深度残差网络与自注意力机制相结合,提出了一种能够自动识别出异常心拍的分类模型,该模型首先基于残差结构设计了18层卷积神经网络,用来充分提取信号中的局部特征,之后再结合双向门控循环单元,用于提高网络对于时序特征的挖掘能力,最后引入自注意力机制为提取到的每一个特征赋予区分化的权重,协助模型在训练的过程中更有效地关注重要特征,以此来获得较高的分类精度。本研究采用多种方式进行数据增强,缓解了由于数据不平衡问题对模型效果带来的影响。本研究实验数据来源于麻省理工学院与贝斯以色列医院(MIT-BIH)构建的心律失常数据库,最终结果表明,研究提出的模型在原始数据集上达到了98.33%的总体准确率,在优化后的数据集中达到了99.12%的总体准确率,证明了该模型在心电信号分类方面拥有良好的效果,具备应用到便携式心电检测设备的潜在价值。 展开更多
关键词 心电信号分类 残差网络 双向门循环控制单元 自注意力机制
原文传递
MultiHead-SelfAttentionBiLSTM网络应用于主观题评分的研究 被引量:2
12
作者 杨松 卫文学 《软件》 2020年第12期180-184,共5页
为了降低主观题评分对人工阅卷的依赖,提升主观题自动阅卷的效率和准确性,使评分结果更客观,设计了MultiHead-SelfAttention BiLSTM Automatic Grading模型。该模型是将深度学习与多头自注意力机制结合,采用BiLSTM模型对进行过人工判分... 为了降低主观题评分对人工阅卷的依赖,提升主观题自动阅卷的效率和准确性,使评分结果更客观,设计了MultiHead-SelfAttention BiLSTM Automatic Grading模型。该模型是将深度学习与多头自注意力机制结合,采用BiLSTM模型对进行过人工判分的主观题进行文本语义特征学习;利用多头机制模拟多人主观判分从多个角度进行关系抽取,降低阅卷偏差;关系抽取利用自注意力机制提取出符合得分要求的关键特征组合。实验结果表明,MultiHead-SelfAttention BiLSTM Automatic Grading模型与常规方法比较,对主观题自动评分的准确率均有不同程度的提高,精确率、召回率、F1值均达到了较好的效果。对减少人工阅卷成本、推进中文自动化评判的进一步发展起到了积极作用。 展开更多
关键词 深度学习 主观题评分 MultiHead-selfattention BiLSTM 多头机制 自注意力机制
下载PDF
基于Vision Transformer的小儿肺炎辅助诊断
13
作者 赵爽 魏国辉 +1 位作者 赵文华 马志庆 《激光与光电子学进展》 CSCD 北大核心 2023年第4期183-190,共8页
为改善基层医疗机构儿童肺炎诊疗水平,提高基层医生分析临床医学影像的效率和质量,提出了一种基于Vision Transformer(ViT)的小儿肺炎辅助诊断模型。首先利用ResUNet对儿童胸片进行肺区域分割,将左右肺区域从胸片中分割出来以降低其他... 为改善基层医疗机构儿童肺炎诊疗水平,提高基层医生分析临床医学影像的效率和质量,提出了一种基于Vision Transformer(ViT)的小儿肺炎辅助诊断模型。首先利用ResUNet对儿童胸片进行肺区域分割,将左右肺区域从胸片中分割出来以降低其他组织对肺炎诊断的干扰。然后,将分割后的图像输入改进的混合ViT模型进行诊断,该模型使用传统卷积神经网络的特征映射作为Transformer的输入,并在卷积神经网络中引入自注意力机制,增强卷积以加强其获取全局相关性的能力。最后,对卷积神经网络的骨干网络和Transformer模型进行端到端的训练,使模型能够达到良好的图像分类结果。在Chest X-Ray Images肺炎标准数据集上进行了实验,实验结果表明,所提模型的肺炎识别准确率、精确率和召回率分别达到97.27%、97.69%和98.60%。即该模型具有较好的可行性,可使基层儿童肺炎的临床诊断准确率得到很大提升。 展开更多
关键词 图像处理 图像分类 儿科肺炎 残差网络 自注意力机制 TRANSFORMER
原文传递
改进DPCNN分类模型在金融领域长文本的应用
14
作者 王婷 梁佳莹 +3 位作者 杨川 何松泽 向东 马洪江 《计算机系统应用》 2023年第12期74-83,共10页
为了解决金融领域文本分类算法稀缺,以及现有算法无法充分提取文本中词与词的关系、长距离依赖关系和深层次特征信息的问题,提出了一种改进卷积自注意力模型的文本深度关系抽取算法.该算法在改进的深度金字塔卷积神经网络(DPCNN)中引入... 为了解决金融领域文本分类算法稀缺,以及现有算法无法充分提取文本中词与词的关系、长距离依赖关系和深层次特征信息的问题,提出了一种改进卷积自注意力模型的文本深度关系抽取算法.该算法在改进的深度金字塔卷积神经网络(DPCNN)中引入自注意力,并联合双向门控神经网络(BiGRU)模块建立文本分类模型,解决了针对金融领域长文本的长距离依赖特征信息和词与词之间关系特征信息的提取问题,实现文本中深层次特征信息和上下文语义信息联合抽取功能.在THUCNews短文本与长文本数据集上分别进行实验,实验结果表明,所提方法与BERT等方法相比,在评价指标上有显著提高.在自制金融长文本数据集上的对比实验表明,与其他模型相比,该算法模型的准确率和F1值更高.通过一系列实验可以证明,该算法模型能够更准确地完成针对金融长文本的分类任务. 展开更多
关键词 自然语言处理 长文本分类 金融文本 特征联合提取 自注意力机制
下载PDF
自注意双路径RNN用于汽车雷达干扰抑制
15
作者 文豪 高勇 《雷达科学与技术》 北大核心 2022年第6期678-687,共10页
雷达是自动驾驶的重要组成部分,通过雷达的发射和接收信号我们可以估计目标距离和速度。随着雷达的广泛使用,不同车辆安装的雷达之间会产生相互干扰,导致本底噪声升高,严重影响目标的可检测性。近年来研究者们开始用深度学习方法来抑制... 雷达是自动驾驶的重要组成部分,通过雷达的发射和接收信号我们可以估计目标距离和速度。随着雷达的广泛使用,不同车辆安装的雷达之间会产生相互干扰,导致本底噪声升高,严重影响目标的可检测性。近年来研究者们开始用深度学习方法来抑制雷达干扰,目前常用的方法大多是基于频域或时频域,但基于深度学习的语音分离方向的研究已证明基于时域的方法相对于其他方法的优越性。然而传统的循环神经网络(Recurrent Neural Network,RNN)对长序列信号建模十分困难,因此本文使用了自注意双路径循环神经网络(Dual-Path Recurrent Neural Network with Self Attention,DPRNN-SelfAttention),用于在深层结构中对长序列进行建模。DPRNN-SelfAttention将长序列输入拆分为更小的块,并迭代地应用块内和块间操作处理整个序列的信息,其中输入长度与每次操作中原始序列长度的平方根成正比。实验结果表明,本文方法可以抑制多个干扰,并能估计抑制干扰后的目标幅度和相位。 展开更多
关键词 自动驾驶 干扰抑制 深度学习 DPRNN-selfattention
下载PDF
一种基于U^(2)型网络的三维肾肿瘤图像分割方法
16
作者 李思源 李锵 关欣 《激光与光电子学进展》 CSCD 北大核心 2023年第22期141-149,共9页
肾肿瘤危害极大,严重影响人类身体健康,对肾肿瘤进行早期检测和诊断有助于患者的治疗与康复。为高效地从腹部电子计算机断层扫描(CT)图像中分割出肾脏及肾肿瘤图像,提出一种基于三维U^(2)型网络(U^(2)-Net)的分割方法。首先,将二维U^(2)... 肾肿瘤危害极大,严重影响人类身体健康,对肾肿瘤进行早期检测和诊断有助于患者的治疗与康复。为高效地从腹部电子计算机断层扫描(CT)图像中分割出肾脏及肾肿瘤图像,提出一种基于三维U^(2)型网络(U^(2)-Net)的分割方法。首先,将二维U^(2)-Net升维并调整网络深度、损失函数与深度监督策略;其次,为了增强解码端的特征表达能力,提出残差特征强化模块,对解码端特征图进行通道与空间域的强化;最后,为提高网络对全局信息的提取能力,提出基于全局特征的多头自注意力模块,计算特征图所有体素点间的长期依赖关系,获取丰富的三维医学图像上下文信息。所提方法在KiTS19官方数据集上的实验结果表明,平均Dice值为0.9008,参数量为4.60 MB,与现有方法相比,所提方法能够在参数量较小的前提下,取得较好的分割精度,对小内存嵌入式肾脏和肾肿瘤图像分割系统具有很高的应用价值。 展开更多
关键词 医学图像分割 卷积神经网络 残差特征强化 多头自注意力
原文传递
基于视觉变换器的级联多阶层医学影像配准方法 被引量:1
17
作者 潘英杰 程远志 +1 位作者 刘豪 史操 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2022年第5期876-886,共11页
在基于深度学习的图像配准中,图像中具有复杂解剖结构的形变区域是影响网络配准精度的重要因素,然而现有方法很难关注到图像的复杂解剖区域。同时,卷积神经网络的感受野受其卷积核大小的限制,难以学习空间位置距离较远的体素之间的关系... 在基于深度学习的图像配准中,图像中具有复杂解剖结构的形变区域是影响网络配准精度的重要因素,然而现有方法很难关注到图像的复杂解剖区域。同时,卷积神经网络的感受野受其卷积核大小的限制,难以学习空间位置距离较远的体素之间的关系,使其难以处理较大区域形变问题。针对以上两个问题,本文提出了一种基于视觉变换器(Transformer)的级联多阶层配准网络模型,并配备了一种基于均方误差的困难形变感知机。困难形变感知机使用滑动窗口和浮动窗口技术在配准图像中进行检索,得到每个体素的困难形变系数,识别出配准效果最差的区域。本研究中,级联多阶层配准网络模型采用困难形变感知机进行阶层连接,在基础配准网络中凭借自注意力机制提取全局特征,对不同尺度的配准结果进行优化。实验结果证明,本文提出的方法可以对复杂形变区域进行渐进配准,从而优化脑部医学影像的配准结果,对医生的临床诊断工作有良好的辅助作用。 展开更多
关键词 医学影像 多阶层配准 困难形变感知 级联网络 自注意力机制
原文传递
基于内容风格迁移的残缺稀疏文字图像盲修复方法
18
作者 刘栋斌 王慧琴 +2 位作者 王可 王展 甄刚 《激光与光电子学进展》 CSCD 北大核心 2022年第24期98-109,共12页
现有残缺文字图像的修复需要确定Mask区域后对其填补,如果文字残缺部分剩余信息量过于稀疏,将无法确定Mask区域。针对该问题,提出了一种基于内容风格迁移的残缺稀疏文字图像盲修复方法。利用循环生成对抗网络构建修复前后文字图像间的... 现有残缺文字图像的修复需要确定Mask区域后对其填补,如果文字残缺部分剩余信息量过于稀疏,将无法确定Mask区域。针对该问题,提出了一种基于内容风格迁移的残缺稀疏文字图像盲修复方法。利用循环生成对抗网络构建修复前后文字图像间的全局关联像素信息,将残缺文字的图像内容风格特征迁移为完整文字图像从而进行修复;并在网络中加入自注意力机制对稀疏像素进行全局约束,解决迁移过程中相隔较远文字稀疏像素之间依赖关系较弱的问题;同时在自注意力机制中使用最大池化,提高迁移修复后的文字图像纹理特征;使用最小二乘损失替换原网络模型中的sigmoid交叉熵损失函数,提高迁移精度。实验结果表明,所提方法不借助Mask指导,能够盲修复稀疏性残缺文字图像中的随机未知缺失区域。 展开更多
关键词 成像系统 盲修复 循环生成对抗网络 自注意力模块 最小二乘损失
原文传递
融合边缘条件的多个鉴别器生成对抗网络
19
作者 朱文球 汪晓毅 黄史记 《湖南工业大学学报》 2022年第1期84-94,共11页
针对现有图像处理方法仍然存在人脸补全后,人脸五官等局部区域的视觉连通性较差的问题,提出了一种包含全局鉴别网络、局部鉴别网络和人脸部位鉴别网络的边缘补全方法。其中全局鉴别网络鉴别全图的视觉连通性;局部鉴别网络约束补全部分;... 针对现有图像处理方法仍然存在人脸补全后,人脸五官等局部区域的视觉连通性较差的问题,提出了一种包含全局鉴别网络、局部鉴别网络和人脸部位鉴别网络的边缘补全方法。其中全局鉴别网络鉴别全图的视觉连通性;局部鉴别网络约束补全部分;人脸部位鉴别网络约束补全图像效果。将残缺灰度图、残缺边缘图和掩膜图输入到边缘补全网络,得到补全边缘图。然后将补全边缘图和残缺彩色图输入到图像补全网络,得到补全图像。边缘补全网络和图像补全网络进行端对端连接,形成一个完整的解决方案。在CelebA数据集上与对照组进行视觉连通性对比,结果表明:提出的算法能够更好地还原人脸部位的信息。 展开更多
关键词 生成对抗网络 人脸补全 深度学习 多鉴别器 自注意力机制
下载PDF
一种用于动作识别的双分支网络
20
作者 秦晓飞 蔡锐 +3 位作者 陈萌 张文奇 何常香 张学典 《光学仪器》 2022年第4期16-25,共10页
动作识别是计算机视觉领域的一项重要任务,主要有基于RGB视频和人体骨架两种数据模态的领域,主流方法分别是3D卷积神经网络和图卷积神经网络。针对视频和人体骨架两种数据模态的不同特点,设计了双分支网络分别对两种数据模态进行建模。... 动作识别是计算机视觉领域的一项重要任务,主要有基于RGB视频和人体骨架两种数据模态的领域,主流方法分别是3D卷积神经网络和图卷积神经网络。针对视频和人体骨架两种数据模态的不同特点,设计了双分支网络分别对两种数据模态进行建模。对于人体骨架数据,基于自注意力机制设计了图卷积神经网络,该算法能在基于骨架的动作识别任务中达到先进的性能。对于视频数据,采用3D卷积网络进行特征提取。同时,利用深监督方法对两种数据模态的中间特征进行监督,提高两种数据特征的耦合度,进一步提高网络效率。这种算法的网络结构简单,在NTU-RGBD60(CS)数据集上仅用3.37×10^(7)的参数量可达到95.6%的精度。 展开更多
关键词 基于人体骨架的动作识别 图卷积神经网络 自注意力机制 3D卷积神经网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部