期刊文献+
共找到136篇文章
< 1 2 7 >
每页显示 20 50 100
基于深度学习的目标检测算法综述 被引量:169
1
作者 王珂 李凌燕 《电子测量技术》 2017年第11期89-93,共5页
传统的目标检测算法及策略已经难以满足目标检测中数据处理的效率、性能、速度和智能化等各个方面要求。深度学习通过对大脑认知能力的研究和模仿以实现对数据特征的分析处理,具有强大的视觉目标检测能力,成为了当前目标检测的主流算法... 传统的目标检测算法及策略已经难以满足目标检测中数据处理的效率、性能、速度和智能化等各个方面要求。深度学习通过对大脑认知能力的研究和模仿以实现对数据特征的分析处理,具有强大的视觉目标检测能力,成为了当前目标检测的主流算法。首先回顾了传统目标检测的发展以及存在的问题;其次介绍以R-CNN为代表的结合region proposal和卷积神经网络(CNN)分类的目标检测框架(R-CNN、SPP-NET、Fast R-CNN、Faster R-CNN);然后介绍以YOLO算法为代表的将目标检测转换为回归问题的目标检测框架(YOLO、SSD);最后对深度学习的目标检测算法存在的问题做出总结,以及未来的发展方向。 展开更多
关键词 深度学习 卷积神经网络 目标检测
下载PDF
复方丹参滴丸对血管内皮功能的保护作用 被引量:72
2
作者 葛玉霞 段云友 +3 位作者 阮骊韬 曹铁生 吕发勤 《中国临床康复》 CSCD 2004年第6期1096-1097,共2页
目的:探讨复方丹参滴丸对血管内皮依赖性舒张功能的保护作用。方法:血管内皮功能障碍患者35例(具有冠心病危险因素)口服复方丹参滴丸(20粒/次,2次/d,)3个月后,利用高分辨力超声检测血管内皮功能的改变。结果:经过3个月的治疗,肱动脉的... 目的:探讨复方丹参滴丸对血管内皮依赖性舒张功能的保护作用。方法:血管内皮功能障碍患者35例(具有冠心病危险因素)口服复方丹参滴丸(20粒/次,2次/d,)3个月后,利用高分辨力超声检测血管内皮功能的改变。结果:经过3个月的治疗,肱动脉的血管内皮依赖性舒张功能明显改善犤(10.38±3.04)%和(3.50±1.28)%,t=6.826,P<0.01犦。血流介导的肱动脉血流量增长百分率亦明显升高犤(370±247)%和(203.2±134)%,t=15.31,P<0.05犦。结论:具有冠心病危险因素患者血管内皮依赖性舒张功能损伤是可逆性的,中药复方丹参滴丸可以明显改善损伤的血管内皮功能。 展开更多
关键词 复方丹参滴丸 血管内皮功能 保护作用 血管舒张功能 危险因素 冠心病
下载PDF
一种基于2D-DWT和2D-PCA的人脸识别方法 被引量:13
3
作者 吴清江 郑文明 《计算机应用》 CSCD 北大核心 2006年第9期2089-2091,共3页
提出了一种联合图像二维离散小波变换(2D-DWT)和二维主成分分析(2D-PCA)的人脸识别方法。首先通过2D-DWT将当前图像分解成四个子图像,其中一子图像对应原图像的主体部分(低通部分),其余三个子图像则对应图像的细节部分(高通部分)。在此... 提出了一种联合图像二维离散小波变换(2D-DWT)和二维主成分分析(2D-PCA)的人脸识别方法。首先通过2D-DWT将当前图像分解成四个子图像,其中一子图像对应原图像的主体部分(低通部分),其余三个子图像则对应图像的细节部分(高通部分)。在此基础上,采用2D-PCA方法分别对每一子图像进行特征提取。此外,文中还提出了一种简单有效的方法对各子图像中所提取的特征进行融合,根据所得到的特征进行人脸识别。同其他基于小波分解的人脸识别方法相比,所提出的方法能更充分地利用人脸图像的有用判别信息,并得到更好的识别结果。 展开更多
关键词 二维离散小波变换 二维主成分分析 人脸识别
下载PDF
“古代汉语”课程教学改革的若干思考 被引量:12
4
作者 汪银峰 《长春师范大学学报》 2016年第9期181-183,187,共4页
"古代汉语"是我国高等院校汉语言文学专业的必修课程,但目前该课程教学存在诸多问题,教学成效甚微,其教学模式亟需改革。"古代汉语"课程教学改革应该在教学内容、教学方法、授课模式、考核检验等各个环节全面展开,... "古代汉语"是我国高等院校汉语言文学专业的必修课程,但目前该课程教学存在诸多问题,教学成效甚微,其教学模式亟需改革。"古代汉语"课程教学改革应该在教学内容、教学方法、授课模式、考核检验等各个环节全面展开,以建立全新的、适应社会发展的古汉语教学模式。 展开更多
关键词 古代汉语 教学模式 改革
下载PDF
正常成人颈内静脉的二维超声检测 被引量:9
5
作者 吕发勤 段云友 +4 位作者 王文 曹铁生 袁丽君 贾化平 《中华超声影像学杂志》 CSCD 2004年第3期236-237,共2页
关键词 成人 颈内静脉 二维超声 检测 形态学
原文传递
多普勒超声对创伤性动静脉瘘的诊断及鉴别诊断 被引量:10
6
作者 段云友 刘禧 +5 位作者 袁丽君 李群 吕发勤 王文 曹铁生 《中华超声影像学杂志》 CSCD 2004年第11期825-827,共3页
目的 探讨创伤性动静脉瘘的彩色及频谱多普勒特征及其鉴别诊断。方法 回顾性分析11 例动静脉瘘患者,使用彩色超声诊断仪观察瘘口处血流情况,受累血管的内径、形态、血流性质及方向,对 瘘口处及受累血管血流频谱进行分析,并与健侧对照... 目的 探讨创伤性动静脉瘘的彩色及频谱多普勒特征及其鉴别诊断。方法 回顾性分析11 例动静脉瘘患者,使用彩色超声诊断仪观察瘘口处血流情况,受累血管的内径、形态、血流性质及方向,对 瘘口处及受累血管血流频谱进行分析,并与健侧对照。结果 8例可直接显示瘘口,显示受累血管管壁连 续性中断,瘘口处五彩镶嵌样血流自动脉流向扩张的静脉腔,脉冲多普勒示瘘口处呈双期单向连续性频 谱,血流速度300~390cm/s,受累动脉近心端血流为高速低阻型,受累静脉出现脉动样血流,近心端静脉 呈高速低阻型频谱;4例患者远心端静脉内出现逆向离心性血流。结论 瘘口处双期单向分流,静脉出现 高速、动脉样血流频谱是动静脉瘘的特征性表现,多普勒超声对创伤性动静脉瘘能够正确诊断及鉴别诊断。 展开更多
关键词 多普勒超声 创伤性 动静脉瘘 多普勒 超声检查
原文传递
基于3D和1D多特征融合的语音情感识别算法 被引量:9
7
作者 徐华南 +1 位作者 姜万 李大鹏 《声学技术》 CSCD 北大核心 2021年第4期496-502,共7页
针对语音情感识别任务中特征提取单一、分类准确率低等问题,提出一种3D和1D多特征融合的情感识别方法,对特征提取算法进行改进。在3D网络,综合考虑空间特征学习和时间依赖性构造,利用双线性卷积神经网络(Bilinear Convolutional Neural ... 针对语音情感识别任务中特征提取单一、分类准确率低等问题,提出一种3D和1D多特征融合的情感识别方法,对特征提取算法进行改进。在3D网络,综合考虑空间特征学习和时间依赖性构造,利用双线性卷积神经网络(Bilinear Convolutional Neural Network,BCNN)提取空间特征,长短期记忆网络(Short-Term Memory Network,LSTM)和注意力(attention)机制提取显著的时间依赖特征。为降低说话者差异的影响,计算语音的对数梅尔特征(Log-Mel)和一阶差分、二阶差分特征合成3D Log-Mel特征集。在1D网络,利用一维卷积和LSTM的框架。最后3D和1D多特征融合得到判别性强的情感特征,利用softmax函数进行情感分类。在IEMOCAP和EMO-DB数据库上实验,平均识别率分别为61.22%和85.69%,同时与提取单一特征的3D和1D算法相比,多特征融合算法具有更好的识别性能。 展开更多
关键词 语音情感识别 双线性卷积网络 长短期记忆网络 注意力(attention) 多特征融合
下载PDF
声脉冲辐射力成像定量技术对非酒精性脂肪肝的初步探讨 被引量:9
8
作者 吴燕 庄磊 +3 位作者 柯红 蒋银花 张民 《医学影像学杂志》 2011年第8期1204-1206,共3页
目的:探讨声脉冲辐射力成像技术(acoustic radiation force Impulse,ARFI)定量检测非酒精性脂肪肝(non-al-coholic fatty liver disease,NAFLD)的临床价值。方法:选择NAFLD患者139例及健康人群70例为研究对象,利用ARFI定量测定肝脏剪切... 目的:探讨声脉冲辐射力成像技术(acoustic radiation force Impulse,ARFI)定量检测非酒精性脂肪肝(non-al-coholic fatty liver disease,NAFLD)的临床价值。方法:选择NAFLD患者139例及健康人群70例为研究对象,利用ARFI定量测定肝脏剪切波速,比较NAFLD与对照组肝脏剪切波速的关系。结果:139例NAFLD与70例健康对照组肝脏平均剪切波速分别为1.08m/s、1.11m/s,两组比较无显著性差异(P=0.25)。结论:ARFI在NAFLD与健康人群中不存在差异,肝活检仍然是评价NAFLD的金标准。 展开更多
关键词 非酒精性脂肪肝 声脉冲辐射力成像技术 声触诊组织量化技术 剪切波
下载PDF
反义复合词“好歹”的共时与历时考察 被引量:7
9
作者 《宜宾学院学报》 2016年第7期97-103,共7页
"好歹"是由形容词语素"好"和"歹"组合而成的,"好歹"凝合成词之后,通过转喻机制,整体发生了转类,趋向于名词化,具有指称功能。随着其句法位置的变化,加上本身具有评价性的语义基础,"好歹&q... "好歹"是由形容词语素"好"和"歹"组合而成的,"好歹"凝合成词之后,通过转喻机制,整体发生了转类,趋向于名词化,具有指称功能。随着其句法位置的变化,加上本身具有评价性的语义基础,"好歹"又进一步虚化为情态副词,且在现代汉语中这一用法成为其最主要的用法。不同词性的"好歹"其自身的概念整合度及词汇化等级也并不相同,表现为:情态副词>名词>形容词。 展开更多
关键词 好歹 词汇化 语法化 语用功能 概念整合度 词汇化等级
下载PDF
一种融合KPCA和KDA的人脸识别新方法 被引量:4
10
作者 郑文明 《计算机应用》 CSCD 北大核心 2008年第5期1263-1266,共4页
核判别分析(KDA)和核主成分分析(KPCA)分别是线性判别分析(LDA)和主成分分析(PCA)在核空间中的非线性推广,提出了一种融合KDA和KPCA的特征提取方法并应用于人脸识别中,该方法综合利用KDA和KPCA的优点来提高人脸识别的性能。此外,还提出... 核判别分析(KDA)和核主成分分析(KPCA)分别是线性判别分析(LDA)和主成分分析(PCA)在核空间中的非线性推广,提出了一种融合KDA和KPCA的特征提取方法并应用于人脸识别中,该方法综合利用KDA和KPCA的优点来提高人脸识别的性能。此外,还提出了一种广义最近特征线(GNFL)方法来构造有效的分类器。实验结果证明:提出的方法获得了更好的识别结果。 展开更多
关键词 核判别分析 核主成分分析 广义最近特征线 人脸识别
下载PDF
玻璃钢节能门窗的发展现状及趋势 被引量:6
11
作者 刘志海 《中国建材》 2004年第8期42-44,共3页
关键词 玻璃钢 建筑节能 门窗 发展趋势 住宅建筑
下载PDF
彩色多普勒超声在硬脑膜动静脉瘘诊断中的应用 被引量:5
12
作者 段云友 +1 位作者 刘禧 曹铁生 《中华超声影像学杂志》 CSCD 2005年第8期580-583,共4页
目的探讨硬脑膜动静脉瘘(DAVF)的彩色多普勒血流显像(CDFI)表现,评价超声影像在DAVF诊断中的价值。方法应用CDFI观察13例DAVF瘘口部位,测量其范围、血流频谱,检测供血动脉、引流静脉及颅外动脉血流参数的变化,包括收缩期峰值流速(Vmax)... 目的探讨硬脑膜动静脉瘘(DAVF)的彩色多普勒血流显像(CDFI)表现,评价超声影像在DAVF诊断中的价值。方法应用CDFI观察13例DAVF瘘口部位,测量其范围、血流频谱,检测供血动脉、引流静脉及颅外动脉血流参数的变化,包括收缩期峰值流速(Vmax)、舒张末流速(Vmin)、平均流速(Vmean)、阻力指数(RI),并与全脑血管造影结果进行对比分析。结果①DAVF瘘口部位表现为异常不规则团状血流信号,呈多方向、不规则的湍流频谱,Vmax(105.6±32.9)cm/s,Vmin(72.0±22.9)cm/s,Vmean(87.0±26.0)cm/s,RI0.31±0.04;②DAVF瘘口部位的检出率为61.4%,横窦-乙状窦区DAVF检出率71.4%(5/7),海绵窦区DAVF全部检出;③供血动脉检出42支(72.4%),经横窦及眼上静脉的引流均检出,经上矢状窦及皮层静脉的引流均未能检出;④颈外动脉Vmin、Vmean增快,RI降低(P<0.05);枕动脉、颞浅动脉Vmax、Vmin、Vmean增快,RI降低(P<0.05)。结论CDFI可较好地显示横窦-乙状窦区及海绵窦区DAVF的瘘口部位,检出大部分颅内、颅外的供血动脉和引流静脉;通过对病变部位和颅外血管血流动力学改变的分析,CDFI有助于DAVF的诊断。 展开更多
关键词 彩色多普勒超声 硬脑膜动静脉瘘 超声诊断 血流动力学 血流速度 脑血管造影
原文传递
基于ARIMA算法特征补齐的语音情感识别 被引量:4
13
作者 史少寒 李大鹏 《电子器件》 CAS 北大核心 2023年第5期1333-1338,共6页
语音情感识别的数据集普遍存在语音数据长短不一致的现象,进行补零处理会造成无用信息的冗余。针对此问题,提出了一种基于差分整合移动平均自回归ARIMA算法特征补齐的语音情感识别算法。首先进行特征的选取,并利用ARIMA方法进行语音特... 语音情感识别的数据集普遍存在语音数据长短不一致的现象,进行补零处理会造成无用信息的冗余。针对此问题,提出了一种基于差分整合移动平均自回归ARIMA算法特征补齐的语音情感识别算法。首先进行特征的选取,并利用ARIMA方法进行语音特征的补齐。然后,基于因果扩张卷积神经网络和长短期记忆网络,构建语音情感识别模型。最后,采用柏林语音集进行实验,结果表明:用ARIMA方法对特征进行补齐,一定程度上提高了模型的表现力;使用因果扩张卷积搭建模型,增加了模型的泛用性。 展开更多
关键词 语音情感识别 差分整合移动平均自回归模型 长短期记忆网络 因果扩张卷积 特征补齐
下载PDF
基于特征选择和GWO-KELM的鸟声识别算法 被引量:5
14
作者 李大鹏 +2 位作者 叶如 夏煜 徐华南 《声学技术》 CSCD 北大核心 2022年第5期782-788,共7页
针对鸟声识别算法中提取特征单一、分类准确率低等问题,提出一种基于混合特征选择和灰狼算法优化核极限学习机的鸟声识别方法。首先从鸟声数据中提取大规模声学特征集ComParE,其次计算每个特征的Fscore并进行排序,然后以广义顺序向前浮... 针对鸟声识别算法中提取特征单一、分类准确率低等问题,提出一种基于混合特征选择和灰狼算法优化核极限学习机的鸟声识别方法。首先从鸟声数据中提取大规模声学特征集ComParE,其次计算每个特征的Fscore并进行排序,然后以广义顺序向前浮动搜索(Generalized Sequential Forward Floating Search,GSFFS)为搜索策略,特征子集在核极限学习机(Kernel Limit Learning Machine,KELM)上十折交叉验证的正确率,作为特征选择标准进行特征选择,得到适用于鸟声识别的特征子集,最后通过灰狼算法(Grey Wolf Optimizer,GWO)选择最优KELM参数识别鸟声。在柏林自然科学博物馆鸟声数据库中进行实验,该方法在60类鸟声识别平均正确率和F1-score达到94.45%和92.29%。结果表明,该方法相较于传统自行设计提取的单一特征集具有更高的识别精度,GWO-KELM模型比网格搜索方式更易找到全局最优值。 展开更多
关键词 核极限学习机 特征选择 鸟声识别 灰狼算法
下载PDF
脑血管病患者颈部血管多普勒血流参数的变化 被引量:5
15
作者 段云友 +4 位作者 阮骊韬 曹铁生 刘禧 魏娟 吕发勤 《中国医学影像技术》 CSCD 2004年第2期239-242,共4页
目的 评价颈内动脉海绵窦瘘 (CCF)、脑动静脉畸形 (AVM )、烟雾病及脑动脉瘤的供血或病变动脉颅外段血管超声血流参数特点。方法 患者组 5 2例 ,其中CCF10例 ;AVM 13例 :主要供血动脉来源于椎基底动脉系统的AVM定为Ⅰ组 ,来源于颈内... 目的 评价颈内动脉海绵窦瘘 (CCF)、脑动静脉畸形 (AVM )、烟雾病及脑动脉瘤的供血或病变动脉颅外段血管超声血流参数特点。方法 患者组 5 2例 ,其中CCF10例 ;AVM 13例 :主要供血动脉来源于椎基底动脉系统的AVM定为Ⅰ组 ,来源于颈内动脉系统的AVM定为Ⅱ组 ;脑动脉瘤 12例 ;烟雾病 17例 ;均经脑血管造影证实。正常对照组 5 5例健康志愿者。测量双侧颈总动脉 (CCA)、颈内动脉 (ICA)及椎动脉 (VA)的最大峰值流速 (Vmax)、舒张末血流速度 (Vmin)、平均血流速度 (Vmean)及阻力指数 (RI)。结果 与正常对照组相比 :①CCF患侧颈内动脉Vmin及Vmean升高 ,RI下降 (P <0 .0 5 ) ;②Ⅰ组位于小脑的 7例中 特大型AVM ,供血侧椎动脉的Vmax、Vmin、Vmean升高 ,RI降低 (P <0 .0 5 ) ;Ⅱ组位于顶、颞、额叶等部位的 6例中 大型AVM ,供血侧颈内动脉血流参数无明显变化 (P >0 .0 5 ) ;③脑动脉瘤载瘤侧颈内动脉血流参数无明显变化 (P >0 .0 5 ) ;④烟雾病患侧颈总动脉及颈内动脉Vmean降低 ,RI升高 (P <0 .0 5 )。结论 CCF、烟雾病及位于小脑中型以上的AVM的供血或病变动脉颅外段血管超声血流参数的变化具有特征性 ,可为临床诊断脑血管病提供参考。 展开更多
关键词 颈内动脉海绵窦瘘 脑动静脉畸形 脑动脉瘤 烟雾病
下载PDF
超声乳化白内障吸除联合人工晶状体植入对糖尿病性白内障角膜内皮损伤的研究 被引量:6
16
作者 刘海芳 郭清 《基层医学论坛》 2020年第5期598-599,共2页
目的 探讨超声乳化白内障吸除联合人工晶状体植入对糖尿病性白内障角膜内皮损伤的情况。方法 回顾性分析2018年5月—2019年6月我院收治66例白内障患者的临床资料,根据患者有无糖尿病分为对照组(无糖尿病,n=33)和观察组(有糖尿病,n=33)。... 目的 探讨超声乳化白内障吸除联合人工晶状体植入对糖尿病性白内障角膜内皮损伤的情况。方法 回顾性分析2018年5月—2019年6月我院收治66例白内障患者的临床资料,根据患者有无糖尿病分为对照组(无糖尿病,n=33)和观察组(有糖尿病,n=33)。2组均实施超声乳化白内障吸除联合人工晶状体植入术,比较2组术后角膜内皮细胞损伤情况。结果 观察组术后1周角膜内皮细胞密度、六边形细胞比例低于对照组,变异系数、中央角膜厚度高于对照组,内皮细胞面积低于对照组,内皮细胞丢失率高于对照组,差异均有统计学意义(P<0.05)。结论 糖尿病性白内障患者超声乳化白内障吸除联合人工晶状体植入术后角膜内皮损伤较普通白内障患者程度严重,临床治疗应加强对角膜内皮的保护,减轻损伤。 展开更多
关键词 糖尿病性白内障 超声乳化白内障吸除 人工晶状体 角膜内皮
下载PDF
基于注意力密集网络的伪彩色红外与可见光图像融合
17
作者 漆建环 倪波 +3 位作者 倪海彬 杨凌升 常建华 《国外电子测量技术》 2024年第5期84-91,共8页
针对现有红外与可见光图像融合算法中存在融合图像的纹理细节不清晰,红外信息和纹理细节的显示不平衡等问题,提出了一种基于注意力密集网络的伪彩色红外与可见光图像融合方法。首先对灰度的红外图像进行伪彩色处理再与彩色的可见光图像... 针对现有红外与可见光图像融合算法中存在融合图像的纹理细节不清晰,红外信息和纹理细节的显示不平衡等问题,提出了一种基于注意力密集网络的伪彩色红外与可见光图像融合方法。首先对灰度的红外图像进行伪彩色处理再与彩色的可见光图像组成多通道数据输入融合网络。其次,设计了一种由卷积层和带有注意力模块的密集连接块组成的生成器网络结构,关注源图像的关键信息,增强网络提取源图像信息的能力。最后,利用红外像素、可见光像素、可见光梯度和红外梯度构建内容损失函数,以保持融合图像中红外目标和纹理细节的平衡。与5种具有代表性的融合方法进行定性和定量比较。结果表明,该方法所获得融合图像的峰值信噪比、信息熵、平均梯度和互信息取得最优值,分别为31.6841、6.5581、6.0096、3.0960。定量以及定性结果证明所提融合方法使融合图像具有更为丰富的纹理细节以及良好的视觉效果。 展开更多
关键词 红外与可见光图像 图像融合 注意力模块 密集连接块
下载PDF
语气副词“并”的共时与历时考察 被引量:4
18
作者 《大庆师范学院学报》 2016年第5期66-69,共4页
语气副词"并"产生于近代汉语,从历时角度考察其来源,其语气副词用法是由范围副词"并"发展而来的,范围副词"并"用于否定词之前,且后续句与前半句句义发生逆转,这是语气副词"并"产生的句法环境... 语气副词"并"产生于近代汉语,从历时角度考察其来源,其语气副词用法是由范围副词"并"发展而来的,范围副词"并"用于否定词之前,且后续句与前半句句义发生逆转,这是语气副词"并"产生的句法环境。随着"并"在这种句法环境中使用频率的提高,其总括用法逐渐丧失,表语气的功能逐渐凸显,并逐步成为"并"的主要语法功能。现代汉语中"并"在否定句中除了具有反预期、表申辩性的语用功能外,还具有对客观事实进行确认、重复的语用功能。 展开更多
关键词 语气副词 语用功能
下载PDF
基于桥接Transformer的小样本优化鸟声识别网络
19
作者 王基豪 +1 位作者 韩智超 王丽丽 《应用声学》 CSCD 北大核心 2024年第3期542-551,共10页
针对实际鸟类监测环境中,收集鸟声声频数据分布不均匀,导致神经网络训练不充分,分类识别测试准确率低的问题,设计了一种桥接Transformer神经网络模型。该网络首先利用原始鸟声声频信号生成短时傅里叶变换语谱图作为输入特征,之后将语谱... 针对实际鸟类监测环境中,收集鸟声声频数据分布不均匀,导致神经网络训练不充分,分类识别测试准确率低的问题,设计了一种桥接Transformer神经网络模型。该网络首先利用原始鸟声声频信号生成短时傅里叶变换语谱图作为输入特征,之后将语谱图输入到由注意力模块和卷积模块桥接组成的Transformer网络中,完成对语谱图中全局特征和局部特征的信息交互,最后利用单层Transformer编码器实现对每一个批次样本的损失优化,得到最终的分类结果。在Birdsdata和xeno-canto鸟声数据集上进行小样本实验,分别获得了91.34%和82.63%的平均准确率,与其他鸟声识别网络进行了对比实验,验证了该网络的有效性。 展开更多
关键词 鸟声识别 注意力机制 卷积模块 Transformer网络
下载PDF
基于双通道特征融合网络的语音情感识别
20
作者 王丽丽 +1 位作者 邵勇斌 鞠醒 《声学技术》 CSCD 北大核心 2024年第6期854-861,共8页
针对语音情感识别中判别性的情感特征提取难题,结合卷积神经网络和视觉transformer网络结构,提出一种双通道特征融合的语音表征方法。使用基于倒瓶颈结构的卷积模块通道,并引入类transformer训练策略提取局部频谱特征,通过改进视觉trans... 针对语音情感识别中判别性的情感特征提取难题,结合卷积神经网络和视觉transformer网络结构,提出一种双通道特征融合的语音表征方法。使用基于倒瓶颈结构的卷积模块通道,并引入类transformer训练策略提取局部频谱特征,通过改进视觉transformer提取全局序列特征,利用卷积神经网络直接提取整个语谱图代替分块部分,更好地提取时序信息,将提取到的特征信息进行融合,能够获取判别性强的情感特征,最后输入到Softmax分类器得到识别结果。在EMO-DB和CASIA数据库上进行实验,文中所提模型的平均准确率分别达到了94.24%和93.05%,与其他模型进行对比试验,结果优于其他模型,表明了该方法的有效性。 展开更多
关键词 语音情感识别 卷积神经网络 视觉transformer 特征融合
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部