期刊文献+
共找到131篇文章
< 1 2 7 >
每页显示 20 50 100
通过改变文字大小在Word文档中加载数字水印的设计与实现 被引量:21
1
作者 刘玉玲 孙星明 《计算机工程与应用》 CSCD 北大核心 2005年第12期110-112,共3页
针对多媒体数字作品的版权保护,传统的加密方法具有一定的局限性,数字水印作为信息隐藏技术的一个分支正逐渐成为实现数字产品版权保护的最后一道屏障。文章提出了一种新的文本数字水印嵌入及检测算法:根据特征编码思想,针对Word文档格... 针对多媒体数字作品的版权保护,传统的加密方法具有一定的局限性,数字水印作为信息隐藏技术的一个分支正逐渐成为实现数字产品版权保护的最后一道屏障。文章提出了一种新的文本数字水印嵌入及检测算法:根据特征编码思想,针对Word文档格式特点,通过改变文档中某些字的大小以嵌入和检测水印。实验结果表明:该算法很好的实现了水印的嵌入和检测,并对传统攻击有着较好的鲁棒性。 展开更多
关键词 数字水印 特征编码 文本数字水印
下载PDF
采用自适应变异粒子群优化SVM的行为识别 被引量:11
2
作者 张国梁 贾松敏 +1 位作者 张祥银 徐涛 《光学精密工程》 EI CAS CSCD 北大核心 2017年第6期1669-1678,共10页
为了提高对视频序列中人体行为的识别能力,建立了基于局部特征的动作识别框架。通过时空特征提取及编码和SVM分类器参数优化两部分对该框架所涉及算法进行了研究。首先,采用Harris3D检测器获取时空兴趣点(STIP),以方向梯度直方图(HOG)... 为了提高对视频序列中人体行为的识别能力,建立了基于局部特征的动作识别框架。通过时空特征提取及编码和SVM分类器参数优化两部分对该框架所涉及算法进行了研究。首先,采用Harris3D检测器获取时空兴趣点(STIP),以方向梯度直方图(HOG)和光流方向直方图(HOF)对STIP进行描述,并引入Fisher向量实现对特征描述子的编码;由于固定参数下SVM动作分类模型存在泛化能力不足的问题,将粒子群算法应用于各动作分类器参数寻优过程中,针对种群多样性逐代变化的特点,构建粒子聚集度模型,并利用其动态调节各代粒子的变异概率;最后,利用KTH和HMDB51数据集对所提方法进行验证。结果表明,所提自适应变异粒子群算法(AMPSO)能够有效避免种群陷入局部最优,具备较强的全局寻优能力;在KTH和HMDB51数据集上的识别准确率分别为87.50%和26.41%,优于其余2种识别方法。实验证明,AMPSO算法收敛性能良好且整体识别框架具有较高的实用性和准确性。 展开更多
关键词 人体行为识别 自适应变异粒子群算法 时空兴趣点 特征编码 支持向量机
下载PDF
考虑5G基站储能可调度容量的有源配电网协同优化调度方法 被引量:8
3
作者 陈实 郭正伟 +3 位作者 周步祥 刘艺洪 臧天磊 罗欢 《电网技术》 EI CSCD 北大核心 2023年第12期5225-5237,共13页
随着移动通信向5G快速更新换代,5G基站建设规模快速增长,可将海量5G通信基站中的闲置储能视作灵活性资源参与电力系统调度,以减轻新能源发电的随机性和波动性对系统的不利影响。针对含分布式风力发电有源配电网的基站储能经济优化调度问... 随着移动通信向5G快速更新换代,5G基站建设规模快速增长,可将海量5G通信基站中的闲置储能视作灵活性资源参与电力系统调度,以减轻新能源发电的随机性和波动性对系统的不利影响。针对含分布式风力发电有源配电网的基站储能经济优化调度问题,首先计及配电网潜在电力中断以及停电恢复时间2个因素,建立基站可靠性评估模型,系统地评估各基站储能的实时可调度容量。进一步以最小化系统运行成本为目标,采用基于变分自编码器(variational auto-encoder,VAE)模型的改进双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法求解5G基站储能最优充放电策略。该算法将多基站储能状态用隐变量的形式表征以挖掘数据中隐含的关联,从而降低模型的求解复杂度,提升算法性能。通过迭代求解至收敛,实现多基站储能(multi-base station energy storage,MBSES)系统的实时调控并为每个基站制定符合实际工况的个性化充放电策略。最后通过算例验证了所提方法的有效性。 展开更多
关键词 5G基站 备用储能 可再生能源 可调度容量 特征编码 深度强化学习
下载PDF
基于深度学习的三维点云修复技术综述 被引量:9
4
作者 刘彩霞 魏明强 郭延文 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第12期1936-1952,共17页
三维点云是最常用的三维场景/物体表示方法之一.根据点云修复侧重点不同,将基于深度学习的三维点云修复技术划分为密集重建、补全重建和去噪重建3类;详细分析了相关典型修复模型及关键技术,如特征编码、特征扩展和损失函数设计;总结了... 三维点云是最常用的三维场景/物体表示方法之一.根据点云修复侧重点不同,将基于深度学习的三维点云修复技术划分为密集重建、补全重建和去噪重建3类;详细分析了相关典型修复模型及关键技术,如特征编码、特征扩展和损失函数设计;总结了常用的网络模块、点云数据集和评估准则;最后讨论了3类修复技术之间的关系,并从旋转不变性特征提取、细节信息修复、拓扑关系保持、几何算法应用和多模态数据融合5个方面探讨了点云修复技术面临的挑战及未来发展趋势. 展开更多
关键词 三维点云 点云修复 深度学习 网络模型 特征编码
下载PDF
回转体零件的CAD/CAPP集成系统 被引量:2
5
作者 马鋆辉 乔良 +1 位作者 李原 杨海成 《西北工业大学学报》 EI CAS CSCD 北大核心 1999年第3期454-458,共5页
针对回转体零件提出了一种 C A D/ C A P P集成方法,通过特征库、用户自定义特征在建模规则的约束下完成零件的建模工作,运用编码规则自动将模型整理成 C A P P子系统所需要的信息,并在 Auto C A D 环境下开发出... 针对回转体零件提出了一种 C A D/ C A P P集成方法,通过特征库、用户自定义特征在建模规则的约束下完成零件的建模工作,运用编码规则自动将模型整理成 C A P P子系统所需要的信息,并在 Auto C A D 环境下开发出了 R S C A D P P系统。该系统在实际应用中运行可靠,极大地提高了设计效率。 展开更多
关键词 STEP 特征建模 集成系统 回转体零件 CAD CAPP
下载PDF
一种基于中文字符编码的文本水印算法研究 被引量:6
6
作者 陈翔 《计算机技术与发展》 2013年第2期237-240,共4页
随着计算机网络技术的迅速发展,数字文本的取得已经变得非常方便,因为数字文本易于复制和更改的特性,使得版权保护的问题长期阻碍着数字出版行业的发展,然而文本水印技术的出现为解决这一问题提供了可行的方法。针对中文字符的特性,给... 随着计算机网络技术的迅速发展,数字文本的取得已经变得非常方便,因为数字文本易于复制和更改的特性,使得版权保护的问题长期阻碍着数字出版行业的发展,然而文本水印技术的出现为解决这一问题提供了可行的方法。针对中文字符的特性,给出了一种利用人眼生理特性和中文字符的书写变化的文本水印方案。通过调整中文字符偏旁部首的位置关系,结合密钥,嵌入水印信息。经过实验分析:该算法具有鲁棒性强、隐蔽性高和抗攻击性强的特点。 展开更多
关键词 文本水印 中文字符 字符结构 特征编码
下载PDF
基于内容特征的视频半脆弱水印方案 被引量:3
7
作者 雷红雨 戴跃伟 +1 位作者 王执铨 王津申 《兵工学报》 EI CAS CSCD 北大核心 2004年第5期613-618,共6页
本文提出一种基于内容的MPEG Ⅰ /Ⅱ格式视频特征编码算法 ,其基本思想是采用离散余弦变换 (DCT)变换域中不同 8× 8块之间DCT能量关系来构造特征码。在此基础上给出了视频半脆弱水印方案 ,将内容特征码生成方法和水印算法有机地结... 本文提出一种基于内容的MPEG Ⅰ /Ⅱ格式视频特征编码算法 ,其基本思想是采用离散余弦变换 (DCT)变换域中不同 8× 8块之间DCT能量关系来构造特征码。在此基础上给出了视频半脆弱水印方案 ,将内容特征码生成方法和水印算法有机地结合在一起。特征码具有“半脆弱”特性 ,即它对于可接受的“内容保持”修改具有鲁棒性 ,而对常见的“内容篡改”性修改具有敏感性。另外由于DCT系数块能量的主要部分集中在低频部分 ,这使得可以用低频部分来生成特征码 ,用高频部分来嵌入水印。 展开更多
关键词 通信技术 内容认证 特征编码 视频水印 半脆弱
下载PDF
柴油机振动信号快速稀疏分解与二维特征编码 被引量:6
8
作者 王旭 岳应娟 蔡艳平 《振动.测试与诊断》 EI CSCD 北大核心 2019年第1期114-122,225,共10页
针对柴油机故障诊断方法中的信号时频表征及特征提取问题,提出一种基于振动信号快速稀疏分解与二维时频特征编码识别的柴油机智能故障诊断方法。首先,为了获得时、频聚集性优良的时频图像,提出一种随分解残差信号自适应更新Gabor字典的... 针对柴油机故障诊断方法中的信号时频表征及特征提取问题,提出一种基于振动信号快速稀疏分解与二维时频特征编码识别的柴油机智能故障诊断方法。首先,为了获得时、频聚集性优良的时频图像,提出一种随分解残差信号自适应更新Gabor字典的改进匹配追踪(adaptive matching pursuit,简称AMP)算法,利用AMP算法将柴油机振动信号分解后叠加各原子分量的Wigner-Ville分布,获取原信号的稀疏分解时频图像;然后,为提取时频图像的特征参量,提出了双向二维非负矩阵分解(two-directional,2-dimensional non-negative matrix factorization,简称TD2DNMF)算法,用于对时频图像的幅值矩阵进行特征编码,获取蕴含在时频图像内部的低维特征,并利用最近邻分类器实现了时频图像的自动分类识别。将提出的方法应用于4种不同状态柴油机气门故障的诊断试验中,结果表明,该方法能够获得无交叉项干扰、聚集性好的时频图像,使各时频分量的物理意义更加明确,并改进了传统图像模式识别中的特征参数提取方法,是一种有效的柴油机故障诊断方法。 展开更多
关键词 柴油机 匹配追踪 二维非负矩阵分解 特征编码 时频分布
下载PDF
基于特征编码的三维可视化圈阅 被引量:1
9
作者 吴磊 吴俊军 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第12期27-29,共3页
在特征编码的基础上 ,研究了圈阅信息与设计模型的关联机制 ,实现了对三维模型的可视化圈阅 .设计相关人员可以浏览三维设计模型 ,选定设计局部 ,进行圈阅 ,并可以查询他人对设计的圈阅批注 .
关键词 实体造型 特征编码 协同设计 可视化 三维模型 圈阅批注 CAD
下载PDF
基于特征编码和动态路由优化的视觉定位方法 被引量:5
10
作者 仉新 郑飂默 +1 位作者 谭振华 李锁 《中国惯性技术学报》 EI CSCD 北大核心 2022年第4期451-460,共10页
针对视角变化、光照变化、大尺度和动态物体等复杂场景下,移动机器人定位的准确性低、鲁棒性差等问题,提出基于特征编码和动态路由优化的视觉定位方法。首先,引入基于残差网络的特征编码策略,提取图像的几何特征和语义特征,减少图像噪... 针对视角变化、光照变化、大尺度和动态物体等复杂场景下,移动机器人定位的准确性低、鲁棒性差等问题,提出基于特征编码和动态路由优化的视觉定位方法。首先,引入基于残差网络的特征编码策略,提取图像的几何特征和语义特征,减少图像噪声信息,加快模型的收敛速度;其次,通过熵密度峰值优化网络的动态路由机制,采用向量表示特征之间的空间位置关系,提升图像特征提取和表达能力,优化网络整体性能;最后,融合优化后的特征编码和动态路由网络,将全局特征描述符和特征向量相结合,保留特征间的差异性和关联性,计算图像特征的相似性用于闭环检测。实验结果表明,相比基于VGG、AlexNet、BoVW及GIST的视觉定位方法,所提方法的准确率分别提高了24.54%、23.06%,43.81%和42.69%,实现了复杂场景下移动机器人闭环检测,提高了定位和建图的准确性和鲁棒性。 展开更多
关键词 同时定位与地图构建 视觉定位 特征编码 动态路由
下载PDF
IrisCodeNet:虹膜特征编码网络 被引量:5
11
作者 贾丁丁 沈文忠 《计算机工程与应用》 CSCD 北大核心 2022年第10期185-192,共8页
使用有效的特征提取算法对虹膜纹理进行准确的表达是虹膜识别技术的关键。基于虹膜识别任务的特殊性,提出了用于虹膜特征编码的网络模型IrisCodeNet。该网络架构使用了改进的BasicBlock,并结合了可以扩大决策边界的损失函数AM-Softmax(a... 使用有效的特征提取算法对虹膜纹理进行准确的表达是虹膜识别技术的关键。基于虹膜识别任务的特殊性,提出了用于虹膜特征编码的网络模型IrisCodeNet。该网络架构使用了改进的BasicBlock,并结合了可以扩大决策边界的损失函数AM-Softmax(additive margin softmax)。为了获取最佳的虹膜识别效果,对AM-Softmax的参数设置、虹膜图像预处理输入形式、数据增强方式、网络输入尺寸做了细致的研究。实验结果表明:使用IrisCodeNet训练得到的特征提取器在CASIA-Iris-Thousand、CASIA-Iris-Distance、IITD虹膜数据库上进行测试,所评估的等错误率(equal error rate,EER)和正确接受率(true acceptance rate,TAR)均远远超过了广泛应用的传统算法。特别地,IrisCodeNet无需传统的虹膜归一化或精确的虹膜分割步骤依然取得了极好的识别效果。并且使用Grad-CAM(gradient-weighted class activation mapping)算法进行了可视化分析,结果表明该网络框架有效地关注了虹膜纹理信息,从而证明了IrisCodeNet具有较强的虹膜纹理特征提取能力。 展开更多
关键词 虹膜识别 特征编码 图像预处理 AM-Softmax Grad-CAM
下载PDF
实时带钢表面质量检测算法研究与应用 被引量:5
12
作者 刘坤 陈宁纪 +1 位作者 张晓怿 孙鹤旭 《机械设计与制造》 北大核心 2015年第7期74-76,79,共4页
针对现有带钢表面质量检测技术在检测精度、数据实时吞吐量等方面存在的问题,提出了一种基于纹理特征编码的带钢表面缺陷检测方法。首先,利用高斯滤波器的差分响应模拟人类视觉的纹理感知模型,在原始图像空间内进行缺陷可疑点检测;然后... 针对现有带钢表面质量检测技术在检测精度、数据实时吞吐量等方面存在的问题,提出了一种基于纹理特征编码的带钢表面缺陷检测方法。首先,利用高斯滤波器的差分响应模拟人类视觉的纹理感知模型,在原始图像空间内进行缺陷可疑点检测;然后对疑似缺陷位置进行纹理特征的提取与编码,在纹理特征编码空间内完成缺陷的精密定位。实验结果表明,该方法可以对带钢表面常见的氧化、孔洞、边裂、麻点等十几种不同类型缺陷进行精确地检测,降低了系统的误检率,同时提高了缺陷检测的识别率和算法的计算效率。 展开更多
关键词 表面缺陷检测 差分响应 特征编码 局部二值模式
下载PDF
并行工程下产品协调模型的研究 被引量:2
13
作者 张天兵 吴俊军 +2 位作者 张新访 钟毅芳 周济 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2000年第10期772-776,共5页
建立和维护产品全生命周期中各种应用活动之间动态的信息关联 ,是实现产品数据集成、保证各应用领域协调活动的关键 .为此 ,提出了基于产品设计过程的产品协调模型 .该模型将原用于基于历史的几何特征建模的特征编码作为建立和维护产品... 建立和维护产品全生命周期中各种应用活动之间动态的信息关联 ,是实现产品数据集成、保证各应用领域协调活动的关键 .为此 ,提出了基于产品设计过程的产品协调模型 .该模型将原用于基于历史的几何特征建模的特征编码作为建立和维护产品几何信息及其它应用信息间关联的纽带 .为了屏蔽特征编码机制的私有属性 ,建立了比特征编码机制更高层的协议——数据协调协议 ,该协议为在产品几何信息与非几何应用信息之间建立和维护动态的、协调一致的关联提供了手段 .最后以实例说明了该模型在装配建模。 展开更多
关键词 并行工程 产品协调模型 CAD CAPP
下载PDF
基于成组技术的轴类零件检索式CAPP系统 被引量:5
14
作者 喻俊馨 辛乐飞 汪波 《西华大学学报(自然科学版)》 CAS 2011年第2期32-34,46,共4页
以成组技术为理论指导,用Access创建零件工艺数据库,VB开发相应程序,设计了轴类零件检索式CAPP系统。该系统既可对已有的轴类零件进行工艺检索,又可对相似的轴类零件检索出同类零件的工艺,并将工艺修改后存储,为后续零件使用。
关键词 CAPP 检索式 特征编码
下载PDF
基于改进哈希算法的图像检索方法 被引量:3
15
作者 陆超文 李菲菲 陈虬 《电子科技》 2020年第5期28-32,共5页
当前主流图像检索技术所采用的传统视觉特征编码缺少足够的学习能力,影响学习得到的特征表达能力。此外,由于视觉特征维数高,会消耗大量的内存,因此降低了图像检索的性能。文中基于深度卷积神经网络与改进的哈希算法,提出并设计了一种... 当前主流图像检索技术所采用的传统视觉特征编码缺少足够的学习能力,影响学习得到的特征表达能力。此外,由于视觉特征维数高,会消耗大量的内存,因此降低了图像检索的性能。文中基于深度卷积神经网络与改进的哈希算法,提出并设计了一种端到端训练方式的图像检索方法。该方法将卷积神经网络提取的高层特征和哈希函数相结合,学习到具有足够表达能力的哈希特征,从而在低维汉明空间中完成对图像数据的大规模检索。在两个常用数据集上的实验结果表明,所提出的哈希图像检索方法的检索性能优于当前的一些主流方法。 展开更多
关键词 图像检索 卷积神经网络 哈希算法 视觉特征 汉明空间 特征编码 特征维度
下载PDF
基于局部特征增强的矿山大规模激光点云语义分割
16
作者 董宏翔 安毅 +2 位作者 谢丽蓉 杨志勇 张凯 《中国激光》 EI CAS CSCD 北大核心 2024年第17期278-289,共12页
矿山大规模激光点云语义分割是无人驾驶矿卡在露天矿山作业的关键技术。由于露天矿山场景大、样本数量不均衡、噪声多等复杂因素,导致无法充分挖掘点云的局部几何特征和上下文信息,无法满足矿卡作业要求。针对上述问题,提出了一种基于... 矿山大规模激光点云语义分割是无人驾驶矿卡在露天矿山作业的关键技术。由于露天矿山场景大、样本数量不均衡、噪声多等复杂因素,导致无法充分挖掘点云的局部几何特征和上下文信息,无法满足矿卡作业要求。针对上述问题,提出了一种基于局部特征增强的矿山大规模激光点云语义分割网络LFE-Net。首先,LFE-Net对点云的空间位置信息编码,增强网络的空间感知定位能力,并利用邻域空间距离权重增强局部语义特征。其次,LFE-Net加入邻域法向量信息,增强网络对几何特征的感知力。最后,LFE-Net引入注意力机制,构造注意力池化,与最大池化相结合构建混合池化,以弥补最大池化带来的特征损失。利用搭载激光雷达的矿卡采集新疆准东露天矿山激光点云数据,并加注真实语义标签,制作矿山三维激光点云语义分割数据集。实验结果表明,与RandLA-Net等大规模激光点云语义分割方法相比,提出的网络模型具有更高的准确率和交并比,对矿卡无人化作业具有重要意义。 展开更多
关键词 遥感 三维激光点云 激光雷达 语义分割 特征编码
原文传递
基于数学形态学的烟支计数识别 被引量:4
17
作者 曹计昌 周建琼 《计算机辅助工程》 2006年第2期6-10,共5页
根据烟支的几何特征,设计1种基于数学形态学的烟支图像分割并计数识别方法.该方法对二值图像应用形态滤波器去噪,对单个标记区域进行形状分类并使用不同的结构元素进行开运算,在腐蚀后膨胀前进行单烟支判定,达到分类处理的效果.在整... 根据烟支的几何特征,设计1种基于数学形态学的烟支图像分割并计数识别方法.该方法对二值图像应用形态滤波器去噪,对单个标记区域进行形状分类并使用不同的结构元素进行开运算,在腐蚀后膨胀前进行单烟支判定,达到分类处理的效果.在整个形态处理过程中引入形态编码概念,从而将形态学运算转换为字节中的位运算,同时将二值图中的区域转换为整数集合,作为1种区域描绘应用在单烟支判定中. 展开更多
关键词 数学形态学 烟支计数 形态滤波器 形态编码 形状分类
下载PDF
基于度量学习的多分支舌象识别网络
18
作者 任思羽 吴瑞 +3 位作者 罗庆林 肖开慧 王艺凡 利节 《中国医学物理学杂志》 CSCD 2024年第4期521-528,共8页
为提升舌象识别效率与精准度,通过度量学习研究辅助医生识别舌象表征的方法。首先,收集舌诊图像111例,数据按照7:3的比例随机分为训练集和测试集。然后,设计一种基于度量学习的多分支舌象识别网络。深度学习网络被分为两个部分,前半部... 为提升舌象识别效率与精准度,通过度量学习研究辅助医生识别舌象表征的方法。首先,收集舌诊图像111例,数据按照7:3的比例随机分为训练集和测试集。然后,设计一种基于度量学习的多分支舌象识别网络。深度学习网络被分为两个部分,前半部分为共享权重层,采用基于度量学习的舌象特征编码损失函数,以获得精准的特征;后半部分针对中医舌象的分类分为4个舌象识别辅助分支,降低舌象识别难度,提升准确率。此外,构建多标签残差映射,增加类间距,减小类内距,提升最终识别的准确度。本文方法在舌象数据集的测试集上进行测试时获得84.8%的识别精度,表明多分支网络架构可以很好地降低舌象识别难度,特别是特征类别较多的舌形和苔质。同时,舌象特征编码损失函数可以有效地提取舌象特征;舌象多标签残差映射可以减少各类别之间的干扰,从而提升识别准确度。 展开更多
关键词 舌象识别 多分支网络架构 特征编码 损失函数 多标签残差映射
下载PDF
桌面式虚拟装配训练评价系统设计与实现 被引量:4
19
作者 赵鸿飞 张琦 +1 位作者 苏凡囤 焦玉民 《解放军理工大学学报(自然科学版)》 EI 北大核心 2012年第6期658-663,共6页
针对当前面向人员操作的虚拟装配训练缺乏评价方法的现状,提出了基于装配体零部件约束解除的零件分层方法,根据装配体组成零件的特征属性对零件进行特征编码,结合桌面式虚拟现实技术,采用基于时间步长和事件步长相结合的方式对受训人员... 针对当前面向人员操作的虚拟装配训练缺乏评价方法的现状,提出了基于装配体零部件约束解除的零件分层方法,根据装配体组成零件的特征属性对零件进行特征编码,结合桌面式虚拟现实技术,采用基于时间步长和事件步长相结合的方式对受训人员的操作进行识别、记录。构建了基于专家知识并与虚拟装配过程相关的序列性、工艺性和时效性评判规则库,应用分层模糊评价方法,实现了对操作人员装配操作过程的评价。将该方法应用于某型装备保障虚拟训练系统,验证了方法的有效性。 展开更多
关键词 虚拟装配 训练评价 约束解除 特征编码 分层模糊评价
下载PDF
基于改进Transformer模型的多声源分离方法
20
作者 曾援 李剑 +2 位作者 马明星 庞润嘉 贺斌 《计算机技术与发展》 2024年第5期60-65,共6页
目前主流的语音分离算法模型都是基于复杂的递归网络或Transformer网络,Transformer网络复杂度高导致训练难度大以及音频的高采样率导致在样本级别上使用超长输入从而获取不完全特征,不能直接对长语音特征序列进行直接建模出现特征丢失... 目前主流的语音分离算法模型都是基于复杂的递归网络或Transformer网络,Transformer网络复杂度高导致训练难度大以及音频的高采样率导致在样本级别上使用超长输入从而获取不完全特征,不能直接对长语音特征序列进行直接建模出现特征丢失问题。对此,该文提出了一种基于Transformer的改进网络模型。首先,在原有Transformer网络模型编码器里新添加下采样块,计算不同时间尺度上的高级特征同时降低特征空间复杂度;其次,在Transformer网络模型的解码器里添加上采样层与编码器下采样层特征融合保证特征不丢失,提高模型分离能力;最后,在模型分离层里引入一种改进的滑动窗口注意力机制,滑动窗口使用循环移位技术,新的特征窗口中包含老的特征窗口特征同时融合特征边缘信息完成了特征窗口之间的信息交互,获得特征编码以及特征位置编码同时提高特征信息之间的相关系数。实验表明,使用SI-SNR评价标准达到13.5 dB,使用SDR评价指标达到14.1 dB,分离效果优于之前的方法。 展开更多
关键词 上下采样层 TRANSFORMER 特征编码 滑动窗口注意力机制 深度学习
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部