期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于VAE-GAN和FLCNN的不均衡样本轴承故障诊断方法 被引量:10
1
作者 张永宏 张中洋 +3 位作者 赵晓平 王丽华 邵凡 吕凯扬 《振动与冲击》 EI CSCD 北大核心 2022年第9期199-209,共11页
针对滚动轴承故障诊断中样本分布不均衡引起的模型泛化能力差、诊断精度低的问题,从两个方面展开研究:(1)故障样本增广,提出结合变分自编码器(VAE)和生成对抗网络(GAN)的VAE-GAN样本增广模型;(2)改进分类算法,提出基于焦点损失(FL)和卷... 针对滚动轴承故障诊断中样本分布不均衡引起的模型泛化能力差、诊断精度低的问题,从两个方面展开研究:(1)故障样本增广,提出结合变分自编码器(VAE)和生成对抗网络(GAN)的VAE-GAN样本增广模型;(2)改进分类算法,提出基于焦点损失(FL)和卷积神经网络(CNN)的FLCNN(focal loss and convolutional neural network)样本分类模型。在此基础上,将VAE-GAN和FLCNN融合,构建VAE-GAN+FLCNN轴承故障诊断模型。首先,将样本量少的故障类输入VAE-GAN模型,通过交替训练编码网络、生成网络和判别网络,学习出真实故障样本的数据分布,从而实现故障样本的增广;然后用增广后的数据样本训练FLCNN分类模型,完成轴承故障识别。试验对比结果表明,所提方法能够有效提升样本不均衡条件下的轴承故障诊断效果,拥有更高的Recall值和F1-score值。 展开更多
关键词 滚动轴承 编码器(vae) 生成对抗网络(GAN) 焦点损失(FL) 故障诊断
下载PDF
多模态信息引导的三维数字人运动生成综述
2
作者 赵宝全 付一愉 +3 位作者 苏卓 王若梅 吕辰雷 罗笑南 《中国图象图形学报》 CSCD 北大核心 2024年第9期2541-2565,共25页
基于多模态信息的三维数字人运动生成技术旨在通过文本、音频、图像和视频等数据实现特定输入条件下的人体运动生成。这项技术在电影、动画、游戏制作和元宇宙等领域具有重要的应用价值和广泛的经济社会效益,是近年来计算机图形学和计... 基于多模态信息的三维数字人运动生成技术旨在通过文本、音频、图像和视频等数据实现特定输入条件下的人体运动生成。这项技术在电影、动画、游戏制作和元宇宙等领域具有重要的应用价值和广泛的经济社会效益,是近年来计算机图形学和计算机视觉等领域研究的热点问题之一。然而,基于多模态信息的三维数字人运动生成面临着诸多挑战,包括跨模态信息的表征和融合困难、高质量数据集缺乏、生成的运动质量较差(如抖动、穿模和脚部滑动等)以及生成效率低等问题。虽然近年来研究者们提出了各式各样的解决方案来应对上述挑战,但如何根据不同模态数据的特点实现高效、高质量的三维数字人运动生成仍然是一个开放性问题。本文以数字人运动生成所采用的模型架构为分类标准,将现有的主流方法分为基于生成对抗网络(generative adversarial network,GAN)的方法、基于自编码器(autoencoder,AE)的方法、基于变分自编码器(variational autoencoder,VAE)的方法以及基于扩散模型的方法,总结并形成了一种数字人运动生成通用框架。本文还介绍了该领域常见的参数化人体模型、数据集以及评估指标。对于一些具有代表性的工作,本文在一些常用数据集上进行了对比实验,评估这些方法的性能表现。最后综合现有的数据集、算法和代表性研究,总结了该领域的问题和挑战,探讨了完善数据集、优化运动质量和多样性、融合跨模态信息和提高生成效率等潜在的研究方向。 展开更多
关键词 三维数字人 运动生成 多模态信息 参数化人体模型 生成对抗网络(GAN) 编码器(AE) 编码器(vae) 扩散模型
原文传递
VAE-ATTGRU模型的股指期货价格预测研究
3
作者 张玉婷 金传泰 李勇 《计算机工程与应用》 CSCD 北大核心 2024年第17期293-301,共9页
针对股指期货市场高波动、非平稳、非线性和高信噪比等特性造成的预测难度大的问题,利用变分自编码器(VAE)和循环神经网络(RNN)提出一种基于VAE-ATTGRU的混合深度学习股指期货价格预测模型。利用变分自编码器对股指期货技术指标进行学习... 针对股指期货市场高波动、非平稳、非线性和高信噪比等特性造成的预测难度大的问题,利用变分自编码器(VAE)和循环神经网络(RNN)提出一种基于VAE-ATTGRU的混合深度学习股指期货价格预测模型。利用变分自编码器对股指期货技术指标进行学习,将VAE学习到的潜在因子与原始数据融合实现数据增强,得到更丰富的因子表示;使用循环神经网络对股指期货价格进行预测,发现结合了注意力机制的门控循环单元(ATTGRU)可以对VAE增强后的股指期货数据进行充分学习,对关键特征信息进行捕捉并重新赋予权重。在沪深300股指期货、中证500股指期货和上证50股指期货数据上进行实验,通过均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和决定系数R2对VAE-ATTGRU模型进行评估,发现其在预测精度上优于其他模型。 展开更多
关键词 股指期货预测 编码器(vae) 数据增强 注意力机制 门控循环单元(GRU)
下载PDF
变分自编码器在环境噪声消除中的应用研究
4
作者 李红玲 《电声技术》 2024年第8期105-107,共3页
针对语音信号中的环境噪声影响问题,研究一种基于变分自编码器(Variational Auto-Encoder,VAE)的噪声消除方法,并进行了相关实验验证。首先,深入研究VAE的基本原理;其次,引入L_2正则化方法优化VAE,以提高模型的泛化能力和健壮性;最后,利... 针对语音信号中的环境噪声影响问题,研究一种基于变分自编码器(Variational Auto-Encoder,VAE)的噪声消除方法,并进行了相关实验验证。首先,深入研究VAE的基本原理;其次,引入L_2正则化方法优化VAE,以提高模型的泛化能力和健壮性;最后,利用ESC-50和VCTK数据集构建包含环境噪声的语音信号数据集,并在此基础上进行了一系列实验。实验结果表明,所提方法能够有效降低环境噪声对语音信号的影响。 展开更多
关键词 编码器(vae) 正则化 环境噪声 去噪
下载PDF
基于卷积变分自编码器的日负荷曲线聚类研究 被引量:3
5
作者 杨亚兰 李晨鑫 +3 位作者 秦毓毅 王渝红 方飚 舒虹 《现代电力》 北大核心 2023年第5期770-778,共9页
用户日用电数据可以反映用户的用电行为特征,聚类任务能够从大量运行数据中提取典型用户日负荷曲线为电力系统的规划与调度等任务提供依据。针对传统聚类方法在数据量庞大、数据维度较高的日负荷数据场景中具有效率低下、提取潜在表征... 用户日用电数据可以反映用户的用电行为特征,聚类任务能够从大量运行数据中提取典型用户日负荷曲线为电力系统的规划与调度等任务提供依据。针对传统聚类方法在数据量庞大、数据维度较高的日负荷数据场景中具有效率低下、提取潜在表征困难等问题,提出基于卷积变分自编码器(variational autoencoders,VAE)的聚类方法对负荷曲线进行聚类。该方法首先通过卷积变分自编码器降维提取日负荷数据的潜在特征,并配合K-means进行负荷聚类任务,最后基于各负荷曲线与聚类中心的距离通过加权修正每一类聚类中心以得到更具代表性的典型日负荷曲线。利用UCI数据集中的葡萄牙用户实际采集数据进行算例验证,结果显示该方法的戴维森堡丁指数(Davies-Bouldin Index,DBI)相较于传统聚类方法K-means、PCA+K-means等下降明显,说明类内更加紧密,类间更加远离,提高了聚类质量。然后利用高斯距离加权改进了聚类中心,提取到更加典型日负荷曲线,使得分析用户用电行为特征更为精确。验证了卷积变分自编码器聚类方法在日负荷曲线中的有效性。 展开更多
关键词 负荷聚类 典型日负荷曲线 卷积神经网络(CNN) 编码器(vae) 距离加权
下载PDF
基于深度学习的视频压缩编码技术研究
6
作者 周立新 《电视技术》 2024年第9期13-16,共4页
视频压缩编码技术是提高数字电视中视频传输和存储效率的关键技术。通过分析数字电视中的视频压缩问题,设计一个面向数字电视的视频压缩数据传输框架,阐述基于变分自编码器(Variational Auto-Encoders,VAE)的视频压缩方法,利用UVG数据集... 视频压缩编码技术是提高数字电视中视频传输和存储效率的关键技术。通过分析数字电视中的视频压缩问题,设计一个面向数字电视的视频压缩数据传输框架,阐述基于变分自编码器(Variational Auto-Encoders,VAE)的视频压缩方法,利用UVG数据集在MATLAB平台上进行实验。实验结果显示,所提方法在视频压缩和重建上取得了较好的效果,验证了其在视频压缩编码领域的有效性和应用潜力。 展开更多
关键词 深度学习 编码器(vae) 视频压缩编码 数据重建
下载PDF
边收缩池化的网格变分自编码器 被引量:3
7
作者 袁宇杰 来煜坤 +3 位作者 杨洁 段琦 傅红波 高林 《中国图象图形学报》 CSCD 北大核心 2022年第2期511-524,共14页
目的3D形状分析是计算机视觉和图形学的一个重要研究课题。虽然现有方法使用基于图的卷积将基于图像的深度学习推广到3维网格,但缺乏有效的池化操作限制了其网络的学习能力。针对具有相同连通性,但几何形状不同的网格模型数据集,本文利... 目的3D形状分析是计算机视觉和图形学的一个重要研究课题。虽然现有方法使用基于图的卷积将基于图像的深度学习推广到3维网格,但缺乏有效的池化操作限制了其网络的学习能力。针对具有相同连通性,但几何形状不同的网格模型数据集,本文利用网格简化的边收缩操作建立网格层次结构,提出了一种新的网格池化操作。方法本文改进了传统的网格简化方法,以避免生成高度不规则的三角形,利用改进的网格简化方法定义了新的网格池化操作。网格简化的边收缩操作建立的网格层次结构之间存在对应关系,有利于网格池化的定义。新定义的池化操作有效地编码了层次结构中较粗糙和较稠密网格之间的对应关系。最后提出了一种带有边收缩池化和图卷积的变分自编码器(variational auto-encoder,VAE)结构,以探索3D形状的隐空间并用于3D形状的生成。结果由于引入了新定义的池化操作和图卷积操作,提出的网络结构比原始MeshVAE需要的参数更少,因此可以处理更稠密的网格模型。结论实验表明提出的方法具有更好的泛化能力,并且在各种应用中更可靠,包括形状生成、形状插值和形状嵌入。 展开更多
关键词 网格生成 网格插值 编码器(vae) 网格池化 边收缩
原文传递
高斯混合生成模型检测健康数据异常 被引量:3
8
作者 朱壮壮 周治平 《计算机科学与探索》 CSCD 北大核心 2022年第5期1128-1135,共8页
在智能穿戴设备普及的背景下,运动手环为全面地了解人们的身体状况提供了丰富的信息源,但是其提供的多维活动数据存在未知的异常值,因此需要进行异常值的检测。由于“维度灾难”,通过传统的方法进行密度估计十分困难,导致检测效果不佳... 在智能穿戴设备普及的背景下,运动手环为全面地了解人们的身体状况提供了丰富的信息源,但是其提供的多维活动数据存在未知的异常值,因此需要进行异常值的检测。由于“维度灾难”,通过传统的方法进行密度估计十分困难,导致检测效果不佳。针对该问题,使用了一种高斯混合生成模型(GMGM)健康数据检测方法。首先,该模型利用变分自编码器(VAE)训练原始数据,并且通过降低重构误差提取潜在特征。然后,利用深度信念网络(DBN),通过潜在分布和提取的特征来预测样本的混合成员隶属度。接着,变分自编码器、深度信念网络与高斯混合模型(GMM)共同优化,避免了模型解耦的影响。高斯混合模型预测得到每个数据的样本密度,将密度高于训练阶段阈值的样本视为异常。在ODDS标准数据集上验证模型的性能,结果表明,相比深度自编码器高斯混合模型(DAGMM),GMGM的AUC指标平均提升了5.5个百分点。最后,在真实数据集上的实验结果也表明了该方法的有效性。 展开更多
关键词 编码器(vae) 深度信念网络(DBN) 高斯混合模型(GMM) 健康数据 异常检测
下载PDF
隐空间转换的混合样本图像去雾 被引量:1
9
作者 郑玉彤 孙昊英 宋伟 《计算机工程与应用》 CSCD 北大核心 2023年第9期225-236,共12页
深度学习从数据集中学习样本的内在规律,数据集的质量一定程度上决定了模型的表现。在去雾任务的公开数据集中,由于缺少成对真实数据,合成的成对数据难以模拟真实环境等问题,可能导致训练出的模型在实际环境中表现不佳。为此,提出混合... 深度学习从数据集中学习样本的内在规律,数据集的质量一定程度上决定了模型的表现。在去雾任务的公开数据集中,由于缺少成对真实数据,合成的成对数据难以模拟真实环境等问题,可能导致训练出的模型在实际环境中表现不佳。为此,提出混合样本学习问题,利用合成的成对数据和真实数据(混合样本)同时训练模型,通过隐空间的转换实现混合样本间的转换。算法利用变分自编码器和生成对抗网络(VAE-GAN)将混合样本分别编码到隐空间,利用对抗损失将真实数据的隐空间向合成雾图的隐空间对齐,利用含特征自适应融合(MFF)模块的映射网络学习成对数据隐空间之间的转换,从而建立起从真实雾图域到清晰图像域之间的去雾数据通路。实验结果表明,该算法相比其他去雾算法在真实雾图上的去雾结果更加清晰,对于较厚的雾图也有突出的效果,且该算法的峰值信噪比高于对比算法。 展开更多
关键词 单幅图像去雾 隐空间转换 混合样本 编码器(vae) 生成对抗网络(GAN)
下载PDF
基于变分自编码器的评分预测模型 被引量:2
10
作者 陈海 钱付兰 +2 位作者 陈洁 赵姝 张燕平 《计算机工程与应用》 CSCD 北大核心 2021年第22期153-159,共7页
深度学习模型具有鲁棒性差的局限性,常见的如在图片中增加特定的噪声会影响到图片的分类和预测结果。近期有学者将深度学习引入到推荐系统中,因此在推荐系统中也存在噪声对推荐精度影响的问题。针对深度推荐模型的鲁棒性问题,基于变分... 深度学习模型具有鲁棒性差的局限性,常见的如在图片中增加特定的噪声会影响到图片的分类和预测结果。近期有学者将深度学习引入到推荐系统中,因此在推荐系统中也存在噪声对推荐精度影响的问题。针对深度推荐模型的鲁棒性问题,基于变分自编码器(Variational Auto-Encoder,VAE)提出了新的评分预测模型REVAE(REcommender Variational Auto-Encoder)。该模型为了训练模型对噪声干扰的鲁棒性,在传统的VAE上增加了一层隐层表示,利用后验分布对隐层表示进行约束,并在该隐层上增加了噪声,通过重构输入数据,训练得到具有抗噪能力的推荐算法模型。在公开的Movielens数据集上进行的实验结果表明,REVAE可以有效降低噪声对模型的干扰,使得整个模型更具有健壮性,相比其他评分预测算法具有更好的推荐效果。 展开更多
关键词 深度学习 推荐系统 编码器(vae) 预测
下载PDF
视觉—语义双重解纠缠的广义零样本学习
11
作者 韩阿友 杨关 +1 位作者 刘小明 刘阳 《中国图象图形学报》 CSCD 北大核心 2023年第9期2913-2926,共14页
目的传统的零样本学习(zero-shot learning,ZSL)旨在依据可见类别的数据和相关辅助信息对未见类别的数据进行预测分类,而广义零样本学习(generalized zero-shot learning,GZSL)中分类的类别既可能属于可见类也可能属于不可见类,这更符... 目的传统的零样本学习(zero-shot learning,ZSL)旨在依据可见类别的数据和相关辅助信息对未见类别的数据进行预测分类,而广义零样本学习(generalized zero-shot learning,GZSL)中分类的类别既可能属于可见类也可能属于不可见类,这更符合现实的应用场景。基于生成模型的广义零样本学习的原始特征和生成特征不一定编码共享属性所指的语义相关信息,这样会导致模型倾向于可见类,并且分类时忽略了语义信息中与特征相关的有用信息。为了分解出相关的视觉特征和语义信息,提出了视觉—语义双重解纠缠框架。方法首先,使用条件变分自编码器为不可见类生成视觉特征,再通过一个特征解纠缠模块将其分解为语义一致性和语义无关特征。然后,设计了一个语义解纠缠模块将语义信息分解为特征相关和特征无关的语义。其中,利用总相关惩罚来保证分解出来的两个分量之间的独立性,特征解纠缠模块通过关系网络来衡量分解的语义一致性,语义解纠缠模块通过跨模态交叉重构来保证分解的特征相关性。最后,使用两个解纠缠模块分离出来的语义一致性特征和特征相关语义信息联合学习一个广义零样本学习分类器。结果实验在4个广义零样本学习公开数据集AWA2(animals with attributes2)、CUB(caltech-ucsd birds-200-2011)、SUN(SUN attribute)和FLO(Oxford flowers)上取得了比Baseline更好的结果,调和平均值在AwA2、CUB、SUN和FLO上分别提升了1.6%、3.2%、6.2%和1.5%。结论在广义零样本学习分类中,本文提出的视觉—语义双重解纠缠方法经实验证明比基准方法取得了更好的性能,并且优于大多现有的相关方法。 展开更多
关键词 零样本学习(ZSL) 广义零样本学习(GZSL) 解纠缠表示 编码器(vae) 跨模态重构 总相关性(TC)
原文传递
一种融合伴随信息的网络表示学习模型
12
作者 杜航原 王文剑 白亮 《软件学报》 EI CSCD 北大核心 2023年第6期2749-2764,共16页
网络表示学习被认为是提高信息网络分析效率的关键技术之一,旨在将网络中每个节点映射为低维隐空间中的向量表示,并使这些向量高效的保持原网络的结构和特性.近年来,大量研究致力于网络拓扑和节点属性的深度挖掘,并在一些网络分析任务... 网络表示学习被认为是提高信息网络分析效率的关键技术之一,旨在将网络中每个节点映射为低维隐空间中的向量表示,并使这些向量高效的保持原网络的结构和特性.近年来,大量研究致力于网络拓扑和节点属性的深度挖掘,并在一些网络分析任务中取得了良好应用效果.事实上,在这两类关键信息之外,真实网络中广泛存在的伴随信息,反映了网络中复杂微妙的各种关系,对网络的形成和演化起着重要作用.为提高网络表示学习的有效性,提出了一种能够融合伴随信息的网络表示学习模型NRLIAI.该模型以变分自编码器(VAE)作为信息传播和处理的框架,在编码器中利用图卷积算子进行网络拓扑和节点属性的聚合与映射,在解码器中完成网络的重构,并融合伴随信息对网络表示学习过程进行指导.该模型克服了现有方法无法有效利用伴随信息的缺点,同时具有一定的生成能力,能减轻表示学习过程中的过拟合问题.在真实网络数据集上,通过节点分类和链路预测任务对NRLIAI模型与几种现有方法进行了对比实验,实验结果验证了该模型的有效性. 展开更多
关键词 网络表示学习 伴随信息 编码器(vae) 图卷积网络(GCN) 互信息
下载PDF
混合高斯变分自编码器的聚类网络 被引量:1
13
作者 陈华华 陈哲 +2 位作者 郭春生 应娜 叶学义 《中国图象图形学报》 CSCD 北大核心 2022年第7期2148-2156,共9页
目的经典的聚类算法在处理高维数据时存在维数灾难等问题,使得计算成本大幅增加并且效果不佳。以自编码或变分自编码网络构建的聚类网络改善了聚类效果,但是自编码器提取的特征往往比较差,变分自编码器存在后验崩塌等问题,影响了聚类的... 目的经典的聚类算法在处理高维数据时存在维数灾难等问题,使得计算成本大幅增加并且效果不佳。以自编码或变分自编码网络构建的聚类网络改善了聚类效果,但是自编码器提取的特征往往比较差,变分自编码器存在后验崩塌等问题,影响了聚类的结果。为此,本文提出了一种基于混合高斯变分自编码器的聚类网络。方法使用混合高斯分布作为隐变量的先验分布构建变分自编码器,并以重建误差和隐变量先验与后验分布之间的KL散度(Kullback-Leibler divergence)构造自编码器的目标函数训练自编码网络;以训练获得的编码器对输入数据进行特征提取,结合聚类层构建聚类网络,以编码器隐层特征的软分配分布与软分配概率辅助目标分布之间的KL散度构建目标函数并训练聚类网络;变分自编码器采用卷积神经网络实现。结果为了验证本文算法的有效性,在基准数据集MNIST(Modified National Institute of Standards and Technology Database)和Fashion-MNIST上评估了该网络的性能,聚类精度(accuracy,ACC)和标准互信息(normalized mutual information,NMI)指标在MNIST数据集上分别为95.86%和91%,在Fashion-MNIST数据集上分别为61.34%和62.5%,与现有方法相比性能有了不同程度的提升。结论实验结果表明,本文网络取得了较好的聚类效果,且优于当前流行的多种聚类方法。 展开更多
关键词 聚类 混合高斯 编码器(vae) KL散度
原文传递
变分自动编码器的潜变量空间解耦方法
14
作者 曾青耀 郑茜颖 俞金玲 《福州大学学报(自然科学版)》 CAS 北大核心 2022年第3期337-344,共8页
针对潜变量空间解耦具有可选择性地调整数据属性,实现更可控的数据生成的特性,提出一种提高解耦任务度量指标的方法.该方法在编码器阶段,运用自注意力机制和残差网络,使模型更有效地捕捉长期依赖关系,增强模型的维度适应性.在训练阶段,... 针对潜变量空间解耦具有可选择性地调整数据属性,实现更可控的数据生成的特性,提出一种提高解耦任务度量指标的方法.该方法在编码器阶段,运用自注意力机制和残差网络,使模型更有效地捕捉长期依赖关系,增强模型的维度适应性.在训练阶段,提出新颖损失函数使潜变量空间编码维度与属性值趋向单调关系,从而更好地调节损失函数所处区间范围,达到优化目的.通过对比实验表明,本模型和方法在图像的潜变量空间解耦生成上优于变分自编码机(variational auto encoder,VAE)及属性正则化(AR-VAE)模型模型,且具有更为轻量级的网络架构. 展开更多
关键词 图像 解耦 编码器(vae) 注意力机制 残差网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部