-
题名基于CycleGAN的音频风格迁移改进方法
- 1
-
-
作者
王欢
蔡志伟
许鑫亮
张豹
吴文益
-
机构
大连民族大学计算机科学与工程学院
-
出处
《大连民族大学学报》
2022年第3期271-275,共5页
-
基金
辽宁省自然科学基金项目(2020-MZLH-19)
贵州省科技支撑计划项目(2021-534)。
-
文摘
提出基于循环一致性生成对抗网络(Cycle-Consistent Generative Adversarial Networks;CycleGAN)实现音频风格迁移的改进方法。该方法可将原始音频风格替换成指定的音频风格。CycleGAN网络常应用于图像到图像的风格迁移,其处理的数据维度一般是2维,而音频是1维的时间序列,需对数据进行预处理将其转换为2维数据。音频数据处理后是稀疏矩阵,本文在生成器网络结构中的ResNet网络中加入瓶颈结构以减少计算量同时不损失原来信息。本文采用主观评价及客观评价方式对模型进行评估,评估结果显示:该模型在音频风格迁移中有较好的效果。
-
关键词
音频风格迁移
循环一致性生成对抗网络
瓶颈结构
-
Keywords
music style transfer
CycleGAN
bottleneck
-
分类号
TP389.41
[自动化与计算机技术—计算机系统结构]
-
-
题名基于卷积神经网络的风格迁移艺术字研究
被引量:1
- 2
-
-
作者
许鑫亮
杨泽昊
闫宇
李镇宇
战国栋
-
机构
大连民族大学计算机科学与工程学院
大连民族大学设计学院
大连民族大学大连市汉字计算机字库设计技术创新中心
-
出处
《大连民族大学学报》
2023年第1期69-72,共4页
-
基金
辽宁省自然科学基金项目(2020-MZLH-19)
贵州省科技支撑计划项目(2021-534)。
-
文摘
针对艺术字风格迁移只迁移风格图像的颜色特征、生成字形风格单一的问题,提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的风格迁移艺术字的方法。该方法首先通过字库提取多种类型字体,自动生成内容图像,再经过预训练VGG19网络提取风格图像的抽象特征表示。构造Gram矩阵作为图像风格表征,最后利用L-BFGS算法进行迭代优化,生成具有特殊风格的艺术字体。结果与市面上艺术字生成器产生的艺术字进行对比,本文的风格迁移艺术字兼具其纹理特征和颜色特征,更具有美感。
-
关键词
风格迁移
卷积神经网络
艺术字
-
Keywords
style transfer
convolutional neural network
wordart
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-