期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于神经网络的生成式三维数字人研究综述:表示、渲染与学习
被引量:
4
1
作者
晏轶超
程宇豪
+9 位作者
陈琢
彭乙骢
吴思婧
张维天
李俊杰
李逸轩
高景南
张维夏
翟广涛
杨小康
《中国科学:信息科学》
CSCD
北大核心
2023年第10期1858-1891,共34页
随着人工智能技术的高速发展,计算机视觉与图形学等相关学科的交叉融合掀起了一场数字人生成技术的新革命,人类进入“元宇宙”等数字空间的梦想正逐渐变为现实.面对大规模三维数字人的生产需求,传统图形学建模方法建模过程繁琐,周期冗长...
随着人工智能技术的高速发展,计算机视觉与图形学等相关学科的交叉融合掀起了一场数字人生成技术的新革命,人类进入“元宇宙”等数字空间的梦想正逐渐变为现实.面对大规模三维数字人的生产需求,传统图形学建模方法建模过程繁琐,周期冗长,阻碍了虚拟数字人的普及和应用,而利用生成式人工智能技术产生高拟真、规模化的虚拟数字人正逐渐成为研究热点.为了深入了解三维数字人技术的研究现状与挑战,本文从生成式模型的视角对数字人技术进行了系统性梳理,并总结了其中的3个关键步骤:表示、渲染与学习.随后,对显式及隐式的表示方法进行总结,对传统渲染与神经网络渲染的成像方式进行归纳,并概括了相应的模型学习方法.最后,本文对三维数字人的典型应用进行分析,并对当前挑战与未来发展方向进行总结和展望.
展开更多
关键词
三维数
字
人
生成模型
隐式表示
神经渲染
对抗学习
原文传递
多模态信息引导的三维数字人运动生成综述
2
作者
赵宝全
付一愉
+3 位作者
苏卓
王若梅
吕辰雷
罗笑南
《中国图象图形学报》
CSCD
北大核心
2024年第9期2541-2565,共25页
基于多模态信息的三维数字人运动生成技术旨在通过文本、音频、图像和视频等数据实现特定输入条件下的人体运动生成。这项技术在电影、动画、游戏制作和元宇宙等领域具有重要的应用价值和广泛的经济社会效益,是近年来计算机图形学和计...
基于多模态信息的三维数字人运动生成技术旨在通过文本、音频、图像和视频等数据实现特定输入条件下的人体运动生成。这项技术在电影、动画、游戏制作和元宇宙等领域具有重要的应用价值和广泛的经济社会效益,是近年来计算机图形学和计算机视觉等领域研究的热点问题之一。然而,基于多模态信息的三维数字人运动生成面临着诸多挑战,包括跨模态信息的表征和融合困难、高质量数据集缺乏、生成的运动质量较差(如抖动、穿模和脚部滑动等)以及生成效率低等问题。虽然近年来研究者们提出了各式各样的解决方案来应对上述挑战,但如何根据不同模态数据的特点实现高效、高质量的三维数字人运动生成仍然是一个开放性问题。本文以数字人运动生成所采用的模型架构为分类标准,将现有的主流方法分为基于生成对抗网络(generative adversarial network,GAN)的方法、基于自编码器(autoencoder,AE)的方法、基于变分自编码器(variational autoencoder,VAE)的方法以及基于扩散模型的方法,总结并形成了一种数字人运动生成通用框架。本文还介绍了该领域常见的参数化人体模型、数据集以及评估指标。对于一些具有代表性的工作,本文在一些常用数据集上进行了对比实验,评估这些方法的性能表现。最后综合现有的数据集、算法和代表性研究,总结了该领域的问题和挑战,探讨了完善数据集、优化运动质量和多样性、融合跨模态信息和提高生成效率等潜在的研究方向。
展开更多
关键词
三维数
字
人
运动生成
多模态信息
参
数
化
人
体模型
生成对抗网络(GAN)
自编码器(AE)
变分自编码器(VAE)
扩散模型
原文传递
题名
基于神经网络的生成式三维数字人研究综述:表示、渲染与学习
被引量:
4
1
作者
晏轶超
程宇豪
陈琢
彭乙骢
吴思婧
张维天
李俊杰
李逸轩
高景南
张维夏
翟广涛
杨小康
机构
人工智能教育部重点实验室
出处
《中国科学:信息科学》
CSCD
北大核心
2023年第10期1858-1891,共34页
基金
上海市市级科技重大专项(批准号:2021SHZDZX0102)资助项目。
文摘
随着人工智能技术的高速发展,计算机视觉与图形学等相关学科的交叉融合掀起了一场数字人生成技术的新革命,人类进入“元宇宙”等数字空间的梦想正逐渐变为现实.面对大规模三维数字人的生产需求,传统图形学建模方法建模过程繁琐,周期冗长,阻碍了虚拟数字人的普及和应用,而利用生成式人工智能技术产生高拟真、规模化的虚拟数字人正逐渐成为研究热点.为了深入了解三维数字人技术的研究现状与挑战,本文从生成式模型的视角对数字人技术进行了系统性梳理,并总结了其中的3个关键步骤:表示、渲染与学习.随后,对显式及隐式的表示方法进行总结,对传统渲染与神经网络渲染的成像方式进行归纳,并概括了相应的模型学习方法.最后,本文对三维数字人的典型应用进行分析,并对当前挑战与未来发展方向进行总结和展望.
关键词
三维数
字
人
生成模型
隐式表示
神经渲染
对抗学习
Keywords
3D digital human
generative model
implicit representation
neural rendering
adversarial learning
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP183 [自动化与计算机技术—计算机科学与技术]
原文传递
题名
多模态信息引导的三维数字人运动生成综述
2
作者
赵宝全
付一愉
苏卓
王若梅
吕辰雷
罗笑南
机构
中山大学人工智能学院
中山大学计算机学院
深圳大学计算机与软件学院
桂林电子科技大学计算机与信息安全学院
出处
《中国图象图形学报》
CSCD
北大核心
2024年第9期2541-2565,共25页
基金
国家重点研发计划资助(2022YFF0903103)
广东省自然科学基金项目(2023A1515011639)
中央高校基本科研业务费专项资金资助(23xkjc019,24qnpy145)。
文摘
基于多模态信息的三维数字人运动生成技术旨在通过文本、音频、图像和视频等数据实现特定输入条件下的人体运动生成。这项技术在电影、动画、游戏制作和元宇宙等领域具有重要的应用价值和广泛的经济社会效益,是近年来计算机图形学和计算机视觉等领域研究的热点问题之一。然而,基于多模态信息的三维数字人运动生成面临着诸多挑战,包括跨模态信息的表征和融合困难、高质量数据集缺乏、生成的运动质量较差(如抖动、穿模和脚部滑动等)以及生成效率低等问题。虽然近年来研究者们提出了各式各样的解决方案来应对上述挑战,但如何根据不同模态数据的特点实现高效、高质量的三维数字人运动生成仍然是一个开放性问题。本文以数字人运动生成所采用的模型架构为分类标准,将现有的主流方法分为基于生成对抗网络(generative adversarial network,GAN)的方法、基于自编码器(autoencoder,AE)的方法、基于变分自编码器(variational autoencoder,VAE)的方法以及基于扩散模型的方法,总结并形成了一种数字人运动生成通用框架。本文还介绍了该领域常见的参数化人体模型、数据集以及评估指标。对于一些具有代表性的工作,本文在一些常用数据集上进行了对比实验,评估这些方法的性能表现。最后综合现有的数据集、算法和代表性研究,总结了该领域的问题和挑战,探讨了完善数据集、优化运动质量和多样性、融合跨模态信息和提高生成效率等潜在的研究方向。
关键词
三维数
字
人
运动生成
多模态信息
参
数
化
人
体模型
生成对抗网络(GAN)
自编码器(AE)
变分自编码器(VAE)
扩散模型
Keywords
3D avatar
motion generation
multimodal information
parametric human model
generative adversarial net⁃work(GAN)
autoencoder(AE)
variational autoencoder(VAE)
diffusion model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于神经网络的生成式三维数字人研究综述:表示、渲染与学习
晏轶超
程宇豪
陈琢
彭乙骢
吴思婧
张维天
李俊杰
李逸轩
高景南
张维夏
翟广涛
杨小康
《中国科学:信息科学》
CSCD
北大核心
2023
4
原文传递
2
多模态信息引导的三维数字人运动生成综述
赵宝全
付一愉
苏卓
王若梅
吕辰雷
罗笑南
《中国图象图形学报》
CSCD
北大核心
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部