V
主页
文本驱动的三维人脸生成: 从粗略草图到逼真细节
发布人
【加群】 一起来刷arxiv,请加vx: pwbot02(请备注:b站arxiv) 【论文标题】 文本驱动的三维人脸生成: 从粗略草图到逼真细节 【论文简述】 本文提出了一种从文本描述生成逼真三维人脸的方法。该方法首先利用一个粗略的草图模型来捕捉人脸的基本结构,然后通过精细的细节建模,逐步优化人脸的形状、纹理和光照等属性,最终生成逼真的三维人脸。具体来说,该方法采用了一个两阶段的框架,第一阶段通过草图模型和形态学变换来生成人脸的粗略形状,第二阶段则通过对抗生成网络和光照估计技术来进一步优化人脸的细节和光照。实验结果表明,该方法能够在各种不同的文本描述下生成高质量的三维人脸,具有广泛的应用前景。 【论文链接】 https://arxiv.org/abs/2312.08889
打开封面
下载高清视频
观看高清视频
视频下载器
吹爆!基于GAN生成对抗网络的图像超分辨率重建与图像补全实战,论文详解+代码实战,AIGC必备算法!!
融合像素与潜在扩散模型的文本到视频生成方法
高斯涂抹文本生成三维模型
文本驱动的视频生成模型的动态定制
ECLIPSE:一种资源高效的文本到图像先验模型用于图像生成
生成高质量的长视频:SEINE视频扩散模型
深度聚类全新突破:模型精度飙升43.5%,刷新多项SOTA,10篇前沿论文给你思路!
快速高效文本到图像生成模型
基于文本到图像扩散模型的文本到视频生成架构研究
CityDreamer: 生成逼真多样的无界3D城市布局
CycleGan模型在图像合成中有什么优点?计算机博士手把手带你做开源项目实战!
通过触觉生成视觉场景的研究
LivePhoto:基于文本引导运动控制的真实图像动画生成
动态3D高斯分布与合成扩散模型:实现文本到4D动画的生成
基于上下文调整的检索增强生成方法
基于文本生成高质量、多样化的3D资产的研究
稳定分数蒸馏:高质量三维生成新方法
基于ChatGPT的模板生成方法用于图像分类
动物伪装研究: 评估和生成有效的伪装图像和视频
PATHFINDER:基于树搜索的多步推理路径生成方法
图像生成美学优化方法研究
大规模语言模型在多模态音乐理解与生成中的应用
面向大型语言模型的有约束文本生成方法
Toward Joint Language Modeling for Speech Units and Text
基于扩散模型的文本到图像合成
FreeControl:实现任意文本到图像扩散模型的无训练空间控制
基于共享注意力的风格一致图像生成方法
TextGenSHAP:面向长文本的可扩展生成解释方法
FineControlNet:基于空间对齐文本控制注入的图像生成细粒度文本控制
人体高斯模型:文本驱动的三维人体生成与高斯密度调控
基于扩散模型的可控4D引导视频生成
开源指令生成:用开源代码提升代码生成模型性能
开箱即用的文本理解大模型
基于双语文本的Skywork-13B大型语言模型研究
区域描述生成:轻量级增强交互式分割模型
大规模语言模型结合神经符号模型的生成型神经符号视觉推理
基于科学图像分析GPT-Vision的生成能力和局限性
文本到图像一致性模型的有条件控制策略研究
这六大神经网络竟然被他一次讲透彻了!CNN/RNN/GAN/GNN/LSTM/Transformer,草履虫都能看懂的原理与实战!
大学没学会的神经网络,被他一次讲明白了!CNN.RNN.GAN.GNN.Transformer 五大最火神经网络入门到实战一次学透彻了!