[GAN进展，真实感人图片生成] 3DHumanGAN，上海人工智能实验室与商汤提出3D-Aware的真实感人全身图片生成方法

发布人

3DHumanGAN: Towards Photo-realistic 3D-Aware Human Image Generation

Zhuoqian Yang（上海人工智能实验室）, Shikai Li(商汤), Wayne Wu（上海人工智能实验室，商汤）, Bo Dai（上海人工智能实验室）

项目地址：https://3dhumangan.github.io/
GitHub地址：https://github.com/3dhumangan/3DHumanGAN（即将发布代码）

我们提出3DHumanGAN, 一个三维感知的GAN方法，它可以在不同的视角和身体姿态下生成一致表现的人体全身图片。为了解决人体关节结构合成的表达和计算复杂度问题，我们提出了一个新的，由3D姿态映射网络调制的2D卷积骨架合成架构。3D姿态映射网络是一个以3D人体网格为条件而构建的可渲染隐函数。这个设计有多个好处，i) 它可以让我们用到2D GAN生成真实感图片的能力，ii)它可以在不同的视角和可被指定的姿态生成一致的图片，iii) 模型可以从3D人体先验中获益。我们的模型是从一组网络图片中学习而得到的，不需要人工标注。

We present 3DHumanGAN, a 3D-aware generative adversarial network (GAN) that synthesizes images of full-body humans with consistent appearances under different view-angles and body-poses. To tackle the representational and computational challenges in synthesizing the articulated structure of human bodies, we propose a novel generator architecture in which a 2D convolutional backbone is modulated by a 3D pose mapping network. The 3D pose mapping network is formulated as a renderable implicit function conditioned on a posed 3D human mesh. This design has several merits: i) it allows us to harness the power of 2D GANs to generate photo-realistic images; ii) it generates consistent images under varying view-angles and specifiable poses; iii) the model can benefit from the 3D human prior. Our model is adversarially learned from a collection of web images needless of manual annotation.

打开封面下载高清视频观看高清视频视频下载器

[GAN进展，真实感人图片生成] 3DHumanGAN，上海人工智能实验室与商汤提出3D-Aware的真实感人全身图片生成方法

[NeRF进展，动画方向] 东京大学在同年提出与我国CageNeRF类似的NeRF动画控制方法，同步了解别人的想法（ECCV 2022)

[NeRF进展，Talking Head应用] 清华大学、鉴智机器人提出DFRF，快速小样本生成高真实感、自然的讲话头，可用于数字人等（ECCV 2022）

[NeRF进展，风格化与重着色，NPR方向]东京大学使用一种新的Palette提取方法，使NeRF重着色可达到实时性能，实现NPR效果（EGSR 2022）

教你从零开始用GAN生成图片（用自制的深度学习系统）

[文本转3D，群友工作] 南京大学提出AvatarBooth，新的文本或图片生成高质量3D Avatar的框架，拍摄的脸或身体照片即可生成，可支持二次编辑

[Neural Rendering]Facebook Reality Lab提出AutoAvatar，推进神经场技术到真实人体动效生成领域(ECCV 2022)

[NeRF进展，文本生成3D] Google，Ben、Jonathan提出DreamBooth3D，DreamBooth+DreamFusion，文本生成3D

[NeRF进展，文本转3D，20221228发表]腾讯ARC Lab、PCG，上海科技大学等提出Dream3D，使用文本转形状+CLIP，提升文本转3D效果

[NeRF进展，场景天气风格化渲染]UIUC、浙江大学，马里兰大学提出ClimateNeRF，在NeRF场景中融合天气物理渲染，实现真实感天气场景渲染效果

[Diffusion生成点云，开源]OpenAI开源大招Point-E，通过文本生成3D point cloud的方法，快速有效地生成多样化复杂的3D模型

[NeRF进展，使用事件相机生成高质量NeRF] 马克思普朗克研究院，萨尔大学提出EventNeRF，使用事件相机生成高质量NeRF，低功耗、低数据量、快速重建

[NeRF进展，人脸动画，褶皱渲染] 华沙工业大学、UBC、微软、Google等提出BlendFields，在少量数据下，结合图形学方法，生成细节表情动画

[NeRF进展，肖像光照] 中科院、北交大、香港城市大学提出NeRFFaceLighting，使用三平面解决人物肖像的3D感知的真实感光照效果，并达到实时处理

[NeRF进展，2D图片生成3D人体] 南洋理工大学提出EVA3D，通过使用人体的分解NeRF表达，使用2D图片集训练生成高质量3D人体模型

[NeRF进展，点云重建] 捷克理工大学提出Tetra-NeRF，使用点云为输入，使用四面体和其德劳内表达进行重建，实现更好的重建性能和效果

[NeRF+Mesh进展，城市场景建模] nVidia，多伦多大学等提出FEGR，结合Mesh，将复杂几何和材质与光照效果分离，实现真实感光照效果，以及场景操控

[Diffusion+Transformer，人体动画进展] 阿里达摩院刚刚提出一个统一的预训练扩散模型MoFusion，用于人体动画合成 (arXiv)

[神经渲染，自动驾驶方向] Waabi，多大，MIT提出UniSim，一种神经sensor模拟器，可以用从录制结果生成真实的close-loop多传感器仿真效果

[神经材质压缩] nVidia杀疯了，提出NTC，使用神经压缩算法压缩纹理压缩，在增加了两层LOD后，不需要熵编码的情况下低码率压缩，解码只增加毫秒级消耗

[NeRF进展，自动数据收集] INSA, UCBL, Meta提出AutoNeRF，一种不需要人工干预的自动agent，采集NeRF训练数据，协助完成下游任务

[NeRF进展，few-shot重建，群友工作] UCLA, nVidia提出FreeNeRF，一个关键观察触发了一个极简的优化，使少量视角重建效果大幅度提升

[NeRF进展，时变3D模型] 浙大，康奈尔，特拉维夫提出neusc，使用网上地标照片，重建可独立控制视点、光照和时间的真实感时变三维模型

[NeRF，场景语义建模与应用]Meta提出SSDNeRF，首个通用NeRF场景语义分割方法，将场景按语议分割建模，让NeRF二次编辑、丰富动画场景变为可能

[NeRF进展，Avatar实时生成] 苏黎世I联邦理工，普朗克研究所提出InstantAvatar，相比SOTA方法速度提升130倍以上，秒级别训练，实时渲染

[3DGS进展] UCSD，nVidia，伯克利提出CF-3DGS，连续处理视频帧数据，在剧烈相机运动的情况下渐进重建整个场景

[NeRF进展，使用不同场景时期图片重建NeRF] 华盛顿大学、Google Research提出PersonNeRF，灵活使用各场景、时期图片重建人物NeRF

[Transformer进展，文本生成图片]GoogleAI提出Muse，首次使用Transformer代替Diffusion模型完成文本生成图片，速度快

[NeRF进展，任意拓扑重建] 腾讯提出NeAT，另一个可用于重建衣物等任意拓扑的工作，NeuralUDF姊妹篇，计算量更低，效果的缺陷更小，代码开源（CVPR

[NeRF进展，语义驱动编辑] 浙江大学3DV国家重点实验室联合Google提出SINE，通过语义驱动NeRF编辑，完成多视角高质量、一致性的编辑操作

[NeRF进展，动态系统建模，优于D-NeRF] UCLA、MIT、马里兰大学等提出Pac-NeRF，从多视角视频中提取高动态优物体的几何与物理参数信息

【122集付费】太全了！一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络！比刷剧爽多了，草履虫都能学会！

[点云+神经渲染进展] Apple, CMU, UBC提出Pointersect，给定一个点云，在不转换为其他表达的情况下，进行推理光线与表面相交性

[NeRF进展，高保真3D Avatar生成]香港科技大学、微软研究院提出Rodin，自动高保真、高细节度生成3D Avatar NeRF模型，数字虚拟人再突破

[NeRF进展，鲁棒的动态NeRF]Meta，台湾大学、KAIST、马里兰大学提出RoDynRF，联合预测静态、动态和相机姿态焦点信息提升鲁棒性

[NeRF+Diffusion进展，单图重建3D] 韩国首尔大学提出DITTO-NeRF，使用文字或单图，通过前视角部分3D+迭代扩散填充，生成3D模型

[NeRF进展，单视角3D重建]香港大学、未来智联等联合推出S3-NeRF，挖掘Shading和Shadow信息提升单视角3D重建(NeurIPS 2022)

[NeRF进展，模型任意转换]北航、旷视提出PVD，可以实现任意到任意的模型转化，训练一个NeRF，可以使用框架进行处理（AAAI 2023)

[Diffusion进展，文本转视频]新加坡国立大学、腾讯ARC实验室提出Tune-A-Video，使用文本生成图片模型One-Shot精调至视频，效果很棒

[NeRF+点云，点云渲染] 香港中文大学、思谋科技提出Point2Pix，使用NeRF将点云渲染为真实感图像的方法，并可完成点云inpainting和上采样

[Generative AI进展]Adobe，特拉维夫大学，CMU提出一种使用已训练生成模型和目标概念，直接生成目标域内容的方法，可批量生成大量效果