单目三维重建 输入图像 3D形状 纹理 可控合成 动画片 重新照明 纹理交换 Farm3D 完全通过基于 2D 扩散的图像生成器的“自由”虚拟监督来学习铰接式对象类别。我们提出了一个框架,该框架采用图像生成器(例如稳定扩散)来生成用于从头开始学习重建网络的训练数据。此外,扩散模型被纳入作为评分机制以进一步改进学习。我们的方法产生了一个单目重建网络,能够在几秒钟内从单个输入图像(无论是真实的还是生成的)生成可控的 3D 资源。 我们提示对对象类别的虚拟视图进行稳定扩散,然后将其用于训练单目铰接对象重建模型,该模型将对象实例的输入图像分解为铰接形状、外观(反照率、漫反射和环境强度)、视点和光线方向。在训练期间,我们还对合成实例视图进行采样,然后通过稳定扩散进行“批评”以指导学习。 尽管没有接受任何真实图像的训练,Farm3D 仍可以重建各种类别的形状,直至其精细的细节,例如腿和耳朵。 我们的方法能够从真实图像或使用稳定扩散合成的图像生成可控的 3D 资产。一旦生成,我们就能够调整光照、在同一类别的模型之间交换纹理,甚至为形状设置动画。 输入图像 动画片 输入图像 动画片 输入图像 动画片 输入图像 雷利特 输入图像 雷利特 输入图像 雷利特 输入图像 纹理图像 纹理交换 输入图像 纹理图像 纹理交换 我们引入了新的 3D 关节动物数据集来直接评估关节动物的单视图 3D 重建的质量。该数据集包括由专业 3D 艺术家制作的马、牛和羊等铰接动物的纹理 3D 网格,并伴有逼真的铰接姿势。Farm3D:通过提取 2D 扩散来学习铰接式 3D 动物
方法
单视图 3D 重建
可控 3D 形状合成
动画片
重新照明
纹理交换
3D 关节动物数据集和基准