把《我的世界》马赛克变成逼真大片！这项AI研究令人想入非非

2024-08-06 20:09:00

《我的世界》真是太好玩了！

在这款游戏中，我可以变成光帮助迪迦奥特曼一起打怪兽！

然鹅我想要更真实的奥特曼图像怎么办。

能不能把《我的世界》中的像素块场景世界转换成真实世界的逼真图案呢？

能！如下图所示，《我的世界》中的一座海岛就被成功转换了：

这就是来自NVIDIA和康奈尔大学的新研究GANcraft，最近刚在GTC 2021主题演讲中进行过展示。

论文链接：https://arxiv.org/abs/2104.07659

项目主页：https://nvlabs.github.io/GANcraft/

1

GANcraft介绍

GANcraft是一个无监督3D神经渲染框架，它可以将游戏《我的世界/Minecraft》方块世界转换为与视图一致的逼真的世界！

该方法通过使用GAN预训练网络生成“伪ground truths”，可以学习在没有成对的《我的世界》真实数据的情况下执行此转换。

转换之后的海岛细节清晰可见：

仔细观察还可以发现就连小花和小草也被逼真还原出来了：

换一座树木葱葱的海岛试试也行：

再换一个沙土多的海岛：

雪地场景也可以轻松转换：

GANcraft甚至可以改变并输出世界的不同风格！

可以看出，GANcraft的追求是能把每个《我的世界》玩家都变成一个3D艺术家！

2

背后技术原理

假设已经有一个合适的体素条件神经渲染模型，它能够表示真实的照片世界。

这时仍然需要一种方法来训练它而不需要任何ground truth图像。

对抗训练是一个不错的选择，它在小规模、无条件的神经渲染任务中取得了一定的成功。然而，对于GANcraft来说，这个问题更具挑战性。

与真实世界相比，《我的世界》中的方块世界通常具有完全不同的标签分布。例如，有些场景完全被雪、沙或水覆盖；在一个小区域内，也有跨越多个生物群落的场景。

此外，当从神经渲染模型中随机抽取视图时，不可能将采样的视角分布与网络照片的分布相匹配。

如第一行所示，由于任务的复杂性，使用网络照片进行对抗性训练会导致不真实的结果。而生成和使用伪ground truth进行训练正是本文工作的主要贡献之一，它显著提高了生成结果（第二行）。

生成伪ground truth

伪ground truth是使用预训练的SPADE模型从分割掩模（mask）生成的照片级真实感图像。当分割掩模从块世界采样时，伪ground truth与从相同视图生成的图像共享相同的标签和视角姿势。

这不仅减少了标签和视角分布的不匹配，而且允许研究者使用更强的损失，例如感知和L2损失，来进行更快、更稳定的训练。

混合体素条件（Voxel-conditional）神经渲染

在GANcraft中，研究者使用三维渲染器和二维图像空间渲染器的组合来表示照片级真实感场景。研究者首先定义了一个以体素为边界的神经辐射场：给定一个方块世界，将一个可学习的特征向量分配给块的每个角，并使用三线性插值来定义体素内任意位置的位置代码。

然后可以使用MLP隐式地定义辐射场，MLP将位置代码、语义标签和共享样式代码作为输入，并生成点特征（类似于辐射度）及其体积密度。

只要再给定📷视角参数，我们就能对辐射场进行渲染得到二维特征图，并通过CNN将其转换为图像。

下图展示了完整的GANcraft 架构：

上面这种两级结构在减少计算量和内存占用的同时显著提高了图像质量，因为辐射场可以用更简单的MLP建模，这是基于隐式体积方法的计算瓶颈。

上面提出的架构能够处理非常大的世界，在本文的实验中，研究人员使用了512×512×256大小的体素网格，相当于现实世界中的65英亩或32个足球场。

神经天空穹顶

天空是照片真实感不可或缺的重要组成部分，然而以往基于体素的神经渲染方法无法模拟无限远处的天空。在GANcraft中，研究人员使用一个额外的MLP来模拟天空。

MLP将视角光线方向转换为与辐射场中的点特征具有相同维数的特征向量。此特征向量用作光线上完全不透明的最终样本，并根据光线的剩余透射率混合到像素特征中。

如何生成具有多样化外观的图像？

在训练过程中，研究者使用拟真图像作为风格图像，这有助于解释由于重建损失而产生的图像与其对应的伪ground truth 之间的不一致性。在评估过程中，可以通过为GANcraft提供不同样式的图像来控制输出样式。

3

与Baseline模型比较

在下面的示例中，研究者在6个不同的样式图像上线性插值样式代码。比较不同方法的结果，可以立即注意到几个问题：

im2im方法（如MUNIT和SPADE）不能保持视点一致性，因为这些方法不了解三维几何体，并且每个帧都是独立生成的。

wc-vid2vid产生视点一致的视频，但由于块状几何结构和测试域间隙的误差累积，图像质量随时间迅速下降。

NSVF-W也产生了视图一致性的输出，但是结果看起来很枯燥，缺乏细节。

而从下面可以看出GANcraft的结果都是视图一致的，而且质量很高。神经渲染的使用保证了视图的一致性，而模型结构和训练方案的创新导致了前所未有的真实感。

放一起来比较：

好像看起来都很不错，这不禁就令我想入非非了，只转换自然风景图可不能令人满足。

回到文章开头，我想问问这项AI技术啥时候能把奥特曼打怪兽这种场景也给转换一下呢？

我已经迫不及待想要变身了！（那一年我们都变成了光......）

参考链接：

https://www.youtube.com/watch?v=1Hky092CGFQ

https://twitter.com/arunmallya/status/1382860338584952840

https://www.reddit.com/r/MachineLearning/comments/mru35h/r_gancraft_unsupervised_3d_neural_rendering_of

赞 (0)

中国AI专利申请量世界第1；不骂人驾校“教练”上线；AI模仿已逝歌手原创4首歌曲｜AI周报

近日,<中国人工智能发展报告 2020>正式发布.数据显示,过去十年(2011-2020)全球人工智能专利申请量 521264 件,总体上呈逐年上升趋势.报告显示,过去十年,全球人工智能专 ...
做出电影级的 CG 渲染！斯坦福大学研究人员提出神经光图渲染

新智元报道来源:unite ai 编辑:yaxin [新智元导读]近日,斯坦福研究人员发表的一篇论文中,对现有的2个数量级图像进行了改进,展示了通过机器学习管道实现实时CG渲染的几个步骤. ...
非常好用的Python图像增强工具，适用多个框架

小白学视觉 4天前以下文章来源于AI公园 ,作者ronghuaiyang AI公园做一个生产真正有用的AI内容的公众号.点击上方"小白学视觉",选择加"星标"或 ...
【技术综述】深度学习自动构图研究报告

言有三毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人作者 | 言有三(微信号Longlongtogo) 编辑 | 言有三感谢北航的云飞扬,武汉理工大学的贾承丰的辅助今天带来基于深度 ...
(3条消息) matlab 绘制 ROC曲线

编程题目接收操作特征(Receiver Operating Characteristic,ROC)曲线,即通常所讲的ROC Curve,是机器学习领域中常用的分类性能评估曲线,横轴是False Pos ...
世界奇观，顶级大片！

送给最爱的朋友,真的太美了! 我们生活的地球上有很多的美景.城市.山川.河流有些是大自然赐予我们的也有些是人为创造的今天无人机带着大家一起走进我们星球上的那些不为人知的美景喜马拉雅云雾缭 ...
图文：这世界假的太逼真，42句话看透一切

*
手绘世界名景逼真程度堪比照片

艺术Art2021-02-27 19:53:12 这是来自美国画家Nathan Walsh(弥敦·沃尔什)的城市风景拟真绘画.他擅长利用光与影的技巧来营造出逼真的场景,这种方式很容易看出破绽,但是从他 ...
世界上最逼真的机器人：来自英国，走在大街上会被误以为是真人

伴随着科技的日益进步,人工智能进入到我们的生活中,融入我们的世界,机器人便是其中之一.对于机器人来言,性能不必多说,小到扫地机器人,大到下棋.科研机器人,都可以帮我们干活,节省我们的宝贵时间.机器人的 ...
世界上最逼真的蜂鸟机器人问世，或将成为未来与人类共存的最理想飞行器

导读蜂鸟是地球上最灵活的飞行员之一,它们的速度和敏捷性以及悬停的特性一直是机器人界致力于模仿的对象.早在8年前,美国国防高级研究计划局DARPA便研制出一只栩栩如生的蜂鸟机器人,计划将其用于军事行动 ...
太逼真！世界上最逼真的机器狗，专为孤寡老人开发，主打真实和陪伴！

导读一款名叫Tombot的机器狗近日在Kickstarter上进行众筹,它被认为是目前市面上最逼真的机器狗,它的出现将会给机器宠物市场带来怎样的影响呢? 作者:蓝枫编辑:Aliey Tombo ...
一周大事件丨世界上最逼真的植物培根肉、菲律宾第一个植物肉品牌诞生、联合利华计划将植物基销售额扩大到10亿美元以上……

上周大事件回顾液态植物蛋新品牌Crackd在英国商店推出,Apeel Sciences再获3000万美元融资-- 本周看点 1.2021北京米其林指南公布,京兆尹荣登三星 2.中国首度问世- ...
世界上最逼真的折纸龙虾，你能折出来算我输！在家无聊，不妨来挑战一下？（CP图+视频）

疫情在家没事干,不如一起来折纸,折一下,玩一年,不花一分钱--哈哈哈,今天小落给大家带来一款超高难度的,也是目前比较火的一个折纸作品--折纸日本伊势龙虾! 成品展示没错!这个以假乱真的作品,真 ...
纪录片《小小世界》4K 自制国语配音 (AI语音合成）

纪录片《小小世界》4K 自制国语配音 (AI语音合成）