英伟达展示最新 AI 成果 GauGAN,涂鸦秒变风景图

3月19日,英伟达在 GTC 2019 上展示了最新的深度学习模型——GauGAN,其运用了生成对抗网络 (GAN),能够将一幅涂鸦变为以假乱真的风景图。根据视频演示,工作人员在软件左边的绘图区勾勒了数笔,右边就几乎实时生成了与之对应的画面,效果十分惊艳。这项研究成果能让设计师快速创作艺术构想,也能让普通人体验到绘画的乐趣。

GauGAN 提供了三种绘图工具:油漆桶、画笔、铅笔。下方是各种素材,选择一种作图,软件就会生成对应的图像。这并不是简单的用材质填充,而是会根据输入的形状产生独特的结果。比如选择云朵素材画一个圆,就会生成一朵轻飘飘的夏日浮云。选择树木素材画一条直线,会生成一根树干,再在上面画一个圆,就会生成树枝和树叶,成为一颗完整的树。软件还引入了随机数机制,避免相同的输入总是生成相同的结果。

GauGAN 使用的神经网络经过数百万张照片的训练,能够理解画面中的各项元素,从而能将涂鸦中的图形用自然的真实事物填入。从演示中可以看到,GauGAN 甚至能正确地生成景物的倒影。GauGAN 还能考虑事物的相关性,若把草地改成雪地,之前画的树木就会从枝繁叶茂变得枯萎。

为了能够实时生成结果,GauGAN 必须运行在张量计算平台上。在这次展示中,Nvidia 使用了 RTX Titan GPU,保证了实时计算所需的算力。应用深度学习研究组副主席 Bryan Catanzaro 表示,经过一些修改,GauGAN 也可运行在几乎任何平台上,只不过需要花上几秒钟才能显示结果。

观看演示视频:https://www.bilibili.com/video/av46730573

(0)

相关推荐