DeepMind 让 AI 拥有一双人类的眼睛，阴影、遮挡统统难不倒它

雷锋网按：这里是，雷锋字幕组编译的 Two minutes paper 专栏，每周带大家用碎片时间阅览前沿技术，了解AI领域的最新研究成果。

原标题： DeepMind's AI Learns To See – Two Minute Papers#263

翻译 | 祁晓君校对 | 陈涛整理 | 余杭 MY

这是一篇关于神经渲染的DeepMind论文，这种基于学习的技术为了使机器以人类的方式看事物。它充分理解关于几何，视点，阴影，遮挡，甚至是自阴影和自遮挡等等许多复杂的概念。

那么它究竟做了什么以及它究竟是如何正常工作的？

它包含表征和生成网络，表征网络需要保持观察以及一些截图，并将此视觉感官数据编码为包含场景中基础信息的简明描述，这些观察仅来自少数摄像机位置和视点。

神经渲染或观察部分意味着我们选择一个位置和视点。该算法尚未见过，并要求生成网络创建一个合适的图像来与现实相结合。

现在，我们必须暂时坚持我们的论文，并理解为什么这是一个如此疯狂的想法。计算机图形学研究人员非常努力地创建类似的渲染和光模拟，这需要大量计算能力来计算光传输所有方面的程序，然后返回了一张美丽的图片。如果我们略微改变摄像机角度就必须重复做大量相同的计算，以彻底猜测信息的剩余部分。

DeepMind 让 AI 拥有一双人类的眼睛，阴影、遮挡统统难不倒它

通过依靠这两个网络学到的东西，它可以很好地概括，甚至可以处理以前未被观察到的场景。我在神经渲染器上工作了大约3000个小时，并创建了一个可以完美预测逼真图像的AIO：不同之处在于它采用的是固定的摄像机视点，并预测对象的样子。

如果我们开始改变其材料属性的话，这两件作品的结合是非常令人兴奋的。

视频描述中有一个链接到这两个作品，您能想到这些技术的其他可能用途吗？

雷锋网雷锋网(公众号：雷锋网)

。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/131587.html