OpenAI发布“宇宙”平台，用1000+训练环境赋予AI“类人智力”

当人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候，Open AI 宣布开源了其新平台“宇宙”（Universe）。这家由伊隆·马斯克资助的非赢利性AI开源组织，在周一的上午搞了个大新闻，相信NIPS的餐桌上一定热闹非凡。当然，Open AI后续也在NIPS的会场展示了自己的成果。

Open AI 联合创始人Greg Brockman 在Twitter上说道，“这个AI 训练架构，是我们从Open AI建立之初就在计划着的”。可见Open AI对这个平台的重视。

那么这个敢以“宇宙”命名的 Universe是个什么东西呢？

掌握人类的“普通智力”

OpenAI官网的介绍是：Universe软件平台，通过全世界的游戏、网页和其它应用，来测量和训练AI的普通智力。

在Universe上，AI智能体像人一样使用电脑：观看视频，并操作键盘和鼠标（只不过是虚拟的）。总而言之：人类可以在网络上做的事情，Universe都可以让AI智能体经历一遍，目的就是训练智能体掌握类似于人类的“普通智力”。

如今的AI技术，已经使计算机能看、能听和翻译，还能产生图像、声音和文本，AlphaGo甚至击败了李世石。

但是如今的AI技术仍然逃脱不了“窄AI”的范畴，也就是说，它可以在某一个特定领域达到超强表现，但是一旦超过这个领域，就无法工作。AlphaGo能在围棋上轻松赢过任何人，但是没法去玩其他的棋类游戏。

而Universe平台，就是为了打破“窄AI”的樊篱而诞生的。其核心架构由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建构。

OpenAI创始人Ilya Sutskever在接受《连线》采访时说道：“一个AI智能体就是应该能够解决你扔给它的任何问题。”这听起来有点过于大胆了，甚至有点“天方夜谭”。但Sutskever将Universe与ImageNet作类比，他认为ImageNet帮助计算机能够像人一样地“看见”，如今谷歌和Facebook的众多app已经可以做到这一点了，而Universe要做的，就是将人工智能朝向每一个维度扩展。

1000+训练环境

早在今年4月，OpenAI 发布了一个名为Gym的工具包，用来开发和比较增强学习算法，包括了众多训练环境（Environments）。如今在Universe上，任何一个程序都可以转变成一个Gym环境。

今天发布的Universe，可以在1000多个环境里运行，包括Flash 游戏、浏览器任务等。Universe 搞定了 Valve 和 Microsoft这样的游戏巨头，获得了游戏授权。

（Universe平台的部分合作方）

其实在游戏里训练智能体不是新鲜事儿，因为游戏的内容是可控的，有清晰的奖惩机制，所以智能体在其中可以稳定地学习什么可以做，什么不可以做。比如加拿大阿尔伯塔大学提供了经典游戏Atari的学习环境，微软则基于Minecraft游戏打造了Malmo系统。

可以说，从训练智能体这一点来看，视频游戏已经给真实世界带来了积极的影响。

不过相比而言，Universe不仅可以在众多游戏环境里，还能在浏览器任务等任何网络环境里运行，其覆盖面超过了以往任何同类系统。

意义：省钱

DeepMind之前建立了一个可以在Atari游戏里训练的智能体，并使用相似的技术来对谷歌全球数据中心网络进行精细化训练，以此来节省每年数百万美金的成本支出。

Craig Quiter目前是Otto公司的工程师，这家自动驾驶卡车公司今年夏天被Uber收购。在任职Otto之前，Quiter曾参与过Universe的开发工作，由于此前对该平台早已熟悉，他对 Universe“省钱”的功能兴致勃勃，正在打造一个可以玩“侠盗猎车手V”游戏的智能体。

目前Otto的自动驾驶系统可以在相对平稳的环境下运行，但是在未来几年，该公司希望可以随时对路上遭遇的恶劣状况做出反应，而“侠盗猎车手V”里此起彼伏的惊险车况，对于Otto的自动驾驶系统是个很好的训练素材。

Sutskever表示，在长期看来，Universe平台以后甚至可以用于“迁移学习”：智能体把一个场景中学到的东西应用到另一个场景。他表示目前已经在着手建立一些智能体，将一个赛车游戏里学到的东西，应用在新的游戏里。

OPEN AI LAB，这个实验室如何加速人工智能的“进化”？ | 深度

雷锋网原创文章，未经授权禁止转载。详情见转载须知。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/62478.html

OpenAI发布“宇宙”平台，用1000+训练环境赋予AI“类人智力”

掌握人类的“普通智力”

1000+训练环境

意义：省钱

相关推荐

发表回复