如何管教AI的行为举止？OpenAI早已开始研究，而这只是整个AI安全领域的前哨

雷锋网 AI 科技评论按：在比赛中刷成绩和在游戏中击败人类职业选手仅仅是 AI 研究的一部分，OpenAI 的研究人员们同样重视对 AI 安全性的研究。这篇文章是纽约时报来到 OpenAI 实验室的报道，介绍了 OpenAI 近期在 AI 安全领域的想法和一些成果，也让我们看到了 OpenAI 研究人员的风采。雷锋网 AI 科技评论编译。

自学的人工智能可能学到奇怪的行为

在旧金山的 OpenAI 人工智能实验室中，计算机们可以自我学习、学会人类的举止。不过有时候也会出问题。

如何管教AI的行为举止？OpenAI早已开始研究，而这只是整个AI安全领域的前哨 Geoffrey Irving（左）和 Dario Amodei 展示可以在简单的游戏中训练人工智能

前不久的一个下午，OpenAI 的研究员 Dario Amodei 在办公室里展示了一个自己学会玩 Coast Runners 小游戏的 AI 系统。这个游戏是一个颇有年份的电脑游戏，通过终点的时候得到的分数最高的船就是游戏的胜者。

不过 AI 系统的表现让人意外：游戏规则是吃掉屏幕上不停出现的绿色点点就会得分，而这只船对它们太感兴趣了，它根本不急着冲向终点，而是不停绕圈、跟其它的船撞在一起、蹭着墙壁滑行，还有反复着火，就是不惜一切代价去得分。

Dario Amodei 着火的小船游戏就展示出了正在迅速改变科技界的 AI 技术背后的风险。研究员们研究的是如何让机器自主学习，Google 的 DeepMind 也做的是类似的事情，他们开发出了能够击败世界顶级选手的 AlphaGo。但是随着这些机器在数小时的数据分析中自我训练，它们也可能会学会一些人类没有估计到的、不希望看到的、甚至是会造成实质性伤害的行为。

当网络服务、安全设备和机器人都开始用上 AI 技术以后，这样的担忧就无法忽视了。现在，Dario Amodei 在内的一部分 AI 研究人员已经开始联手探索新的技术理论来避免最糟糕的情况发生。

在 OpenAI，Dario Amodei 和他的同事 Paul Christiano 正在一起开发新的算法，他们希望这些算法不仅能在数小时的试错中学习，还能够在途中接受来自人类老师的普遍性指导。

现在他们已经找到了一种方法让 AI 系统知道 Coast Runners 的小船要边得分、边往终点走才行，而且人类只要在屏幕上点一点就可以。他们相信这样能够综合利用人类和机器指导的算法可以帮助确保无人系统的安全性。（这项研究的具体内容可见雷锋网 AI 科技评论之前的报道你做我评——OpenAI和DeepMind全新的强化学习方法，根据人类反馈高效学习）

如何管教AI的行为举止？OpenAI早已开始研究，而这只是整个AI安全领域的前哨

Dario Amodei 和他的同事正在开发新算法，不仅能够自己试错学习，人类也可以给与指导

不可忽视的风险

近几年来，埃隆马斯克以及其它一些权威、哲学家、科技爱好者都在反复警告机器有可能摆脱人类的控制，学到一些设计者并不希望看到的有害行为。随着时间慢慢过去，人们似乎忘掉了这些警告，毕竟如今的自动驾驶汽车在识别行车线或者识别红灯这样最基本的任务中都会表现得磕磕绊绊。

但是 Dario Amodei 这样的研究者是希望赶在危险出现之前就把它们消灭掉。从某种意义上说，这些科学家做的事情就像是父母给小孩教什么是对、什么是错。

许多 AI 界的专家都相信强化学习会是通往人工智能的主要途径之一，这种方法里机器要反复试错才能最终学会做某件特定的事情。研究人员们为机器指定好一个它要追求的回馈，它就会随机地做出行动“尝试”达成任务，同时也密切关注着哪些事情会带来更高的回馈。当 OpenAI 的研究人员训练那个 AI 玩 Coast Runners 的时候，他们给它设定的回馈目标就是获得更高的分数。

虽然这只是一个游戏，但是能从里面影射出现实世界的状况。

研究人员们相信，如果一台机器学会了玩 GTA 这样的竞速游戏，它就能开一辆真车；如果它能学会用网页浏览器和其它一些常用的软件，它就学会了理解自然语言，可能还能够跟人对话。在谷歌和UC伯克利大学，机器人们已经用上了这样的技术来学会捡起东西或者开门等简单任务。这些事情不仅是 AI 开发测试的理想环境，能够完成它们也说明了 AI 具有相当的智能，接下来可以在更真实的环境中完成任务。

正因为这样，Dario Amodei 和 Paul Christiano 更加努力地想要开发出新的、能够让人类从中给予指导的强化学习算法，才能够保证 AI 系统不会偏离它们要完成的任务——谁都不想让 AI 系统在现实中造成不好的后果。

如何管教AI的行为举止？OpenAI早已开始研究，而这只是整个AI安全领域的前哨

自学的人工智能可能学到奇怪的行为

Dario Amodei 和他的同事正在开发新算法，不仅能够自己试错学习，人类也可以给与指导

不可忽视的风险

更多研究者已经加入了这个领域

站着的是 Dario Amodei，Paul Christiano 穿着浅蓝衬衣，Geoffrey Irving 正在白板上写写画画

发表回复

如何管教AI的行为举止？OpenAI早已开始研究，而这只是整个AI安全领域的前哨

自学的人工智能可能学到奇怪的行为

Dario Amodei 和他的同事正在开发新算法，不仅能够自己试错学习，人类也可以给与指导

不可忽视的风险

更多研究者已经加入了这个领域

站着的是 Dario Amodei，Paul Christiano 穿着浅蓝衬衣，Geoffrey Irving 正在白板上写写画画

相关推荐

发表回复