雷锋网(公众号:雷锋网) AI 科技评论按:这是一个关于 AI 的自画像的故事。
AI 应该长什么样子?人们给出常见的答案不外乎是:像个机器人,像一组闪烁的 LED 灯,或者像电脑屏幕上一组变幻莫测的波形。那么在 AI 的眼中,一个 AI 应该长什么样子呢?
一个直接的了解办法大概是让 AI 给自己画一张自画像。比如下面这张。
这张图是 IBM 的研究人员让 AI 画的一张自画像,它发表在了 10 月 19 日的纽约时报上。
纽约时报 9 月下旬联系到了 IBM 研究院,希望他们可以帮忙想想如何用一种特殊的方式让 AI 生成一幅艺术作品,以便用在他们的十月 AI 特辑上。时间不多,也无法提前决断最后的效果,他们决定让 AI 创作原创作品。而任务目标是高层次抽象的——要展现 AI 中的一项重要概念,创作一幅能展示出这个概念的原创作品,并且它呈现出的视觉风格还要与纽约时报相符。
“自画像”这件事情对 AI 来说有点耐人寻味。毕竟,AI 总是我们身边的那个看不见摸不着的信息处理工具,它能分析路况转化成驾驶指令(自动驾驶汽车)、能把图像信号变成位置和概率输出(图像识别)、能把数字化后的连续波形信号转换成离散的文字符号(语音识别),但这些任务都不需要 AI 创造任何新的材料,它只是根据训练过程学习到的数据模式分析输入、产生输出而已。即便我们如今在图像和语义理解上已经有了不小的进步,也仍然很难想象如何让 AI 「思考自己看起来长什么样」。
如今面对着这幅作品,在外行眼中有种老生常谈的味道,因为看起来只不过是(AI 和人的)手拉手动作的数字化涂鸦展示。但看过我们以下的创作流程介绍之后,内行就会会心一笑——这还真的是用深度学习时代的标准方法,把 AI 和人类的能力结合起来,让 AI 画了一幅自画像呢。
第一步:在 AI 中找到某一个核心的视觉概念
-
找到过去发表在纽约时报上的大约三千篇关于 AI 的文章;
-
用自然语言处理工具分析这些文章,找到与 AI 有关的、有区分度的、有语义概念的前三十项;
-
训练一个用于视觉识别的神经网络,它会在图像中识别这前三十项概念;
-
找到纽约时报中所有直接描述或者蕴含 AI 意味的图片,用这个网络给这些图像评分;
-
在评分前 10 的图像中,参与项目的研究员、工程师、艺术家们选出了一张他们认为贴切的:一张人和机器人握手的画面;
第二步:创作一幅捕捉到了这个 AI 概念的原创图像
-
构建了一个超过 1000 张图像组成的数据集,图像内容是人的手和机械手
-
用数据集训练一个对抗性生成式网络(GAN),让它绘制了一幅包含人的手和机械手的新图像;这个过程消耗了 7 个日夜;
第三步:用符合纽约时报的视觉风格呈现它
-
收集了一些往期的纽约时报封面图像,训练了一个图像风格转换网络;
-
用这个网络对刚才绘制的包含人的手和机械手的图像做自动风格转换,以便匹配纽约时报封面的“视觉语言”
-
根据总体的概念清晰度和艺术风格,选出了一张最终的图像 —— 也就是开篇那张。
这是一个典型的融合了 AI 的计算能力和人类的艺术创造、判断能力的流程,而且它也可以用来生成其它领域的艺术作品。
而且,也正与图像内容展示的、正与这个创作过程表示出的一样,人类与 AI 的共同未来应当是携手的、互助的,而不是此消彼长的、对抗的。
via www.ibm.com ,雷锋网 AI 科技评论编译。文章有改动。雷锋网
雷锋网版权文章,未经授权禁止转载。详情见。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/134559.html