编者按:亚马逊首席科学家 Rohit Prasad 接受记者采访,讨论了智能家居 AI 的前景,以及 Echo 和 Alexa 的最近进展。他特别提到,Alexa 作为平台为开发者提供了多项“福利”,包括内置“用户意图”和词库,供开发者整合入他们的软件应用。这意味着,在亚马逊 Alexa 平台上的开发者,可以直接利用 Alexa 的内置工具包使软件应用更智能,极大节约了时间和精力。随着 Echo 的热卖,目前,Alexa 平台已吸引约 5000 名开发者。Alexa 是否会异军突起,成为未来智能家居甚至是物联网的通用平台?
一场冰与火之歌式的 AI 争霸正在科技巨头之间展开,参与者有亚马逊、谷歌、苹果、微软、Facebook 等巨头。吊诡的是,相比雷声大雨点小的竞争对手,AI 产品销路最好的却是那个最低调的公司——亚马逊。亚马逊的数据中心为数千公司提供云服务,它的 Echo 智能音箱在美国上市两年,销量打破 500 万,独立开创了一个全新的产品品类。但近年来亚马逊似乎比苹果还要重视保密,常常对它的 AI 研究三缄其口,而苹果已经在今年早些时候开放了它的机器学习项目。不过,最近亚马逊首席科学家兼 Alexa 项目副总裁 Rohit Prasad 接受了外媒采访,对 Alexa 语音识别和自然语言理解上的技术进展,和智能家居 AI 的前景,做了详细阐述。
亚马逊 Alexa 首席科学家兼副总裁 Rohit Prasad
对于不了解 Alexa 的读者,它是亚马逊明星产品 Echo 上搭载的智能语音助手,更确切的说,是“人机交互平台”,可看作是亚马逊的 “Siri”。
四天前,Rohit Prasad 在拉斯维加斯的亚马逊网络服务大会上,发布了:
-
改进的 Alexa 工具箱(Alexa Skills Kit),以帮助开发者们为 Alexa 平台开发软件应用;
-
大幅提高的 Alexa 语音服务,更加容易得把冰箱汽车之类的第三方设备,变为受 Alexa 控制的“机器人”;
-
亚马逊与英特尔的合作;
-
Alexa 加速项目,通过初创孵化器 Techstars 运营 13 周的培训,帮新人熟悉 Alexa 的功能。
发布会之外,Rohit Prasad 接受了外媒记者 Steven Levy 的采访,对 Alexa 项目的未来发展方向作了详细说明。采访内容如下:
Steven Levy:你是 Alexa 的副总经理,请告诉我 2016 年的项目进展。
Rohit Prasad: 我们对现在的市场反响十分满意。今年我们发布了几个新设备,并且进入新的国际市场。在训练 Alexa 更好地理解用户上面,我们有了巨大进步——不管是 Alexa 的服务范围,还是搜索内容的精确度。比方说,在音乐领域,Alexa 有了新的能力,让用户能根据歌词搜索并播放歌曲。最后,Alexa 的第三方的功能软件以惊人的速度增加,早些时候只有几百个,现在达到 5000 个左右。
你们对Alexa平台的期望是什么?Echo 仅仅是接受用户的命令,还是会成为我们聊天说话的伴侣?
Alexa 已经提供了一系列的功能和体验,对用户的几种单次表达意图有极高的识别率。在对话方面,我们认为把这做好需要做很多妥协。Alexa 不应该问你不相干的问题,这会让用户很烦。但有些问题 Alexa 又必须要问。能够与用户谈话的能力确实非常重要。你知道 Alexa 大奖赛吗(Alexa Prize competition)?
你说的是九月宣布的,对计算机专业学生奖金 250 万美元的挑战?
没错。在学术界进行人机对话研究十分困难,他们没有 Alexa 这样的系统。所以我们把一个改版的 Alexa 工具箱提供给他们,让对话功能的研发更加容易。完成这项超级挑战需要:开发一个社交机器人,要能和人进行有意义、连贯、并且有吸引力的对话。
你认为这会是一个图灵水平的人机对话吗?
不会,图灵测试取决于人的轻信—— AI 是否能欺骗一个陌生人,让其相信它是一个人?在一些特定任务上,Alexa 已经比人类强得多。让人在数百万音乐目录里找出一首歌是极度困难的,对吧?让 Alexa 计算六十次方,人也没法比。所以我们绝对不想让 Alexa 成为图灵测试那样的 AI (这意味着把它的一些能力降低到人类水平)。这更多是连贯性和可参与性的问题。
在 20 分钟的挑战时间中,测试者们会和 Alexa 说些什么呢?
我们会给出一些话题,比如说,“你能说说今天报纸的流行话题吗?”我们希望社交机器人能够在科学发明或者金融危机这样的话题上能和你交谈。
你们收到很多报名了吗?
极其得多,几百个接着几百个地来。我们还在向大学生们提供资助——因为参与挑战的研究生和博士生们要在学业之外花费时间,除非是最理想的情况——该挑战和他们课程的研究高度一致。所以我们想确保他们在高难度的语音应用研究上得到资助。我们收到那么多申请,以至于一开始无法决定十个资助名额该给谁,最后我们资助了十二只团队。
由于大公司对杰出 AI 和机器学习人才的巨大需求,有人担心学界会流失他们的核心人才。
这是一个需要考虑的问题。这也是我建立 Alexa 大奖赛的动机之一。我们希望培养下一代机器学习和 AI 的人才,学术圈会起到重要作用。我认为如果所有教授都去为公司效力将是很短视、很可怕的。
但你们很明显在雇佣 AI 人才,与谷歌、微软、苹果、Facebook 甚至传统企业进行人才竞争。你们用什么吸引那些人才来亚马逊工作呢??
我不认为我应该回答这个问题,其它公司会复制。
但是,如果你回答得好,人们也许会看到然后申请去亚马逊工作。
在亚马逊这样的公司做研究的好处是:数据和计算性能的结合。世界上最聪明的头脑都来这儿,一起解决用户面临的问题。研究怎么解决用户实际问题并不会减少创新,事实上这加速了创新。在亚马逊,我们想要解决的问题都超级难。 在 Alexa 刚开始的时候,解决语音识别和自然语言理解问题跨越了许多领域,这显然就是一个非常难的问题。
今天你们发布了帮助开发者的新工具,是吗?
是的。其中两项我们想为开发者简化的问题是“内置意图”(built-in intent)和“位置种类”(slot types)。
请解释。
大多数功能中,人们想说“ALexa,停下”或者“ALexa,取消命令”。你希望这些命令或者意图被开发者们照顾到,而不需要告诉他们开发这样的定制功能。“位置种类”是类似于城市名称、词汇这样的东西。我们之前做了很多这样的东西,有十个意图和“位置”是开发者们经常用到的。作为第三方开发技能,我们发布了有几百个内置功能的工具箱——它横跨多个领域的“位置种类”,比如书、视频和本地经营,还有一系列的意图来帮助回答人们问 Alexa 的问题。
换句话说,如果我是开发者,我可以靠内置的词库和同义词解释,来让我的功能更智能。而且可以做更多。
的确如此,它给你的交互技术一个更好的起步。我们以开发者预览的形式发布它,有两点原因:1. 我们希望了解人们在意图中是怎么使用这些东西的,这是由于我们对这些意图和种类如何使用有一个明确的思维模型。但是开发者也许有不同想法。消费者们也可能有不同想法。2. 我们希望得到开发者们的反馈,并不断改进。我们会不断增加新内置功能。
目前,当用户唤醒了Echo 的某个技术,Alexa 的思维会在某种程度上转移给开发者的 app 。看起来,你们今天做的这些东西是为了建立一个 Alexa 词库和执行方式的标准,让开发者们能够直接利用,是这样吗?
你说的完全正确。这创造了一个共同的词库,帮助分享和改进 Alexa。开发者们可以整合这些功能所以他们不需要再做一遍同样的工作。
对我来说,使用 Alexa 的问题是它的功能太多。一般来说,你需要知道一个功能的存在来触发它,现在已经有了 5000 个功能并且还在不断增加,用户们怎么跟得上呢?
我们绝对希望 Alexa 能通过第三方应用告诉你怎么做,即使你并不知道相关功能。我们还没有试过这个,但这绝对在我们的路线图上。建立一个共同的词库能帮助我们走到那一步。
亚马逊并不是唯一一家用 AI 打造交互式对话平台的公司。你们的方法独特在哪?
没有手部控制是关键,这是语音的王牌应用。如果你说的“独特”指的是 Alexa 和 Echo,我们并没有试图逃避无屏交互难题(内心大吼:它们没有屏幕!)。在“谈话交互应该怎么是什么样子”这个问题上,我们的想法在一开始就和其它公司不一样:它不应该和智能手机一个样,它是一个应对专门场景的设备,而且不会有屏幕。我们必须解决这个难题。
那些担心时刻开启的麦克风所带来的隐私风险的用户呢?对于“天啊,亚马逊一直在听我说话”这样的用户,你们怎么说?
隐私非常关键,我们一直在该问题上十分透明。亚马逊云平台并没有一直在听你的动静,那只是 Echo 设备。而且 Echo 起到的是“探测”作用,它不是一个识别所有词语的的识别装置。它在探测用户是否说了 “Alexa”(让 Echo 执行命令需要对它喊“Alexa”)。只有它确信用户对它说了“Alexa”的时候,我们才开始用到云端。
Alexa 会变得像 Google Now 或者 Apple 消息通知那样主动吗?比方说,当它听见我在房间里瞎搞,它会提醒我该出门了,不然今天的会面我会迟到?
我们确实想过这点。但 Echo 没有屏幕,实现该功能会有一些挑战。对于任何涉及信息通知的功能,我们希望把它做成该做的样子。现在还不能透漏我们采用的方式。
目前,人们不得不为他们的智能助手选择一种谈话交互方式(某一家公司的 AI 系统)。有朝一日,我们能否看到 Alexa、微软小冰,Google Home, Samsung Viv 或者其他任何 AI 系统相互协作呢?
对于这类对话装置来说,现在还很早。我看到这类技术已经超过 20 年了,现在仍感觉 Alexa 和 Echo 是革命性的东西,尤其在交互上。我认为这(多 AI 协作)需要将来再说。每个公司都有不同的一套东西,你可以未来想象将会有多套 AI 系统。至于它们之间能否协作,现在还不能判断。
Echo 智能音箱, 和它的 Alexa 技术,对大多数普通消费者来说是新奇事物。一开始人们还以为这是亚马逊一种快速购物的方式。现在它已经成为亚马逊最受欢迎的产品之一,并且是一个非常重要的平台,你们的项目使命有没有发生变化呢?
我不会这么说。基本上,我们仍然在做着三年前我们所说的、应该做的事。只不过现在要让 Alexa 在用户面前变得更有魔力。
via backchannel
【招聘】雷锋网坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力,翻译及写作能力优良的外翻编辑加入。工作地点深圳。简历投递至 guoyixin@leiphone.com 。
相关文章:
雷峰网原创文章,未经授权禁止转载。详情见。
原创文章,作者:kirin,如若转载,请注明出处:https://blog.ytso.com/216935.html