雷锋网 AI 科技评论按:2017年6月21日至22日,腾讯·云+未来峰会在深圳举行。在昨天主题为“机器学习:创新视角,直面挑战”的演讲 – 雷锋网后,雷锋网(公众号:雷锋网) AI 科技评论在内的多家媒体共同对演讲者人工智能泰斗迈克尔·欧文·乔丹(Michael I.Jordan)进行了采访。
与演讲中一样,这位UC伯克利计算机系教授,美国科学院、工程院、美国艺术与科学院三院院士认为人工智能/机器学习能帮助解决不少人类的问题,但是前路还有很多问题等待人类来解决。另一方面,对于现在火热的神经网络/深度学习,迈克尔·乔丹教授认为机器学习的范畴很大,神经网络只是其中的一类方法;未来的人工智能如果要更可靠、更强大,单独只靠神经网络是远远不够的。
以下为采访现场实录,雷锋网 AI 科技评论听译。
记者提问:深度学习现在已经愈发火热,有人认为深度学习已经在某些应用中取代了传统的机器学习算法。在您看来,在深度学习未来的训练、算法优化中,有哪些亟待解决的问题?
迈克尔·乔丹:深度学习只是一种方法,它没法解决所有的问题。还有许多别的机器学习算法,比如集群算法、因果推理算法、多重选择算法等等,机器学习范畴里有很多的方法可以用。当你有大量的带标签数据、想要得到一个输出映射的时候,深度学习就很适合。但机器学习可以解决的问题有很多,并不局限于这一种。而且深度学习的解释性很差,很难跟人解释它在做什么。它效果非常好的领域主要是模式识别,比如给计算机音频视频加上标签,这个标签就是我们要的结果。类似这样的问题有很多,不一样的问题也有很多。所以我觉得机器学习是那个更大的范围,那么深度学习,架构上看它有很多层,但是还有很多别的架构也有许多层的,比如决策树、图模型,用在其它的方面。所以我觉得未来我们还是会探索更大的空间,而不是仅仅关注一两种方法。
记者提问:人工智能的最新发展也从仿生学受到启发,我们可以从人类和动物身上学到更好的解决方案。从您的研究看来,我们还能做更好吗?
迈克尔·乔丹:我觉得我们的研究不是受仿生学启发的,不是的。我觉得梯度下降,或者叫做反向传播,是让这些大型系统具有优秀表现的最重要的算法。那么梯度下降、反向传播就跟大脑的工作方式很不一样,它不是来自于大脑的启发,而是来自于数学。所以我们要小心来自神经科学方面的限制,神经科学中研究的是具有复杂空间分布的神经细胞,它们可以有穿透或者非线性的行为,它们之间的连接方式无比复杂。我们对神经还没有研究清楚呢,所以在我看来(说深度学习网络像动物神经细胞间的连接)只是一种比喻,除此之外的说法都有问题。如果真的是那样的话,我们其实应该模仿动物的神经细胞才对,虽然也有人那样做,但是没有取得什么进展。所以我们走到今天这一步靠的是数学、计算机等方面的原理,而不是靠仿生学。
记者提问:深度学习仍然是机器学习的主流工具,不过也有人觉得不应该过早孤注一掷。相比需要大量数据的深度学习,也有像概率编程这样典型的使用少量数据的例子。那么您怎么看人工智能研究目前的同质化现象,您对不断出现的新方法是如何看待的?
迈克尔·乔丹:如果我们看看现代机器学习库的话,比如基于Spark的机器学习库,里面有各种各样的方法,它们都有各自的作用,比如用矩阵谱、集群算法以一定方法建立推荐系统,比邻的方法也可以用来解决一些问题,增强学习也经常可以转换成一个大规模的树搜索。所以确实,用到神经网络和反向传播的稠密矩阵操作是非常有用的,比如NVIDIA就有各种需要的软硬件可以支持各种不同的方法,它确实能支持深度学习,但是如果我要解决的问题范畴里标签的数量很少,比如文本,我只是想要识别一段不带标签的文本的特征,我可能用语言学分配方法就够了,这就是一种人们在这个范畴中用来找到文字重点的方法。说这么多你应该懂了,深度学习不是唯一可行的方法。虽然给它制造专用的GPU、TPU确实重要,可以支持很多种不同的应用。但是我们想要建立下一代的架构,它要能支持树操作、搜索操作、约束下降操作和其它一些需要的语言学操作,而不仅仅是一层层的矩阵。
记者提问:您如何看待中国的AI潮流?您认为腾讯能在其中扮演怎样的角色?
迈克尔·乔丹:我对腾讯的情况不太清楚,不太好评价,我只知道外界看来他们除了社交网络外还有很大一块娱乐和游戏业务。在现在这个阶段,有游戏和娱乐的环境,就可以模拟出一个虚拟世界,在里面得到准确的事实,从而生成真实世界可能无法得到的标签;而且可以在强化学习方面起到帮助,在虚拟世界里面可以做海量的搜索;或者还有其它方法,都可以大规模地使用我们现有的机器学习技术。还可以在虚拟世界中尝试一些真实世界中可能会伤害到人类的技术。利用内在的游戏技术可以探索机器学习方面的新想法,这很重要,腾讯看起来似乎也有很大的自然优势。
记者提问:大数据催生了很多工业应用,许多互联网、金融证券巨头都开始涉足AI。您看好AI的前景吗?
迈克尔·乔丹:人们对AI的期待太高了。语言方面的期待是最高的,许多人都觉得聊天机器人会发展得像人差不多,不过我不太相信,我觉得聊天机器人对世界的理解是没办法跟人类相提并论的,比如理解上下文、理解语言的发展——以前是如何表达的、如何理解可能发生的事情——人类有对事情的预见,针对不同的环境可以建立不同的计划、运用举例类比比喻。我小孩今年5岁就可以做到所有这些事情,但是人工智能很长一段时间都做不到这些。人们期待人工智能的智力水平可以达到小孩的程度,但是小孩能做的事情也很多啊,所以这是做不到的。这方面的期待太高了。另外人们还期待AI系统可以在某些方面比人类更聪明,但是我们永远都不会让机器人成为决策者,比如做CEO、CTO之类的,它们没有对世界的那种微妙的理解,没办法抽象地做推理,没法面对不确定性的事情还做出优秀的决定,没有好的直觉。所以我觉得人们期待人工智能做这些,不是那么理性。
记者提问:我们期待人工智能除了做计算性的思考,还可以做推理和决策。您认为大数据在这些方面能发挥作用吗?
迈克尔·乔丹:大数据是必须的,但是只有大数据还不够。借助大数据,很多以前做不对的细节现在可以做对了,但是这不代表你就能清楚地观察全局、能理解抽象的概念、能做长期的推理、能改变事情发生的可能性、对事情做出预见。所以,其实推理是很难的,在多步骤的、具有不确定性的状况下,人类能做得非常好,但是人工智能系统就需要用大量的数据反复训练,然后才能在某些步骤中模仿人类,但这还是没办法达到人类的水平。
记者提问:那有没有新的算法可以达到更好的效果呢?
迈克尔·乔丹:没有,据我所知还没有什么那样的神奇算法。肯定还需要几十年的研究,要有更好的算法、更好的工程技术做出的更好的模拟器、用正确的方式收集数据、建立起大型的合作机构比如企业,付出努力解决关键的问题。在这个过程中会有越来越好的算法出现,有可能会有突破性的算法出现,不过我也不确定会不会出现,我觉得都不是很必要。会有突破的是,新的组织数据、组织决策、组织以往信息的方式,然后与人类协作,让人类成为其中一环,让机器学习变得更好,达成人类的目标。你得明白,计算机视觉、语音识别这样的技术就是在最近的30年里慢慢变得越来越好的。我们感觉到明显变好了,但这都是基于以往的经验一步步过来的。未来很多方面的发展也会是这样。
记者提问:MIT科技评论有篇文章中提到过“AI内心的黑暗秘密”,他们的意思是,没有人知道最先进的算法工作的时候具体是怎么工作的。美国国防部甚至认为可解释性是AI发展的一大挡路石。您是怎么看的?
迈克尔·乔丹:解释性是众多问题之一。还有鲁棒性、安全性、语义性、抽象性等等许多问题,解释性只是其中一个。如果某个领域内对神经网络最大的担忧是它的解释性的话,那也许就这时候就不应该用神经网络,而应该用决策树,解释性要强得多。决策树是沿着路径往下走的,人类可以理解路径上的每一步,而且可以根据不同状况做出不同决定,用事情发生的前后关系做判断。不过它的性能就不如神经网络那么好了,但是也不错。还有一些领域如果有足够的数据也可以用随机森林-多选择决策树,它的效果和神经网络差不多,而且也可以用在对解释性要求更好的场合里。对做决策来说,人类决策的解释性比决策树还要好得多,人类可以预见到应该考虑什么、没有考虑什么,还能解释出为什么有东西不需要考虑。我们现有的学习模型都不擅长这些。所以这个确实是一个大问题,不会有一个全新的方法可以横空出世来给神经网络解决这个问题,很难沿着某个路径进行解释,我们只能在神经网络的外围设计别的东西。另外,我觉得总体的来说,单独一个神经网络对大多数问题都不是合适的解决方案,它应该只是一部分,和其它的部分共同协作起来、考虑其它的情境、在周围构建一些其它的架构,才是好的解决方案。
记者提问:您在演讲中提到,我们需要建立一个在正常工作的同时还要能不给人添麻烦、不引发灾难的系统,这样的系统现在有没有呢?
迈克尔·乔丹:这需要深厚的工程能力。比如数据库,人们还没有用机器学习的方法去做数据库,但是银行系统就能很好地工作,全世界的数据库之间不停地进行联络和交易,不仅做到了即时性、还做到了协作性。当我自己全世界旅行的时候,我银行账户里的钱不会跟着我来回交易,但是我和我妻子两个人用同一个账户,一个人在美国取钱,一个人在中国取钱,账户余额还是对的。这样的系统服务着几十亿人,这是惊人的成就,仅仅靠来回发送数据。“这些数据是哪来的”、“在发生了这样一系列事情以后应该如何应对”,数据库系统做的就是这些事,它没有什么学习功能,但是它也需要有智能的基础设施才能让人感到信任、才能保证正确等等。如果把这样的思路和机器学习结合在一起,那就能对什么事情是能发生的、未来会发生什么做出预测。所以,这应该不算是什么突破,但是需要深入的工程研究才能设计出有多种防范能力的系统,然后就有了能判断出相关的信息、能正确选取信息用来做预测的系统。这其中牵扯到很多选择,如果知道在同样的环境中采集到的数据有哪些是可用的,数据库已经为你分析好了,那你就会更信任这样的数据库系统。这就是做预测困难的地方,你在环境中采集到的数据可能和数据库中的不一样,你没办法采集到所有的数据。在真实世界中,你需要知道哪些数据是有关系的,还要知道为什么,然后才能用它们做出预测。所以能做好这个的系统需要多种组成部分,需要有工程化的思考。
采访现场,迈克尔·乔丹教授对待记者们的问题表现得非常耐心和积极,在问答过程中与记者们保持着互动,他的回答热情也越来越高,情绪越来越丰富,语速也越来越快。可惜因为迈克尔·乔丹教授的行程较紧,没法抽出更多时间,采访就匆匆结束了。
迈克尔·乔丹教授的回答中透露出他对机器学习的严谨和热忱,雷锋网 AI 科技评论也会继续对相关信息保持关注。
相关文章:
腾讯优图贾佳亚在“腾讯·云+未来”AI大数据专场分享:计算机视觉有哪三种打开方式?
。
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/126143.html