雷锋网 AI科技评论按:作为国际公认的语音识别专家,洪小文于1995年加入微软,在1998年曾参与微软亚洲研究院的创立。随后洪小文又被调回西雅图总部,成为微软公司自然交互服务部门的创始成员,并担任架构师。2004年他重回北京,担任微软亚洲研究院副院长;2007年,担任院长。2014年,继张亚勤之后兼任微软亚太研发集团主席。2015年,担任微软公司全球资深副总裁。
而在这些职位的背后,洪小文博士在学术领域也影响颇大。洪小文博士是IEEE Fellow,微软杰出首席科学家和国际公认的语音识别专家,且在国际著名学术刊物及大会发表百余篇学术论文,著作《语音技术处理》一书被全世界多所大学采用为语音技术教学课本。此外,他在多个技术领域还拥有36项专利发明。
一面是微软的高层管理人员,另一面是学术界的巨擘,洪小文博士无论在AI的哲学层面、技术层面还是应用层面,都有很深刻的思考。
近日,在微软亚洲研究院与哈工大共同举办的第十九届“二十一世纪的计算”国际学术研讨会(21CCC)上,洪小文博士出席该会议并做了特邀演讲。雷锋网AI科技评论记者有幸采访了洪小文博士,并探讨了包括人工智能的缺点、AI技术落地所需考虑的四个方面,微软在AI的方向、中国与美国在人工智能上的异同以及语音方面未来发展方向。以下为洪小文就这几个问题的观点,分享给大家:
内容速览:
1、当前人工智能的发展主要基于大数据,这是一种以繁制繁的方式,未来发展会趋向于小数据,甚至无数据的人工智能。
2、人工智能研究成果的落地能够给企业带来的价值主要体现在四个方面:能否让你的产品更好、能否增进你与客户之间的联系、能否提高企业内部运行的效率以及能否改善员工的工作激情。
3、微软在AI领域主要有两个方向。首先是对AI技术的基础研究、开发和应用,其次是作为一个有情怀和社会责任感的公司去关注AI可能带来的安全、伦理等问题。
4、中国与美国相比,在移动互联网行业已经走在前面,但在基础研究方面与美国相比还有一定差距。除此之外,中国在对人工智能的思考上也有很大的欠缺。
5、语音识别准确率的提升需要多个领域(包括视觉等)的综合。人的智能是全部智能的总和,这也是人工智能发展的一个方向。
注:雷锋网根据采访内容作了不改变原意的精简和编辑。
雷锋网:人的智能和当前AI的智能有什么区别?
洪小文:机器的智能我把它称为以繁制繁,这是机器的强项。我们所谓的深度学习,从广义上来讲,其实就是一种模式识别。机器的这种模式识别,不管是记十个电话号码,还是AlphaGo的下棋,都是一样的,就是死记硬背。
而人的智能则是以简制繁,就是在复杂中找到规律,根据规律来解决问题。如果十个电话号码没有规律,别说十个,一个可能都不记得;但如果找到了规律就很容易了。
我们人一直在讲智慧,最高境界其实就是化繁为简。“吾道一以贯之”,这不就是化繁为简吗,我只要一个道理就可以破所有的功。人的智慧是这个,而不是以繁制繁。以繁制繁是一种智慧,但不是最高智慧。
爱因斯坦当年几乎是从零数据提出了引力波,一百年后我们才勉勉强强测到。我们今天所谓的AI都是要大数据,至少目前还看不出AI能做到基于小数据或者零数据的预测。未来可能会有,但从应用的角度来看,短时间之内是很难做出很了不起的应用的,反而是大数据的应用会很快。
雷锋网(公众号:雷锋网):现在AI的实际落地给企业带来的价值体现在哪些方面?
洪小文:在微软我们把它叫做数字化转型。为什么这样说呢?因为今天有用的AI一定要和数据、计算绑在一起的。你就想从有计算机到现在,哪样东西变成数字化了?支付数字化,我们跟人的社交网络数字化,买卖行为、电子商务所有这些都是数字化,更不要说物联网了,它把以前没有数字化的东西全部数字化了进来。数字化以后就可以做分析,所以我们把它叫做数字化转型。
这里面的落地对企业(也包括任何单位,下面统一用“组织”),我们认为至少有下面四点:
第一、每个组织一定有个产品,怎样用AI(+大数据)迭代让你的产品越来越好。这里产品是广义的,例如学校的产品就是教育,政府的产品就是服务市民。
第二、每个组织一定有用户,怎样用AI(+大数据)促进组织和组织的用户进行连接。这里的用户也是广义的,例如学校的用户就是学生,政府的用户就是市民。不管你是2B还是2C都会有用户。和用户进行连接,从消极的角度来讲,当你的用户有各种问题的时候,你要及时服务他们;从积极的角度来讲,怎么让你的用户自愿地帮你们得到更大的影响。
第三、怎样利用AI(+大数据)提高组织内部运营的效率、效能。
第四、怎样利用AI(+大数据)提高员工的生活质量、激发员工的创造力。我觉得任何一个公司到最后最大的资产就是员工,所以如何用这个东西帮助你的员工将事业和家庭都照顾好,并能够激发员工的创造力,非常重要。
雷锋网:微软未来关注的AI的研究方向是哪些?
洪小文:分几块。
一块是现在既有的AI的理论、系统和重要的AI的技术。比如说感知,感知里面有语音、自然语言、视觉,这些东西都是现在兵家必争之地,我们继续在做;当然还有跟各种应用的结合,这些都是今天在做的东西了。
另一个就是做AI的研究单位。例如今天的AI都是大数据,那么小数据怎么做,甚至无数据怎么做?我们研究院在这些方面有一些新的想法,也在做。
还有一块不是纯技术的,我们在美国有一个Partnership on AI。现在我们的数据变得非常重要,一个人如果有了内线交易的数据,他不管用什么笨方法都一定是赚钱的,但有可能他是非法的,所以数据的监管就变得非常重要。现在越来越多的人重视这方面。尤其是今天所谓的大头(企业)们,我觉得不是他们拥有什么AI的技术,而是他们拥有的数据。所以你有什么样的数据,你要负什么责任,什么东西可以做,什么东西不可以做,这个都必须规定清楚,成立Partnership on AI就是来探讨这些问题的,到底什么是AI for Good。我觉得这个东西在未来我们必须要认真探讨的,而且这个问题可能比技术问题更难,因为它牵扯到人,牵扯到政策的制定、政府、社会学、心理学、人类学、经济,它对我们的影响是全方面的。
雷锋网:您如何看人工智能在美国和中国的差异?
洪小文:从应用上来看,我认为差异上不大。唯一的差别是中国在移动互联网上有一些方面的确是领先世界的,像移动支付以及微信里面一些很新的社交网络的用法。大体上来讲,尤其是现在世界又是通的,大家看到这些应用,总是会想想怎么把它用过去,所以说这方面的差别不一定大。
研究上来讲,我觉得应用型的创新、应用型的研究中国不缺,但是中国对基础的研究比起美国还是相对少一点的。这个是好坏兼有的。毕竟中国的发展多半做很多事情背后是有经济动机的,在这些方面也影响到了我们对于基础研究的投入可能不够。现在很多人在讲这个,但只是在讲,我希望他们真正去解决这个现状,包括公司和个人。
此外,高科技对社会的影响方面,我觉得在中国讨论得还不够多。这一方面是好,因为中国对高科技非常向往,而且非常正面,所以对高科技公司的发展非常有利。但如果你留意西方的话,很多关于高科技负面的声音都出来了,最近有一个本书,一个教授很深度地在讨论这方面的问题。他担心我们这些所谓的高科技公司什么东西都强调算法,而算法本身是机械化的东西,你喜欢一条新闻,我就专门给你推送类似的新闻,到最后我们就失去了灵魂。
雷锋网:现在语音技术面对的还有哪些比较大的挑战?未来会怎么发展?
洪小文:语音的挑战永远存在,因为真正要做到百分之百的语音识别,我认为是个AI complete问题,就是只有解决了其他AI的问题才有可能解决语音的问题。
一个明显的例子,在语音里面有个叫做“鸡尾酒效应”。你去参加一个鸡尾酒会,周围非常嘈杂,每个人都在讲话,即使我离你很近,可能很多时候还是听不清你在讲什么,你讲的话里面十个字有九个字我都没有听清,可是因为你讲的内容我大概知道,所以即使我连音都听不清楚,我还是能够猜出你讲的是什么。
但今天用任何语音识别的方法一定失败。在上面的例子中我们人用了太多所谓的常识,以及对对方的了解,有时候甚至会比手画脚。这其实就类似于把所有的AI都用上了。所以,人的智能事实上是全部智能的总和。我们人真的没有只靠耳朵。
所以如何将各个方面的东西,包括视觉的、文字的、知识的智能综合起来使用,不仅仅是语音的挑战,也是人工智能未来的挑战,这也是大家在讲的通用人工智能。目前这个很难做。
相关文章:
扒一扒陆奇、沈向洋、李开复、 洪小文四人在CMU和职业生涯早期的故事
洪小文撰文: 人工智能正在与机器学习、大数据构成一个足以改变未来的技术“铁三角”
二十一世纪的计算 | 微软亚洲研究院洪小文54页PPT讲述人工智能和人类智能的 “共进化”
图灵奖获得者John Hopcroft:理性看待AI浪潮,下次革命或许还需要另外40年 | 21CCC
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/128867.html