凭借科技巨头们的推动,AI技术在新一轮的AI浪潮中更加普及,并进一步引发了围绕AI芯片、AI算法、大数据的创业热潮。由于英伟达的GPU是承载这一轮AI浪潮的关键因素之一,同时也为英伟达带来了不错的营收。因此,AI芯片的初创公司绝大部分都表示要挑战英伟达。
不过,即将在今年第三季推出AI芯片的中国初创公司天数智芯,不仅已经凭借其企业级的软件平台产品及解决方案产生了营收,还表示:他们更想比拼的是另一科技巨头Google,这是为何?
不只看到AI热潮的AI创业公司
天数智芯于2015年在南京成立,从成立时间上看,这是一家AI热潮中创立的公司,但其CEO李云鹏创立公司时看到的不仅仅有AI。2002年李云鹏从南京大学计算机系毕业后到美国威斯康辛州大学麦迪逊校区(University of Wisconsin-Madison)攻读计算机硕士学位,2005年毕业后他选择在硅谷工作,进入了美国甲骨文(Oracle)公司总部。
天数智芯CEO李云鹏
天数智芯CEO李云鹏接受雷锋网采访时表示:“AI确实给了我们一个很重要的弯道超车的机会。不过和许多有技术背景的工程师的想法一样,能从更基础的层面提升国家的软实力是我选择回国和创业的初衷。”
“从2005年到2015年的十年间,中国的基础设施的硬实力在不断完善,软实力也在逐步提升。值得关注的是,虽然2006年起国内就开始发展‘核高基‘(核心电子器件、高端通用芯片、基础软件产品),但基础软件对海外的依赖程度依然很高。我恰好在基础软件行业有十年的技术积累,这是让我当初选择回国创业的重要原因。”李云鹏进一步表示。
其实从2014年开始,越来越多的海外华人工程师选择回国,一方面是看到了中国快速发展与美国平稳发展之间的差异,另一方面是他们在海外积累的经验和技术在国内能够有更大的施展空间,还有就是AI热潮能使华人工程师们更容易获得创业所需的资本。
李云鹏就是海外工程师回国热潮中的一员,作为创业者,他深度思考了AI与提升软实力愿景之间的关系。他表示:“AI是某一类型算法的统称,算法迭代的速度很快,但基础性产品的迭代周期又很长,这两者之间有矛盾。对于一家公司而言,能够成功的关键是20年后我们的产品是否还流行。因此,我们的基础软硬件系统需要具备通用、标准、高性能的特性,同时,从AI的角度切入,提升软件和硬件的算力。”
“杀手锏”AI软件算力平台产品已带来可观营收
任何一家公司的产品都会与创始人的经历和背景产生密不可分的联系,初创公司在这一点上体现得更为明显。既然想要为中国的软实力提升贡献力量,创始人又有10年在甲骨文的工作经历,天数智芯首先推出的自然是软件算力平台产品。
李云鹏指出,我们专注在以AI为代表的计算提供基础性支撑;即承接已有开发者生态基础上,着力于计算性能的提升。谈到性能,就必须站在计算机系统的角度来看待整个计算的过程:在多数场景中,性能的瓶颈并未发生在处理器端,而是在IO子系统或者是网络等其它子系统上。天数智芯的软件算力平台产品的主要着力点便是尽可能的将计算瓶颈从其它子系统挪到处理器端,进而充分发挥处理器的算力,从整体上带来系统性能的提升。
在实现方式上,天数智芯在操作系统和计算机体系结构层面,在计算的基础算子、内存管理、数据本身的逻辑/物理存储等方面,针对数据处理的共性特征进行专门性优化,相对底层的技术实现,能够灵活的承接各种各样的中间件(如开源计算框架平台)。因此,天数智芯的“杀手锏”是透明迁移。
所谓透明迁移,就是凡是使用开源计算框架进行数据处理的公司,想要使用天数智芯的平台软件产品,不需要改动一行应用代码,便可以实现无缝对接,最大程度的发挥整个计算机硬件系统的计算能力。
李云鹏强调了透明迁移的重要性。他举了一个例子,国内某互联网巨头在为一个新零售方案寻找英伟达GPU的替代方案时,天数智芯采用其自研的一款AI芯片产品的FPGA模拟原型向用户进行展示,在一行代码都不改的前提下满足了客户所有的需求,用户对该方案的认可度甚至远超对其他成熟的芯片公司和AI芯片公司方案的认可。
现在,天数智芯自主研发出了大数据机器学习平台“SkyDiscovery”和面向智能计算的应用服务云平台“SkyACC”,并分别研发了“SkyFront智能设备健康管理系统”、“SkyDataLab人工智能教学实验平台”,这些系统已经应用到了高校、钢轨探伤、EPR一体化管控、轨道交通设备安全运维等领域。
李云鹏表示:“公司在2018年年中之前都处于‘野蛮生长’的阶段,这个野蛮生长主要是技术版图和产品线的野蛮生长,接下来将是天数智芯在市场销售方面的快速增长。”他还同时透露,天数智芯的营收应达到甚至超过了某些头部AI芯片初创公司的水平。
不过,天数智芯软件平台的意义还不止于此。李云鹏认为,软件在某种意义上代表着生态。因为软件是接入生态最有效和方便的方式,当有很多客户使用的时候,就能够产生所谓的生态。以AI为代表的数据驱动时代,我认为是开源的生态,因此我们不去破坏已有的开源生态,而是去提升软件性能的承接功能。这是我们已经在做的,当软件让AI的瓶颈尽量靠近处理器的时候,想要进一步提升就需要优化处理器。
软件向下延伸,明年推出AI云端芯片
雷锋网了解到,李云鹏在2015年一篇内部的发展战略中写道,通过软件技术,将计算机系统的算力提升,将已有的硬件能力发挥到极致,实现算力均值的提升。当时机成熟的时候,将以FPGA或ASIC的方式,把市场上的芯片难以完成的工作交给到我们的芯片部门去做。
“没想到,才两年时间时机就来了。“李云鹏接受采访时发出了这样的感慨。他表示,随着摩尔定律逼近极限,已有的处理器都面临不同的挑战。2017年年中时,我们希望找一家处理器芯片公司合作芯片进一步提升算力,但发现能够找到的AI芯片厂商都专注于神经网络类算法的加速领域,并不具备通用属性(即细粒度的可编程性),无法满足我们的诉求。此时刚好有一群芯片领域的专家对我说与其找人合作,不如自己研发。因此,短短三个月,天数智芯的芯片事业部就横空出世。如今芯片团队已经有150多人,分别位于上海和美国硅谷。成员大多在GPU设计领域埋头耕耘多年,并历经AMD、Nvidia、Qualcomm等芯片巨头的洗礼。
之所以能如此快速地建立起芯片团队,李云鹏认为,一方面是这些专家希望有新的平台去实现一些在原有公司不能实现的想法,另一方面是公司已经通过软件获得了一些客户,他们不用担心设计出来的产品没有客户和持续迭代。
天数智芯的终极算力武器,是一款基于自主IP架构的、云端高性能GPGPU计算芯片。在云端AI芯片市场,英伟达和英特尔有着难以撼动的地位,一些初创公司曾尝试进入但最终都放弃了。对此,李云鹏表示,云端市场代表相对稳定的需求,而且生态相对终端也更成熟和完善,因此更容易获得稳定和持续的客户。终端市场与消费者联系更加紧密,相应的需求变化较快,风险也更大, 对自身技术实力的信心,是天数智芯立志云端芯片的基础。
但天数智芯为何还计划在2019年第三季度推出第一代边缘端AI芯片EPU?雷锋网认为,一方面,其IP核完全自主研发,虽然团队中的核心成员有丰富的经验,但为降低风险仍需要验证,毕竟芯片的研发和流片成本非常高昂,严谨谨慎是明智的决定。另一方面,通过相同架构但更简单的终端AI芯片去验证IP是否可以达到预期,并获得市场的反馈,为云端AI芯片的推出积累经验。
那么,天数智芯的云端AI芯片如何与市场上同类产品竞争?李云鹏表示,从通用计算支持角度,我们的芯片产品和市场上最成熟的英伟达产品去比拼是最直接的。天数智芯将在2020年推出的云端GPGPU Big Island基于自有的细粒度可编程、可扩展和可配置的计算IP。我们的Big Island与英伟达的GPU最大的不同在于没有图形渲染的功能,更通俗来讲就是我们的GPGPU不能打游戏。Big Island与其他AI芯片产品的区别是,Big Island除了AI计算还能做其他的数据计算,而单纯的AI芯片只能做AI计算。
由此,带来了两大方面的优势。一方面是GPGPU能够更好的做并行计算(适合深度学习),并且可以在同等算力的情况下降低能耗,这是数据中心中最大的问题。另一方面是没有图形渲染功能可以在一定程度上降低开发的难度,同时也能缩短开发时间。相对标准的图形处理器GPU,BI技术门槛是降低的,然而并不是低到没有门槛。李云鹏表示,我们的目标是“跳起来,刚刚够得着”!
天数智芯的GPGPU在其配套系统软件上,选择兼容CUDA的技术路线。面向数据中心的高端计算芯片,最大的市场挑战便是生态:通过兼容CUDA,能够让想要采用新一代高功耗比(Performance per watt)芯片的用户以更低的成本和更简单的方式进行迁移,这是竞争的关键。
雷锋网了解到,除了面向云端训练和推理的高性能AI芯片以及5-10瓦级的终端AI芯片,天数智芯未来还可能根据市场的需求推出面向边缘云的AI芯片。需要指出的是,由于天数智芯的AI芯片更强调通用性。在通用性和面向AI的专用性的“鱼和熊掌“之间,天数智芯选择了一个动态的技术平衡点。
为何不对标英伟达?
至此,我们就更容易理解为何天数智芯会推出云端和终端的AI芯片,但却要比拼谷歌。如果从云计算的IaaS、PaaS、SaaS层对比英伟达和谷歌的产品布局,可以发现英伟达的产品主要是集中在IaaS层,而谷歌的产品则非常全面。李云鹏表示,我们更愿意成为像谷歌那样有系统能力的公司。我认为,AI时代软件与硬件的结合将会更加紧密,其中软件是场景的关键,肩负开拓市场和创造直观价值的重任,硬件是基石和推动着,是技术实力和降低成本的关键因素。
“软硬一体的优势十分明显,一方面,通过软件我们可以很快了解客户的需求,将其共性需求有效地反馈给芯片设计,为芯片设计这一技术驱动的部门带来市场的拉力。另一方面,具备系统能力,从终端到云端,从IaaS层到PaaS层,都是使用同一套系统,能够带来一致且良好的用户体验。“李云鹏进一步指出。
那么在芯片层面天数智芯的GPGPU是否是谷歌TPU的直接竞品?李云鹏表示,和Google比,更多的是产品栈和技术创新的类比。在芯片具体架构和技术上,天数智芯的GPGPU是成熟的大规模并行计算架构,而TPU是脉动阵列架构,两者存在差异。
显然,想要成为一家具备系统能力的公司困难重重,获得足够多的客户构建生态本身就是一件非常困难的事情,此时选择进入的领域至关重要。李云鹏表示:“基于人脸识别的AI芯片的落地已经被许多创业公司探索得非常成功。我们看好的是一些貌似传统,但实则具备数字产业化转型的行业:在2016年就开始进入高端制造、新能源等行业。“
他进一步表示,对于制造业和新能源行业的公司,他们的设备健康对安全生产、运营维护等方面至关重要。如果能通过AI有效减少重复的劳动力,就已经很好的发挥了AI的价值。如果能进一步提升效率,给出预判以及问题的原因,那将实现更大的价值。
但为何天数智芯能够进入这些领域?李云鹏表示,过去三年我们已经与教育、轨道、高端制造、新能源领域的合作伙伴进行了非常密切的合作,我们将自己的技术优势和他们的需求进行结合,为这些行业的客户提供他们所需的智能数据解决方案,用AI提升效率。另外,这些行业的壁垒相对较高,如果不了解行业的痛点和需求很难进入。相比其他公司,我们的商业团队对这些行业客户需求的深刻理解是我们的优势。
还有值得一提的是,为了解决AI人才稀缺的问题,天数智芯将会开源自己的IP。李云鹏表示,这么做是希望科研院所能够有一套产品可以去练手,希望能够增加这个行业的人才。
不过,雷锋网(公众号:雷锋网)认为如果他们的整套产品能够得到科研院所的使用,除了有利于AI人才的培养,从长远看更是为天数智芯生态的壮大埋下了种子。
雷锋网小结
天数智芯虽然是AI时代的创业公司,但CEO李云鹏创业的愿景不仅仅局限于AI,而是希望能够从更基础的层面为提升中国的软实力贡献一份力量。基于李云鹏Oracle十年的软件技术积累,天数智芯从提升软件算力上入手,把软件作为承载其生态的关键。在通过软件把AI或者说AI大数据分析的问题移到靠近处理器的时候,适时推出AI芯片,通过软件加硬件的方式不仅提升算力的均值,还将提升算力的峰值。由于此时已经通过可透明迁移的软件平台获取了客户,如果芯片表现达到预期,后续硬件的迭代将进一步增强其实力,以特定领域的应用获得认可,再以通用的芯片向更多应用领域拓展。
这是一个逻辑清晰,且目标远大的计划。从目前的情况来看天数智芯已经取得了阶段性的胜利,至于向前迈进一步的时候能否取得成功,我们让产品和市场来投票。最后,借用李云鹏接受采访时所说:“芯片,特别是云端芯片,需要有超过20年的生命力。单一的性能指标不是芯片公司成功的唯一条件,技术产品的商业成功既需要有效融合生态的软件能力,又需要具备为客户解决痛点,创造价值的商业思维”。
相关文章:
集产品、方案和云服务为一体,天数智芯如何做到“AI时代芯魂合一”
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/64994.html