黄仁勋亲自撰文怼上 TPU：P40速度比你快 2 倍，带宽是你的 10 倍

雷锋网(公众号：雷锋网)按：前不久谷歌发布了关于TPU细节的论文，称“TPU 处理速度比当前 GPU 和 CPU 要快 15 到 30 倍”。当时就有人对此种“比较”表示质疑，因其拿来的比较对象并非市场里性能最好的。

而昨晚（美国时间 4 月 10 日）英伟达 CEO 黄仁勋就亲自撰文回应了这一“比较”，文章第一段就以谷歌 TPU 开头，炮击意图十分明显，随后更是扔出了 Tesla P40 GPU 与 TPU 的性能对比图，可谓针尖对麦芒。

不过 P40 和 TPU 的售价差距很大（P40 24GB版本售价5千多美元，TPU 成本估计在几百美元），尺寸和制程也不一样，也有人觉得这样的对比未免也是不恰当的。但黄仁勋不惜亲自撰写长文，摆事实摆数据，意在表明英伟达在 AI 芯片领域的强势姿态和技术领先的骄傲。

当时TPU论文甫一发布，雷锋网就论文中的比较对象问题咨询了AI人士意见，感兴趣的读者可戳《谷歌公布TPU细节之后，AI业界怎么看？》。以下为黄仁勋发表全文，原文标题为“AI 驱动数据中心加速计算的崛起”（AI Drives the Rise of Accelerated Computing in Data Centers），由雷锋网编译。

谷歌最近的TPU论文给出了一个十分明确的结论：如果没有高速计算能力，大规模AI实现根本不可能。

如今的世界经济运行在全球的数据中心之上，而数据中心也在急剧发生改变。不久之前，数据中心服务支撑网页、广告和视频。现在，它们能够从视频流里识别声音、检测图片，还能随时让我们获得想要的信息。

以上提到的各种能力，都在愈来愈依靠深度学习来支撑。深度学习是一种算法，从海量数据里学习形成软件，来处理诸多高难度挑战，包括翻译、癌症诊断、自动驾驶等等。这场由AI引发的变革，正在以一种前所未有的速度影响着各种行业。

深度学习的开拓者Geoffrey Hinton最近在接受《纽约客》采访时说道：“凡是任何一个有很多数据的分类问题，都可以用深度学习的方法来解决。深度学习有几千种应用。”

不可思议的效果

以谷歌为例。谷歌在深度学习里突破性的工作引发了全球关注：Google Now 语音交互系统令人吃惊的精确性、AlphaGo在围棋领域历史性的胜利、谷歌翻译应用于100种语言。

深度学习已经达到了不可思议的效果。但是深度学习的方法，要求计算机在摩尔定律放缓的时代背景下，精确处理海量数据。深度学习是一种全新的计算模型，它也需要一种全新计算架构的诞生。

一段时间以来，这种 AI 计算模型都是运行于英伟达芯片之上。2010 年，研究员 Dan Ciresan 当时在瑞士 Juergen Schmidhuber 教授的 AI 实验室工作，他发现英伟达 GPU 芯片可以被用来训练深度神经网络，比 CPU 的速度快 50 倍。一年之后，Schmidhuber 教授的实验室又使用 GPU 开发了世界上首个纯深度神经网络，一举赢得国际手写识别和计算机视觉比赛的冠军。接着，在 2012 年，多伦多大学的硕士生 Alex Krizhevsky 使用了两个 GPU，赢得了如今蜚声国际的 ImageNet 图像识别竞赛。（Schmidhuber教授曾经写过一篇文章，全面梳理了运行于GPU之上的深度学习对于当代计算机视觉的影响 http://people.idsia.ch/~juergen/computer-vision-contests-won-by-gpu-cnns.html）

深度学习优化

全球的 AI 研究员都发现了，英伟达为计算机图形和超级计算应用所设计的 GPU 加速计算模型，是深度学习的理想之选。深度学习应用，比如 3D 图形，医疗成像、分子动力学、量子化学和气象模拟等，都是一种线性代数算法，需要进行大规模并行张量或多维向量计算。诞生于 2009 年的英伟达 Kepler GPU 架构，虽然帮助唤醒了世界在深度学习中使用 GPU 加速计算，但其诞生之初并非为深度学习量身定制的。

所以，我们必须开发出新一代GPU架构，首先是 Maxwell，接着是 Pascal，这两种架构都对深度学习进行了特定的优化。在Kepler Tesla K80 之后四年，基于 Pascal 架构的 Tesla P40 推理加速器诞生了，它的推理性能是前者的 26 倍，远远超过了摩尔定律的预期。

在这一时期，谷歌也设计了一款定制化的加速器芯片，名为“张量处理单元”，即 TPU。具体针对数据推理，于 2015 年部署。

上周，谷歌团队发布了关于 TPU 优越性的一些信息，称 TPU 比 K80 的推理性能高出 13 倍。但是，谷歌并没有拿 TPU 与如今最新一代的 Pascal P40 做比较。

黄仁勋亲自撰文怼上 TPU：P40速度比你快 2 倍，带宽是你的 10 倍

不可思议的效果

深度学习优化

最新对比

发表回复

黄仁勋亲自撰文怼上 TPU：P40速度比你快 2 倍，带宽是你的 10 倍

不可思议的效果

深度学习优化

最新对比

相关推荐

发表回复