英特尔Xe HPG Alchemist GPU详解:台积电6nm工艺 2022年1季度上市

0-1.jpg

(图 via WCCFTech

英特尔表示:作为本次架构变革的一部分,其重新定义了“计算构建块”,并将之作为 Xe 架构的基础。

0-2.jpg

该公司还借此机会更新了一些命名,比如大家不再听到所谓的“执行单元”(EU)。理由是随着数字变得越来越大,代际之间的推理对比都会变得相当麻烦。

1.jpg

Xe GPU 核心中包括了高效的算数、缓存、负载存储逻辑等单元,其中算术单元整合了用于传统浮点、整数向量运算,以及用于加速、卷积和矩阵运算的引擎,此类引擎在 AI 工作负载中较为常见。

2.jpg

参照新的标准,一个基础的 Xe Alchemist GPU 核心单元,将拥有 16 组“向量引擎”(256 bit)和 16 组“矩阵引擎”(1024 bit)。

6.jpg

每个 Xe Core 都有自己的专用采样器、几何图形、缓存,以及共享的像素后端。4 个 Xe 核心单元(Xe Core)将构成一个渲染切片(Render Slice),且每个渲染切片也都有自己的光线追踪(RT)单元。

7.jpg

初代 Xe HPG GPU 将拥有 8 个切片,每个由 4 个 Xe Core 组成,总计 512(8×4×16)的向量 / 矩阵。

8.jpg

对于技术爱好者来说,这点与之前的执行单元(EU)也没有多大差别。假设基础架构是相通的,那它还是 4096 个 ALLU(512*8)。

4.jpg

台积电业务发展高级副总裁 Kevin Zhang 博士

值得一提的是,为追求更高的 GPU 性能 / 功耗表现,台积电对英特尔 Alchemist 独显选择了该公司的 N6 制程工艺表示相当欢迎。

5.jpg

借助台积电 N6 工艺,Alchemist GPU 将可在性能、密度和能效之间实现最佳的平衡,是现代 GPU 代工的理想选择。

9.jpg

如果一切顺利,采用台积电 N6 工艺制造的英特尔 Xe HPG 产品线,将具有能耗和晶体管密度方面的显著优势,从而在正式上市时取得不错的销量。

10.jpg

据悉,英特尔 Xe HPG 架构将能够实现 1.5 倍于 Xe LP 的时钟速率,且每瓦性能也是后者的 1.5 倍。

11.jpg

鉴于 Xe LP GPU 已经跑到 1.4 GHz,这意味着我们有望迎来 2.1 GHz 的 Xe HPG GPU 时钟速率。

12.jpg

另一方面,英特尔也将能够在不消耗额外功耗的情况下,从新架构中榨取出更多的性能。或在性能不变的基础上,降低新一代 GPU 的功耗。

13.jpg

访问购买页面:

英特尔旗舰店

相关文章:

英特尔详解Ponte Vecchio Xe HPC GPU A0芯片设计

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/97521.html

(0)
上一篇 2021年8月20日 12:05
下一篇 2021年8月20日 12:05

相关推荐

发表回复

登录后才能评论