Intel GPU多年来的基本模块一直都是“执行单元”(EU),这次变成了全新的“Xe核心”(Xe Core),包含矢量和矩阵(张量)ALU单元、零级和一级缓存、载入存储单元等等。
大致看来,Intel Xe核心的组织方式有点像NVIDIA SM,只是少了纹理单元,当然内部结构肯定是迥异的。
Xe核心内有16个矢量单元,或者叫矢量引擎,每个每时钟周期可处理256位,又可细分为8个FP32 ALU单元,因此每个Xe核心每时钟周期颗处理器128个FP32操作。
同时还有16个矩阵数学单元,或者叫矩阵引擎(XMX),处理矩阵、张量操作,每个每时钟周期可处理1024位,可以是64个FP16操作,也可以是128个INT8操作。
Xe核心的上一层级是“渲染切片”(Render Slice),专为DX12 Ultimate设计,每个包含4个Xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、2个像素后端。
值得一提的是,光追部分支持DirectX光追(DXR)、Vulkan光追。
Alchemist DG2 GPU包含最多8个渲染切片,共享大容量二级缓存。
不过架构图上并未画出PCIe控制器、多媒体引擎、显示控制器等固定功能单元,但我们知道,它会首发支持DisplayPort 2.0。
这颗GPU将交给台积电代工,采用后者的N6 6nm工艺,也就是7nm的优化升级版。
台积电对此也是相当兴奋,称将为Intel GPU提供优化的性能、密度、能效平衡。
Intel宣称,通过架构、逻辑设计、电路设计、制程工艺技术、软件的全方位优化,相比于Xe LP微架构,Xe HPG微架构可以实现1.5倍的频率提升、1.5倍的能效提升。
照此推算,Alchemist显卡的频率应该在2GHz左右,FP32算力大约16.4TFlops,是之前DG1低功耗独显的几乎8倍。
当然,软件开发是释放硬件设计潜力的关键,这方面Intel也是倾尽全力,并公布了最新的进展。
目前,Intel正与开发人员密切合作,进行Xe微架构的设计,力求与行业标准保持一致。
驱动程序也在统一的代码库中涵盖集成、独立显卡,Intel称第一款高性能游戏显卡将性能和质量放在首位。
同时,Intel已经完成了内核显卡驱动程序组件的重新架构,特别是内存管理器、编译器,号称计算密集型游戏的吞吐量平均提高了15%,最多可达80%,而游戏加载时间缩短了25%。
Alchemist只是Intel高性能显卡的第一步,接下来还会有基于第二代、第三代Xe HPG微架构的Battlemage、Celestial,然后将是全新下一代Xe架构的Druid。
访问购买页面:
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/97128.html