雷锋网在去年9月的《单线程性能提升超50%!Arm新款服务器CPU要靠单核打天下?》文章中介绍了其最新的Neoverse N2和Neoverse V1平台,不过当时Arm并未公布两款新品更多的产品细节,只是表示对比Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余单线程性能提升了40%,Neoverse V1的单线程性能可提升超过50%。
本月初发布最新一代架构Armv9后,Arm本周公布了更多关于Neoverse N2和Neoverse V1的技术细节,还发布了Mesh互联技术Neoverse CMN-700。同时,Arm介绍了更多生态建设方面的进展,包括与腾讯、阿里云、甲骨文等公司合作的进展。
生态建设是Arm向服务器以及基础设施市场拓展的关键,在智能手机市场增速放缓背景下,Arm拓展新市场的节奏似乎也加速了。
Neoverse V1和N2各有绝招
Neoverse V系列的定位是提供最佳性能,整体而言,相比N1,Neoverse V1带来了 50% 的性能提升、1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化。这背后,是Arm迄今为止设计过的最宽微架构,让Neoverse V1能够容纳更多运行中的指令,支持高性能和百万兆级计算等市场应用。
与此同时,Neoverse V1也率先支持了可伸缩矢量扩展(SVE,Scalable Vector Extensions),SVE可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。
Arm基础设施事业部高级副总裁兼总经理Chris Bergey说:“Neoverse V1宽而深的架构,加上 SVE功能将使其在单核性能和通过SVE延长代码存活期等方面占据领先优势,为芯片设计人员提供可实现的灵活性。”
Neoverse V1率先支持了SVE,Neoverse N2则是第一个具备SEV2功能的平台,因为Neoverse N2平台是第一个基于Armv9架构的平台。
Chris Bergey介绍,在诸如机器学习、数字信号处理、多媒体和5G等广泛应用场景中,SVE2除了带来大幅性能提升外,还带来 了SVE 具备的编程简易性及可移植性等优势。
Neoverse N定位就是同时考虑性能、功率、面积(PPA),擅长可扩展,可以应用于从高吞吐量计算到功率与尺寸受限的边缘和5G应用场景。其单线程的性能提升略低于Neoverse V1,相比N1有40%的提升,能为用户减少TCO的每瓦性能表现。
计算加互联,提供平台级解决方案
Neoverse V1和N2能够提供相比x86架构CPU更高的单核性能,但数据中心的建设者发现计算性能越来越高的同时,系统间互联的挑战越来越大。因此,Arm也在CMN-600的基础上,发布了升级的Mesh互联技术CMN-700。
据悉,CMN-700在每个矢量上进一步提升了性能——从内核的数量、缓存的大小,到附加内存及 IO 设备的数量和类型。
Arm的技术专家介绍,“Neoverse产品支持 MPAM(Memory Partitioning and Monitoring)和 C-busy(Completer busy)特性,能够让大量的内核可以均衡利用那些DRAM以及系统缓存等共享资源。同时,在支持可扩展性方面我们有CMN-700互连技术,它能实现多达256个内核的可扩展性支持,还能连接到加速器以及合作伙伴的IP等。”
“我们认为和多样化的加速器进行互联,比如和AI加速器,对于未来市场非常关键,与此同时,互联技术的灵活性尤为重要。” Chris Bergey表示。
Arm的目标是通过对CCIX和CXL持续不断的投入,让合作伙伴可以实现更多的定制方案,具备总线和高核数的可扩展性特色,突破传统硅限制。
也因此,Arm更强调Neoverse的平台属性。Chris Bergey说:“我们发现越来越多的客户需要完整的解决方案,即一个平台承载他们的系统,可以在上面添加他们的加速器或其他设备,并且可以对其进行定制。我们要做的就是为客户提供构建科技大厦所需要的‘砖瓦’,而不只是单个给客户某一个单独的IP,单独的CPU或互联IP。”
完善软件生态,抓住四大市场机遇
Arm能够提供有竞争力的平台级解决方案,但要真正实现在云计算、高性能计算、5G以及边缘基础设施四大市场的基于,软件的完善程度以及生态合作伙伴的支持非常重要。在EDA工具、数据库、DevOps以及安全等方面,Arm Neoverse获得了越来越多的软件支持,AWS Gravition2在这样的支持下不断完善。
另外,甲骨文(Oracle)已宣布计划在Oracle云基础设施上采用Ampere Altra CPU。
在国内,Neoverse也吸引了腾讯和阿里云。腾讯专项测试技术中心总监黄闻欣介绍,“去年,我们和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲,在AI推理和图片处理领域优势非常明显。”
Arm与阿里在Java方面的合作也有进展。阿里巴巴首席工程师周经森说:“Arm的CPU资源在我们现有的软件里有两个考虑的点,一些软件需要重新编译,另一些只需要把Java applications在JVM(Java Virtual Machine)运行好。过去一年里,我们与Arm合作提高JVM性能,从JDK8到JDK11,通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),把现有一些Java应用的性能提高了50%。”
对于云原生市场的机遇,Arm基础设施事业部全球高级总监邹挺表示:“云原生技术我们看到了很大的机遇,也不断进行投入,包括与公有云以及其他细分市场的合作伙伴紧密合作。在开源社区方面,我们投入大量工程资源,积极与合作伙伴们进行了诸多云原生方面的协作。同时,在下一代基础设施方面,我们也展开了大规模的合作,比如说在OSS以及与ISV方面的合作。”
Arm在5G领域的合作伙伴也有所进展,Marvell发布了基于Neoverse N2 的OCTEON系列网络解决方案,预计2021年底前试产。据悉,相较于前一代的OCTEON解决方案,其性能提升3倍。
在高性能计算市场,印度电子信息技术部(MeitY)已宣布将加入法国芯片公司 SiPearl 和韩国电子通信研究所( ETRI)的行列,采用Neoverse V1驱动国家级百万兆级高性能计算项目。
小结
相同的产品,Arm在半年内分两次介绍,这表明了Arm看好新一代基础设施市场的机遇,是重视,当然也心切。毕竟,智能手机市场的增长正越来越慢,向新的市场拓展对于Am的重要性越来越高。
就像本月GTC 21上黄仁勋发布基于Arm架构AI专用CPU GRACE时所说,英伟达能够帮助Arm的优势拓展到移动市场之外。
生态的建设没有捷径可走,抢食x86的蛋糕,也困难重重。Neoverse的灵活性和可扩展性带来的可定制性,以及TCO的优势,能够取得多大的胜利?
注,文中配图来自Arm雷锋网(公众号:雷锋网)雷锋网
相关文章:
单线程性能提升超50%!Arm新款服务器CPU要靠单核打天下?
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/64568.html