芯東西9月23日報道,今天,Arm公布下一代Neoverse服務器CPU設計,不僅公布N系列的第二代產品N2,還首次推出了全新產品類別Neoverse V系列平臺,劍指最高單線程性能。
▲最新Neoverse服務器CPU路線圖
Neoverse V1內核(代號Zeus)支持可伸縮擴展(SVE),具備更高的單線程性能和機器學習性能,適用于對CPU性能和帶寬要求更高的應用。相較N1內核,V1單線程性能提高了50%以上。
N2內核(代號Perseus)提供更多的內核數和優化的性能/功率比,具有更好的橫向擴展性能。相較N1內核,N2單線程性能提高了40%以上。
Neoverse N系列的PPA特征定義是性能、功率、面積得到了同等考量,擅長可擴展;E系列主要關注效率,對于網絡流量和數據應用程序非常有效,在功耗和面積的縮減上進行優化;V系列旨在提供最佳性能,需要添加更大的緩存、窗口和隊列,相對來說會消耗更多面積和功耗。
Arm基礎設施事業部高級副總裁兼總經理Chris Bergey說,Arm承諾每年30%的性能提升,將持續到2022年及以后。
01
Neoverse V1:主打高單線程性能,支持可伸縮矢量擴展
Neoverse V1面向7nm和5nm工藝技術而設計,是Arm的第一個支持可伸縮矢量擴展(Scalable Vector Extensions,SVE)的設計核心,將支持256位寬度的向量,適合高性能計算、高性能云和機器學習處理任務。
SVE可基于未知寬度向量單元的軟件編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。SVE可確保軟件編碼的可移植性與使用壽命,同時兼顧高效的執行。
“我們的芯片伙伴可以完全控制SVE電壓和頻率轉換,富士通A64FX CPU就是一個很好的例子,在執行SVE代碼時,它可以全天全頻率運行。”
Chris Bergey介紹說,對于開發者而言,主要好處是SVE的架構使其可以在寄存器寬度之間無縫轉換,因此,他們可以合并新的寬向量SVE指令,同時可以重新使用為較小的寄存器編寫的輔助函數。
V1還支持PCIe 5.0連接、DDR5、HBM2e和CCIX 1.0,以實現插槽之間的芯片與封裝內小芯片之間的雙向一致性通信。
與Neoverse N1相比,Neoverse V1的單線程性能可提升超過50%。
02
Neoverse N2:主打高度可擴展性,單線程性能較N1提升40%
Neoverse N2被設計為一個超級可擴展平臺,用來滿足橫向擴展的性能需求。
N2面向5nm工藝技術而設計,支持PCIe 5.0和DDR5,通過支持用于高帶寬存儲器的HBM3以及用于結構的CCIX 2.0和CXL 2.0來進一步擴展。
此外,相較Neoverse N1,Neoverse N2在保持相同水平的功率和面積效率之余,單線程性能提升了40%。
它不會像V1在每線程性能具有突出表現,但它將在恒定的TDP中支持更多內核。它可以支持從20W、8個內核到350W、192個內核,用例可橫跨云、智能網卡(SmartNICs)、企業網絡到功耗受限的邊緣設備。
N2在邊緣計算要求的性能下,甚至非常有限的TDP條件下,同樣能展現出良好的性能表現。“對于企業網絡和SmartNIC應用,沒有比N2更好的解決方案。”Chris Bergey說。
Arm的一位性能工程負責人做了一張有趣的圖表,X軸是芯片級性能,Y軸是每線程性能,Arm認為客戶和運營商將需要更多的單線程性能。
Chris Bergey認為,N1 CPU在芯片級吞吐量和單線程性能方面,都將超過市場上的任何產品。V1和N2在圖的右上方,Arm也展示了這兩款新品預期的性能提升。
“我們知道其他競爭架構不會停滯不前,但我們非常有信心N2將繼續代表最高的單芯片性能,而V1將在未來提供最高的單線程性能。”Chris Bergey談到。
▲Arm的移動設備和服務器CPU IP之間的世代同級產品(圖源:AnandTech)
值得注意的是,同一時期串聯開發的Arm移動IP系列Cortex和Neoverse產品之間存在相似之處,例如Neoverse N1是與Cortex-A76一起開發的,因此這兩個微體系結構可以看作是兄弟設計,具有很多相似之處。
Neoverse V1可以看作是Cortex-X1的同級設計,可能共享許多為這兩個旗艦CPU開發的超大型內核結構。Neoverse N2較為特殊,代表了下一代Cortex-A內核的兄弟設計,是A78的后續產品。
03
“裝機即用”的軟件與創新的組件
除了提供更高性能的處理器核外,Arm還為合作伙伴提供可擴展性的交換網,用以支持大量的處理器核。
Arm在CCIX與CXL進行投資,確保其生態系統得以快速且高效地推出相關的技術。
迄今為止,日本富士通超算的A64FX芯片和定制核心微架構是唯一一款宣布和提供SVE的CPU, Neoverse V1和N2將是Arm第一批實現SVE的自主設計處理器核。
在軟件生態系統方面,Arm Project Cassini旨在為軟件開發者提供流暢的體驗,通過標準、平臺安全性與參考實施,使得行業伙伴可基于Arm平臺上部署“裝機即用”的軟件。
同時,Arm也持續推動基礎軟件支持。例如,Xen、KVM、Docker容器以及越來越多的Kubernetes等操作系統、虛擬機管理程序,都已經陸續宣布支持Arm架構。許多初期由Arm推動的開源項目正在變得自主運轉,同時,商用ISV應用程序也齊步演進。
Chris Bergey談到,Arm希望每一代有30%以上的性能提升,除了與技術團隊的努力分不開外,與整個軟件生態的逐漸成熟也有很大關系,許多原生軟件現已能夠無縫運行在軟件架構上。
04
7大互聯網公司已有4家公開宣布采用Arm技術
Arm自十年前就開始部署數據中心領域的高效計算技術。
2018年,Arm首次公布在基礎設施市場的初步產品——Neoverse服務器CPU路線圖,這個“量尺”用來衡量Arm在接下來的18個月的進程,并承諾以每年增長30%的平臺性能為指標,持續優化到2021年。
過去兩年間,Arm在服務器市場取得一系列落地進展。
在互聯網領域,前7大互聯網公司中有4家公開宣布采用Arm技術進行部署。
在高性能計算(HPC)領域,搭載Arm服務器CPU的日本富士通超算是今年全球排名第一的超級計算機。
在整個5G生態系統廠商中,從L1到傳輸的整個堆棧,以及新興的OpenRAN和VRAN計劃,Arm都獲得一系列重大設計項目。
在基礎架構和邊緣,Arm已推出uCPE轉Arm以及Project Cassini計劃,并將在兩周后的Arm DevSummit大會上更新Project Cassini第一年的進展。
05
結語:Arm在服務器市場的競爭力顯著增長
如今第一代Neoverse N1基礎架構CPU IP產品已經以商業和公開可用的形式進入市場,下一代Neoverse平臺也即將面世。
無論是近年推出的基于Arm平臺的服務器處理器產品,還是今天所公布的新一代處理器核的性能,都足見Arm已成為數據中心服務器市場的競爭力正顯著提升。
今天的發布只是預告片,據Chris Bergey透露,Arm將在明年深入分享關于V1和N2產品的更多細節。