“ 數(shù)據(jù)中心市場一觸即發(fā)
日前,三星推出了第一個開源軟件解決方案——可擴展存儲器開發(fā)套件 (SMDK)專門設計用于支持 Compute Express Link (CXL) 內(nèi)存平臺。這是繼三星在今年5月推出首個支持CXL標準的DDR5內(nèi)存后,針對CXL技術發(fā)展的又一推動。
三星電子內(nèi)存產(chǎn)品規(guī)劃團隊副總裁 Cheolmin Park在新聞稿中表示:“為了讓數(shù)據(jù)中心和企業(yè)系統(tǒng)順利運行像CXL這樣的下一代內(nèi)存解決方案,開發(fā)相應的軟件是必要的。”
此前BusinessKorea有報道指出,隨著美國科技巨頭包括亞馬遜、Facebook、微軟和谷歌將數(shù)據(jù)中心投資增加約40%,韓國DRAM大廠三星電子服務器芯片市場受益。另外,三星方面也曾表示,由于數(shù)據(jù)中心投資增加和新應用,5G和數(shù)據(jù)中心的儲存芯片需求將增加。
在這種情況下,布局數(shù)據(jù)中心市場不足為奇,但為什么CXL能成為數(shù)據(jù)中心市場的寵兒?在互聯(lián)技術上的布局對于服務器芯片廠商來說又意味著什么?
互聯(lián)技術之于數(shù)據(jù)中心的重要性
隨著數(shù)據(jù)中心市場的發(fā)展,以英特爾、英偉達、AMD為代表的巨頭芯片企業(yè)都開始紛紛圍繞著數(shù)據(jù)中心芯片進行了布局,在這個過程中,以CPU而聞名的英特爾和AMD開始向GPU領域拓展,憑借GPU而崛起的英偉達也開始涉足CPU市場。
而基于CPU、GPU等服務器芯片的特性,他們在數(shù)據(jù)中心當中也承擔著不同的角色——CPU 適用于一系列廣泛的工作負載,適合用于處理從串行計算到數(shù)據(jù)庫運行等類型的工作;GPU則常作為并行處理器,以便能夠處理越來越多的應用程序。而這也意味著,大量的數(shù)據(jù)需要在CPU和GPU之間進行高速傳遞。
但事實情況是,根據(jù)企業(yè)存儲技術發(fā)布的一篇文章顯示,在2021 Persistent Memory +Computational Storage Summit會議中主題為《Futureof Persistent Memory, DRAM and SSD Form Factors Aligned with New SystemArchitectures》的演講中曾指出,從2012-2019年,服務器CPU核心(從8核到64核)增長了8倍,而Pin引腳數(shù)量(從LGA-2011到4094/4189)和內(nèi)存通道數(shù)(從4到8)僅增長了2倍,PCIe lane(從40到64,如果是AMD則按照雙路中每CPU支持來算)甚至不到2倍。也就是說I/O跟不上計算密度的增長。
因此,與數(shù)據(jù)中心相關的數(shù)據(jù)傳輸技術也受到了服務器芯片廠商的關注。
DIGITIMES Research分析師翁書婷曾表示表示,業(yè)者為提高兩芯片間的數(shù)據(jù)傳輸效率,英特爾、AMD與英偉達數(shù)據(jù)中心CPU與GPU產(chǎn)品線,著重于高速互連介面的創(chuàng)新。
為此,這些芯片巨頭廠商都在互聯(lián)技術方面展開了新的探索。英偉達開發(fā)并推出了NVLink,NVLink采用點對點結構、串列傳輸,用于CPU與GPU之間的連接,也可用于多個NVIDIA圖形處理器之間的相互連接。
在英偉達提出這種“新”的互聯(lián)方式之處,IBM給予了他們很多支持,根據(jù)相關報道顯示,IBM曾將NVlink 1.0添加到他們基于Power8+微架構的Power處理器上,這一舉措使得P100可以直接通過NVlink于CPU相連,而無需通過PCIe。
與此同時,AMD也推出了名為Infinity Fabric的互聯(lián)架構,這是AMD于2016年公布的一個基于HyperTransport擴展而來的技術,被用于CPU之間、GPU之間以及CPU和GPU之間的互聯(lián)。根據(jù)AMD方面的展示來看,其最新的Infinity Fabric 3.0已經(jīng)可以將 EPYC CPU 與 Radeon聯(lián)合工作,每路 EPYC CPU 搭配 4 組 Radeon Instinct加速卡亦沒有問題。
CXL技術則是英特爾所主張的用于數(shù)據(jù)中心的互聯(lián)技術,這原是英特爾的一個內(nèi)部項目,他們希望底層基于PCIe而發(fā)展的CXL,可消除CPU與設備、CPU與存儲之間的計算密集型工作負載的傳輸瓶頸,創(chuàng)建一個可以支持加速器、I/O、緩存和內(nèi)存的接口,以服務于下一代高性能計算、數(shù)據(jù)中心。簡單來講,CXL的作用是使得異構處理器之間的內(nèi)存調(diào)用變得方便,數(shù)據(jù)交換更快。
2019年3月13日,英特爾攜手阿里巴巴、思科、戴爾EMC、Facebook、谷歌、HPE、華為以及微軟宣布成立Compute Express Link(CXL)開放合作聯(lián)盟,旨在共同合作開發(fā)CXL開放互連技術并制定相應規(guī)范,促進新興應用模式的性能突破,同時支持面向數(shù)據(jù)中心加速器和其他高速增強的開放生態(tài)系統(tǒng)。同年7月,隨著AMD宣布加入CXL開放合作聯(lián)盟,我們看到,CXL這種技術正在被越來越多的廠商所認同。
針對CXL的布局計劃
從CXL開放合作聯(lián)盟的發(fā)展動態(tài)中,可以探視到芯片廠商對于CXL技術的推進情況——在CXL開放合作聯(lián)盟成立之初,CXL 1.0標準也同時推出,該標準制定了I/O協(xié)議、允許設備間共享內(nèi)存的內(nèi)存協(xié)議以及保有一致性的接口標準。在接口規(guī)格上,CXL可兼容PCIe 5.0,最高帶寬可達128GB/s幾乎能夠滿足當時所有的數(shù)據(jù)傳輸需求。
在2020年11月,CXL聯(lián)盟又發(fā)布了CXL 2.0規(guī)范,2.0規(guī)范增加了內(nèi)存池的支持,以最大限度地提高內(nèi)存利用率,并且提供了對持久性內(nèi)存的標準化管理,允許與DDR同時運行,從而可以釋放DDR用于其他用途。并且CXL 2.0規(guī)范也向后兼容CXL 1.1和CXL 1.0。
除了聯(lián)盟發(fā)布的動向外,從個別廠商的動作上看,致力于CXL發(fā)展的Rambus也開了戰(zhàn)略布局,他們推出面向數(shù)據(jù)中心的“CXL內(nèi)存互聯(lián)(CXL Memory Interconnect)計劃”。同時,今年6月,Rambus還宣布完成了對AnalogX和PLDA兩家公司的收購,Rambus在其新聞稿中稱,對PLDA和AnalogX的收購提供了我們關鍵的產(chǎn)品和專業(yè)技術,增強了公司在服務器內(nèi)存接口芯片方面的領先地位,進一步加速了為下一代數(shù)據(jù)中心提供創(chuàng)新CXL互連解決方案的路線圖。
除此之外,作為CXL聯(lián)盟的早期成員,Astera Labs為解決以數(shù)據(jù)為中心應用系統(tǒng)的性能瓶頸推出了新的產(chǎn)品,全新的Aries Compute Express Link(CXL 2.0)Smart Retimer(PT5161LX、PT5081LX)產(chǎn)品系列是面向低時延的CXL.io連接方案,也是其布局新領域的首款解決方案。
一觸即發(fā)的服務器芯片市場較量
當初英特爾牽頭成立CXL開放合作聯(lián)盟之時,就曾被認為是與英偉達NVLink技術相抗衡。在這種競爭之下,我們看到圍繞著數(shù)據(jù)中心芯片市場的較量也將一觸即發(fā)。
眾所周知,CPU、GPU和FPGA等芯片都將在數(shù)據(jù)中心市場中發(fā)揮巨大的作用,為此,英特爾、AMD和英偉達都針對自己的“短板”進行了補充,在這個過程當中所發(fā)生的巨額并購(包括英特爾收購Aletra、AMD計劃收購賽靈思以及英偉達計劃收購Arm),都被業(yè)務視為是他們?yōu)闆Q戰(zhàn)數(shù)據(jù)中心市場而進行的布局。
以英特爾和英偉達為例,從他們推出的產(chǎn)品進程上看,以CPU見長的英特爾在去年推出了首款數(shù)據(jù)中心的獨顯產(chǎn)品;英偉達則是在今年4月,推出了其基于Arm的數(shù)據(jù)中心CPU,據(jù)英偉達介紹,該芯片是專為大規(guī)模神經(jīng)網(wǎng)絡工作負載設計的,預計將于2023年在英偉達的產(chǎn)品中使用。
在他們圍繞著多計算架構芯片展開競爭的同時。作為這些芯片之間溝通的橋梁,在互聯(lián)技術方面的競爭或許也預示著他們在服務器芯片市場領域的爭斗也進入到了決勝階段。
根據(jù)英特爾在2021 hot chip上的演講顯示,市場將在 2022 年真正看到的 CXL 1.0/1.1 設備。從英偉達方面來看,其所推出的基于Arm架構而開發(fā)的數(shù)據(jù)中心CPU采用了第四代 NVLink互聯(lián)技術,據(jù)了解,這一技術能夠提高Grace CPU和NVDIA GPU之間的連接速度最高達到900GB/s,使總帶寬比目前最先進的服務器高30倍。
除了在CPU、GPU、FPGA領域的較量外,這些芯片廠商還認為DPU將在數(shù)據(jù)中心市場大有可為。而互聯(lián)技術在DPU上也同樣重要,以CXL為例,福布斯曾在其發(fā)表的一篇文章中提到,在PCIe物理層上工作的CXL將為內(nèi)存提供新的功能。與NVMe-oF、DPU和特殊處理器相結合,新的可組合內(nèi)存和存儲體系結構以及計算存儲都是可用的。
從這一點上看,互聯(lián)技術已經(jīng)成為了數(shù)據(jù)中心發(fā)展過程中一個不可忽視的領域。同時,我們也認識到了,圍繞著服務器芯片市場的競爭已經(jīng)不僅僅局限于芯片本身的性能,他們也正在向更多領域進行延伸(還包括在各大芯片廠商在封裝方面的探索),在這些方面的突破,也或許能夠成為他們未來在服務器芯片市場競爭中的利劍。
寫在最后
在上文中,我們曾提到第一代CXL與32 Gbps PCIe 5.0保持一致。而在前不久,PCI-SIG確認,PCIe 6.0規(guī)范的0.7版已正式向其成員發(fā)布,PCI-SIG組織已經(jīng)批準了PCIe 5.0標準,并計劃在2021年發(fā)布完整的PCIe 6.0規(guī)范。9月,據(jù)外媒報道稱,PCI-SIG 和 CXL Consortium宣布已簽署 MOU(諒解備忘錄)。該諒解備忘錄的目的是在兩個組織之間建立一個溝通系統(tǒng),以便在共同感興趣的領域進行一致的聯(lián)合消息傳遞和營銷。因此,我們或許可以推測,CXL 2.0將在PCIe 6.0的推進中起到關鍵的驅動因素。
與此同時,被視為與CXL能夠并駕齊驅的NVLink也在不斷升級。從這兩個陣營的競爭上看,或許我們可以認為,目前在互聯(lián)技術上的爭奪,將會影響未來他們在數(shù)據(jù)中心市場的地位。
可以預見,隨著數(shù)據(jù)中心逐漸接近大規(guī)模落地的時間節(jié)點,這些芯片廠商們的競爭也進入到了白熱化的階段。