要在服務器市場中占得一席之地,Arm似乎還需要花些力氣。
2020年前后,Arm在服務器市場越來越得勢了。
幾個月內,亞馬遜AWS、Marvell、Ampere等陸續推出了,基于Arm架構設計出的服務器芯片新品,而此前就有華為站隊,Arm服務器陣營的影響力可以說日趨強大。
在拉斯維加斯的re:Invent大會上,亞馬遜AWS CEO Andy Jassy就直接對外表示,他們不再需要大量的x86處理器來運行工作負載了。Arm成了不二人選。
然而也不乏反對聲,此前Linux創始人Linus Torvalds就公開說出了自己的想法,稱ARM架構無法在服務器領域取得成功。而有一個事實是,自2008年就開始嘗試服務器市場的Arm確實一直都沒有真正進入這個市場。
可以說,Arm是否能夠進入服務器市場一直是行業內,一個為人所津津樂道的話題。而因為今年市場形勢的變化莫測和Arm技術的更進一步成熟,Arm的局面似乎要逼近了翻盤。
此Arm非彼Arm
不久前,Ampere在發布新品時就特別贊許了ARM架構技術的進步,要知道這家初創公司的團隊大多具備Intel服務器架構的開發經驗。
對于ARM架構,他們特別提到了這幾個方面,“經過了過去幾年的發展,ARM架構的綜合能力已經具有領先數據中心的性能和能效要求。同時,Arm軟件的生態現在基本上已經成熟了,所有數據中心都可以基于ARM運行的,不僅僅是操作系統、中間件等,還包括應用。”
其實,2008年Arm巨額投資Calexda開始,它醞釀服務器市場的計劃就顯露出來,而發展至今,盡管具有低功耗的優勢,ARM架構在性能上一直不及X86,因此業內也只是在建設冷數據的存儲中心會采用功耗相對較低的ARM架構。
當時想要打破Intel的服務器生態,著實是一件難度比較高的事情。有統計數據表明,在2008年到2013年期間,X86 CPU性能基本保持年度復合增長在60%左右性能的增長。
不過,隨后幾年,X86處理器架構的性能增長大幅下降,這給了市場中其他競爭者機會,比如可以替代英特爾的AMD。
但Arm與AMD們不太一樣,它想要做的不僅僅是性能相當的替代,還要把“低功耗”優勢做進服務器市場。
選擇這樣做的原因很簡單,數據中心的能耗成本與日俱增。有數據顯示,一個典型的IT機柜的能耗曾是1-3千瓦,而現在機柜常見的負載為20-40千瓦。隨著性能增加,機柜的能耗還會繼續增加。
谷歌當時選擇自研TPU就與能耗有很大關系。當時谷歌負責全球基礎設施業務的Joe Kava就透露,谷歌在2015年使用了5.7太瓦時的能源。他說,“數據中心的能耗占去了大半,這也是谷歌緣何能成為云計算園區可再生能源的頭號買家。”
其實,在國內大規模推動數據中心建設時,能耗過高的問題同樣會困擾著阿里、騰訊等互聯網巨頭,因此Arm的勝算也會更多。
其實通過市場評價來看現在的Arm,對標X86,如今的它其實具備抗衡能力。
首先Arm有強大的生態,而且低功耗的優勢很明顯。因此尤其隨著近幾年云計算市場需求興起,云—邊—端被提出來后,超大規模、邊緣側等各類數據中心對功耗要求越來越高,Arm也自然會被越來越多的廠商考慮。
同時難能可貴的是,ARM架構的性能有了比較顯著的提升。有用戶在評測基于ARM架構搭建的華為鯤鵬服務器和傳統X86架構服務器時,已經發現ARM架構的計算性能表現十分逼近X86架構了,這一點讓Arm的最大短板得到了彌補。
機遇與挑戰并存,廠商站隊各有想法
目前,選擇ARM架構來搭建服務器的廠商,已經不少。其中不乏亞馬遜、華為這樣的頭部廠商,同時Marvell、Ampere以及國內的飛騰還在基于ARM架構來做服務器芯片研發。
可以說,綜合考慮市場和Arm技術本身,各家廠商站隊Arm生態各有各的原因,而正是這些“原因”,構成了Arm可以預見的未來。
在華為全連接大會上,就為什么棄用X86而選擇“性能要差些”的Arm,胡厚崑給出了這樣的解釋,“Arm在手機生態上的優勢會向數據中心延伸,以前Arm在數據中心推廣的主要瓶頸是性能,而華為發布的鯤鵬920是兼容Arm的,由于技術創新,性能超越了業界主流通用CPU 25%以上。”
同時,他還補充說,“客戶對ARM架構的需求也隨著手機算力向云端遷移增長,如果云端使用X86架構將會損失40%的性能,使用ARM架構則會增加40%,這也是華為支持ARM架構的原因之一。”
其實從胡厚崑的解釋中,我們能夠看出,華為想要打造屬于自己的生態,因此Arm的強大生態是它非常看重的,而在性能方面,華為用自身的設計去做了改進和彌補,這里面有很大的原因是出于一家大廠的自信。
當然,華為自然也有自己的戰略布局考慮。其實“全連接”傳達出的就是華為要打通移動終端和服務器端生態的想法,從這個戰略角度來看,對華為來說,沒有什么比ARM架構更合適。
而亞馬遜選擇Arm的原因則更簡單,它就直接對外宣稱,因為采用基于ARM架構設計的云服務器芯片Graviton,有部分工作負載可以降低45%。
其中,亞馬遜AWS對外提供的Amazon EC2服務就是基于ARM架構做的。可以看出,與華為有些不同,亞馬遜選擇Arm很大程度上是為了做出更加滿足自身服務需求的“定制化”芯片,因為可以基于ARM架構來進行芯片設計,而Amazon EC2服務也有了諸多創新,比如良好的可伸縮性等,以滿足云服務的需求。
再看基于ARM架構做創新型的服務器芯片廠商,其想法也有些與亞馬遜不謀而合。Ampere在接受采訪時,就表示Arm的生態系統已經有了大幅度的成熟,而基于Arm設計的芯片,可以滿足云端的需求。
“經過過去幾年的發展,ARM架構已經具備一定競爭力。同時云端發生了很大的變化,尤其是可預測的性能、平臺可擴展性等需求的變化,市場也在反推芯片設計的創新。”
事實上,如Ampere提到,不同于傳統數據中心,隨著市場發展,存儲數據中心、控制中心、計算中心和網絡中心等多樣終端出現,這帶來了多樣的需求,尤其是云需求給新入局者創造了很多機會,這是ARM架構重新獲得進入市場機會的一個重要原因。
性能不可妥協,成本難降或催生新商業模式
不難發現,Arm能夠逐漸被認可,除了本身的生態優勢,其在技術上的進步,以及整個市場需求的變化,多方面因素促成了這樣的市場選擇,也幫助Arm打開了市場的突破口。
但正如當下很多廠商仍然在猶豫一樣,大家沒有選擇Arm,關鍵就在于性能。簡單來說,性能不足是硬傷,即便在其他方面有諸多優勢,再有潛力也難受到大家的廣泛認可。
事實上,也確實如此,因為ARM架構的不成熟,它極易造成數據中心的不穩定和不安全,從而造成大面積宕機現象,其問題的嚴重性也自然高于成本等其他因素。
那如果不采用ARM架構,還有什么方式可以降低能耗,或者說成本?
依據業內的分析,性能提升、功耗降低基本不成現實。但是有人提出,其實可以考慮通過云定價模式來開發新的商業模式,以優化能耗成本,比如基于負載流量的動態路由機制設計最優服務定價策略。
這不失為一個可行的好辦法。
提出該辦法的作者就指出,當下很多研究者大多是從降低能耗總量的角度出發去研究各種數據中心節能技術,但是這些技術并沒有考慮定價機制對能耗優化技術的影響。
而無論是提供云服務的廠商,還是數據中心運營方,大家其實最關注的還是自身利益的最大化,因此能夠研究出定價與能耗優化之間的關系,給出最優的定價策略和能耗成本優化方案,這可以說是必由之路,也將促進云計算市場的健康發展。
作為國內最大的云服務提供商,阿里云的營收增速雖然很快,但該業務的虧損已經是一個公開的秘密。在阿里巴巴2019年年報中,我們就能看出,作為阿里四大核心板塊之一的云計算業務,雖然2019財年的營收為240.8億元,達到了2015年的近20倍,但是其虧損是在持續擴大。這里面,很大的原因就在于不斷增加的成本投入。
總體來說,一邊是成本,一邊是性能,云計算廠商其實已經陷入兩難的境地,而想要化解該難題,多半需要仰仗芯片和架構提供商們了。這是Arm和其他新玩家的機會。