全球GPU市場長期被英特爾、英偉達、AMD等國外三巨頭壟斷,國產高性能GPU一直未見起色。
在自主可控需求及國產替代浪潮之下,近年來有不少公司開始涉足GPU領域,也吸引著越來越多資本的涌入。然而,只聽雷聲響,未見雨下來,陣陣喧鬧過后,市場上仍未見可與國際巨頭對標的量產產品。
誰能橫槍勒馬,打破格局,人們翹首以盼……
GPU(Graphic Processing Unit),圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。
通俗來講,GPU就是完成3D圖形的生成,將圖形映射到相應的像素點上,對每個像素進行計算確定最終顏色并完成輸出,GPU采用流式并行計算模式,可對每個數據行獨立的并行計算。
作為圖形渲染和智能計算的主要平臺,GPU產業已形成較大規模。據Verified Market Research數據統計,2020年全球GPU市場價值為254.1億美元,2027年有望達到1853.1億美元,年平均增速高達32.82%。
全球GPU規模走勢預測
(數據:Verified Market Research,半導體行業觀察制圖)
當前,GPU市場主要被英特爾、英偉達、AMD等廠商壟斷,市場高度集中。據JPR公布的數據顯示,2021年第二季度,在全球獨立GPU市場中,英偉達獨占83%的市場,AMD則占據17%的份額;在PC GPU市場中,英特爾占比超過68%,英偉達與AMD次之。
在中國市場中,三大巨頭自然也是分走了大部分蛋糕,作為全球GPU市場重要組成部分,2020年英偉達、AMD在中國大陸收入占比分別為23.3%、23.9%,可以說是賺得盆滿缽滿。
國產GPU涌動
當前,在5G數據中心、云游戲,以及云宇宙等熱門應用的推動下,GPU領域的市場空間正在快速增長,市場潛力巨大。結合市場趨勢、行業格局以及不穩定的國際貿易關系等多重因素,國內越來越多的企業開始在GPU市場布局。
近年來國產GPU市場的火爆引起廣泛關注,國產GPU廠商相繼發布產品進展,也有GPU廠商陸續獲得大筆融資,這說明國產GPU不僅受到了資本的大力支持,也切實在產品上取得了一定的突破。
但能夠發現,由于GPU行業的準入門檻較高,國內很多廠商專注的是通用GPU(GPGPU)的研發,這種GPU并不具備圖形處理能力,主要是用來計算原本由CPU處理的通用計算(與圖形無關的)任務,實現相對簡單的一些AI運算。雖然GPGPU的價值也很高,增長也不錯,但細分市場總的體量還是遠不及圖形渲染GPU領域。
而在圖形GPU領域,國內還是以景嘉微、航錦科技等為代表的傳統企業為主力。另外,從事CPU研發的企業(如兆芯、龍芯等),也開始切入這個賽道,增強了國內GPU企業的整體研發實力。
然而,喧鬧過后,市場上仍無一款可與國際巨頭對標的量產產品。艱難破局的關口,需要更多有實力的廠商參與進來,助力國產突圍。
在此行業背景和市場推動下,11月26日,芯動科技正式發布了自己的GPU芯片——“風華1號”,并通過現場多項4K級重度渲染演示,揭開了這款集眾多自主技術創新、備受矚目的國產GPU的神秘面紗。
國產GPU突破
對于“風華1號”GPU性能,芯動科技云計算總裁敖海進行了介紹:
芯動科技云計算總裁敖海
“風華1號”單芯片A卡渲染能力達到160GPixel/秒,FP32浮點性能達到5T FLOPS;
3D圖形渲染處理管線定制優化,支持Linux/龍芯/Windows/安卓操作系統圖形框架,同時支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延遲編解碼+AI計算于一體,AI性能為25TOPS(INT8);
芯片支持32路SR-IOV虛擬化,內置中國專利的物理不可克隆PUF技術,保護信息安全;
顯存技術采用全球領先的GDDR6/GDDR6X Combo自研技術,單比特最大傳輸速率達到19Gbps。顯存帶寬最高可達304GB/s,顯存容量最大可擴展至16GB;
主機接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8,支持OpenGL4.0;
視頻輸出接口方面,“風華1號”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路獨立輸出。
“風華1號”主要性能指標(圖源:現場拍攝)
在發布會現場,芯動科技還進行了“風華1號”A卡的渲染演示,在國產CPU和操作系統桌面上辦公上網、CAD設計、圖形工作站、EDA設計、GIS實景地圖、重度游戲benchmark、OpenGL4.0 Heaven、Vulkan框架下運行Windows游戲、多路云游戲等多種高清渲染場景下的流暢表現,“風華1號”實測功耗表現非常優秀,桌面4K重度渲染典型芯片功耗在20W左右,多路重度云渲染典型功耗在50W左右。
從芯片算力性能來看,“風華1號”雙芯片B卡(下文有介紹)FP32浮點性能達到10T FLOPS,可以對標英偉達Tesla T4 GPU(FP32 / 8.1T FLOPS),且功耗更低,遠超其它國產GPU性能。此外,風華GPU還搭載了Chiplet、GDDR6X以及虛擬化解決方案等眾多優勢技術,為產品提供賦能。
Innolink Chiplet技術
值得關注的是,“風華1號”還首次成功實施了中國自主標準的Innolink Chiplet多晶粒技術。芯動科技GDDR6X研發負責人高專表示,Innolink Chiplet技術是芯動科技推出的國產標準封裝技術,將不同功能不同工藝制造的小芯片進行模塊化封裝,成為一個異構集成芯片。
簡單來說,Chiplet技術就是像搭積木一樣,把一些預先生產好的能實現特定功能的芯片裸片(die)通過先進的集成技術集成封裝在一起,形成一個系統芯片(SoC)。從這個意義上來說,Chiplet就是一個新的IP復用模式。
芯動科技可以為多種場景的Chiplet提供接口解決方案,Innolink A/B/C三種互連選項滿足不同芯片的需求,具有高度可編程性和靈活性,可實現高達1.5Tbps以上的帶寬,同時保持信號完整性和低延遲。
芯動科技Innolink IP(圖源:現場拍攝)
在風華GPU里面用的是InnolinkB的技術,InnolinkB基于GDDR6技術,可以兼容一些傳統封裝,實現芯片到芯片間的互聯,可以做到低延時、小面積。通過Innolink Chiplet擴展,“風華1號”GPU顯卡服務器用B卡,在A卡基礎上直接性能翻倍,渲染能力達到320GPixel/秒,FP32浮點性能達到10T FLOPS;同時支持32路1080P@60fps和64路720P@30fps強渲染+低延遲編解碼+AI計算,顯存達到32GB。
基于Chiplet的模塊化設計方法,用先進封裝的方式將不同功能“芯片模塊”封裝在一起,可以跳過流片快速定制出一個符合應用需求的芯片,芯片的交付過程也被進一步加快。
據了解,Innolink方案不只是用在GPU上,芯動科技也授權給了合作伙伴和客戶,通過復用芯動科技的國產Innolink Chiplet技術,能夠快速便捷地實現多die、多芯片之間的互連,有效簡化了設計流程。作為中國半導體IP和芯片定制的一站式生態賦能型領軍企業,芯動科技希望將該技術推廣出去,讓它為中國的集成電路、芯片產業的崛起做出貢獻。
業界最先進顯存GDDR6X
此外,“風華1號”搭載的GDDR6X也是目前最為先進的顯存,英偉達的RTX3090和RTX3080搭載的顯存就是美光獨家供貨的GDDR6X顯存,目前全球只有英偉達和芯動科技兩家擁有。
芯動科技GDDR6X研發負責人高專
據介紹,GDDR6/6X速度是DRR4/LPDDR4最高速度的5倍,這在GPU領域意味著內存帶寬性能的碾壓。新顯存的優勢體現在兩個方面,一是顯存容量可擴展至16GB,二是速度高達21Gbps。
“核心技術是買不來的,英偉達的高帶寬顯存技術一直自研,是其保持其競爭優勢和70%利潤率的一大利器,芯動科技在這方面能與其并駕齊驅,確保了GPU性能和工藝量產的靈活性和性價比。” 高專強調,“GDDR6X的PAM4并行技術超級難做,英偉達與美光在一棟樓里共同研發兩年才研發出來; 而芯動團隊是全球唯一一家僅憑有限的遠程技術支持,只用一年時間就做出來了的公司,這一點連AMD都還沒有做到,所以美光的架構師都不禁感嘆我們的研發實力之強”。
GPU虛擬化技術
除了采用全球頂尖的GDDR6X高帶寬顯存技術和Chiplet等前沿技術之外,虛擬化技術也是“風華1號”GPU的一大亮點。
據介紹,虛擬化方面,“風華1號”是一個支持虛擬化云服務的GPU,能支持32路的720P,并且目前采用的是超低功耗的設計,在現有架構上還有非常多的創新空間,更進一步地擴大算力。硬件虛擬化和可延展性給用戶在未來進行類似于對安全性很高的應用場景,通過加密并且不斷地延展在特定場所的計算能力和渲染能力方面,提供非常大的優勢。
虛擬化技術能夠把GPU虛擬成多個可以獨立工作的GPU,支持多路計算的場景,同時給多個用戶使用。芯動科技SoC體系架構師何穎表示:“該技術適用于云服務領域,因為在云服務里面很可能是很多客戶一起在一個服務器上跑,這個時候如果是一個GPU服務一個客戶的話,實際上滿足不了需求。因為GPU本身的性能比較強,用來滿足一個客戶的需求的話性能會有冗余,這個時候虛擬化就是把這個GPU變成多個虛擬的GPU,每個虛擬GPU服務每個客戶。當然這里面涉及到很多東西,要做到每個客戶之間采用的資源是互相隔離的,包括他們用的顯存、計算資源、編解碼資源等全部都要虛擬化起來,使得每個客戶能夠用得很流暢。”
芯動科技SoC體系架構師何穎
英偉達和AMD在GPU虛擬化的路上走的比較慢,即使提供虛擬化的方案,好像它不太支持靈活的虛擬化。對此,芯動科技工程副總毛鳴明指出,虛擬化除了技術方面有很大的瓶頸,它還有一個商業的原因。GPU虛擬化是一個類似于內卷的技術,因為GPU虛擬化之后,賣的顯卡數量就會減少,因此對于顯卡巨頭來說沒有太大的動力去支持其快速推進虛擬化技術,或者哪怕支持也會收取特別昂貴的費用。因此,這也屬于芯動科技的一個差異化優勢,國產GPU本身也是一個要走向國際市場的產品,面對巨頭競爭要走差異化路線。
從芯片參數和各項優勢技術可以看到,“風華1號”的發布實現了國產5G數據中心服務器GPU和4K桌面GPU這兩大應用場景從0到1的突破。“風華1號”顯卡實現了多項第一,如第一款渲染能力達到5T-10T FLOPS的國產GPU顯卡,第一款圖形API達到OpenGL4.0以上,并能實際演示4.0 benchmark的GPU,還是第一款支持多路渲染+編解碼+AI服務,硬件虛擬化和Chiplet可延展的國產GPU等。
在桌面上,“風華1號”適配了4K、1080p分辨率,支持Windows、Android、Linux(含國產)等操作系統,支持ARM、MIPS、x86 CPU架構,支持OpenGL、OpenGL ES、OpenCL、Vulkan、DirectX等主流圖形框架,支持嵌入式VR/AR/AU、智能座艙、工控機、元宇宙等應用。
在服務器上,“風華1號”支持數據中心服務器高密度圖形渲染、AI超分/運算,支持5G數據中心多路云辦公、云渲染、云游戲、云手機,支持高安全性多路硬件虛擬化、遠程桌面應用。
從當前市場來看,服務器GPU被廣泛應用于AI、數據分析、高性能計算與渲染等領域,服務器作為網絡中的重要設備,要接受少至幾十人、多至成千上萬人的訪問,因此對服務器GPU具有大數據量的快速吞吐、超強的穩定性、長時間運行等嚴格要求。相較于其他運算單元,服務器GPU因較高的可編程性和不錯的通用性能,被用作特定應用處理器(ASP),部署在云端、辦公室、數據中心、邊緣計算。目前,主要的服務器GPU解決方案主要由英偉達、AMD來提供。
“風華1號”的發布大幅提升了國產GPU的渲染能力,從而在5G數據中心渲染性能上能夠對標國外服務器級別顯卡。中國服務器市場規模和潛力非常大,IDC數據顯示,2021年上半年,國內服務器市場出貨量為170.6萬臺,同比增長8.9%;市場規模達到108.1億美元,同比增長12.1%。同時IDC預測,未來五年,中國服務器市場復合增速在12.7%,2025年市場規模預計達到424.7億美金。
2020-2021年中國服務器市場規模(數據來源:IDC)
這一增幅足以說明了加速計算的發展勢頭,龐大的整機制造能力意味著巨量的GPU采購。據IDC預測,中國GPU服務器市場規模到2024年預計可以達到60億美元。未來,“風華1號”或將在5G數據中心、云桌面、工作站等多個關鍵領域迎來發展機遇。
國產GPU生態如何突圍?
風華GPU芯片的發布才是剛剛開始,后面更重要的問題是產品要如何實現規模化商用,國產GPU生態又該如何突圍?
芯動科技工程副總毛鳴明表示,作為一家比較本土化的設計公司,芯動科技可以更貼近客戶,更貼近云游戲的廠商,在硬件設計和定制化方面做一些有差異化的東西。
芯動科技工程副總毛鳴明
在進入新領域的時候不在存量市場上跟巨頭進行PK,芯動科技計劃憑借“風華1號”先立足于國產信創桌面和服務器市場,先把這一塊做好,通過快速的技術升級和產品迭代站穩腳跟,從站住腳的出發點跟著云渲染指數級增長的態勢一同向前發展,等積累到一定程度的時候或許會逐漸進入桌面、筆記本,甚至手機市場,一旦在一個戰場上站住腳以后就可以慢慢發展開來。
信創市場是國產GPU成長的機會,而不是終極目標。國家做信創本身鼓勵的也是更通用、商業化的行為。因此,信創只是一個開始,往后商用的應用場景也會往國產化方向走,不管是軟件還是硬件,芯動科技也是想在信創上站穩腳跟,往更通用的方向走。這是一個動態變化的,當有足夠的技術積累之后就會切入到新的賽道。
長遠來看,芯片技術最終還是需要經年累月的迭代和優化。巨大的研發費用和資本開支是必需,但是下游產業鏈長期、持續的利潤支撐才是芯片長久發展的強力驅動。也就是說,芯片的成功和成熟需要大量的驗證和出貨,而找到可持續的落地場景才是長期發展的關鍵驅動力。所以國產GPU生態要突圍,還必須腳踏實地,從切切實實的好產品開始。
寫在最后
“風華1號”目前正在跟合作伙伴進行適配調優,今年年底之前開始進行商業化的試用和適配,在這個過程中不斷地總結和提升產品的核心競爭優勢。
敖海表示,在“風華1號”向客戶送樣的同時,新一代GPU芯片已經在路上了。先進工藝的強悍迭代能力是芯動的固有優勢,靠自有IP和定制能力以及代工廠合作伙伴的支持,不斷演進先進技術,確保性能持續領先、供應鏈安全和優勢性價比,“芯動計劃在未來三年里持續每年量產兩顆以上、性能不斷大幅度提升的GPU芯片, 并滿足用戶的定制需求。明年初‘風華2號’和‘風華3號’將接踵而至,2022年我們計劃投片5nm加光追技術,賦能國產GPU產業。”
可見,在以芯動科技為代表的這些企業的努力下,我國GPU行業正在加速發展,實現了快速的進步,正一點點敲開外資企業封鎖的大門。
據Verified Market Research數據顯示,2020年中國大陸的獨立GPU市場規模為47.39億美元,預計2027年中國大陸GPU市場規模將超過345.57億美元。
中國大陸獨立GPU市場規模預測(數據來源:Verified Market Research)
這片巨大的市場,吸引著越來越多資本的涌入。同時,隨著政策端對信息關鍵基礎設施自主可控的重視,國產替代浪潮來臨,更是給國產GPU的發展添了一把火。
不過,GPU是一個高技術含量的賽道,而且我國在這一領域發展已經落后許久。盡管近年來突然開始有不少初創公司踏足GPU領域,并受到資本青睞,但我國想要徹底打破GPU壟斷并不是一件易事。
國內投資GPU的熱潮既是商業化的需求,也是國家戰略替代的需求。相較于已有一定積累的CPU來說,我國在GPU方面的發展進度還十分緩慢。目前桌面和移動端的GPU基本被英偉達、AMD、ARM壟斷,所以國產替代的空間和潛能很大,可以說是一個巨大的藍海市場。投資者青睞GPU領域其實也是看好這個市場的巨大發展前景和機會。
但是,毛鳴明認為:“我們也不能忽視這背后的投機屬性。一方面,一些GPU新勢力尚沒有明確自己的細分市場,沒有想清楚未來長遠的發展方向,還只是停留在PPT階段,所以盡管熱度高漲,但真正能用產品說話的企業非常少,尤其是高性能商業化的渲染GPU產品鳳毛麟角;另一方面,GPU技術門檻高,長期被國外行業霸主壟斷,新勢力想要生存必須掌握核心技術,有多年的技術積累和人才資金供給。長遠來看,GPU領域在競爭中將會逐漸由多家公司收斂成屈指可數的幾家公司。”
必須正視的是,現在的GPU市場已經略顯浮躁,很多初創公司通過競相融資來“秀肌肉”,像極了通過比拼燒錢來爭勝負的互聯網公司。其實優秀的硬件產品本身是有利潤的,像英偉達和AMD的利潤都非常高。每一個硬件公司、芯片公司,只有保持良性正循環,不斷通過一個勝利來贏得下一個勝利,這才是真正優秀公司的特質。通過燒錢,遲早會燒出越來越大的窟窿。
記者在采訪中了解到,芯動多年來一直是持續盈利的企業。雖然在不斷投入重大新項目,但是財務管理非常健康,不僅不需要通過融資來燒錢,反而可以通過自身強大造血能力確保供應鏈安全。
所以,新的競爭和涌動或許才剛剛開始。希望芯動科技一馬當先,引領這個潮流!