曾經,作為電腦的大腦,計算機需要CPU。計算機內存儲的數據、外圍的設備和其他組建要么將數據輸入CPU,要么接受CPU的指令。
后來,為了減輕CPU的壓力,GPU應運而生。雖然GPU的出現是為了減輕CPU在圖像處理方面的壓力,但是由于其優秀的并行處理能力,如今GPU不局限于圖像渲染,還應用于人工智能、深度學習、大數據分析等領域。
到了現在,隨著核心網、匯聚網朝著100G、200G發展,接入網也達到50G、100G,CPU無法提供足夠的算力來處理數據包。因此,出現了“性能帶寬增速比失調”的問題。AWS形象地稱之為“數據中心稅”——還未運行業務程序,接入網絡數據就要占去許多計算資源。
舉一個例子,在云計算場景下,虛擬機之間的數據轉發,通常而言20個VM需要消耗的算力,如果用Xeon的多核CPU來處理大概需要5個核的算力,這是將一筆比很大的開銷。
阿里云彈性計算產品線負責人張獻濤曾經算了一筆賬,阿里云營收規模已經達到上百億元,如果存儲、網絡占用約10%的CPU資源,則意味著年損失10多億元。
因此,為了繼續減輕CPU的負擔,DPU登上舞臺。對于CPU處理效率低下同時GPU也處理不了的負載,就可以卸載到專用的DPU進行處理。
DPU的概念是由英偉達帶火的。在2020年上半年,英偉達以69億美元的對價收購以色列網絡芯片公司 Mellanox Technologies,并與同年推出BlueField-2 DPU,從此拉開了DPU發展的序幕。
英偉達首席執行官黃仁勛表示:“DPU將是未來計算的三大支柱之一。CPU用于通用計算、GPU用于加速計算,而DPU在數據中心移動數據,進行數據處理?!?/p>
DPU競爭開始
DPU最早落地的領域是云計算,很多云服務商早就意識到了問題,AWS從2015年就已經探索DPU的發展,收購芯片廠商Annapurna Labs,推出Nitro芯片。雖然當時還沒有“DPU”這一名字,但Nitro被公認為是DPU的早期形態。之后,2017年AWS正式推出了Nitro,將網絡、存儲和安全任務卸載到基于Arm架構的專用設備上。
同樣是2017年,為了解決隨著云計算業務規模的擴大,資源爭搶、算力損失的問題,阿里云推出了神龍(X-Dragon),通過虛擬化來達到轉接CPU存儲、網絡等基礎功能的目的。很快,阿里云就把天貓雙十一當做試驗場并成功運營,后來上汽成了第一家神龍架構的試驗客戶。
回看過去,我們可以將2017這一年稱之為DPU元年。
三年后英偉達將其命名為DPU之后,才有了一個統一的叫法。目前來看,真正實現大規模商用DPU架構的,全球只有兩家:亞馬遜的AWS,以及阿里云。
而云服務商中,不止亞馬遜與阿里云布局DPU,同樣看中云服務的騰訊云也加入了DPU的研發。以統一算力底座,降低總體成本為目的,騰訊自研了水杉和銀杉兩代DPU。目前,騰訊自研DPU已經支撐公有云外部客戶,以及微信、QQ、騰訊會議等自研業務上云。
去年加入云計算的新成員字節跳動也宣布將自研DPU,計劃通過火山引擎云產品的方式對外服務。
在云廠商的來勢洶洶下,芯片廠商也并非無動于衷。
當初帶火DPU的英偉達,自然對DPU有所部署。英偉達計劃在2022年推出性能更強的BlueField3;到2022年,英偉達計劃推出第三代DPU;2024年推出集成其GPU模塊的BlueField4。
Marvell最新推出的OCTEON 10系列DPU,采用了Armv9架構的Neoverse N2 CPU內核和臺積電5nm制程工藝,支持最新的PCIe 5.0 I/O與DDR5內存。作為DPU的重要補充,Marvell還為OCTEON 10引入了內部機器學習(ML)引擎。這樣,從本質上講,Marvell正在成為英偉達的直接競爭對手。
英特爾也參與戰局,在2021年6月發布首款IPU產品,將其視為云戰略的重要支柱之一,助力數據中心網絡加速走向可編程的分布式架構。2022年4月,英特爾公布收購云解決方案公司Granulate的協議,以提升自身在云計算系統的綜合協調性;2022年5月,英特爾發布第二代IPU,并公布將在2023—2024年間上線第三代IPU的消息?;诙说蕉丝删幊棠芰?,英特爾不斷在“云端”實現高效運算,解鎖數據中心基礎設施的新潛力。
國內DPU初創企業
DPU的賽道上也逐漸出現了中國企業的身影,并且隨著DPU風口的漸起成功融到資金。目前來說,國內比較受到關注的DPU初創企業包括:云豹智能、中科馭數、芯啟源、云脈芯聯、星云智聯、大禹智芯。
今年6月,大禹智芯宣布完成A輪融資,融資金額未公布,該輪融資由前海方舟旗下的智慧互聯產業基金、中原前海基金和齊魯前海基金共同投資,融資資金將用于產品研發和推廣。
云豹智能同樣在6月完成了B輪融資,據悉本輪云豹投后估值約90 億元,而本輪投資方包括騰訊、淡馬錫、深創投、華西村股份旗下投資平臺一村資本、民生銀行上市金融控股平臺民銀資本、耀途資本,這是騰訊第3 次投資這家成立不到 2 年的 DPU 公司。
9月,中科馭數宣布完成超以往輪次融資規模的數億元B輪融資,由金融街資本領投,建設銀行旗下建信股權跟投,老股東靈均投資、光環資本、泉宗資本連續三輪追投。
芯啟源在去年11月完成數億元的Pre-A4 輪融資后,今年3月宣布再獲超億元戰略投資,本輪融資由國家集成電路產業基金旗下子基金上海超越摩爾領投,老股東允泰資本繼續堅定跟投。
可以看到,在DPU的熱潮下,不少初創企業紛紛拿到巨額融資。但作為數據處理的一大將,DPU需要與CPU、GPU同量級的投入,可是市場規模遠不如CPU、GPU。據統計,2021年全球DPU市場規模達到50.7億美元,CPU市場規模則可達532億美元,這其中是10倍的差距。
有業內人士做過一個估算,在終端場景,大芯片的銷量至少需要達到數千萬級別才能有效攤薄一次性的研發成本;在數據中心場景,則需要50萬甚至100萬以上的銷量,才能有效攤薄研發成本。
根據海外做 DPU 的初創公司如 Fungible 和 Pensando 等需要的資深開發人員規模、研發時間、需要購買的 IP 和測試工具以及這些公司融到的資金去估算,開發這樣復雜的高端通用的 DPU 芯片大概需要 3 億美元以上的成本,才能實現客戶量產。
這注定了DPU不可能是一個簡單的創業“游戲”。
DeepTech曾經總結了打造一個成功的 DPU 芯片企業,至少需要兼具的六大條件:一是具備高端芯片開發經驗;二是要有大量商業落地的經驗;三是有成功創業經驗的團隊;四是對云計算客戶業務非常熟悉;五是與云計算大廠客戶緊密合作,有豐富的場景實戰經驗;六是必須要巨額融資。
創始人經歷來看,不少初創公司或缺乏高端芯片開發經驗,或缺乏頭部云服務商合作的經驗等,是否能走到最后還是一個問號。
云豹智能創始人蕭啟陽,博士畢業于美國斯坦福大學,后續在硅谷創辦 RMI 公司;中科馭數創始人鄢貴海是中科院背景;芯啟源,創始人盧笙有銷售 USB 和 TCAM 芯片的背景;大禹智芯創始人李爽是前美團公有云的負責人,對云業務有一定的認識,這四家家公司創始人都有相關背景。
云脈芯聯、星云智聯等企業的創始人在公開資料中,并沒有開發高端芯片和創業的經驗。云脈芯聯創始人劉永鋒是技術出身,曾在阿里和華為工作過,在公開信息沒有查到其創始人有開發高端芯片和創業的經驗;星云智聯,兩位創始人是夏廬生和于勇。夏廬生曾擔任安信證券研究中心通信行業首席分析師,公開信息查不到于勇在芯片行業的背景。
即使強如英偉達,其DPU發布兩年左右,使用的人數也尚且不多,更何況是本就在芯片方面發展相對欠缺的中國芯片初創企業。目前能夠拿出成績的僅有中科馭數、云豹智能兩家企業。
成立僅一年后,中科馭數第一顆芯片就已成功完成流片,并取得了業界數據庫與時序數據處理融合加速芯片零的突破。中科馭數的第三代DPU芯片的研發迭代也已經接近尾聲。中科馭數第二代DPU芯片K2已于今年年初投片,預計在10月回片。
云豹的第一款 DPU SoC(系統級芯片)正在開發階段,計劃于明年量產。去年底云豹已發布基于 FPGA 版本的 DPU 云霄。
與 CPU、GPU 等一樣,DPU 結構復雜、開發周期長、投入大。起步于2020 年和 2021 年的中國DPU初創企業,算上前期團隊組建時間,開發周期也僅在 1 年左右,何時能出現量產的產品是市場都在期待的。
總結
實際上,梳理中國DPU行業商業模式后,能將其分為兩種。
一種是以芯啟源為代表的,通過自研中高級軟件、外購處理器和網絡芯片的方式,這類方式門檻適中,DPU產線核心研發團隊需至少10人,預判在5至8年收回前期成本。
另一種是以中科馭數和云豹為代表的,自研處理器微架構和中高級軟件,外購網絡芯片的方式,這類方式門檻較高,DPU產線核心研發團隊需具備至少40人。
DPU沒有統一的標準、需要與云計算基礎設施緊密綁定、產品的通用性問題、沒有明確的大客戶,這些都是DPU創業會遇到的問題。
目前要解決DPU標準化應用,還存在一定挑戰。由于數據中心本身的復雜性,各大廠商一方面采用商用現貨組件(即COTS)來構建系統,追求低成本,一方面又設法分層服務化,打造面向不用類型客戶的標準化產品,但除此之外的所有技術實現幾乎都是“八仙過海,各顯神通?!?/p>
中科馭數創始人鄢貴海也表示:“有的廠商強化IO能力、有的關注路由轉發、有的重視存儲卸載、有的關注安全加密,不一而足。”而上層負載不同,也必然對底層架構有各異的需求,這也許是目前DPU標準化面臨的最大挑戰。
更多信息可以來這里獲取==>>電子技術應用-AET<<