日前,一個聲稱其成員來自53家公司的組織舉辦了其第一次關于為加速器創建小芯片(chiplet)開放標準的研討會。該研討會的目的是在半導體發展步伐放緩的當下,實現SoC的低成本替代方案。
這個名為“開放特定領域架構(ODSA)”的組織,隸屬于Facebook創建的開放計算項目(Open Compute Project)框架下,他們最近宣布了其第一個開源硅項目。但該項目正面臨技術難題和商業障礙,阻礙了其市場化動力,目前尚不清楚這項躊躇滿志的計劃能否獲得積極響應和廣泛參與。
迄今為止,已經有很多公司早早地創建了自己的 chiplet 生態系統,包括Marvell的MoChi、英特爾的EMIB以及初創公司zGlue提供的產品。而且早在去年夏天,英特爾就已發布了針對其EMIB封裝技術的開源AIB協議,作為其DARPA研究計劃中小芯片研究的一部分。
Chiplet是業界為了彌補硅工藝技術增長放緩所做的幾項努力之一。 它們起源于多芯片模塊,誕生于20世紀70年代,最近在AMD的Ryzen和Epyc x86處理器等產品中作為一種節省成本的技術而重新煥發活力。
“目前所有的多芯片接口都是專有的。我們團隊想要建立的是一個開放接口,讓你可以組裝出最好的芯片,” Netronome工程師,同時也是ODSA的創始人Bapi Vinnakota表示,該公司旨在為OSDA組織提供多核網絡處理器中使用的800Gbps架構提供寄存器傳輸級(RTL)設計。
作為一個開始,其他ODSA成員在研討會上提出以一個簡單的“線束”作為初始物理層接口,它可以以1、2或4 Gbits /秒/ pin的可選速率在有機基板上運行。
未來的接口還可能包括CCIX、112G和56G serdes以及RISC-V TileLink。該組織建議將來使用PCIe PIPE抽象層來實現各種協議和PHY物理層。盡管其成員主要精力在數據中心,但ODSA最終的目標也包括為移動和邊緣系統提供芯片。
ODSA的目標是圍繞PCIe創建快速概念驗證,同時定義其接口。(來源:ODSA)
該組織將研究相干和非相干內存鏈路的混合應用,并采用turbo模式實現雙向流量。 但它似乎拒絕了英特爾的AIB協議,因為其數據速率和引腳排列太有限。
ODSA計劃于年底前展示其基于PCIe的概念驗證。同時,它將充實其PHY、協議以及其他規范。建議工程師們可以在明年開始進行商業化的工作。
該組織還旨在為 chiplets 定義業務流程。ODSA的另一位創始人,NXP公司營銷總監Sam Fuller表示,它將為不同的行業細分提供有價值的建議,并為已知合格芯片(KGD)定義測試認證。他補充說,ODSA還需要吸引包括封裝供應商在內的幾個主要參與者。
ODSA其他活躍成員還包括監督概念驗證的FPGA供應商Achronix公司和提供電源和散熱問題觀點的On Semiconductor公司。初創公司Kandou、SiFive和zGlue也是該組織的聯合創始公司。
大約有70人參加了ODSA首屆活動,其中約20人參加了直播活動。 “每隔兩、三個星期就會有四、五個新的有識之士參與進來,” 該組織的Vinnakota表示,該組織于2018年10月開始與七家公司合作。
三星曾在其北美總部舉辦的活動中討論到ODSA,并表示出其對該組織的支持。
“我們正在定義公司的chiplet策略,僅我個人而言,我看到了很多人對chiplet的濃厚興趣,”三星電子美洲戰略高級主管 Craig Orr說。
“我見過許多公司從3D堆疊中做出引人注目的東西,他們將晶圓最大限度切割并拼接在一起。還有許多網絡公司正在分離I/O芯片,這使得今天的serdes傳輸可以在未來切換到硅光子傳輸,“他說。
隨著成本的上升,“生產前沿工藝節點芯片的公司越來越少,因此如果我們可以通過采用 chiplet 降低成本,這將會給我們帶來更多的客戶,”他補充道。
對于Facebook和其他大型數據中心而言,定義硅芯片是定義一系列系統、電路板和模塊之后的下一個重大飛躍。隨著芯片發熱量上升,目前廣泛使用液體冷卻的價格也水漲船高,這讓他們倍感壓力。
包括AMD、英特爾、英偉達、Qualcomm、賽靈思和人工智能初創公司Graphcore和Habana等公司在內的一個組織,與Facebook合作定義了一個用于冷卻高端芯片的模塊,這個模塊與一個大的咖啡馬克杯一樣大小,被稱為OCP加速器模塊(簡稱OAM),它的設計目標為最多容納8個芯片,在風冷系統中每個芯片的功率達到450W,在水冷系統中高達700W。
該模塊最初只是為追求高性能的AI機器培訓工作而設計,現在Facebook相信它也能用于推理系統。“我們提供了一個700W功率的選項,因為的確有公司在考慮采用,”Facebook硬件工程師Whitney Zhao表示,她談起了英偉達公司與一所大學研究的多芯片GPU。
“450W是頂線,高于450W,冷卻問題就可能對我們產生很大影響。液體冷卻對數據中心會產生巨大影響。 我們需要時間來構建這個基礎設施 - 這是我們現在的主要議題之一。” 她說。
Open Compute成員已經將各種系統用于加速器。(來源:ODSA)
與此同時,包括OAM在內,Facebook和微軟在他們的數據中心中使用了至少五種系統構成封裝,而且還會有越來越多的系統構成出現。Facebook和合作伙伴將在今年開始為新模塊定義通用基板、機箱和托盤。
“我們需要一個開放的加速器基礎架構,” Zhao說,她還提到她在參加ODSA會議后了了解芯片級選項。
對于芯片供應商來說,越來越多的系統目標“令人大開眼界,我們的著陸區就是一份厚厚的菜單,”Netronome公司的Vinnakota說。“我們得決定我們的目標模塊,再搞清楚用哪些產品。簡單來說,答案是目前我們還沒有明確的想法,我們愿意接受任何幫助來搞清楚我們要的是什么。” 他補充說。