《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > Cerebras全球最大芯片WSE升級二代:參數(shù)翻番,功耗不變

Cerebras全球最大芯片WSE升級二代:參數(shù)翻番,功耗不變

2021-04-22
來源:電子工程專輯
關(guān)鍵詞: Cerebras WSE 最大芯片

  4月20日,Cerebras Systems 公司再次刷新歷史,推出為超級計算機(jī)任務(wù)而打造的第 2 代 Wafer Scale Engine (WSE-2)芯片。與一代WSE相比,WSE-2雖然在面積上沒有變化,但卻擁有創(chuàng)紀(jì)錄的 2.6 萬億個晶體管以及 85萬個 AI 優(yōu)化的內(nèi)核,芯片的所有性能特征,包括:晶體管數(shù)、內(nèi)核數(shù)、內(nèi)存、內(nèi)存帶寬和結(jié)構(gòu)帶寬,均比一代增加了一倍以上。

  差不多兩年前(2019年8月),SeaMicro 創(chuàng)始人安德魯·費爾德曼(Andrew Feldman)創(chuàng)辦的 Cerebras  Systems 公司公司,揭開了芯片設(shè)計領(lǐng)域的一場革命,他們將整片晶圓制成了一個巨大的芯片。

微信圖片_20210422110041.jpg

  以往的芯片制造流程,是從硅錠切下一片晶圓后在Fab中進(jìn)行加工,一片晶圓能被切成數(shù)百顆獨立的芯片。而這顆名為晶圓級引擎(Wafer Scale Engine,WSE-1)的處理器直接把整片晶圓做成了一顆芯片,面積與12英寸晶圓所能截取的最大矩形面積一樣——比iPad還大。

  不過,這顆芯片的每一塊區(qū)域都能被稱為內(nèi)核,它們以一種復(fù)雜的方式與其他內(nèi)核相互連接。互聯(lián)的設(shè)計是為了保持所有內(nèi)核的高速運轉(zhuǎn),以便所有晶體管能夠作為一個整體一起工作。在 2019 年推出的WSE-1中,Cerebras 融入了 40 萬個內(nèi)核和 1.2萬億個晶體管,采用的是 16 納米工藝進(jìn)行制造,可同時專注于AI和HPC(High Performance Computing,高性能計算機(jī)群)工作負(fù)載。

  更狠的第二代(WSE-2)來了

微信圖片_20210422110108.jpg

  4月20日,Cerebras Systems 公司再次刷新歷史,推出為超級計算機(jī)任務(wù)而打造的第二代 Wafer Scale Engine (WSE-2)芯片。與一代WSE相比,WSE-2雖然在面積上沒有變化,但卻擁有創(chuàng)紀(jì)錄的 2.6 萬億個晶體管以及 85萬個 AI 優(yōu)化的內(nèi)核,芯片的所有性能特征,包括:晶體管數(shù)、內(nèi)核數(shù)、內(nèi)存、內(nèi)存帶寬和結(jié)構(gòu)帶寬,均比一代增加了一倍以上。

微信圖片_20210422110123.jpg

  這得益于WSE-2采用基于臺積電(TSMC)的N7工藝(7nm)打造,使得邏輯電路可以按比例縮小,并在一定程度上縮小了SRAM,讓新芯片上可以容納更多AI內(nèi)核。Feldman 說,有了這樣的先進(jìn)工藝支持,Cerebras 可以在同樣的8*8英寸,面積約46225mm2的芯片中塞進(jìn)更多的晶體管。

微信圖片_20210422110142.jpg

  WSE-2與一代對比(圖自:AnanTech)

  值得注意的是,在功能提升的前提下,Cerebras還能夠保持其系統(tǒng)功耗不變(23 kW)。

微信圖片_20210422110158.jpg

  對比市場上第二大AI處理器,英偉達(dá)的Ampere A100面積約為826mm2,具有0.054萬億個晶體管。WSE-2比它多了2.55萬億個晶體管;內(nèi)核數(shù)是A100的123倍;緩存是其1000倍;可提供的內(nèi)存帶寬,則達(dá)到了A100的13萬倍。

  Cerebras還引用了1000倍的板載內(nèi)存,帶有40 GB的SRAM,而Ampere A100則為40 MB。

微信圖片_20210422110211.jpg

  最初推出WSE-1的時候,很多人擔(dān)心這么大的晶圓做芯片,萬一其中一塊不良,是否整個報廢?對此Cerebras解釋說,他們通過設(shè)計一種可以繞開任何制造缺陷的系統(tǒng)來實現(xiàn)100%的良率,核心與帶有FMAC數(shù)據(jù)路徑的2D Mesh連接

  Cerebras在WSE-1用了1.5%的額外核心來容納缺陷,但由于臺積電工藝的提升,這個數(shù)值被進(jìn)一步縮小了。

  晶圓級引擎存在的意義

  WSE的出現(xiàn),是因為訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要花費較多的時間,即便是當(dāng)今最先進(jìn)的模型,也需要幾天或幾周的時間進(jìn)行訓(xùn)練,大型網(wǎng)絡(luò)則需要數(shù)周。通常做法是在數(shù)十、數(shù)百甚至數(shù)千個GPU上進(jìn)行分布式訓(xùn)練,以使訓(xùn)練時間更可控。

  其中最大的瓶頸,是這些龐大的處理器集群很難編程,而且數(shù)據(jù)必須在處理器和外部 DRAM 存儲器之間進(jìn)行多次傳輸,既浪費時間又消耗能源。所以WSE研發(fā)團(tuán)隊的初衷是擴(kuò)大芯片,使它與 AI 處理器內(nèi)核一起容納所需的所有數(shù)據(jù),一個CS-2的性能相當(dāng)于整個GPU集群的性能,同時具有單個設(shè)備的簡單性……

微信圖片_20210422110228.jpg

  其設(shè)計的關(guān)鍵是自定圖形編譯器,采用pyTorch或TensorFlow將每一層映射到芯片的物理部分,從而允許在數(shù)據(jù)流過時進(jìn)行異步計算。擁有如此大的處理器意味著數(shù)據(jù)永遠(yuǎn)不會掉隊,也不需要在內(nèi)存中等待,不浪費功率,并且可以以流水線的方式連續(xù)地移至計算的下一個階段。編譯器和處理器的設(shè)計還考慮到了稀疏性,無論批處理大小如何都可以實現(xiàn)高利用率,或者可以使參數(shù)搜索算法同時運行。

微信圖片_20210422110248.jpg

  Cerebras設(shè)計的獨特性,讓它能夠超越制造過程中出現(xiàn)的常見物理限制,即標(biāo)線限制。處理器的設(shè)計限制,往往取決于芯片的最大尺寸,因為很難通過Cross link連接兩個區(qū)域。這是Cerebras的殺手锏之一,該公司仍然是唯一一家能提供這種規(guī)模處理器的公司。

微信圖片_20210422110303.jpg

  在Hot Chips 2020,該公司首席硬件架構(gòu)師Sean Lie表示,Cerebras對客戶的主要好處之一是能夠簡化工作負(fù)載,以前需要使用GPU / TPU機(jī)架的工作,現(xiàn)在可以以計算相關(guān)的方式在單個WSE上運行。

  產(chǎn)品和合作伙伴

  Cerebras的第一代WSE作為CS-1的完整系統(tǒng)的一部分一起打包出售,不少實驗室與計算機(jī)中心已經(jīng)部署了Cerebras WSE和CS-1。

微信圖片_20210422110326.jpg

  愛丁堡大學(xué)的超級計算中心,利用WSE進(jìn)行自然語言處理、基因組學(xué)和COVID-19的相關(guān)研究。

  在美國阿貢國家實驗室(ANL),WSE被用于COVID-19研究、重力波檢測和材料發(fā)現(xiàn)等;并且在癌癥療法研究中,使癌癥模型的實驗周轉(zhuǎn)時間,減少了300倍以上。

  制藥企業(yè)葛蘭素史克的高級副總裁金·布蘭森表示:“其增加了生成的編碼器模型的復(fù)雜性,同時將訓(xùn)練時間減少了80倍。”

  Lawrence Livermore將一臺CS-1與其23 PFLOP“拉森”超級計算機(jī)配對。匹茲堡超級計算機(jī)中心以500萬美元的價格購買了兩個系統(tǒng),并將這些系統(tǒng)連接到他們的Neocortex超級計算機(jī)上,以實現(xiàn)同步AI和增強(qiáng)的計算能力。

  對于WSE-2的應(yīng)用,國際調(diào)研公司Tirias Research首席分析師Jim McGregor認(rèn)為:“顯然,對用于大型數(shù)據(jù)集的Cerebras晶圓級解決方案,有些公司和實體很感興趣。但是在企業(yè)層面,還有數(shù)百萬的其他AI應(yīng)用,以及一些Cerebras不能處理的情況,這就是英偉達(dá)擁有SuprPod和Selene超級計算機(jī)的原因。與英偉達(dá)相比,Cerebras更像是一個小眾平臺,二者的廣度無法相提并論。”

  目前Cerebras在多倫多、圣地亞哥、東京和舊金山擁有約300名員工。該公司首席執(zhí)行官安德魯·費爾德曼(Andrew Feldman)表示,作為一家公司,他們已經(jīng)實現(xiàn)了盈利,已經(jīng)部署了CS-1的客戶很多,并且在啟動商業(yè)系統(tǒng)時已經(jīng)有更多的客戶在遠(yuǎn)程試用CS-2。

微信圖片_20210422110346.jpg

  除了AI之外,由于芯片的靈活性使流體動力學(xué)和其他計算仿真成為可能,因此Cerebras在典型的商業(yè)高性能計算市場(例如石油、天然氣和基因組學(xué))中吸引了很多客戶。

  CS-2的部署將于今年晚些時候的第三季度開始,價格已從2-3百萬美元升至“幾百萬”美元。

  

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 日日干狠狠 | 国产一卡2卡3卡不卡 | 亚洲国产精品v在线播放 | 亚洲大成色www永久网 | 欧美一区二区三区视频 | 亚洲国产聚色窝 | 男人和女人日皮视频 | 亚洲欧美日韩另类在线一 | 亚洲日本天堂 | 天天干伊人 | 香港三级日本三级三级人妇 | 欧美性猛交xxxxx按摩国内 | 国产天堂网 | 青草国产视频 | 你懂得在线播放 | 人人澡 人人澡 人人看欧美 | 亚洲精品午夜在线观看 | 福利免费观看 | 欧美日本免费观看αv片 | 日韩欧美在线视频 | 欧美日在线| 免费一级毛片在线播放视频 | 天天综合色网 | 一级黄色片一 | 一级特黄特黄的大片免费 | 免费观看黄色 | 亚洲成a人不卡在线观看 | 欧美日韩性生活 | 日本一视频一区视频二区 | 国产精品成人免费视频 | 午夜伦理网 | 性xxxx毛茸茸俄罗斯 | 国产aⅴ一区二区三区 | 欧美色综合高清视频在线 | 免费人成在线观看 | 亚洲精品永久www嫩草 | 天天插天天射天天干 | 1717she永久精品免费 | 黑丝美脚 | 免费簧网站永久在线播放国产 | 黄色一级视频免费观看 |