據(jù)enterpriseai報道,目前市場上有80多家AI芯片供應(yīng)商和初創(chuàng)公司,每家公司都表示,在為廣泛的行業(yè)和用途構(gòu)建AI芯片時,他們都有一個更好的主意。
這樣的情況同樣出現(xiàn)在擁有3年歷史的無晶圓廠AI芯片公司SimpleMachines身上。據(jù)報道,他們正在憑借自己獨特的設(shè)計去挑戰(zhàn)Nvidia和Marvell這樣的芯片巨頭。當(dāng)然,像他們這樣的初創(chuàng)公司也是其挑戰(zhàn)對象。其說憑借的就是他們所說的不同方法去解決AI計算的難題。
SimpleMachines的創(chuàng)始人兼首席執(zhí)行官Karu Sankaralingam說,這始于公司所謂的算法自適應(yīng)AI芯片,程序員可以對其進行定制,以快速,無縫地滿足其工作流程的需求。
這個想法催生了Mozart:該公司的首個AI芯片,該芯片針對推理進行了優(yōu)化,在設(shè)計中使用了16納米工藝,HBM2高帶寬內(nèi)存和PCIe Gen3x16尺寸。Sankaralingam告訴EnterpriseAI,公司的Mozart芯片現(xiàn)在正在送樣,正在接受客戶評估。他說,Mozart芯片是由芯片制造商臺積電生產(chǎn)的,具有完整的軟件和硬件堆棧,可讓數(shù)據(jù)科學(xué)家運行程序而無需擔(dān)心背后的問題。
Sankaralingam說,Mozart之所以能夠在AI芯片領(lǐng)域脫穎而出,是因為它可以在一個芯片上同時運行多個AI模型。
他說:“之所以發(fā)生這種情況,是因為我們的芯片在內(nèi)部分為64個不同的模塊,如果有必要,程序員可以對其進行尋址并同時運行64個不同的應(yīng)用程序或模型。” “然后,開發(fā)人員可以編寫64個不同的模型,并且可以在一芯片硅片上同時運行64個模塊(如果需要)。
Mozart的軟件堆棧包括直接的TensorFlow支持以及C / C ++和Python的API,使程序員和數(shù)據(jù)科學(xué)家可以使用它。
Mozart可以以稱為Accelerando的PCIe卡形式購買,也可以通過SimpleMachines的Symphony Cloud Service進行使用,該服務(wù)可以訪問Azure,Google Cloud Platform和AWS等公有云,本質(zhì)上是一種AI-as-a -服務(wù)交付模式。初始測試顯示了可以同時運行的推薦引擎,語音和語言處理以及圖像檢測的用例。將來,帶有Mozart芯片的Accelerando卡將在標(biāo)準(zhǔn)OEM廠商的系統(tǒng)中出售,例如Dell和Supermicro。
不同的方法
Moor Insights&Strategy的HPC和機器學(xué)習(xí)高級研究分析師Karl Freund表示,近年來他在AI芯片和軟件的”寒武紀(jì)大爆發(fā)“中看到了十幾種獨特的AI芯片設(shè)計,但是SimpleMachines的Mozart設(shè)計不同于大多數(shù)設(shè)計。
”像所有的AI初創(chuàng)公司一樣,他們聲稱性能出色,但是現(xiàn)在還不能斷言他們的說法“ Freund說。”他們的內(nèi)存架構(gòu)給人留下了深刻的印象,這種架構(gòu)看上去優(yōu)雅而簡單,這將使繁重的軟件工作變得更容易解決。在軟件方面,他們還有很多工作要做,例如對PyTorch的支持。但是隨著平臺的成熟,他們似乎正在朝著正確的方向前進,這值得進一步跟蹤。“
AI芯片要求不斷變化
他說,新型Mozart AI芯片的靈感之一是Sankaralingam正在進行的研究,該研究指出需要一種新型的架構(gòu),以適應(yīng)當(dāng)今的大數(shù)據(jù)時代。Sankaralingam還是威斯康星大學(xué)麥迪遜分校的計算機科學(xué)教授,他在那里任教14年。
Sankaralingam說,當(dāng)前的芯片平臺,甚至包括為特定要求而構(gòu)建的定制芯片,都無法滿足這些需求。”應(yīng)用呈爆炸式增長,因此,它不再只是處理圖像了。它是文本到語音乘以重要數(shù)據(jù)的時間,并且變化迅速且不斷增長,然后每六個月突破一次。公司的機會是市場需要大量的計算效率,而GPU卻無法滿足他們的需求。這些趨勢使我們意識到,針對一個AI問題的專用定制芯片已經(jīng)面世。“
他說,借助Mozart,這些挑戰(zhàn)得以解決,因為可以通過使用芯片的深度軟件堆棧即時重新編程來更改芯片上的項目需求。
他說:”我們正在與客戶的討論中,他們都說過不同的公司如何使用不同的模型,許多公司正在使用許多模型。“ ”這使我們再次審視了關(guān)于AI計算必要條件的假設(shè)。能力和效率并不是唯一的指標(biāo),另一個重要的指標(biāo)是算法適應(yīng)性。GPU之所以會出現(xiàn),是因為它們具有很高的適應(yīng)性。“
Sankaralingam說,使用另一種方法,SimpleMachines的策略是忽略應(yīng)用正在嘗試執(zhí)行的操作,而轉(zhuǎn)向算法。”我們觀察到,許多或所有這些算法從根本上分解為四種行為:數(shù)據(jù)收集,計算,控制和同步。我們可以使用這些行為對算法進行分類。然后,我們構(gòu)建一個個可以將應(yīng)用分解為這些行為的編譯器,并將該信息提供給我們的硬件。“
他說,然后硬件不再執(zhí)行指令,獲取,分支中斷器和緩存,而是實現(xiàn)了這四種行為。
Sankaralingam說:”這就是我們需要對它們進行編程的全部,作為一名程序員,您可以在TensorFlow中編寫這些代碼,然后提取出這些行為并將其映射到我們的芯片上。“ ”這是一個很大的平行轉(zhuǎn)變。“
Mozart的體系結(jié)構(gòu)將任何軟件應(yīng)用程序抽象為少量已定義的行為,然后使用SimpleMachines自己的編譯器集成到TensorFlow等標(biāo)準(zhǔn)AI框架的后端。據(jù)該公司稱,這使得架構(gòu)可以實時轉(zhuǎn)換這些程序并重新配置硬件,從而產(chǎn)生一種芯片,其性能就像最初為該應(yīng)用程序設(shè)計的一樣。
SimpleMachines認為其Mozart AI芯片將在公共數(shù)據(jù)中心,網(wǎng)絡(luò)安全,金融和保險市場中看到機遇,并在未來的邊緣和移動設(shè)備市場中為其路線圖上即將推出的產(chǎn)品提供更多機遇。