AI芯片的發展,離不開人工智能技術的成熟。人工智能從1956年誕生至今,共經歷過三次大的浪潮。進入21世紀,由于計算機性能的提升和海量數據的產生,以及機器學習和CNN技術(Convolutional Nerual Networks,卷積神經網絡)獲得突破,算法、算力和數據都滿足了人工智能的商業化落地需求,人工智能迎來了高速發展的階段。
實際上,人工智能產業得以快速發展,離不開目前唯一的物理基礎——芯片。可以說,“無芯片不AI”,能否開發出具有超高運算能力、符合市場需求的芯片,已成為人工智能能否可持續發展的重要因素。
近年來,AI芯片產業發展迅猛,眾多企業紛紛布局。但從芯片的起步、發展、成熟的三個階段來看,人工智能芯片仍然處于起步階段。
巨頭新銳,共遇產業瓶頸
按應用場景的不同,AI芯片設計可分為云端訓練、云端推斷、終端推斷三部分。其中云端訓練芯片主要以英偉達的GPU為主,新入競爭者是谷歌的TPU,以及深耕FPGA的賽靈思與英特爾。在云端推斷方面,代表企業有AMD、谷歌、英偉達、百度、寒武紀等。
在終端推斷方面,由于移動終端、自動駕駛等應用場景需求逐漸爆發,布局企業包括傳統芯片巨頭和初創企業,如高通、華為海思、地平線、寒武紀、比特大陸等。
不難發現,在市場格局上,雖然目前都是傳統芯片巨頭占據著AI芯片市場的霸主地位。但AI芯片落地難,是困擾巨頭與新銳的共同問題。
來源:清華大學未來芯片創新中心
地平線聯合創始人兼副總裁黃暢告訴億歐科創:AI芯片落地之所以難,首先是大家技術上都遇到了共同的瓶頸,也是所謂的“馮·諾依曼瓶頸”。
提高AI芯片性能的關鍵之一,在于支持高效的數據訪問。在傳統馮·諾伊曼體系結構中,數據從處理單元外的存儲器提取,處理完之后再寫回存儲器。AI芯片本身基于馮·諾伊曼體系結構,使用簡單的功能是完全沒問題的。
但由于運算部件和存儲部件存在速度差異,當運算能力達到一定程度,由于訪問存儲器的速度無法跟上運算部件消耗數據的速度,再增加運算部件也無法得到充分利用,即形成所謂的馮·諾依曼瓶頸,或“內存墻”問題,這是長期困擾計算機體系結構的難題。
目前常見的方法是利用高速緩存(Cache)等層次化存儲技術,盡量緩解運算和存儲的速度差異。然而,AI芯片中需要存儲和處理的數據量遠遠大于之前常見的應用。這都使得馮·諾依曼瓶頸問題在AI應用中愈發嚴重。“可以不夸張地說,大部分針對AI提出的硬件架構創新都是在和這個問題做斗爭。”黃暢補充道。
不過,也正是由于人工智能芯片的技術難題,導致不論是巨頭還是新銳都處于同一起跑線,這給國產企業提供了良好的超越“賽道”。這也避免了傳統巨頭利用自身已有優勢,快速甩開對手。
問鼎全球,如何彎道超車
19年6月20日,寒武紀推出第二代云端“思元270”;6月21日,華為發布人工智能手機芯片“麒麟810”;7月3日,百度發布人工智能芯片遠場語音交互芯片“鴻鵠”;10月29日,地平線發布AIoT邊緣計算人工智能芯片“旭日二代”。
可以發現,國產企業在AI芯片領域的布局已初見雛形,有一戰之力。但想問鼎全球,仍需改善一些不足。
針對國產AI芯片的發展,中國工程院院士倪光南多次表示,芯片設計門檻極高,只有極少數企業能夠承受中高端芯片研發成本,這也制約了芯片領域創新。我國可以借鑒開源軟件成功經驗,降低創新門檻,提高企業自主能力,發展國產開源芯片。
“開源軟件正成為當前軟件產業的主流,芯片產業也可以采用開源這種模式。”倪光南強調,目前在芯片開發方面,新的RISC-V指令集是一種能夠降低處理器芯片IP成本的新模式。企業可以自由免費使用RISC-V進行CPU設計、開發并添加自有指令集進行拓展等。RISC-V對于當前AI芯片架構的優化,成本的控制,都有很好的效果。
關于AI芯片架構,其實我國企業已有不少可圈可點的案例,例如華為的達芬奇架構,寒武紀的Cambricon-X架構,鯤云科技的CAISA架構,地平線的伯努利架構等。
比起人工智能芯片架構,我國更應該關注人工智能芯片的產業鏈完整度。
我國制造芯片的最新設備和工藝比國際先進水平落后多代,因此一些人工智能芯片需要送到境外進行制造和封裝。這就會造成芯片產量不足,以及價格過高的問題。使得下游很多使用其模組的產品無法量產,造成惡性循環,不利于行業的發展。
作為國內邊緣側AI芯片領域的先行者,嘉楠科技早在2016年就掌握了16nm制程工藝,之所以現階段的AI芯片制程工藝仍為28nm,主要也是受價格和出貨量的限制。
賽迪顧問《中國人工智能芯片產業發展白皮書》顯示,中國人工智能芯片市場規模保持高速增長。云端領域,2018年云端市場全球占比17.0%;預計2021年將達221.5億元,CAGR達 51.23%。終端領域,2021年將達84.1億元,CAGR為59.3%。
面對如此廣闊的市場,希望國產企業能潛心突破瓶頸,問鼎全球。
作者:張偉超