最近,英特爾推出了第二代神經擬態(tài)芯片Loihi2和用于神經啟發(fā)應用程序的開源軟件框架Lava。并且,Loihi2采用Intel4工藝的預生產版本制造。使用極紫外光刻技術簡化布局設計規(guī)則,使得快速開發(fā)Loohi2成為可能。
在AI芯片方面,除了英特爾推出的神經擬態(tài)芯片,百度也在8月18日的百度世界大會上宣布第二代自研AI芯片——昆侖2正式量產。公布即量產,可以看出百度對于昆侖芯片的自信。
自1956年的Dartmouth學會上,人工智能的概念誕生。經過了半個多世紀的發(fā)展,麥卡錫提出的人工智能在機器人、語音識別、圖像識別等領域都不斷發(fā)展。而在人工智能發(fā)展的過程中,必然不會缺少的就是AI芯片。
目前對于AI芯片并沒有明確的定義,廣義上所有面向AI應用的芯片,包括訓練和推理應用的芯片都可以稱為AI芯片。
幾乎所有的科技巨頭都已開始布局,除了百度、英特爾兩家企業(yè),特斯拉也推出了號稱全球算力最高的自研AI芯片。AI芯片行業(yè)巨頭英偉達市值一度被推至5000億以上。
AI芯片的市場注定是一場激烈的斗爭。
資本的涌入
2017年左右掀起了一輪新的AI熱潮。AlphaGo戰(zhàn)勝人類頂級棋手柯潔,橫掃圍棋界,一時間學界開始了又一輪的AI研究。
在最近三年級,AI芯片領域出現了兩筆超級融資,壁仞科技在新創(chuàng)18個月就融資超過47億元,創(chuàng)下國內芯片創(chuàng)業(yè)公司的最大融資記錄。摩爾線程成立不到一年,估值超百億,融資數十億。
就單從2021年開年后看,AI芯片行業(yè)至少有20多起公開融資,而已公布的投融資金額及加起來,合計已達到約200億人民幣,其中有至少8起單筆融資的金額逾10億人民幣,單筆最高融資達53.5億人民幣。
國內的云端AI芯片創(chuàng)業(yè)公司擁有超強的吸金能力。
致力于打造高性能GPU的沐曦集成電路有限公司8月27日宣布完成10億元人民幣A輪融資。
2021 年 1 月,燧原科技完成 18 億人民幣 C 輪融資。其實在去年 5 月,燧原科技就完成 7 億人民幣 B 輪融資,領投方為半導體產業(yè)基金武岳峰資本,老股東騰訊繼續(xù)跟投。
2021年3月1日,云端服務器級的通用高性能計算芯片的天數智芯宣布完成C輪12億元融資。
摩爾線程在成立后的短短100天,即獲深創(chuàng)投、紅杉資本中國基金、GGV紀源資本等眾多機構的青睞,融資金額已達數10億。
可重構存算AI芯片的提出者千芯半導體(TensorChip)在3月22日公布完成了數千萬人民幣融資。
9月22日,黑芝麻智能宣布今年已經完成數億美元的戰(zhàn)略輪及C輪兩輪融資。戰(zhàn)略輪由小米長江產業(yè)基金、富賽汽車等國內產業(yè)龍頭企業(yè)參與投資。
在深圳的墨芯人工智能,其自稱是唯一擁有動態(tài)稀疏和靜態(tài)稀疏技術的企業(yè),在今年的1、3月份分別宣布獲得新融資。
如此強大的吸金能力,能夠看出資本方對于AI芯片企業(yè)的看好。
無論資本市場如何火熱,檢驗AI芯片創(chuàng)企們長期發(fā)展實力的關鍵準則,最終會回歸到產品實際性能和落地能力上來。
AI芯片落地難點
AI芯片已經進入肉搏期。相比起一度火熱的概念潮,目前比拼的是誰能夠率先落地產品、構建生態(tài)。
現在的問題成為了:進入了哪些場景?合作了哪些客戶?有沒有軟硬一體化方案?是否已經有標桿案例?
AI芯片落地難的原因可能有很多個。例如,神經網絡中的卷積運算加速對于功耗的增加,當算力翻倍,除了硬件成本增加,電力供應和電費成本更是一個瓶頸。從芯片技術到算法理論的創(chuàng)新,是一個原因。
還有芯片研發(fā)速度小于AI語言的研發(fā)速度,當出現合適的芯片時,其采用的AI語言可能已經過時。這對于能否量產打出了一個問號。
Rokid北京AI實驗室負責人高鵬在鈦媒體的采訪中說,“衡量一塊芯片成功與否的標準,就是看它能否大規(guī)模的應用于產品。” 云知聲創(chuàng)始人黃偉也曾表示:“我們的芯片是有客戶的,不是PPT造芯,更不是自嗨。“
落地難更重要的原因還是在應用場景的設計。缺乏殺手級應用使得現有的AI芯片沒有清晰的定位,無法高度優(yōu)化PPA。支撐AI芯片的不僅僅是AI計算,更要面向場景,實現完整的功能。
“每個規(guī)格的芯片都有自己的特性,有些芯片非常便宜,性能就會差,無法支持諸如打斷喚醒這種前端能力,這類芯片就適合高性價比產品;像 Rokid KAMINO18這樣的AI 芯片,支持4麥陣列,就很適合智能音箱場景。”圖靈機器人兒童事業(yè)部總監(jiān)劉峰表示。
除去殺手級應用場景的缺乏,很多半導體投資人都表示,誰能在自己的產品賽道上率先突破生態(tài),誰就能存活下來。
所謂的AI芯片生態(tài)指的是,芯片上整個軟件棧來支持AI框架,而AI應用程序則是基于這些框架開發(fā)的。軟件棧包括驅動程序、編譯器、函數庫、算字庫、工具包等等,是實現高性能、高通用性、高易用性,以及針對不同應用場景深度優(yōu)化的關鍵。
生態(tài)搭建的難度和時間,遠比芯片開發(fā)要更難、更長。
安謀中國AI技術高級市場經理吳彤曾表示,ASIC定制類的AI芯片會在未來的五到十年內成為市場上的主流,與此同時,AI芯片領域專用架構(DSA)也將開始流行。
針對不同的應用場景,客戶的需求并不統(tǒng)一。一個可以商用的AI芯片除去自身芯片的研發(fā),更多的時間還是花在了創(chuàng)造生態(tài)上。
在AI訓練芯片領域,國際巨頭英偉達一家獨大,云端訓練芯片上,很少有公司能夠突破英偉達生態(tài)。在英偉達快速擴大中,生態(tài)成為了他的“護城河”。在2019年,云廠商亞馬遜、谷歌、阿里巴巴中97.4%的人工智能加速器都部署了英偉達的圖形處理器。
生態(tài)的改變絕非一朝一夕的事。
國內廠商的芯片落地
2018年,騰訊戰(zhàn)略領投了燧原科技。燧原科技的通用AI訓練芯片專為人工智能計算領域而設計,基于這種芯片的AI加速卡、燧原智能互聯(lián)技術,以及“馭算”計算及編程平臺可實現深度全棧集成,為編程人員提供針對性的加速AI計算。
面向AI云端訓練,邃思2.0在7月份正式發(fā)布。
尺寸為57.5毫米×57.5毫米(面積為3306mm2),達到了芯片采用的日月光2.5D封裝的極限,與上代產品一樣采用格羅方德12nm工藝,單精度FP32算力為40TFLOPS,單精度張量TF32算力為160TFLOPS,整數精度INT8算力為320TOPS。
燧原產品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內容生產;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數據,構建新型智能化交通;高效推理算力集群,建設園區(qū)AI視頻云。
中科寒武紀,寒武紀科技的終端智能處理器IP主要產品有2016年推出的寒武紀1A處理器、2017年推出的寒武紀1H處理器、2018年推出的寒武紀1M處理器;云端智能芯片及加速卡產品有2018年推出的思元100、2019年推出的思元270、2021年初正式亮相的思元290;邊緣智能芯片及加速卡為思元220,推出時間為2019年。
寒武紀科技面向云、邊、端三大場景研發(fā)了三種類型的芯片產品。
分別為終端智能處理器IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡,并為上述三個產品線所有產品研發(fā)了統(tǒng)一的基礎系統(tǒng)軟件平臺(包含應用開發(fā)平臺)——Cambricon Neuware軟件開發(fā)平臺(適用于其所有芯片與處理器產品)。
中星微,于 2016 年 6 月率先推出全球頭先款具有深度學習能力的嵌入式神經網絡處理器(NPU)人工智能芯片——“星光智能一號”,其后又于 2018 年推出運算速度提高 16 倍、功耗降低50%、適用場景更廣的“星光智能二號”(NPU-II)人工智能芯片。
在今年9月的中關村論壇上,中星微發(fā)布了后摩爾時代下的新一代人工智能機器視覺芯片——“星光摩爾一號”。
“星光摩爾一號”是面向邊緣計算的人工智能機器視覺芯片,可廣泛應用于各類機器視覺邊緣計算。支持800萬像素的圖像處理、視頻編解碼、安全加解密和異構智能計算,其視頻編解碼提供國標SVAC2.0與H.265兩種格式的自由切換和轉碼,支持國標35114的A、B、C三種安全級別,提供4TOPS的深度學習峰值算力并支持多模融合智能計算框架。
地平線機器人(Horizon Robotics)。成立于 2015 年,總部在北京,創(chuàng)始人是前百度深度學習研究院負責人余凱。
地平線機器人在2021年先后發(fā)布了芯片征程5、Matrix 5平臺和Matrix SuperDrive整車智能解決方案,并將推出國內首個開源安全實時操作系統(tǒng)TogetherOS。9月15日,搭載了地平線旭日3芯片,科沃斯發(fā)布了最新一代掃地機器人地寶X1也成為了業(yè)內首款搭載AI專用芯片的掃地機器人。
除去掃地機器人芯片的使用,征程2則是商用落地的車規(guī)級AI芯片。該芯片現已應用于智能輔助駕駛、高級別自動駕駛、高精建圖與定位,以及智能座艙等智能駕駛場景。基于軟硬結合的創(chuàng)新設計理念,可提供4 TOPS等效算力,典型功耗僅2瓦;而且具有極高的算力有效性,每TOPS算力可達同等算力GPU的10倍以上。
靈汐科技,類腦芯片KA200入選2021年世界互聯(lián)網領先科技成果“提名項目”。該系列產品可廣泛應用于云端和邊緣計算,滿足眾多傳統(tǒng)人工智能企業(yè)的智能化升級需求,促進智慧城市、智能網聯(lián)車等眾多相關行業(yè)的發(fā)展和變革。
不僅能高效支持類腦計算模型和大規(guī)模腦仿真,為腦科學領域提供有利工具。同時,還可助力構建更大、更快、更精準的功能級腦仿真平臺,推動腦科學與類腦算法的研究和類腦生態(tài)構建。
計算機科學與腦科學融合的類腦芯片KA200,采用異構融合眾核、存算一體的架構,單芯片集成25萬神經元和2500萬突觸,每秒超過16萬億次突觸計算,功耗近12瓦。KA200已經于2021年實現量產。
并且基于KA200構成了完整的產品體系,如類腦計算板卡、類腦計算模組、類腦服務器、軟件工具鏈和系統(tǒng)軟件以及類腦整體解決方案。
國內本土的AI芯片在不同場景應用中發(fā)力。
燧原科技面向云端訓練,瞄準具體商業(yè)落地場景;寒武紀科技面向云、邊、端三大場景研發(fā)了三種類型的芯片產品;中星微則布局嵌入式人工智能大規(guī)模商用,與AlphaGo這樣高算力、高功耗的服務器端AI不同,嵌入式人工智能應用需要小型化、低功耗、低成本的芯片,星光智能二號完美地符合了這些需求,攝像頭本身就具備AI邊緣計算功能。
落地應用前景
云端和邊緣端
作為AI算力的主要應用場景,AI芯片在云端發(fā)展需要解決算力性價比與通用性問題。算力性價比決定了人工智能應用的部署成本,而算力通用性及軟件生態(tài)決定著不同算法的遷移及開發(fā)成本。
在邊緣和終端這一側,AI芯片所面臨的挑戰(zhàn)是它們會被部署在各種各樣的應用環(huán)境中。即便在同一個垂直場景里,也需要考慮不同模塊之間的任務負載均衡問題。
賽靈思的單羿認為,FPGA因為有靈活可編程的優(yōu)勢,可以根據場景的持續(xù)需求調整這些模塊之間的資源占用比例,從而達到全系統(tǒng)最優(yōu)的效果。
ADAS/自動駕駛應用場景落地
地平線瞄準自動駕駛應用場景,在ADAS/自動駕駛應用場景下,AI芯片的核心價值就是實時處理行駛道路上的人、車、物等復雜環(huán)境的感知和決策。
目前,自動駕駛芯片在架構設計、研發(fā)投入與車規(guī)級應用等方面仍處于較為前期的探索過程中,特別是國產汽車芯片的市場份額還有待提升,因此,突破本土自動駕駛芯片技術的發(fā)展壁壘,將成為促進未來中國智能汽車產業(yè)發(fā)展的關鍵環(huán)節(jié)。
安防
安防是目前最為明確的AI芯片應用場景,主要任務是視頻結構化。攝像頭終端加入AI芯片,可以實現實時響應、降低帶寬壓力。也可以將推理功能集成在邊緣的服務器級產品中。
AI芯片要有視頻處理和解碼能力,主要考慮的是可處理的視頻路數以及單路視頻結構化的成本。
寫在最后
在AI芯片狂熱的背后,越來越多的關注點轉移到落地,中國的AI狂歡并不會持續(xù)太久。在“老大吃肉,老二喝湯”的半導體行業(yè),AI芯片也具有這樣的屬性,每個產品線最后會跑出兩三家公司。不過這是未來的格局,現在的AI芯片市場,很符合一句話:讓子彈先飛一會。