DNA 100處理器適用于汽車、監控、機器人、無人機、AR / VR、智能手機、智能家居和物聯網產品的神經網絡推理,可輕松從0.5擴展至100TMAC
中國上海,2018年9月20日——楷登電子(美國 Cadence公司,NASDAQ:CDNS)今日推出Cadence? Tensilica? DNA100處理器IP,首款深度神經網絡加速器(DNA)AI處理器IP,無論小至0.5 還是大到數百TeraMAC(TMAC),均可實現高性能和高能效。DNA 100處理器非常適用于自動駕駛汽車(AV)、ADAS、監視、機器人、無人機、增強現實(AR)/虛擬現實(VR)、智能手機、智能家居和物聯網領域的設備端神經網絡推理應用。較其他采用相似陣列尺寸大小的乘法累加運算(MAC)解決方案,DNA 100處理器性能提升達 4.7倍,每瓦特性能提升高達2.3倍。
神經網絡的特征在于權重和激活函數的固有稀疏度,加載和乘以零會造成其他處理器不必要的MAC消耗。DNA 100處理器的專屬硬件計算引擎移除了上述兩項任務,利用稀疏度提高能效并降低計算量。神經網絡再訓練有助于提高網絡的稀疏度,并通過DNA 100處理器的稀疏計算引擎實現最高性能。DNA 100處理器能夠利用更小的陣列實現最大吞吐量。作為例證,4K MAC配置環境下,ResNet 50推理性能預計能實現每秒高達2550幀(fps)和3.4TMAC / W(在16 nm工藝)。
“人工智能處理器的應用發展迅速,但是運行最新的神經網絡模型會使功耗預算嚴重縮緊。”Linley Group資深分析師Mike Demler說道。“滿足從小型電池供電的物聯網傳感器到自動駕駛汽車等設備的人工智能功能需求,需要更高效的架構。Cadence全新Tensilica DNA 100處理器采用的創新稀疏計算引擎解決了這些局限性,在任何功耗預算下均能提供優秀性能。”
DNA 100處理器配備完整的AI軟件平臺,兼容最新版本的Tensilica神經網絡編譯器(Tensilica Neural Network Compiler),支持Caffe、TensorFlow、TensorFlow Lite及包括卷積和循環網絡在內的廣泛神經網絡等高級AI框架。因此,DNA 100處理器是視覺、語音、雷達、激光雷達和通信應用設備端推理的理想之選。 Tensilica神經網絡編譯器利用全面優化的神經網絡庫函數,將任意神經網絡映射為可執行且高度優化的高性能代碼。因此,DNA 100處理器為不同網絡類型提供了強大的軟件生態系統支持,包括分類、對象檢測、分割、重復和回歸。 DNA 100處理器還支持安卓神經網絡(ANN)API,可用于安卓設備端的AI推理。
DNA 100處理器可以在所有神經網絡層運行,包括卷積、完全連接、LSTM、LRN和池化。單個DNA 100處理器可以輕松從0.5擴展到12有效TMAC;并可以通過堆疊多個DNA 100處理器,實現數百TMAC,適用于最計算密集型設備端的神經網絡應用。 DNA 100處理器還集成了Tensilica DSP,以適應DNA 100處理器內部硬件引擎當前不支持的新神經網絡層;同時使用Tensilica指令擴展(TIE)指令集實現Tensilica Xtensa核心的可擴展性和可編程性。由于DNA 100處理器擁有獨立的直接存儲器訪問(DMA),因此無需新增控制器即可運行其他控制代碼。
“我們客戶的神經網絡推理需求涉及不同量級的人工智能處理和多種神經網絡類型。他們需要一種可擴展的架構,無論在低端物聯網應用,還是在汽車應用,都具備同樣有效,做到這一點需要數十甚至數百TMAC,”Cadence Tensilica IP產品管理和營銷高級總監Lazaar Louis表示。 “憑借DNA 100處理器、完整的AI軟件平臺、以及強大的合作伙伴生態系統,我們的客戶可以設計出設備端AI推理所需的高性能和高能效產品。”
DNA 100處理器將于2018年12月面向部分客戶出售,預計于2019年第一季度全面上市。
關于楷登電子Cadence
Cadence 公司致力于推動電子系統和半導體公司設計創新的終端產品,以改變人們的工作、生活和娛樂方式。客戶采用 Cadence的軟件、硬件、IP 和服務,覆蓋從半導體芯片到電路板設計乃至整個系統,幫助他們能更快速向市場交付產品。Cadence 公司創新的“系統設計實現” (SDE)戰略,將幫助客戶開發出更具差異化的產品,無論是在移動設備、消費電子、云計算、汽車電子、航空、物聯網、工業應用等其他的應用市場。Cadence 公司同時被財富雜志評選為“全球年度最適宜工作的100家公司”之一。