此前業內一直盛傳華為正在秘密研發AI芯片,現在真的來了。10月10日,以“+智能,見未來”為主題的2018華為全聯接大會(HUAWEI CONNECT)在上海世博展覽館正式開幕。在會上,華為輪值CEO徐直軍公布了華為全棧全場景AI解決方案,并正式推出了兩款AI芯片:昇騰910、昇騰310。
人工智能是新的通用目的技術
華為輪值董事長徐直軍在大會上發表“構建萬物互聯的智能世界”的主題演講。1956年,達特矛斯第一次正式提出了“人工智能”的定義。“從那以后的60年里,人工智能經歷了兩次發展的低谷,即所謂的‘冬天’,但其發展的腳步并未就此停止。”他說。
徐直軍認為,人工智能是一種新的通用目的技術。任何技術只有準確的定位,才會充分發揮其價值。給人工智能技術進行合理的定位,是我們理解和應用此技術的基礎。
他說,“華為在實踐中發現,人工智能不但可以替代人,還能夠自動降低生產成本。這是人工智能與信息化最大的不同,也是其最有價值的特點。” 人工智能觸發的產業變革,將涉及所有行業,從交通、教育、醫療到翻譯、運維和自動駕駛等等。
兩款AI芯片發布
昇騰910:計算密度最大的單芯片
昇騰910是目前單芯片計算密度最大的芯片,其算力可以達到 256TFOPS,采用7nm工藝制程,最大功耗為350W。
根據華為官方公布的性能數據顯示,昇騰910半精度為(FP 16):256 Tera FLOPS,整數精度(INT 8):512 Tera FLOPS,128通道 全高清 視頻解碼器- H.264/265。
華為還將昇騰910的性能與谷歌TPU v2、谷歌TPU v3、英偉達V100進行了對比。可以看到,昇騰910的算力比Nvidia 的 V100 還要高出一倍,計算力遠超谷歌及英偉達。
此外,值得一提的是,華為基于昇騰910還構建了一個昇騰 plus,它是迄今為止全球最大的分布式訓練系統。
徐直軍介紹,通過把 1024個昇騰910連接起來,構建一個 AI 計算機群,可提供高大 256 個 P 超高 AI 計算能力,實現人們過去從未想過的速度訓練你的模型,不管多復雜的模型。
昇騰310:高效計算低功耗AI SoC
華為昇騰310屬于昇騰910的迷你系列,主打終端低功耗AI場景,采用臺積電12nm工藝制造,擁有8 TFLOPs半精度計算力,整數精度的算力達到16TFLOPS,同時昇騰310還集成了 16 個通道的高全高清視頻解碼器,是目前面向邊緣計算產品最強算力的 AI 芯片,也可以用于數據中心的訓練和推理。最大功耗僅為8W。
兩款AI芯片均采用華為自研的達芬奇AI架構。其中昇騰310目前已經量產,昇騰910將在明年第二季度量產。2019年,華為還將推出3款AI芯片,均屬昇騰系列,同時華為將會基于昇騰系列AI芯片提供AI云服務。
十大改變 開創未來
在會上,徐植軍表示,要解決人工智能“火熱”與“冷靜”之間的巨大落差,開創未來,要從技術、人才、產業這三個方面進行主動的變革。徐植軍和大家分享了十個有關人工智能技術、人才和產業的重要變革方向。
改變之一:縮短訓練模型的時間
按照目前的技術水平,訓練某些復雜模型時往往需要數天甚至數月,而成功的創新發現往往需要多次迭代,這種訓練速度嚴重制約了應用創新。我們認為,未來模型的訓練要能在幾分鐘、甚至幾秒鐘內完成。
改變之二:充裕經濟的算力
算力是AI的基礎,但目前的算力非常昂貴,是一種稀缺資源。如果說算力的進步是當下AI大發展的主要驅動因素,那么,算力的稀缺和昂貴正在成為制約AI全面發展的核心因素。
我們認為,算力應該是充裕且經濟的,并且這種需求應該盡快實現。
改變之三:人工智能要適應任何部署場景
混合云已經成為企業采用云服務的主要模式,當前的AI主要在云,少量在邊緣,與企業的業務環境的結合有待進一步深入。
我們認為,未來AI將無處不在,要能夠部署在任何場景,并確保用戶隱私得到尊準和保護。
改變之四:更高效更安全的算法
算法是推動AI發展的另一個主要動力,但目前運用的主要算法多誕生于1980年代。隨著AI的廣泛普及,這些算法的不足愈發明顯。
我們認為,未來的算法,要能夠基于更少的數據需求,即數據高效。也要能夠基于更低的算力和能耗,即能耗高效。同時要解決自身的安全問題,并實現可解釋…等等,這都是AI全面發展的重要技術基礎。
改變之五:更高的自動化水平
今天的人工智能,自身還需要大量的人工,特別是在數據標注環節,今天甚至還誕生了一個新的職業叫“數據標注師”。有人調侃說,今天的人工智能,是沒有“人工”就沒有“智能”。
我們認為,應該大大提升AI自身的自動化水平,比如在數據標注、數據獲取,特征提取,模型設計和訓練等環節,要實現自動化或半自動化。
改變之六:模型要面向實際應用
2018年6月,伯克利大學的助理教授 Benjamin 等發表了一篇題目奇怪的論文--《CIFAR-10分類器能否泛化到CIFAR-10?》
該論文指出,在CIFAR-10分類器上測試準確度出色的模型算法,卻在作者創建的與CIFAR-10非常接近的另一測試集上出現了偏差,分類識別準確率下降了5-15個百分點不等。這也就意味著,這個模型算法的可用度大幅度下降。
由此,可見當前很多優秀的模型算法,更多的是“考試”優秀,還未達到“工作”優秀。
我們認為,未來的模型必須實現工業級的優秀,即滿足工業生產的需要,而不僅僅滿足于測試集上“考試”優秀。
改變之七:模型更新
模型的準確率并非是一成不變的,而是會隨著數據分布、應用環境和硬件環境的變化而變化,始終保持準確率在期望的范圍內對于企業應用是必須的。但目前的模型更新是非實時的,依賴人工周期性的更新,因此是一個半開環的系統。
我們認為,未來的模型要能及時適應各種變化,實時更新,實現閉環系統,保證企業AI應用始終處于最佳狀態。
改變之八:人工智能要多技術協同
每一個通用目的技術,只有與其它技術充分協同配合,才能發揮到極致,創造巨大的經濟價值。AI也不例外,但在目前我們探討AI時,更多的是僅僅聚焦AI本身。
我們認為,AI需要與云、物聯網、邊緣計算、區塊鏈、大數據、數據庫…等技術充分協同,如此才能發揮更大價值。
改變之九:人工智能要成為由一站式平臺支持的基本技能
今天,AI還是一項只有具備高級技能的專家才能完成的工作,成熟、穩定、完善的自動化工具還比較缺乏,獲得一個AI模型還是一個非常復雜,耗時耗力的事情。
我們認為,應該有一站式平臺,提供必需的自動化工具,讓AI應用開發更容易,更快捷。從而,使AI成為所有應用開發者甚至所有ICT技術從業人員的一項基本技能。
改變之十:以AI的思維解決AI的人才短缺
AI人才的短缺,特別是數據科學家的缺乏,一直是業界顧慮較多的一個制約因素。而且我們認為,數據科學家將永遠是稀缺的。
解決之道應該是,以AI的思維解決AI的人才短缺。通過著力發展智能化、自動化、簡單易用的AI平臺和工具服務,以及提供培訓教育,培養大量的數據科學工程師,使他們能完成大量基本的數據科學相關工作。
通過這些大量的數據科學工程師與數據科學家和各領域專家相互配合的梯形結構,來解決AI人才稀缺問題。
這十個改變,一定不是AI技術、人才、產業發展的全部,但都是未來發展的重要基礎。
華為的AI發展戰略:
徐直軍提出了10個人工智能的重要改變方向既是華為對AI產業發展的期望,也是華為制定AI發展戰略的源動力。基于這十大改變,華為的AI發展戰略包括五個方面:
1. 投資基礎研究:在計算視覺、自然語言處理、決策推理等領域構筑數據高效(更少的數據需求) 、能耗高效(更低的算力和能耗) ,安全可信、自動自治的機器學習基礎能力。
2. 打造全棧方案:打造面向云、邊緣和端等全場景的、獨立的以及協同的、全棧解決方案,提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺。
3. 投資開放生態和人才培養:面向全球,持續與學術界、產業界和行業伙伴廣泛合作,打造人工智能開放生態,培養人工智能人才。
4. 解決方案增強:把AI思維和技術引入現有產品和服務,實現更大價值、更強競爭力。
5. 內部效率提升:應用AI優化內部管理,對準海量作業場景,大幅度提升內部運營效率和質量。
華為的AI全棧解決方案
在大會中,徐直軍用一張圖完整展示了華為的全棧全場景解決方案。
“我們提出的全場景,是指包括公有云、私有云、各種邊緣計算、物聯網行業終端以及消費類終端等部署環境。我們說的全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。”他說。
華為的全棧方案具體包括:
Ascend: 基于統一、可擴展架構的系列化AI IP 和 芯片,包括Max,Mini,Lite,Tiny和Nano等五個系列。包括我們今天發布的華為昇騰910(Ascend 910),是目前全球已發布的單芯片計算密度最大的AI芯片,還有Ascend 310,是目前面向計算場景最強算力的AI SoC。2.CANN: 芯片算子庫和高度自動化算子開發工具
MindSpore:支持端、邊、云獨立的和協同的統一訓練和推理框架應用使能:提供全流程服務(ModelArts),分層API和預集成方案從華為云EI、人工智能引擎HiAI到全棧解決方案,華為構建出自己的一套完整AI方案。
徐直軍表示,“今天,我們發布的全棧全場景解決方案是對華為云EI和HiAI的強有力支撐。基于這個解決方案,華為云EI能為企業、政府提供全棧人工智能解決方案;HiAI能為智能終端提供全棧解決方案,且HiAI service是基于華為云EI部署的。”
從某種方面說,人工智能很“火”,但又很“冷靜”,這種差異被徐直軍稱為“令人興奮的落差”,是凝聚產業發展的巨大動力。
新的戰場,新的對手
在兩年前,華為另一名輪值董事長郭平就表示,公司每年至少拿出10億美元的研發預算,用于與數據中心相關的投入。
2017年9月,華為發布了面向企業、政府的人工智能服務平臺華為云EI。今年4月,華為又發布了面向智能終端的人工智能引擎HiAI。
但在投入的過程中,發現了一個普遍存在的問題,就是云服務平臺不賣終端芯片,賣終端芯片的平臺不提供云計算服務。因此,這種割裂的環節讓開發者浪費了大量的時間和精力以及財力在訓練和部署之間。
此前,谷歌云推出了用于邊緣計算的Edge TPU,作為Cloud TPU的補充,用戶可以在云上構建和訓練ML模型,然后通過Edge TPU硬件加速器在Cloud IoT Edge設備上運行這些模型,這在某種程度上降低了開發者的成本。
但如果能出現一套框架,讓手機、公有云、私有云、邊緣計算等不同平臺的AI應用應用一次調校就能部署,將會比Edge TPU更有效率。
“今天,我們發布的全棧全場景解決方案是對華為云EI和HiAI的強有力支撐。基于這個解決方案,華為云EI能為企業、政府提供全棧人工智能解決方案;HiAI能為智能終端提供全棧解決方案,且HiAI service是基于華為云EI部署的。”徐直軍說。
一位華為人士在社交平臺發表感嘆時表示,“(華為)又多了一些強大的全球頂級競爭對手。”