中國的人工智能已經可以去清華了?2021年6月1日,清華大學計算機系知識工程實驗室迎來了中國第一位原創虛擬學生“華智冰”,清華大學為其辦理了學生證與郵箱。華智冰是一位美麗聰慧的女同學:其面容和聲音通過人工智能模型生成,有著超高的雙商,以及寫詩、作曲、作畫、創作劇本殺等才藝,還具有一定程度上的推理和情感交互能力,堪稱“女神級”的存在。
能被培養得如此優秀,并且進入清華“深造”,華智冰不是一個沒有“背景”的女同學:“她”脫胎于中國首個超大規模智能模型“悟道2.0”,師從智源研究院學術副院長、清華大學教授唐杰,由北京智源人工智能研究院、智譜AI和小冰公司聯合培養。
對于中國的人工智能行業而言,華智冰誕生的意義不僅是吸引世人眼球,其代表的更是中國的人工智能已經達到了一個相當高超的水平。如今的中國人工智能實力已足夠強悍,哪怕是與在人們普遍認知中技術最先進的美國相比也已不必怯場。
當然這也不是說美國在人工智能方面表現得不夠優異,畢竟美國所取得的成果是有目共睹的。只是與中國相比,美國在人工智能方面似乎多了不少“炫技”的意味,使其產品在實用性上反而遜色于中國了。不過照此下去,中國在未來全球范圍內的人工智能領域,或許會在某種意義上成為超越美國的“領導者”。
一、“華智冰”折射高超實力,中國AI遠比想象中更優秀
華智冰是在中關村國家自主創新示范區會議中心舉行的“2021北京智源大會”上以視頻形式登臺亮相的,同時發布的還有華智冰所依托的智能模型“悟道2.0”。該會議為期3天,匯集了來自全球范圍內的200多位AI行業的領先人物,主要圍繞“AI最迫切需要解決的問題”這一核心議題展開討論,共同探索在AI領域新的破題思路。
能在這樣一個會議上得以展示,華智冰必然不是其表面上看到的那樣,只是一個“噱頭”那么簡單。唐杰教授表示,華智冰所依托的“悟道2.0”可以用“你SHI(實)最大”加以概括:
“你”是指基于“悟道2.0”建立悟道社區生態的愿景,邀請每一位研發人員加入;
“實”是指“悟道2.0”模型的實用化,用戶能夠依托實用框架迅速完成部署;
“最”指的是準確性,“悟道2.0”在全球公認的9項AI精準紀錄上皆取得了重大突破;
“大”則是指其參數已達1.75萬億,是GPT-3的10倍,打破了之前由Googl Switch Transformer預訓練模型創造的1.6萬億的參數記錄,并兼具簡單、靈活、高性能等諸多優勢,能夠支持大規模的并行訓練,是目前中國首個也是全球最大的萬億級模型。
想知道這一AI模型的實力,可以大規模預訓練模型為例。要完成這種模型,在算力資源、訓練時間等方面都需要更多的消耗,程度遠非傳統的AI模型所能及。為了提升大規模預訓練模型的產業普適性和易用性,悟道團隊搭建了高效預訓練框架,在編碼、微調、推理等方面進行了全鏈路的原創突破與迭代優化,實現了效率方面的大幅提升。
而且在未來,“悟道2.0”還會給各類企業提供AI方面的技術與服務。此次大會上就已經和包括小米、美團、快手、新華社、寒武紀等多家不同領域的知名企業簽約。既能夠為企業的AI技術賦能,又能夠吸納更多企業共同開發AI大模型智能應用,從而形成“反哺”作用。
這還只是“悟道2.0”取得的成績。若是縱觀整個中國的AI行業,在許多方面取得的成果都是令人驚嘆的。
論文方面,中國人工智能的論文總量全球第一。中國在全世界AI領域的論文占比從1997年的4.26%增至2017年的27.68%,在全球范圍內遙遙領先;
在專利申請方面,中國是全球人工智能專利布局最多的國家,比起美國和日本都更勝一籌;根據《中國人工智能發展報告2020》給出的數據來看,過去10年間,全球人工智能專利申請量超過52萬件,其中中國人工智能專利申請量為389571件,占全球總量的74.7%,是排名第二的美國申請量的8.2倍。
中國在AI方面的實力讓美國頗為忌憚。
今年,由亞馬遜云CEO安迪·賈西、甲骨文聯席CEO薩弗拉·卡茨、微軟首席科學家埃里克·霍維茨等硅谷高管組成的NSCAI(美國國家人工智能安全委員會)向美國國會提交了一份長達756頁的報告,其中有608次提及中國。
該報告的主旨是“中國人工智能技術正在快速崛起,10年內將超越美國并抵消美國的技術優勢,主導AI全球標準”,建議美國、日本等國家對中國在AI方面的發展,也就是對中國的AI“卡脖子”。
美國對這招很熟,我們都懂。不過在AI方面能不能卡得住,恐怕還真不是美國單方面說了算。
二、美國AI可能是“炫技派”,而中國AI更“實在”
2020年,中國的人工智能市場規模高達434億美元,增速達13.75%,高于世界平均水平。從商業化的成果來看,相較于美國,中國在人工智能的實際落地應用方面做得更好。
例如,此次華智冰的亮相及“悟道2.0”的面世,意味著中國超大預訓練模型研發水平將會達到一個全新階段,還能推動國際超大預訓練模型發展的步伐。而且“悟道2.0”還可應用于手語翻譯、服裝設計、新聞稿件撰寫等諸多領域,其任務完成程度高度接近人類,還有望為2022年的冬奧會服務。
中國的一個AI平臺出現,就有如此功效,想不引起關注都難。當然美國的企業在AI方面也有過人之處,如名滿世界的阿爾法狗、波士頓機器狗,以及時不時就能上個熱搜的微軟小冰等,都是美國人工智能商業化應用成功的最佳體現。
然而如果仔細觀察,不難發現美國對人工智能的應用似乎有偏向于“炫技”之風。這不代表它們毫無實際用處,只是與中國在人工智能的應用方面相比還不夠“實在”。
例如最近在許多酒店都很火的AI送貨機器人。疫情期間,外賣、快遞禁止進入酒店,而且中國許多地方的酒店已經不能主動向客人提供一次性牙刷、一次性梳子等“六小件”用品了。這些東西如果讓客人親自下樓去取會十分不便,也容易消耗賓客耐心影響心情。
于是許多酒店就用起了AI送貨機器人。例如華住會旗下的酒店所應用的AI送貨機器人,在客人打電話告知需要送貨的物品之后,它們會被放入機器人的腹部,機器人就能夠自動完成一系列送貨流程。既保證了疫情期間的安全,還能增添住酒店的趣味性,可以說是非常實用了。
在面部識別方面,計算機視覺、圖像處理等人工智能技術同樣很有用。
例如張學友演唱會上多次抓到逃犯,其實就是這些技術起到了重大作用。而隨著人臉識別技術的進一步成熟與社會認同度的日漸提升,人工智能技術也將得到更廣闊的發揮舞臺,給人們的生活帶去更多改變。
從商業化成果來看,曠視科技、商湯科技等中國AI公司在開發用于面部識別系統的AI方面有許多進展,而科大訊飛則是語音識別應用程序的典型,阿里巴巴更是早在2019年就宣布了能夠制造“漢光800芯片”,該芯片每秒可處理比競爭對手更多的圖像。
從政策層面來看,中國也在大力支持人工智能的發展。《新一代人工智能發展規劃》中提出,到2025年,人工智能將成為中國產業升級和經濟轉型的一個主要動力,而且要得到廣泛應用,核心產業規模計劃超過4000元,帶動相關產業規模超過5萬億元。
從中美雙方人工智能應用的狀況來看,美國屬于“炫技派”,而中國更接地氣。這兩種不同的路徑本身也許并無高下之分,但從實際情況來看,中國在人工智能方面的勝算確實更多一些。
三、中國AI更勝一籌,有望成為全球“領導者”
隨著中國人工智能技術的逐漸成熟,應用模式與商業模式基本成型,人工智能市場和產業發展也將更上一層樓。截至去年6月底,中國人工智能的核心產業規模為770億元,人工智能企業超過2600家,已成為全球AI獨角獸企業的主要聚集地之一。
而在人工智能未來的發展中,場景是頗為重要的。未來中國的人工智能將在細分市場和縱深化程度方面進一步提升,更加密集而廣泛的商業化落地階段即將到來,包括家居、金融、醫療健康、軌道交通等多個領域,而相關部門的扶持舉措也將更加務實。
雖然美國如今在人工智能領域的硬件、算法和人才方面依然處于全球第一的位置,但是中國的綜合實力正在提升,對人才的待遇也愈發豐厚,相信更多的世界人工智能領域的頂級人才在不久的將來會將中國作為首選。
更為重要的是,中國在人工智能的數據和應用能力方面已然處于領先位置。如果照目前中國的追趕速度來看,在未來5到10年內,中國在人工智能領域有望與美國比肩,甚至超越美國,成為全球AI產業真正的“領導者”。