這個冬天,ChatGPT火爆全球。作為AIGC的重要落地應用,ChatGPT到底是什么?帶來什么影響?中國版ChatGPT如何發展?通信產業如何著力?對此,《通信產業報》全媒體專訪聯通數科首席AI科學家廉士國博士(專家介紹請戳:喜報),作為2022年度“全球前2%頂尖科學家榜單”入選者,他如何看待ChatGPT概念、影響和未來發展呢,一起來看:
ChatGPT是什么?
廉士國:ChatGPT是一個面向對話場景的大語言模型,是在2020年發布的語言生成模型GPT-3版本基礎上的改進版,又稱為GPT-3.5版。它能通過與人類做文字對話的方式,針對人類輸入的提示文字,提供相應的文字回答,且回答的內容“形式上合理”。
因為采用了自監督學習技術,而無需人工做數據標注,就可以用網絡上大量公開文本數據來做模型訓練,以形成沉淀了大量知識的模型。依賴于訓練庫中的文本數據涉及的領域,原則上只要是自然語言能夠表述出的領域都可用來訓練并能具備該領域的智能問答功能,例如歷史、地理、數學、詩歌、編程等。目前大家在線體驗的ChatGPT服務,是基于ChatGPT模型包裝成的問答SaaS服務。
ChatGPT有什么影響?
廉士國:ChatGPT給人們帶來新穎的體驗,主要體現在其支持自然問答交互方式、能創作性組織文字內容、可記憶強大知識庫、具備“多才多藝”能力等方面,在交互方式和能力上更“像”人。因為是基于自然語言數據訓練的,其在自然語言或文字相關的功能上更成熟,例如百科知識查詢、問題探討或觀點獲取、文字創作等。
首先,會對搜索體驗帶來提升,包括更自然地輸入內容、更豐富的輸出結果呈現、更準確的內容組織梳理等,可在自然對話中完成更精準的搜索,或者說讓搜索從關鍵詞匹配逐漸過渡到語義匹配。其次,為文字創作提供便捷的輔助工具,例如寫論文、編程序、回復郵件等,先為人工生成草稿以提升效率。另外,會提升對話閑聊的水平,包括對長句的理解能力、多輪對話能力、針對問題的內容組織能力等的提升,將革新智能音箱的體驗。總之,基于ChatGPT基礎模型,可以對例如搜索引擎類的信息查詢工具做升級改造,可以制作文字創作工具作為人類的助手來提升工作效率,可以為人類提供專家級咨詢參考和輔導等。
ChatGPT會如何影響AI產業格局和發展走勢?
廉士國:ChatGPT目前在免費試用階段,上線僅兩個月已突破1億用戶數。據說后續會推出按月收費的商用版本,同時微軟已正式推出基于ChatGPT的Bing搜索產品并正將其嵌入Office和Azure等產品中。
目前看,ChatGPT在B端產品中的定位相對明確,可作為輔助工具來改進已有產品或為人工提供助手功能。例如,雖然大模型里沉淀了大量知識,但它很難完全替代搜索引擎,因為其不能提供原始內容鏈接、不能做即時信息查詢等,可作為使能工具來升級搜索引擎產品;它可為銷售人員提供回復郵件自動生成工具,以降低人工工作量并提升效率等。
而作為C端產品,相對還不夠明確,類似寫論文、編程序、咨詢顧問等的個人助手,是否存在合規性風險、商業模式問題等,有待探索,但同時也有較大可想像空間。但對算力基礎設施的帶動作用是明確的,無論是ChatGPT的研發(訓練)和基于ChatGPT的應用(推理)都需要大量智能計算資源和數據存儲及傳輸資源,因此具備智能算力中心的云計算企業將是受益者。從技術分層角度看,從底往上:智能算力平臺、ChatGPT基礎大模型、基于ChatGPT基礎模型的AI應用或插件、行業應用系統。
可以預見:以智能算力平臺為基礎,會有少量公司做類似ChatGPT基礎大模型,其他大量公司和開發者會基于ChatGPT基礎模型做AI應用或插件,包括To B和To C類的,這些AI應用或插件可被集成到行業應用系統中。這種分層模式跟非大模型時代相似,只是現在大模型可能開始不再免費了,這是否說明會出現以ChatGPT基礎大模型擁有者為中心的“寡頭”?對標OpenAI的ChatGPT,谷歌剛剛發布了以其LaMDA大模型為基礎的Bard對話服務。是否要出現類似iOS和Android兩強對立的局面?
我們認為,目前階段的基礎大模型性能上還需完善,其門檻也沒有高到只能出現兩個“寡頭”,更多玩家的局面將會出現。試用階段的用戶熱度是否會延續,有賴于后續“爆款”AI應用的出現,但其對已有行業應用系統的升級輔助作用會持續體現出價值。
ChatGPT發展存在哪些挑戰?它會對AI倫理、數字治理有什么影響?
廉士國:ChatGPT基礎模型是基于文字間上下文關聯關系做自監督訓練的,以數據驅動為主、外加少量人工介入,其功能依賴于訓練數據的數量和質量。從近期的大眾試用反映來看,如果通過百科知識問答、寫詩、做數學題和查詢天氣等測試來分別評估當前基礎模型的記憶、創作、推理、查詢能力,其相對從強到弱的排序是:記憶能力、創作能力、推理能力、查詢能力。其推理能力相對較弱,這印證了國外部分專家的評價:當前版本模型對自然語言文本規則和模式知識學得較好,但對抽象知識和邏輯推理還沒有學到位。其信息查詢能力依賴于其訓練數據的截止搜集時間,例如問“北京明天的天氣是?”其回答“北京明天25度,天氣晴朗”,因為其訓練數據截止到2021年春夏之交,僅能查詢2021年之前的信息。即使其創作能力較強,寫出的詩、論文和問題建議在形式結構上看很合理,但細究其內部邏輯仍有不合理的拼湊感。
盡管ChatGPT本身還存在一些技術挑戰,但大家已經看到了其威力,甚至已對現行制度帶來了不利影響,例如有國外學生用它來代寫課題論文并獲得了高分,這給其他同學帶來了不公平。的確,ChatGPT的出現超出了大家的預期,但我們的數字治理還沒有跟上。像這樣具備文字創作等能力的超級助手,人人都可以平等獲得嗎?其創作的內容存在版權問題嗎、是否可以自由使用而不受限?其創作的內容如果存在編造事實、民族歧視、侵犯隱私等問題應由誰來擔責?等等問題是需要大家共同來面對的。而人工智能領域的專家們已經開始考慮用技術手段來鑒別AI生成的內容了,例如通過人工規則來判斷內容合法性、通過文本內容統計分析及添加文本水印等方法來鑒權等。我們相信,除了技術手段之外,相關的數字治理制度也將啟動建立。
中國版ChatGPT如何發展?
廉士國:類似ChatGPT的大模型可通過基于自然語言的自監督學習技術實現對知識的沉淀,可作為公共的基礎模型,支撐多種上層應用。因此,構建中文版的ChatGPT形成具備中文知識的公共基礎模型,也尤為重要。
研發類似ChatGPT的大模型,其基礎主要包括智能算力、大量數據、自監督學習算法等。對于這些基礎,國內相關企業和機構是擁有的或可以聯合構建。之前,已有國內企業和機構發布了大模型,包括語言大模型、基于語言大模型的多模態模型等,只是其語言大模型還沒達到ChatGPT的能力。剛剛已有幾家國內企業宣布在ChatGPT上做布局,相信國內很快會出現類似ChatGPT的語言大模型,并且對中文效果更好。
另外,國內的應用場景豐富、開發者眾多,以ChatGPT類大模型為基礎,面向垂直應用場景的再開發,可能出現“爆款”智能應用。而且,考慮到國內千行百業數字化轉型的趨勢,會產生豐富的行業場景數據,可能推進行業大模型的快速發展,包括語言類、多模類等,不限于對話場景,可在基礎模型上做微調或重訓練。
最后,ChatGPT的研發模式和歷程值得我們借鑒。一方面,ChatGPT的研發要以巨大的算力和數據以及最前沿算法為基礎,OpenAI公司能聚齊這些資源并具備產學研用融合特點,這種以公司牽頭的產學研用融合研發體系值得借鑒。另一方面,雖然ChatGPT僅僅是OpenAI追求的AGI(通用人工智能)的初級階段,但我們已看到了其創新帶來的巨大影響力,這得益于OpenAI創始人和投資者的遠見和堅持。大家可能還記得,OpenAI和DeepMind的投入-產出問題(虧損情況),曾是大家熱議的話題,也反應在國內AI領域投資的波動上。從ChatGPT基礎模型的研發歷程來看,大模型研發是中長期積累的產物,如果僅追求短期回報可能反而會錯過機會。這也給了國內投資者和創始人以啟示,大的創新是需要中長期的堅持的,尤其人工智能領域還有很多未知待解決,就更需要堅定客觀正確的方向不動搖。
ChatGPT對信息通信業有什么影響與互動?如何利用?
廉士國:ChatGPT實現了人與機器之間以文本方式“communication”的功能,接近甚至超越了人與人之間以文本方式聊天的體驗,這與信息通信業要支撐的豐富人們的溝通與交流相似。
首先,ChatGPT大模型可作為工具用來改進信息通信服務能力,例如其在自然語言上的強大能力可用于提升智能客服、智慧運營、欺詐監測等運營服務功能,通信網絡的巨量數據量可用來訓練通信網絡大模型賦能網絡自主運行。其次,ChatGPT在自然語言上的成功,啟示了在語音、視覺等多模態數據上的擴展空間,這將為運營商在政企業務上為千行百業數字化轉型賦能提供重要工具。而且,ChatGPT等大模型的運行和服務離不開算力和網絡支撐,運營商作為新型信息基礎設施服務運營者,可以加強算網融合的智能算力中心建設,來承載ChatGPT等大模型訓練和推理服務,真正讓大模型服務遍及無處不在的用戶。
可以預見,ChatGPT的流行會讓人機自然對話的交互方式越來越普及,并很可能從文本對話模式擴展到語音對話模式,以及與數字人面對面交流模式,進而將大大提升信息通信流量和用戶黏度,這也將推動信息通信業考慮從人與人之間的溝通交流擴展到人機之間的溝通交流。雖然傳統搜索引擎已經不再是搜尋或咨詢信息的普遍方式了,部分代之以基于知識沉淀的大模型構建的文本/語音/數字人對話機器人,但這對信息通信的依賴程度有過之而無不及,因而通信行業更應該擁抱大模型。
敬請關注電子技術應用2023年2月22日==>>商業航天研討會<<