人工智能近年來發展迅猛,也引起了很多其它領域研究者的關注。越來越多有關 AI+傳統領域的研究正出現在 Nature、Cell 等重要期刊上。然而隔行如隔山,對于其它行業的人們來說,AI 研究社區似乎并不如看起來那么友好。
近日,蒙特利爾 Jewish General Hospital 的生物統計學家 Alexia Jolicoeur-Martineau 在社交網絡中抱怨 AI 研究社區排外,吐槽 Yoshua Bengio 的言論引起了業內人士的注意。AI 領域的學者 Ian Goodfellow 等人紛紛表示關注。眾所周知,人工智能領域能有今天的發展離不開開源、arXiv 分享精神的幫助,但這次討論給了我們從另外一個角度看待問題的機會。
值得一提的是,在成為醫療行業的科學家之前,Alexia 自己有計算機科學和統計學背景(她有數學和計算機學士學位,以及統計碩士學位)。
Alexia Jolicoeur-Martineau 的 Twitter 內容如下:
我們需要討論一下這一問題。我把其他 AI 研究者(有的來自蒙特利爾,有的不是)也拉入了討論,因為我認為這個問題非常重要。
這個問題不止關乎蒙特利爾,還關乎整個 AI 生態。
除了詬病一些小的溝通問題,人們總是在贊美這個社區的偉大,但沒有人注意到這個社區有多么封閉、排外。
在小組討論中,我只聽 Yoshua Bengio 提過一次「NGO」(非政府機構),學界和業界是最常出現的兩個字眼,好像這個社區非此即彼。事實并非如此,NGO 是存在的,里面是一些因為不堪忍受學術界虐待/盤剝而出走的人。
或者僅僅是因為他們無法解決政治和環境問題(此類文章比比皆是)。因此,許多人像我一樣屢次嘗試申請讀博,但還是被拒之門外。
如果其他像我一樣有 10 篇統計學方面的論文(8 篇已發,其中兩篇是第一作者)和 2 篇 AI 方向論文(未發表)的人也屢次遭拒,那么這說明一個問題:一大批才華橫溢的人才被攔在這個社區之外。
如果絕口不提這些人,也不考慮將其納入討論小組,那么我們相當于假裝他們并不存在。有人提到了這一漏洞百出的流程,說想要申請讀博非常困難,Joelle Pineau 的答復是這一問題將盡快得到解決。
Pineau 提到了另外的 20-40 個博士點。很抱歉這并不是問題的解決之道。她還提到有 300 人申請他們的 GAN 研究項目,她說,申請者或許應該轉向其它更有趣的項目。
這表明她不會再接收 GAN 方向的申請者。這點合情合理,因為決定接收誰做自己的學生是她的權利,但這表明這一領域門檻很高,僅僅增加幾個名額并不能解決問題。
在這 300 個對 GAN 感興趣的申請者之中,可能有 50 個天分極高的人才不得不停止該方面的研究,轉而投向其它不相關的崗位或產業。
我們失去了那么多樂意在學界之外進行科研(不計報酬)的人才。但在研討小組中我們連他們的存在都沒有提到,這更加重了 AI 社區生態的封閉、排外感。我們至少應該承認這一點!
我堅信,以后有了基本收入之后,這些研究人員即使不在學術界也會做研究;同時,還有很多 AI 的業余愛好者在空閑時間進行 AI 方面的研究,我們不應該因為這些人沒有華麗的頭銜而忽視他們。
我的建議是,在學界之外創建一些盡可能國際化的 AI 實驗室,里面沒有論資排輩,任何人都能提出項目,并/或成為一名 PI(不需要任何華麗的頭銜)。如果大家對這個主意感興趣,我很樂意繼續展開。
我沒有足夠的資金啟動這樣一個艱巨的項目,但我堅信這才是未來,我們需要停止維持這個社區一切都好的假象,不再假裝那些學界、業界之外的人不存在,或拒絕承認他們是「真正的研究者」(雖然沒在討論小組中聽到過,但之前聽到很多人這么說)。
Alexia 希望申請 GAN 方向的博士遇阻,她的遭遇引起了 GAN 發明者 Ian Goodfellow 的關注:
來自一家醫院的生物統計學家正在抱怨融入 AI 研究社區的困難,她既不屬于人工智能學界,也不屬于工業界。
其他人或許就沒有這么冷靜了,Alexia 的觀點在 Reddit 上引發了熱烈的討論,其中不乏對于機器學習界長篇大論的辯護。
BeatLeJuce 對此表示:
就我所知,機器學習是一個最為開放、包容的研究社區之一——但現在人們都被慣壞了,因而忽略了這一點。明確點說:幾十年來,人工智能社區一直在努力,所以我們的研究成果對每個人都是可望又可及的。現在我們的大部分研究都在 arxiv 上免費分享,大部分代碼也都在 GitHub 上分享。ICLR 是第一批試圖通過創建 openreview.net 來公開進行審查的大會之一。
我們大部分書也是免費的,比如 Goodfellow、Mackay 和 Tibshirani 等人的書。第一批成功的 MOOC 是由機器學習者開設的,第一批高影響力的 MOOC 平臺也是由機器學習者創建的:吳恩達和 Koller 創辦了 Coursera,Thrun 創辦了 Udacity。你甚至可以在推特上給世界一流的研究人員發消息,并與之展開這樣的討論。所以,我認為機器學習站在了無障礙研究的前沿。
我們并沒有故意去孤立任何人,也沒有把任何參加科學領域活動的人排除在外。有人抱怨過因為沒有博士學位而不得參與高能物理研究社區嗎?或者計算機架構社區嗎?又或者其它任何研究領域嗎?如果你想寫一篇關于量子化學的論文,直接寫就好,沒人會阻止你。但如果你想參與該研究領域的討論,你得讓其他量子化學家相信你的研究有價值。就這么簡單,機器學習同樣如此。
對此,唯一的問題是:1)ML 非常火熱非常潮,每個人都想加入;2)在 ML 中,我們總是盡己所能地讓所有材料和信息對其他人開放,所以人們以為入學門檻很低,即使沒受過正規教育,他們也能實現這些。但事實是,大多數時候,人們確實缺少正規教育,因為有很多技能 MOOC 還沒有傳授:如何寫好 ML 論文,如何區分質量高的論文和不怎么樣的論文。
理論上來說,你當然可以參與 AI 研究,即寫自己的論文。而如果它被拒收了,那說明有 3 個人看過并且都認為它不夠好。這很可能意味著這個想法或者研究方案不符合標準。的確,也許 5 或 10 年前,如果你在 CIFAR 或 MNIST 取得了好成績,一次沒有理論依據的簡單黑客攻擊可能會給你帶來一篇不錯的論文。但現在不會了,因為這個領域已經成長了。所以,如果你讀了舊論文并認為「我本來可以這么做」,那你可能是對的。但要記住,情況已經大不一樣了,這些論文中的大部分現在已沒法實現。
論文評審會要求清晰的解釋、誤差條和理論依據等等,因為我們要弄清楚什么是真正有效的,以及為什么有效。我們不是想刻薄,而是想徹底弄清楚。我們是科學界,這是我們的工作。雖然你不一定非得有博士學位才能成為科學家,但有個博士學位確實有用。即使有些科學家沒有博士學位,但請你明白!這些人是非常特殊的存在,在整個社區里占很小的比例。以 C. Olah 和 Dyson 為例子的人可以滾蛋了,因為這些人顯然不明白這二者是怎樣特別的存在。對于普通人來說,規則很簡單,且相當直接:如果你想成為科學家,那就接受對科學家的培訓——取得博士學位。
我知道,有些人抱怨說博士學位很難獲得,我也聽到了這樣的聲音。這個領域現在非常流行和熱門,所有一些有名氣的人會被博士申請洪流給淹沒。你聽得沒錯,洪流!所以,有時候進入一個好的研究所沒那么容易,因為我們既沒有時間也沒有資源來接受所有申請人。這意味著,有些人即使有實力,也可能不會被接受。這很糟糕,但對此我沒有任何解決辦法。
但要求我們「更包容」有點牽強。我認為我們已經足夠包容了,而且我在開頭就提到了這一點。我們非常歡迎每一個社區之外的人向任何 ML 會議提交其研究報告。如果你的論文足夠好,你就能夠發表它。如果不是,那請你做得更好。很抱歉,我們沒時間教你如何寫好論文和進行適當的實驗,因為我們已經被學生給淹沒了。
john_8_32_表示:
這種想法太荒謬了,就相當于在說我的申請被拒了,所以整個博士申請系統都很糟糕。我很同情那些申請被拒的人,他們也是一心想成為科學家,但這一領域已經被炒得太熱了,而且研究院名額有限,無法滿足這么大的需求。學術界確實有太多太多的問題存在,但除了研究院壓力過大使得研究人員精疲力竭之外,我不覺得她指出的問題戳中痛點。
如果其他像我一樣有 10 篇統計學方面的論文(8 篇已發,其中兩篇是第一作者)和 2 篇 AI 方向論文(未發表)的人也屢次遭拒,那么這說明一個問題:一大批才華橫溢的人才被攔在這個社區之外。
統計學和機器學習是非常不同的領域,有著不同的目標和標準。我看了她的論文,看起來是挺不錯的統計學論文,但論文得以發表在另外一個領域并不能說明她的 ML 論文有多好。一些終身教授的論文也經常被拒。很明顯,同行評審是有瑕疵的,但這種言論是相當奇怪的。同時也給一絲鼓勵:我認為被拒有助于寫出更好的論文,而不是世界末日。
這表明她不會再接收 GAN 方向的申請者。這點合情合理,因為決定接收誰做自己的學生是她的權利,但這表明這一領域門檻很高,僅僅增加幾個名額并不能解決問題。
確實,在資源有限的世界,即研究所里,「門檻」對于資源分配是有必要的。
我的建議是,在學界之外創建一些盡可能國際化的 AI 實驗室,里面沒有論資排輩,任何人都能提出項目,并/或成為一名 PI(不需要任何華麗的頭銜)。如果大家對這個主意感興趣,我很樂意繼續展開。
我沒有足夠的資金啟動這樣一個艱巨的項目,但我堅信這才是未來,我們需要停止維持這個社區一切都好的假象,不再假裝那些學界、業界之外的人不存在,或拒絕承認他們是「真正的研究者」(雖然沒在討論小組中聽到過,但之前聽到很多人這么說)。
處于學術界和工業界之外的人們的研究成果基本上沒有發表。科學是讓人們分享知識的社區,如果不能讀到你的論文,沒有人會感受到你的影響力。從科學的角度來說,你或多或少是不存在的。這點說起來很令人難過,但這就是我們積累知識的方式。
Alexia 的遭遇并不是罕見的例子,同樣投身醫療領域的 noelsusman 表示:
我是一名肄業博士生(提前退學了,目前擁有碩士學位),現在在一所醫院研究機器學習。
我認為學術界已經遭到破壞,但不是因為原貼中提到的任何一個因素。從醫療界的角度來看,我們是有太多(而不是太少)的人在做研究。作為一個群體,我們并沒有好好利用那群涌入到 GAN 研究的人們的成果。
我所在的這家醫院仍然在使用簡單的啟發式方法來評估再入院風險。我們目前所處的階段,只要擬合一個 logistic 回歸到一些基礎的診斷數據就能顯著改善原來的狀況。但這并沒有發生,因為我們有太多這樣的問題需要解決,卻沒有足夠的人手。這是個很困難的問題,因為(a)醫院沒有用不完的資金;(b)我們的人力資源不足,因為薪資水平競爭不過技術公司。在街對面就有這樣一家公司,我能在那里做相同的事情并拿到多 20% 的薪水。
我確實希望有更簡單的方式讓外行人進入學術界。我現在在做的研究是新穎的、可發表的,并且我也樂意分享,但我不知道如何解決更大的問題。
人工智能現在已經成為熱門學科,即使對于 AI 領域之內的人來說,2019 年申請博士學位的難度也已大幅超過往日。相信隨著人工智能的發展,這樣的討論還會愈演愈烈。