谷歌(google)旗下的英國人工智能研究公司DeepMind在《自然》(Nature)雜志上發表了一篇研究報告,其中討論了一種深度學習模型的性能,該模型可以持續預測患者未來罹患一種名為急性腎損傷(AKI)的危及生命的疾病的可能性。該公司表示,其模型能夠準確預測患者將在48小時前“在臨床可操作的窗口內”發展成AKI。
DeepMind在一篇鼓吹該研究的博客文章中稱,這是一項突破——該論文表明,人工智能能夠在“可避免的患者傷害的主要原因之一”發生前兩天預測出它?!斑@是我們團隊迄今為止在醫療保健研究方面取得的最大突破,”報告補充道,“證明了我們不僅能夠更有效地發現病情惡化,而且能夠在惡化發生之前就做出預測。”
不過,即便是表面上看一下這份報紙,也會提出一些主要的警告。尤其重要的是,用于訓練模型的數據絕大多數是男性:93.6%。這是因為DeepMind的人工智能使用的是美國退伍軍人事務部(VA)提供的病人數據。研究報告指出,在培訓數據集中,女性僅占患者的6.38%。
本文還納入了數據集統計的匯總,顯示18.9%的患者為黑人,雖然黑人女性在培訓數據集中所占比例沒有突破(邏輯上認為可能低于6.38%)。沒有其他種族被打破。
當被問及該模型的跨性別和不同種族的表現能力時,DeepMind的一位女發言人告訴我們:“在女性中,它預測在所有已知性別的AKI患者中,早期有44.8%(男性56%)患有AKI。”非裔美國患者的模型表現更高——早期檢測到的AKIs中有60.4%是非洲裔美國人,而其他所有種族的總檢出率為54.1%。”
“這項研究只是第一步,”她證實?!耙乖撃P瓦m用于一般人群,還需要進行進一步的研究,在模型所依據的數據中使用更有代表性的一般人群樣本?!睌祿硗宋檐娙斯芾砭值娜丝?,我們承認這個樣本不能代表美國人口。就像所有的深度學習模型一樣,在更廣泛地使用之前,它還需要來自其他來源的代表性數據。
“我們的下一步將是與(退伍軍人管理局)密切合作,通過回顧性和前瞻性觀察研究安全地驗證該模型,然后有希望探索我們如何進行前瞻性干預研究,以了解預測如何在臨床環境中影響護理結果?!薄耙鲞@類工作,我們需要正確的數據,”她補充說?!巴宋檐娙斯芾砭衷谄渌嗅t院和站點使用相同的電子病歷系統(被廣泛認為是最全面的電子病歷之一),這意味著數據集也非常全面、干凈、結構良好。”
因此,DeepMind的“突破性”研究論文明確強調的是人工智能輸出與訓練輸入之間的反射關系。在醫療保健的環境中,有指導意義的輸出可能是生與死的區別,而不是技術才是王道;關鍵是對代表性數據集的訪問——這才是真正的價值所在。
這表明,擁有納稅人資助的公共醫療系統的國家,有巨大的機會構建并釋放其掌握的民眾醫療數據所包含的價值,從而開發自己的公共醫療人工智能。事實上,這是英國2017年產業戰略評估的建議之一的生命科學部門。領導這項研究的牛津大學的約翰·貝爾爵士在給《衛報》的評論中總結道:“大部分價值在于數據。我們能做的最糟糕的事就是免費送人?!?/p>