存儲可以在很多方面為醫學研究提供支持,尤其是與大腦成像硬件相關的領域。美國斯坦福大學是如何在其最近的研究項目中利用高速存儲的呢?
在醫學領域,快速存儲能支持研究人員存儲和解析大型數據集。一個超大型數據集的示例就是斯坦福大學的 MultiMAP 項目,該項目用于跟蹤、記錄并分析斑馬魚大腦中神經細胞的活動。
斯坦福大學的 MultiMAP 是做什么的?
在斯坦福大學的一篇新聞稿中,科學作家 Bruce Goldman 解釋說,MultiMAP(分子和活動表型的多重比對)支持研究人員“跟蹤斑馬魚大腦中的幾乎每一個神經元,然后確定每個相關神經元的細胞類型。”MultiMAP 背后的斯坦福大學團隊利用技術確定了腦回路實際上與警覺性有關。
斯坦福大學跟蹤了斑馬魚大腦中的神經元,將大腦活動與警覺性聯系起來。 圖片來自 NICHD。
斯坦福大學生物工程及精神病學和行為科學教授兼霍華德·休斯醫學研究所研究員 Karl Deisseroth 告訴 Goldman,“我們在魚存活期、細胞處于極度活躍狀態時跟蹤它大腦中的每個神經元,并了解了魚的警覺性最高時哪些細胞最活躍。然后,在不改變魚頭部細胞相對位置的情況下使用固定劑保存魚的腦組織后,我們可以使用分子探針找到相關神經元并確定其細胞類型。”
這項技術本身需要大規模運作,因此需要處理單元附近部署大量低延遲、高速的存儲才能實現正常運轉。隨著此類大腦成像技術的持續發展和進步,存儲也要迎頭趕上。
MultiMAP 極其重要,因為它收集的數據對心理健康有極大影響。Goldman 特別指出,睡眠不足與抑郁癥均和缺乏警覺性有關,而焦慮癥、躁狂癥與創傷后壓力心理障礙癥 (PTSD) 和警覺性過度有關。
Deisseroth 說:“新發現開拓了一條全新的深入探索之路。我們越了解警覺性等大腦狀態下的神經元構造,就會越了解大腦狀態這個概念本身,我們甚至能夠幫助設計針對大腦狀態的臨床干預措施。”
要踏上這條“深入探索之路”,快速存儲至關重要。斑馬魚幼體有大約 100,000 個神經元,每個神經元產生的數據都需要被記錄、存儲并快速仔細地梳理,才能獲取重要的數據點。成年斑馬魚有大約 1,000 萬個神經元,這對斯坦福大學的 MultiMAP 技術的要求呈指數級增長。相較之下,人類大腦則包含 860 億個神經元。
人類的神經元數目是斑馬魚的 860 多倍。
哪類存儲能夠繪制大腦構造呢?
美光科技技術營銷高級經理 Jason Echols 表示,在處理如此多的信息、繪制大腦構造并確定其決策和功能時,研究人員便進入了快速數據領域。為了處理如此多的數據并分析其中的重要數據點,MultiMAP“讓人工智能和機器學習變得稍稍清晰可見了一些”。
Echols 說,“他們需要進行大量的并行處理。當他們需要將數據納入決策流時,他們不僅僅是在思考,實際上是在提取數據并予以分析。”
Echols 表示,從事 MultiMAP 項目等工作的醫學研究人員在竭力“優化存儲基礎設施以獲取最佳性能”,尤其是當他們處理斯坦福大學研究人員在腦細胞中觀察到的海量數據時。
“你會發現,英偉達和其他一些企業都在這些領域與他們進行合作。”Echols 說,“他們如何使存儲兼具成本效益和超快速度,讓運行這些數據所需的所有計算核心都能獲得需要的數據呢?這才是真正有意義的對話。”
推動所有存儲的發展
Echols 表示,存儲研究能為醫學研究提供動力。隨著精簡、快速且高效的存儲解決方案不斷在新應用中實施,這一領域的方方面面均將受益。
Echols 解釋說,在研究人員和前沿思想家正大規模應用內存和存儲的多種方式中,其中有八種應用正推動著前沿科學和醫學的發展:
大數據與分析
物聯網 (IoT) 設備
混合云
非易失性存儲主機控制器接口規范 (NVMe) 和單根輸入/輸出虛擬化 (SRIOV)
橫向擴展架構
人工智能 (AI) 和機器學習
安防
軟件定義的存儲 (SDS)
Echols 說:“僅看存儲方面的業務,這些是我們在宏觀趨勢層面真正能影響到的領域。”
美光科技首席技術營銷工程師 Tony Ansley 表示,上述很多應用均能從與精簡存儲這一基本概念中獲益:更快速地存儲和計算數據。比如說,如果研究人員可以判斷某個神經元是處于活躍狀態還是不太活躍狀態,他們就能更快速地得出結論。
Ansley 說,“它不僅是存儲技術,也是整個計算機行業的架構技術。如何針對新興的服務器平臺、服務器技術和處理器技術的需求優化存儲,使我們能夠在更小的整體空間內確保更多的存儲容量和更快的存儲速度,從而提高分析速度呢?”
Crucial DDR4 DRAM 等美光內存產品能幫助醫學研究技術縮短處理時間。 圖片來自 Dsimic。
在計算架構上直接分析數據大約需要 5 納秒來完成處理。就處理時間而言,DRAM 與計算架構極其接近,需要約 30 納秒。但隨著內存解決方案越來越遠離計算架構,處理時間也隨之增加。SATA 固態硬盤處理同樣的數據需要 300 微秒,而 SAS 普通硬盤需要 6 毫秒。在遙遠的另一端,混合 SAN 需要整整 30 毫秒。
這看起來可能差別并不大,尤其是當這些數字僅是一秒的極小一部分時,但 Echols 建議用簡單易懂的說法來解釋它。如果在計算架構中直接處理數據需要 1 秒,那么 DRAM 處理同樣的數據需要 6 秒。SATA 固態硬盤需要 16 個小時,SAS 普通硬盤需要 2 周,而混合 SAN 需要 2-3 個月。在這個層面,Echols 說:“這些速度極快的計算架構等不了那么久。”
Echols 說:“美光科技的創新之處也正在于此。從 DRAM 到固態硬盤領域,我們在不斷創新。這是我們推動行業發展的貢獻所在。”
醫學的未來
Ansley 表示,美光科技助力精簡醫學研究技術的一個主要方式是:在更小的外形規格內實施存儲解決方案,方便研究人員隨身攜帶。
Ansley 說,“尤其是在可能爆發特定類型病原體的第三世界國家/地區,研究人員可能需要收集實時視頻掃描或超聲波掃描,即大量數據需要處理,所以他們更希望能夠把存儲數據握在手里而不是推在車里。”
Tony Ansley 認為,美光科技的內存產品非常適合用來為移動醫療設備提供支持。圖片來自哥倫布空軍基地。
就像 MultiMAP 收集來自每個大腦神經元的數據一樣,其他醫學技術也會收集海量數據,從高分辨率的X射線圖到超聲波掃描圖文件中的數千兆字節的數據,均是如此。研究人員需要能在現場隨時輕松獲取更多的數據,避免不斷上傳和下載。因此,Ansley 說:“如果能將所有技術更高效地集成到越來越小的封裝中,我就能夠用手拿著而不用背在背上。”
他接著說道:“舉例來說,作為行業的一份子,美光科技始終在考慮如何將更多存儲集成到單個 NAND 芯片中。我們將 2.5 英寸硬盤或固態硬盤的存儲從過去的 100GB 擴展到了 10 到 20TB,而這僅用了短短幾年的時間,我們還將繼續努力。”