近日,來自瑞士聯邦理工學院的一組研究人員在美國光學學會的高影響因子期刊 Optica 上發表文章報告其研究成果。他們利用深度神經網絡對經過多模光纖傳輸的數字圖像進行精確重建,在長達一公里的光纖上實現了 90% 的準確率。圖像經過光纖傳輸后輸出的是散斑圖,人眼無法辨認其內容,該研究小組利用深度神經網絡模仿人腦學習過程,把模糊難認的散斑圖轉換成可識別的數字圖像,該神經網絡還能夠處理因環境對光纖的擾動而造成的失真。該研究有望改進內窺鏡成像等醫療程序和通信應用。
多模光纖輸出的圖像散斑圖(speckle pattern)輸入到深度神經網絡的隱藏層,并被重建為數字 3。(圖源:Demetri Psaltis, Swiss Federal Institute of Technology Lausanne)
一個研究小組創造性地使用神經網絡來模擬人腦處理圖像的過程,并且報告了其對在長達一公里的光纖上傳輸的圖像進行精確重建的研究工作。
研究人員在美國光學學會(OSA)高影響因子期刊「Optica」上報告了他們的研究,他們訓練一種被稱為深度神經網絡的機器學習算法,基于數字圖像傳輸到光纖遠端所生成的散斑圖來重建數字圖像。該研究可以改進用于醫學診斷的內窺鏡成像,提高光纖通信網絡的承載信息量,或者提高光纖的光功率。
瑞士聯邦理工學院的 Demetri Psaltis 稱:「我們使用現代深度神經網絡架構從光纖的雜亂輸出中檢索出輸入圖像。」他與同事 Christophe Moser 一同領導了這項研究。他補充道:「我們證明了,在長達 1 公里的光纖上完成這個過程是可能的。」并且將該工作稱作「一個重要的里程碑」。
解碼模糊圖案
光纖通過光傳輸信息。多模光纖比單模光纖具有更強的信息傳輸能力。它們具有許多通道(被稱為空間模式,因為它們具有不同的空間形狀),這些通道可以同時傳輸不同的信息流。
盡管多模光纖非常適合傳輸基于光的信號,但要用它傳輸圖像還存在一些問題。來自圖像的光穿過所有的通道后,從另一端傳出的是一種人眼無法解碼的散斑圖。
為了解決這個問題,Psaltis 和他的團隊決定使用深度神經網絡,這是一種運作方式與人腦類似的機器學習算法。深度神經網絡可以賦予計算機識別圖像中物體的能力,還能幫助改進語音識別系統。輸入數據通過幾層人工神經元進行處理,每層神經元在進行一個小運算后將結果傳遞給下一層神經元。機器通過識別與輸入相關的輸出模式來學習識別輸入圖像。
參與該項目的博士生 Eirini Kakkava 解釋道:「如果我們思考一下神經網絡的起源(即人腦),就會發現它的工作機制很簡單。當一個人盯著一個物體看的時候,大腦中的神經元就會被激活,這個過程表示對一個熟悉的物體進行識別。我們的大腦之所以能夠做到這一點,是因為它在我們的生活中會接受同一類物體的圖像或信號的訓練,這改變了神經元之間連接的強度。」為了訓練一個人工神經網絡,研究人員基本上遵循相同的處理過程,教會神經網絡識別某些圖像(在本文中指手寫數字),直到它能夠識別之前從未見過、但與訓練圖像屬于同一類別的圖像。
從數字中學習
為了訓練系統,研究人員使用了一個包含 20000 個手寫數字樣本的數據庫,所有樣本是 0-9 的數字。他們選擇了其中的 16000 個樣本作為訓練數據,留出 2000 個樣本作為驗證集,剩下的 2000 個樣本則用來測試已驗證的系統。他們用激光照射每一個數字,并且將光束通過大約有 4500 個通道的光纖傳輸到遠端的相機上。他們用一臺計算機測量輸出光的強度是如何在捕獲到的圖像中變化的。他們為每個數字收集了一系列實例。
盡管為每個數字收集的散斑圖對人眼來說都差不多,但神經網絡能夠辨別出其中的細微差異,并識別出與每個數字相關的光強度模式。測試表明,該算法對在 0.1 米長的光纖中傳輸的圖像達到了 97.6% 的識別準確率,在 1 公里長的光纖中達到了 90% 的識別準確率。
這是一種更簡單的方法
研究小組的另一位成員 Navid Borhani 說,與其它需要對輸出進行全息測量的方法相比,這種機器學習方法能夠更簡單地重建通過光纖傳輸的圖像。該神經網絡還能夠處理因環境對光纖的擾動而造成的失真,例如溫度波動或氣流引起的光纖移動,這些擾動會增加圖像的噪聲,而這種情況會隨著纖維長度的增加而變得更糟。
Psatis 表示:「深度神經網絡具備檢索通過多模光纖傳輸的信息的卓越能力,這將有利于內窺鏡成像等醫療過程和通信應用。」通信信號通常需要穿越若干公里的光纖,并且可能失真,而他們的這項技術可以修正這一現象。醫生可以使用超薄光纖探針收集人體內的神經束和動脈圖像,無需復雜的全息記錄儀,也不用擔心操作時移動幅度過大。Psatis 說:「呼吸或血液循環造成的微小運動會導致通過多模光纖傳輸的圖像失真。」而他們創建的深度神經網絡方法是處理這種噪聲的高效解決方案。
Psaltis 和他的團隊打算通過生物樣本測試這項技術,看看是否和識別手寫數字一樣有效。他們希望利用不同類型的圖像進行一系列研究,以探討這項技術的可能性和局限性。