《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 設計應用 > 一種ASIC硬件圖像匹配最大互相關算法的設計和實現
一種ASIC硬件圖像匹配最大互相關算法的設計和實現
摘要: 一種ASIC硬件圖像匹配最大互相關算法的設計和實現,圖像匹配是指通過一定的匹配算法在兩幅或多幅圖像之間識別同名點,如二維圖像匹配中通過比較目標區和搜索區中相同大小的窗口的相關系數,取搜索區中相關系數最大所對應的窗口中心點作為同名點。其實質是在基元相似性
Abstract:
Key words :

    圖像匹配是指通過一定的匹配算法在兩幅或多幅圖像之間識別同名點,如二維圖像匹配中通過比較目標區和搜索區中相同大小的窗口的相關系數,取搜索區中相關系數最大所對應的窗口中心點作為同名點。其實質是在基元相似性的條件下,運用匹配準則的最佳搜索問題。圖像匹配技術是近代信息處理,特別是圖像信息處理領域中極為重要的技術。圖像匹配就是要根據參考圖像和實時圖像來選定某些特征、相似性準則及搜索策略進行相關運算,以確定匹配的最佳空間對應點。它主要研究的問題有特征空間、相似性度量和搜索策略三個方面。圖像匹配關鍵是要確定有效的匹配方法,要求匹配概率高、誤差小、速度快且適時性好。 圖像匹配的方法一般分為基于灰度的匹配方法和基于特征的匹配方法兩大類。

  圖像匹配是圖像處理和模式識別領域中的一個非常關鍵問題,同時也是眾多計算機視覺理論與應用的基礎,它的研究成果廣泛應用于目標識別、遙感測量、自動導航、虛擬現實、醫學診斷、生產自動化及軍事等方面。由于圖像具有很強的結構性,而圖作為一種描述數據的工具可以保留結構、區域之間的相互關系,是一個非常重要而有效的結構特征信息的表示方式,因此,用圖來描述圖像的結構特征并且應用圖匹配來研究圖像特征之間的匹配問題受到了越來越多的關注,成為了目前模式識別等領域的研究熱點問題。

  圖像匹配一般可采用如下幾種方式實現:①軟件;②高速DSP;③面向算法的專用ASIC器件。軟件方法靈活,可大大降低計算量,但它必須以高速DSP硬件平臺為基礎,才可能滿足高實時性要求;高速DSP方法簡單靈活,能夠滿足高實時性要求,如TI公司的TMS320C6X系列高速DSP芯片,速度高達1600MIPS[4],單片機就可實現高速實時處理系統。以這高速DSP芯片組成的硬件結構應是圖像匹配計算機首選的硬件實現結構。但對應用于尖端科技的這些高速DSP芯片,西文發達國家對我國采取禁售策略,這使我國的某些科技領域受到很大的制約,因此在我國必須另辟途徑以避免禁售策略的制約。面向算法的專用ASIC器件方法,采用大量的并行功能單元,速度高、可以滿足嵌入式應用中的高速實時計算要求,而且結構簡單、軟件編程簡單、硬件實現容易、體積小、成本低,特別適應我國國情。因此開發研究專用ASIC組成的高速圖像匹配計算機實現結構具有重要的意義。

  1 圖像匹配最大互相關算法分析

  基于灰度的圖像匹配算法有許多種,其中最基本的有最小絕對差算法、最小平方差算法,最小卷積算法、最大互相關算法、不變矩算法等十幾種。它們各有優缺點,其中最大互相關算法具有去直流噪聲、匹配位置準確等特點,因而成為圖像匹配采用的主要方法。它的原始公式為:

  由于原始公式中的變量X(i,j),Y(i+u,j+v)為去均值后的圖像數據,不是原始圖像象素數據,這樣的算法結構有正有負、中間結果量多、計算量大、規律性差,不利于專用硬件實現[3],因此必須對原始公式進行變換。把(2)和(3)式代入原始公式(1)中,變換后的公式為:

  由于在圖像匹配搜索過程中基準圖是已知的,可預先對基準圖子圖數據進行均值和平方均值計算,然后預先裝配在相關計算機上。在圖像匹配過程中可不記其所需時間,因此圖像匹配所需時間主要為求實時圖數據和基準子圖數據的卷積。這一結論也可通過實際圖像匹配運算得到。在TI公司TMS320C30DSP(33M)上,采用公式(4)對不同象素數的實時圖和參考圖進行全搜索圖像匹配,其運算時間如表1所示(匯編程序、程序放置在片內存儲器,數據片外零等待存儲器)。

  從表1可看出,圖像匹配的最大互相關算法主要歸結為卷積運算,因此采用專用的硬件卷積電路必將大大加快圖像匹配運算速度。

  表1 采用互相變換公式圖象匹配運算周期數和時間

項  目 公式(4) 公式(4)鄭項所占比例
實時圖 參考圖 總運算周期數 卷積項周期數 約需時間(ms)
36×36 128×128 51443810 51354910 3081 99.83%
64×64 128×128 89362992 89308446 5362 99.93%
36×36 150×150 77423252 77291458 4645 99.83%
64×64 150×150 160078800 159994050 9605 99.95%

  2 以TMS320C30和專用ASIC器件LS9501組成的圖像匹配計算機結構介紹

  ASIC是Application Specific Integrated Circuit的英文縮寫,在集成電路界被認為是一種為專門目的而設計的集成電路。目前,在集成電路界ASIC被認為是一種為專門目的而設計的集成電路。是指應特定用戶要求和特定電子系統的需要而設計、制造的集成電路。ASIC的特點是面向特定用戶的需求,ASIC在批量生產時與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優點。

  2.1 專用圖像匹配器件LS9501介紹

  LS9501[2]是西安微電子技術研究所根據圖像匹配的特點研制成功的一個高速[20M]二維具有3x3內核的卷積器,它的主要功能是可同時對9對象素值實現乘加運算,即實現:.LS9501的輸入是二維無符號8位的圖像數據,輸出是無符號20位卷結果和二維串行移位無符號8位的圖像數據。其內部結構采用流水線并行技術,主要的功能單元有寄存器組、快速乘法器、加法器和控制電路,如圖2所示。電路中設置的兩組寄存器A和B由9個8位的移位寄存器構成,可存放9個圖像象素數據。9個快速乘法器可保證在每一個時鐘內同時進行9對圖像數據相乘。其工作原理為:向A寄存器輸入9個實時圖象素數據后,再向B寄存器輸入入九個基準圖像素數據,當9對象素值輸入完后,經過一定時間延遲,即可得到卷積結果。此后,如A寄存器的數據不變,B寄存器繼續輸入數據,則每輸入一個數據,即可獲得一個9個圖像象素數據卷積結果。如果將多個LS9501卷積器級連起來,可實現更多對象素數據的卷積運算。例如,將4個LS9501級連,可實現36對象素數據的卷積,但要將4個卷積器的結果加起來,才能得到最后的結果。為此,西安微電子技術研究所研制了級連加法器LS9502,它的功能是在60ns內將4LS9501的輸出結果求和。

  3 圖像匹配計算機結構

  將4個卷積器LS8501和級連加法器LS9501組合起來作為TMS320C30數字信號處理器的快速協處理器部件,可組成一種高速的單DSP+多ASIC系統結構的嵌入式計算機,如圖3所示。其工作過程為:首先TMS320C30按一定次序把36個實時圖象素數據從實時圖存儲器中取出并輸入LS9501的A寄存器中,然后,從基準圖存儲中將基準圖像素數據輸入B寄存器。輸入36個基準圖像素數據后,經過一定時間延遲,即可讀出第一個36對圖像象素數據卷積結果。此后即建立起流水,每輸入一個基準圖數據可得到相應36對圖像象素數據卷積結果,直至對整個基準圖匹配計算完。當實時圖比較大時,可把實時圖分成若干子圖,然后對每一個子圖分別進行卷積運算,最后再把它們的結果加在一起。這樣,工作量最大的匹配計算任務由LS8501完成,TMS320C30將各個圖匹配結果進行累加,求最大互相關值,并對卷器控制輸入8位灰度圖像數據。

  4 圖像匹配結果與討論

  在上述圖像匹配計算機中,采用美國TI公司的TMS320C30(33M)DSP芯片主為處理器,4片關并行的LS9501和級連加法器LS9502組成圖像匹配協處理器,外部圖像存儲器讀寫為零等待狀態。根據組成的計算機系統結構,把36x36的實時圖分成36個4x9的子圖,然后計算每一子圖與相應基準圖子圖卷積,最后把各個子圖卷積結果累加在一起。通過編寫TMS320C30匯編程序,對不同大小實時圖和基準圖進行搜索(即匹配所有(M-N+1)2個子圖)最大互相差匹配運算,運算結果匹配位置正確。匹配運算時間如表2所示(對基準圖像素數據預處理,不計運算時間)。

  表2 實時圖和基準圖匹配運算時間

圖像大小 運算時間/ms
實時較 基準圖 由單DSP執行 由DSP+ABIC執行
36×36 128×128 3081 623
36×36 150×150 4645 946

  從表2可看出,采用專用集成電路LS9501可大大加快圖像匹配運算速度,而且編程比較簡單,實現容易,實測結果令人滿意的。

  本研究為國家"九五"預研項目"高速數字信號處理機技術"的一部分,已通過國家驗收,并已應用于高速圖像相關計算機中。這一研究的成功使我們看到了打破西方禁售策略的一種簡單可行的方法。在實驗中我們發現LS9501具有非常大的提高其實時性的潛力,現分析如下:

  在實驗中發現,LS9501內部圖像數據移位寄存器時鐘和3級加法器寄存器時鐘不為同一時鐘,這使得卷積模塊的并行效率大為降低。如果將其改進為同一時鐘,那篤在圖3所示單機系統結構中,對(36x36)實時圖與(128x128)或(150x150)基準圖圖像匹配時間將分別為394ms和592ms,圖像匹配速度提高約1倍(軟件模擬)。另外在實驗的單機系統結構中,卷積模塊完全靠TMS320C30控制,其時鐘輸入依賴TMS320C30讀寫信號,而且TMS329C30對外部存儲器連續時讀寫信號不變化[1],必須加NOP指令以使讀寫信號變化。這樣LS9501的性能沒有得到完全發揮,而且TMS320C30也不能處理其它任務,二者依賴性太大,相互制約,并行度和實時性難以得到提高。卷積模塊發展為智能卷積處理器,那么硬件結構右發展為主從式雙機計算機系統結構:主機為DSP,從機為卷積處理器。這種系統結構可使DSP與卷積器的依賴 性降到最低,提高任務級并行性,也可最大限揮LS9501的性能,從而提高圖像匹配的速度。在不增加單芯片實現的卷積規模條件下,開發更高速度的LS9501,同樣可提高圖像匹配的速度。不容質疑,提高單芯片實現的卷積規模必將較大地提高圖像匹配的速度。

  由實驗結構及以上分析可以預見,圖像匹配最大互相關的專用ASIC實現方法是一個簡單可行的方法,并具有很好的發展前景,完全可以開發體積小、成本低、速度與TI公司C6000系列高性能DSP的速度相比美的卷積處理器。
 

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 国产亚洲精品91 | 日韩激情视频在线观看 | 黄色在线播放 | 久久免费黄色 | 国产亚洲女在线精品 | 日本r级视频 | 免费在线观看污片 | 最近的中文字幕大全免费版 | 亚洲天堂999 | 看一级毛片国产一级毛片 | 视频在线观看免费网站 | 午夜a级毛片 | 亚洲国产日韩欧美综合久久 | 日本人成年视频在线观看 | 国产在线a不卡免费视频 | 午夜96影视 | 国产午夜视频在线观看第四页 | 日日噜噜夜夜狠狠 | 久久本道综合色狠狠五月 | 欧美性精品hdvideosex | 亚洲视频在线视频 | 国产亚洲一区二区三区在线 | 欧美成人在线免费观看 | 国产成人欧美一区二区三区的 | 久久午夜夜伦鲁鲁影院 | 国产成人精品精品欧美 | 成人在线播放视频 | 新一级毛片国语版 | 国产成社区在线视频观看 | 日本一区二区视频在线观看 | 欧美视频一区二区三区 | 日韩欧美一二三区 | 中国videos18高清hd | 成人影院高清在线观看免费网站 | 国产成人深夜福利短视频99 | 成人a一级毛片免费看 | 精品一区二区三区在线观看 | 亚洲精品人成网线在线 | 亚洲欧美精品综合中文字幕 | 在线观看日韩欧美 | 亚洲欧洲高清 |