文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2015.07.043
中文引用格式: 羅亮,龍偉,李富貴,等. HHT在血細胞特征提取中的應用[J].電子技術應用,2015,41(7):154-157.
英文引用格式: Luo Liang,Long Wei,Li Fugui,et al. Application in blood feature extraction with Hilbert-Huang trans-
form[J].Application of Electronic Technique,2015,41(7):154-157.
0 引言
血細胞分析儀是醫院檢驗科、化驗室的常規設備之一[1]。血細胞的計數與分類是臨床上判斷疾病類型和嚴重程度的重要標準。國內外血液分析儀主要采用電阻抗法對細胞進行判斷和識別。電阻抗法主要原理是細胞通過小孔電極產生電壓脈沖,由脈沖的個數和幅值對細胞進行計數和分類。國產血細胞分析儀普遍采用模擬電路識別法[2],將電壓脈沖信號轉化為能觸發計數器的方波來實現計數。該方法簡單快捷,能適應于基本的臨床初診,但在計數正確度和分類準確度上無法在臨床上進一步病理分析和確診,無法滿足高端市場的需求。
類似血細胞信號這種非線性、非平穩、非高斯、非確定性的時變信號,常見的特征提取方法有:短時窗傅里葉變換(STFT)、Wigner-Ville分布、小波變換等[3,4],但這些方法各自均有不足之處,如:STFT容易受窗函數的影響,Wigner-Ville分布受到交叉項的干擾,小波變換的時頻分辨率不高且不具備自適應能力。為此,Norden E.Huang等人提出了一種新的信號分析方法——希爾伯特-黃變換(Hilbert-Huang Transform,HHT)[5-8],通過EMD(Empirical Mode Decomposition,EMD) 方法將信號分解為有限個IMF(Intrinsic Mode Function,IMF)的和,對每個IMF進行Hilbert變換得到有意義的瞬時頻率,從而給出頻率隨時間變化的精確表達,進而表示出信號在時間-頻率平面上的幅度分布。本文主要研究應用HHT 對血細胞進行特征提取,并在此基礎上采用多類分類支持向量機方法實現了多形態血細胞信號的分類識別。
1 血細胞信號分析
根據庫爾特原理[9],血細胞通過檢測小孔時產生電壓脈沖信號,根據脈沖數量得到單位時間內通過細胞的個數。實際檢測過程中由于樣本濃度、小孔負壓、微型氣泡等影響,檢測到的細胞脈沖形態多樣[10],圖1(a)是一個細胞通過時的單峰信號,圖1(b)是兩個或多個細胞同時通過時的M型多峰脈沖信號,圖1(c)是單個細胞從檢測小孔邊緣斜向通過時的“m”型駝峰式脈沖信號。多形態的脈沖信號影響血細胞計數的準確度,因而,在對血細胞信號進行正確分類與識別前,需要對這3種形態的血細胞脈沖信號進行合適的特征分析與提取。
2 血細胞特征提取
2.1 時域特征提取
單純的脈沖計數容易將M信號和m信號誤判為單峰信號,引起脈沖信號的誤計或漏計。考慮到M信號和m信號時域特征相似,本小節以M信號為代表對這兩種形態的雙峰信號建立模型進行特征分析。
圖2是一例典型的M信號脈沖波形。α、β分別是第一個脈沖下降時的平均角度和第二個脈沖上升時的平均角度。
根據信號分析結果可知,m信號的谷值較M信號谷值高,且后者的第二個脈沖變化程度較前者劇烈,因此,采用峰谷比和陡度描述兩者在時域的差異。
根據上述分析,提取兩個脈沖的寬度和高度以及峰谷比和陡度構造M信號的時域特征向量:
2.2 頻域特征提取
血細胞脈沖信號的時域特征能夠有效區分單峰和雙峰脈沖信號。本小節主要分析兩種形態的雙峰脈沖信號的特征差異,提取能夠正確區分這兩種形態脈沖的特征量。
圖3是兩種形態的雙峰脈沖信號序列,其序列長度和脈沖個數均相同。
對這兩種脈沖序列進行經驗模態分解[11],得到一序列模態分量,如圖4所示。
由圖4可見:原始脈沖序列經過EMD分解后得到一序列頻率由高到低的模態分量,且越早分解出來的分量頻率越高,IMF1分量代表原始信號的最高頻率成分,往后依次分解得到次高頻、中頻、低頻成分,最后得到單調的趨勢分量。各個分量在同一局部位置上的頻率成分和振蕩模式均不相同,表明經驗模態分解能夠充分體現原始信號的所有局部振蕩。
對分解后的IMF分量進行Hilbert變換,得到各分量的瞬時幅值和瞬時頻率。將幅值表示成時間-頻率的分布后,得到原始信號的Hilbert幅值譜(簡稱Hilbert譜),如圖5所示。在Hilbert譜的基礎上求得原始信號的邊際譜如圖6所示。由信號的Hilbert譜和邊際譜可以看出,對信號幅值和能量的主要貢獻頻率主要集中在IMF2~IMF8所表示的的頻段上。
血細胞脈沖信號的形態差異和固有特征與其自身的幅值、頻率和能量有著密切的內在關聯。為了研究兩種形態的雙峰脈沖信號的差異性,對兩者的平均強度、頻譜質心、能量貢獻率這3個特征量進行了對比分析。設原始信號經EMD分解后得到M個模態分量和一個殘余量,其中第i階模態分量共有N個采樣點,則第j個采樣點的瞬時幅值、瞬時頻率、瞬時強度、瞬時能量分別為aij、fij、Aij、Eij,i=1,2,…,M;j=1,2,…N。
(1)平均強度
平均強度體現了在給定頻帶范圍內信號的幅值特征,反映了信號在頻域空間的強度分布。第i階模態分量的平均強度可定義為:
(2)譜質心
譜質心[12]是信號分析的一個重要特征量,是在給定頻帶范圍內以每個頻率成分的能量為權重的加權平均頻率,它反映了信號能量與頻率成分之間的分布關系。第i階模態分量的譜質心可定義為:
(3)能量貢獻率
能量貢獻率表示單個模態分量的能量在原始信號總能量中的比重,它能夠體現原始信號的某些固有特征。第i階模態分量的能量貢獻率可定義為:
對圖3中的兩類脈沖信號進行EMD分解和Hilbert譜分析,求得各分量的平均強度、譜質心、能量貢獻率,如圖7和圖8所示。
信號經EMD分解后一序列IMF分量,其頻率是由高到低的。根據IMF分量頻率分布規則,圖7中沿著X軸從右至左的分量分別是IMF1~IMF8。對比分析兩類脈沖信號的分量特征可以發現,前3階分量m脈沖序列的譜質心和平均強度均低于M脈沖序列;由第4~6階分量的譜質心和平均強度可以看出,M脈沖序列的模式特征較m脈沖序列突出。由圖7可以看出,兩類脈沖序列的第2~5階分量特征有較好的區分度。
圖8反映了兩類脈沖序列的能量貢獻率差異與圖7中其平均強度的差異大體一致。M脈沖的能量主要集中在第2~6階分量中,而m脈沖的能量則主要集中在第2~5階分量中。
綜合上述分析和討論,兩類脈沖序列的特征差異主要體現在第2~5階分量上,分量的平均強度和能量貢獻率均反映了信號在頻域里的能量特征。因此,選擇第2~5階的分量譜質心和能量貢獻率構成血細胞脈沖信號的頻域特征向量:
2.3 血細胞特征向量
結合血細胞脈沖信號的時域特征向量、頻域特征向量,可以得到用于區分3種形態的血細胞脈沖信號的14維血細胞特征向量:
3 實驗仿真與應用
從項目組自有的臨床數據庫中隨機選擇3種形態的脈沖樣本各200個,用以構成本研究的樣本庫,奇數樣本用于訓練,偶數樣本用于檢驗。采用的分類器是多類分類支持向量機[13],其參數設置如表1所示。
(1)用數據樣本庫中的奇數樣本對已設計好的多類分類器進行訓練,用偶數樣本對訓練好的分類器進行測試,同時使用模擬電路法進行測試對比。表2分析比較了不同識別方法下的3種形態的血細胞脈沖信號的分類結果。
(2)以瑞士奧菲MYTHIC 18儀器為參考,按照《中華人民共和國醫藥行業標準——血液分析儀》的檢驗方法,隨機選取醫院門診部門200位患者標本,以白細胞(white blood cell, WBC)為例對比采用HHT方法的國產儀器和MYTHIC 18的可比性和相關性,結果見表3。
由表2可以看出,根據HHT方法提取的血細胞特征量,多類分類支持向量機能夠對這3種形態的血細胞脈沖信號進行正確分類與識別,分類精度可達94.33%。而模擬電路識別法存在較大的識別誤差。由于模擬電路識別法是通過觸發器將脈沖波轉化為方波來對脈沖信號進行計數,且存在漏計或誤計的弱點,它無法反應出血細胞信號的特征,無法正確識別出雙峰信號。
由表3則可以看出,使用HHT對血細胞進行特征提取識別能提高血細胞分析儀的可比性和分類相關性。從整體上看,該算法識別準確率相對較高,有效提高了儀器的計數正確度和分類準確度。
4 結語
本文研究了基于HHT 的血細胞信號的特征提取方法。HHT 作為一種新的信號處理方法,在非平穩非線性信號的分析上有著獨特的優勢。研究表明,HHT 具有局部化特性,分辨率高,適應性好并且實現簡單,可用于實時計算,為多形態血細胞脈沖信號的特征提取提供了有力的途徑和研究思路。最后的實驗結果也驗證了HHT方法在特征提取方面的有效性與可行性。
參考文獻
[1] 胡少華.加強血細胞分析儀質量控制提高血液檢驗水平[J].中國實用醫藥,2012,7(8):255.
[2] 許超.橈動脈超聲多普勒血流信號的特征提取及分類研究[D].哈爾濱:哈爾濱工業大學,2008.
[3] 許文榮.臨床血液學檢驗(第五版/本科檢驗)[M].北京:人民衛生出版社,2012.
[4] 孟慶豐.信號特征提取方法與應用研究[D].西安:西安電子科技大學,2006.
[5] 周小龍.希爾伯特—黃變換在故障診斷中的應用[D].吉林:長春工業大學,2014.
[6] HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C].Proc.R.Soc.A.1998,454:903-995.
[7] HUANG N E.New method for nonlinear and nonstationary time series analysis:Empirical mode decomposition and Hilbert spectral analysis[C].In:Proceedings of SPIE,2000,4056:197-209.
[8] 賈春花.希爾伯特.黃變換及其在信號處理中的應用研究[J].電力學報,2013,28(4):150-151.
[9] 叢玉隆,樂家新,袁家穎.實用血細胞分析技術與臨床[M].北京:人民軍醫出版社,2011.
[10] 張春光,黃民雙,陶寶祺.血細胞計數分析儀的信號處理[J].自動化與儀器儀表,2000,89(3):27-29.
[11] 付曉波.經驗模態分解法理論研究與應用[D].山西:太原理工大學,2013.
[12] 王娜, 陳克安.分段譜質心特征在水下目標識別中的應用[J].兵工學報,2009,30(2):144-149.
[13] 白鵬,張喜斌,張斌,等.支持向量機理論及工程應用實例[M].西安:西安電子科技大學出版社,2008.