本發(fā)明涉及一種用于識(shí)別生理聲音的方法,特別針對(duì)一種提取與分類生理聲音特征的方法。本發(fā)明也涉及一種用于識(shí)別生理聲音的系統(tǒng)。
背景技術(shù):
:非侵入性聽診對(duì)心臟、肺、骨髓、小腸、血管病的分析已經(jīng)成為疾病醫(yī)療診斷的非常有用的工具。傳統(tǒng)的電子聽診器于1992年才被發(fā)明。現(xiàn)代的電子聽診器能夠提升信號(hào)的質(zhì)量以及提供心臟音信號(hào)的可視化應(yīng)用,例如心音圖(phonocardiogram,PCG)。心音圖(PCG)以及心電圖(Electrocardiography,ECG)可以應(yīng)用于心臟的基礎(chǔ)測(cè)試。通過(guò)儀器的機(jī)械振動(dòng)記錄電信號(hào)可以獲得心音圖(PCG)(聽診器放置在胸部的特定位置進(jìn)行數(shù)據(jù)收集)。在心臟的任意兩面放置兩個(gè)電極,并將兩個(gè)電極連接到心電圖機(jī)的正極與負(fù)極,形成標(biāo)準(zhǔn)心電圖并記錄身體任意兩個(gè)地方的心電的電壓變化。心電圖通常在心電圖測(cè)紙上所示或者監(jiān)控,反映整個(gè)心臟跳動(dòng)的節(jié)律以及心肌的薄弱部分。第一心音(S1)發(fā)生在心臟收縮期,由于心室收縮血液流經(jīng)大血管并引起二尖瓣和三尖瓣關(guān)閉。第一心音(S1)持續(xù)時(shí)間相對(duì)長(zhǎng),音調(diào)低。第二心音(S2)發(fā)生在心臟舒張期,由于心室壁擴(kuò)張所引起主動(dòng)脈瓣和肺動(dòng)脈瓣迅速關(guān)閉,且房室瓣打開引起血液從心房流向心室。第二心音(S2)持續(xù)時(shí)間相比第一心音(S1)更短。臨床上,異常的第三心音以及第四心音有時(shí)候也會(huì)被發(fā)現(xiàn)。第三心音的頻率以及幅度較低,由心室壁擴(kuò)張所引起。第四心音由于心房收縮以及心室壁的舒張時(shí)血流快速充盈心室所引起。大量的心臟疾病都能夠通過(guò)聽診有效診斷。在一些嚴(yán)重的心臟疾病(例如心臟瓣膜功能失常、心臟衰竭等),心臟聽診已經(jīng)成為早期診斷中成功、可靠、低成本的方式。然而,心臟聽診的準(zhǔn)確性同醫(yī)生的經(jīng)驗(yàn)息息相關(guān)。一些疾病展示了明顯的發(fā)生方式(例如,第一心音(S1)以及第二心音(S2)發(fā)生之間或者第二心音(S2)之后等)。因此,如何自動(dòng)提取以及初步判斷第一心音(S1)與第二心音(S2)的發(fā)生時(shí)間成為重要課題。這個(gè)課題能夠有效幫助醫(yī)生初步證實(shí)疾病的發(fā)生。常規(guī)情況下,第一心音(S1)以及第二心音(S2)的時(shí)間順序成為判斷的素材。而且心率不齊的情況下,時(shí)間順序不再可靠。如果第一心音(S1)與第二心音(S2)之間的聲紋對(duì)比較為合理,心律不齊病例的判斷需要提高質(zhì)量。關(guān)于心音的提取研究可以分為兩大類:心電信號(hào)相關(guān)性以及心電信號(hào)非相關(guān)性。心電信號(hào)的相關(guān)性研究包括心電圖基于瞬時(shí)能量的提取(Malarvilietal.,2003)以及QRS波群和T波群的提取(E1-Segaieretal.,2005)。雖然如此,在低質(zhì)量的心電信號(hào),不大可能總是清晰的測(cè)出T波。在這種情況下,第二心音(S2)可以用非監(jiān)督分類器進(jìn)行分類(Carvalhoetal.,2005),雖然這些方式必須視乎硬件裝置以及被測(cè)試者的舒服程度。心電信號(hào)非相關(guān)性的方法可以分為非監(jiān)督類方法以及監(jiān)督類方法。非監(jiān)督類的方式包括使用歸一化平均香農(nóng)能量(normalizedaverageShannonEnergy,Liangetal.1997)以及高頻率的方式(Kumaretal.2006)作為小波分析。監(jiān)督類的方式包括神經(jīng)網(wǎng)絡(luò)分類器(Hebdenetal.,1996)以及決策樹(Stasisetal.,1996)用于分類。除此之外,最先進(jìn)的提取方式往往根據(jù)第一心音(S1)與第二心音(S2)之間的規(guī)律間距的特征。一般來(lái)說(shuō),平均的心跳速率(Olmezetal.,2003,Kumaretal.,2006)能夠在研究中假定。然而,這些假定并不能應(yīng)用在心律不齊患者的心臟音。在實(shí)際臨床案例中,對(duì)于心音圖以及心電圖同時(shí)同步進(jìn)行記錄與分析相對(duì)較為困難。另外,當(dāng)無(wú)脈搏性電氣活動(dòng)出現(xiàn)的時(shí)候,由于電流活動(dòng)的維持心電圖不能判定心率已經(jīng)停止。因此,如何根據(jù)獨(dú)有的心音圖(PCG)進(jìn)行診斷成為重要以及主流的研究課題。主流的檢測(cè)手段通常包括判斷第一心音(S1)以及第二心音(S2)的時(shí)間間隔特征。但是這種特征在一些情況諸如心率不齊變得不再可靠,極大地降低了檢測(cè)的準(zhǔn)確性。因此,前案中缺陷需要得到解決。技術(shù)實(shí)現(xiàn)要素:有鑒于此,有必要提供一種識(shí)別生理聲音的系統(tǒng),包括一接收模塊,一特征提取模塊,一分類器。接收模塊用于接收生理聲音;特征提取模塊用于提取所述生理聲音中至少一特征;分類器用于分類所述至少一特征以識(shí)別至少一種種類。所述接收模塊是一生理記錄裝置將生理聲音的模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)。所述生理記錄裝置是一電聽診器。所述特征提取模塊包括語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊以及梅爾頻率倒頻譜系數(shù)(MFCC)模塊。語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊用于從生理聲音中檢測(cè)至少一聲音片段;梅爾頻率倒頻譜系數(shù)(MFCC)模塊用于轉(zhuǎn)移所述至少一聲音片段到至少一種梅爾頻率倒頻譜系數(shù)(MFCC)特征向量中。所述系統(tǒng)進(jìn)一步包括K-平均算法模塊,用于從至少一種梅爾頻率倒頻譜系數(shù)向量中找出至少一代表點(diǎn)。所述分類器包括監(jiān)督分類器。所述監(jiān)督分類器包括K-近鄰算法(KNN)模塊,高斯混合模型(GMM)模塊,支持向量機(jī)(SVM)模塊或者深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊。所述生理聲音包括心音、肺音、腸鳴音、血管回音、氣管呼吸音、支氣管呼吸音以及手足呼吸音。所述心音包括第一心音(S1),第二心音(S2)以及兩者的混合模型。所述系統(tǒng)進(jìn)一步包括一比較模塊,用于對(duì)比正常生理聲音以及/或者異常生理聲音中至少一種類別以評(píng)估疾病風(fēng)險(xiǎn)。所述系統(tǒng)進(jìn)一步包括自動(dòng)體外心臟除顫器,動(dòng)態(tài)心電圖監(jiān)護(hù)儀,心肺復(fù)蘇器(CPR),心臟起搏器,埋藏式心臟復(fù)律除顫器(ICD),心電圖(EKG)或者超聲波裝置。當(dāng)系統(tǒng)在非危險(xiǎn)情況識(shí)別第一心音(S1)和第二心音(S2)時(shí),系統(tǒng)合并成心率檢測(cè)裝置。當(dāng)系統(tǒng)在危險(xiǎn)情況識(shí)別第一心音(S1)和第二心音(S2)時(shí),系統(tǒng)區(qū)分脈搏狀態(tài)和無(wú)脈搏,從而準(zhǔn)確決定使用哪種裝置。另外一方面,本發(fā)明提供一種使用如上所述系統(tǒng)的識(shí)別生理聲音的方法,包括:使用接收模塊,接收生理聲音;使用特征提取模塊,從生理聲音中提取至少一特征;使用分類器,分類至少一特征以識(shí)別至少一種類別。所述從生理聲音中提取至少一特征包括:使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊從生理聲音中檢測(cè)至少一聲音片段;以及使用梅爾頻率倒頻譜系數(shù)(MFCC)模塊轉(zhuǎn)移所述至少一聲音片段到至少一MFCC特征向量。所述方法進(jìn)一步包括:通過(guò)K-平均算法模塊從至少一MFCC特征向量中找出至少一代表點(diǎn)。所述分類器包括監(jiān)督分類器。所述監(jiān)督分類器包括K-近鄰算法(KNN)模塊,高斯混合模型(GMM)模塊,支持向量機(jī)(SVM)模塊或者深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊。所述生理聲音包括心音、肺音、腸鳴音、血管回音、氣管呼吸音、支氣管呼吸音以及手足呼吸音。所述心音包括第一心音(S1),第二心音(S2)或者二者的混合模型。所述方法進(jìn)一步包括:使用比較模塊對(duì)比正常生理聲音以及/或者異常生理聲音中至少一種類別以評(píng)估疾病風(fēng)險(xiǎn)。本發(fā)明的優(yōu)點(diǎn)在于識(shí)別生理聲音的系統(tǒng)以及方法能夠準(zhǔn)確識(shí)別特征性的生理聲音,并且能夠排除雜訊。從下述的詳細(xì)實(shí)施方式搭配附圖,本發(fā)明的其他目的、優(yōu)勢(shì)和新穎特征將變得更加的顯著。附圖說(shuō)明圖1顯示了本發(fā)明中識(shí)別生理聲音的系統(tǒng)的組成模塊圖;圖2顯示了本發(fā)明的分類器包括K-近鄰算法(KNN)模塊、高斯混合模型(GMM)模塊、支持向量機(jī)(SVM)模塊以及深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊;圖3是一個(gè)深度神經(jīng)網(wǎng)絡(luò)(DNN)模型;圖4顯示了一個(gè)流程圖,描述了圖1中識(shí)別生理聲音的方法:S201到S206分別代表步驟201到步驟206;圖5是本發(fā)明中第一心音(S1)和第二心音(S2)的光譜圖(上方位置)和波形圖(下方位置);圖6顯示了心音的精確結(jié)果,使用本發(fā)明的分類器KNN模塊、高斯混合模型(GMM)模塊、支持向量機(jī)(SVM)模塊和深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊。圖7顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的規(guī)則心音的能量差異聲音片段(實(shí)體方框部分所示);圖8顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的不規(guī)則心音的能量差異聲音片段(實(shí)體方框部分所示);圖9顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的正常肺音的能量差異聲音片段(實(shí)體方框部分所示);圖10顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的哮鳴肺的能量差異聲音片段(實(shí)體方框部分所示);圖11顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的濕啰肺音的能量差異聲音片段(實(shí)體方框部分所示)。具體實(shí)施方式本發(fā)明提供一種識(shí)別生理聲音的系統(tǒng)與方法。如圖1和2所示,識(shí)別生理聲音的系統(tǒng)100包括接收模塊110,特征提取模塊120,分類器130以及對(duì)比模塊140。所述特征提取模塊120包括語(yǔ)音活動(dòng)檢測(cè)(voiceactivitydetector,VAD)模塊121,梅爾頻率倒頻譜系數(shù)(Mel-FrequencyCepstrum,MFCC)模塊122,K-平均算法模塊123;分類器130包括K-近鄰算法模塊(K-nearestneighbor,KNN)模塊131,高斯混合模型(Gaussianmixturemodel,GMM)模塊132,支持向量機(jī)(supportvectormachine,SVM)模塊133或者深度神經(jīng)網(wǎng)絡(luò)(deepneuralnetwork,DNN)模塊134。準(zhǔn)備1特征提取(1)VAD模塊121VAD模塊121又稱為語(yǔ)音活動(dòng)檢測(cè)或者語(yǔ)音檢測(cè),通常被使用于判斷一段聲音信號(hào)是否存在人聲的語(yǔ)音處理技術(shù)。語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121的主要應(yīng)用在語(yǔ)音編碼和語(yǔ)音識(shí)別。VAD模塊121也常用在分類問(wèn)題前做為預(yù)處理,以提高后期辨識(shí)的準(zhǔn)確性。這種預(yù)處理在此的目的用于找出第一心音(S1)和第二心音(S2)的位置,同時(shí)進(jìn)一步偵測(cè)此聲音片段是第一心音(S1)還是第二心音(S2)。理想狀態(tài)下,通過(guò)聽診器采集的心臟音訊號(hào)通常遠(yuǎn)大于雜訊的訊號(hào),所以我們可以根據(jù)聲音能量的差異確定此片段是否是我們所需要的心臟音。經(jīng)過(guò)VAD模塊121處理之后的結(jié)果如圖3所示。以能量的差異作為判定心臟音的所在位置。首先,針對(duì)每段聲音信號(hào)計(jì)算該段語(yǔ)音的最大標(biāo)準(zhǔn)差,如公式(1)計(jì)算。公式(1)中m代表音框,n代表頻域,μ代表平均值。接下來(lái)計(jì)算該段聲音每個(gè)音框是否有心臟音,如公式(2)所示。fi代表第i個(gè)音框,1代表有心臟音以及0代表靜止的聲音,stdi代表第i個(gè)音框的標(biāo)準(zhǔn)差,α以及β代表參數(shù)。(2)MFCC模塊122通常來(lái)說(shuō),人體在不同頻率域的區(qū)間下有著不同的感知敏感度。正常情況下是對(duì)于低頻率有更高的分辨率,意味著在低頻時(shí)可以分辨較小的頻率差異。此外還需要考慮臨界頻帶現(xiàn)象。在1kHz頻率下的臨界頻帶寬度約為100Hz。1kHz頻率以上的臨界頻帶寬度成指數(shù)增長(zhǎng)。因此,我們可以根據(jù)人類聽覺特征,在頻率域中以梅爾量度(Melscale)劃分頻率帶,將屬于一條頻率帶中的頻率成分合在一起看成一個(gè)能量強(qiáng)度,然后將這些頻帶強(qiáng)度以離散余弦變換(DiscreteCosineTransform,DCT)計(jì)算之后轉(zhuǎn)化為倒頻譜,此為梅爾頻率倒頻譜(MelFrequencyCepstrum,MFC)。因?yàn)槊窢栴l率倒頻譜系數(shù)MFCC是依據(jù)人耳聽覺模型所產(chǎn)生的參數(shù),所以成功地被應(yīng)用于語(yǔ)音識(shí)別以及分類問(wèn)題中。MFCC模塊122利用下列6個(gè)連續(xù)的步驟計(jì)算MFCC:預(yù)強(qiáng),加窗口,快速傅立葉變換(FastFourierTransform,F(xiàn)FT),梅爾濾波器組,非線性轉(zhuǎn)換以及離散余弦變換(DiscreteCosineTransform,DCT)。一般來(lái)說(shuō),經(jīng)過(guò)以上六個(gè)步驟之后可以獲取十三個(gè)維度的語(yǔ)音特征,包括一個(gè)對(duì)數(shù)能量參數(shù)以及十二個(gè)倒頻譜參數(shù)。但在實(shí)際運(yùn)用于音訊分析上,通常會(huì)再添加差分倒頻譜函數(shù),以顯示倒頻譜參數(shù)如何隨著時(shí)間進(jìn)行變化。它的意義為倒頻譜參數(shù)相對(duì)于時(shí)間的斜率,也就是代表倒頻譜參數(shù)在時(shí)間上的動(dòng)態(tài)變化。因此,如果加上速度以及加速度的成分之后可以得到39維的語(yǔ)音特征,其計(jì)算方法如下所示:c[i]代表第i個(gè)維度的倒頻譜參數(shù),t代表音框的時(shí)間指標(biāo)。(3)K-平均算法模塊123K-平均算法模塊123主要目標(biāo)用于從大量高維度的數(shù)據(jù)點(diǎn)中找出具有代表性的數(shù)據(jù)點(diǎn)。這些數(shù)據(jù)點(diǎn)稱為群中心。再根據(jù)群中心進(jìn)行數(shù)據(jù)壓縮(利用少數(shù)的數(shù)據(jù)點(diǎn)代表大量的數(shù)據(jù)以達(dá)到壓縮數(shù)據(jù)功能)以及分類(以少數(shù)的代表點(diǎn)來(lái)代表特定的類別,可以降低數(shù)據(jù)量和計(jì)算量,避免雜訊帶入的負(fù)面干擾)。演算法的計(jì)算步驟如下所示:A.初始化:將訓(xùn)練資料隨機(jī)分成K群,任意地選擇K個(gè)值作為初始的群中心yk,k=1,2,...,KB.遞歸演算:a.將每一個(gè)數(shù)據(jù)x,對(duì)所有K個(gè)群中心計(jì)算與其之間的距離,并使其歸屬到距離最短的群中心。k*=argkmind(x,yk),x∈Ck公式(5)b.所有歸屬于Ck數(shù)據(jù)的x形成一個(gè)群。再重新計(jì)算其群中心yk。c.如果新的一組群中心與原先一組的群中心相同,沒(méi)有改變,則該訓(xùn)練結(jié)束。否則就以新的一組群中心替代原先的群中心?;氐絘步驟持續(xù)進(jìn)行遞迴演算。準(zhǔn)備2分類器(1)KNN模塊131K-近鄰算法(KNN)模塊131背后的本義是“物以類聚”。換句話說(shuō),同一類的物件應(yīng)該會(huì)聚集在一起。用數(shù)學(xué)的語(yǔ)言來(lái)說(shuō),如果同一類別的物件若以高維度空間中的點(diǎn)來(lái)表示,這些點(diǎn)之間的距離應(yīng)該會(huì)變得比較相近。因此,對(duì)于一個(gè)未知類別的一筆數(shù)據(jù),我們只要找出來(lái)在訓(xùn)練數(shù)據(jù)中和此筆數(shù)據(jù)最相鄰的點(diǎn),就可以判定此筆數(shù)據(jù)的類別應(yīng)該和最接近的點(diǎn)的類別是一樣的。K-近鄰算法(KNN)模塊131的分類步驟主要是將一個(gè)測(cè)量數(shù)據(jù)x分類到類別C中的其中一類。這些步驟的具體實(shí)施方式如下:A.決定要使用測(cè)量數(shù)據(jù)x,對(duì)訓(xùn)練數(shù)據(jù)中的最相鄰的數(shù)據(jù)點(diǎn)K。使用合適的距離公式計(jì)算距離。B.當(dāng)測(cè)量數(shù)據(jù)x,于某特定類別中有相對(duì)較多數(shù)的代表(在K個(gè)最近距離中于某類別中的個(gè)數(shù)占最多),則判定x為該類別。整個(gè)分類器所預(yù)先需要的信息是:最相鄰的K數(shù)據(jù)點(diǎn)的個(gè)數(shù),選擇計(jì)算距離的公式,以及訓(xùn)練數(shù)據(jù)。假定我們的訓(xùn)練集為成對(duì)的(xi,zi),i=1,...,n。xi代表第i個(gè)訓(xùn)練數(shù)據(jù)的向量,而zi是對(duì)應(yīng)的分類指標(biāo)(例如zi=j(luò)代表第i個(gè)訓(xùn)練數(shù)據(jù)向量是第j類別ωi的樣本)。將測(cè)試數(shù)據(jù)向量x與訓(xùn)練數(shù)據(jù)向量y之間的距離定義為d(x,y)。在此部分使用歐幾里得尺度(Euclideanmetric)作為距離計(jì)算公式,如公式6所示。(2)高斯混合模型(GMM)模塊132高斯分類器是一種常規(guī)的分類器,應(yīng)用貝葉斯定理(Bayes'theorem)作為基本的概念。這也是高斯分類器被稱為貝葉斯分類器(NaiveBayesclassifier)的原因。該高斯分類器的概念是利用已知的類型數(shù)據(jù)計(jì)算其概率分布,并在已知類型的概率分布中找出未知類型數(shù)據(jù)的概率,其中概率最高的類型就會(huì)被選作未知數(shù)據(jù)的類型,而平均值以及標(biāo)準(zhǔn)差作為決定整個(gè)模型的兩個(gè)參數(shù)。單一高斯分布是根據(jù)一個(gè)平均值和一個(gè)標(biāo)準(zhǔn)差描述其分布的形狀。然而,信號(hào)通常是以更加復(fù)雜的方式分布。因此,如果只使用一個(gè)高斯分布通常無(wú)法近似于該信號(hào)。而高斯混合模型是使用多個(gè)高斯分布來(lái)模擬信號(hào)。正因?yàn)槿绱?,信?hào)的分布能夠更好的得到模擬。而且,隨著混合高斯曲線的數(shù)量提升之后,分布的形狀變得更加的相似以及復(fù)雜程度變得相對(duì)提高。高斯混合模型包括3個(gè)參數(shù):平均向量μi,共變異矩陣∑i,加權(quán)值ωi。為了簡(jiǎn)化表示高斯模型,以λ來(lái)表示,表示的公式如公式(7)所示。λ={ωi,μi,∑i},i=1,...,K公式(7)特征向量z的混合概率密度函數(shù)利用公式(8)表達(dá)其中pi(z)為特征向量z的第i個(gè)高斯分布概率密度函數(shù)。其中因?yàn)樽畲蟾怕手禐?,所以(7)式中高斯混合模型的混合概率密度函數(shù)的加權(quán)值ωi必須符合公式(10)所述的條件才會(huì)成立。當(dāng)有一筆數(shù)目為N,維度為d的特征向量z,要將此訓(xùn)練樣本訓(xùn)練成符合高斯混合模型λ時(shí),即是希望求得適當(dāng)高斯混合模型λ的三個(gè)參數(shù)μi、∑i以及ωi(i=1,…,K)。使得訓(xùn)練過(guò)后的模型能充分代表特征向量z的分布。也就是找出一組適當(dāng)?shù)哪P蛥?shù),使得特征向量z以及高斯混合模型λ的相似性p(z|λ)為最大,如公式(11)所示。因?yàn)楣?8)是非線性的等式,解決過(guò)程中復(fù)雜的計(jì)算公式是難以避免的。一般來(lái)說(shuō),可以應(yīng)用最大期望(expectation-maximization,EM)演算法找出高斯混合模型的最佳參數(shù)。(3)SVM模型133支持向量機(jī)(SVM)模塊133廣泛使用在統(tǒng)計(jì)分類以及迴歸分析。根據(jù)實(shí)驗(yàn)證實(shí)SVM模塊133有強(qiáng)大的分類能力。SVM模塊133的中心概念是將訓(xùn)練數(shù)據(jù)映射到高維特征平面,以及建立一個(gè)最佳超平面(在高維度中的平面且于大間隔中擁有邊界)。大部分的SVM模型主要應(yīng)用在二元分類的問(wèn)題上,但也可以結(jié)合多個(gè)二元分類,建構(gòu)出多重類別的分類方法。而這些情況又被分為線性數(shù)據(jù)以及非線性數(shù)據(jù)兩種情形。假定一個(gè)子集{xi,i=1,...,n}以及子集被分配到ω1或者ω2其中一類,對(duì)應(yīng)標(biāo)記為yi=±1,其希望能找到一個(gè)超平面g(x)(g(x)=wTx+w0),使所有yi=+1的數(shù)據(jù)點(diǎn)都落在g(x)>0的范圍內(nèi)。通過(guò)執(zhí)行這樣操作,即可利用g(x)的正負(fù)號(hào)來(lái)區(qū)別。其進(jìn)一步希望找到與所示兩條邊界有最大距離的平面,稱為最佳超平面。為了使H1與H2之間的距離最大化,需利用公式(12)解決:限制條件如公式(13)所描述yi(wTxi+wo)≥1,i=1,...,n公式(13)當(dāng)數(shù)據(jù)不是線性和可分離的時(shí)候,利用核函數(shù)如(14),將數(shù)據(jù)投射到更高維度特征空間。常見的核函數(shù)包括線性、多項(xiàng)式、高斯徑向基函數(shù)核,可依照分類問(wèn)題特性選擇不同的核函數(shù)。在此部分中使用高斯徑向基函數(shù)核為核函數(shù),如公式(15)所示:K(x,y)=exp(-||x-y||/2σ2)公式(15)(4)DNN模塊134類神經(jīng)網(wǎng)絡(luò)(Neuralnetwork,NN)是一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的數(shù)學(xué)模型,使計(jì)算機(jī)能自我學(xué)習(xí)并且可利用經(jīng)驗(yàn)法則來(lái)進(jìn)行推理,所以相比于邏輯推論計(jì)算更具有優(yōu)勢(shì)。而此演算法有下述的一些特征:1.平行處理(parallelprocessing),2.容錯(cuò)技術(shù)(fault-tolerant),3.結(jié)合式記憶(combinedmemory),4.解決最佳化問(wèn)題,5.執(zhí)行超大規(guī)模集成電路(very-large-scaleintegration,VLSI)以及6.處理一般演算法較難處理的問(wèn)題。到目前為止,許多學(xué)者通過(guò)設(shè)計(jì)不同的類神經(jīng)網(wǎng)絡(luò)模型來(lái)解決不同的問(wèn)題。常見的網(wǎng)絡(luò)模型包括反向傳播網(wǎng)絡(luò)(back-propagationnetwork),霍普菲爾德網(wǎng)絡(luò)(Hopfieldnetwork)以及徑向基函數(shù)網(wǎng)絡(luò)(radialbasisfunctionnetwork)。DNN模塊134的操作通常采用輸出層來(lái)作為下一隱藏層的輸入。概念在于利用隱藏層數(shù)目的提升來(lái)增強(qiáng)系統(tǒng)。附圖3表示的深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134通常含有5個(gè)層級(jí)。輸入層與第一隱藏層的輸出之間的關(guān)系用公式(16)表述a2=f(W1x)公式(16)x代表輸入,W1代表權(quán)重,f代表激勵(lì)函數(shù)。此部份使用了sigmoid函數(shù),a2是第二層級(jí)的輸出。當(dāng)獲取第一隱藏層級(jí)的輸出之后,相對(duì)關(guān)系可以用關(guān)系式(17)所示。L代表DNN模塊134的層級(jí)數(shù)目。ai+1=f(Wiai),i=2,…,L-1公式(17)除此之外,因?yàn)閰?shù)的原始值會(huì)影響到計(jì)算結(jié)果,DNN模塊134通常使用受限玻爾茲曼機(jī)(restrictedBoltzmannmachines,RBM)來(lái)執(zhí)行原始參數(shù)的預(yù)測(cè),再使用反向傳播演算法(Back-propagation)來(lái)調(diào)整參數(shù),如公式18所示。J(aL,y)=loss(aL,y)公式(18)公式(18)中,y代表標(biāo)簽,aL代表第L層的輸出。此部分損失函數(shù)(lossfunction)應(yīng)用了softmax函數(shù)。具體的演算法可能參照參考文獻(xiàn)(Bengio,2009),Mohamedetal.,2013)。最后,頻繁的使用”退出”(dropout)可能避免過(guò)度訓(xùn)練以及獲得更佳的效率。準(zhǔn)備3評(píng)估方式評(píng)估方式用對(duì)比模塊140進(jìn)行操作。該評(píng)估方式使用在模式識(shí)別與信息檢索常會(huì)使用的精確性(precision),召回率(recall)和F-量測(cè)(F-measure)作為評(píng)估該系統(tǒng)的好或者壞的標(biāo)準(zhǔn)(Martinetal.,1997)。考慮到四種情況如表1所述,每一種解釋都在公式(19)-(21)中所示。表1項(xiàng)目評(píng)估矩陣F-量測(cè)通常也被稱為F1量測(cè),代表精確性以及召回率的權(quán)重均等。召回率通常被稱為真陽(yáng)性率(truepositiverate)或者敏感性(sensitivity),精確性被稱為陽(yáng)性預(yù)測(cè)值。在分類研究中,準(zhǔn)確度(accuracy)通常被用作評(píng)估模型,其定義如公式(22)所示。實(shí)施例1心臟音的實(shí)驗(yàn)全集以及實(shí)驗(yàn)步驟識(shí)別生理聲音的方法中的流程圖如圖1,2和4所示。步驟201是使用接收模塊110來(lái)接收生理聲音。接收音頻的地方通常集成在房室瓣的聽診器區(qū)域以及第二大動(dòng)脈瓣膜聽診器區(qū)域。接收模塊110通常是一電子聽診器,這個(gè)實(shí)驗(yàn)中所使用的數(shù)據(jù)通常是通過(guò)電子聽診器來(lái)收集實(shí)際的聲音數(shù)據(jù)。該目標(biāo)在于利用心臟音找出第一心音(S1)以及第二心音(S2)的音頻軌跡。首先,使用數(shù)字手機(jī)用于記錄心臟音,同時(shí)將記錄的心臟音轉(zhuǎn)化為模擬的信號(hào)。通過(guò)解碼芯片的解碼,模擬音頻的信號(hào)能夠被分解為兩個(gè)路徑。一路徑用于轉(zhuǎn)移過(guò)濾的聲音為數(shù)字信號(hào),并且通過(guò)耳咽管釋放數(shù)字信號(hào)。另外一條路徑主要是用于將非處理的模擬信號(hào)儲(chǔ)存于建成的記憶平臺(tái)。另外這些非處理的模擬信號(hào)用于研究中的分析。步驟202是使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121的特征提取模塊120提取生理聲音的至少一聲音片段。因?yàn)樾呐K音集中在低頻率,采樣頻率設(shè)置在5kHz。訓(xùn)練數(shù)據(jù)由17位健康男女性所錄制而成。通過(guò)人工選擇提取第一心音(S1)以及第二心音(S2)之后,我們可以獲得完整的322個(gè)第一心音(S1)以及313個(gè)第二心音(S2);而測(cè)試數(shù)據(jù)則來(lái)自3位男性以及1位女性,經(jīng)過(guò)特征提取模塊120的處理語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理之后,共切割出122個(gè)心臟音訊號(hào),其中66個(gè)是第一心音(S1),另外56個(gè)是第二心音(S2)。步驟203是使用特征提取模塊120的梅爾頻率倒頻譜系數(shù)(MFCC)模塊122將至少一聲音片段轉(zhuǎn)移到至少一個(gè)MFCC特征向量中。通過(guò)梅爾頻率倒頻譜系數(shù)(MFCC)模塊122提取的MFCC特征向量,從13個(gè)維度擴(kuò)張到39個(gè)維度。步驟204使用特征提取模塊120的K-平均算法模塊123,從至少一個(gè)MFCC特征向量找出至少一代表點(diǎn)。在心臟音的片段中,K-平均算法模塊123使用2個(gè)中央向量來(lái)代表心臟音和雜訊部分。步驟205通過(guò)分類器130用于辨識(shí)與分類所述至少一種特征到至少一種類別,其特征在于分類器130包括K-近鄰算法(KNN)模塊131,高斯混合模型(GMM)模塊132,支持向量機(jī)(SVM)模塊133或者深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134。歐幾里得尺度是K-近鄰算法(KNN)模塊131的距離計(jì)算公式。高斯徑向基函數(shù)核作為核函數(shù)。高斯混合模型(GMM)模塊132中第一心音(S1)模型以及第二心音(S2)模型各自獨(dú)立使用8個(gè)混合數(shù)字。深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134設(shè)置了3隱藏層,每層有100個(gè)神經(jīng)元。丟棄率為70%。步驟206通過(guò)比較模塊140,對(duì)比正常生理聲音或者異常生理聲音的至少一種類別以評(píng)估疾病風(fēng)險(xiǎn)。通過(guò)接收模塊110記錄正常性音或者異常性音。經(jīng)過(guò)人工選擇之后提取第一心音(S1)和第二心音(S2),第一心音(S1)和第二心音(S2)被訓(xùn)練為訓(xùn)練數(shù)據(jù)。實(shí)施例2通過(guò)不同的分類器獲取心臟音中的準(zhǔn)確結(jié)果在MFCC特征提取的訓(xùn)練數(shù)據(jù)中,第一心音(S1)和第二心音(S2)的光譜以及波形圖通過(guò)圖5中觀測(cè)以及顯示。首先,心臟音的頻率主要貢獻(xiàn)在低頻率部分,高度的區(qū)分于聲音頻率低于8kHz的頻率段,因此,采樣頻率調(diào)整為5kHz中。心臟音的基線大約為15ms,所以音框尺寸設(shè)置為15ms,并且相互重疊了10ms。經(jīng)過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121調(diào)整如公式(2)所示的α以及β的參數(shù)之后,使用VAD模塊121進(jìn)行數(shù)據(jù)訓(xùn)練,手動(dòng)剪切聲頻文件通常作為匹配測(cè)試數(shù)據(jù)的目的,該測(cè)試數(shù)據(jù)由VAD模塊121的訓(xùn)練數(shù)據(jù)進(jìn)行處理。分類器部分,使用K-近鄰算法(KNN)模塊131,高斯混合模型(GMM)模塊132,支持向量機(jī)(SVM)模塊133以及深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134。然而,使用K-近鄰算法(KNN)模塊131的想法相對(duì)來(lái)說(shuō)較為簡(jiǎn)單,僅僅使用特征作為距離的判斷標(biāo)準(zhǔn)。高斯混合模型(GMM)模塊132是發(fā)生模型。每個(gè)種類在高斯模型下分別地進(jìn)行訓(xùn)練。單獨(dú)模型中測(cè)試數(shù)據(jù)的概率也可以進(jìn)行計(jì)算。支持向量機(jī)(SVM)模塊133,使用線性或者非線性(反映)方式以分解訓(xùn)練數(shù)據(jù)并且獲取訓(xùn)練模型。將測(cè)試數(shù)據(jù)引入模型中來(lái)獲取檢測(cè)結(jié)果。最終,深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134在近年來(lái)成為最先進(jìn)的識(shí)別方法,同時(shí)也模仿了人腦的多層次學(xué)習(xí)來(lái)獲取訓(xùn)練模型,檢測(cè)結(jié)果可以通過(guò)引入測(cè)試數(shù)據(jù)之后獲得。表2.KNN實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S185%77.3%81%-S275.8%83.9%79.7%-平均值---80.3%表3.GMM實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S189.2%87.9%88.6%-S286%87.5%86.7%-平均值---87.7%表4.SVM實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S196.7%89.4%92.9%-S288.5%96.4%92.3%-平均值---92.6%表5.DNN實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S196.8%90.9%93.8%-S290%96.4%93.1%-平均值---93.4%從表2到表5以及圖6是根據(jù)使用指定的系統(tǒng)結(jié)果提取的第一心音(S1)以及第二心音(S2)的實(shí)驗(yàn)結(jié)果。根據(jù)實(shí)驗(yàn)結(jié)果,支持向量機(jī)(SVM)模塊133以及深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134所示了非常高的識(shí)別率。深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134準(zhǔn)確度達(dá)到了93.4%。第一心音(S1)在四種分類器中擁有較高的F-量測(cè)。實(shí)施例3識(shí)別正常心臟音以及異常心臟音為了評(píng)估正常以及異常心臟音之間的差異如圖7所示,記錄三對(duì)正常的第一心音(S1)以及三對(duì)正常的第二心音(S2)。使用5K的采樣頻率作為記錄因素,同時(shí)5K的采樣頻率以每個(gè)樣本0.2ms進(jìn)行。第一心音(S1)的每個(gè)樣本相對(duì)來(lái)說(shuō)是1466,6266,10109941,1588889以及20564,以及第二心音(S2)的每個(gè)樣本分別是2995,7796,11608,177421,以及22242。第一心音(S1)的第一心率是每分鐘60/[(|6266-1466|)x0.2x0.001]=62.5每分鐘心跳次數(shù)(BeatPerMinute,BPM),以及第一心音的第二心率為64.2BPM。第一心率以及第二心率之間的模塊差異是1.7(64.2BPM-62.5BPM),該值遠(yuǎn)小于第一心率3.125的5%(62.5BPMx5%)。相反的,如圖8所示,可以記錄三對(duì)異常的第一心音(S1)以及三對(duì)異常的第二心音(S2)。第一心音(S1)的每個(gè)采樣分別是1162,8269,11775,17555,第二心音(S2)分別是2661,9630,13344,and18957。第一心音(S1)的第二心率是42.8BPM,第三心率是51.9BPM。第二心率以及第三心率之間的模塊差異為9.1,比第二心率2.14的5%要更大。如圖1所示,接收模塊110,接收正常與異常心臟音,所述特征提取模塊120的語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121用于提取每對(duì)第一心音(S1)與第二心音(S2)的兩個(gè)聲音片段,并且計(jì)算每個(gè)心率和常規(guī)性。兩個(gè)心率之間的模塊差異度比前心率小于5%,心率可以判定為正常,如果所述兩個(gè)心率之間的模塊差異度大于前心率的5%,心率被判定為異常。以上方法可以用識(shí)別兩個(gè)心率循環(huán)中的正常以及異常的心率。如圖1以及2所示,結(jié)合深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134聲波分析法,以及語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121,梅爾頻率倒頻譜系數(shù)(MFCC)模塊112的方法,用于識(shí)別第一心音(S1)與第二心音(S2)。由于所述方法以及系統(tǒng)不需要借助于第一心音(S1)以及第二心音(S2)之間的時(shí)間間隔信息。所述心率失常問(wèn)題可以得到有效解決。K-平均算法模塊123用于代表心臟音以及噪音。分類法中會(huì)自動(dòng)對(duì)比精準(zhǔn)率,召回率,F(xiàn)-量測(cè)以及準(zhǔn)確率,每個(gè)實(shí)驗(yàn)中實(shí)驗(yàn)結(jié)果中第一心音(S1)以及第二心音(S2)都會(huì)展示出優(yōu)異的提取結(jié)果,第一心音(S1)所示出較高的準(zhǔn)確度。在實(shí)際的臨床使用中,第一心音(S1)以及第二心音(S2)的概念都會(huì)成對(duì)或者單獨(dú)的出現(xiàn)在語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121中所提取的心臟音中。所述第一心音(S1)的特征有更好的識(shí)別率,并且根據(jù)程序檢測(cè)來(lái)獲取第二心音(S2)。同時(shí),第三心音以及第四心音擁有相同的概念,可以通過(guò)上述的本發(fā)明實(shí)施例中得到識(shí)別。實(shí)施例4識(shí)別正常以及異常肺音如圖1以及圖4所示,處理相同的步驟來(lái)識(shí)別正常以及異常的肺音。獲取音頻的位置位于左胸區(qū)域的第六肋間區(qū)域。識(shí)別不同生理聲音的關(guān)鍵步驟是使用特征提取模塊120的語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121來(lái)檢測(cè)生理聲音的聲音片段,因?yàn)椴煌纳砺曇粲衅渥约旱穆曇羝巍H绺綀D9所示,正常肺音的能量差異通過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理成每個(gè)片段。如圖1以及10所示,呼吸喘鳴聲的能量差異通過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理成每個(gè)片段。呼吸喘鳴聲(醫(yī)學(xué)術(shù)語(yǔ)上稱為高調(diào)干羅音)是一種呼吸的過(guò)程中在呼吸道產(chǎn)生的連續(xù)、沙啞、口哨音般的聲音。氣喘發(fā)作的人群通常會(huì)有鳴音。如圖1以及11所示,濕啰肺音的能量差異通過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理成聲音片段。濕啰肺音音由小呼吸道的“迅猛打開“所引起,水腫,流出物或者呼吸時(shí)候的斷氣引起肺泡破裂。濕啰肺音在肺炎或者肺水腫中可以聽診到。雖然本發(fā)明的大量特征以及優(yōu)點(diǎn)已在先前的資料中闡述,連同本發(fā)明結(jié)構(gòu)和特征的具體方式,所述揭露僅僅用于闡述。本發(fā)明細(xì)節(jié)當(dāng)可作些許之變動(dòng),特別是識(shí)別生理聲音例如像心臟音、肺音、腸鳴音、血管回音、氣管呼吸音、支氣管呼吸音以及手足呼吸音,故本發(fā)明值保護(hù)范圍當(dāng)視后附之申請(qǐng)專利范圍所界定者為準(zhǔn)。當(dāng)前第1頁(yè)1 2 3