識(shí)別生理聲音的方法以及系統(tǒng)與流程

文檔序號(hào)：12473182閱讀：436來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及一種用于識(shí)別生理聲音的方法，特別針對(duì)一種提取與分類生理聲音特征的方法。本發(fā)明也涉及一種用于識(shí)別生理聲音的系統(tǒng)。
背景技術(shù)：
：非侵入性聽診對(duì)心臟、肺、骨髓、小腸、血管病的分析已經(jīng)成為疾病醫(yī)療診斷的非常有用的工具。傳統(tǒng)的電子聽診器于1992年才被發(fā)明。現(xiàn)代的電子聽診器能夠提升信號(hào)的質(zhì)量以及提供心臟音信號(hào)的可視化應(yīng)用，例如心音圖(phonocardiogram，PCG)。心音圖(PCG)以及心電圖(Electrocardiography，ECG)可以應(yīng)用于心臟的基礎(chǔ)測(cè)試。通過(guò)儀器的機(jī)械振動(dòng)記錄電信號(hào)可以獲得心音圖(PCG)(聽診器放置在胸部的特定位置進(jìn)行數(shù)據(jù)收集)。在心臟的任意兩面放置兩個(gè)電極，并將兩個(gè)電極連接到心電圖機(jī)的正極與負(fù)極，形成標(biāo)準(zhǔn)心電圖并記錄身體任意兩個(gè)地方的心電的電壓變化。心電圖通常在心電圖測(cè)紙上所示或者監(jiān)控，反映整個(gè)心臟跳動(dòng)的節(jié)律以及心肌的薄弱部分。第一心音(S1)發(fā)生在心臟收縮期，由于心室收縮血液流經(jīng)大血管并引起二尖瓣和三尖瓣關(guān)閉。第一心音(S1)持續(xù)時(shí)間相對(duì)長(zhǎng)，音調(diào)低。第二心音(S2)發(fā)生在心臟舒張期，由于心室壁擴(kuò)張所引起主動(dòng)脈瓣和肺動(dòng)脈瓣迅速關(guān)閉，且房室瓣打開引起血液從心房流向心室。第二心音(S2)持續(xù)時(shí)間相比第一心音(S1)更短。臨床上，異常的第三心音以及第四心音有時(shí)候也會(huì)被發(fā)現(xiàn)。第三心音的頻率以及幅度較低，由心室壁擴(kuò)張所引起。第四心音由于心房收縮以及心室壁的舒張時(shí)血流快速充盈心室所引起。大量的心臟疾病都能夠通過(guò)聽診有效診斷。在一些嚴(yán)重的心臟疾病(例如心臟瓣膜功能失常、心臟衰竭等)，心臟聽診已經(jīng)成為早期診斷中成功、可靠、低成本的方式。然而，心臟聽診的準(zhǔn)確性同醫(yī)生的經(jīng)驗(yàn)息息相關(guān)。一些疾病展示了明顯的發(fā)生方式(例如，第一心音(S1)以及第二心音(S2)發(fā)生之間或者第二心音(S2)之后等)。因此，如何自動(dòng)提取以及初步判斷第一心音(S1)與第二心音(S2)的發(fā)生時(shí)間成為重要課題。這個(gè)課題能夠有效幫助醫(yī)生初步證實(shí)疾病的發(fā)生。常規(guī)情況下，第一心音(S1)以及第二心音(S2)的時(shí)間順序成為判斷的素材。而且心率不齊的情況下，時(shí)間順序不再可靠。如果第一心音(S1)與第二心音(S2)之間的聲紋對(duì)比較為合理，心律不齊病例的判斷需要提高質(zhì)量。關(guān)于心音的提取研究可以分為兩大類：心電信號(hào)相關(guān)性以及心電信號(hào)非相關(guān)性。心電信號(hào)的相關(guān)性研究包括心電圖基于瞬時(shí)能量的提取(Malarvilietal.,2003)以及QRS波群和T波群的提取(E1-Segaieretal.，2005)。雖然如此，在低質(zhì)量的心電信號(hào)，不大可能總是清晰的測(cè)出T波。在這種情況下，第二心音(S2)可以用非監(jiān)督分類器進(jìn)行分類(Carvalhoetal.,2005)，雖然這些方式必須視乎硬件裝置以及被測(cè)試者的舒服程度。心電信號(hào)非相關(guān)性的方法可以分為非監(jiān)督類方法以及監(jiān)督類方法。非監(jiān)督類的方式包括使用歸一化平均香農(nóng)能量(normalizedaverageShannonEnergy，Liangetal.1997)以及高頻率的方式(Kumaretal.2006)作為小波分析。監(jiān)督類的方式包括神經(jīng)網(wǎng)絡(luò)分類器(Hebdenetal.,1996)以及決策樹(Stasisetal.,1996)用于分類。除此之外，最先進(jìn)的提取方式往往根據(jù)第一心音(S1)與第二心音(S2)之間的規(guī)律間距的特征。一般來(lái)說(shuō)，平均的心跳速率(Olmezetal.,2003,Kumaretal.,2006)能夠在研究中假定。然而，這些假定并不能應(yīng)用在心律不齊患者的心臟音。在實(shí)際臨床案例中，對(duì)于心音圖以及心電圖同時(shí)同步進(jìn)行記錄與分析相對(duì)較為困難。另外，當(dāng)無(wú)脈搏性電氣活動(dòng)出現(xiàn)的時(shí)候，由于電流活動(dòng)的維持心電圖不能判定心率已經(jīng)停止。因此，如何根據(jù)獨(dú)有的心音圖(PCG)進(jìn)行診斷成為重要以及主流的研究課題。主流的檢測(cè)手段通常包括判斷第一心音(S1)以及第二心音(S2)的時(shí)間間隔特征。但是這種特征在一些情況諸如心率不齊變得不再可靠，極大地降低了檢測(cè)的準(zhǔn)確性。因此，前案中缺陷需要得到解決。技術(shù)實(shí)現(xiàn)要素：有鑒于此，有必要提供一種識(shí)別生理聲音的系統(tǒng)，包括一接收模塊，一特征提取模塊，一分類器。接收模塊用于接收生理聲音；特征提取模塊用于提取所述生理聲音中至少一特征；分類器用于分類所述至少一特征以識(shí)別至少一種種類。所述接收模塊是一生理記錄裝置將生理聲音的模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)。所述生理記錄裝置是一電聽診器。所述特征提取模塊包括語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊以及梅爾頻率倒頻譜系數(shù)(MFCC)模塊。語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊用于從生理聲音中檢測(cè)至少一聲音片段；梅爾頻率倒頻譜系數(shù)(MFCC)模塊用于轉(zhuǎn)移所述至少一聲音片段到至少一種梅爾頻率倒頻譜系數(shù)(MFCC)特征向量中。所述系統(tǒng)進(jìn)一步包括K-平均算法模塊，用于從至少一種梅爾頻率倒頻譜系數(shù)向量中找出至少一代表點(diǎn)。所述分類器包括監(jiān)督分類器。所述監(jiān)督分類器包括K-近鄰算法(KNN)模塊，高斯混合模型(GMM)模塊，支持向量機(jī)(SVM)模塊或者深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊。所述生理聲音包括心音、肺音、腸鳴音、血管回音、氣管呼吸音、支氣管呼吸音以及手足呼吸音。所述心音包括第一心音(S1)，第二心音(S2)以及兩者的混合模型。所述系統(tǒng)進(jìn)一步包括一比較模塊，用于對(duì)比正常生理聲音以及/或者異常生理聲音中至少一種類別以評(píng)估疾病風(fēng)險(xiǎn)。所述系統(tǒng)進(jìn)一步包括自動(dòng)體外心臟除顫器，動(dòng)態(tài)心電圖監(jiān)護(hù)儀，心肺復(fù)蘇器(CPR)，心臟起搏器，埋藏式心臟復(fù)律除顫器(ICD)，心電圖(EKG)或者超聲波裝置。當(dāng)系統(tǒng)在非危險(xiǎn)情況識(shí)別第一心音(S1)和第二心音(S2)時(shí)，系統(tǒng)合并成心率檢測(cè)裝置。當(dāng)系統(tǒng)在危險(xiǎn)情況識(shí)別第一心音(S1)和第二心音(S2)時(shí)，系統(tǒng)區(qū)分脈搏狀態(tài)和無(wú)脈搏，從而準(zhǔn)確決定使用哪種裝置。另外一方面，本發(fā)明提供一種使用如上所述系統(tǒng)的識(shí)別生理聲音的方法，包括：使用接收模塊，接收生理聲音；使用特征提取模塊，從生理聲音中提取至少一特征；使用分類器，分類至少一特征以識(shí)別至少一種類別。所述從生理聲音中提取至少一特征包括：使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊從生理聲音中檢測(cè)至少一聲音片段；以及使用梅爾頻率倒頻譜系數(shù)(MFCC)模塊轉(zhuǎn)移所述至少一聲音片段到至少一MFCC特征向量。所述方法進(jìn)一步包括：通過(guò)K-平均算法模塊從至少一MFCC特征向量中找出至少一代表點(diǎn)。所述分類器包括監(jiān)督分類器。所述監(jiān)督分類器包括K-近鄰算法(KNN)模塊，高斯混合模型(GMM)模塊，支持向量機(jī)(SVM)模塊或者深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊。所述生理聲音包括心音、肺音、腸鳴音、血管回音、氣管呼吸音、支氣管呼吸音以及手足呼吸音。所述心音包括第一心音(S1)，第二心音(S2)或者二者的混合模型。所述方法進(jìn)一步包括：使用比較模塊對(duì)比正常生理聲音以及/或者異常生理聲音中至少一種類別以評(píng)估疾病風(fēng)險(xiǎn)。本發(fā)明的優(yōu)點(diǎn)在于識(shí)別生理聲音的系統(tǒng)以及方法能夠準(zhǔn)確識(shí)別特征性的生理聲音，并且能夠排除雜訊。從下述的詳細(xì)實(shí)施方式搭配附圖，本發(fā)明的其他目的、優(yōu)勢(shì)和新穎特征將變得更加的顯著。附圖說(shuō)明圖1顯示了本發(fā)明中識(shí)別生理聲音的系統(tǒng)的組成模塊圖；圖2顯示了本發(fā)明的分類器包括K-近鄰算法(KNN)模塊、高斯混合模型(GMM)模塊、支持向量機(jī)(SVM)模塊以及深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊；圖3是一個(gè)深度神經(jīng)網(wǎng)絡(luò)(DNN)模型；圖4顯示了一個(gè)流程圖，描述了圖1中識(shí)別生理聲音的方法：S201到S206分別代表步驟201到步驟206；圖5是本發(fā)明中第一心音(S1)和第二心音(S2)的光譜圖(上方位置)和波形圖(下方位置)；圖6顯示了心音的精確結(jié)果，使用本發(fā)明的分類器KNN模塊、高斯混合模型(GMM)模塊、支持向量機(jī)(SVM)模塊和深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊。圖7顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的規(guī)則心音的能量差異聲音片段(實(shí)體方框部分所示)；圖8顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的不規(guī)則心音的能量差異聲音片段(實(shí)體方框部分所示)；圖9顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的正常肺音的能量差異聲音片段(實(shí)體方框部分所示)；圖10顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的哮鳴肺的能量差異聲音片段(實(shí)體方框部分所示)；圖11顯示了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊處理的濕啰肺音的能量差異聲音片段(實(shí)體方框部分所示)。具體實(shí)施方式本發(fā)明提供一種識(shí)別生理聲音的系統(tǒng)與方法。如圖1和2所示，識(shí)別生理聲音的系統(tǒng)100包括接收模塊110，特征提取模塊120，分類器130以及對(duì)比模塊140。所述特征提取模塊120包括語(yǔ)音活動(dòng)檢測(cè)(voiceactivitydetector，VAD)模塊121，梅爾頻率倒頻譜系數(shù)(Mel-FrequencyCepstrum，MFCC)模塊122，K-平均算法模塊123；分類器130包括K-近鄰算法模塊(K-nearestneighbor，KNN)模塊131，高斯混合模型(Gaussianmixturemodel，GMM)模塊132，支持向量機(jī)(supportvectormachine，SVM)模塊133或者深度神經(jīng)網(wǎng)絡(luò)(deepneuralnetwork，DNN)模塊134。準(zhǔn)備1特征提取(1)VAD模塊121VAD模塊121又稱為語(yǔ)音活動(dòng)檢測(cè)或者語(yǔ)音檢測(cè)，通常被使用于判斷一段聲音信號(hào)是否存在人聲的語(yǔ)音處理技術(shù)。語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121的主要應(yīng)用在語(yǔ)音編碼和語(yǔ)音識(shí)別。VAD模塊121也常用在分類問(wèn)題前做為預(yù)處理，以提高后期辨識(shí)的準(zhǔn)確性。這種預(yù)處理在此的目的用于找出第一心音(S1)和第二心音(S2)的位置，同時(shí)進(jìn)一步偵測(cè)此聲音片段是第一心音(S1)還是第二心音(S2)。理想狀態(tài)下，通過(guò)聽診器采集的心臟音訊號(hào)通常遠(yuǎn)大于雜訊的訊號(hào)，所以我們可以根據(jù)聲音能量的差異確定此片段是否是我們所需要的心臟音。經(jīng)過(guò)VAD模塊121處理之后的結(jié)果如圖3所示。以能量的差異作為判定心臟音的所在位置。首先，針對(duì)每段聲音信號(hào)計(jì)算該段語(yǔ)音的最大標(biāo)準(zhǔn)差，如公式(1)計(jì)算。公式(1)中m代表音框，n代表頻域，μ代表平均值。接下來(lái)計(jì)算該段聲音每個(gè)音框是否有心臟音，如公式(2)所示。fi代表第i個(gè)音框，1代表有心臟音以及0代表靜止的聲音，stdi代表第i個(gè)音框的標(biāo)準(zhǔn)差，α以及β代表參數(shù)。(2)MFCC模塊122通常來(lái)說(shuō)，人體在不同頻率域的區(qū)間下有著不同的感知敏感度。正常情況下是對(duì)于低頻率有更高的分辨率，意味著在低頻時(shí)可以分辨較小的頻率差異。此外還需要考慮臨界頻帶現(xiàn)象。在1kHz頻率下的臨界頻帶寬度約為100Hz。1kHz頻率以上的臨界頻帶寬度成指數(shù)增長(zhǎng)。因此，我們可以根據(jù)人類聽覺特征，在頻率域中以梅爾量度(Melscale)劃分頻率帶，將屬于一條頻率帶中的頻率成分合在一起看成一個(gè)能量強(qiáng)度，然后將這些頻帶強(qiáng)度以離散余弦變換(DiscreteCosineTransform，DCT)計(jì)算之后轉(zhuǎn)化為倒頻譜，此為梅爾頻率倒頻譜(MelFrequencyCepstrum，MFC)。因?yàn)槊窢栴l率倒頻譜系數(shù)MFCC是依據(jù)人耳聽覺模型所產(chǎn)生的參數(shù)，所以成功地被應(yīng)用于語(yǔ)音識(shí)別以及分類問(wèn)題中。MFCC模塊122利用下列6個(gè)連續(xù)的步驟計(jì)算MFCC：預(yù)強(qiáng)，加窗口，快速傅立葉變換(FastFourierTransform，F(xiàn)FT)，梅爾濾波器組，非線性轉(zhuǎn)換以及離散余弦變換(DiscreteCosineTransform，DCT)。一般來(lái)說(shuō)，經(jīng)過(guò)以上六個(gè)步驟之后可以獲取十三個(gè)維度的語(yǔ)音特征，包括一個(gè)對(duì)數(shù)能量參數(shù)以及十二個(gè)倒頻譜參數(shù)。但在實(shí)際運(yùn)用于音訊分析上，通常會(huì)再添加差分倒頻譜函數(shù)，以顯示倒頻譜參數(shù)如何隨著時(shí)間進(jìn)行變化。它的意義為倒頻譜參數(shù)相對(duì)于時(shí)間的斜率，也就是代表倒頻譜參數(shù)在時(shí)間上的動(dòng)態(tài)變化。因此，如果加上速度以及加速度的成分之后可以得到39維的語(yǔ)音特征，其計(jì)算方法如下所示：c[i]代表第i個(gè)維度的倒頻譜參數(shù)，t代表音框的時(shí)間指標(biāo)。(3)K-平均算法模塊123K-平均算法模塊123主要目標(biāo)用于從大量高維度的數(shù)據(jù)點(diǎn)中找出具有代表性的數(shù)據(jù)點(diǎn)。這些數(shù)據(jù)點(diǎn)稱為群中心。再根據(jù)群中心進(jìn)行數(shù)據(jù)壓縮(利用少數(shù)的數(shù)據(jù)點(diǎn)代表大量的數(shù)據(jù)以達(dá)到壓縮數(shù)據(jù)功能)以及分類(以少數(shù)的代表點(diǎn)來(lái)代表特定的類別，可以降低數(shù)據(jù)量和計(jì)算量，避免雜訊帶入的負(fù)面干擾)。演算法的計(jì)算步驟如下所示：A.初始化：將訓(xùn)練資料隨機(jī)分成K群，任意地選擇K個(gè)值作為初始的群中心yk，k＝1,2,...,KB.遞歸演算：a.將每一個(gè)數(shù)據(jù)x，對(duì)所有K個(gè)群中心計(jì)算與其之間的距離，并使其歸屬到距離最短的群中心。k*＝argkmind(x，yk)，x∈Ck公式(5)b.所有歸屬于Ck數(shù)據(jù)的x形成一個(gè)群。再重新計(jì)算其群中心yk。c.如果新的一組群中心與原先一組的群中心相同，沒(méi)有改變，則該訓(xùn)練結(jié)束。否則就以新的一組群中心替代原先的群中心?；氐絘步驟持續(xù)進(jìn)行遞迴演算。準(zhǔn)備2分類器(1)KNN模塊131K-近鄰算法(KNN)模塊131背后的本義是“物以類聚”。換句話說(shuō)，同一類的物件應(yīng)該會(huì)聚集在一起。用數(shù)學(xué)的語(yǔ)言來(lái)說(shuō)，如果同一類別的物件若以高維度空間中的點(diǎn)來(lái)表示，這些點(diǎn)之間的距離應(yīng)該會(huì)變得比較相近。因此，對(duì)于一個(gè)未知類別的一筆數(shù)據(jù)，我們只要找出來(lái)在訓(xùn)練數(shù)據(jù)中和此筆數(shù)據(jù)最相鄰的點(diǎn)，就可以判定此筆數(shù)據(jù)的類別應(yīng)該和最接近的點(diǎn)的類別是一樣的。K-近鄰算法(KNN)模塊131的分類步驟主要是將一個(gè)測(cè)量數(shù)據(jù)x分類到類別C中的其中一類。這些步驟的具體實(shí)施方式如下：A.決定要使用測(cè)量數(shù)據(jù)x，對(duì)訓(xùn)練數(shù)據(jù)中的最相鄰的數(shù)據(jù)點(diǎn)K。使用合適的距離公式計(jì)算距離。B.當(dāng)測(cè)量數(shù)據(jù)x，于某特定類別中有相對(duì)較多數(shù)的代表(在K個(gè)最近距離中于某類別中的個(gè)數(shù)占最多)，則判定x為該類別。整個(gè)分類器所預(yù)先需要的信息是：最相鄰的K數(shù)據(jù)點(diǎn)的個(gè)數(shù)，選擇計(jì)算距離的公式，以及訓(xùn)練數(shù)據(jù)。假定我們的訓(xùn)練集為成對(duì)的(xi,zi),i＝1,...,n。xi代表第i個(gè)訓(xùn)練數(shù)據(jù)的向量，而zi是對(duì)應(yīng)的分類指標(biāo)(例如zi＝j(luò)代表第i個(gè)訓(xùn)練數(shù)據(jù)向量是第j類別ωi的樣本)。將測(cè)試數(shù)據(jù)向量x與訓(xùn)練數(shù)據(jù)向量y之間的距離定義為d(x,y)。在此部分使用歐幾里得尺度(Euclideanmetric)作為距離計(jì)算公式，如公式6所示。(2)高斯混合模型(GMM)模塊132高斯分類器是一種常規(guī)的分類器，應(yīng)用貝葉斯定理(Bayes'theorem)作為基本的概念。這也是高斯分類器被稱為貝葉斯分類器(NaiveBayesclassifier)的原因。該高斯分類器的概念是利用已知的類型數(shù)據(jù)計(jì)算其概率分布，并在已知類型的概率分布中找出未知類型數(shù)據(jù)的概率，其中概率最高的類型就會(huì)被選作未知數(shù)據(jù)的類型，而平均值以及標(biāo)準(zhǔn)差作為決定整個(gè)模型的兩個(gè)參數(shù)。單一高斯分布是根據(jù)一個(gè)平均值和一個(gè)標(biāo)準(zhǔn)差描述其分布的形狀。然而，信號(hào)通常是以更加復(fù)雜的方式分布。因此，如果只使用一個(gè)高斯分布通常無(wú)法近似于該信號(hào)。而高斯混合模型是使用多個(gè)高斯分布來(lái)模擬信號(hào)。正因?yàn)槿绱?，信?hào)的分布能夠更好的得到模擬。而且，隨著混合高斯曲線的數(shù)量提升之后，分布的形狀變得更加的相似以及復(fù)雜程度變得相對(duì)提高。高斯混合模型包括3個(gè)參數(shù)：平均向量μi，共變異矩陣∑i，加權(quán)值ωi。為了簡(jiǎn)化表示高斯模型，以λ來(lái)表示，表示的公式如公式(7)所示。λ＝{ωi，μi，∑i}，i＝1，...，K公式(7)特征向量z的混合概率密度函數(shù)利用公式(8)表達(dá)其中pi(z)為特征向量z的第i個(gè)高斯分布概率密度函數(shù)。其中因?yàn)樽畲蟾怕手禐?，所以(7)式中高斯混合模型的混合概率密度函數(shù)的加權(quán)值ωi必須符合公式(10)所述的條件才會(huì)成立。當(dāng)有一筆數(shù)目為N，維度為d的特征向量z，要將此訓(xùn)練樣本訓(xùn)練成符合高斯混合模型λ時(shí)，即是希望求得適當(dāng)高斯混合模型λ的三個(gè)參數(shù)μi、∑i以及ωi(i＝1,…,K)。使得訓(xùn)練過(guò)后的模型能充分代表特征向量z的分布。也就是找出一組適當(dāng)?shù)哪Ｐ蛥?shù)，使得特征向量z以及高斯混合模型λ的相似性p(z|λ)為最大,如公式(11)所示。因?yàn)楣?8)是非線性的等式，解決過(guò)程中復(fù)雜的計(jì)算公式是難以避免的。一般來(lái)說(shuō)，可以應(yīng)用最大期望(expectation-maximization，EM)演算法找出高斯混合模型的最佳參數(shù)。(3)SVM模型133支持向量機(jī)(SVM)模塊133廣泛使用在統(tǒng)計(jì)分類以及迴歸分析。根據(jù)實(shí)驗(yàn)證實(shí)SVM模塊133有強(qiáng)大的分類能力。SVM模塊133的中心概念是將訓(xùn)練數(shù)據(jù)映射到高維特征平面，以及建立一個(gè)最佳超平面(在高維度中的平面且于大間隔中擁有邊界)。大部分的SVM模型主要應(yīng)用在二元分類的問(wèn)題上，但也可以結(jié)合多個(gè)二元分類，建構(gòu)出多重類別的分類方法。而這些情況又被分為線性數(shù)據(jù)以及非線性數(shù)據(jù)兩種情形。假定一個(gè)子集{xi，i＝1,...,n}以及子集被分配到ω1或者ω2其中一類，對(duì)應(yīng)標(biāo)記為yi＝±1，其希望能找到一個(gè)超平面g(x)(g(x)＝wTx+w0)，使所有yi＝+1的數(shù)據(jù)點(diǎn)都落在g(x)>0的范圍內(nèi)。通過(guò)執(zhí)行這樣操作，即可利用g(x)的正負(fù)號(hào)來(lái)區(qū)別。其進(jìn)一步希望找到與所示兩條邊界有最大距離的平面，稱為最佳超平面。為了使H1與H2之間的距離最大化，需利用公式(12)解決：限制條件如公式(13)所描述yi(wTxi+wo)≥1，i＝1，...，n公式(13)當(dāng)數(shù)據(jù)不是線性和可分離的時(shí)候，利用核函數(shù)如(14)，將數(shù)據(jù)投射到更高維度特征空間。常見的核函數(shù)包括線性、多項(xiàng)式、高斯徑向基函數(shù)核，可依照分類問(wèn)題特性選擇不同的核函數(shù)。在此部分中使用高斯徑向基函數(shù)核為核函數(shù)，如公式(15)所示：K(x，y)＝exp(-||x-y||/2σ2)公式(15)(4)DNN模塊134類神經(jīng)網(wǎng)絡(luò)(Neuralnetwork，NN)是一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的數(shù)學(xué)模型，使計(jì)算機(jī)能自我學(xué)習(xí)并且可利用經(jīng)驗(yàn)法則來(lái)進(jìn)行推理，所以相比于邏輯推論計(jì)算更具有優(yōu)勢(shì)。而此演算法有下述的一些特征：1.平行處理(parallelprocessing)，2.容錯(cuò)技術(shù)(fault-tolerant)，3.結(jié)合式記憶(combinedmemory)，4.解決最佳化問(wèn)題，5.執(zhí)行超大規(guī)模集成電路(very-large-scaleintegration，VLSI)以及6.處理一般演算法較難處理的問(wèn)題。到目前為止，許多學(xué)者通過(guò)設(shè)計(jì)不同的類神經(jīng)網(wǎng)絡(luò)模型來(lái)解決不同的問(wèn)題。常見的網(wǎng)絡(luò)模型包括反向傳播網(wǎng)絡(luò)(back-propagationnetwork)，霍普菲爾德網(wǎng)絡(luò)(Hopfieldnetwork)以及徑向基函數(shù)網(wǎng)絡(luò)(radialbasisfunctionnetwork)。DNN模塊134的操作通常采用輸出層來(lái)作為下一隱藏層的輸入。概念在于利用隱藏層數(shù)目的提升來(lái)增強(qiáng)系統(tǒng)。附圖3表示的深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134通常含有5個(gè)層級(jí)。輸入層與第一隱藏層的輸出之間的關(guān)系用公式(16)表述a2＝f(W1x)公式(16)x代表輸入，W1代表權(quán)重，f代表激勵(lì)函數(shù)。此部份使用了sigmoid函數(shù)，a2是第二層級(jí)的輸出。當(dāng)獲取第一隱藏層級(jí)的輸出之后，相對(duì)關(guān)系可以用關(guān)系式(17)所示。L代表DNN模塊134的層級(jí)數(shù)目。ai+1＝f(Wiai)，i＝2，…，L-1公式(17)除此之外，因?yàn)閰?shù)的原始值會(huì)影響到計(jì)算結(jié)果，DNN模塊134通常使用受限玻爾茲曼機(jī)(restrictedBoltzmannmachines，RBM)來(lái)執(zhí)行原始參數(shù)的預(yù)測(cè)，再使用反向傳播演算法(Back-propagation)來(lái)調(diào)整參數(shù)，如公式18所示。J(aL，y)＝loss(aL，y)公式(18)公式(18)中，y代表標(biāo)簽，aL代表第L層的輸出。此部分損失函數(shù)(lossfunction)應(yīng)用了softmax函數(shù)。具體的演算法可能參照參考文獻(xiàn)(Bengio,2009),Mohamedetal.,2013)。最后，頻繁的使用”退出”(dropout)可能避免過(guò)度訓(xùn)練以及獲得更佳的效率。準(zhǔn)備3評(píng)估方式評(píng)估方式用對(duì)比模塊140進(jìn)行操作。該評(píng)估方式使用在模式識(shí)別與信息檢索常會(huì)使用的精確性(precision)，召回率(recall)和F-量測(cè)(F-measure)作為評(píng)估該系統(tǒng)的好或者壞的標(biāo)準(zhǔn)(Martinetal.,1997)。考慮到四種情況如表1所述，每一種解釋都在公式(19)-(21)中所示。表1項(xiàng)目評(píng)估矩陣F-量測(cè)通常也被稱為F1量測(cè)，代表精確性以及召回率的權(quán)重均等。召回率通常被稱為真陽(yáng)性率(truepositiverate)或者敏感性(sensitivity)，精確性被稱為陽(yáng)性預(yù)測(cè)值。在分類研究中，準(zhǔn)確度(accuracy)通常被用作評(píng)估模型，其定義如公式(22)所示。實(shí)施例1心臟音的實(shí)驗(yàn)全集以及實(shí)驗(yàn)步驟識(shí)別生理聲音的方法中的流程圖如圖1,2和4所示。步驟201是使用接收模塊110來(lái)接收生理聲音。接收音頻的地方通常集成在房室瓣的聽診器區(qū)域以及第二大動(dòng)脈瓣膜聽診器區(qū)域。接收模塊110通常是一電子聽診器，這個(gè)實(shí)驗(yàn)中所使用的數(shù)據(jù)通常是通過(guò)電子聽診器來(lái)收集實(shí)際的聲音數(shù)據(jù)。該目標(biāo)在于利用心臟音找出第一心音(S1)以及第二心音(S2)的音頻軌跡。首先，使用數(shù)字手機(jī)用于記錄心臟音，同時(shí)將記錄的心臟音轉(zhuǎn)化為模擬的信號(hào)。通過(guò)解碼芯片的解碼，模擬音頻的信號(hào)能夠被分解為兩個(gè)路徑。一路徑用于轉(zhuǎn)移過(guò)濾的聲音為數(shù)字信號(hào)，并且通過(guò)耳咽管釋放數(shù)字信號(hào)。另外一條路徑主要是用于將非處理的模擬信號(hào)儲(chǔ)存于建成的記憶平臺(tái)。另外這些非處理的模擬信號(hào)用于研究中的分析。步驟202是使用語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121的特征提取模塊120提取生理聲音的至少一聲音片段。因?yàn)樾呐K音集中在低頻率，采樣頻率設(shè)置在5kHz。訓(xùn)練數(shù)據(jù)由17位健康男女性所錄制而成。通過(guò)人工選擇提取第一心音(S1)以及第二心音(S2)之后，我們可以獲得完整的322個(gè)第一心音(S1)以及313個(gè)第二心音(S2)；而測(cè)試數(shù)據(jù)則來(lái)自3位男性以及1位女性，經(jīng)過(guò)特征提取模塊120的處理語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理之后，共切割出122個(gè)心臟音訊號(hào)，其中66個(gè)是第一心音(S1)，另外56個(gè)是第二心音(S2)。步驟203是使用特征提取模塊120的梅爾頻率倒頻譜系數(shù)(MFCC)模塊122將至少一聲音片段轉(zhuǎn)移到至少一個(gè)MFCC特征向量中。通過(guò)梅爾頻率倒頻譜系數(shù)(MFCC)模塊122提取的MFCC特征向量，從13個(gè)維度擴(kuò)張到39個(gè)維度。步驟204使用特征提取模塊120的K-平均算法模塊123，從至少一個(gè)MFCC特征向量找出至少一代表點(diǎn)。在心臟音的片段中，K-平均算法模塊123使用2個(gè)中央向量來(lái)代表心臟音和雜訊部分。步驟205通過(guò)分類器130用于辨識(shí)與分類所述至少一種特征到至少一種類別，其特征在于分類器130包括K-近鄰算法(KNN)模塊131，高斯混合模型(GMM)模塊132，支持向量機(jī)(SVM)模塊133或者深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134。歐幾里得尺度是K-近鄰算法(KNN)模塊131的距離計(jì)算公式。高斯徑向基函數(shù)核作為核函數(shù)。高斯混合模型(GMM)模塊132中第一心音(S1)模型以及第二心音(S2)模型各自獨(dú)立使用8個(gè)混合數(shù)字。深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134設(shè)置了3隱藏層，每層有100個(gè)神經(jīng)元。丟棄率為70％。步驟206通過(guò)比較模塊140，對(duì)比正常生理聲音或者異常生理聲音的至少一種類別以評(píng)估疾病風(fēng)險(xiǎn)。通過(guò)接收模塊110記錄正常性音或者異常性音。經(jīng)過(guò)人工選擇之后提取第一心音(S1)和第二心音(S2)，第一心音(S1)和第二心音(S2)被訓(xùn)練為訓(xùn)練數(shù)據(jù)。實(shí)施例2通過(guò)不同的分類器獲取心臟音中的準(zhǔn)確結(jié)果在MFCC特征提取的訓(xùn)練數(shù)據(jù)中，第一心音(S1)和第二心音(S2)的光譜以及波形圖通過(guò)圖5中觀測(cè)以及顯示。首先，心臟音的頻率主要貢獻(xiàn)在低頻率部分，高度的區(qū)分于聲音頻率低于8kHz的頻率段，因此，采樣頻率調(diào)整為5kHz中。心臟音的基線大約為15ms，所以音框尺寸設(shè)置為15ms，并且相互重疊了10ms。經(jīng)過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121調(diào)整如公式(2)所示的α以及β的參數(shù)之后，使用VAD模塊121進(jìn)行數(shù)據(jù)訓(xùn)練，手動(dòng)剪切聲頻文件通常作為匹配測(cè)試數(shù)據(jù)的目的，該測(cè)試數(shù)據(jù)由VAD模塊121的訓(xùn)練數(shù)據(jù)進(jìn)行處理。分類器部分，使用K-近鄰算法(KNN)模塊131，高斯混合模型(GMM)模塊132，支持向量機(jī)(SVM)模塊133以及深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134。然而，使用K-近鄰算法(KNN)模塊131的想法相對(duì)來(lái)說(shuō)較為簡(jiǎn)單，僅僅使用特征作為距離的判斷標(biāo)準(zhǔn)。高斯混合模型(GMM)模塊132是發(fā)生模型。每個(gè)種類在高斯模型下分別地進(jìn)行訓(xùn)練。單獨(dú)模型中測(cè)試數(shù)據(jù)的概率也可以進(jìn)行計(jì)算。支持向量機(jī)(SVM)模塊133，使用線性或者非線性(反映)方式以分解訓(xùn)練數(shù)據(jù)并且獲取訓(xùn)練模型。將測(cè)試數(shù)據(jù)引入模型中來(lái)獲取檢測(cè)結(jié)果。最終，深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134在近年來(lái)成為最先進(jìn)的識(shí)別方法，同時(shí)也模仿了人腦的多層次學(xué)習(xí)來(lái)獲取訓(xùn)練模型，檢測(cè)結(jié)果可以通過(guò)引入測(cè)試數(shù)據(jù)之后獲得。表2.KNN實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S185％77.3％81％-S275.8％83.9％79.7％-平均值---80.3％表3.GMM實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S189.2％87.9％88.6％-S286％87.5％86.7％-平均值---87.7％表4.SVM實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S196.7％89.4％92.9％-S288.5％96.4％92.3％-平均值---92.6％表5.DNN實(shí)驗(yàn)結(jié)果精確性召回率F-量測(cè)準(zhǔn)確度S196.8％90.9％93.8％-S290％96.4％93.1％-平均值---93.4％從表2到表5以及圖6是根據(jù)使用指定的系統(tǒng)結(jié)果提取的第一心音(S1)以及第二心音(S2)的實(shí)驗(yàn)結(jié)果。根據(jù)實(shí)驗(yàn)結(jié)果，支持向量機(jī)(SVM)模塊133以及深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134所示了非常高的識(shí)別率。深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134準(zhǔn)確度達(dá)到了93.4％。第一心音(S1)在四種分類器中擁有較高的F-量測(cè)。實(shí)施例3識(shí)別正常心臟音以及異常心臟音為了評(píng)估正常以及異常心臟音之間的差異如圖7所示，記錄三對(duì)正常的第一心音(S1)以及三對(duì)正常的第二心音(S2)。使用5K的采樣頻率作為記錄因素，同時(shí)5K的采樣頻率以每個(gè)樣本0.2ms進(jìn)行。第一心音(S1)的每個(gè)樣本相對(duì)來(lái)說(shuō)是1466，6266，10109941，1588889以及20564，以及第二心音(S2)的每個(gè)樣本分別是2995，7796，11608，177421，以及22242。第一心音(S1)的第一心率是每分鐘60/[(|6266-1466|)x0.2x0.001]＝62.5每分鐘心跳次數(shù)(BeatPerMinute，BPM)，以及第一心音的第二心率為64.2BPM。第一心率以及第二心率之間的模塊差異是1.7(64.2BPM-62.5BPM)，該值遠(yuǎn)小于第一心率3.125的5％(62.5BPMx5％)。相反的，如圖8所示，可以記錄三對(duì)異常的第一心音(S1)以及三對(duì)異常的第二心音(S2)。第一心音(S1)的每個(gè)采樣分別是1162,8269，11775,17555，第二心音(S2)分別是2661，9630,13344,and18957。第一心音(S1)的第二心率是42.8BPM，第三心率是51.9BPM。第二心率以及第三心率之間的模塊差異為9.1，比第二心率2.14的5％要更大。如圖1所示，接收模塊110，接收正常與異常心臟音，所述特征提取模塊120的語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121用于提取每對(duì)第一心音(S1)與第二心音(S2)的兩個(gè)聲音片段，并且計(jì)算每個(gè)心率和常規(guī)性。兩個(gè)心率之間的模塊差異度比前心率小于5％，心率可以判定為正常，如果所述兩個(gè)心率之間的模塊差異度大于前心率的5％，心率被判定為異常。以上方法可以用識(shí)別兩個(gè)心率循環(huán)中的正常以及異常的心率。如圖1以及2所示，結(jié)合深度神經(jīng)網(wǎng)絡(luò)(DNN)模塊134聲波分析法，以及語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121，梅爾頻率倒頻譜系數(shù)(MFCC)模塊112的方法，用于識(shí)別第一心音(S1)與第二心音(S2)。由于所述方法以及系統(tǒng)不需要借助于第一心音(S1)以及第二心音(S2)之間的時(shí)間間隔信息。所述心率失常問(wèn)題可以得到有效解決。K-平均算法模塊123用于代表心臟音以及噪音。分類法中會(huì)自動(dòng)對(duì)比精準(zhǔn)率，召回率，F(xiàn)-量測(cè)以及準(zhǔn)確率，每個(gè)實(shí)驗(yàn)中實(shí)驗(yàn)結(jié)果中第一心音(S1)以及第二心音(S2)都會(huì)展示出優(yōu)異的提取結(jié)果，第一心音(S1)所示出較高的準(zhǔn)確度。在實(shí)際的臨床使用中，第一心音(S1)以及第二心音(S2)的概念都會(huì)成對(duì)或者單獨(dú)的出現(xiàn)在語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121中所提取的心臟音中。所述第一心音(S1)的特征有更好的識(shí)別率，并且根據(jù)程序檢測(cè)來(lái)獲取第二心音(S2)。同時(shí)，第三心音以及第四心音擁有相同的概念，可以通過(guò)上述的本發(fā)明實(shí)施例中得到識(shí)別。實(shí)施例4識(shí)別正常以及異常肺音如圖1以及圖4所示，處理相同的步驟來(lái)識(shí)別正常以及異常的肺音。獲取音頻的位置位于左胸區(qū)域的第六肋間區(qū)域。識(shí)別不同生理聲音的關(guān)鍵步驟是使用特征提取模塊120的語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121來(lái)檢測(cè)生理聲音的聲音片段，因?yàn)椴煌纳砺曇粲衅渥约旱穆曇羝巍Ｈ绺綀D9所示，正常肺音的能量差異通過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理成每個(gè)片段。如圖1以及10所示，呼吸喘鳴聲的能量差異通過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理成每個(gè)片段。呼吸喘鳴聲(醫(yī)學(xué)術(shù)語(yǔ)上稱為高調(diào)干羅音)是一種呼吸的過(guò)程中在呼吸道產(chǎn)生的連續(xù)、沙啞、口哨音般的聲音。氣喘發(fā)作的人群通常會(huì)有鳴音。如圖1以及11所示，濕啰肺音的能量差異通過(guò)語(yǔ)音活動(dòng)檢測(cè)(VAD)模塊121處理成聲音片段。濕啰肺音音由小呼吸道的“迅猛打開“所引起，水腫，流出物或者呼吸時(shí)候的斷氣引起肺泡破裂。濕啰肺音在肺炎或者肺水腫中可以聽診到。雖然本發(fā)明的大量特征以及優(yōu)點(diǎn)已在先前的資料中闡述，連同本發(fā)明結(jié)構(gòu)和特征的具體方式，所述揭露僅僅用于闡述。本發(fā)明細(xì)節(jié)當(dāng)可作些許之變動(dòng)，特別是識(shí)別生理聲音例如像心臟音、肺音、腸鳴音、血管回音、氣管呼吸音、支氣管呼吸音以及手足呼吸音，故本發(fā)明值保護(hù)范圍當(dāng)視后附之申請(qǐng)專利范圍所界定者為準(zhǔn)。當(dāng)前第1頁(yè)1 2 3

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：蔡昆熹;曹昱;古士軒;梁慈真;張?jiān)品?楊仕屹;
技術(shù)所有人：創(chuàng)心醫(yī)電股份有限公司;
我是此專利的發(fā)明人

上一篇：一種基于單片機(jī)的智能火災(zāi)報(bào)警裝置的制作方法
上一篇：消防用報(bào)警裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

聲音識(shí)別系統(tǒng)相關(guān)技術(shù)

電生理導(dǎo)航系統(tǒng)相關(guān)技術(shù)

皮膚生理指標(biāo)系統(tǒng)分析相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

識(shí)別生理聲音的方法以及系統(tǒng)與流程