本發(fā)明涉及輔助睡眠技術(shù)領(lǐng)域,特別是涉及一種睡眠狀態(tài)分類器的訓(xùn)練方法和系統(tǒng)。
背景技術(shù):
在睡眠中,人體進(jìn)行了自我放松及恢復(fù)的過程,因此良好的睡眠是保持身體健康的一項(xiàng)基本條件;但是由于工作壓力大、生活作息不規(guī)律等原因,導(dǎo)致了部分人群的睡眠質(zhì)量欠佳,表現(xiàn)為失眠、半夜驚醒等。
目前市面上已經(jīng)有一些設(shè)備來(lái)幫助人們?nèi)胨?,提高睡眠質(zhì)量。例如在某一特定睡眠狀態(tài)下通過聲音、光信號(hào)等人工干預(yù),避免在熟睡狀態(tài)下叫醒用戶等。對(duì)于輔助睡眠的設(shè)備而言,為了真正達(dá)到提高用戶睡眠質(zhì)量的目的,正確的檢測(cè)用戶的睡眠狀態(tài)是非常重要的。
目前臨床上主要采用多導(dǎo)睡眠圖識(shí)別睡眠狀態(tài),主要是利用腦電信號(hào)來(lái)對(duì)睡眠進(jìn)行分析,通過訓(xùn)練睡眠狀態(tài)模型來(lái)識(shí)別被測(cè)者的睡眠狀態(tài),例如判斷用戶處于睡眠的哪個(gè)階段,但由于腦電信號(hào)的特異性較強(qiáng),并且強(qiáng)度很弱容易受到外界干擾。現(xiàn)有技術(shù)訓(xùn)練的分類器對(duì)很多用戶的檢測(cè)存在誤差,準(zhǔn)確性難以得到保證。
技術(shù)實(shí)現(xiàn)要素:
基于此,有必要針對(duì)上述問題,提供一種睡眠狀態(tài)分類器的訓(xùn)練方法和系統(tǒng),有效地提高睡眠狀態(tài)分類器識(shí)別的準(zhǔn)確性。
一種睡眠狀態(tài)分類器的訓(xùn)練方法,包括:
構(gòu)建多種睡眠狀態(tài)類型的樣本數(shù)據(jù)的特征向量以及特征向量聚集而成的簇中心,根據(jù)所述特征向量及其簇中心建立目標(biāo)函數(shù);其中,所述目標(biāo)函數(shù)表征最小化相同類型的樣本數(shù)據(jù)與字典原子的距離,且最大化不同類型的原子之間的距離;
分別從多種睡眠狀態(tài)類型的樣本數(shù)據(jù)中選擇若干個(gè)特征向量作為原子的初始值,將各個(gè)樣本數(shù)據(jù)分配至所述原子并求解所述目標(biāo)函數(shù),得到分類字典;
利用分類字典對(duì)樣本數(shù)據(jù)進(jìn)行分類,比較與樣本數(shù)據(jù)最近的原子的類型與距離,若距離小于預(yù)設(shè)的閾值,則判斷該樣本數(shù)據(jù)的類型與該原子的類型一致;
根據(jù)分類后的樣本數(shù)據(jù)訓(xùn)練出睡眠狀態(tài)分類器。
一種睡眠狀態(tài)分類器的訓(xùn)練系統(tǒng),包括:
字典構(gòu)建模塊,用于構(gòu)建多種睡眠狀態(tài)類型的樣本數(shù)據(jù)的特征向量以及特征向量聚集而成的簇中心,根據(jù)所述特征向量及其簇中心建立目標(biāo)函數(shù);其中,所述目標(biāo)函數(shù)表征最小化相同類型的樣本數(shù)據(jù)與字典原子的距離,且最大化不同類型的原子之間的距離;
字典訓(xùn)練模塊,用于分別從多種睡眠狀態(tài)類型的樣本數(shù)據(jù)中選擇若干個(gè)特征向量作為原子的初始值,將各個(gè)樣本數(shù)據(jù)分配至所述原子并求解所述目標(biāo)函數(shù),得到分類字典;
樣本分類模塊,用于利用分類字典對(duì)樣本數(shù)據(jù)進(jìn)行分類,比較與樣本數(shù)據(jù)最近的原子的類型與距離,若距離小于預(yù)設(shè)的閾值,則判斷該樣本數(shù)據(jù)的類型與該原子的類型一致;
分類器訓(xùn)練模塊,用于根據(jù)分類后的樣本數(shù)據(jù)訓(xùn)練出睡眠狀態(tài)分類器。
上述睡眠狀態(tài)分類器的訓(xùn)練方法和系統(tǒng),基于具有分類能力的聚類算法來(lái)訓(xùn)練字典,字典中原子分別對(duì)應(yīng)一種睡眠狀態(tài),以原子的個(gè)數(shù)為算法的參數(shù),訓(xùn)練時(shí)通過最小化相同類型的樣本與字典原子的距離,同時(shí)最大化不同類型的原子之間的距離的方式,以針對(duì)每種睡眠狀態(tài)訓(xùn)練出相應(yīng)的原子,然后利用對(duì)應(yīng)于不同類型的原子及距離對(duì)樣本的類型進(jìn)行判斷,從而可以準(zhǔn)確地識(shí)別樣本的類型,用于睡眠狀態(tài)分類器的自學(xué)習(xí)過程中,能夠訓(xùn)練出更加準(zhǔn)確的睡眠狀態(tài)分類器,提升睡眠狀態(tài)檢測(cè)的準(zhǔn)確性。
附圖說明
圖1為一個(gè)實(shí)施例的睡眠狀態(tài)分類器的訓(xùn)練方法的流程圖;
圖2為一個(gè)實(shí)施例的睡眠狀態(tài)分類器的訓(xùn)練系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖闡述本發(fā)明的睡眠狀態(tài)分類器的訓(xùn)練方法和系統(tǒng)的實(shí)施例。
參考圖1所示,圖1為一個(gè)實(shí)施例的睡眠狀態(tài)分類器的訓(xùn)練方法的流程圖,包括:
本發(fā)明的睡眠狀態(tài)分類器的訓(xùn)練方法,在對(duì)用戶進(jìn)行輔助睡眠時(shí),通過用戶佩戴相關(guān)傳感設(shè)備,檢測(cè)用戶的腦電信號(hào),在采集腦電信號(hào)時(shí),可以以30s為一幀進(jìn)行采集。
根據(jù)需要進(jìn)行睡眠狀態(tài)識(shí)別的任務(wù),確定特征數(shù)據(jù)類型,從腦電信號(hào)中提取與之相應(yīng)的樣本數(shù)據(jù);例如,要識(shí)別1~N種睡眠狀態(tài),提取用于進(jìn)行這N種狀態(tài)識(shí)別的樣本數(shù)據(jù)。
步驟S101,構(gòu)建多種睡眠狀態(tài)類型的樣本數(shù)據(jù)的特征向量以及特征向量聚集而成的簇中心,根據(jù)所述特征向量及其簇中心建立目標(biāo)函數(shù);其中,所述目標(biāo)函數(shù)表征最小化相同類型的樣本數(shù)據(jù)與字典原子的距離,且最大化不同類型的原子之間的距離;
本步驟中,在KMeans(K均值)和KNN(K最鄰近)算法的基礎(chǔ)上,設(shè)計(jì)具有分類能力的聚類算法來(lái)訓(xùn)練字典,字典中原子分別對(duì)應(yīng)一種睡眠狀態(tài)(如清醒狀態(tài),睡眠狀態(tài)等),原子的個(gè)數(shù)為算法的參數(shù)。
當(dāng)輸入樣本與原子的距離足夠小(相似度足夠大時(shí)),則可以認(rèn)為樣本的類型與原子的類型是一致的;建立目標(biāo)函數(shù),在訓(xùn)練時(shí)通過最小化相同類型的樣本與字典原子的距離,同時(shí)最大化不同類型的原子之間的距離的方式,以針對(duì)每種特定狀態(tài)都訓(xùn)練出相應(yīng)的原子。
如果是多分類問題,設(shè)有一共有t種類型的樣本,為特征向量,為特征向量聚集而成的簇中心,目標(biāo)函數(shù)的通用形式可以表示為如下形式:
式中,設(shè)有t種睡眠狀態(tài)類型的樣本數(shù)據(jù),為特征向量,為特征向量聚集而成的簇中心。
以清醒狀態(tài)和睡眠狀態(tài)的二類問題為例,設(shè)為清醒狀態(tài)類型(wake)的特征向量,為清醒狀態(tài)類型的特征向量聚集而成的簇中心,為睡眠狀態(tài)類型(sleep)的特征向量,為睡眠狀態(tài)類型的特征向量聚集而成的簇中心,其目標(biāo)函數(shù)可以表示為如下形式:
所述目標(biāo)函數(shù)為:
式中,為清醒類型的特征向量,為清醒類型的特征向量聚集而成的簇中心,為睡眠類型的特征向量,為睡眠類型的特征向量聚集而成的簇中心,wake表示清醒類型,sleep表示睡眠類型。
步驟S102,分別從多種睡眠狀態(tài)類型的樣本數(shù)據(jù)中選擇若干個(gè)特征向量作為原子的初始值,將各個(gè)樣本數(shù)據(jù)分配至所述原子并求解所述目標(biāo)函數(shù),得到分類字典;
本步驟中,基于所述目標(biāo)函數(shù),訓(xùn)練分類字典,在訓(xùn)練時(shí),本方案在經(jīng)典的KMeans算法的基礎(chǔ)上進(jìn)行改進(jìn),以清醒狀態(tài)和睡眠狀態(tài)的二類分類問題為例,訓(xùn)練過程可以如下:
(1)初始化時(shí),分別從清醒類型的樣本數(shù)據(jù)和睡眠類型的樣本數(shù)據(jù)中隨機(jī)設(shè)定若干個(gè)特征向量作為原子;將各個(gè)樣本數(shù)據(jù)分配給距離其最近的原子;
(2)更新原子,若歸屬于本原子的所有樣本數(shù)據(jù)與原子的類型一致(均為清醒狀態(tài)類型或者均為睡眠狀態(tài)類型),則計(jì)算屬于該原子的所有樣本數(shù)據(jù)的均值,并以此作為新的原子;
若存在與原子類型不一致的樣本數(shù)據(jù),則分別計(jì)算清醒類型的樣本數(shù)據(jù)和睡眠類型的樣本數(shù)據(jù)的均值,計(jì)算過程可以包括如下公式:
式中,c'wake為清醒類型的樣本數(shù)據(jù)的均值,c'sleep為睡眠類型的樣本數(shù)據(jù)的均值;
根據(jù)與原子類型不一致的樣本數(shù)據(jù)(陰性樣本)的數(shù)量及其位置修正原子的位置,將原子的位置更新在距離陰性樣本數(shù)據(jù)的更遠(yuǎn)的位置,計(jì)算過程可以包括如下公式:
式中,c為修正后原子的位置,g為判斷函數(shù),w為權(quán)重值;
進(jìn)一步的,所述權(quán)重值w的計(jì)算公式可以如下:
式中,wwake為清醒類型的權(quán)重值,wsleep為睡眠類型的權(quán)重值。
作為另一個(gè)實(shí)施例,所述權(quán)重值w的計(jì)算公式也可以如下:
(3)若歸屬于本原子的所有樣本數(shù)據(jù)與原子的類型均不一致,則變更該原子的類型,并計(jì)算屬于該原子所有樣本數(shù)據(jù)的均值,并將該均值作為新的原子;
(4)重復(fù)執(zhí)行步驟(2)和(3)進(jìn)行迭代,當(dāng)?shù)昂蟮脑拥牟钪敌∮谠O(shè)定范圍(足夠小),或者沒有樣本數(shù)據(jù)被分配至新的原子時(shí),存儲(chǔ)當(dāng)前的分類字典并退出訓(xùn)練。
步驟S103,利用分類字典對(duì)樣本數(shù)據(jù)進(jìn)行分類,比較與樣本數(shù)據(jù)最近的原子的類型與距離,若距離小于預(yù)設(shè)的閾值,則判斷該樣本數(shù)據(jù)的類型與該原子的類型一致;
此步驟中,利用樣本數(shù)據(jù)對(duì)分類字典進(jìn)行測(cè)試,通過比較與樣本數(shù)據(jù)最近的原子的類型與距離來(lái)判斷樣本數(shù)據(jù)的類型,若距離小于閾值,則認(rèn)為樣本數(shù)據(jù)的類型與該原子的類型一致,輸出“真”的判斷,反之則拒絕判斷。
步驟S104,根據(jù)分類后的樣本數(shù)據(jù)訓(xùn)練出睡眠狀態(tài)分類器。
在此步驟中,根據(jù)分類字典識(shí)別出清醒類型的樣本數(shù)據(jù)和睡眠類型的樣本數(shù)據(jù),利用所述清醒類型的樣本數(shù)據(jù)和睡眠類型的樣本數(shù)據(jù)訓(xùn)練出睡眠狀態(tài)分類器。
作為一個(gè)實(shí)施例,采用網(wǎng)格測(cè)試方法選擇最優(yōu)的懲罰因子C和RBF核的參數(shù)σ;調(diào)節(jié)所述懲罰因子C和參數(shù)σ,將識(shí)別率最高時(shí)對(duì)應(yīng)的參數(shù)設(shè)為最優(yōu)參數(shù);利用所述最優(yōu)參數(shù)重新訓(xùn)練分類器,并對(duì)該分類器進(jìn)行測(cè)試;將測(cè)試中識(shí)別率最優(yōu)的分類器設(shè)為睡眠狀態(tài)分類器。
具體的,對(duì)于訓(xùn)練睡眠狀態(tài)分類器時(shí),可以選用svm(支持向量機(jī))分類器,神經(jīng)網(wǎng)絡(luò)。如果采用svm分類器有兩個(gè)參數(shù):懲罰因子C和核函數(shù)的參數(shù)(例如RBF核的σ等,線性核函數(shù)除外)。而神經(jīng)網(wǎng)絡(luò)算法的參數(shù)主要是中間層(hidden-layer)的神經(jīng)元的個(gè)數(shù)。在訓(xùn)練時(shí)利用grid-test(網(wǎng)格測(cè)試)尋找最優(yōu)參數(shù),并將總體識(shí)別率最高的參數(shù)作為最優(yōu)的參數(shù)。然后利用該參數(shù)在訓(xùn)練數(shù)據(jù)中重新運(yùn)行一次,得到分類模型。在測(cè)試時(shí),睡眠狀態(tài)分類器利用該分類模型對(duì)樣本數(shù)據(jù)進(jìn)行分析,并輸出樣本數(shù)據(jù)的類型。
參考圖2所示,圖2為一個(gè)實(shí)施例的睡眠狀態(tài)分類器的訓(xùn)練系統(tǒng)結(jié)構(gòu)示意圖,包括:
字典構(gòu)建模塊101,用于構(gòu)建多種睡眠狀態(tài)類型的樣本數(shù)據(jù)的特征向量以及特征向量聚集而成的簇中心,根據(jù)所述特征向量及其簇中心建立目標(biāo)函數(shù);其中,所述目標(biāo)函數(shù)表征最小化相同類型的樣本數(shù)據(jù)與字典原子的距離,且最大化不同類型的原子之間的距離;
字典訓(xùn)練模塊102,用于分別從多種睡眠狀態(tài)類型的樣本數(shù)據(jù)中選擇若干個(gè)特征向量作為原子的初始值,將各個(gè)樣本數(shù)據(jù)分配至所述原子并求解所述目標(biāo)函數(shù),得到分類字典;
樣本分類模塊103,用于利用分類字典對(duì)樣本數(shù)據(jù)進(jìn)行分類,比較與樣本數(shù)據(jù)最近的原子的類型與距離,若距離小于預(yù)設(shè)的閾值,則判斷該樣本數(shù)據(jù)的類型與該原子的類型一致;
分類器訓(xùn)練模塊104,用于根據(jù)分類后的樣本數(shù)據(jù)訓(xùn)練出睡眠狀態(tài)分類器。
本發(fā)明的睡眠狀態(tài)分類器的訓(xùn)練系統(tǒng)與本發(fā)明的睡眠狀態(tài)分類器的訓(xùn)練方法一一對(duì)應(yīng),在上述睡眠狀態(tài)分類器的訓(xùn)練方法的實(shí)施例闡述的技術(shù)特征及其有益效果均適用于睡眠狀態(tài)分類器的訓(xùn)練系統(tǒng)的實(shí)施例中,特此聲明。
以上所述實(shí)施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡(jiǎn)潔,未對(duì)上述實(shí)施例中的各個(gè)技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說明書記載的范圍。
以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。