本發(fā)明屬于醫(yī)療器械領(lǐng)域,特別涉及一種基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的言語(yǔ)處理方法和系統(tǒng)。
背景技術(shù):對(duì)于英文語(yǔ)音識(shí)別來(lái)說(shuō),語(yǔ)音產(chǎn)生過(guò)程中的聲波的基頻信息和周期性信息的貢獻(xiàn)較弱,但對(duì)于中文的聲調(diào)識(shí)別來(lái)講,基頻信息和周期性信息尤其重要。漢語(yǔ)聲調(diào)的識(shí)別主要是通過(guò)感知頻域基頻(F0)的變化來(lái)實(shí)現(xiàn)的。其他一些聲學(xué)特性,在不同聲調(diào)下也會(huì)有所不同,這些聲學(xué)特征對(duì)聲調(diào)的識(shí)別也可能有所幫助。例如,韻母長(zhǎng)度:一般來(lái)說(shuō),第三聲的韻母長(zhǎng)度是最長(zhǎng)的,而第四聲是最短的;聲音幅度:第三聲的峰值幅度較低,而第四聲的峰值幅度是最高的;幅度包絡(luò)和F0輪廓相關(guān)性:很多聲音的幅度變化包絡(luò)與基頻的變化輪廓有一定程度的相關(guān)性。在頻域基頻(F0)存在的情況下,這些聲學(xué)特性對(duì)聲調(diào)識(shí)別影響很小。因此,基頻輪廓為說(shuō)話(huà)人的身份鑒定,韻律辨識(shí)和聲調(diào)識(shí)別提供了重要信息。在人工耳蝸系統(tǒng)中,大量的研究證明,雖然存在較大的個(gè)體差異,但植入者的音調(diào)(頻率)感知隨植入電極從蝸尖到蝸底呈從低到高排列,與正常聽(tīng)覺(jué)系統(tǒng)中音調(diào)感知的部位編碼理論相符。傳統(tǒng)編碼策略在對(duì)耳蝸進(jìn)行電刺激時(shí),電極的選擇范圍是固定的,導(dǎo)致針對(duì)較性差,并不能傳遞聲信號(hào)基頻變化的信息,功耗高。
技術(shù)實(shí)現(xiàn)要素:有鑒于此,本發(fā)明的目的在于提供一種基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的言語(yǔ)處理方法和系統(tǒng),根據(jù)輸入聲信號(hào)頻率的變化,適當(dāng)改變刺激電極的整體位置,從而達(dá)到提高漢語(yǔ)聲調(diào)識(shí)別的效果。本發(fā)明主要針對(duì)人工耳蝸,故下面的內(nèi)容皆以人工耳蝸言語(yǔ)處理為基礎(chǔ)。為達(dá)到上述目的,本發(fā)明提供了一種基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理方法,包括以下步驟:確定M個(gè)可用電極,H個(gè)活動(dòng)電極,固定電極序列中有M-H個(gè)電極;對(duì)輸入人工耳蝸言語(yǔ)處理器的聲信號(hào)進(jìn)行基頻提取,得到穩(wěn)定的參考基頻,默認(rèn)固定電極序列處于蝸底電極至蝸?lái)旊姌O之間的中間位置,此處為固定電極序列的默認(rèn)位置;檢測(cè)基頻變化,以百分?jǐn)?shù)表示;當(dāng)H為2時(shí),基頻變化高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;當(dāng)H為4時(shí),基頻變化高于參考基頻的15%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;基頻變化低于參考基頻的15%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;當(dāng)H為6時(shí),基頻變化高于參考基頻的10%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)三位;基頻變化低于參考基頻的10%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;基頻變化低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)三位;確定固定電極序列后,選取能量最大的N個(gè)通道進(jìn)行刺激。優(yōu)選地,所述進(jìn)行基頻提取,得到穩(wěn)定的參考基頻,為連續(xù)提取3幀穩(wěn)定的基頻,確定為參考基頻。優(yōu)選地,所述檢測(cè)基頻變化后,隨基頻即時(shí)做出相應(yīng)移動(dòng)。優(yōu)選地,當(dāng)H為2時(shí),刺激后200ms后,將固定電極序列切換回默認(rèn)位置。優(yōu)選地,當(dāng)H為4時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng)。優(yōu)選地,當(dāng)H為6時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng)。基于上述目的,本發(fā)明還提供了一種基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理系統(tǒng),包括:電極選取單元,用于確定M個(gè)可用電極,H個(gè)活動(dòng)電極,固定電極序列中有M-H個(gè)電極;基頻提取單元,與所述電極選取單元連接,用于對(duì)輸入人工耳蝸言語(yǔ)處理器的聲信號(hào)進(jìn)行基頻提取,得到穩(wěn)定的參考基頻,默認(rèn)固定電極序列處于蝸底電極至蝸?lái)旊姌O之間的中間位置,此處為固定電極序列的默認(rèn)位置;然后檢測(cè)基頻變化,以百分?jǐn)?shù)表示;移頻決策單元,與所述基頻提取單元連接,用于根據(jù)活動(dòng)電極個(gè)數(shù)H不同,進(jìn)行移頻處理,當(dāng)H為2,基頻變化高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;當(dāng)H為4,基頻變化高于參考基頻的15%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;基頻變化低于參考基頻的15%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;當(dāng)H為6,基頻變化高于參考基頻的10%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)三位;基頻變化低于參考基頻的10%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;基頻變化低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)三位;通道刺激單元,與所述移頻決策單元連接,用于在確定固定電極序列后,選取能量最大的N個(gè)通道進(jìn)行刺激。優(yōu)選地,所述基頻提取單元,為連續(xù)提取3幀穩(wěn)定的基頻,確定為參考基頻。優(yōu)選地,所述基頻提取單元,檢測(cè)基頻變化后,隨基頻即時(shí)做出相應(yīng)移動(dòng)。優(yōu)選地,所述移頻決策單元,當(dāng)H為2時(shí),刺激后200ms后,將固定電極序列切換回默認(rèn)位置;當(dāng)H為4時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng);當(dāng)H為6時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng)。本發(fā)明的有益效果在于:一般情況下,言語(yǔ)基頻范圍是100-350Hz,漢語(yǔ)四聲的基頻變化范圍因男女聲不同有近10dB的改變范圍。其中,女聲的四聲基頻變化范圍分別為:第一聲5.3%;第二聲40.0%;第三聲31.5%;第四聲56.6%;男聲四聲基頻變化范圍分別為:第一聲7%;第二聲39.4%;第三聲27.4%;第四聲55.5%,所以漢語(yǔ)四聲的基頻變化范圍較大,如果統(tǒng)一的使用所有的電極發(fā)出刺激,沒(méi)有針對(duì)性,對(duì)聲調(diào)識(shí)別的效果不好?,F(xiàn)有技術(shù)中對(duì)電極刺激的優(yōu)化僅僅通過(guò)提高幅度包絡(luò)與基頻的相關(guān)性,和通道自適應(yīng)動(dòng)態(tài)峰值刺激,本發(fā)明通過(guò)引入固定電極與活動(dòng)電極,只使用固定電極序列,根據(jù)聲信號(hào)頻率的變化,適當(dāng)改變固定電極序列位置,刺激不同頻率感知位置,從而提高了人工耳蝸言語(yǔ)處理器的漢語(yǔ)聲調(diào)識(shí)別率;同時(shí),由于僅使用固定電極,有效減小了功耗;在移頻決策單元后可以與連續(xù)交替取樣或峰值選取或虛擬通道策略聯(lián)合使用,具有廣泛的適應(yīng)性和實(shí)用性。附圖說(shuō)明為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進(jìn)行說(shuō)明:圖1為本發(fā)明實(shí)施例的基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理方法的步驟流程圖;圖2為本發(fā)明實(shí)施例的基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理系統(tǒng)的結(jié)構(gòu)示意圖;圖3為本發(fā)明實(shí)施例的基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理系統(tǒng)中活動(dòng)電極H=2的移頻刺激示意圖;圖4為本發(fā)明實(shí)施例的基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理系統(tǒng)中活動(dòng)電極H=4的移頻刺激示意圖;圖5為本發(fā)明實(shí)施例的基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理系統(tǒng)中活動(dòng)電極H=6的移頻刺激示意圖。具體實(shí)施方式下面將結(jié)合附圖,對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述。參見(jiàn)圖1,所示為本發(fā)明實(shí)施例的基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理方法的步驟流程圖,包括以下步驟:S101,確定M個(gè)可用電極,H個(gè)活動(dòng)電極,固定電極序列中有M-H個(gè)電極;S102,對(duì)輸入人工耳蝸言語(yǔ)處理器的聲信號(hào)進(jìn)行基頻提取,得到穩(wěn)定的參考基頻,默認(rèn)固定電極序列處于蝸底電極至蝸?lái)旊姌O之間的中間位置,此處為固定電極序列的默認(rèn)位置;S103,檢測(cè)基頻變化,以百分?jǐn)?shù)表示;S104,當(dāng)H為2時(shí),基頻變化高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;S105,當(dāng)H為4時(shí),基頻變化高于參考基頻的15%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;基頻變化低于參考基頻的15%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;S106,當(dāng)H為6時(shí),基頻變化高于參考基頻的10%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)三位;基頻變化低于參考基頻的10%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;基頻變化低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)三位;S107,確定固定電極序列后,選取能量最大的N個(gè)通道進(jìn)行刺激。進(jìn)一步地,S102中所述進(jìn)行基頻提取,得到穩(wěn)定的參考基頻,為連續(xù)提取3幀穩(wěn)定的基頻,確定為參考基頻。進(jìn)一步地,所述S103步驟后,隨基頻即時(shí)做出相應(yīng)移動(dòng)。進(jìn)一步地,當(dāng)H為2時(shí),刺激后200ms后,將固定電極序列切換回默認(rèn)位置。進(jìn)一步地,當(dāng)H為4時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng)。進(jìn)一步地,當(dāng)H為6時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng)。與上述基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理方法對(duì)應(yīng)的是,本發(fā)明又一實(shí)施例提供了基于移頻處理提高漢語(yǔ)聲調(diào)識(shí)別率的人工耳蝸言語(yǔ)處理系統(tǒng)的結(jié)構(gòu)示意圖,包括:電極選取單元101,用于確定M個(gè)可用電極,H個(gè)活動(dòng)電極,固定電極序列中有M-H個(gè)電極;基頻提取單元102,與電極選取單元101連接,用于對(duì)輸入人工耳蝸言語(yǔ)處理器的聲信號(hào)進(jìn)行基頻提取,得到穩(wěn)定的參考基頻,默認(rèn)固定電極序列處于蝸底電極至蝸?lái)旊姌O之間的中間位置,此處為固定電極序列的默認(rèn)位置;然后檢測(cè)基頻變化,以百分?jǐn)?shù)表示;移頻決策單元103,與基頻提取單元102連接,用于根據(jù)活動(dòng)電極個(gè)數(shù)H不同,進(jìn)行移頻處理,當(dāng)H為2,基頻變化高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;當(dāng)H為4,基頻變化高于參考基頻的15%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;基頻變化低于參考基頻的15%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;當(dāng)H為6,基頻變化高于參考基頻的10%時(shí),將固定電極序列向蝸底電極方向移動(dòng)一位;高于參考基頻的20%時(shí),將固定電極序列向蝸底電極方向移動(dòng)兩位;高于參考基頻的30%時(shí),將固定電極序列向蝸底電極方向移動(dòng)三位;基頻變化低于參考基頻的10%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)一位;基頻變化低于參考基頻的20%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)兩位;基頻變化低于參考基頻的30%時(shí),將固定電極序列向蝸?lái)旊姌O方向移動(dòng)三位;通道刺激單元104,與移頻決策單元103連接,用于在確定固定電極序列后,選取能量最大的N個(gè)通道進(jìn)行刺激。進(jìn)一步地,在具體應(yīng)用實(shí)例中,基頻提取單元102,為連續(xù)提取3幀穩(wěn)定的基頻,確定為參考基頻。進(jìn)一步地,在具體應(yīng)用實(shí)例中,基頻提取單元102檢測(cè)基頻變化后,隨基頻即時(shí)做出相應(yīng)移動(dòng)。進(jìn)一步地,在具體應(yīng)用實(shí)例中,移頻決策單元103,當(dāng)H為2時(shí),刺激后200ms后,將固定電極序列切換回默認(rèn)位置;當(dāng)H為4時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng);當(dāng)H為6時(shí),刺激后200ms后,將固定電極序列隨基頻即時(shí)做出相應(yīng)移動(dòng)。在切換回默認(rèn)位置和隨基頻即時(shí)做出相應(yīng)移動(dòng)的過(guò)程中,基頻提取單元102不再進(jìn)行基頻提取。本發(fā)明用于物理電極多于20個(gè)的人工耳蝸。具體實(shí)施例中24個(gè)可用電極,電極編號(hào)1-24號(hào),對(duì)應(yīng)從蝸?lái)數(shù)轿伒?,即從低頻到高頻,6個(gè)活動(dòng)電極,那么固定電極為18個(gè),固定電極序列為4-21號(hào)電極。即分為18個(gè)通道,以第4號(hào)電極代表最低頻的第一通道;以第21號(hào)電極代表最高頻的第二十四個(gè)通道。每一幀只分頻18個(gè)通道,電極號(hào)記為E1-E18。默認(rèn)模式下,第4-21號(hào)電極分別對(duì)應(yīng)E1-E18。E1-E18的選擇是連續(xù)的。E1-E18的選擇隨輸入聲信號(hào)基頻的變化而變化。極限是:E1-E18對(duì)應(yīng)第1到第18號(hào)電極或E1-E18對(duì)應(yīng)7-24號(hào)電極。一般來(lái)說(shuō),兩邊蝸?lái)?蝸底(低頻/高頻)的活動(dòng)電極個(gè)數(shù)要相等對(duì)稱(chēng)。活動(dòng)電極個(gè)數(shù)不小于2個(gè),不大于6個(gè)。固定電極個(gè)數(shù)不大于22,不小于18。具體實(shí)施例中,參見(jiàn)圖3-5,圖中上半部分兩個(gè)波形圖為基頻曲線,曲線1為基頻的大?。幌掳氩糠值膬蓚€(gè)坐標(biāo)圖表示固定電極序列,小圓圈2表示該電極被激活。參見(jiàn)圖3,若活動(dòng)電極為2個(gè),即1對(duì),記為1級(jí);當(dāng)基頻提取單元102獲得穩(wěn)定的參考基頻后,基頻變化超過(guò)的20%即開(kāi)始移頻,若高于參考基頻的20%,將固定電極序列向蝸底方向移動(dòng)。固定電極序列默認(rèn)位置為第2到第23號(hào)電極,活動(dòng)電極為第1及第24號(hào)電極。當(dāng)檢測(cè)基頻變化為原來(lái)的120%,即高于參考基頻20%時(shí),小圓圈2移位為第3到第24號(hào)電極,;當(dāng)檢測(cè)基頻變化為原來(lái)的80%時(shí),小圓圈2移位為第1到第22號(hào)電極。參見(jiàn)圖4,若為2對(duì),記為2級(jí);當(dāng)基頻提取單元102獲得穩(wěn)定的參考基頻后,基頻變化超過(guò)15%即開(kāi)始移頻,移頻方向與上述一致,高于參考基頻的15%固定電極序列向編號(hào)大的電極移動(dòng)一位,低于參考基頻的15%固定電極序列向編號(hào)小的電極移動(dòng)一位;高于參考基頻的30%固定電極序列再向編號(hào)大的電極移動(dòng)一位,與默認(rèn)位置相比移動(dòng)了兩位,低于參考基頻的30%固定電極序列向編號(hào)小的電極移動(dòng)一位,與默認(rèn)位置相比移動(dòng)了兩位。通過(guò)圖4中曲線1的大小變化與小圓圈2的位置對(duì)應(yīng),可見(jiàn)移頻效果很好。參見(jiàn)圖5,若為3對(duì),記為3級(jí);當(dāng)基頻提取單元102獲得穩(wěn)定的參考基頻后,基頻變化超過(guò)的10%即開(kāi)始移頻,移頻方向與上述一致,高于參考基頻的10%固定電極序列向編號(hào)大的電極移動(dòng)一位,低于參考基頻的10%固定電極序列向編號(hào)小的電極移動(dòng)一位;高于參考基頻的20%固定電極序列再向編號(hào)大的電極移動(dòng)一位,與默認(rèn)位置相比移動(dòng)了兩位,低于參考基頻的20%固定電極序列向編號(hào)小的電極移動(dòng)一位,與默認(rèn)位置相比移動(dòng)了兩位;高于參考基頻的30%固定電極序列再向編號(hào)大的電極移動(dòng)一位,與默認(rèn)位置相比移動(dòng)了三位,低于參考基頻的30%固定電極序列向編號(hào)小的電極移動(dòng)一位,與默認(rèn)位置相比移動(dòng)了三位。通過(guò)圖5中曲線1的大小變化與小圓圈2的位置對(duì)應(yīng),可見(jiàn)移頻效果很好。最后說(shuō)明的是,以上優(yōu)選實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制,盡管通過(guò)上述優(yōu)選實(shí)施例已經(jīng)對(duì)本發(fā)明進(jìn)行了詳細(xì)的描述,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以在形式上和細(xì)節(jié)上對(duì)其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書(shū)所限定的范圍。