本發(fā)明涉及生物識(shí)別技術(shù)領(lǐng)域,尤其涉及一種基于多人說(shuō)話的聲紋識(shí)別方法。
背景技術(shù):
聲紋識(shí)別和指紋,虹膜,人臉識(shí)別等一樣,屬于生物識(shí)別的一種,被認(rèn)為是最自然的生物特征識(shí)別身份鑒定方式。依靠聲紋識(shí)別可以很方便地對(duì)說(shuō)話人的身份進(jìn)行驗(yàn)證,并且這種驗(yàn)證方式的私密性非常高,因?yàn)槁暭y通常無(wú)法被惡意復(fù)制和盜取,因此聲紋識(shí)別在各種領(lǐng)域尤其是智能設(shè)備領(lǐng)域具有突出的應(yīng)用優(yōu)勢(shì)。
聲紋識(shí)別的基本過(guò)程為語(yǔ)音采集,特征提取,分類模型。常見(jiàn)的語(yǔ)音特征提取方法是利用語(yǔ)音的短時(shí)平穩(wěn)特性,采用美倒譜變換方法將語(yǔ)音轉(zhuǎn)換為識(shí)別特征集,之后經(jīng)過(guò)學(xué)習(xí)過(guò)程對(duì)說(shuō)話人語(yǔ)音進(jìn)行建模得到說(shuō)話人的分類模型,隨后通過(guò)各類識(shí)別模型獲得聲紋識(shí)別的結(jié)果。但是上述過(guò)程存在以下幾個(gè)問(wèn)題:(1)上述聲紋識(shí)別的模型需要學(xué)習(xí)更多的樣本才能應(yīng)用;(2)依據(jù)上述識(shí)別模型進(jìn)行的聲紋識(shí)別的計(jì)算的復(fù)雜度較高;(3)依據(jù)上述的識(shí)別模型計(jì)算得到的模型數(shù)據(jù)量較大;(4)當(dāng)多個(gè)說(shuō)話人同時(shí)說(shuō)話時(shí),無(wú)法辨別出需要識(shí)別的說(shuō)話人的語(yǔ)音。綜上所述,對(duì)于資源有限的智能系統(tǒng)而言,上述既存的問(wèn)題限制了現(xiàn)有技術(shù)中的聲紋識(shí)別算法的應(yīng)用。
技術(shù)實(shí)現(xiàn)要素:
根據(jù)現(xiàn)有技術(shù)中存在的上述問(wèn)題,現(xiàn)提供一種基于多人說(shuō)話的聲紋識(shí)別方法的技術(shù)方案,具體包括:
一種基于多人說(shuō)話的聲紋識(shí)別方法,其中:預(yù)設(shè)一第一頻段以及一第二頻段,所述第一頻段高于所述第二頻段,包括下述步驟:
步驟s1,接收多個(gè)說(shuō)話人的聲源;
步驟s2,對(duì)所述聲源進(jìn)行分解,以分別獲取每個(gè)人的語(yǔ)音;
步驟s3,將每個(gè)人的所述語(yǔ)音均與所述第一頻段進(jìn)行匹配,以獲取相應(yīng)的匹配關(guān)聯(lián)度,或者
將每個(gè)人的所述語(yǔ)音均與所述第二頻段進(jìn)行匹配,以獲取相應(yīng)的匹配關(guān)聯(lián)度;
步驟s4,提取最大的所述匹配關(guān)聯(lián)度對(duì)應(yīng)的所述語(yǔ)音,將所述語(yǔ)音與所述第一頻段或者所述第二頻段進(jìn)行擬合;
步驟s5,將分別處于所述第一頻段或者所述第二頻段下的不同背景、不同人聲的語(yǔ)音分割為特定長(zhǎng)度的識(shí)別區(qū)段;
步驟s6,對(duì)每個(gè)所述識(shí)別區(qū)段做特征變換后得到相應(yīng)的多個(gè)識(shí)別特征,并采用關(guān)聯(lián)于所有所述識(shí)別區(qū)段的所有所述識(shí)別特征分別構(gòu)成對(duì)應(yīng)所述第一頻段的識(shí)別特征空間,或者對(duì)應(yīng)所述第二頻段的所述識(shí)別特征空間;
步驟s7,將所述識(shí)別特征空間劃分成復(fù)數(shù)個(gè)子空間,并以描述信息每個(gè)被劃分的所述子空間,以及分別對(duì)每個(gè)所述子空間賦予一對(duì)應(yīng)的序號(hào);
步驟s8,分別將處于所述第一頻段或者處于所述第二頻段的關(guān)聯(lián)于訓(xùn)練模型的每條訓(xùn)練語(yǔ)句做特征變換后得到包括相應(yīng)的時(shí)序特征點(diǎn)的時(shí)序特征點(diǎn)集,每個(gè)所述時(shí)序特征點(diǎn)分別被分配入同頻段下的各個(gè)所述子空間,根據(jù)每個(gè)所述時(shí)序特征點(diǎn)對(duì)應(yīng)的所述子空間的序號(hào)分別形成關(guān)聯(lián)于所述第一頻段或者所述第二頻段的第一序列,并進(jìn)而形成對(duì)應(yīng)的訓(xùn)練識(shí)別特征;
步驟s9,分別將處于所述第一頻段或者處于所述第二頻段的關(guān)聯(lián)于測(cè)試模型的每條測(cè)試語(yǔ)句做特征變換后得到所述時(shí)序特征點(diǎn)集,每個(gè)所述時(shí)序特征點(diǎn)分別被分配入各個(gè)所述子空間,根據(jù)每個(gè)所述時(shí)序特征點(diǎn)對(duì)應(yīng)的所述子空間的序號(hào)分別形成關(guān)聯(lián)于所述第一頻段或者所述第二頻段的第二序列,并進(jìn)而形成對(duì)應(yīng)的測(cè)試識(shí)別特征;
步驟s10,對(duì)比關(guān)聯(lián)于所述第一頻段的所述訓(xùn)練識(shí)別特征與所述測(cè)試識(shí)別特征是否相似,并根據(jù)對(duì)比結(jié)果處理得到基于多人說(shuō)話的聲紋識(shí)別的確認(rèn)結(jié)果,或者
對(duì)于關(guān)聯(lián)于所述第二頻段的所述訓(xùn)練識(shí)別特征與所述測(cè)試識(shí)別特征是否相似,并根據(jù)對(duì)比結(jié)果處理得到基于多人說(shuō)話的聲紋識(shí)別的確認(rèn)結(jié)果。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中,所述步驟s8中,每個(gè) 所述時(shí)序特征點(diǎn)按照最近鄰原則被分配入各個(gè)所述子空間內(nèi)。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中,所述步驟s8中,將被分配入所述時(shí)序特征點(diǎn)的各個(gè)所述子空間按照所述序號(hào)組成一空間序列,并將所述空間序列作為所述第一序列,以形成所述訓(xùn)練識(shí)別特征。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中,所述步驟s9中,將被分配入所述時(shí)序特征點(diǎn)的各個(gè)所述子空間按照所述序號(hào)組成一空間序列,并將所述控件序列作為所述第二序列,以形成所述測(cè)試識(shí)別特征。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中,所述步驟s8中,所述空間序列中包括關(guān)聯(lián)于每個(gè)所述子空間的數(shù)據(jù)組,一個(gè)所述數(shù)據(jù)組對(duì)應(yīng)一個(gè)所述序號(hào);
在形成所述空間序列后,還包括分別對(duì)處于所述第一頻段或者所述第二頻段的所述空間序列進(jìn)行的第一數(shù)據(jù)壓縮的過(guò)程,具體為:
步驟s81,記錄每個(gè)所述數(shù)據(jù)組的所述序號(hào),并記錄關(guān)聯(lián)于每個(gè)所述序號(hào)的重復(fù)序號(hào)數(shù)量;
步驟s82,判斷是否存在所述序號(hào)的所述重復(fù)序號(hào)數(shù)量為1,并在存在所述重復(fù)序號(hào)數(shù)量為1的所述數(shù)據(jù)組時(shí)轉(zhuǎn)向步驟s83;
步驟s83,刪除所述重復(fù)序號(hào)數(shù)量為1的所述序號(hào)對(duì)應(yīng)的所述數(shù)據(jù)組;
步驟s84,判斷被刪除的所述數(shù)據(jù)組的前一個(gè)數(shù)據(jù)組的所述序號(hào)是否與被刪除的所述數(shù)據(jù)組的后一個(gè)數(shù)據(jù)組的所述序號(hào)相同:
若相同,則將所述前一個(gè)數(shù)據(jù)組和所述后一個(gè)數(shù)據(jù)組合并;
若不相同,則保留所述前一個(gè)數(shù)據(jù)組和所述后一個(gè)數(shù)據(jù)組;
對(duì)所述空間序列中的所有所述數(shù)據(jù)組均執(zhí)行所述第一數(shù)據(jù)壓縮后形成所述第一序列。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中,所述步驟s9中,所述空間序列中包括關(guān)聯(lián)于每個(gè)所述子空間的數(shù)據(jù)組,一個(gè)所述數(shù)據(jù)組對(duì)應(yīng)一個(gè)所述序號(hào);
在形成所述空間序列后,還包括分別對(duì)處于所述第一頻段或者所述第二頻段的所述空間序列進(jìn)行的第二數(shù)據(jù)壓縮的過(guò)程,具體為:
步驟s91,記錄每個(gè)所述數(shù)據(jù)組的所述序號(hào),并記錄關(guān)聯(lián)于每個(gè)所述序號(hào)的重復(fù)序號(hào)數(shù)量;
步驟s92,判斷是否存在所述序號(hào)的所述重復(fù)序號(hào)數(shù)量為1,并在存在所述重復(fù)序號(hào)數(shù)量為1的所述數(shù)據(jù)組時(shí)轉(zhuǎn)向步驟s93;
步驟s93,刪除所述重復(fù)序號(hào)數(shù)量為1的所述序號(hào)對(duì)應(yīng)的所述數(shù)據(jù)組;
步驟s94,判斷被刪除的所述數(shù)據(jù)組的前一個(gè)數(shù)據(jù)組的所述序號(hào)是否與被刪除的所述數(shù)據(jù)組的后一個(gè)數(shù)據(jù)組的所述序號(hào)相同:
若相同,則將所述前一個(gè)數(shù)據(jù)組和所述后一個(gè)數(shù)據(jù)組合并;
若不相同,則保留所述前一個(gè)數(shù)據(jù)組和所述后一個(gè)數(shù)據(jù)組;
對(duì)所述空間序列中的所有所述數(shù)據(jù)組均執(zhí)行所述第二數(shù)據(jù)壓縮后形成所述第二序列。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中:所述特征變換為美倒譜變換。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中:于執(zhí)行所述美倒譜變換的過(guò)程中,分別將每條所述語(yǔ)句分割為20ms一幀,并將10ms的幀移取出關(guān)聯(lián)于所述語(yǔ)句的語(yǔ)句幀;
隨后,以幀為單位去掉靜音,對(duì)所述語(yǔ)句幀作美倒譜變換后每幀留12個(gè)系數(shù),并以12個(gè)所述系數(shù)構(gòu)成所述識(shí)別特征。
優(yōu)選的,該基于多人說(shuō)話的聲紋識(shí)別方法,其中:所述步驟s7中,采用“k-均值”算法將識(shí)別特征空間劃分成數(shù)個(gè)子空間,劃分后的每個(gè)所述子空間分別以“k-均值”的中心點(diǎn)記錄為對(duì)應(yīng)所述子空間的所述描述信息。
上述技術(shù)方案的有益效果是:提供一種基于多人說(shuō)話的聲紋識(shí)別方法,可在多人同時(shí)說(shuō)話時(shí),可對(duì)聲源進(jìn)行分解,獲取每個(gè)說(shuō)話人的語(yǔ)音,將每個(gè)人的語(yǔ)音與預(yù)設(shè)的頻段進(jìn)行匹配,根據(jù)匹配相似度識(shí)別出需要識(shí)別的說(shuō)話人的語(yǔ)音,在對(duì)該語(yǔ)音進(jìn)行聲紋識(shí)別,計(jì)算量較小,能夠節(jié)省存儲(chǔ)和計(jì)算資源,識(shí)別的準(zhǔn)確率高,并且克服了基于概率統(tǒng)計(jì)的建模方法存在的問(wèn)題,適合于系統(tǒng)資源有限的智能系統(tǒng)使用。同時(shí)預(yù)先設(shè)置了表示兒童的說(shuō)話人的第一頻率以及表示成年的說(shuō)話人的第二頻率并分別進(jìn)行比較,進(jìn)一步提升了基于多人說(shuō)話的聲紋識(shí)別的準(zhǔn)確度。
附圖說(shuō)明
圖1是本發(fā)明的較佳的實(shí)施例中,一種基于多人說(shuō)話的聲紋識(shí)別方法的 總體流程圖;
圖2是本發(fā)明的較佳的實(shí)施例中,第一數(shù)據(jù)壓縮的流程示意圖;
圖3是本發(fā)明的較佳的實(shí)施例中,第二數(shù)據(jù)壓縮的流程示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
需要說(shuō)明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可以相互組合。
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,但不作為本發(fā)明的限定。
本發(fā)明的較佳的實(shí)施例中,基于現(xiàn)有技術(shù)中存在的上述問(wèn)題,現(xiàn)提供一種基于多人說(shuō)話的聲紋識(shí)別方法。該基于多人說(shuō)話的聲紋識(shí)別方法可以適用于具有語(yǔ)音控制功能的智能設(shè)備中,例如應(yīng)用于私人空間中的智能機(jī)器人等。
在上述基于多人說(shuō)話的聲紋識(shí)別方法中,首先預(yù)設(shè)一第一頻段以及一第二頻段,所述第一頻段高于所述第二頻段。具體地,對(duì)于不同的使用者而言,其語(yǔ)音的頻率可能不同,對(duì)頻率粗略進(jìn)行劃分可以分為對(duì)應(yīng)成年的說(shuō)話人的較低的頻段,以及對(duì)應(yīng)兒童的說(shuō)話人的較高的頻段。
更進(jìn)一步地,對(duì)于成年的說(shuō)話人和兒童的說(shuō)話人而言,其基于多人說(shuō)話的聲紋識(shí)別可能并不相同,具體在于其聲紋特征的提取以及相應(yīng)的聲紋模型的構(gòu)建可能會(huì)有區(qū)別。因此在本發(fā)明技術(shù)方案中,設(shè)置兩個(gè)語(yǔ)音接收的頻段,并根據(jù)這兩個(gè)頻段將成年人的語(yǔ)音和兒童的語(yǔ)音區(qū)分識(shí)別,從而進(jìn)一步提升識(shí)別精度。換言之,上文中的第一頻段可以用于表示兒童的說(shuō)話人的語(yǔ)音頻段,第二頻段可以用于表示成年的說(shuō)話人的語(yǔ)音頻段。因此,本發(fā)明的較佳的實(shí)施例中,上述兩個(gè)頻段可以根據(jù)實(shí)驗(yàn)數(shù)據(jù)的不斷累加進(jìn)行相應(yīng)修改,從而達(dá)到一個(gè)能夠較準(zhǔn)確地分別代表成年說(shuō)話人和兒童說(shuō)話人的語(yǔ)音頻段的目的。
則本發(fā)明的較佳的實(shí)施例中,如圖1所示,上述基于多人說(shuō)話的聲紋識(shí)別方法具體包括下述步驟:
步驟s1,接收多個(gè)說(shuō)話人的聲源;
步驟s2,對(duì)聲源進(jìn)行分解,以分別獲取每個(gè)人的語(yǔ)音;
步驟s3,將每個(gè)人的語(yǔ)音均與第一頻段進(jìn)行匹配,以獲取相應(yīng)的匹配關(guān)聯(lián)度,或者
將每個(gè)人的語(yǔ)音均與第二頻段進(jìn)行匹配,以獲取相應(yīng)的匹配關(guān)聯(lián)度;
步驟s4,提取最大的匹配關(guān)聯(lián)度對(duì)應(yīng)的語(yǔ)音,將語(yǔ)音與第一頻段或者第二頻段進(jìn)行擬合;
步驟s5,將分別處于第一頻段或者第二頻段下的不同背景、不同人聲的語(yǔ)音分割為特定長(zhǎng)度的識(shí)別區(qū)段;
步驟s6,對(duì)每個(gè)識(shí)別區(qū)段做特征變換后得到相應(yīng)的多個(gè)識(shí)別特征,并采用關(guān)聯(lián)于所有識(shí)別區(qū)段的所有識(shí)別特征分別構(gòu)成對(duì)應(yīng)第一頻段的識(shí)別特征空間,或者對(duì)應(yīng)第二頻段的識(shí)別特征空間;
步驟s7,將識(shí)別特征空間劃分成復(fù)數(shù)個(gè)子空間,并以描述信息每個(gè)被劃分的子空間,以及分別對(duì)每個(gè)子空間賦予一對(duì)應(yīng)的序號(hào);
步驟s8,分別將處于第一頻段或者處于第二頻段的關(guān)聯(lián)于訓(xùn)練模型的每條訓(xùn)練語(yǔ)句做特征變換后得到包括相應(yīng)的時(shí)序特征點(diǎn)的時(shí)序特征點(diǎn)集,每個(gè)時(shí)序特征點(diǎn)分別被分配入同頻段下的各個(gè)子空間,根據(jù)每個(gè)時(shí)序特征點(diǎn)對(duì)應(yīng)的子空間的序號(hào)分別形成關(guān)聯(lián)于第一頻段或者第二頻段的第一序列,并進(jìn)而形成對(duì)應(yīng)的訓(xùn)練識(shí)別特征;
步驟s9,分別將處于第一頻段或者處于第二頻段的關(guān)聯(lián)于測(cè)試模型的每條測(cè)試語(yǔ)句做特征變換后得到時(shí)序特征點(diǎn)集,每個(gè)時(shí)序特征點(diǎn)分別被分配入各個(gè)子空間,根據(jù)每個(gè)時(shí)序特征點(diǎn)對(duì)應(yīng)的子空間的序號(hào)分別形成關(guān)聯(lián)于第一頻段或者第二頻段的第二序列,并進(jìn)而形成對(duì)應(yīng)的測(cè)試識(shí)別特征;
步驟s10,對(duì)比關(guān)聯(lián)于第一頻段的訓(xùn)練識(shí)別特征與測(cè)試識(shí)別特征是否相似,并根據(jù)對(duì)比結(jié)果處理得到聲紋識(shí)別的確認(rèn)結(jié)果,或者
對(duì)于關(guān)聯(lián)于第二頻段的訓(xùn)練識(shí)別特征與測(cè)試識(shí)別特征是否相似,并根據(jù)對(duì)比結(jié)果處理得到聲紋識(shí)別的確認(rèn)結(jié)果。
在本實(shí)施例中,基于多人說(shuō)話的聲紋識(shí)別方法可在多人同時(shí)說(shuō)話時(shí),可 對(duì)聲源進(jìn)行分解,獲取每個(gè)說(shuō)話人的語(yǔ)音,將每個(gè)人的語(yǔ)音與預(yù)設(shè)的頻段進(jìn)行匹配,根據(jù)匹配相似度識(shí)別出需要識(shí)別的說(shuō)話人的語(yǔ)音,在對(duì)該語(yǔ)音進(jìn)行聲紋識(shí)別,計(jì)算量較小,能夠節(jié)省存儲(chǔ)和計(jì)算資源,識(shí)別的準(zhǔn)確率高,并且克服了基于概率統(tǒng)計(jì)的建模方法存在的問(wèn)題,適合于系統(tǒng)資源有限的智能系統(tǒng)使用。同時(shí)預(yù)先設(shè)置了表示兒童的說(shuō)話人的第一頻率以及表示成年的說(shuō)話人的第二頻率并分別進(jìn)行比較,進(jìn)一步提升了聲紋識(shí)別的準(zhǔn)確度。
本發(fā)明的較佳的實(shí)施例中,在上述預(yù)先設(shè)置的基礎(chǔ)上,上述步驟s5-s6中,首先獲取分別處于第一頻段或者第二頻段下的基于不同背景、不同人聲的語(yǔ)音,并將這些語(yǔ)音分割為特定長(zhǎng)度的識(shí)別區(qū)段。具體地,可以將不同背景、不同人聲的語(yǔ)音對(duì)應(yīng)的每條語(yǔ)句分割為以20ms為一幀的多個(gè)語(yǔ)句幀,并將10ms的語(yǔ)句幀移取,然后以每幀為單位去掉靜音,對(duì)語(yǔ)音幀作美倒譜變換,每幀留12個(gè)系數(shù),該12個(gè)系數(shù)即構(gòu)成識(shí)別特征。所有語(yǔ)音段的識(shí)別特征構(gòu)成識(shí)別特征集,也就是構(gòu)成相應(yīng)的識(shí)別特征空間。
本發(fā)明的較佳的實(shí)施例中,在上述步驟s7中,采用“k-均值”算法將識(shí)別特征空間劃分為復(fù)數(shù)個(gè)子空間,劃分后的數(shù)個(gè)子空間分別以“k-均值”的中心點(diǎn)記錄為該子空間的數(shù)據(jù)描述,并對(duì)各個(gè)子空間進(jìn)行編號(hào),記錄每個(gè)子空間的描述信息和其對(duì)應(yīng)的序號(hào)。上述步驟同樣對(duì)處于第一頻段或者第二頻段下的識(shí)別特征空間分別執(zhí)行。
本發(fā)明的較佳的實(shí)施例中,分別對(duì)處于第一頻段或者第二頻段下的子空間進(jìn)行如上述步驟s8的操作:將關(guān)聯(lián)于訓(xùn)練模型的每條訓(xùn)練語(yǔ)句做特征變換后得到包括相應(yīng)的時(shí)序特征點(diǎn)的時(shí)序特征點(diǎn)集,每個(gè)時(shí)序特征點(diǎn)分別被分配入同頻段下的各個(gè)子空間,根據(jù)每個(gè)時(shí)序特征點(diǎn)對(duì)應(yīng)的子空間的序號(hào)分別形成關(guān)聯(lián)于第一頻段或者第二頻段的第一序列,并進(jìn)而形成對(duì)應(yīng)的訓(xùn)練識(shí)別特征。
具體地,本發(fā)明的較佳的實(shí)施例中,所謂訓(xùn)練語(yǔ)句,可以為經(jīng)過(guò)反復(fù)訓(xùn)練后預(yù)設(shè)于系統(tǒng)內(nèi)部供系統(tǒng)比對(duì)時(shí)進(jìn)行參照的訓(xùn)練模型的組成部分。
具體地,本發(fā)明的較佳的實(shí)施例中,上述步驟s8中,將每個(gè)時(shí)序特征點(diǎn)按照最近鄰原則分別分配入處于同一頻段下(第一頻段或者第二頻段)的各個(gè)子空間中,并且記錄每個(gè)時(shí)序特征點(diǎn)對(duì)應(yīng)的子空間的序號(hào),最終形成一個(gè)第一序列,該第一序列由不同的子空間的序號(hào)組成,例如(2、2、4、8、8、 8、5、5、5、5、5),進(jìn)而根據(jù)該第一序列形成對(duì)應(yīng)的訓(xùn)練識(shí)別特征。
本發(fā)明的較佳的實(shí)施例中,類似地,上述步驟s9中,分別對(duì)處于上述第一頻段或者第二頻段下的子空間進(jìn)行如下操作:對(duì)關(guān)聯(lián)于測(cè)試模型的測(cè)試語(yǔ)句做特征變換后得到時(shí)序特征點(diǎn)集,每個(gè)時(shí)序特征點(diǎn)分別被分配入各個(gè)子空間,根據(jù)每個(gè)時(shí)序特征點(diǎn)對(duì)應(yīng)的子空間的序號(hào)分別形成關(guān)聯(lián)于第一頻段或者第二頻段的第二序列,并進(jìn)而形成對(duì)應(yīng)的測(cè)試識(shí)別特征。
本發(fā)明的較佳的實(shí)施例中,所謂測(cè)試語(yǔ)句,其關(guān)聯(lián)于測(cè)試模型,也就是需要比對(duì)的語(yǔ)句。
具體地,本發(fā)明的較佳的實(shí)施例中,上述步驟s9中,同樣將上述測(cè)試語(yǔ)句中的每個(gè)時(shí)序特征點(diǎn)按照最近鄰原則分別分配入處于同一頻段下(第一頻段或者第二頻段)的各個(gè)子空間中,并且記錄每個(gè)時(shí)序特征點(diǎn)對(duì)應(yīng)的子空間的序號(hào),最終形成一個(gè)第二序列,該第二序列同樣由不同的子空間的序號(hào)組成,例如(2、3、3、5、5、8、6、6、6、4、4),進(jìn)而根據(jù)該第二序列形成對(duì)應(yīng)的測(cè)試識(shí)別特征。本發(fā)明的較佳的實(shí)施例中,上述步驟s8和步驟s9之間并不存在相互依附的關(guān)系(即步驟s9的執(zhí)行不必須以步驟s8執(zhí)行完畢為前提),因此上述步驟s8和步驟s9可以同時(shí)進(jìn)行。圖1中仍然示出步驟s8和步驟s9順序進(jìn)行的實(shí)施例。
本發(fā)明的較佳的實(shí)施例中,上述步驟s10中,將上述形成的訓(xùn)練識(shí)別特征和測(cè)試識(shí)別特征進(jìn)行比對(duì),并根據(jù)比對(duì)結(jié)果處理得到聲紋識(shí)別的最終結(jié)果。
具體地,上述步驟s10中,同樣分別依照第一頻段以及第二頻段進(jìn)行比對(duì),即將第一頻段下的測(cè)試識(shí)別特征與同樣處于第一頻段下的訓(xùn)練識(shí)別特征進(jìn)行比對(duì),并根據(jù)比對(duì)結(jié)果處理得到聲紋識(shí)別的結(jié)果。同樣地,將第二頻段下的測(cè)試識(shí)別特征與同樣處于第二頻段下的訓(xùn)練識(shí)別特征進(jìn)行比對(duì),并根據(jù)比對(duì)結(jié)果處理得到聲紋識(shí)別的結(jié)果。
進(jìn)一步地,本發(fā)明的較佳的實(shí)施例中,上述步驟s8中,空間序列中包括關(guān)聯(lián)于每個(gè)子空間的數(shù)據(jù)組,一個(gè)數(shù)據(jù)組對(duì)應(yīng)一個(gè)序號(hào);
則在形成空間序列后,還包括分別對(duì)處于第一頻段或者第二頻段的空間序列進(jìn)行的第一數(shù)據(jù)壓縮的過(guò)程,具體如圖2所示,為:
步驟s81,記錄每個(gè)數(shù)據(jù)組的序號(hào),并記錄關(guān)聯(lián)于每個(gè)序號(hào)的重復(fù)序號(hào)數(shù)量;
步驟s82,判斷是否存在序號(hào)的重復(fù)序號(hào)數(shù)量為1,并在存在重復(fù)序號(hào)數(shù)量為1的數(shù)據(jù)組時(shí)轉(zhuǎn)向步驟s83;
步驟s83,刪除重復(fù)序號(hào)數(shù)量為1的序號(hào)對(duì)應(yīng)的數(shù)據(jù)組;
步驟s84,判斷被刪除的數(shù)據(jù)組的前一個(gè)數(shù)據(jù)組的序號(hào)是否與被刪除的數(shù)據(jù)組的后一個(gè)數(shù)據(jù)組的序號(hào)相同:
若相同,則將前一個(gè)數(shù)據(jù)組和后一個(gè)數(shù)據(jù)組合并;
若不相同,則保留前一個(gè)數(shù)據(jù)組和后一個(gè)數(shù)據(jù)組;
對(duì)空間序列中的所有數(shù)據(jù)組均執(zhí)行第一數(shù)據(jù)壓縮后形成第一序列。
具體地,本發(fā)明的較佳的實(shí)施例中,上述第一數(shù)據(jù)壓縮的過(guò)程中,記錄子空間的序號(hào)以及相同序號(hào)的數(shù)量,將序號(hào)和相同序號(hào)的數(shù)量作為一組數(shù)據(jù)進(jìn)行排列,當(dāng)相同序號(hào)的數(shù)量為1時(shí),去掉該組數(shù)據(jù)。在本發(fā)明的一個(gè)腳架的實(shí)施例中,序號(hào)為4的數(shù)據(jù)只有1個(gè),則在進(jìn)行第一數(shù)據(jù)壓縮的過(guò)程中刪掉該組數(shù)據(jù)。
如果當(dāng)去掉該組數(shù)據(jù)后,該數(shù)據(jù)前方一組數(shù)據(jù)中的序號(hào)和后方一組數(shù)據(jù)中的序號(hào)相同時(shí),則將兩組合并。新形成的數(shù)據(jù)組的序號(hào)與被刪除的該數(shù)據(jù)組的前方一組數(shù)據(jù)的序號(hào)相同,相同序號(hào)的數(shù)量為被刪除的該組數(shù)據(jù)前方一組數(shù)據(jù)的數(shù)量與被刪除的該組數(shù)據(jù)后方一組數(shù)據(jù)的數(shù)量之和。又或者,在刪除該組數(shù)據(jù)后,該數(shù)據(jù)前方一組數(shù)據(jù)中的序號(hào)和后方一組數(shù)據(jù)中的序號(hào)不同,則同時(shí)保留這兩組數(shù)據(jù)。例如,在本發(fā)明的一個(gè)較佳的實(shí)施例中,當(dāng)序號(hào)為4的數(shù)據(jù)組被去除后,位于該組數(shù)據(jù)前一組的數(shù)據(jù)的序號(hào)為2,位于該組數(shù)據(jù)后一組的數(shù)據(jù)的序號(hào)為8,2和8不相同,所以保留原數(shù)據(jù)組。
本發(fā)明的較佳的實(shí)施例中,經(jīng)過(guò)第一數(shù)據(jù)壓縮后的第一序列即為上述訓(xùn)練識(shí)別特征。
相應(yīng)地,本發(fā)明的較佳的實(shí)施例中,上述步驟s9中,空間序列中包括關(guān)聯(lián)于每個(gè)子空間的數(shù)據(jù)組,一個(gè)數(shù)據(jù)組對(duì)應(yīng)一個(gè)序號(hào);
則在形成空間序列后,還包括分別對(duì)處于第一頻段或者第二頻段的空間序列進(jìn)行的第二數(shù)據(jù)壓縮的過(guò)程,具體如圖3所示,為:
步驟s91,記錄每個(gè)數(shù)據(jù)組的序號(hào),并記錄關(guān)聯(lián)于每個(gè)序號(hào)的重復(fù)序號(hào)數(shù)量;
步驟s92,判斷是否存在序號(hào)的重復(fù)序號(hào)數(shù)量為1,并在存在重復(fù)序號(hào) 數(shù)量為1的數(shù)據(jù)組時(shí)轉(zhuǎn)向步驟s93;
步驟s93,刪除重復(fù)序號(hào)數(shù)量為1的序號(hào)對(duì)應(yīng)的數(shù)據(jù)組;
步驟s94,判斷被刪除的數(shù)據(jù)組的前一個(gè)數(shù)據(jù)組的序號(hào)是否與被刪除的數(shù)據(jù)組的后一個(gè)數(shù)據(jù)組的序號(hào)相同:
若相同,則將前一個(gè)數(shù)據(jù)組和后一個(gè)數(shù)據(jù)組合并;
若不相同,則保留前一個(gè)數(shù)據(jù)組和后一個(gè)數(shù)據(jù)組;
對(duì)空間序列中的所有數(shù)據(jù)組均執(zhí)行第二數(shù)據(jù)壓縮后形成第二序列。
具體地,類似上述步驟s8中的步驟,步驟s9中,同樣記錄子空間的序號(hào)以及相同序號(hào)的數(shù)量,將序號(hào)和相同序號(hào)的數(shù)量作為一組數(shù)據(jù)進(jìn)行排列。當(dāng)相同序號(hào)的數(shù)量為1時(shí),去掉該組數(shù)據(jù)。
如果當(dāng)去掉該組數(shù)據(jù)后,該數(shù)據(jù)前方一組數(shù)據(jù)中的序號(hào)和后方一組數(shù)據(jù)中的序號(hào)相同時(shí),則將兩組合并。新形成的數(shù)據(jù)組的序號(hào)與被刪除的該數(shù)據(jù)組的前方一組數(shù)據(jù)的序號(hào)相同,相同序號(hào)的數(shù)量為被刪除的該組數(shù)據(jù)前方一組數(shù)據(jù)的數(shù)量與被刪除的該組數(shù)據(jù)后方一組數(shù)據(jù)的數(shù)量之和。又或者,在刪除該組數(shù)據(jù)后,該數(shù)據(jù)前方一組數(shù)據(jù)中的序號(hào)和后方一組數(shù)據(jù)中的序號(hào)不同,則同時(shí)保留這兩組數(shù)據(jù)。例如,在本發(fā)明的一個(gè)較佳的實(shí)施例中,當(dāng)序號(hào)為4的數(shù)據(jù)組被去除后,位于該組數(shù)據(jù)前一組的數(shù)據(jù)的序號(hào)為2,位于該組數(shù)據(jù)后一組的數(shù)據(jù)的序號(hào)為8,2和8不相同,所以保留原數(shù)據(jù)組。
同樣地,本發(fā)明的較佳的實(shí)施例中,上述經(jīng)過(guò)第二數(shù)據(jù)壓縮的第二序列即為測(cè)試識(shí)別特征。
上述步驟s10中,最終通過(guò)將處于同一頻段(第一頻段或者第二頻段)下的訓(xùn)練識(shí)別特征和測(cè)試識(shí)別特征進(jìn)行比對(duì),并根據(jù)比對(duì)結(jié)果處理得到最終的聲紋識(shí)別的結(jié)果。
上述步驟的執(zhí)行使得聲紋識(shí)別的計(jì)算量更小,識(shí)別率更好,并且需要處理的數(shù)據(jù)量也相對(duì)較小。
以上所述僅為本發(fā)明較佳的實(shí)施例,并非因此限制本發(fā)明的實(shí)施方式及保護(hù)范圍,對(duì)于本領(lǐng)域技術(shù)人員而言,應(yīng)當(dāng)能夠意識(shí)到凡運(yùn)用本發(fā)明說(shuō)明書及圖示內(nèi)容所作出的等同替換和顯而易見(jiàn)的變化所得到的方案,均應(yīng)當(dāng)包含 在本發(fā)明的保護(hù)范圍內(nèi)。