專利名稱:數(shù)字聲紋鑒定系統(tǒng)及確認(rèn)和辨認(rèn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人體生物特征身份識(shí)別領(lǐng)域,尤其涉及一種用于刑事鑒識(shí)身 份的數(shù)字聲紋鑒定系統(tǒng)及確認(rèn)和辨認(rèn)方法。
背景技術(shù):
人體生物特征包括DNA、指紋、虹膜、網(wǎng)膜、手掌和聲紋等。其中DNA 和指紋在各個(gè)行業(yè)的應(yīng)用日益成熟,尤其在刑事鑒識(shí)方面利用DNA和指紋進(jìn) 行嫌疑犯鑒定。但是建立DNA和指紋數(shù)據(jù)庫(kù)而要收集DNA和指紋的工作非 常復(fù)雜,并且在犯罪現(xiàn)場(chǎng)要獲取DNA和指紋相對(duì)聲音來說要困難。
目前,語音自動(dòng)識(shí)別技術(shù)、語音自動(dòng)確認(rèn)技術(shù)、話者自動(dòng)辨認(rèn)技術(shù)、語 音頻譜圖技術(shù)、語音頻譜分析技術(shù)都在迅猛發(fā)展。其中實(shí)現(xiàn)話者確認(rèn)和辨認(rèn) 的方法很多,例如使用基于多空間概率分布(multi-space probability distribution)的高斯混合模型 (Gaus-sian mixture model, GMM)來對(duì)語音頻 譜進(jìn)行建模實(shí)現(xiàn)說話者身份的識(shí)別。但是這樣的方案基本無法應(yīng)用在刑事鑒 識(shí)上,因?yàn)檎Z音頻譜分析的精度不夠,這種頻譜分析主要依賴于分析者的工 作經(jīng)驗(yàn),因此不同的分析者對(duì)于同一語音痕跡獲得分析結(jié)果可以完全不同, 從而不適宜應(yīng)用于刑事鑒識(shí)方面。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)存在的缺陷,提供一種數(shù)字聲紋鑒定系 統(tǒng)實(shí)現(xiàn)根據(jù)現(xiàn)場(chǎng)錄音辨識(shí)嫌疑犯。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種數(shù)字聲紋鑒定系統(tǒng),包括 多個(gè)采集器,用于采集嫌疑犯的聲音痕跡;聲紋處理器,與多個(gè)采集器連接,用于將所述采集器采集到的聲音痕跡 或現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、建模等處理獲得聲紋數(shù)據(jù)并對(duì)聲音痕跡建立案
號(hào)進(jìn)行注冊(cè);
聲紋數(shù)據(jù)庫(kù),與聲紋處理器連接,用于存儲(chǔ)注冊(cè)的與案號(hào)相關(guān)的處理后 的嫌疑犯的聲紋的特征信息;
比對(duì)調(diào)準(zhǔn)引擎,與聲紋數(shù)據(jù)庫(kù)連接,用于設(shè)定聲紋數(shù)據(jù)庫(kù)的聲紋與輸入 的現(xiàn)場(chǎng)錄音的聲紋進(jìn)行比對(duì)條件,并在比對(duì)過程中實(shí)時(shí)調(diào)整比對(duì)條件。
所述聲紋處理器包括
降噪模塊,用于對(duì)現(xiàn)場(chǎng)錄音和聲音痕跡進(jìn)行自動(dòng)降噪; 切片模塊,用于接收所述降噪模塊發(fā)送的降噪后的文件自動(dòng)切片; 識(shí)別關(guān)鍵字模塊,用于接收所述切片模塊發(fā)送的切片后的文件選擇5-8
個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段;
參數(shù)化模塊,用于接收識(shí)別出的關(guān)鍵字段進(jìn)行參數(shù)化;
建模模塊,用于對(duì)經(jīng)過參數(shù)化的關(guān)鍵字段根據(jù)詞、字、聲母、韻母進(jìn)行
建模從而獲得聲紋;
注冊(cè)模塊,將所述建模模塊建模獲得的聲紋注冊(cè)進(jìn)聲紋數(shù)據(jù)庫(kù)。
所述的數(shù)字聲紋鑒定系統(tǒng)還包括
確認(rèn)模型庫(kù),用于提供確認(rèn)通用標(biāo)準(zhǔn);
排查處理器,用于輸入現(xiàn)場(chǎng)錄音以及案號(hào),從在聲紋數(shù)據(jù)庫(kù)中根據(jù)案號(hào) 找出相應(yīng)的嫌疑犯聲紋,對(duì)該嫌疑犯聲紋與輸入的現(xiàn)場(chǎng)錄音經(jīng)過聲紋處理器 處理后的聲紋,根據(jù)確認(rèn)模型庫(kù)進(jìn)行比對(duì)以確認(rèn)該現(xiàn)場(chǎng)錄音為該嫌疑人所說。
數(shù)字聲紋鑒定系統(tǒng)還包括
辨認(rèn)模型庫(kù),用于提供辨認(rèn)通用標(biāo)準(zhǔn);;
辨認(rèn)處理器,用于根據(jù)邊界條件從聲紋數(shù)據(jù)庫(kù)中編寫辨認(rèn)模型庫(kù),并根 據(jù)辨認(rèn)模型庫(kù)中的聲紋數(shù)據(jù)找出嫌疑犯列表。
本發(fā)明提供了一種刑事鑒識(shí)身份的確認(rèn)方法,包括對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第一聲紋特征;
獲取與現(xiàn)場(chǎng)錄音相同內(nèi)容的聲音痕跡,對(duì)其進(jìn)行聲紋處理獲得第二聲紋 數(shù)據(jù);
獲取多個(gè)第三聲紋特征,并將所述第二聲紋特征和所述多個(gè)第三聲紋特 征通過計(jì)算獲得確認(rèn)模型庫(kù);
將所述第二聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì),并將獲得的第一差別 存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中;
將所述第一聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì)獲得第二差別,確定第 一差別和第二差別的相似度。
所述進(jìn)行聲紋處理包括對(duì)現(xiàn)場(chǎng)錄音或聲音痕跡進(jìn)行降噪、切片、選擇 5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù)化后,根據(jù)詞、字、聲母、韻母進(jìn) 行建模從而獲得第一聲紋數(shù)據(jù)或第二聲紋數(shù)據(jù)。
本發(fā)明提供了 一種刑事鑒識(shí)身份的辨認(rèn)方法包括
對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第三聲紋數(shù)據(jù);
根據(jù)所述現(xiàn)場(chǎng)錄音中的身份信息從數(shù)據(jù)庫(kù)中獲取滿足這些邊界條件的嫌
疑犯編寫辨識(shí)模型庫(kù);
將采樣的所述嫌疑犯聲紋特征與辨認(rèn)模型庫(kù)進(jìn)行比對(duì),記錄第一差別,
并將該差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中;
將第三聲紋特征和所述辨認(rèn)模型庫(kù)進(jìn)行比對(duì)得到第二差別; 將該第一差別和所述第二差別進(jìn)行相似度的排序輸出辨認(rèn)結(jié)果。 所述進(jìn)行聲紋處理包括對(duì)現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、選擇5-8個(gè)沒有兩
個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù)化后,根據(jù)詞、字、聲母、韻母進(jìn)行建模從而
獲得聲紋數(shù)據(jù)。
因此,本發(fā)明提供的這種能夠高精度且有效地辨識(shí)或確認(rèn)嫌疑犯,有 利于在刑事偵緝上使用。
下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
圖1為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例的結(jié)構(gòu)圖; 圖2為本發(fā)明聲紋處理器2的結(jié)構(gòu)圖; 圖3為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例2的結(jié)構(gòu)圖; 圖4為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例3的結(jié)構(gòu)圖; 圖5本發(fā)明聲紋鑒識(shí)系統(tǒng)的確認(rèn)過程流程圖; 圖6本發(fā)明聲紋鑒識(shí)系統(tǒng)的辨認(rèn)過程流程圖。
具體實(shí)施例方式
本發(fā)明主要用于刑事鑒識(shí)方面,獲得現(xiàn)場(chǎng)語音痕跡后,對(duì)嫌疑人進(jìn)行錄 音采集,進(jìn)行降噪處理和剪輯,然后將嫌疑人錄音參數(shù)化和建模使之成為聲 紋,存儲(chǔ)在嫌疑人聲紋數(shù)據(jù)庫(kù)中。然后將現(xiàn)場(chǎng)語音痕跡和嫌疑人聲紋比對(duì), 確定該嫌疑人和現(xiàn)場(chǎng)語音為同一人,也即稱之為確認(rèn)過程?;蛘咴谥挥蝎@得 現(xiàn)場(chǎng)語音痕跡后,可以根據(jù)建立的聲紋歷史數(shù)據(jù)庫(kù)如犯罪人聲紋數(shù)據(jù)庫(kù)、嫌 疑人聲紋數(shù)據(jù)庫(kù)和在逃犯聲紋數(shù)據(jù)庫(kù)編寫出辨識(shí)模式庫(kù)后進(jìn)行比較,找出與 現(xiàn)場(chǎng)語音痕跡最接近的嫌疑人聲紋,即得出嫌疑人列表,也即辨認(rèn)過程。
如圖1所示為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例的結(jié)構(gòu)圖,該系統(tǒng)100包括多 個(gè)采集器l,用于采集嫌疑犯的聲音痕跡;聲紋處理器2,與多個(gè)采集器l連 接,用于將采集器1收集到的聲音痕跡進(jìn)行降噪、切片、建模等處理獲得聲 紋數(shù)據(jù)并對(duì)其建立案號(hào)進(jìn)行注冊(cè);聲紋數(shù)據(jù)庫(kù)包括第一聲紋數(shù)據(jù)庫(kù)3和第二 聲紋數(shù)據(jù)庫(kù)4,分別與聲紋處理器2連接,用于存儲(chǔ)注冊(cè)的各個(gè)案號(hào)相關(guān)的處 理后嫌疑犯的聲紋數(shù)據(jù)如身份信息年齡、性別、口音地、體重、身高,以及 聲紋的特征信息如說話的頻率、說話的幅度、說話的能量、等聲紋指標(biāo)參數(shù); 比對(duì)調(diào)準(zhǔn)引擎5,與第一聲紋數(shù)據(jù)庫(kù)3和第二聲紋數(shù)據(jù)庫(kù)4連接,用于設(shè)定第 一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)中的嫌疑犯的聲紋與輸入的現(xiàn)場(chǎng)錄音的聲紋 進(jìn)行比對(duì)的條件,并在比對(duì)過程中實(shí)時(shí)調(diào)整比對(duì)條件。其中第一聲紋數(shù)據(jù)庫(kù)又稱為急用聲紋數(shù)據(jù)庫(kù),在獲得現(xiàn)場(chǎng)錄音和嫌疑犯 錄音后,可以立刻立案辨認(rèn)和確認(rèn)的數(shù)據(jù)庫(kù);第二聲紋數(shù)據(jù)庫(kù)又稱為儲(chǔ)備數(shù) 據(jù)庫(kù),在沒有現(xiàn)場(chǎng)錄音但有嫌疑犯的情況下,對(duì)嫌疑犯的聲紋進(jìn)行注冊(cè)備用。 聲紋數(shù)據(jù)庫(kù)中詳細(xì)地保存著嫌疑犯的各種信息,如身份信息年齡、性別、口 音地、體重、身高,以及聲紋的特征信息如說話的頻率、說話的幅度、說話 的能量、等聲紋指標(biāo)參數(shù)。
如圖2所示,為本發(fā)明聲紋處理器2的結(jié)構(gòu)圖,包括降噪模塊21、切片 模塊22、識(shí)別關(guān)鍵字模塊23、參數(shù)化模塊24、根據(jù)詞、字、聲母、韻母進(jìn)行 建模的建模模塊25,將聲紋注冊(cè)進(jìn)第一或者第二數(shù)據(jù)庫(kù)中的注冊(cè)模塊26。降 噪模塊21將獲得的錄音文件如現(xiàn)場(chǎng)錄音文件或嫌疑犯錄音文件如包含"這里 是五街十號(hào)樓"的一個(gè)聲音文件進(jìn)行自動(dòng)降噪,然后將降噪后的文件發(fā)送給切 片模塊22進(jìn)行自動(dòng)切片如將"這里是五街十號(hào)樓"的聲音文件切出,將文件切 片后根據(jù)關(guān)鍵字如"五街十號(hào)樓"對(duì)切片的文件進(jìn)行自動(dòng)關(guān)鍵字識(shí)別,選擇關(guān)鍵 字的準(zhǔn)則是選擇5-8個(gè)字且沒有兩個(gè)以上重復(fù)的字,根據(jù)由參數(shù)化模塊將包含 關(guān)鍵字的切片文件進(jìn)行參數(shù)化,建模模塊25根據(jù)詞、字、聲母、韻母進(jìn)行建 模,從而獲得聲紋,由注冊(cè)模塊注冊(cè)進(jìn)第一或第二聲紋數(shù)據(jù)庫(kù)。
參見圖3所示,本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例2的結(jié)構(gòu)圖,該系統(tǒng)還包括 確認(rèn)模型庫(kù),用于提供確認(rèn)通用標(biāo)準(zhǔn);排査處理器6,用于輸入現(xiàn)場(chǎng)錄音以及 案號(hào),聲紋處理器從在第一聲紋數(shù)據(jù)庫(kù)中根據(jù)案號(hào)找出相應(yīng)的嫌疑犯聲紋, 對(duì)該嫌疑犯聲紋與輸入的現(xiàn)場(chǎng)錄音經(jīng)過聲紋處理器處理后的聲紋,根據(jù)確認(rèn) 模型庫(kù)進(jìn)行比對(duì)以確認(rèn)該現(xiàn)場(chǎng)錄音為該嫌疑人所說。該過程即稱之為確認(rèn)過 程如圖5所示,即包括以下步驟
步驟3h聲紋處理器獲取現(xiàn)場(chǎng)錄音,并將之處理成第一聲紋,也稱之為 已知聲紋;其中錄音如圖2所示的那樣進(jìn)行聲紋處理;如在本鈳中是采用的 聲母建模;如將現(xiàn)場(chǎng)錄音的一段話"這里是五街十號(hào)樓"、"明天早上七點(diǎn)準(zhǔn)時(shí) 見面"的中間5-8個(gè)字且沒有兩個(gè)以上重復(fù)的字如"里是五街十號(hào)"和"早上七點(diǎn)準(zhǔn)時(shí)見面"進(jìn)行聲紋處理;
步驟32:聲紋處理器獲取嫌疑人如張三的聲音痕跡,并將之處理成第二 聲紋,也稱之為聲稱聲紋;其中對(duì)嫌疑犯的聲音痕跡如圖2所示的那樣進(jìn)行 聲紋處理;如在本例中是采用的聲母建模;即該嫌疑犯張三重復(fù)說現(xiàn)場(chǎng)錄音 中的"里是五街十號(hào)"和"早上七點(diǎn)準(zhǔn)時(shí)見面",并采集多次,對(duì)其同樣進(jìn)行聲 紋處理;以及將若干個(gè)無相干人員如5個(gè)無關(guān)人員進(jìn)行采樣,采樣的原則是 樣本要有一定的長(zhǎng)度如"這里是五街十號(hào)樓"(要求有連續(xù)的5-7個(gè)字的長(zhǎng) 度)、要文本有關(guān),即要求采樣內(nèi)容和現(xiàn)場(chǎng)語音內(nèi)容一致如"這里是五街 十號(hào)樓"、要多次采樣即嫌疑人要重復(fù)的說采樣內(nèi)容若干次;
步驟33,采樣結(jié)束后,將采樣的結(jié)果經(jīng)過降噪、剪切等處理后,輸入
到計(jì)算機(jī)中,通過包括特征提取和語音建模的嫌疑人模型計(jì)算,得到一個(gè) 確認(rèn)模型庫(kù);
步驟34,將這個(gè)嫌疑人張三的聲紋特征和確認(rèn)模型庫(kù)進(jìn)行比對(duì),將其和 確認(rèn)模型庫(kù)的差別記錄后添加到聲紋數(shù)據(jù)庫(kù)中;
步驟35,將現(xiàn)場(chǎng)語音樣本和確認(rèn)模型庫(kù)進(jìn)行比對(duì)獲得差別,査看這個(gè)差別 與存放在聲紋數(shù)據(jù)庫(kù)中的嫌疑人與確認(rèn)模型庫(kù)的差別的相似度,如完全近似 則認(rèn)為現(xiàn)場(chǎng)錄音的這個(gè)人和嫌疑犯是同一個(gè)人即認(rèn)定同一,如果完全不相似, 則得出結(jié)果是否定同一人,如果兩個(gè)差別有一定的相似即較多相似,則得出 結(jié)果是傾向認(rèn)定同一人;如果兩個(gè)差別有一定的不相似即較多不相似,則得 出的結(jié)果是傾向否定同一。
參見圖4所示,本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例3還包括一個(gè)辨認(rèn)處理器7, 以及辨認(rèn)模型庫(kù)8。辨認(rèn)模型庫(kù)8,用于提供辨認(rèn)通用標(biāo)準(zhǔn),辨認(rèn)處理器7與 第一、第二聲紋數(shù)據(jù)庫(kù)3和4以及世界模型庫(kù)8連接,用于根據(jù)邊界條件從 第一和第二聲紋數(shù)據(jù)庫(kù)3和4中編寫世界模型庫(kù)8,并根據(jù)世界模型庫(kù)8中的 各項(xiàng)指標(biāo)參數(shù)找出聲紋所對(duì)應(yīng)的嫌疑犯列表。該過程是根據(jù)現(xiàn)場(chǎng)錄音片段從 聲紋數(shù)據(jù)庫(kù)中辨認(rèn)出說該錄音片段的說話者列表。辨識(shí)模型庫(kù)根據(jù)一定的輸入?yún)?shù)如性別、年齡、出生地從第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)中獲取的 嫌疑人信息,辨識(shí)模型庫(kù)是第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)的子集。該過 程即稱之為辨認(rèn)過程如圖6所示,即包括以下步驟
步驟41,獲取現(xiàn)場(chǎng)錄音片段如"這里是五街十號(hào)樓",進(jìn)行降噪、剪切等 基本處理將其處理成第三聲紋;
步驟42,根據(jù)現(xiàn)場(chǎng)錄音片段中的身份信息如說話者為男性、年齡在25-25 歲之間、口音為河南音從第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)中將符合這些輸 入?yún)?shù)的犯罪嫌疑人信息導(dǎo)出,對(duì)嫌疑人進(jìn)行采樣假設(shè)有10個(gè)嫌疑人,此處 僅為示例性并非限制,采樣的原則是樣本要有一定的長(zhǎng)度如"這里是五街十 號(hào)樓"(要求有連續(xù)的5-7個(gè)字的長(zhǎng)度)、要文本有關(guān),即要求采樣內(nèi)容 和現(xiàn)場(chǎng)語音內(nèi)容一致如"這里是五街十號(hào)樓"、要多次采樣即嫌疑人要重 復(fù)的說采樣內(nèi)容若干次;
步驟43,采樣結(jié)束后,將采樣的結(jié)果經(jīng)過降噪、剪切等處理后,輸入 到計(jì)算機(jī)中,通過包括特征提取和語音建模的嫌疑人模型計(jì)算,得到一個(gè) 嫌疑人模型庫(kù)(具有這IO個(gè)人的普遍特征)即衡量這IO個(gè)嫌疑人聲紋特 征的通用標(biāo)準(zhǔn);
步驟44,將這IO個(gè)嫌疑人的聲紋特征分別和嫌疑人模型庫(kù)進(jìn)行比對(duì), 將其和嫌疑人模型庫(kù)的差別分別記錄后添加到聲紋數(shù)據(jù)庫(kù)中;
步驟45,將現(xiàn)場(chǎng)語音樣本和嫌疑人模型庫(kù)進(jìn)行比對(duì),得到現(xiàn)場(chǎng)語音樣本 和嫌疑人模型庫(kù)的差別,按照聲紋數(shù)據(jù)庫(kù)中10個(gè)嫌疑人和嫌疑人模型庫(kù)的差 別與現(xiàn)場(chǎng)語音樣本和嫌疑人模型庫(kù)的差別的相似度進(jìn)行由高到低的排序,輸 出辨認(rèn)結(jié)果得出嫌疑人列表。如張三的能量可信度如2.1、頻率可信度2.0、 幅度可信度1.9,從而獲得該嫌疑人的辨別可信度為98%。第二嫌疑人李四的 能量可信度如1.8、頻率可信度2.0、幅度可信度1.7,從而獲得該嫌疑人的辨 別可信度為88%,第三嫌疑人王五的能量可信度如1.5、頻率可信度1.9、幅 度可信度1.2,辨別可信度為76%,從而獲得一個(gè)列表,將這些嫌疑人按辨別可信度依次遞減進(jìn)行排列。因此,該排列表中排在第一的嫌疑犯具有最大嫌 疑性。
其中,采用嫌疑人模型庫(kù)的優(yōu)點(diǎn)在于基于算法,在對(duì)語音樣本進(jìn)行采 樣注冊(cè)后得到的是其和嫌疑人模型庫(kù)的差別。因此,在僅有兩個(gè)對(duì)象的時(shí) 候,不能以其中任何一個(gè)對(duì)象作為標(biāo)準(zhǔn)進(jìn)行比對(duì),而是需要一定數(shù)量的對(duì) 象形成嫌疑人模型庫(kù),在得到各對(duì)象與嫌疑人模型庫(kù)的差別后才可進(jìn)行比 對(duì)。舉個(gè)例子來說,假設(shè)我們有甲、乙兩個(gè)對(duì)象要進(jìn)行比對(duì),如果以甲為
標(biāo)準(zhǔn)即嫌疑人模型庫(kù),那么甲和嫌疑人模型庫(kù)的差別就是0而乙和嫌疑人 模型庫(kù)的差別必為一非o量(因?yàn)榧词故峭粋€(gè)人不同的兩次錄音也會(huì)存
在著一定的差別),這樣就不能簡(jiǎn)單地說這個(gè)差別小于一個(gè)既定的數(shù)值之 后,就判定兩個(gè)對(duì)象是同一個(gè)人。
其次就是在聲紋數(shù)據(jù)庫(kù)的建立時(shí),采用的原則是盡可能的節(jié)省空間資 源,如果每一個(gè)聲音樣本都記錄他所有的聲紋特征,這樣聲紋數(shù)據(jù)庫(kù)將十 分的龐大,浪費(fèi)資源。相反采用嫌疑人模型庫(kù),只需要記錄下語音樣本和 嫌疑人模型庫(kù)的差別即可,相同的部分就省略了,達(dá)到節(jié)省資源的目的。
最后所應(yīng)說明的是,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制, 盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng) 理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技 術(shù)方案的精神和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1. 一種數(shù)字聲紋鑒定系統(tǒng),其特征在于包括多個(gè)采集器,用于采集嫌疑犯的聲音痕跡;聲紋處理器,與多個(gè)采集器連接,用于將所述采集器采集到的聲音痕跡或現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、建模等處理獲得聲紋數(shù)據(jù)并對(duì)聲音痕跡建立案號(hào)進(jìn)行注冊(cè);聲紋數(shù)據(jù)庫(kù),與聲紋處理器連接,用于存儲(chǔ)注冊(cè)的與案號(hào)相關(guān)的處理后的嫌疑犯的聲紋的特征信息;比對(duì)調(diào)準(zhǔn)引擎,與聲紋數(shù)據(jù)庫(kù)連接,用于設(shè)定聲紋數(shù)據(jù)庫(kù)的聲紋與輸入的現(xiàn)場(chǎng)錄音的聲紋進(jìn)行比對(duì)條件,并在比對(duì)過程中實(shí)時(shí)調(diào)整比對(duì)條件。
2. 根據(jù)權(quán)利要求1所述的數(shù)字聲紋鑒定系統(tǒng),其特征在于所述聲紋處理 器包括降噪模塊,用于對(duì)現(xiàn)場(chǎng)錄音和聲音痕跡進(jìn)行自動(dòng)降噪; 切片模塊,用于接收所述降噪模塊發(fā)送的降噪后的文件自動(dòng)切片; 識(shí)別關(guān)鍵字模塊,用于接收所述切片模塊發(fā)送的切片后的文件選擇5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段;參數(shù)化模塊,用于接收識(shí)別出的關(guān)鍵字段進(jìn)行參數(shù)化;建模模塊,用于對(duì)經(jīng)過參數(shù)化的關(guān)鍵字段根據(jù)詞、字、聲母、韻母進(jìn)行建模從而獲得聲紋;注冊(cè)模塊,將所述建模模塊建模獲得的聲紋注冊(cè)進(jìn)聲紋數(shù)據(jù)庫(kù)。
3. 根據(jù)權(quán)利要求2所述的數(shù)字聲紋鑒定系統(tǒng),其特征在于還包括 確認(rèn)模型庫(kù),用于提供確認(rèn)通用標(biāo)準(zhǔn);排査處理器,用于輸入現(xiàn)場(chǎng)錄音以及案號(hào),從在聲紋數(shù)據(jù)庫(kù)中根據(jù)案號(hào) 找出相應(yīng)的嫌疑犯聲紋,對(duì)該嫌疑犯聲紋與輸入的現(xiàn)場(chǎng)錄音經(jīng)過聲紋處理器 處理后的聲紋,根據(jù)確認(rèn)模型庫(kù)進(jìn)行比對(duì)以確認(rèn)該現(xiàn)場(chǎng)錄音為該嫌疑人所說。
4. 根據(jù)權(quán)利要求3所述的數(shù)字聲紋鑒定系統(tǒng),其特征在于還包括辨認(rèn)模型庫(kù),用于提供辨認(rèn)通用標(biāo)準(zhǔn);;辨認(rèn)處理器,用于根據(jù)邊界條件從聲紋數(shù)據(jù)庫(kù)中編寫辨認(rèn)模型庫(kù),并根 據(jù)辨認(rèn)模型庫(kù)中的聲紋數(shù)據(jù)找出嫌疑犯列表。
5. —種刑事鑒識(shí)身份的確認(rèn)方法,其特征在于包括 對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第一聲紋特征;獲取與現(xiàn)場(chǎng)錄音相同內(nèi)容的聲音痕跡,對(duì)其進(jìn)行聲紋處理獲得第二聲紋 數(shù)據(jù);獲取多個(gè)第三聲紋特征,并將所述第二聲紋特征和所述多個(gè)第三聲紋特 征通過計(jì)算獲得確認(rèn)模型庫(kù);將所述第二聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì),并將獲得的第一差別 存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中;將所述第一聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì)獲得第二差別,確定第 一差別和第二差別的相似度。
6. 根據(jù)權(quán)利要求5所述的確認(rèn)方法,其特性在于所述進(jìn)行聲紋處理包括 對(duì)現(xiàn)場(chǎng)錄音或聲音痕跡進(jìn)行降噪、切片、選擇5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字 段進(jìn)行參數(shù)化后,根據(jù)詞、字、聲母、韻母進(jìn)行建模從而獲得第一聲紋數(shù)據(jù) 或第二聲紋數(shù)據(jù)。
7. —種刑事鑒識(shí)身份的辨認(rèn)方法,其特性在于包括 對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第三聲紋數(shù)據(jù);根據(jù)所述現(xiàn)場(chǎng)錄音中的身份信息從數(shù)據(jù)庫(kù)中獲取滿足這些邊界條件的嫌 疑犯編寫辨識(shí)模型庫(kù);將采樣的所述嫌疑犯聲紋特征與辨認(rèn)模型庫(kù)進(jìn)行比對(duì),記錄第一差別, 并將該差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中;將第三聲紋特征和所述辨認(rèn)模型庫(kù)進(jìn)行比對(duì)得到第二差別;將該第一差別和所述第二差別進(jìn)行相似度的排序輸出辨認(rèn)結(jié)果。
8. 根據(jù)權(quán)利要求7所述的確認(rèn)方法,其特性在于所述進(jìn)行聲紋處理包括:對(duì)現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、選擇5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù) 化后,根據(jù)詞、字、聲母、韻母進(jìn)行建模從而獲得聲紋數(shù)據(jù)。
全文摘要
本發(fā)明公開了一種數(shù)字聲紋鑒定系統(tǒng),包括多個(gè)采集器;聲紋處理器,與多個(gè)采集器連接;聲紋數(shù)據(jù)庫(kù),與聲紋處理器連接;比對(duì)調(diào)準(zhǔn)引擎,與聲紋數(shù)據(jù)庫(kù)連接。本發(fā)明還提供了刑事鑒識(shí)身份的確認(rèn)方法,對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第一聲紋特征;獲得第二聲紋數(shù)據(jù);計(jì)算獲得確認(rèn)模型庫(kù);比對(duì),并將獲得的第一差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中;確定第一差別和第二差別的相似度。本發(fā)明還提供了刑事鑒識(shí)身份的辨認(rèn)方法,處理獲得第三聲紋數(shù)據(jù);根據(jù)所述現(xiàn)場(chǎng)錄音中的身份信息編寫辨識(shí)模型庫(kù);將采樣的所述嫌疑犯聲紋特征與辨認(rèn)模型庫(kù)進(jìn)行比對(duì),記錄第一差別;將第三聲紋特征和所述辨認(rèn)模型庫(kù)進(jìn)行比對(duì)得到第二差別;將該第一差別和所述第二差別進(jìn)行相似度的排序輸出辨認(rèn)結(jié)果。
文檔編號(hào)G10L17/00GK101447188SQ20071017814
公開日2009年6月3日 申請(qǐng)日期2007年11月27日 優(yōu)先權(quán)日2007年11月27日
發(fā)明者約翰·葉, 里奧納德·程 申請(qǐng)人:北京金運(yùn)昭德數(shù)字科技有限公司