數(shù)字聲紋鑒定系統(tǒng)及確認(rèn)和辨認(rèn)方法

文檔序號(hào)：2837481閱讀：890來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：數(shù)字聲紋鑒定系統(tǒng)及確認(rèn)和辨認(rèn)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及人體生物特征身份識(shí)別領(lǐng)域，尤其涉及一種用于刑事鑒識(shí)身份的數(shù)字聲紋鑒定系統(tǒng)及確認(rèn)和辨認(rèn)方法。
背景技術(shù)：
人體生物特征包括DNA、指紋、虹膜、網(wǎng)膜、手掌和聲紋等。其中DNA 和指紋在各個(gè)行業(yè)的應(yīng)用日益成熟，尤其在刑事鑒識(shí)方面利用DNA和指紋進(jìn) 行嫌疑犯鑒定。但是建立DNA和指紋數(shù)據(jù)庫(kù)而要收集DNA和指紋的工作非常復(fù)雜，并且在犯罪現(xiàn)場(chǎng)要獲取DNA和指紋相對(duì)聲音來說要困難。
目前，語音自動(dòng)識(shí)別技術(shù)、語音自動(dòng)確認(rèn)技術(shù)、話者自動(dòng)辨認(rèn)技術(shù)、語音頻譜圖技術(shù)、語音頻譜分析技術(shù)都在迅猛發(fā)展。其中實(shí)現(xiàn)話者確認(rèn)和辨認(rèn) 的方法很多，例如使用基于多空間概率分布(multi-space probability distribution)的高斯混合模型 (Gaus-sian mixture model, GMM)來對(duì)語音頻譜進(jìn)行建模實(shí)現(xiàn)說話者身份的識(shí)別。但是這樣的方案基本無法應(yīng)用在刑事鑒識(shí)上，因?yàn)檎Z音頻譜分析的精度不夠，這種頻譜分析主要依賴于分析者的工作經(jīng)驗(yàn)，因此不同的分析者對(duì)于同一語音痕跡獲得分析結(jié)果可以完全不同，從而不適宜應(yīng)用于刑事鑒識(shí)方面。

發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)存在的缺陷，提供一種數(shù)字聲紋鑒定系統(tǒng)實(shí)現(xiàn)根據(jù)現(xiàn)場(chǎng)錄音辨識(shí)嫌疑犯。
為了實(shí)現(xiàn)上述目的，本發(fā)明提供了一種數(shù)字聲紋鑒定系統(tǒng)，包括多個(gè)采集器，用于采集嫌疑犯的聲音痕跡；聲紋處理器，與多個(gè)采集器連接，用于將所述采集器采集到的聲音痕跡或現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、建模等處理獲得聲紋數(shù)據(jù)并對(duì)聲音痕跡建立案
號(hào)進(jìn)行注冊(cè)；
聲紋數(shù)據(jù)庫(kù)，與聲紋處理器連接，用于存儲(chǔ)注冊(cè)的與案號(hào)相關(guān)的處理后的嫌疑犯的聲紋的特征信息；
比對(duì)調(diào)準(zhǔn)引擎，與聲紋數(shù)據(jù)庫(kù)連接，用于設(shè)定聲紋數(shù)據(jù)庫(kù)的聲紋與輸入的現(xiàn)場(chǎng)錄音的聲紋進(jìn)行比對(duì)條件，并在比對(duì)過程中實(shí)時(shí)調(diào)整比對(duì)條件。
所述聲紋處理器包括
降噪模塊，用于對(duì)現(xiàn)場(chǎng)錄音和聲音痕跡進(jìn)行自動(dòng)降噪；切片模塊，用于接收所述降噪模塊發(fā)送的降噪后的文件自動(dòng)切片；識(shí)別關(guān)鍵字模塊，用于接收所述切片模塊發(fā)送的切片后的文件選擇5-8
個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段；
參數(shù)化模塊，用于接收識(shí)別出的關(guān)鍵字段進(jìn)行參數(shù)化；
建模模塊，用于對(duì)經(jīng)過參數(shù)化的關(guān)鍵字段根據(jù)詞、字、聲母、韻母進(jìn)行
建模從而獲得聲紋；
注冊(cè)模塊，將所述建模模塊建模獲得的聲紋注冊(cè)進(jìn)聲紋數(shù)據(jù)庫(kù)。
所述的數(shù)字聲紋鑒定系統(tǒng)還包括
確認(rèn)模型庫(kù)，用于提供確認(rèn)通用標(biāo)準(zhǔn)；
排查處理器，用于輸入現(xiàn)場(chǎng)錄音以及案號(hào)，從在聲紋數(shù)據(jù)庫(kù)中根據(jù)案號(hào) 找出相應(yīng)的嫌疑犯聲紋，對(duì)該嫌疑犯聲紋與輸入的現(xiàn)場(chǎng)錄音經(jīng)過聲紋處理器處理后的聲紋，根據(jù)確認(rèn)模型庫(kù)進(jìn)行比對(duì)以確認(rèn)該現(xiàn)場(chǎng)錄音為該嫌疑人所說。
數(shù)字聲紋鑒定系統(tǒng)還包括
辨認(rèn)模型庫(kù)，用于提供辨認(rèn)通用標(biāo)準(zhǔn)；；
辨認(rèn)處理器，用于根據(jù)邊界條件從聲紋數(shù)據(jù)庫(kù)中編寫辨認(rèn)模型庫(kù)，并根據(jù)辨認(rèn)模型庫(kù)中的聲紋數(shù)據(jù)找出嫌疑犯列表。
本發(fā)明提供了一種刑事鑒識(shí)身份的確認(rèn)方法，包括對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第一聲紋特征；
獲取與現(xiàn)場(chǎng)錄音相同內(nèi)容的聲音痕跡，對(duì)其進(jìn)行聲紋處理獲得第二聲紋數(shù)據(jù)；
獲取多個(gè)第三聲紋特征，并將所述第二聲紋特征和所述多個(gè)第三聲紋特征通過計(jì)算獲得確認(rèn)模型庫(kù)；
將所述第二聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì)，并將獲得的第一差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中；
將所述第一聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì)獲得第二差別，確定第一差別和第二差別的相似度。
所述進(jìn)行聲紋處理包括對(duì)現(xiàn)場(chǎng)錄音或聲音痕跡進(jìn)行降噪、切片、選擇 5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù)化后，根據(jù)詞、字、聲母、韻母進(jìn) 行建模從而獲得第一聲紋數(shù)據(jù)或第二聲紋數(shù)據(jù)。
本發(fā)明提供了一種刑事鑒識(shí)身份的辨認(rèn)方法包括
對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第三聲紋數(shù)據(jù)；
根據(jù)所述現(xiàn)場(chǎng)錄音中的身份信息從數(shù)據(jù)庫(kù)中獲取滿足這些邊界條件的嫌
疑犯編寫辨識(shí)模型庫(kù)；
將采樣的所述嫌疑犯聲紋特征與辨認(rèn)模型庫(kù)進(jìn)行比對(duì)，記錄第一差別，
并將該差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中；
將第三聲紋特征和所述辨認(rèn)模型庫(kù)進(jìn)行比對(duì)得到第二差別；將該第一差別和所述第二差別進(jìn)行相似度的排序輸出辨認(rèn)結(jié)果。所述進(jìn)行聲紋處理包括對(duì)現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、選擇5-8個(gè)沒有兩
個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù)化后，根據(jù)詞、字、聲母、韻母進(jìn)行建模從而
獲得聲紋數(shù)據(jù)。
因此，本發(fā)明提供的這種能夠高精度且有效地辨識(shí)或確認(rèn)嫌疑犯，有利于在刑事偵緝上使用。
下面結(jié)合附圖和實(shí)施例，對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

圖1為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例的結(jié)構(gòu)圖；圖2為本發(fā)明聲紋處理器2的結(jié)構(gòu)圖；圖3為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例2的結(jié)構(gòu)圖；圖4為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例3的結(jié)構(gòu)圖；圖5本發(fā)明聲紋鑒識(shí)系統(tǒng)的確認(rèn)過程流程圖；圖6本發(fā)明聲紋鑒識(shí)系統(tǒng)的辨認(rèn)過程流程圖。
具體實(shí)施例方式
本發(fā)明主要用于刑事鑒識(shí)方面，獲得現(xiàn)場(chǎng)語音痕跡后，對(duì)嫌疑人進(jìn)行錄音采集，進(jìn)行降噪處理和剪輯，然后將嫌疑人錄音參數(shù)化和建模使之成為聲紋，存儲(chǔ)在嫌疑人聲紋數(shù)據(jù)庫(kù)中。然后將現(xiàn)場(chǎng)語音痕跡和嫌疑人聲紋比對(duì)，確定該嫌疑人和現(xiàn)場(chǎng)語音為同一人，也即稱之為確認(rèn)過程?；蛘咴谥挥蝎@得現(xiàn)場(chǎng)語音痕跡后，可以根據(jù)建立的聲紋歷史數(shù)據(jù)庫(kù)如犯罪人聲紋數(shù)據(jù)庫(kù)、嫌疑人聲紋數(shù)據(jù)庫(kù)和在逃犯聲紋數(shù)據(jù)庫(kù)編寫出辨識(shí)模式庫(kù)后進(jìn)行比較，找出與現(xiàn)場(chǎng)語音痕跡最接近的嫌疑人聲紋，即得出嫌疑人列表，也即辨認(rèn)過程。
如圖1所示為本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例的結(jié)構(gòu)圖，該系統(tǒng)100包括多個(gè)采集器l，用于采集嫌疑犯的聲音痕跡；聲紋處理器2，與多個(gè)采集器l連接，用于將采集器1收集到的聲音痕跡進(jìn)行降噪、切片、建模等處理獲得聲紋數(shù)據(jù)并對(duì)其建立案號(hào)進(jìn)行注冊(cè)；聲紋數(shù)據(jù)庫(kù)包括第一聲紋數(shù)據(jù)庫(kù)3和第二聲紋數(shù)據(jù)庫(kù)4，分別與聲紋處理器2連接，用于存儲(chǔ)注冊(cè)的各個(gè)案號(hào)相關(guān)的處理后嫌疑犯的聲紋數(shù)據(jù)如身份信息年齡、性別、口音地、體重、身高，以及聲紋的特征信息如說話的頻率、說話的幅度、說話的能量、等聲紋指標(biāo)參數(shù); 比對(duì)調(diào)準(zhǔn)引擎5，與第一聲紋數(shù)據(jù)庫(kù)3和第二聲紋數(shù)據(jù)庫(kù)4連接，用于設(shè)定第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)中的嫌疑犯的聲紋與輸入的現(xiàn)場(chǎng)錄音的聲紋進(jìn)行比對(duì)的條件，并在比對(duì)過程中實(shí)時(shí)調(diào)整比對(duì)條件。其中第一聲紋數(shù)據(jù)庫(kù)又稱為急用聲紋數(shù)據(jù)庫(kù)，在獲得現(xiàn)場(chǎng)錄音和嫌疑犯錄音后，可以立刻立案辨認(rèn)和確認(rèn)的數(shù)據(jù)庫(kù)；第二聲紋數(shù)據(jù)庫(kù)又稱為儲(chǔ)備數(shù) 據(jù)庫(kù)，在沒有現(xiàn)場(chǎng)錄音但有嫌疑犯的情況下，對(duì)嫌疑犯的聲紋進(jìn)行注冊(cè)備用。聲紋數(shù)據(jù)庫(kù)中詳細(xì)地保存著嫌疑犯的各種信息，如身份信息年齡、性別、口音地、體重、身高，以及聲紋的特征信息如說話的頻率、說話的幅度、說話的能量、等聲紋指標(biāo)參數(shù)。
如圖2所示，為本發(fā)明聲紋處理器2的結(jié)構(gòu)圖，包括降噪模塊21、切片模塊22、識(shí)別關(guān)鍵字模塊23、參數(shù)化模塊24、根據(jù)詞、字、聲母、韻母進(jìn)行建模的建模模塊25，將聲紋注冊(cè)進(jìn)第一或者第二數(shù)據(jù)庫(kù)中的注冊(cè)模塊26。降噪模塊21將獲得的錄音文件如現(xiàn)場(chǎng)錄音文件或嫌疑犯錄音文件如包含"這里是五街十號(hào)樓"的一個(gè)聲音文件進(jìn)行自動(dòng)降噪，然后將降噪后的文件發(fā)送給切片模塊22進(jìn)行自動(dòng)切片如將"這里是五街十號(hào)樓"的聲音文件切出，將文件切片后根據(jù)關(guān)鍵字如"五街十號(hào)樓"對(duì)切片的文件進(jìn)行自動(dòng)關(guān)鍵字識(shí)別，選擇關(guān)鍵字的準(zhǔn)則是選擇5-8個(gè)字且沒有兩個(gè)以上重復(fù)的字，根據(jù)由參數(shù)化模塊將包含關(guān)鍵字的切片文件進(jìn)行參數(shù)化，建模模塊25根據(jù)詞、字、聲母、韻母進(jìn)行建模，從而獲得聲紋，由注冊(cè)模塊注冊(cè)進(jìn)第一或第二聲紋數(shù)據(jù)庫(kù)。
參見圖3所示，本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例2的結(jié)構(gòu)圖，該系統(tǒng)還包括確認(rèn)模型庫(kù)，用于提供確認(rèn)通用標(biāo)準(zhǔn)；排査處理器6，用于輸入現(xiàn)場(chǎng)錄音以及案號(hào)，聲紋處理器從在第一聲紋數(shù)據(jù)庫(kù)中根據(jù)案號(hào)找出相應(yīng)的嫌疑犯聲紋，對(duì)該嫌疑犯聲紋與輸入的現(xiàn)場(chǎng)錄音經(jīng)過聲紋處理器處理后的聲紋，根據(jù)確認(rèn) 模型庫(kù)進(jìn)行比對(duì)以確認(rèn)該現(xiàn)場(chǎng)錄音為該嫌疑人所說。該過程即稱之為確認(rèn)過程如圖5所示，即包括以下步驟
步驟3h聲紋處理器獲取現(xiàn)場(chǎng)錄音，并將之處理成第一聲紋，也稱之為已知聲紋；其中錄音如圖2所示的那樣進(jìn)行聲紋處理；如在本鈳中是采用的聲母建模；如將現(xiàn)場(chǎng)錄音的一段話"這里是五街十號(hào)樓"、"明天早上七點(diǎn)準(zhǔn)時(shí) 見面"的中間5-8個(gè)字且沒有兩個(gè)以上重復(fù)的字如"里是五街十號(hào)"和"早上七點(diǎn)準(zhǔn)時(shí)見面"進(jìn)行聲紋處理；
步驟32:聲紋處理器獲取嫌疑人如張三的聲音痕跡，并將之處理成第二聲紋，也稱之為聲稱聲紋；其中對(duì)嫌疑犯的聲音痕跡如圖2所示的那樣進(jìn)行聲紋處理；如在本例中是采用的聲母建模；即該嫌疑犯張三重復(fù)說現(xiàn)場(chǎng)錄音中的"里是五街十號(hào)"和"早上七點(diǎn)準(zhǔn)時(shí)見面"，并采集多次，對(duì)其同樣進(jìn)行聲紋處理；以及將若干個(gè)無相干人員如5個(gè)無關(guān)人員進(jìn)行采樣，采樣的原則是樣本要有一定的長(zhǎng)度如"這里是五街十號(hào)樓"(要求有連續(xù)的5-7個(gè)字的長(zhǎng) 度)、要文本有關(guān)，即要求采樣內(nèi)容和現(xiàn)場(chǎng)語音內(nèi)容一致如"這里是五街十號(hào)樓"、要多次采樣即嫌疑人要重復(fù)的說采樣內(nèi)容若干次；
步驟33，采樣結(jié)束后，將采樣的結(jié)果經(jīng)過降噪、剪切等處理后，輸入
到計(jì)算機(jī)中，通過包括特征提取和語音建模的嫌疑人模型計(jì)算，得到一個(gè) 確認(rèn)模型庫(kù)；
步驟34，將這個(gè)嫌疑人張三的聲紋特征和確認(rèn)模型庫(kù)進(jìn)行比對(duì)，將其和確認(rèn)模型庫(kù)的差別記錄后添加到聲紋數(shù)據(jù)庫(kù)中；
步驟35，將現(xiàn)場(chǎng)語音樣本和確認(rèn)模型庫(kù)進(jìn)行比對(duì)獲得差別，査看這個(gè)差別與存放在聲紋數(shù)據(jù)庫(kù)中的嫌疑人與確認(rèn)模型庫(kù)的差別的相似度，如完全近似則認(rèn)為現(xiàn)場(chǎng)錄音的這個(gè)人和嫌疑犯是同一個(gè)人即認(rèn)定同一，如果完全不相似，則得出結(jié)果是否定同一人，如果兩個(gè)差別有一定的相似即較多相似，則得出結(jié)果是傾向認(rèn)定同一人；如果兩個(gè)差別有一定的不相似即較多不相似，則得出的結(jié)果是傾向否定同一。
參見圖4所示，本發(fā)明聲紋鑒識(shí)系統(tǒng)實(shí)施例3還包括一個(gè)辨認(rèn)處理器7，以及辨認(rèn)模型庫(kù)8。辨認(rèn)模型庫(kù)8，用于提供辨認(rèn)通用標(biāo)準(zhǔn)，辨認(rèn)處理器7與第一、第二聲紋數(shù)據(jù)庫(kù)3和4以及世界模型庫(kù)8連接，用于根據(jù)邊界條件從第一和第二聲紋數(shù)據(jù)庫(kù)3和4中編寫世界模型庫(kù)8，并根據(jù)世界模型庫(kù)8中的各項(xiàng)指標(biāo)參數(shù)找出聲紋所對(duì)應(yīng)的嫌疑犯列表。該過程是根據(jù)現(xiàn)場(chǎng)錄音片段從聲紋數(shù)據(jù)庫(kù)中辨認(rèn)出說該錄音片段的說話者列表。辨識(shí)模型庫(kù)根據(jù)一定的輸入?yún)?shù)如性別、年齡、出生地從第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)中獲取的嫌疑人信息，辨識(shí)模型庫(kù)是第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)的子集。該過程即稱之為辨認(rèn)過程如圖6所示，即包括以下步驟
步驟41，獲取現(xiàn)場(chǎng)錄音片段如"這里是五街十號(hào)樓"，進(jìn)行降噪、剪切等基本處理將其處理成第三聲紋；
步驟42，根據(jù)現(xiàn)場(chǎng)錄音片段中的身份信息如說話者為男性、年齡在25-25 歲之間、口音為河南音從第一聲紋數(shù)據(jù)庫(kù)和第二聲紋數(shù)據(jù)庫(kù)中將符合這些輸入?yún)?shù)的犯罪嫌疑人信息導(dǎo)出，對(duì)嫌疑人進(jìn)行采樣假設(shè)有10個(gè)嫌疑人，此處僅為示例性并非限制，采樣的原則是樣本要有一定的長(zhǎng)度如"這里是五街十號(hào)樓"(要求有連續(xù)的5-7個(gè)字的長(zhǎng)度)、要文本有關(guān)，即要求采樣內(nèi)容和現(xiàn)場(chǎng)語音內(nèi)容一致如"這里是五街十號(hào)樓"、要多次采樣即嫌疑人要重復(fù)的說采樣內(nèi)容若干次；
步驟43，采樣結(jié)束后，將采樣的結(jié)果經(jīng)過降噪、剪切等處理后，輸入到計(jì)算機(jī)中，通過包括特征提取和語音建模的嫌疑人模型計(jì)算，得到一個(gè) 嫌疑人模型庫(kù)(具有這IO個(gè)人的普遍特征)即衡量這IO個(gè)嫌疑人聲紋特征的通用標(biāo)準(zhǔn)；
步驟44，將這IO個(gè)嫌疑人的聲紋特征分別和嫌疑人模型庫(kù)進(jìn)行比對(duì)，將其和嫌疑人模型庫(kù)的差別分別記錄后添加到聲紋數(shù)據(jù)庫(kù)中；
步驟45，將現(xiàn)場(chǎng)語音樣本和嫌疑人模型庫(kù)進(jìn)行比對(duì)，得到現(xiàn)場(chǎng)語音樣本和嫌疑人模型庫(kù)的差別，按照聲紋數(shù)據(jù)庫(kù)中10個(gè)嫌疑人和嫌疑人模型庫(kù)的差別與現(xiàn)場(chǎng)語音樣本和嫌疑人模型庫(kù)的差別的相似度進(jìn)行由高到低的排序，輸出辨認(rèn)結(jié)果得出嫌疑人列表。如張三的能量可信度如2.1、頻率可信度2.0、幅度可信度1.9，從而獲得該嫌疑人的辨別可信度為98%。第二嫌疑人李四的能量可信度如1.8、頻率可信度2.0、幅度可信度1.7，從而獲得該嫌疑人的辨別可信度為88%，第三嫌疑人王五的能量可信度如1.5、頻率可信度1.9、幅度可信度1.2，辨別可信度為76%，從而獲得一個(gè)列表，將這些嫌疑人按辨別可信度依次遞減進(jìn)行排列。因此，該排列表中排在第一的嫌疑犯具有最大嫌疑性。
其中，采用嫌疑人模型庫(kù)的優(yōu)點(diǎn)在于基于算法，在對(duì)語音樣本進(jìn)行采樣注冊(cè)后得到的是其和嫌疑人模型庫(kù)的差別。因此，在僅有兩個(gè)對(duì)象的時(shí) 候，不能以其中任何一個(gè)對(duì)象作為標(biāo)準(zhǔn)進(jìn)行比對(duì)，而是需要一定數(shù)量的對(duì) 象形成嫌疑人模型庫(kù)，在得到各對(duì)象與嫌疑人模型庫(kù)的差別后才可進(jìn)行比對(duì)。舉個(gè)例子來說，假設(shè)我們有甲、乙兩個(gè)對(duì)象要進(jìn)行比對(duì)，如果以甲為
標(biāo)準(zhǔn)即嫌疑人模型庫(kù)，那么甲和嫌疑人模型庫(kù)的差別就是0而乙和嫌疑人模型庫(kù)的差別必為一非o量(因?yàn)榧词故峭粋€(gè)人不同的兩次錄音也會(huì)存
在著一定的差別)，這樣就不能簡(jiǎn)單地說這個(gè)差別小于一個(gè)既定的數(shù)值之后，就判定兩個(gè)對(duì)象是同一個(gè)人。
其次就是在聲紋數(shù)據(jù)庫(kù)的建立時(shí)，采用的原則是盡可能的節(jié)省空間資源，如果每一個(gè)聲音樣本都記錄他所有的聲紋特征，這樣聲紋數(shù)據(jù)庫(kù)將十分的龐大，浪費(fèi)資源。相反采用嫌疑人模型庫(kù)，只需要記錄下語音樣本和嫌疑人模型庫(kù)的差別即可，相同的部分就省略了，達(dá)到節(jié)省資源的目的。
最后所應(yīng)說明的是，以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制，盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng) 理解，可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換，而不脫離本發(fā)明技術(shù)方案的精神和范圍，其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1. 一種數(shù)字聲紋鑒定系統(tǒng)，其特征在于包括多個(gè)采集器，用于采集嫌疑犯的聲音痕跡；聲紋處理器，與多個(gè)采集器連接，用于將所述采集器采集到的聲音痕跡或現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、建模等處理獲得聲紋數(shù)據(jù)并對(duì)聲音痕跡建立案號(hào)進(jìn)行注冊(cè)；聲紋數(shù)據(jù)庫(kù)，與聲紋處理器連接，用于存儲(chǔ)注冊(cè)的與案號(hào)相關(guān)的處理后的嫌疑犯的聲紋的特征信息；比對(duì)調(diào)準(zhǔn)引擎，與聲紋數(shù)據(jù)庫(kù)連接，用于設(shè)定聲紋數(shù)據(jù)庫(kù)的聲紋與輸入的現(xiàn)場(chǎng)錄音的聲紋進(jìn)行比對(duì)條件，并在比對(duì)過程中實(shí)時(shí)調(diào)整比對(duì)條件。
2. 根據(jù)權(quán)利要求1所述的數(shù)字聲紋鑒定系統(tǒng)，其特征在于所述聲紋處理器包括降噪模塊，用于對(duì)現(xiàn)場(chǎng)錄音和聲音痕跡進(jìn)行自動(dòng)降噪；切片模塊，用于接收所述降噪模塊發(fā)送的降噪后的文件自動(dòng)切片；識(shí)別關(guān)鍵字模塊，用于接收所述切片模塊發(fā)送的切片后的文件選擇5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段；參數(shù)化模塊，用于接收識(shí)別出的關(guān)鍵字段進(jìn)行參數(shù)化；建模模塊，用于對(duì)經(jīng)過參數(shù)化的關(guān)鍵字段根據(jù)詞、字、聲母、韻母進(jìn)行建模從而獲得聲紋；注冊(cè)模塊，將所述建模模塊建模獲得的聲紋注冊(cè)進(jìn)聲紋數(shù)據(jù)庫(kù)。
3. 根據(jù)權(quán)利要求2所述的數(shù)字聲紋鑒定系統(tǒng)，其特征在于還包括確認(rèn)模型庫(kù)，用于提供確認(rèn)通用標(biāo)準(zhǔn)；排査處理器，用于輸入現(xiàn)場(chǎng)錄音以及案號(hào)，從在聲紋數(shù)據(jù)庫(kù)中根據(jù)案號(hào) 找出相應(yīng)的嫌疑犯聲紋，對(duì)該嫌疑犯聲紋與輸入的現(xiàn)場(chǎng)錄音經(jīng)過聲紋處理器處理后的聲紋，根據(jù)確認(rèn)模型庫(kù)進(jìn)行比對(duì)以確認(rèn)該現(xiàn)場(chǎng)錄音為該嫌疑人所說。
4. 根據(jù)權(quán)利要求3所述的數(shù)字聲紋鑒定系統(tǒng)，其特征在于還包括辨認(rèn)模型庫(kù)，用于提供辨認(rèn)通用標(biāo)準(zhǔn)；；辨認(rèn)處理器，用于根據(jù)邊界條件從聲紋數(shù)據(jù)庫(kù)中編寫辨認(rèn)模型庫(kù)，并根據(jù)辨認(rèn)模型庫(kù)中的聲紋數(shù)據(jù)找出嫌疑犯列表。
5. —種刑事鑒識(shí)身份的確認(rèn)方法，其特征在于包括對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第一聲紋特征；獲取與現(xiàn)場(chǎng)錄音相同內(nèi)容的聲音痕跡，對(duì)其進(jìn)行聲紋處理獲得第二聲紋數(shù)據(jù)；獲取多個(gè)第三聲紋特征，并將所述第二聲紋特征和所述多個(gè)第三聲紋特征通過計(jì)算獲得確認(rèn)模型庫(kù)；將所述第二聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì)，并將獲得的第一差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中；將所述第一聲紋特征和所述確認(rèn)模型庫(kù)進(jìn)行比對(duì)獲得第二差別，確定第一差別和第二差別的相似度。
6. 根據(jù)權(quán)利要求5所述的確認(rèn)方法，其特性在于所述進(jìn)行聲紋處理包括對(duì)現(xiàn)場(chǎng)錄音或聲音痕跡進(jìn)行降噪、切片、選擇5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù)化后，根據(jù)詞、字、聲母、韻母進(jìn)行建模從而獲得第一聲紋數(shù)據(jù) 或第二聲紋數(shù)據(jù)。
7. —種刑事鑒識(shí)身份的辨認(rèn)方法，其特性在于包括對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第三聲紋數(shù)據(jù)；根據(jù)所述現(xiàn)場(chǎng)錄音中的身份信息從數(shù)據(jù)庫(kù)中獲取滿足這些邊界條件的嫌疑犯編寫辨識(shí)模型庫(kù)；將采樣的所述嫌疑犯聲紋特征與辨認(rèn)模型庫(kù)進(jìn)行比對(duì)，記錄第一差別，并將該差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中；將第三聲紋特征和所述辨認(rèn)模型庫(kù)進(jìn)行比對(duì)得到第二差別；將該第一差別和所述第二差別進(jìn)行相似度的排序輸出辨認(rèn)結(jié)果。
8. 根據(jù)權(quán)利要求7所述的確認(rèn)方法，其特性在于所述進(jìn)行聲紋處理包括:對(duì)現(xiàn)場(chǎng)錄音進(jìn)行降噪、切片、選擇5-8個(gè)沒有兩個(gè)字重復(fù)的關(guān)鍵字段進(jìn)行參數(shù) 化后，根據(jù)詞、字、聲母、韻母進(jìn)行建模從而獲得聲紋數(shù)據(jù)。
全文摘要
本發(fā)明公開了一種數(shù)字聲紋鑒定系統(tǒng)，包括多個(gè)采集器；聲紋處理器，與多個(gè)采集器連接；聲紋數(shù)據(jù)庫(kù)，與聲紋處理器連接；比對(duì)調(diào)準(zhǔn)引擎，與聲紋數(shù)據(jù)庫(kù)連接。本發(fā)明還提供了刑事鑒識(shí)身份的確認(rèn)方法，對(duì)現(xiàn)場(chǎng)錄音進(jìn)行聲紋處理獲得第一聲紋特征；獲得第二聲紋數(shù)據(jù)；計(jì)算獲得確認(rèn)模型庫(kù)；比對(duì)，并將獲得的第一差別存儲(chǔ)在聲紋數(shù)據(jù)庫(kù)中；確定第一差別和第二差別的相似度。本發(fā)明還提供了刑事鑒識(shí)身份的辨認(rèn)方法，處理獲得第三聲紋數(shù)據(jù)；根據(jù)所述現(xiàn)場(chǎng)錄音中的身份信息編寫辨識(shí)模型庫(kù)；將采樣的所述嫌疑犯聲紋特征與辨認(rèn)模型庫(kù)進(jìn)行比對(duì)，記錄第一差別；將第三聲紋特征和所述辨認(rèn)模型庫(kù)進(jìn)行比對(duì)得到第二差別；將該第一差別和所述第二差別進(jìn)行相似度的排序輸出辨認(rèn)結(jié)果。
文檔編號(hào)G10L17/00GK101447188SQ20071017814
公開日2009年6月3日申請(qǐng)日期2007年11月27日優(yōu)先權(quán)日2007年11月27日
發(fā)明者約翰·葉, 里奧納德·程申請(qǐng)人:北京金運(yùn)昭德數(shù)字科技有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：約翰.葉;里奧納德.程
技術(shù)所有人：北京金運(yùn)昭德數(shù)字科技有限公司
我是此專利的發(fā)明人

上一篇：一種單音旋律曲線的匹配方法
上一篇：語音識(shí)別終端用戶身份的方法及終端的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

聲紋鑒定相關(guān)技術(shù)

智能聲紋鑒定工作站相關(guān)技術(shù)

聲紋鑒定方法相關(guān)技術(shù)

聲紋識(shí)別相關(guān)技術(shù)

聲紋相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)字聲紋鑒定系統(tǒng)及確認(rèn)和辨認(rèn)方法