一種基于聲紋識(shí)別的數(shù)據(jù)獲取方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及聲紋識(shí)別領(lǐng)域,并且更具體地,涉及一種基于聲紋識(shí)別的數(shù)據(jù)獲取方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著與終端設(shè)備相關(guān)的信息技術(shù)的日益發(fā)展,用戶對(duì)于通過終端設(shè)備進(jìn)行數(shù)據(jù)獲取的需求越來越大。通常,用戶可以在終端設(shè)備處輸入要訪問的數(shù)據(jù)的地址,從而獲取數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行處理;或者用戶可以在終端設(shè)備搜索相關(guān)數(shù)據(jù)從而獲取數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行處理。由于上述方式均需要用戶在終端設(shè)備上進(jìn)行手動(dòng)輸入,而當(dāng)用戶處于忙碌狀態(tài)(例如,駕駛車輛)時(shí),通常無法進(jìn)行有效輸入。此外,當(dāng)用戶聽到某段語(yǔ)音,想獲得與這段語(yǔ)音相關(guān)的數(shù)據(jù)時(shí),通過上述方式無法獲取數(shù)據(jù)內(nèi)容。因此,需要將聲紋識(shí)別技術(shù)應(yīng)用到數(shù)據(jù)獲取和處理的過程中。
[0003]目前,聲紋識(shí)別技術(shù)廣泛應(yīng)用于諸如汽車導(dǎo)航、密碼認(rèn)證、智能設(shè)備等領(lǐng)域。聲紋是指通過專用的電聲轉(zhuǎn)換儀器(聲譜儀、語(yǔ)圖儀等)將聲波特征繪制成的波譜圖形。聲紋可以是各種聲學(xué)特征圖譜的集合。聲紋是人類長(zhǎng)期穩(wěn)定的特征信號(hào)。聲紋識(shí)別是把未知人的語(yǔ)音數(shù)據(jù)(檢材)與已知人的語(yǔ)音數(shù)據(jù)(樣本)分別通過電聲轉(zhuǎn)換儀器繪成聲紋圖譜,再根據(jù)圖譜上的語(yǔ)音聲學(xué)特征進(jìn)行比較和綜合分析,以得出兩者是否相同的判斷過程。
[0004]聲紋識(shí)別廣義上分為兩種:語(yǔ)音識(shí)別和說話人識(shí)別。語(yǔ)音識(shí)別是根據(jù)說話人的發(fā)音辨認(rèn)其所說的語(yǔ)音、音節(jié)、單詞或單句。語(yǔ)音識(shí)別需要排除不同說話人的個(gè)人聲音特色,確定代表各個(gè)語(yǔ)音單位的共性特征。說話人識(shí)別是根據(jù)語(yǔ)音來辨認(rèn)說話人,而通常不考慮聲音的內(nèi)容和意義。說話人識(shí)別需要分離出每個(gè)個(gè)體的聲音特性。語(yǔ)音識(shí)別是當(dāng)前確認(rèn)語(yǔ)音數(shù)據(jù)的文本內(nèi)容的主要方式。說話人識(shí)別是當(dāng)前生物信息認(rèn)證方式中的一種主流方式,并且通常包括文本相關(guān)以及文本無關(guān)兩種聲紋識(shí)別方式,即,說話人識(shí)別包括說話人辨認(rèn)和說話人確認(rèn)兩個(gè)方面。說話人辨認(rèn)是一對(duì)多的分析過程,即判斷出某段語(yǔ)音是若干人中哪一個(gè)所說。說話人確認(rèn)是一對(duì)一的確定過程,即確認(rèn)某段語(yǔ)音是否屬于指定的某人。聲紋識(shí)別通常也都包括訓(xùn)練、校驗(yàn)兩個(gè)步驟。聲紋識(shí)別的核心是預(yù)先錄入聲音樣本,并提取每個(gè)樣本獨(dú)一無二的特征,建立特征數(shù)據(jù)庫(kù),并且在使用時(shí)將待檢聲音與數(shù)據(jù)庫(kù)中的特征進(jìn)行匹配,通過分析計(jì)算,實(shí)現(xiàn)說話人識(shí)別。然而,在實(shí)際應(yīng)用中,文本無關(guān)型的聲紋識(shí)別方式由于識(shí)別結(jié)果的不確定性,通常要和其他的生物特征認(rèn)證方式共同使用,很難作為一種獨(dú)立的檢測(cè)方式,由此也限制了其使用的范圍。
[0005]為此,需要一種能夠利用穩(wěn)定識(shí)別技術(shù)的數(shù)據(jù)獲取方法及系統(tǒng)。
【發(fā)明內(nèi)容】
[0006]為了解決上述問題,根據(jù)本發(fā)明的一個(gè)方面,提供一種基于聲紋識(shí)別的數(shù)據(jù)獲取系統(tǒng),所述數(shù)據(jù)獲取系統(tǒng)包括:
[0007]用戶終端,接收待識(shí)別的語(yǔ)音數(shù)據(jù)并且對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音格式預(yù)處理,從經(jīng)過語(yǔ)音格式預(yù)處理的音頻數(shù)據(jù)提取語(yǔ)音特征,將所提取的語(yǔ)音特征組成語(yǔ)音特征集合;
[0008]對(duì)待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行關(guān)鍵詞識(shí)別,獲得一個(gè)或多個(gè)關(guān)鍵詞,根據(jù)所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)從識(shí)別服務(wù)器接收的識(shí)別對(duì)象集合中的每個(gè)識(shí)別對(duì)象的匹配度進(jìn)行加權(quán),根據(jù)加權(quán)后的匹配度確定目標(biāo)對(duì)象,并且獲取與所確定的目標(biāo)對(duì)象相對(duì)應(yīng)的數(shù)據(jù);以及
[0009]識(shí)別服務(wù)器,根據(jù)用戶終端發(fā)送的語(yǔ)音特征集合中的所有語(yǔ)音特征與語(yǔ)音模型進(jìn)行匹配,確定所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別對(duì)象集合,其中在識(shí)別對(duì)象集合中按照匹配度遞減的順序?qū)ψR(shí)別對(duì)象進(jìn)行排序。
[0010]優(yōu)選地,其中用戶終端對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音格式預(yù)處理包括:利用預(yù)處理單元對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行分割以生成多個(gè)語(yǔ)音片段;對(duì)多個(gè)語(yǔ)音片段進(jìn)行寬窄帶判別,對(duì)判別為寬帶信號(hào)的語(yǔ)音片段添加寬帶標(biāo)識(shí),對(duì)判別為窄帶信號(hào)的語(yǔ)音片段添加窄帶標(biāo)識(shí);以及對(duì)添加了寬帶標(biāo)識(shí)或窄帶標(biāo)識(shí)的語(yǔ)音片段進(jìn)行音頻特征提取,得到特征數(shù)據(jù)。
[0011]優(yōu)選地,其中所述特征數(shù)據(jù)包括語(yǔ)音片段的起始時(shí)間、語(yǔ)音特征和音頻文件名稱。
[0012]優(yōu)選地,其中識(shí)別服務(wù)器根據(jù)用戶終端發(fā)送的語(yǔ)音特征集合中的所有語(yǔ)音特征與語(yǔ)音模型進(jìn)行匹配,確定所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別對(duì)象集合包括:
[0013]識(shí)別服務(wù)器從用戶終端接收語(yǔ)音特征集合,并且將語(yǔ)音特征集合中的所有語(yǔ)音特征與預(yù)先存儲(chǔ)的語(yǔ)音模型進(jìn)行匹配,根據(jù)匹配度確定與所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)識(shí)別對(duì)象,將所述至少一個(gè)識(shí)別對(duì)象組成識(shí)別對(duì)象集合。
[0014]可替換地,將語(yǔ)音特征集合傳送至用戶終端的匹配單元,用戶終端的匹配單元將語(yǔ)音特征集合中的所有語(yǔ)音特征與預(yù)先存儲(chǔ)的語(yǔ)音模型進(jìn)行匹配,根據(jù)匹配度確定與所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)識(shí)別對(duì)象,將所述至少一個(gè)識(shí)別對(duì)象組成識(shí)別對(duì)象集入口 ο
[0015]優(yōu)選地,其中用戶終端根據(jù)所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)識(shí)別對(duì)象集合中的每個(gè)識(shí)別對(duì)象的匹配度進(jìn)行加權(quán),根據(jù)加權(quán)后的匹配度確定目標(biāo)對(duì)象包括:用戶終端的目標(biāo)對(duì)象確定單元根據(jù)所述一個(gè)或多個(gè)關(guān)鍵詞在相關(guān)度數(shù)據(jù)庫(kù)中進(jìn)行搜索,確定待識(shí)別的語(yǔ)音數(shù)據(jù)與識(shí)別對(duì)象集合中每個(gè)識(shí)別對(duì)象的相關(guān)度,根據(jù)所述相關(guān)度對(duì)每個(gè)識(shí)別對(duì)象的匹配度進(jìn)行加權(quán),根據(jù)加權(quán)后的匹配度確定目標(biāo)對(duì)象。
[0016]優(yōu)選地,其中用戶終端獲取與所確定的目標(biāo)對(duì)象相對(duì)應(yīng)的數(shù)據(jù)包括:用戶終端的數(shù)據(jù)獲取單元根據(jù)關(guān)聯(lián)規(guī)則確定與所述目標(biāo)對(duì)象相對(duì)應(yīng)的數(shù)據(jù)內(nèi)容并且將針對(duì)數(shù)據(jù)內(nèi)容的請(qǐng)求發(fā)送至內(nèi)容服務(wù)器,從內(nèi)容服務(wù)器獲取所述數(shù)據(jù)內(nèi)容。
[0017]根據(jù)另一方面,提供一種基于聲紋識(shí)別的數(shù)據(jù)獲取方法,所述數(shù)據(jù)獲取方法包括:
[0018]接收待識(shí)別的語(yǔ)音數(shù)據(jù);
[0019]對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音格式預(yù)處理;
[0020]從經(jīng)過語(yǔ)音格式預(yù)處理的音頻數(shù)據(jù)提取語(yǔ)音特征,將所提取的語(yǔ)音特征組成語(yǔ)音特征集合;
[0021]根據(jù)語(yǔ)音特征集合中的所有語(yǔ)音特征與語(yǔ)音模型進(jìn)行匹配,確定所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別對(duì)象集合,其中在識(shí)別對(duì)象集合中按照匹配度遞減的順序?qū)ψR(shí)別對(duì)象進(jìn)tx排序;
[0022]對(duì)待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行關(guān)鍵詞識(shí)別,獲得一個(gè)或多個(gè)關(guān)鍵詞;
[0023]根據(jù)所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)識(shí)別對(duì)象集合中的每個(gè)識(shí)別對(duì)象的匹配度進(jìn)行加權(quán),根據(jù)加權(quán)后的匹配度確定目標(biāo)對(duì)象;以及
[0024]獲取與所確定的目標(biāo)對(duì)象相對(duì)應(yīng)的數(shù)據(jù)。
[0025]優(yōu)選地,其中對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音格式預(yù)處理包括:
[0026]對(duì)所述待識(shí)別的語(yǔ)音數(shù)據(jù)進(jìn)行分割以生成多個(gè)語(yǔ)音片段;
[0027]對(duì)多個(gè)語(yǔ)音片段進(jìn)行寬窄帶判別,對(duì)判別為寬帶信號(hào)的語(yǔ)音片段添加寬帶標(biāo)識(shí),對(duì)判別為窄帶信號(hào)的語(yǔ)音片段添加窄帶標(biāo)識(shí);
[0028]對(duì)添加了寬帶標(biāo)識(shí)或窄帶標(biāo)識(shí)的語(yǔ)音片段進(jìn)行音頻特征提取,得到特征數(shù)據(jù)。
[0029]優(yōu)選地,所述特征數(shù)據(jù)包括語(yǔ)音片段的起始時(shí)間、語(yǔ)音特征和音頻文件名稱。
[0030]優(yōu)選地,其中根據(jù)語(yǔ)音特征集合中的所有語(yǔ)音特征與語(yǔ)音模型進(jìn)行匹配,確定所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別對(duì)象集合包括:
[0031]將語(yǔ)音特征集合發(fā)送至識(shí)別服務(wù)器,識(shí)別服務(wù)器將語(yǔ)音特征集合中的所有語(yǔ)音特征與預(yù)先存儲(chǔ)的語(yǔ)音模型進(jìn)行匹配,根據(jù)匹配度確定與所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)識(shí)別對(duì)象,將所述至少一個(gè)識(shí)別對(duì)象組成識(shí)別對(duì)象集合。
[0032]可替換地,將語(yǔ)音特征集合發(fā)送至終端設(shè)備的匹配單元,終端設(shè)備的匹配單元將語(yǔ)音特征集合中的所有語(yǔ)音特征與預(yù)先存儲(chǔ)的語(yǔ)音模型進(jìn)行匹配,根據(jù)匹配度確定與所述待識(shí)別的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)識(shí)別對(duì)象,將所述至少一個(gè)識(shí)別對(duì)象組成識(shí)別對(duì)象集入口 ο
[0033]優(yōu)選地,其中根據(jù)所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)識(shí)別對(duì)象集合中的每個(gè)識(shí)別對(duì)象的匹配度進(jìn)行加權(quán),根據(jù)加權(quán)后的匹配度確定目標(biāo)對(duì)象包括:根據(jù)所述一個(gè)或多個(gè)關(guān)鍵詞在相關(guān)度數(shù)據(jù)庫(kù)中進(jìn)行搜索,確定待識(shí)別的語(yǔ)音數(shù)據(jù)與從所述識(shí)別服務(wù)器獲取的識(shí)別對(duì)象集合中每個(gè)識(shí)別對(duì)象的相關(guān)度,根據(jù)所述相關(guān)度對(duì)每個(gè)識(shí)別對(duì)象的匹配度進(jìn)行加權(quán),根據(jù)加權(quán)后的匹配度確定目標(biāo)對(duì)象。
[0034]優(yōu)選地,其中獲取與所確定的目標(biāo)對(duì)象相對(duì)應(yīng)的數(shù)據(jù)包括:根據(jù)關(guān)聯(lián)規(guī)則確定與所述目標(biāo)對(duì)象相對(duì)應(yīng)的數(shù)據(jù)內(nèi)容并且將針對(duì)數(shù)據(jù)內(nèi)容的請(qǐng)求發(fā)送至內(nèi)容服務(wù)器,從內(nèi)容服務(wù)器獲取所述數(shù)據(jù)內(nèi)容。
[0035]根據(jù)本發(fā)明的基于聲紋識(shí)別的數(shù)據(jù)獲取方法及系統(tǒng)通過關(guān)鍵字對(duì)聲紋識(shí)別的初步結(jié)果進(jìn)行