語料數(shù)據(jù)的查詢方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種語料數(shù)據(jù)的查詢方法和裝置。其中,該語料數(shù)據(jù)的查詢方法包括:獲取用戶的第一聲紋模型;從語料數(shù)據(jù)庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型;根據(jù)語料數(shù)據(jù)庫中預先存儲的預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系,獲取與第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù);以及將第一語料數(shù)據(jù)發(fā)送給用戶。通過本發(fā)明,解決了現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題,進而達到了提高查找語料數(shù)據(jù)的效率的效果。
【專利說明】語料數(shù)據(jù)的查詢方法和裝置
【技術領域】
[0001]本發(fā)明涉及多媒體領域,具體而言,涉及一種語料數(shù)據(jù)的查詢方法和裝置。
【背景技術】
[0002] 隨著多媒體技術的不斷發(fā)展和進步,越來越多的語料數(shù)據(jù)產(chǎn)生并存儲。在需要調(diào) 用這些語料數(shù)據(jù)時,需要在存儲的文件中按照語料數(shù)據(jù)的文件名逐個比對查找,對于大量 的語料數(shù)據(jù)來說,通過逐個對比文件名的方式查找語料數(shù)據(jù)的方式顯然效率比較低。另外, 通過文件名查找語料數(shù)據(jù)的方法在文件名的命名規(guī)則不規(guī)范時,無法準確查找到相應的語 料數(shù)據(jù),甚至無法查找到語料數(shù)據(jù)。
[0003] 針對現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題,目前尚未提出有效的解決方 案。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的主要目的在于提供一種語料數(shù)據(jù)的查詢方法和裝置,以解決現(xiàn)有技術中 查找語料數(shù)據(jù)的效率比較低的問題。
[0005] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種語料數(shù)據(jù)的查詢方法。根 據(jù)本發(fā)明的語料數(shù)據(jù)的查詢方法包括:獲取用戶的第一聲紋模型;從語料數(shù)據(jù)庫的預存聲 紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型;根據(jù)所述語 料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系,獲取與所述第二聲紋模 型相關聯(lián)的第一語料數(shù)據(jù);以及將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
[0006] 進一步地,獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)包括:從所述語料數(shù) 據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標識;獲取與所述對象標識關聯(lián)的第 二語料數(shù)據(jù);以及將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù)據(jù)。
[0007] 進一步地,將所述第一語料數(shù)據(jù)發(fā)送給所述用戶包括:獲取所述對象標識的對象 信息;以及在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時,將所述對象信息發(fā)送給所述用戶。
[0008] 進一步地,從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的 聲紋模型,得到第二聲紋模型包括:利用后驗概率分別計算所述第一聲紋模型與所述預f 聲紋模型中的每個預存聲紋模型的相似度,得到多個相似度;比較所述多個相似^彳^^最 大相似度;以及將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第一尸紋 模型。 #
[0009] 進-步地,在原順獅麵存聲紋麵巾誠與難第-聲猶型的相匹^ 的聲紋模型之前,臟方法還包括:收集多個對象標砸指示的多個對細語料數(shù)據(jù)^獲 取所述多個對象的語料數(shù)據(jù)的聲紋模型,得到所述預存聲紋模型;以及建立所述預存聲紋 臟語料娜與臓鄉(xiāng)個雜_識趣1關聯(lián);提取與臟鄉(xiāng)頓脅V、巾每1對象標 V、 關聯(lián)的所有語料數(shù)據(jù)中每一幀語音信號的語音特征參數(shù);對提取到的所述每個對象標識的 語音特征參數(shù)進行訓練,得到屬于所述每個對象標識的聲紋模型;以及將屬于所述每個對 象標識的聲紋模型作為所述預存聲紋模型。
[0011] 進一步地,在建立所述預存聲紋模型與所述多個對象標識的對應關系之后,且獲 取用戶的第一聲紋模型之前,所述方法還包括:獲取第一對象的語料數(shù)據(jù);識別所述第一 對象的語料數(shù)據(jù)中的聲紋模型;從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹 配的聲紋模型;以及將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標 識。
[0012] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種語料數(shù)據(jù)的查詢裝置。根 據(jù)本發(fā)明的語料數(shù)據(jù)的查詢裝置包括:第一獲取單元,用于獲取用戶的第一聲紋模型;第 一查找單元,用于從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲 紋模型,得到第二聲紋模型;第二獲取單元,用于根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預 存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系,獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù);以 及發(fā)送單元,用于將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
[0013] 進一步地,所述第一獲取單元包括:查找模塊,用于從所述語料數(shù)據(jù)庫中查找與所 述第二聲紋模型具有映射關系的對象標識;第一獲取模塊,用于獲取與所述對象標識關聯(lián) 的第二語料數(shù)據(jù);以及第一確定模塊,用于將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作 為所述第一語料數(shù)據(jù)。
[0014] 進一步地,所述發(fā)送單元包括:第二獲取模塊,用于獲取所述對象標識的對象信 息;以及發(fā)送模塊,用于在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時,將所述對象信息發(fā)送給 所述用戶。
[0015] 進一步地,所述查找單元包括:計算模塊,用于利用后驗概率分別計算所述第一聲 紋模型與所述預存聲紋模型中的每個預存聲紋模型的相似度,得到多個相似度;比較模塊, 用于比較所述多個相似度,得到最大相似度;以及第二確定模塊,用于將所述預存聲紋模型 中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
[0016] 進一步地,所述裝置還包括:收集單元,用于在從語料數(shù)據(jù)庫的預存聲紋模型中查 找與所述第一聲紋模型的相匹配的聲紋模型之前,收集多個對象標識所指示的多個對象的 語料數(shù)據(jù);第三獲取單元,用于獲取所述多個對象的語料數(shù)據(jù)的聲紋模型,得到所述預存聲 紋模型;以及建立單元,用于建立所述預存聲紋模型與所述多個對象標識的對應關系。
[0017] 進一步地,所述第三獲取單元包括:關聯(lián)模塊,用于將所述語料數(shù)據(jù)與所述多個對 象的標識進行關聯(lián);提取模塊,用于提取與所述多個對象標識中每個對象標識關聯(lián)的所有 語料數(shù)據(jù)中每一幀語音信號的語音特征參數(shù);訓練模塊,用于對提取到的所述每個對象標 識的語音特征參數(shù)進行訓練,得到屬于所述每個對象標識的聲紋模型;以及第三確定模塊, 用于將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
[0018] 進一步地,所述裝置還包括:第四獲取單元,用于在建立所述預存聲紋模型與所述 多個對象標識的對應關系之后,且獲取用戶的第一聲紋模型之前,獲取第一對象的語料數(shù) 據(jù);識別單元,用于識別所述第一對象的語料數(shù)據(jù)中的聲紋模型;第二查找單元,用于從所 述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型;以及關聯(lián)單元,用于 將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標識。
[001幻通過本發(fā)明,在語料數(shù)據(jù)庫中保存第二聲紋模型以及第二聲紋模型與語料數(shù)據(jù)的 映 ?關?,因此,從語料數(shù)據(jù)庫中找到與第一聲紋模型匹配的第二聲紋模型,就能找到與第 二聲紋模型相關聯(lián)的語料數(shù)據(jù),從而找到與用戶的第一聲紋模型向匹配的所有語料數(shù)據(jù), 解決了現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題,進而達到了提高查找語料數(shù)據(jù)的效 率的效果。
【專利附圖】
【附圖說明】
[0020]構成本申請的一部分的附圖用來提供對本發(fā)明的進一步理解,本發(fā)明的示意性實 施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
[0021]圖1是根據(jù)本發(fā)明實施例的語料數(shù)據(jù)的查詢方法的流程圖;
[0022]圖2是根據(jù)本發(fā)明又一實施例的語料數(shù)據(jù)的查詢方法的流程圖;
[0023]圖3是根據(jù)本發(fā)明實施例的通過對象標識將語料數(shù)據(jù)表與對象信息表關聯(lián)的示 意圖;以及
[0024]圖4是根據(jù)本發(fā)明實施例的語料數(shù)據(jù)的查詢裝置的示意圖。
【具體實施方式】
[0025]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相 互組合。下面將參考附圖并結合實施例來詳細說明本發(fā)明。
[0026]為了使本【技術領域】的人員更好地理解本發(fā)明方案,下面將結合本發(fā)明實施例中的 附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發(fā)明一部分的實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術 人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本發(fā)明保護的范 圍。
[0027]需要說明的是,本發(fā)明的說明書和權利要求書及上述附圖中的術語"第一"、"第 二"等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用 的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或 描述的那些以外的順序?qū)嵤?。此外,術語"包括"和"具有"以及他們的任何變形,意圖在于 覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限 于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn) 品或設備固有的其它步驟或單元。
[0028] 本發(fā)明提供了一種語料數(shù)據(jù)的查找方法。圖1是根據(jù)本發(fā)明實施例的語料數(shù)據(jù)的 查找方法的流程圖。如圖所示,該語料數(shù)據(jù)的查找方法包括如下步驟:
[0029] 步驟S102,獲取用戶的第一聲紋模型;
[0030] 步驟S104,從語料數(shù)據(jù)庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋 模型,得到第二聲紋模型;
[0031] 步驟S106,根據(jù)語料數(shù)據(jù)庫中預先存儲的預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系, 獲取與第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù);以及
[0032] 步驟S108,將第一語料數(shù)據(jù)發(fā)送給用戶。
[0033] 語料數(shù)據(jù)庫中保存了第二聲紋模型以及第二聲紋模型與語料數(shù)據(jù)的映射關系,因 此,從語料數(shù)據(jù)庫中找到與第一聲紋模型匹配的第二聲紋模型,就能找到與第二聲紋模型 相關聯(lián)的語料數(shù)據(jù),從而找到與用戶的第一聲紋模型向匹配的所有語料數(shù)據(jù),提高了查找 語料數(shù)據(jù)的效率,并且能夠準確匹配到需要查找的語料數(shù)據(jù)。
[0034] 以下結合表1對本實施例進行說明。
[0035] 表 1
[0036]
【權利要求】
1. 一種語料數(shù)據(jù)的查詢方法,其特征在于,包括: 獲取用戶的第一聲紋模型; 從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型,得到 第二聲紋模型; 根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系,獲取與 所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù);以及 將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
2. 根據(jù)權利要求1所述的方法,其特征在于,獲取與所述第二聲紋模型相關聯(lián)的第一 語料數(shù)據(jù)包括: 從所述語料數(shù)據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標識; 獲取與所述對象標識關聯(lián)的第二語料數(shù)據(jù);以及 將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù)據(jù)。
3. 根據(jù)權利要求2所述的方法,其特征在于,將所述第一語料數(shù)據(jù)發(fā)送給所述用戶包 括: 獲取所述對象標識的對象信息;以及 在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時,將所述對象信息發(fā)送給所述用戶。
4. 根據(jù)權利要求1所述的方法,其特征在于,從語料數(shù)據(jù)庫的預存聲紋模型中查找與 所述第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型包括: 利用后驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每個預存聲紋模 型的相似度,得到多個相似度; 比較所述多個相似度,得到最大相似度;以及 將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
5. 根據(jù)權利要求1所述的方法,其特征在于,在從語料數(shù)據(jù)庫的預存聲紋模型中查找 與所述第一聲紋模型的相匹配的聲紋模型之前,所述方法還包括: 收集多個對象標識所指示的多個對象的語料數(shù)據(jù); 獲取所述多個對象的語料數(shù)據(jù)的聲紋模型,得到所述預存聲紋模型;以及 建立所述預存聲紋模型與所述多個對象標識的對應關系。
6. 根據(jù)權利要求5所述的方法,其特征在于,獲取多個對象的語料數(shù)據(jù)的聲紋模型,得 到所述預存聲紋模型包括: 將所述語料數(shù)據(jù)與所述多個對象的標識進行關聯(lián); 提取與所述多個對象標識中每個對象標識關聯(lián)的所有語料數(shù)據(jù)中每一幀語音信號的 語音特征參數(shù); 對提取到的所述每個對象標識的語音特征參數(shù)進行訓練,得到屬于所述每個對象標識 的聲紋模型;以及 將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
7. 根據(jù)權利要求5所述的方法,其特征在于,在建立所述預存聲紋模型與所述多個對 象標識的對應關系之后,且獲取用戶的第一聲紋模型之前,所述方法還包括: 獲取第一對象的語料數(shù)據(jù); 識別所述第一對象的語料數(shù)據(jù)中的聲紋模型; 從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型;以及 將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標識。
8. -種語料數(shù)據(jù)的查詢裝置,其特征在于,包括: 第一獲取單元,用于獲取用戶的第一聲紋模型; 第一查找單元,用于從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹 配的聲紋模型,得到第二聲紋模型; 第二獲取單元,用于根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù) 的關聯(lián)關系,獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù);以及 發(fā)送單元,用于將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
9. 根據(jù)權利要求8所述的裝置,其特征在于,所述第一獲取單元包括: 查找模塊,用于從所述語料數(shù)據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標 識; 第一獲取模塊,用于獲取與所述對象標識關聯(lián)的第二語料數(shù)據(jù);以及 第一確定模塊,用于將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù) 據(jù)。
10. 根據(jù)權利要求9所述的裝置,其特征在于,所述發(fā)送單元包括: 第二獲取模塊,用于獲取所述對象標識的對象信息;以及 發(fā)送模塊,用于在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時,將所述對象信息發(fā)送給所 述用戶。
11. 根據(jù)權利要求8所述的裝置,其特征在于,所述查找單元包括: 計算模塊,用于利用后驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每 個預存聲紋模型的相似度,得到多個相似度; 比較模塊,用于比較所述多個相似度,得到最大相似度;以及 第二確定模塊,用于將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述 第二聲紋模型。
12. 根據(jù)權利要求8所述的裝置,其特征在于,所述裝置還包括: 收集單元,用于在從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配 的聲紋模型之前,收集多個對象標識所指示的多個對象的語料數(shù)據(jù); 第三獲取單元,用于獲取所述多個對象的語料數(shù)據(jù)的聲紋模型,得到所述預存聲紋模 型;以及 建立單元,用于建立所述預存聲紋模型與所述多個對象標識的對應關系。
13. 根據(jù)權利要求12所述的裝置,其特征在于,所述第三獲取單元包括: 關聯(lián)模塊,用于將所述語料數(shù)據(jù)與所述多個對象的標識進行關聯(lián); 提取模塊,用于提取與所述多個對象標識中每個對象標識關聯(lián)的所有語料數(shù)據(jù)中每一 幀語音信號的語音特征參數(shù); 訓練模塊,用于對提取到的所述每個對象標識的語音特征參數(shù)進行訓練,得到屬于所 述每個對象標識的聲紋模型;以及 第三確定模塊,用于將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
14. 根據(jù)權利要求12所述的裝置,其特征在于,所述裝置還包括: 第四獲取單元,用于在建立所述預存聲紋模型與所述多個對象標識的對應關系之后, 且獲取用戶的第一聲紋模型之前,獲取第一對象的語料數(shù)據(jù); 識別單元,用于識別所述第一對象的語料數(shù)據(jù)中的聲紋模型; 第二查找單元,用于從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲 紋模型;以及 關聯(lián)單元,用于將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標 識。
【文檔編號】G10L17/00GK104268279SQ201410549904
【公開日】2015年1月7日 申請日期:2014年10月16日 優(yōu)先權日:2014年10月16日
【發(fā)明者】張征, 張爍 申請人:魔方天空科技(北京)有限公司