語料數(shù)據(jù)的查詢方法和裝置制造方法

文檔序號：2827967閱讀：234來源：國知局

語料數(shù)據(jù)的查詢方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種語料數(shù)據(jù)的查詢方法和裝置。其中，該語料數(shù)據(jù)的查詢方法包括：獲取用戶的第一聲紋模型；從語料數(shù)據(jù)庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型；根據(jù)語料數(shù)據(jù)庫中預先存儲的預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系，獲取與第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)；以及將第一語料數(shù)據(jù)發(fā)送給用戶。通過本發(fā)明，解決了現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題，進而達到了提高查找語料數(shù)據(jù)的效率的效果。
【專利說明】語料數(shù)據(jù)的查詢方法和裝置

【技術領域】
[0001]本發(fā)明涉及多媒體領域，具體而言，涉及一種語料數(shù)據(jù)的查詢方法和裝置。

【背景技術】
[0002] 隨著多媒體技術的不斷發(fā)展和進步，越來越多的語料數(shù)據(jù)產(chǎn)生并存儲。在需要調(diào) 用這些語料數(shù)據(jù)時，需要在存儲的文件中按照語料數(shù)據(jù)的文件名逐個比對查找，對于大量的語料數(shù)據(jù)來說，通過逐個對比文件名的方式查找語料數(shù)據(jù)的方式顯然效率比較低。另外，通過文件名查找語料數(shù)據(jù)的方法在文件名的命名規(guī)則不規(guī)范時，無法準確查找到相應的語料數(shù)據(jù)，甚至無法查找到語料數(shù)據(jù)。
[0003] 針對現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題，目前尚未提出有效的解決方案。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的主要目的在于提供一種語料數(shù)據(jù)的查詢方法和裝置，以解決現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題。
[0005] 為了實現(xiàn)上述目的，根據(jù)本發(fā)明的一個方面，提供了一種語料數(shù)據(jù)的查詢方法。根據(jù)本發(fā)明的語料數(shù)據(jù)的查詢方法包括：獲取用戶的第一聲紋模型；從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型；根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系，獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)；以及將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
[0006] 進一步地，獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)包括：從所述語料數(shù) 據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標識；獲取與所述對象標識關聯(lián)的第二語料數(shù)據(jù)；以及將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù)據(jù)。
[0007] 進一步地，將所述第一語料數(shù)據(jù)發(fā)送給所述用戶包括：獲取所述對象標識的對象信息；以及在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時，將所述對象信息發(fā)送給所述用戶。
[0008] 進一步地，從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型包括：利用后驗概率分別計算所述第一聲紋模型與所述預f 聲紋模型中的每個預存聲紋模型的相似度，得到多個相似度；比較所述多個相似^彳^^最大相似度；以及將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第一尸紋模型。 #
[0009] 進-步地，在原順獅麵存聲紋麵巾誠與難第-聲猶型的相匹^ 的聲紋模型之前，臟方法還包括：收集多個對象標砸指示的多個對細語料數(shù)據(jù)^獲取所述多個對象的語料數(shù)據(jù)的聲紋模型，得到所述預存聲紋模型；以及建立所述預存聲紋臟語料娜與臓鄉(xiāng)個雜_識趣1關聯(lián)；提取與臟鄉(xiāng)頓脅V、巾每1對象標 V、關聯(lián)的所有語料數(shù)據(jù)中每一幀語音信號的語音特征參數(shù)；對提取到的所述每個對象標識的語音特征參數(shù)進行訓練，得到屬于所述每個對象標識的聲紋模型；以及將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
[0011] 進一步地，在建立所述預存聲紋模型與所述多個對象標識的對應關系之后，且獲取用戶的第一聲紋模型之前，所述方法還包括：獲取第一對象的語料數(shù)據(jù)；識別所述第一對象的語料數(shù)據(jù)中的聲紋模型；從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型；以及將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標識。
[0012] 為了實現(xiàn)上述目的，根據(jù)本發(fā)明的另一方面，提供了一種語料數(shù)據(jù)的查詢裝置。根據(jù)本發(fā)明的語料數(shù)據(jù)的查詢裝置包括：第一獲取單元，用于獲取用戶的第一聲紋模型；第一查找單元，用于從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型；第二獲取單元，用于根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系，獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)；以及發(fā)送單元，用于將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
[0013] 進一步地，所述第一獲取單元包括：查找模塊，用于從所述語料數(shù)據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標識；第一獲取模塊，用于獲取與所述對象標識關聯(lián) 的第二語料數(shù)據(jù)；以及第一確定模塊，用于將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù)據(jù)。
[0014] 進一步地，所述發(fā)送單元包括：第二獲取模塊，用于獲取所述對象標識的對象信息；以及發(fā)送模塊，用于在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時，將所述對象信息發(fā)送給所述用戶。
[0015] 進一步地，所述查找單元包括：計算模塊，用于利用后驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每個預存聲紋模型的相似度，得到多個相似度；比較模塊，用于比較所述多個相似度，得到最大相似度；以及第二確定模塊，用于將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
[0016] 進一步地，所述裝置還包括：收集單元，用于在從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型之前，收集多個對象標識所指示的多個對象的語料數(shù)據(jù)；第三獲取單元，用于獲取所述多個對象的語料數(shù)據(jù)的聲紋模型，得到所述預存聲紋模型；以及建立單元，用于建立所述預存聲紋模型與所述多個對象標識的對應關系。
[0017] 進一步地，所述第三獲取單元包括：關聯(lián)模塊，用于將所述語料數(shù)據(jù)與所述多個對象的標識進行關聯(lián)；提取模塊，用于提取與所述多個對象標識中每個對象標識關聯(lián)的所有語料數(shù)據(jù)中每一幀語音信號的語音特征參數(shù)；訓練模塊，用于對提取到的所述每個對象標識的語音特征參數(shù)進行訓練，得到屬于所述每個對象標識的聲紋模型；以及第三確定模塊，用于將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
[0018] 進一步地，所述裝置還包括：第四獲取單元，用于在建立所述預存聲紋模型與所述多個對象標識的對應關系之后，且獲取用戶的第一聲紋模型之前，獲取第一對象的語料數(shù) 據(jù)；識別單元，用于識別所述第一對象的語料數(shù)據(jù)中的聲紋模型；第二查找單元，用于從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型；以及關聯(lián)單元，用于將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標識。
[001幻通過本發(fā)明，在語料數(shù)據(jù)庫中保存第二聲紋模型以及第二聲紋模型與語料數(shù)據(jù)的映 ?關?，因此，從語料數(shù)據(jù)庫中找到與第一聲紋模型匹配的第二聲紋模型，就能找到與第二聲紋模型相關聯(lián)的語料數(shù)據(jù)，從而找到與用戶的第一聲紋模型向匹配的所有語料數(shù)據(jù)，解決了現(xiàn)有技術中查找語料數(shù)據(jù)的效率比較低的問題，進而達到了提高查找語料數(shù)據(jù)的效率的效果。

【專利附圖】

【附圖說明】
[0020]構成本申請的一部分的附圖用來提供對本發(fā)明的進一步理解，本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明，并不構成對本發(fā)明的不當限定。在附圖中：
[0021]圖1是根據(jù)本發(fā)明實施例的語料數(shù)據(jù)的查詢方法的流程圖；
[0022]圖2是根據(jù)本發(fā)明又一實施例的語料數(shù)據(jù)的查詢方法的流程圖；
[0023]圖3是根據(jù)本發(fā)明實施例的通過對象標識將語料數(shù)據(jù)表與對象信息表關聯(lián)的示意圖；以及
[0024]圖4是根據(jù)本發(fā)明實施例的語料數(shù)據(jù)的查詢裝置的示意圖。

【具體實施方式】
[0025]需要說明的是，在不沖突的情況下，本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本發(fā)明。
[0026]為了使本【技術領域】的人員更好地理解本發(fā)明方案，下面將結合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分的實施例，而不是全部的實施例。基于本發(fā)明中的實施例，本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都應當屬于本發(fā)明保護的范圍。
[0027]需要說明的是，本發(fā)明的說明書和權利要求書及上述附圖中的術語"第一"、"第二"等是用于區(qū)別類似的對象，而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換，以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外，術語"包括"和"具有"以及他們的任何變形，意圖在于覆蓋不排他的包含，例如，包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元，而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn) 品或設備固有的其它步驟或單元。
[0028] 本發(fā)明提供了一種語料數(shù)據(jù)的查找方法。圖1是根據(jù)本發(fā)明實施例的語料數(shù)據(jù)的查找方法的流程圖。如圖所示，該語料數(shù)據(jù)的查找方法包括如下步驟：
[0029] 步驟S102,獲取用戶的第一聲紋模型；
[0030] 步驟S104,從語料數(shù)據(jù)庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型；
[0031] 步驟S106,根據(jù)語料數(shù)據(jù)庫中預先存儲的預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系，獲取與第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)；以及
[0032] 步驟S108,將第一語料數(shù)據(jù)發(fā)送給用戶。
[0033] 語料數(shù)據(jù)庫中保存了第二聲紋模型以及第二聲紋模型與語料數(shù)據(jù)的映射關系，因此，從語料數(shù)據(jù)庫中找到與第一聲紋模型匹配的第二聲紋模型，就能找到與第二聲紋模型相關聯(lián)的語料數(shù)據(jù)，從而找到與用戶的第一聲紋模型向匹配的所有語料數(shù)據(jù)，提高了查找語料數(shù)據(jù)的效率，并且能夠準確匹配到需要查找的語料數(shù)據(jù)。
[0034] 以下結合表1對本實施例進行說明。
[0035] 表 1
[0036]

【權利要求】
1. 一種語料數(shù)據(jù)的查詢方法，其特征在于，包括：獲取用戶的第一聲紋模型；從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型；根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù)的關聯(lián)關系，獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)；以及將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
2. 根據(jù)權利要求1所述的方法，其特征在于，獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)包括：從所述語料數(shù)據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標識；獲取與所述對象標識關聯(lián)的第二語料數(shù)據(jù)；以及將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù)據(jù)。
3. 根據(jù)權利要求2所述的方法，其特征在于，將所述第一語料數(shù)據(jù)發(fā)送給所述用戶包括：獲取所述對象標識的對象信息；以及在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時，將所述對象信息發(fā)送給所述用戶。
4. 根據(jù)權利要求1所述的方法，其特征在于，從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型包括：利用后驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每個預存聲紋模型的相似度，得到多個相似度；比較所述多個相似度，得到最大相似度；以及將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
5. 根據(jù)權利要求1所述的方法，其特征在于，在從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型之前，所述方法還包括：收集多個對象標識所指示的多個對象的語料數(shù)據(jù)；獲取所述多個對象的語料數(shù)據(jù)的聲紋模型，得到所述預存聲紋模型；以及建立所述預存聲紋模型與所述多個對象標識的對應關系。
6. 根據(jù)權利要求5所述的方法，其特征在于，獲取多個對象的語料數(shù)據(jù)的聲紋模型，得到所述預存聲紋模型包括：將所述語料數(shù)據(jù)與所述多個對象的標識進行關聯(lián)；提取與所述多個對象標識中每個對象標識關聯(lián)的所有語料數(shù)據(jù)中每一幀語音信號的語音特征參數(shù)；對提取到的所述每個對象標識的語音特征參數(shù)進行訓練，得到屬于所述每個對象標識的聲紋模型；以及將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
7. 根據(jù)權利要求5所述的方法，其特征在于，在建立所述預存聲紋模型與所述多個對象標識的對應關系之后，且獲取用戶的第一聲紋模型之前，所述方法還包括：獲取第一對象的語料數(shù)據(jù)；識別所述第一對象的語料數(shù)據(jù)中的聲紋模型；從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型；以及將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標識。
8. -種語料數(shù)據(jù)的查詢裝置，其特征在于，包括：第一獲取單元，用于獲取用戶的第一聲紋模型；第一查找單元，用于從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型，得到第二聲紋模型；第二獲取單元，用于根據(jù)所述語料數(shù)據(jù)庫中預先存儲的所述預存聲紋模型與語料數(shù)據(jù) 的關聯(lián)關系，獲取與所述第二聲紋模型相關聯(lián)的第一語料數(shù)據(jù)；以及發(fā)送單元，用于將所述第一語料數(shù)據(jù)發(fā)送給所述用戶。
9. 根據(jù)權利要求8所述的裝置，其特征在于，所述第一獲取單元包括：查找模塊，用于從所述語料數(shù)據(jù)庫中查找與所述第二聲紋模型具有映射關系的對象標識；第一獲取模塊，用于獲取與所述對象標識關聯(lián)的第二語料數(shù)據(jù)；以及第一確定模塊，用于將與所述對象標識關聯(lián)的所述第二語料數(shù)據(jù)作為所述第一語料數(shù) 據(jù)。
10. 根據(jù)權利要求9所述的裝置，其特征在于，所述發(fā)送單元包括：第二獲取模塊，用于獲取所述對象標識的對象信息；以及發(fā)送模塊，用于在將所述第一語料數(shù)據(jù)發(fā)送給所述用戶時，將所述對象信息發(fā)送給所述用戶。
11. 根據(jù)權利要求8所述的裝置，其特征在于，所述查找單元包括：計算模塊，用于利用后驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每個預存聲紋模型的相似度，得到多個相似度；比較模塊，用于比較所述多個相似度，得到最大相似度；以及第二確定模塊，用于將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
12. 根據(jù)權利要求8所述的裝置，其特征在于，所述裝置還包括：收集單元，用于在從語料數(shù)據(jù)庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型之前，收集多個對象標識所指示的多個對象的語料數(shù)據(jù)；第三獲取單元，用于獲取所述多個對象的語料數(shù)據(jù)的聲紋模型，得到所述預存聲紋模型；以及建立單元，用于建立所述預存聲紋模型與所述多個對象標識的對應關系。
13. 根據(jù)權利要求12所述的裝置，其特征在于，所述第三獲取單元包括：關聯(lián)模塊，用于將所述語料數(shù)據(jù)與所述多個對象的標識進行關聯(lián)；提取模塊，用于提取與所述多個對象標識中每個對象標識關聯(lián)的所有語料數(shù)據(jù)中每一幀語音信號的語音特征參數(shù)；訓練模塊，用于對提取到的所述每個對象標識的語音特征參數(shù)進行訓練，得到屬于所述每個對象標識的聲紋模型；以及第三確定模塊，用于將屬于所述每個對象標識的聲紋模型作為所述預存聲紋模型。
14. 根據(jù)權利要求12所述的裝置，其特征在于，所述裝置還包括：第四獲取單元，用于在建立所述預存聲紋模型與所述多個對象標識的對應關系之后，且獲取用戶的第一聲紋模型之前，獲取第一對象的語料數(shù)據(jù)；識別單元，用于識別所述第一對象的語料數(shù)據(jù)中的聲紋模型；第二查找單元，用于從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型；以及關聯(lián)單元，用于將所述第一對象的語料數(shù)據(jù)關聯(lián)到查找到的聲紋模型所對應的對象標識。
【文檔編號】G10L17/00GK104268279SQ201410549904
【公開日】2015年1月7日申請日期:2014年10月16日優(yōu)先權日:2014年10月16日
【發(fā)明者】張征, 張爍申請人:魔方天空科技（北京）有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：張征;張爍
技術所有人：魔方天空科技（北京）有限公司
我是此專利的發(fā)明人

上一篇：一種基于分組密碼體制的語音加密方法
上一篇：降低語音編碼所需處理容量的方法以及網(wǎng)絡單元的制作方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

中文語料數(shù)據(jù)預處理相關技術

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語料數(shù)據(jù)的查詢方法和裝置制造方法