錄音標(biāo)記方法及錄音裝置的制造方法

文檔序號(hào)：10536378閱讀：834來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

錄音標(biāo)記方法及錄音裝置的制造方法
【專(zhuān)利摘要】本發(fā)明提供了錄音標(biāo)記方法及錄音裝置，通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)，對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板，判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板，如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息，使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板，利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息，進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記，實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能，而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
【專(zhuān)利說(shuō)明】
錄音標(biāo)記方法及錄音裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及電子技術(shù)領(lǐng)域，尤其涉及一種錄音標(biāo)記方法及錄音裝置。
【背景技術(shù)】
[0002]目前智能手機(jī)逐漸融入到了人們?nèi)粘Ｉ钪?，不但成為日常通訊設(shè)備，也成為日常易于攜帶的記錄設(shè)備。其中，用戶通過(guò)智能手機(jī)的錄音應(yīng)用程序(Applicat1n，簡(jiǎn)稱(chēng)APP)可以對(duì)語(yǔ)音信息進(jìn)行錄制和保存，便于用戶快速地保存一段難以直接記憶語(yǔ)音信息，并且還可以多次使用該錄音。
[0003]現(xiàn)在很多錄音APP可以讓用戶在錄音的過(guò)程中，手動(dòng)地對(duì)錄音進(jìn)行標(biāo)記。通過(guò)這種手動(dòng)地打標(biāo)機(jī)的方式，便于整理和使用保存后的錄音信息。當(dāng)用戶需要打標(biāo)記時(shí)，只需要在錄音時(shí)點(diǎn)擊標(biāo)設(shè)置好的記按鈕，此時(shí)就會(huì)在錄音的位置出現(xiàn)一個(gè)標(biāo)記，在播放錄音時(shí)該標(biāo)記也會(huì)顯示在播放條上。
[0004]在錄制多人對(duì)話的過(guò)程中，當(dāng)講話者發(fā)生變化時(shí)，用戶就需要相應(yīng)地在錄音中變更與當(dāng)前講話人對(duì)應(yīng)的標(biāo)記，這種通過(guò)手動(dòng)打標(biāo)記的方法便捷性較差，而且使得用戶也無(wú)法關(guān)注錄音的內(nèi)容，需要花費(fèi)用戶的很多時(shí)間。

【發(fā)明內(nèi)容】

[0005]本發(fā)明提供一種錄音標(biāo)記方法及錄音裝置，用于解決手動(dòng)標(biāo)記時(shí)存在便捷性較差以及浪費(fèi)時(shí)間的問(wèn)題。
[0006]為了實(shí)現(xiàn)上述目的，本發(fā)明提供了一種錄音標(biāo)記方法，包括:
[0007]采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)；
[0008]對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板；
[0009]判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板；
[0010]如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息；
[0011 ]使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0012]為了實(shí)現(xiàn)上述目的，本發(fā)明提供了一種錄音裝置，包括:
[0013]提取模塊，用于采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)；
[0014]訓(xùn)練模塊，用于對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板；
[0015]判斷模塊，用于判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板；
[0016]獲取模塊，用于在所述判斷模塊的判斷結(jié)果為是時(shí)，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息；
[0017]標(biāo)記模塊，用于使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0018]本發(fā)明的錄音標(biāo)記方法及錄音裝置，通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)，對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板，判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板，如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息，使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本發(fā)明通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板，利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息，進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記，實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能，而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
【附圖說(shuō)明】
[0019]圖1為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的流程示意圖；
[0020]圖2為本發(fā)明實(shí)施例一的錄首標(biāo)記方法的應(yīng)用不例不意圖；
[0021 ]圖3為本發(fā)明實(shí)施例二的錄音標(biāo)記方法的流程示意圖；
[0022]圖4為本發(fā)明實(shí)施例二的錄音標(biāo)記方法的應(yīng)用示例示意圖之一；
[0023 ]圖5為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的應(yīng)用示例示意圖之二；
[0024]圖6為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的應(yīng)用示例示意圖之三；
[0025]圖7為本發(fā)明實(shí)施例二中的聲紋數(shù)據(jù)庫(kù)建立方法的流程示意圖；
[0026]圖8為本發(fā)明實(shí)施例三的錄音裝置的結(jié)構(gòu)示意圖；
[0027]圖9為本發(fā)明實(shí)施例四的錄音裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0028]下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例提供的錄音標(biāo)記方法及錄音裝置進(jìn)行詳細(xì)描述。
[0029]實(shí)施例一
[0030]如圖1所示，其為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的流程示意圖，該錄音標(biāo)記方法包括:
[0031]步驟101、采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)。
[0032]用戶可以通過(guò)智能手機(jī)的用戶界面，開(kāi)啟智能手機(jī)中下載的錄音APP的錄音功能，錄音APP開(kāi)始對(duì)當(dāng)前錄音進(jìn)行采集，在采集的過(guò)程中錄音APP可以對(duì)聲音進(jìn)行預(yù)處理，例如，采集的數(shù)據(jù)進(jìn)行分幀、加窗和濾波等。
[0033]進(jìn)一步地，對(duì)采集的當(dāng)前錄音進(jìn)行特征分析，進(jìn)而得到當(dāng)前錄音的聲波特征參數(shù)，其中，聲波特征參數(shù)包括:聲音的能量、共振峰、梅爾倒譜系數(shù)(Mel-frequency cepstrumcoefficients，簡(jiǎn)稱(chēng)MFCC)以及線性預(yù)測(cè)系數(shù)(Li near Predict1n Coefficients，簡(jiǎn)稱(chēng)LPC)。
[0034]步驟102、對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板。
[0035]本實(shí)施例中，為了識(shí)別出錄音的模板，設(shè)置有聲紋聚類(lèi)訓(xùn)練器，在獲取到聲紋特征參數(shù)后，通過(guò)該訓(xùn)練器對(duì)聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練，就可以得到該當(dāng)前錄音對(duì)應(yīng)的目標(biāo)聲紋模板。
[0036]步驟103、判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板。
[0037]本實(shí)施例中，通過(guò)訓(xùn)練器對(duì)樣本聲音進(jìn)行聲紋聚類(lèi)訓(xùn)練，得到了樣本聲音對(duì)應(yīng)的樣本聲紋模板，使用樣本聲紋模板預(yù)先設(shè)置了一個(gè)聲紋數(shù)據(jù)庫(kù)存儲(chǔ)在錄音APP中。一般聲紋數(shù)據(jù)庫(kù)中存儲(chǔ)有多個(gè)樣本聲紋模板，以便于用戶在錄音過(guò)程中進(jìn)行錄音標(biāo)記。在獲取到目標(biāo)聲紋模板后，錄音APP可以在聲紋數(shù)據(jù)庫(kù)中進(jìn)行查找，判斷該目標(biāo)聲紋模板是否存在于該聲紋數(shù)據(jù)庫(kù)中。
[0038]步驟104、若目標(biāo)聲紋模板為聲紋數(shù)據(jù)庫(kù)中的聲紋模板，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0039]在聲紋數(shù)據(jù)庫(kù)中不僅保存有樣本聲紋模板，而且還存儲(chǔ)有與樣本聲紋模板對(duì)應(yīng)的標(biāo)記信息，一般每個(gè)樣本聲紋模板對(duì)應(yīng)有各自的標(biāo)記信息。當(dāng)在聲紋數(shù)據(jù)庫(kù)中獲取到與目標(biāo)聲紋模板對(duì)應(yīng)的樣本聲紋模板時(shí)，就可以獲取與該目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0040]步驟105、使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0041 ]在獲取到目標(biāo)標(biāo)記信息后，錄音APP自動(dòng)使用該目標(biāo)標(biāo)記信息對(duì)當(dāng)前錄音進(jìn)行標(biāo)記。
[0042]如圖2所示，其為本實(shí)施例的應(yīng)用示例示意圖，由于說(shuō)話人的聲紋的唯一性可以利用聲紋作為區(qū)別說(shuō)話人的唯一特征。對(duì)一段錄音進(jìn)行分段標(biāo)記。首先對(duì)當(dāng)前錄音進(jìn)行聲紋分析，對(duì)于不同聲紋使用不同的標(biāo)記進(jìn)行標(biāo)記。同一個(gè)說(shuō)話人使用相同的標(biāo)記進(jìn)行標(biāo)記。比如一段錄音有5個(gè)說(shuō)話人，分別使用左斜線、右斜線、橫線、豎線以及網(wǎng)格進(jìn)行標(biāo)記說(shuō)話人A、B、C、D、E。其中，當(dāng)說(shuō)話人A在這段錄音中有兩次被其他說(shuō)話人分開(kāi)的發(fā)言，這兩段發(fā)言都會(huì)使用左斜線標(biāo)記說(shuō)話人A，以表明是同一個(gè)說(shuō)話人的錄音段落。為了用戶更直觀的看到說(shuō)話人的不同，可以使用不同的顏色標(biāo)記說(shuō)話人，例如，分別使用紅色、黃色、藍(lán)色、綠色和紫色來(lái)標(biāo)記說(shuō)話人A、B、C、D、E?；蛘弋?dāng)說(shuō)話人A在這段錄音中有兩次被其他說(shuō)話人分開(kāi)的發(fā)言，這兩段發(fā)言都會(huì)使用紅色標(biāo)記說(shuō)話人A，以表明是同一個(gè)說(shuō)話人的錄音段落。
[0043]本實(shí)施例提供的錄音標(biāo)記方法，通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)，對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板，判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板，如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息，使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板，利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息，進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記，實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能，而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0044]實(shí)施例二
[0045]如圖3所示，其為本發(fā)明實(shí)施例二的錄音標(biāo)記方法的流程示意圖，該錄音標(biāo)記方法包括:
[0046]步驟201、采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)。
[0047]步驟202、對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板。
[0048]步驟203、判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板
[0049]如果判斷結(jié)果為是，執(zhí)行步驟204;否則執(zhí)行步驟205。
[0050]步驟204、從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。[0051 ] 步驟201?步驟204的相關(guān)內(nèi)容可參見(jiàn)上述實(shí)施例一中步驟101?步驟104中的記載，此處不再贅述。
[0052]步驟205、生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。
[0053]在識(shí)別出目標(biāo)聲紋模板并不存在與聲紋數(shù)據(jù)庫(kù)中之后，錄音APP可以為該目標(biāo)聲紋模板設(shè)置一個(gè)目標(biāo)標(biāo)記信息，以通過(guò)該目標(biāo)標(biāo)記信息對(duì)該目標(biāo)聲紋模板進(jìn)行標(biāo)記。
[0054]步驟206、使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0055]步驟207、建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。
[0056]步驟208、接收用戶通過(guò)終端發(fā)送的備注信息。
[0057]步驟209、使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注。
[0058]步驟210、將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。
[0059]接收用戶通過(guò)終端發(fā)送的備注信息，備注信息可以為當(dāng)前錄音的來(lái)源名稱(chēng)，在終端獲取到備注信息后，指示錄音APP使用該備注信息對(duì)當(dāng)前錄音進(jìn)行備注。例如，錄音APP可以為當(dāng)前錄音對(duì)應(yīng)的位置添加一個(gè)標(biāo)簽。進(jìn)一步地，錄音APP還可以將獲取到的備注信息更新到聲紋數(shù)據(jù)中與當(dāng)前錄音對(duì)應(yīng)的目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息中，以便錄制的聲音為當(dāng)前錄音對(duì)應(yīng)的音源時(shí)可以再次被調(diào)用。
[0060]如圖4所示，其為本實(shí)施例的應(yīng)用示例示意圖，當(dāng)錄音APP對(duì)當(dāng)前錄音進(jìn)行自動(dòng)標(biāo)記后，用戶可以通過(guò)終端向錄音APP發(fā)送備注信息，用于給這段錄音中每位說(shuō)話人添加備注信息。比如，用戶可以通過(guò)錄音APP將用左斜線標(biāo)記的說(shuō)話人A備注為“張老師”。用戶可為新說(shuō)話人添加的備注信息，并直接與該說(shuō)話人的聲紋信息匹配，并作為這段錄音的名稱(chēng)。
[0061]如圖5所示，其為本實(shí)施例的應(yīng)用示例示意圖，當(dāng)用戶新建一段錄音，如果其中包含已保存聲音名稱(chēng)的說(shuō)話人的錄音，在聲紋分析后，這位說(shuō)話人的錄音段落會(huì)直接標(biāo)記為已保存的標(biāo)記信息。比如已經(jīng)保存了之前一段錄音的說(shuō)話人A為“張老師”，新建一段包含這個(gè)說(shuō)話人的錄音不會(huì)再顯示說(shuō)話人A的標(biāo)記，而是顯示“張老師”。
[0062]如圖6所示，其為本實(shí)施例的應(yīng)用示例示意圖，錄音中包含用戶保存過(guò)的講話人對(duì)應(yīng)的標(biāo)記信息，按照所標(biāo)記的說(shuō)話人，更快定位需要尋找的錄音。比如用戶想要尋找張老師的講課錄音，只要尋找“張老師”的標(biāo)簽即可。
[0063]在步驟201采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前，還需要通過(guò)樣本聲音建立一個(gè)聲紋數(shù)據(jù)庫(kù)。
[0064]如圖7所示，其為本發(fā)明實(shí)施例二中的聲紋數(shù)據(jù)庫(kù)建立方法的流程示意圖，該聲紋數(shù)據(jù)庫(kù)建立方法包括:
[0065]步驟301、對(duì)樣本聲音進(jìn)行分析，提取所述樣本聲音的所述聲紋特征參數(shù)。
[0066]本實(shí)施例中，將錄音APP在當(dāng)前錄音之前的每次錄制的聲音作為樣本聲音。在獲取到每次錄音后，錄音APP會(huì)對(duì)錄音的樣本聲音進(jìn)行分析，提取出該樣本聲音的聲紋特征參數(shù)，其中聲紋特征參數(shù)包括:聲音的能量、共振峰、MFCC以及LPC等。
[0067]步驟302、根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板。
[0068]為了對(duì)獲取到樣本聲紋的聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練，需要進(jìn)一步確定該聲紋特征參數(shù)是否為同一個(gè)音源的聲音，具體地，預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)，當(dāng)所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)具有相似性時(shí)，對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。如果確定出樣本聲紋的聲紋特征參數(shù)的不具有相似性，則需要將聲紋特征參數(shù)進(jìn)行緩存，再判斷出該聲音特征參數(shù)具有相似性之后，對(duì)聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板。
[0069]比如，有一段錄音中有5個(gè)說(shuō)話人，這5個(gè)說(shuō)話人就可以做完樣本聲音，在通過(guò)聲紋聚類(lèi)訓(xùn)練后，可以識(shí)別出這個(gè)5個(gè)說(shuō)話人分別為說(shuō)話人A、B、C、D、E，并5個(gè)說(shuō)話人生成相應(yīng)的樣本聲紋模板。
[0070]步驟303、為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息。
[0071 ]在生成樣本聲紋模板后，為樣本聲音生成對(duì)應(yīng)的樣本標(biāo)記信息，例如同一個(gè)說(shuō)話人使用相同的標(biāo)記進(jìn)行標(biāo)記。本實(shí)施例中，可以使用左斜線、右斜線、橫線、豎線以及網(wǎng)格進(jìn)行標(biāo)記說(shuō)話人A、B、C、D、E。
[0072]步驟304、使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。
[0073]為了提高對(duì)錄音標(biāo)記的快捷性，本實(shí)施例中，使用樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。每次對(duì)錄音進(jìn)行聲紋聚類(lèi)訓(xùn)練后生成的聲紋模板都會(huì)作為樣本聲紋模板保存到聲紋數(shù)據(jù)庫(kù)中，而且會(huì)將對(duì)該樣本聲紋模板的標(biāo)記信息以及兩者之間的映射關(guān)系也會(huì)保存到聲紋數(shù)據(jù)庫(kù)中，以對(duì)聲紋數(shù)據(jù)庫(kù)進(jìn)行更新。這樣當(dāng)再次遇到同一說(shuō)話人的錄音時(shí)，錄音APP通過(guò)聲紋分析，能夠很迅速地對(duì)該說(shuō)話人的錄音進(jìn)行標(biāo)記，提高了錄音標(biāo)記的便捷性。
[0074]本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板，并利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息，進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記，實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能，而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0075]實(shí)施例三
[0076]如圖8所示，其為本發(fā)明實(shí)施例三的錄音裝置的結(jié)構(gòu)示意圖。該裝置包括:提取模塊11、訓(xùn)練模塊12、判斷模塊13、獲取模塊14和標(biāo)記模塊15。
[0077]其中，提取模塊11，用于采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)。
[0078]提取模塊11對(duì)采集的當(dāng)前錄音進(jìn)行特征分析，進(jìn)而得到當(dāng)前錄音的聲波特征參數(shù)，其中，聲波特征參數(shù)包括:聲音的能量、共振峰MFCC以及LPC。
[0079]訓(xùn)練模塊12，用于對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板。
[0080]本實(shí)施例中，為了識(shí)別出錄音的模板，設(shè)置有訓(xùn)練模塊12，其中訓(xùn)練模塊12可以為聲紋聚類(lèi)訓(xùn)練器。在獲取到聲紋特征參數(shù)后，通過(guò)該訓(xùn)練模塊12對(duì)聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練，就可以得到該當(dāng)前錄音對(duì)應(yīng)的目標(biāo)聲紋模板。
[0081]判斷模塊13，用于判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板。
[0082]本實(shí)施例中，通過(guò)訓(xùn)練模塊12對(duì)樣本聲音進(jìn)行聲紋聚類(lèi)訓(xùn)練，得到了樣本聲音對(duì)應(yīng)的樣本聲紋模板，使用樣本聲紋模板預(yù)先設(shè)置了一個(gè)聲紋數(shù)據(jù)庫(kù)。一般聲紋數(shù)據(jù)庫(kù)中存儲(chǔ)有多個(gè)樣本聲紋模板，以便于用戶在錄音過(guò)程中進(jìn)行錄音標(biāo)記。在獲取到目標(biāo)聲紋模板后，判斷模塊13可以在聲紋數(shù)據(jù)庫(kù)中進(jìn)行查找，判斷該目標(biāo)聲紋模板是否存在于該聲紋數(shù)據(jù)庫(kù)中。
[0083]獲取模塊14，用于在所述判斷模塊的判斷結(jié)果為是時(shí)，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0084]在聲紋數(shù)據(jù)庫(kù)中不僅保存有樣本聲紋模板，而且還存儲(chǔ)有與樣本聲紋模板對(duì)應(yīng)的標(biāo)記信息，一般每個(gè)樣本聲紋模板對(duì)應(yīng)有各自的標(biāo)記信息。當(dāng)在聲紋數(shù)據(jù)庫(kù)中獲取到與目標(biāo)聲紋模板對(duì)應(yīng)的樣本聲紋模板時(shí)，獲取模塊14就可以獲取與該目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0085]標(biāo)記模塊15，用于使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0086]在獲取到目標(biāo)標(biāo)記信息后，標(biāo)記模塊15自動(dòng)使用該目標(biāo)標(biāo)記信息對(duì)當(dāng)前錄音進(jìn)行
ο
[0087]本實(shí)施例提供的錄音裝置，通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)，對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板，判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板，如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息，使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板，利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息，進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記，實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能，而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0088]實(shí)施例四
[0089]圖9所示，其為本發(fā)明實(shí)施例四的錄像裝置的結(jié)構(gòu)示意圖。該裝置包括上述實(shí)施例三中的提取模塊11、訓(xùn)練模塊12、判斷模塊13、獲取模塊14和標(biāo)記模塊15之外，還包括生成模塊16、建立模塊17和接收模塊18。
[0090]其中，所述生成模塊16，用于在所述判斷模塊的判斷結(jié)果為否時(shí)，生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。
[0091 ]所述建立模塊17，用于在標(biāo)記模塊15使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后，建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。
[0092]進(jìn)一步地，所述提取模塊11，還用于在采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前，對(duì)樣本聲音進(jìn)行分析提取所述樣本聲音的所述聲紋特征參數(shù)。
[0093]所述訓(xùn)練模塊12，還用于根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板。
[0094]所述生成模塊16，還用于為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息。
[0095]所述建立模塊17，還用于使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。
[0096]進(jìn)一步地，所述訓(xùn)練模塊12，具體用于獲取預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)，在所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)相似時(shí)，對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。
[0097]進(jìn)一步地，接收模塊18，用于在所述標(biāo)記模塊15使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后，接收用戶通過(guò)終端發(fā)送的備注信息；
[0098]所述標(biāo)記模塊15，還用于使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注；
[0099]所述建立模塊17，還用于將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。
[0100]本實(shí)施例提供的錄音裝置的各功能模塊可用于執(zhí)行圖1、3和7所示的錄音標(biāo)記方法的流程，其具體工作原理不再贅述，詳見(jiàn)方法實(shí)施例的描述。
[0101]本實(shí)施例提供的錄音裝置，通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)，對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板，判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板，如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息，使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板，利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息，進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記，實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能，而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0102]本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí)，執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:R0M、RAM、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0103]最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案，而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改，或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。
【主權(quán)項(xiàng)】
1.一種錄音標(biāo)記方法，其特征在于，包括: 采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)；對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板；判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板；如果判斷結(jié)果為是，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息; 使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。2.根據(jù)權(quán)利要求1所述的錄音標(biāo)記方法，其特征在于，所述使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之前，還包括: 如果判斷結(jié)果為否，生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。3.根據(jù)權(quán)利要求2所述的錄音標(biāo)記方法，其特征在于，所述使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后，還包括: 建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的錄音標(biāo)記方法，其特征在于，所述采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前，包括: 對(duì)樣本聲音進(jìn)行分析，提取所述樣本聲音的所述聲紋特征參數(shù)；根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板；為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息；使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。5.根據(jù)權(quán)利要求4所述的錄音標(biāo)記方法，其特征在于，所述根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板包括: 獲取預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)；在所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)具有相似性時(shí)，對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。6.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的錄音標(biāo)記方法，其特征在于，所述使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后，還包括: 接收用戶通過(guò)終端發(fā)送的備注信息；使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注；將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。7.一種錄音裝置，其特征在于，包括: 提取模塊，用于采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)；訓(xùn)練模塊，用于對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板；判斷模塊，用于判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板；獲取模塊，用于在所述判斷模塊的判斷結(jié)果為是時(shí)，從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息；標(biāo)記模塊，用于使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。8.根據(jù)權(quán)利要求7所述的錄音裝置，其特征在于，還包括: 生成模塊，用于在所述判斷模塊的判斷結(jié)果為否時(shí)，生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。9.根據(jù)權(quán)利要求8所述的錄音裝置，其特征在于，還包括；建立模塊，用于在所述標(biāo)記模塊使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后，建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。10.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的錄音裝置，其特征在于，所述提取模塊，還用于在采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前，對(duì)樣本聲音進(jìn)行分析提取所述樣本聲音的所述聲紋特征參數(shù)；所述訓(xùn)練模塊，還用于根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板；所述生成模塊，還用于為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息；所述建立模塊，還用于使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。11.根據(jù)權(quán)利要求10所述的錄音裝置，其特征在于，所述訓(xùn)練模塊，具體用于獲取預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)，在所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)具有相似時(shí)，對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。12.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的錄音裝置，其特征在于，還包括: 接收模塊，用于在所述標(biāo)記模塊使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后，接收用戶通過(guò)終端發(fā)送的備注信息；所述標(biāo)記模塊，還用于使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注；所述建立模塊，還用于將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。
【文檔編號(hào)】G10L15/06GK105895077SQ201510782729
【公開(kāi)日】2016年8月24日
【申請(qǐng)日】2015年11月15日
【發(fā)明人】蔡竹沁, 齊峰巖, 牛磊, 關(guān)彬
【申請(qǐng)人】樂(lè)視移動(dòng)智能信息技術(shù)（北京）有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：蔡竹沁;齊峰巖;牛磊;關(guān)彬;
技術(shù)所有人：樂(lè)視移動(dòng)智能信息技術(shù)（北京）有限公司;
我是此專(zhuān)利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

eve目標(biāo)標(biāo)記裝置相關(guān)技術(shù)

目標(biāo)標(biāo)記裝置相關(guān)技術(shù)

反錄音裝置相關(guān)技術(shù)

相同的水下錄音裝置相關(guān)技術(shù)

火警數(shù)字錄音錄時(shí)裝置相關(guān)技術(shù)

陰陽(yáng)師標(biāo)記怪物的方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

錄音標(biāo)記方法及錄音裝置的制造方法