錄音標(biāo)記方法及錄音裝置的制造方法
【專(zhuān)利摘要】本發(fā)明提供了錄音標(biāo)記方法及錄音裝置,通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù),對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板,判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板,如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息,使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板,利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息,進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記,實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能,而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
【專(zhuān)利說(shuō)明】
錄音標(biāo)記方法及錄音裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種錄音標(biāo)記方法及錄音裝置。
【背景技術(shù)】
[0002]目前智能手機(jī)逐漸融入到了人們?nèi)粘I钪?,不但成為日常通訊設(shè)備,也成為日常易于攜帶的記錄設(shè)備。其中,用戶通過(guò)智能手機(jī)的錄音應(yīng)用程序(Applicat1n,簡(jiǎn)稱(chēng)APP)可以對(duì)語(yǔ)音信息進(jìn)行錄制和保存,便于用戶快速地保存一段難以直接記憶語(yǔ)音信息,并且還可以多次使用該錄音。
[0003]現(xiàn)在很多錄音APP可以讓用戶在錄音的過(guò)程中,手動(dòng)地對(duì)錄音進(jìn)行標(biāo)記。通過(guò)這種手動(dòng)地打標(biāo)機(jī)的方式,便于整理和使用保存后的錄音信息。當(dāng)用戶需要打標(biāo)記時(shí),只需要在錄音時(shí)點(diǎn)擊標(biāo)設(shè)置好的記按鈕,此時(shí)就會(huì)在錄音的位置出現(xiàn)一個(gè)標(biāo)記,在播放錄音時(shí)該標(biāo)記也會(huì)顯示在播放條上。
[0004]在錄制多人對(duì)話的過(guò)程中,當(dāng)講話者發(fā)生變化時(shí),用戶就需要相應(yīng)地在錄音中變更與當(dāng)前講話人對(duì)應(yīng)的標(biāo)記,這種通過(guò)手動(dòng)打標(biāo)記的方法便捷性較差,而且使得用戶也無(wú)法關(guān)注錄音的內(nèi)容,需要花費(fèi)用戶的很多時(shí)間。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種錄音標(biāo)記方法及錄音裝置,用于解決手動(dòng)標(biāo)記時(shí)存在便捷性較差以及浪費(fèi)時(shí)間的問(wèn)題。
[0006]為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種錄音標(biāo)記方法,包括:
[0007]采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù);
[0008]對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板;
[0009]判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板;
[0010]如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息;
[0011 ]使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0012]為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種錄音裝置,包括:
[0013]提取模塊,用于采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù);
[0014]訓(xùn)練模塊,用于對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板;
[0015]判斷模塊,用于判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板;
[0016]獲取模塊,用于在所述判斷模塊的判斷結(jié)果為是時(shí),從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息;
[0017]標(biāo)記模塊,用于使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0018]本發(fā)明的錄音標(biāo)記方法及錄音裝置,通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù),對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板,判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板,如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息,使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本發(fā)明通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板,利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息,進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記,實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能,而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
【附圖說(shuō)明】
[0019]圖1為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的流程示意圖;
[0020]圖2為本發(fā)明實(shí)施例一的錄首標(biāo)記方法的應(yīng)用不例不意圖;
[0021 ]圖3為本發(fā)明實(shí)施例二的錄音標(biāo)記方法的流程示意圖;
[0022]圖4為本發(fā)明實(shí)施例二的錄音標(biāo)記方法的應(yīng)用示例示意圖之一;
[0023 ]圖5為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的應(yīng)用示例示意圖之二;
[0024]圖6為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的應(yīng)用示例示意圖之三;
[0025]圖7為本發(fā)明實(shí)施例二中的聲紋數(shù)據(jù)庫(kù)建立方法的流程示意圖;
[0026]圖8為本發(fā)明實(shí)施例三的錄音裝置的結(jié)構(gòu)示意圖;
[0027]圖9為本發(fā)明實(shí)施例四的錄音裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0028]下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例提供的錄音標(biāo)記方法及錄音裝置進(jìn)行詳細(xì)描述。
[0029]實(shí)施例一
[0030]如圖1所示,其為本發(fā)明實(shí)施例一的錄音標(biāo)記方法的流程示意圖,該錄音標(biāo)記方法包括:
[0031]步驟101、采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)。
[0032]用戶可以通過(guò)智能手機(jī)的用戶界面,開(kāi)啟智能手機(jī)中下載的錄音APP的錄音功能,錄音APP開(kāi)始對(duì)當(dāng)前錄音進(jìn)行采集,在采集的過(guò)程中錄音APP可以對(duì)聲音進(jìn)行預(yù)處理,例如,采集的數(shù)據(jù)進(jìn)行分幀、加窗和濾波等。
[0033]進(jìn)一步地,對(duì)采集的當(dāng)前錄音進(jìn)行特征分析,進(jìn)而得到當(dāng)前錄音的聲波特征參數(shù),其中,聲波特征參數(shù)包括:聲音的能量、共振峰、梅爾倒譜系數(shù)(Mel-frequency cepstrumcoefficients,簡(jiǎn)稱(chēng)MFCC)以及線性預(yù)測(cè)系數(shù)(Li near Predict1n Coefficients,簡(jiǎn)稱(chēng)LPC)。
[0034]步驟102、對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板。
[0035]本實(shí)施例中,為了識(shí)別出錄音的模板,設(shè)置有聲紋聚類(lèi)訓(xùn)練器,在獲取到聲紋特征參數(shù)后,通過(guò)該訓(xùn)練器對(duì)聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練,就可以得到該當(dāng)前錄音對(duì)應(yīng)的目標(biāo)聲紋模板。
[0036]步驟103、判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板。
[0037]本實(shí)施例中,通過(guò)訓(xùn)練器對(duì)樣本聲音進(jìn)行聲紋聚類(lèi)訓(xùn)練,得到了樣本聲音對(duì)應(yīng)的樣本聲紋模板,使用樣本聲紋模板預(yù)先設(shè)置了一個(gè)聲紋數(shù)據(jù)庫(kù)存儲(chǔ)在錄音APP中。一般聲紋數(shù)據(jù)庫(kù)中存儲(chǔ)有多個(gè)樣本聲紋模板,以便于用戶在錄音過(guò)程中進(jìn)行錄音標(biāo)記。在獲取到目標(biāo)聲紋模板后,錄音APP可以在聲紋數(shù)據(jù)庫(kù)中進(jìn)行查找,判斷該目標(biāo)聲紋模板是否存在于該聲紋數(shù)據(jù)庫(kù)中。
[0038]步驟104、若目標(biāo)聲紋模板為聲紋數(shù)據(jù)庫(kù)中的聲紋模板,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0039]在聲紋數(shù)據(jù)庫(kù)中不僅保存有樣本聲紋模板,而且還存儲(chǔ)有與樣本聲紋模板對(duì)應(yīng)的標(biāo)記信息,一般每個(gè)樣本聲紋模板對(duì)應(yīng)有各自的標(biāo)記信息。當(dāng)在聲紋數(shù)據(jù)庫(kù)中獲取到與目標(biāo)聲紋模板對(duì)應(yīng)的樣本聲紋模板時(shí),就可以獲取與該目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0040]步驟105、使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0041 ]在獲取到目標(biāo)標(biāo)記信息后,錄音APP自動(dòng)使用該目標(biāo)標(biāo)記信息對(duì)當(dāng)前錄音進(jìn)行標(biāo)記。
[0042]如圖2所示,其為本實(shí)施例的應(yīng)用示例示意圖,由于說(shuō)話人的聲紋的唯一性可以利用聲紋作為區(qū)別說(shuō)話人的唯一特征。對(duì)一段錄音進(jìn)行分段標(biāo)記。首先對(duì)當(dāng)前錄音進(jìn)行聲紋分析,對(duì)于不同聲紋使用不同的標(biāo)記進(jìn)行標(biāo)記。同一個(gè)說(shuō)話人使用相同的標(biāo)記進(jìn)行標(biāo)記。比如一段錄音有5個(gè)說(shuō)話人,分別使用左斜線、右斜線、橫線、豎線以及網(wǎng)格進(jìn)行標(biāo)記說(shuō)話人A、B、C、D、E。其中,當(dāng)說(shuō)話人A在這段錄音中有兩次被其他說(shuō)話人分開(kāi)的發(fā)言,這兩段發(fā)言都會(huì)使用左斜線標(biāo)記說(shuō)話人A,以表明是同一個(gè)說(shuō)話人的錄音段落。為了用戶更直觀的看到說(shuō)話人的不同,可以使用不同的顏色標(biāo)記說(shuō)話人,例如,分別使用紅色、黃色、藍(lán)色、綠色和紫色來(lái)標(biāo)記說(shuō)話人A、B、C、D、E?;蛘弋?dāng)說(shuō)話人A在這段錄音中有兩次被其他說(shuō)話人分開(kāi)的發(fā)言,這兩段發(fā)言都會(huì)使用紅色標(biāo)記說(shuō)話人A,以表明是同一個(gè)說(shuō)話人的錄音段落。
[0043]本實(shí)施例提供的錄音標(biāo)記方法,通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù),對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板,判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板,如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息,使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板,利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息,進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記,實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能,而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0044]實(shí)施例二
[0045]如圖3所示,其為本發(fā)明實(shí)施例二的錄音標(biāo)記方法的流程示意圖,該錄音標(biāo)記方法包括:
[0046]步驟201、采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)。
[0047]步驟202、對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板。
[0048]步驟203、判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板
[0049]如果判斷結(jié)果為是,執(zhí)行步驟204;否則執(zhí)行步驟205。
[0050]步驟204、從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。[0051 ] 步驟201?步驟204的相關(guān)內(nèi)容可參見(jiàn)上述實(shí)施例一中步驟101?步驟104中的記載,此處不再贅述。
[0052]步驟205、生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。
[0053]在識(shí)別出目標(biāo)聲紋模板并不存在與聲紋數(shù)據(jù)庫(kù)中之后,錄音APP可以為該目標(biāo)聲紋模板設(shè)置一個(gè)目標(biāo)標(biāo)記信息,以通過(guò)該目標(biāo)標(biāo)記信息對(duì)該目標(biāo)聲紋模板進(jìn)行標(biāo)記。
[0054]步驟206、使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0055]步驟207、建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。
[0056]步驟208、接收用戶通過(guò)終端發(fā)送的備注信息。
[0057]步驟209、使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注。
[0058]步驟210、將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。
[0059]接收用戶通過(guò)終端發(fā)送的備注信息,備注信息可以為當(dāng)前錄音的來(lái)源名稱(chēng),在終端獲取到備注信息后,指示錄音APP使用該備注信息對(duì)當(dāng)前錄音進(jìn)行備注。例如,錄音APP可以為當(dāng)前錄音對(duì)應(yīng)的位置添加一個(gè)標(biāo)簽。進(jìn)一步地,錄音APP還可以將獲取到的備注信息更新到聲紋數(shù)據(jù)中與當(dāng)前錄音對(duì)應(yīng)的目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息中,以便錄制的聲音為當(dāng)前錄音對(duì)應(yīng)的音源時(shí)可以再次被調(diào)用。
[0060]如圖4所示,其為本實(shí)施例的應(yīng)用示例示意圖,當(dāng)錄音APP對(duì)當(dāng)前錄音進(jìn)行自動(dòng)標(biāo)記后,用戶可以通過(guò)終端向錄音APP發(fā)送備注信息,用于給這段錄音中每位說(shuō)話人添加備注信息。比如,用戶可以通過(guò)錄音APP將用左斜線標(biāo)記的說(shuō)話人A備注為“張老師”。用戶可為新說(shuō)話人添加的備注信息,并直接與該說(shuō)話人的聲紋信息匹配,并作為這段錄音的名稱(chēng)。
[0061]如圖5所示,其為本實(shí)施例的應(yīng)用示例示意圖,當(dāng)用戶新建一段錄音,如果其中包含已保存聲音名稱(chēng)的說(shuō)話人的錄音,在聲紋分析后,這位說(shuō)話人的錄音段落會(huì)直接標(biāo)記為已保存的標(biāo)記信息。比如已經(jīng)保存了之前一段錄音的說(shuō)話人A為“張老師”,新建一段包含這個(gè)說(shuō)話人的錄音不會(huì)再顯示說(shuō)話人A的標(biāo)記,而是顯示“張老師”。
[0062]如圖6所示,其為本實(shí)施例的應(yīng)用示例示意圖,錄音中包含用戶保存過(guò)的講話人對(duì)應(yīng)的標(biāo)記信息,按照所標(biāo)記的說(shuō)話人,更快定位需要尋找的錄音。比如用戶想要尋找張老師的講課錄音,只要尋找“張老師”的標(biāo)簽即可。
[0063]在步驟201采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前,還需要通過(guò)樣本聲音建立一個(gè)聲紋數(shù)據(jù)庫(kù)。
[0064]如圖7所示,其為本發(fā)明實(shí)施例二中的聲紋數(shù)據(jù)庫(kù)建立方法的流程示意圖,該聲紋數(shù)據(jù)庫(kù)建立方法包括:
[0065]步驟301、對(duì)樣本聲音進(jìn)行分析,提取所述樣本聲音的所述聲紋特征參數(shù)。
[0066]本實(shí)施例中,將錄音APP在當(dāng)前錄音之前的每次錄制的聲音作為樣本聲音。在獲取到每次錄音后,錄音APP會(huì)對(duì)錄音的樣本聲音進(jìn)行分析,提取出該樣本聲音的聲紋特征參數(shù),其中聲紋特征參數(shù)包括:聲音的能量、共振峰、MFCC以及LPC等。
[0067]步驟302、根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板。
[0068]為了對(duì)獲取到樣本聲紋的聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練,需要進(jìn)一步確定該聲紋特征參數(shù)是否為同一個(gè)音源的聲音,具體地,預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù),當(dāng)所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)具有相似性時(shí),對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。如果確定出樣本聲紋的聲紋特征參數(shù)的不具有相似性,則需要將聲紋特征參數(shù)進(jìn)行緩存,再判斷出該聲音特征參數(shù)具有相似性之后,對(duì)聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板。
[0069]比如,有一段錄音中有5個(gè)說(shuō)話人,這5個(gè)說(shuō)話人就可以做完樣本聲音,在通過(guò)聲紋聚類(lèi)訓(xùn)練后,可以識(shí)別出這個(gè)5個(gè)說(shuō)話人分別為說(shuō)話人A、B、C、D、E,并5個(gè)說(shuō)話人生成相應(yīng)的樣本聲紋模板。
[0070]步驟303、為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息。
[0071 ]在生成樣本聲紋模板后,為樣本聲音生成對(duì)應(yīng)的樣本標(biāo)記信息,例如同一個(gè)說(shuō)話人使用相同的標(biāo)記進(jìn)行標(biāo)記。本實(shí)施例中,可以使用左斜線、右斜線、橫線、豎線以及網(wǎng)格進(jìn)行標(biāo)記說(shuō)話人A、B、C、D、E。
[0072]步驟304、使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。
[0073]為了提高對(duì)錄音標(biāo)記的快捷性,本實(shí)施例中,使用樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。每次對(duì)錄音進(jìn)行聲紋聚類(lèi)訓(xùn)練后生成的聲紋模板都會(huì)作為樣本聲紋模板保存到聲紋數(shù)據(jù)庫(kù)中,而且會(huì)將對(duì)該樣本聲紋模板的標(biāo)記信息以及兩者之間的映射關(guān)系也會(huì)保存到聲紋數(shù)據(jù)庫(kù)中,以對(duì)聲紋數(shù)據(jù)庫(kù)進(jìn)行更新。這樣當(dāng)再次遇到同一說(shuō)話人的錄音時(shí),錄音APP通過(guò)聲紋分析,能夠很迅速地對(duì)該說(shuō)話人的錄音進(jìn)行標(biāo)記,提高了錄音標(biāo)記的便捷性。
[0074]本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板,并利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息,進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記,實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能,而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0075]實(shí)施例三
[0076]如圖8所示,其為本發(fā)明實(shí)施例三的錄音裝置的結(jié)構(gòu)示意圖。該裝置包括:提取模塊11、訓(xùn)練模塊12、判斷模塊13、獲取模塊14和標(biāo)記模塊15。
[0077]其中,提取模塊11,用于采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)。
[0078]提取模塊11對(duì)采集的當(dāng)前錄音進(jìn)行特征分析,進(jìn)而得到當(dāng)前錄音的聲波特征參數(shù),其中,聲波特征參數(shù)包括:聲音的能量、共振峰MFCC以及LPC。
[0079]訓(xùn)練模塊12,用于對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板。
[0080]本實(shí)施例中,為了識(shí)別出錄音的模板,設(shè)置有訓(xùn)練模塊12,其中訓(xùn)練模塊12可以為聲紋聚類(lèi)訓(xùn)練器。在獲取到聲紋特征參數(shù)后,通過(guò)該訓(xùn)練模塊12對(duì)聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練,就可以得到該當(dāng)前錄音對(duì)應(yīng)的目標(biāo)聲紋模板。
[0081]判斷模塊13,用于判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板。
[0082]本實(shí)施例中,通過(guò)訓(xùn)練模塊12對(duì)樣本聲音進(jìn)行聲紋聚類(lèi)訓(xùn)練,得到了樣本聲音對(duì)應(yīng)的樣本聲紋模板,使用樣本聲紋模板預(yù)先設(shè)置了一個(gè)聲紋數(shù)據(jù)庫(kù)。一般聲紋數(shù)據(jù)庫(kù)中存儲(chǔ)有多個(gè)樣本聲紋模板,以便于用戶在錄音過(guò)程中進(jìn)行錄音標(biāo)記。在獲取到目標(biāo)聲紋模板后,判斷模塊13可以在聲紋數(shù)據(jù)庫(kù)中進(jìn)行查找,判斷該目標(biāo)聲紋模板是否存在于該聲紋數(shù)據(jù)庫(kù)中。
[0083]獲取模塊14,用于在所述判斷模塊的判斷結(jié)果為是時(shí),從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0084]在聲紋數(shù)據(jù)庫(kù)中不僅保存有樣本聲紋模板,而且還存儲(chǔ)有與樣本聲紋模板對(duì)應(yīng)的標(biāo)記信息,一般每個(gè)樣本聲紋模板對(duì)應(yīng)有各自的標(biāo)記信息。當(dāng)在聲紋數(shù)據(jù)庫(kù)中獲取到與目標(biāo)聲紋模板對(duì)應(yīng)的樣本聲紋模板時(shí),獲取模塊14就可以獲取與該目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息。
[0085]標(biāo)記模塊15,用于使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。
[0086]在獲取到目標(biāo)標(biāo)記信息后,標(biāo)記模塊15自動(dòng)使用該目標(biāo)標(biāo)記信息對(duì)當(dāng)前錄音進(jìn)行
ο
[0087]本實(shí)施例提供的錄音裝置,通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù),對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板,判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板,如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息,使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板,利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息,進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記,實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能,而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0088]實(shí)施例四
[0089]圖9所示,其為本發(fā)明實(shí)施例四的錄像裝置的結(jié)構(gòu)示意圖。該裝置包括上述實(shí)施例三中的提取模塊11、訓(xùn)練模塊12、判斷模塊13、獲取模塊14和標(biāo)記模塊15之外,還包括生成模塊16、建立模塊17和接收模塊18。
[0090]其中,所述生成模塊16,用于在所述判斷模塊的判斷結(jié)果為否時(shí),生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。
[0091 ]所述建立模塊17,用于在標(biāo)記模塊15使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后,建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。
[0092]進(jìn)一步地,所述提取模塊11,還用于在采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前,對(duì)樣本聲音進(jìn)行分析提取所述樣本聲音的所述聲紋特征參數(shù)。
[0093]所述訓(xùn)練模塊12,還用于根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板。
[0094]所述生成模塊16,還用于為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息。
[0095]所述建立模塊17,還用于使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。
[0096]進(jìn)一步地,所述訓(xùn)練模塊12,具體用于獲取預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù),在所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)相似時(shí),對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。
[0097]進(jìn)一步地,接收模塊18,用于在所述標(biāo)記模塊15使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后,接收用戶通過(guò)終端發(fā)送的備注信息;
[0098]所述標(biāo)記模塊15,還用于使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注;
[0099]所述建立模塊17,還用于將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。
[0100]本實(shí)施例提供的錄音裝置的各功能模塊可用于執(zhí)行圖1、3和7所示的錄音標(biāo)記方法的流程,其具體工作原理不再贅述,詳見(jiàn)方法實(shí)施例的描述。
[0101]本實(shí)施例提供的錄音裝置,通過(guò)采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù),對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板,判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板,如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息,使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。本實(shí)施例通過(guò)聲紋識(shí)別當(dāng)前錄音對(duì)應(yīng)的聲紋模板,利用建立的聲紋數(shù)據(jù)庫(kù)獲取與當(dāng)前錄音對(duì)應(yīng)的標(biāo)記信息,進(jìn)而對(duì)當(dāng)前錄音進(jìn)行標(biāo)記,實(shí)現(xiàn)了自動(dòng)標(biāo)記錄音的功能,而且節(jié)省了用戶添加標(biāo)記的時(shí)間。
[0102]本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:R0M、RAM、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0103]最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。
【主權(quán)項(xiàng)】
1.一種錄音標(biāo)記方法,其特征在于,包括: 采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù); 對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板; 判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板; 如果判斷結(jié)果為是,從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息; 使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。2.根據(jù)權(quán)利要求1所述的錄音標(biāo)記方法,其特征在于,所述使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之前,還包括: 如果判斷結(jié)果為否,生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。3.根據(jù)權(quán)利要求2所述的錄音標(biāo)記方法,其特征在于,所述使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后,還包括: 建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的錄音標(biāo)記方法,其特征在于,所述采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前,包括: 對(duì)樣本聲音進(jìn)行分析,提取所述樣本聲音的所述聲紋特征參數(shù); 根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板; 為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息; 使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。5.根據(jù)權(quán)利要求4所述的錄音標(biāo)記方法,其特征在于,所述根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板包括: 獲取預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù); 在所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)具有相似性時(shí),對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。6.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的錄音標(biāo)記方法,其特征在于,所述使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后,還包括: 接收用戶通過(guò)終端發(fā)送的備注信息; 使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注; 將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。7.一種錄音裝置,其特征在于,包括: 提取模塊,用于采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù); 訓(xùn)練模塊,用于對(duì)所述聲紋參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練得到所述聲紋參數(shù)的目標(biāo)聲紋模板; 判斷模塊,用于判斷所述目標(biāo)聲紋模板是否為聲紋數(shù)據(jù)庫(kù)中的聲紋模板; 獲取模塊,用于在所述判斷模塊的判斷結(jié)果為是時(shí),從所述聲紋數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)聲紋模板對(duì)應(yīng)的目標(biāo)標(biāo)記信息; 標(biāo)記模塊,用于使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記。8.根據(jù)權(quán)利要求7所述的錄音裝置,其特征在于,還包括: 生成模塊,用于在所述判斷模塊的判斷結(jié)果為否時(shí),生成與所述目標(biāo)聲紋模板對(duì)應(yīng)的所述目標(biāo)標(biāo)記信息。9.根據(jù)權(quán)利要求8所述的錄音裝置,其特征在于,還包括; 建立模塊,用于在所述標(biāo)記模塊使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后,建立所述目標(biāo)聲紋模板與所述目標(biāo)標(biāo)記信息之間映射關(guān)系并存儲(chǔ)在所述聲紋數(shù)據(jù)庫(kù)中。10.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的錄音裝置,其特征在于,所述提取模塊,還用于在采集當(dāng)前錄音并從所述當(dāng)前錄音中提取聲紋特征參數(shù)之前,對(duì)樣本聲音進(jìn)行分析提取所述樣本聲音的所述聲紋特征參數(shù); 所述訓(xùn)練模塊,還用于根據(jù)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成樣本聲紋模板; 所述生成模塊,還用于為所述樣本聲紋模板生成對(duì)應(yīng)的樣本標(biāo)記信息; 所述建立模塊,還用于使用所述樣本聲紋模板、所述樣本標(biāo)記信息以及所述樣本聲紋模板與所述樣本標(biāo)記信息之間的映射關(guān)系生成所述聲紋數(shù)據(jù)庫(kù)。11.根據(jù)權(quán)利要求10所述的錄音裝置,其特征在于,所述訓(xùn)練模塊,具體用于獲取預(yù)設(shè)時(shí)間段內(nèi)的所述樣本聲音的所述聲紋特征參數(shù),在所述預(yù)設(shè)時(shí)間內(nèi)的所述樣本聲音的所述聲紋特征參數(shù)具有相似時(shí),對(duì)所述樣本聲音的所述聲紋特征參數(shù)進(jìn)行聲紋聚類(lèi)訓(xùn)練生成所述樣本聲紋模板。12.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的錄音裝置,其特征在于,還包括: 接收模塊,用于在所述標(biāo)記模塊使用所述目標(biāo)標(biāo)記信息對(duì)所述當(dāng)前錄音進(jìn)行標(biāo)記之后,接收用戶通過(guò)終端發(fā)送的備注信息; 所述標(biāo)記模塊,還用于使用所述備注信息對(duì)所述當(dāng)前錄音進(jìn)行備注; 所述建立模塊,還用于將所述備注信息更新到所述聲紋數(shù)據(jù)中所述目標(biāo)標(biāo)記信息中。
【文檔編號(hào)】G10L15/06GK105895077SQ201510782729
【公開(kāi)日】2016年8月24日
【申請(qǐng)日】2015年11月15日
【發(fā)明人】蔡竹沁, 齊峰巖, 牛磊, 關(guān)彬
【申請(qǐng)人】樂(lè)視移動(dòng)智能信息技術(shù)(北京)有限公司