亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種將錄音音頻分割成段的方法與流程

文檔序號:12475846閱讀:6326來源:國知局

本發(fā)明屬于 本發(fā)明涉及音頻處理領(lǐng)域,特別涉及一種將錄音音頻分割成段的方法。



背景技術(shù):

隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,圖像、視頻、音頻等多媒體數(shù)據(jù)已逐漸成為互聯(lián)網(wǎng)信息處理領(lǐng)域中主要的信息媒體形式。其中,音頻數(shù)據(jù)占有很重要的位置。原始音頻數(shù)據(jù)本身是一種非語義符號表示和非結(jié)構(gòu)化的二進(jìn)制流。在大型會議上形成的錄音音頻往往容量很大,時間很長,并且錄音者有多人,而用戶需要的往往是其中一小段,或者是某個人的音頻,這時候就需要把大容量的音頻分割成若干段,方便存儲取用,在分割的過程中往往分割形成的節(jié)點(diǎn)處不是句尾或者段尾(將其定義為停頓處),會造成音頻損失,同時也造成用戶體驗(yàn)不好。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問題是音頻分割形成的節(jié)點(diǎn)處不是停頓處從而造成音頻損失及用戶體驗(yàn)不好的問題,而改善這一問題的辦法就是將分割節(jié)點(diǎn)處調(diào)整至停頓處。

為解決上述技術(shù)問題,本發(fā)明提供了一種將錄音音頻分割成段的方法,其特征是包括以下步驟:

獲取并遍歷錄音音頻數(shù)據(jù),獲取語音部分和靜音部分;

設(shè)定停頓處;

根據(jù)時間分割形成若干個節(jié)點(diǎn),設(shè)置節(jié)點(diǎn)編號;

相鄰的兩個節(jié)點(diǎn)之間形成段;

對節(jié)點(diǎn)進(jìn)行修正;

所述對節(jié)點(diǎn)進(jìn)行修正的方法是判斷節(jié)點(diǎn)是否屬于停頓處,如果節(jié)點(diǎn)不屬于停頓處,那么把節(jié)點(diǎn)調(diào)整至上一個停頓處;

如果節(jié)點(diǎn)屬于停頓處,繼續(xù)修正下一個節(jié)點(diǎn)直至結(jié)束;

所述靜音部分的時間為相鄰的兩個語音部分之間的時間差。

進(jìn)一步,所述設(shè)定停頓處的方法是,根據(jù)靜音部分的時間計(jì)算平均靜音時間,將大于平均靜音時間的閾值的靜音部分判斷為停頓處。

進(jìn)一步,所述根據(jù)靜音部分的時間計(jì)算平均靜音時間的步驟是,獲取靜音部分的總時長,以及靜音部分的數(shù)量,用靜音部分的總時長除以靜音部分的數(shù)量計(jì)算出平均靜音時間。

進(jìn)一步,所述設(shè)定停頓處的方法是,取靜音部分的時間的中位數(shù)并設(shè)定為停頓處。

進(jìn)一步,所述設(shè)定停頓處的方法是,由錄音者按照習(xí)慣語速錄制錄音音頻的樣本,所述錄音音頻的樣本包括一個停頓處,將錄音音頻的樣本的停頓處設(shè)定為錄音音頻的停頓處。

進(jìn)一步,所述修正節(jié)點(diǎn)的方法還包括節(jié)點(diǎn)前和/或節(jié)點(diǎn)后的字符是否與節(jié)點(diǎn)標(biāo)簽庫中的標(biāo)簽匹配,所述節(jié)點(diǎn)標(biāo)簽庫是存儲了若干句子的段開始或段結(jié)束的詞標(biāo)簽的語料庫。

進(jìn)一步,所述修正節(jié)點(diǎn)的方法還包括判斷節(jié)點(diǎn)的字符是否與人物更換標(biāo)簽匹配,所述人物更換標(biāo)簽是在錄音時根據(jù)人的聲音不同形成的用以區(qū)分的人物差異化標(biāo)識符。

采用上述技術(shù)方案,可達(dá)到以下效果:

1.大容量的音頻分割成若干段,方便存儲取用;

2.在分割的過程中分割形成的節(jié)點(diǎn)屬于停頓處(一般是句尾或段尾),避免了音頻損失,增強(qiáng)了用戶體驗(yàn)。

附圖說明

此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定,在附圖中:

圖1示出了一種將錄音音頻分割成段的方法的流程示意圖。

具體實(shí)施方式

下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明的技術(shù)方案作進(jìn)一步具體說明。

為解決上述技術(shù)問題,如圖1所示,本發(fā)明提供了一種將錄音音頻分割成段的方法,其特征是包括以下步驟:

獲取并遍歷錄音音頻數(shù)據(jù),獲取語音部分和靜音部分;

設(shè)定停頓處;

根據(jù)時間分割形成若干個節(jié)點(diǎn),設(shè)置節(jié)點(diǎn)編號;

相鄰的兩個節(jié)點(diǎn)之間形成段;

對節(jié)點(diǎn)進(jìn)行修正;

所述對節(jié)點(diǎn)進(jìn)行修正的方法是判斷節(jié)點(diǎn)是否屬于停頓處,如果節(jié)點(diǎn)不屬于停頓處,那么把節(jié)點(diǎn)調(diào)整至上一個停頓處;

如果節(jié)點(diǎn)屬于停頓處,繼續(xù)修正下一個節(jié)點(diǎn)直至將所有節(jié)點(diǎn)處理結(jié)束;

所述靜音部分的時間為相鄰的兩個語音部分之間的時間差。

進(jìn)一步,所述設(shè)定停頓處的方法是,根據(jù)靜音部分的時間計(jì)算平均靜音時間,將大于平均靜音時間的閾值的靜音部分判斷為停頓處。

進(jìn)一步,所述根據(jù)靜音部分的時間計(jì)算平均靜音時間的步驟是,獲取靜音部分的總時長,以及靜音部分的數(shù)量,用靜音部分的總時長除以靜音部分的數(shù)量計(jì)算出平均靜音時間。

進(jìn)一步,所述設(shè)定停頓處的方法是,取靜音部分的時間的中位數(shù)并設(shè)定為停頓處。

進(jìn)一步,所述設(shè)定停頓處的方法是,由錄音者按照習(xí)慣語速錄制錄音音頻的樣本,所述錄音音頻的樣本包括一個停頓處,將錄音音頻的樣本的停頓處設(shè)定為錄音音頻的停頓處。

進(jìn)一步,所述修正節(jié)點(diǎn)的方法還包括節(jié)點(diǎn)前和/或節(jié)點(diǎn)后的字符是否與節(jié)點(diǎn)標(biāo)簽庫中的標(biāo)簽匹配,所述節(jié)點(diǎn)標(biāo)簽庫是存儲了若干句子的段開始或段結(jié)束的詞標(biāo)簽的語料庫。

進(jìn)一步,所述修正節(jié)點(diǎn)的方法還包括判斷節(jié)點(diǎn)的字符是否與人物更換標(biāo)簽匹配,所述人物更換標(biāo)簽是在錄音時根據(jù)人的聲音不同形成的用以區(qū)分的人物差異化標(biāo)識符。

本領(lǐng)域技術(shù)人員還應(yīng)當(dāng)理解,以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1