亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音播放方法及裝置的制造方法

文檔序號(hào):9647369閱讀:411來(lái)源:國(guó)知局
語(yǔ)音播放方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音信號(hào)處理領(lǐng)域,具體涉及一種語(yǔ)音播放方法及裝置。
【背景技術(shù)】
[0002]目前,越來(lái)越多的人們喜歡采用錄音的形式代替文本的形式記錄所需要的信息,如開(kāi)會(huì)時(shí),采用錄音的形式將會(huì)議內(nèi)容記錄下來(lái),以供后續(xù)查閱;記者采訪時(shí),將采訪內(nèi)容采用錄音的形式記錄下來(lái),基于該內(nèi)容編輯成稿;學(xué)生上課時(shí),將聽(tīng)不懂的地方錄下來(lái),回去查閱資料等。然而,當(dāng)錄音數(shù)據(jù)量較大時(shí),人們很難快速準(zhǔn)確地找到有價(jià)值的錄音內(nèi)容。為了減少錄音的播放時(shí)間,現(xiàn)有的語(yǔ)音播放方法一般采用端點(diǎn)檢測(cè)的方法,檢測(cè)純?cè)肼暥位蜢o音段,將這些語(yǔ)音段略過(guò),以正常語(yǔ)速播放剩下的語(yǔ)音數(shù)據(jù)。然而,在錄音的過(guò)程中,經(jīng)常會(huì)將一些不重要的內(nèi)容一起錄制下來(lái),現(xiàn)有方法播放錄音時(shí),經(jīng)常需要用戶手動(dòng)轉(zhuǎn)換成快進(jìn)形式播放,或直接跳過(guò)不重要的內(nèi)容。尤其是在錄音環(huán)境不好的情況下,錄制的語(yǔ)音數(shù)據(jù)質(zhì)量往往較差,為了聽(tīng)清錄音內(nèi)容,用戶需要手動(dòng)重復(fù)播放多次,大大降低了用戶體驗(yàn)度。

【發(fā)明內(nèi)容】

[0003]本發(fā)明提供一種語(yǔ)音播放方法及裝置,以幫助用戶快速準(zhǔn)確地找到所關(guān)注的語(yǔ)音段。
[0004]為此,本發(fā)明提供如下技術(shù)方案:
[0005]—種語(yǔ)音播放方法,包括:
[0006]接收待播放語(yǔ)音數(shù)據(jù);
[0007]對(duì)所述待播放語(yǔ)音數(shù)據(jù)進(jìn)行端點(diǎn)檢測(cè),得到各語(yǔ)音段;
[0008]根據(jù)各語(yǔ)音段的語(yǔ)音內(nèi)容和/或聲紋特征確定所述語(yǔ)音段是否為關(guān)鍵信息段;
[0009]在播放所述待播放語(yǔ)音數(shù)據(jù)時(shí),根據(jù)所述關(guān)鍵信息段對(duì)所述待播放語(yǔ)音數(shù)據(jù)的語(yǔ)速進(jìn)行調(diào)整。
[0010]優(yōu)選地,所述根據(jù)各語(yǔ)音段的語(yǔ)音內(nèi)容確定所述語(yǔ)音段是否為關(guān)鍵信息段包括:
[0011]對(duì)各語(yǔ)音段進(jìn)行語(yǔ)音識(shí)別,得到各語(yǔ)音段的識(shí)別文本;
[0012]根據(jù)各語(yǔ)音段的識(shí)別文本,確定所述語(yǔ)音段是否為關(guān)鍵信息段。
[0013]優(yōu)選地,所述根據(jù)各語(yǔ)音段的識(shí)別文本,確定所述語(yǔ)音段是否為關(guān)鍵信息段包括:
[0014]確定各語(yǔ)音段的識(shí)別文本是否包含預(yù)置的關(guān)鍵詞;
[0015]如果是,則確定所述語(yǔ)音段為關(guān)鍵信息段。
[0016]優(yōu)選地,所述根據(jù)各語(yǔ)音段的識(shí)別文本,確定所述語(yǔ)音段是否為關(guān)鍵信息段包括:
[0017]采用迭代方式從所有語(yǔ)音段中抽取摘要語(yǔ)音段,并在達(dá)到設(shè)定的迭代次數(shù)后,得到多個(gè)摘要語(yǔ)音段,將所述多個(gè)摘要語(yǔ)音段作為關(guān)鍵信息段。
[0018]優(yōu)選地,所述從所有語(yǔ)音段中抽取摘要語(yǔ)音段包括:
[0019]計(jì)算當(dāng)前語(yǔ)音段的識(shí)別文本與所述待播放語(yǔ)音數(shù)據(jù)的識(shí)別文本的相似度,得到第一計(jì)算值;
[0020]計(jì)算所述當(dāng)前語(yǔ)音段的識(shí)別文本與已抽取摘要語(yǔ)音段識(shí)別文本的相似度,得到第二計(jì)算值;
[0021]計(jì)算第一計(jì)算值與第二計(jì)算值的差值,得到當(dāng)前語(yǔ)音段的摘要得分;
[0022]在得到所有語(yǔ)音段的摘要得分后,選擇摘要得分最大的語(yǔ)音段作為摘要語(yǔ)音段。
[0023]優(yōu)選地,所述根據(jù)各語(yǔ)音段的聲紋特征確定所述語(yǔ)音段是否為關(guān)鍵信息段包括:
[0024]如果所述待播放語(yǔ)音數(shù)據(jù)包含多個(gè)說(shuō)話人的語(yǔ)音數(shù)據(jù),則提取各語(yǔ)音段的聲紋特征;
[0025]根據(jù)所述聲紋特征及特定說(shuō)話人的聲紋模型,確定所述語(yǔ)音段是否為特定說(shuō)話人的語(yǔ)音數(shù)據(jù);
[0026]如果是,則確定所述語(yǔ)音段為關(guān)鍵信息段。
[0027]優(yōu)選地,所述根據(jù)各語(yǔ)音段的聲紋特征確定所述語(yǔ)音段是否為關(guān)鍵信息段包括:
[0028]如果所述待播放語(yǔ)音數(shù)據(jù)包含多個(gè)說(shuō)話人的語(yǔ)音數(shù)據(jù),則通過(guò)說(shuō)話人分離技術(shù),確定主說(shuō)話人;
[0029]將所述主說(shuō)話人的語(yǔ)音段作為關(guān)鍵信息段。
[0030]優(yōu)選地,所述根據(jù)所述關(guān)鍵信息段對(duì)所述待播放語(yǔ)音數(shù)據(jù)的語(yǔ)速進(jìn)行調(diào)整包括:
[0031]如果當(dāng)前語(yǔ)音段為關(guān)鍵信息段,則采用正常語(yǔ)速播放所述當(dāng)前語(yǔ)音段,否則采用快語(yǔ)速播放所述當(dāng)前語(yǔ)音段;或者
[0032]如果當(dāng)前語(yǔ)音段為關(guān)鍵信息段,則采用慢語(yǔ)速播放所述當(dāng)前語(yǔ)音段,否則采用正常語(yǔ)速或快語(yǔ)速播放所述當(dāng)前語(yǔ)音段。
[0033]優(yōu)選地,所述方法還包括:
[0034]獲取各語(yǔ)音段的置信度;
[0035]對(duì)所述待播放語(yǔ)音數(shù)據(jù)的語(yǔ)速進(jìn)行調(diào)整具體為:根據(jù)所述關(guān)鍵信息段及各語(yǔ)音段的置信度對(duì)所述待播放語(yǔ)音數(shù)據(jù)的語(yǔ)速進(jìn)行調(diào)整。
[0036]優(yōu)選地,所述根據(jù)所述關(guān)鍵信息段及各語(yǔ)音段的置信度對(duì)所述待播放語(yǔ)音數(shù)據(jù)的語(yǔ)速進(jìn)行調(diào)整包括:
[0037]如果當(dāng)前語(yǔ)音段為關(guān)鍵信息段,則如果其置信度大于第二閾值,則采用快語(yǔ)速播放所述當(dāng)前語(yǔ)音段,否則采用慢語(yǔ)速播放所述當(dāng)前語(yǔ)音段;
[0038]如果當(dāng)前語(yǔ)音段為非關(guān)鍵信息段,則如果其置信度大于第二閾值,則略過(guò)所述當(dāng)前語(yǔ)音段;如果其置信度小于等于第一閾值,則采用慢語(yǔ)速播放所述當(dāng)前語(yǔ)音段,所述第一閾值小于所述第二閾值。
[0039]優(yōu)選地,所述方法還包括:
[0040]對(duì)各語(yǔ)音段進(jìn)行語(yǔ)音信號(hào)層面的分析,所述語(yǔ)音信號(hào)層面的分析包括以下任意一種或多種:音量變化情況、混響情況、噪聲情況;
[0041]在播放所述待播放語(yǔ)音數(shù)據(jù)時(shí),根據(jù)分析結(jié)果對(duì)所述語(yǔ)音段進(jìn)行優(yōu)化處理,所述優(yōu)化處理包括以下任意一種或多種:
[0042](1)如果當(dāng)前語(yǔ)音段中有連續(xù)多幀語(yǔ)音數(shù)據(jù)的幅值超過(guò)上限值,則調(diào)低當(dāng)前語(yǔ)音段的幅值;如果當(dāng)前語(yǔ)音段中有連續(xù)多幀語(yǔ)音數(shù)據(jù)的幅值低于下限值,則調(diào)高當(dāng)前語(yǔ)音段的幅值;
[0043](2)如果當(dāng)前語(yǔ)音段的混響時(shí)間超過(guò)閾值,則對(duì)當(dāng)前語(yǔ)音段進(jìn)行混響消除;
[0044](3)如果當(dāng)前語(yǔ)音段的信噪比小于信噪比閾值,則對(duì)當(dāng)前語(yǔ)音段進(jìn)行去噪處理。
[0045]—種語(yǔ)音播放裝置,包括:
[0046]接收模塊,用于接收待播放語(yǔ)音數(shù)據(jù);
[0047]端點(diǎn)檢測(cè)模塊,用于對(duì)所述待播放語(yǔ)音數(shù)據(jù)進(jìn)行端點(diǎn)檢測(cè),得到各語(yǔ)音段;
[0048]關(guān)鍵信息段確定模塊,包括第一確定模塊和/或第二確定模塊,所述第一確定模塊用于根據(jù)各語(yǔ)音段的語(yǔ)音內(nèi)容確定所述語(yǔ)音段是否為關(guān)鍵信息段,所述第二確定模塊用于根據(jù)各語(yǔ)音段的聲紋特征確定所述語(yǔ)音段是否為關(guān)鍵信息段;
[0049]播放模塊,用于播放所述待播放語(yǔ)音數(shù)據(jù);
[0050]語(yǔ)速調(diào)整模塊,用于在所述播放模塊播放所述待播放語(yǔ)音數(shù)據(jù)時(shí),根據(jù)所述關(guān)鍵信息段對(duì)所述待播放語(yǔ)音數(shù)據(jù)的語(yǔ)速進(jìn)行調(diào)整。
[0051]優(yōu)選地,所述第一確定模塊包括:
[0052]語(yǔ)音識(shí)別單元,用于對(duì)各語(yǔ)音段進(jìn)行語(yǔ)音識(shí)別,得到各語(yǔ)音段的識(shí)別文本;
[0053]確定單元,用于根據(jù)各語(yǔ)音段的識(shí)別文本,確定所述語(yǔ)音段是否為關(guān)鍵信息段。
[0054]優(yōu)選地,所述確定單元,具體用于確定各語(yǔ)音段的識(shí)別文本是否包含預(yù)置的關(guān)鍵詞;如果是,則確定所述語(yǔ)音段為關(guān)鍵信息段。
[0055]優(yōu)選地,所述確定單元包括:
[0056]迭代次數(shù)設(shè)定子單元,用于設(shè)置迭代次數(shù);
[0057]摘要抽取子單元,用于采用迭代方式從所有語(yǔ)音段中抽取摘要語(yǔ)音段;
[0058]判斷子單元,用于判斷是否達(dá)到設(shè)定的迭代次數(shù),并在達(dá)到設(shè)定的迭代次數(shù)后,觸發(fā)所述摘要抽取子單元停止迭代過(guò)程;
[0059]關(guān)鍵信息段獲取子單元,用于在所述摘要抽取子單元停止迭代過(guò)程后,獲取當(dāng)前所有的摘要語(yǔ)音段,并將其作為關(guān)鍵信息段。
[0060]優(yōu)選地,所述摘要抽取子單元包括:
[0061]第一計(jì)算子單元,用于計(jì)算當(dāng)前語(yǔ)音段的識(shí)別文本與所述待播放語(yǔ)音數(shù)據(jù)的識(shí)別文本的相似度,得到第一計(jì)算值;
[0062]第二計(jì)算子單元,用于計(jì)算所述當(dāng)前語(yǔ)音段的識(shí)別文本與已抽取摘要語(yǔ)音段識(shí)別文本的相似度,得到第二計(jì)算值;
[0063]差值計(jì)算子單元,用于計(jì)算第一計(jì)算值與第二計(jì)算值的差值,得到當(dāng)前語(yǔ)音段的摘要得分;
[0064]選擇子單元,用于在得到所有語(yǔ)音段的摘要得分后,選擇摘要得分最大的語(yǔ)音段作為摘要語(yǔ)音段。
[0065]優(yōu)選地,所述第二確定模塊包括:
[0066]聲紋特征提取單元,用于在所述待播放語(yǔ)音數(shù)據(jù)包含多個(gè)說(shuō)話人的語(yǔ)音數(shù)據(jù)時(shí),提取各語(yǔ)音段的聲紋特征;
[0067]聲紋識(shí)別單元,用于根據(jù)所述聲紋特征及特定說(shuō)話人的聲紋模型,確定所述語(yǔ)音段是否為特定說(shuō)話人的語(yǔ)音數(shù)據(jù);如果是,則確定所述語(yǔ)音段為關(guān)鍵信息段。
[0068]優(yōu)選地,所述第二確定模塊包括:
[0069]聲紋特征提取單元,用于在所述待播放語(yǔ)音數(shù)據(jù)包含多個(gè)說(shuō)話人的語(yǔ)音數(shù)據(jù)時(shí),提取各
當(dāng)前第1頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1