亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種韻律標(biāo)注的方法及專用標(biāo)注設(shè)備的制作方法

文檔序號(hào):2825273閱讀:207來(lái)源:國(guó)知局
專利名稱:一種韻律標(biāo)注的方法及專用標(biāo)注設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般地涉及語(yǔ)音數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其是一種韻律標(biāo)注的方法及專用標(biāo)注設(shè)備。
背景技術(shù)
帶有韻律標(biāo)注的聲音資源庫(kù),是語(yǔ)音識(shí)別或者從文本到語(yǔ)音(Text ToSpeech,TTS)領(lǐng)域不可或缺的知識(shí)訓(xùn)練源。目前現(xiàn)有技術(shù)在進(jìn)行韻律標(biāo)注時(shí),有一種是利用生語(yǔ)料和標(biāo)點(diǎn)符號(hào)信息生成統(tǒng)計(jì)概率模型,再根據(jù)該模型進(jìn)行韻律標(biāo)注;但是因?yàn)樯傻慕y(tǒng)計(jì)概率模型不夠準(zhǔn)確,所以進(jìn)行韻律標(biāo)注的結(jié)果也不夠精確;還有一種現(xiàn)有技術(shù)將用戶的真實(shí)聲音作為訓(xùn)練數(shù)據(jù),根據(jù)發(fā)聲規(guī)則和統(tǒng)計(jì)出的音素長(zhǎng)度來(lái)生成規(guī)則韻律信息;但是用戶會(huì)出現(xiàn)疲累的狀態(tài),這樣就會(huì) 使得生成的規(guī)則韻律信息不夠通用??傊?,采用現(xiàn)有技術(shù)進(jìn)行韻律標(biāo)注都不能有效生成準(zhǔn)確的音頻標(biāo)注信息,進(jìn)而也使得語(yǔ)音合成的準(zhǔn)確度或者流暢程度都不滿足實(shí)際需求。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供了一種韻律標(biāo)注的方法及專用標(biāo)注設(shè)備,能夠方便得生成準(zhǔn)確的音頻標(biāo)注信息,進(jìn)而也使得語(yǔ)音合成的準(zhǔn)確度或者流暢程度都能夠滿足實(shí)際需求。根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供一種專用標(biāo)注設(shè)備,包括接收模塊,用于接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào);播放模塊,用于依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù);記錄模塊,用于在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與所述標(biāo)注者的標(biāo)注行為相關(guān)的信息;生成模塊,用于根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信肩、O根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供一種韻律標(biāo)注的方法,包括接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào);依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù);在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與標(biāo)注者的標(biāo)注行為相關(guān)的信息;根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息。另外,根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種存儲(chǔ)介質(zhì)。所述存儲(chǔ)介質(zhì)包括機(jī)器可讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時(shí),所述程序代碼使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述一種韻律標(biāo)注的方法。此外,根據(jù)本發(fā)明實(shí)施例的再一方面,還提供了一種程序產(chǎn)品。所述程序產(chǎn)品包括機(jī)器可執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令時(shí),所述指令使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述一種韻律標(biāo)注的方法。
根據(jù)本發(fā)明實(shí)施例的上述方法,可以通過(guò)多次向標(biāo)注者播放音頻數(shù)據(jù)的方式,能夠在標(biāo)注者熟悉音頻數(shù)據(jù)之后,再觸發(fā)音頻數(shù)據(jù)的標(biāo)注過(guò)程,并且通過(guò)重復(fù)標(biāo)注的方式,可以使得采用本實(shí)施例得到的音頻標(biāo)注數(shù)據(jù)更準(zhǔn)確,進(jìn)而也使得采用音頻標(biāo)注數(shù)據(jù)進(jìn)行語(yǔ)音合成的準(zhǔn)確度或者流暢程度都能夠滿足實(shí)際需求。并且,還能夠?qū)δ骋粋€(gè)標(biāo)注者所標(biāo)注的所有音頻標(biāo)注信息進(jìn)行可信權(quán)重處理,這樣就能進(jìn)一步評(píng)估音頻標(biāo)注信息的精確度和準(zhǔn)確性,從而為后續(xù)的語(yǔ)音合成等應(yīng)用打下基礎(chǔ)。在下面的說(shuō)明書(shū)部分中給出本發(fā)明實(shí)施例的其他方面,其中,詳細(xì)說(shuō)明用于充分地公開(kāi)本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,而不對(duì)其施加限定。


下面結(jié)合具體的實(shí)施例,并參照附圖,對(duì)本發(fā)明實(shí)施例的上述和其它目的和優(yōu)點(diǎn)做進(jìn)一步的描述。在附圖中,相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖標(biāo)記來(lái)表示。
圖I是示出作為本發(fā)明實(shí)施例提供的第一種韻律標(biāo)注的方法流程圖;圖2是示出作為第一種方法實(shí)施例中步驟S102的流程圖;圖3是示出作為第一種方法實(shí)施例中步驟S103的流程圖;圖4是示出作為本發(fā)明實(shí)施例提供的第二種韻律標(biāo)注的方法流程圖;圖5是示出作為本發(fā)明實(shí)施例提供的第三種韻律標(biāo)注的方法流程圖;圖6是示出作為第三種方法實(shí)施例中步驟S506的流程圖;圖7是示出作為第三種方法實(shí)施例中步驟S507的流程圖;圖8是示出作為本發(fā)明實(shí)施例提供的韻律標(biāo)注的裝置的示意圖;圖9是示出作為韻律裝置實(shí)施例中專用標(biāo)注設(shè)備的界面的示意圖;圖10是示出作為韻律裝置實(shí)施例中記錄模塊603的示意圖;圖11是示出作為本發(fā)明的實(shí)施例中所采用的信息處理設(shè)備的個(gè)人計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
具體實(shí)施例方式下面參照附圖來(lái)說(shuō)明本發(fā)明的實(shí)施例。具體的,參見(jiàn)圖1,本發(fā)明實(shí)施例提供的第一種韻律標(biāo)注的方法可以包括SlOl :接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào)。在本發(fā)明實(shí)施例中,待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí)可以采用音頻數(shù)據(jù)的批次或者數(shù)據(jù)條目號(hào)來(lái)表示,這樣就可以通過(guò)選擇需要標(biāo)注的批次和/或數(shù)據(jù)條目號(hào)來(lái)確定出待標(biāo)注的音頻數(shù)據(jù)。其中,待標(biāo)注的音頻數(shù)據(jù)可以使用無(wú)線上網(wǎng)模塊從互聯(lián)網(wǎng)進(jìn)行下載,或者可以使用USB模塊從本地下載,待標(biāo)注的音頻數(shù)據(jù)的獲取方式可以有多種,本發(fā)明實(shí)施例中對(duì)此不做限定。S102 :依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù)。當(dāng)選擇音頻數(shù)據(jù)標(biāo)識(shí)之后,就可以確定出待標(biāo)注的音頻數(shù)據(jù),此時(shí),再向標(biāo)注者播放選擇的音頻數(shù)據(jù)。需要說(shuō)明的是,這里的標(biāo)注者可以由自然人來(lái)實(shí)現(xiàn),也可以采用具有標(biāo)注功能的實(shí)體來(lái)實(shí)現(xiàn)。具體的,參考圖2所示,所述步驟S102在實(shí)際應(yīng)用中可以包括S201 :依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者第一次播放相對(duì)應(yīng)的音頻數(shù)據(jù)。在播放音頻數(shù)據(jù)過(guò)程中,可以采取反復(fù)播放的方式,這樣可以提高標(biāo)注的準(zhǔn)確度。因此首先向標(biāo)注者第一次播放相對(duì)應(yīng)的音頻數(shù)據(jù)。S202 :在停頓第一預(yù)定時(shí)間段之后,向標(biāo)注者第二次播放所述音頻數(shù)據(jù)。所述第一預(yù)定時(shí)間段可以設(shè)置為兩秒,這樣就可以給標(biāo)注者一個(gè)適應(yīng)時(shí)間,提高標(biāo)注的注意力。S203 :在停頓第二預(yù)定時(shí)間段之后,向標(biāo)注者第三次播放所述音頻數(shù)據(jù)。 所述第二預(yù)定時(shí)間段可以設(shè)置為三秒,其與第一預(yù)定時(shí)間段起到相同的作用。回到圖1,在步驟S103 :在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與標(biāo)注者的標(biāo)注行為相關(guān)的信息。在向標(biāo)注者播放兩次待標(biāo)注的音頻數(shù)據(jù)的情況下,檢測(cè)標(biāo)注者是否觸發(fā)了標(biāo)注過(guò)程,如果標(biāo)注者觸發(fā)了標(biāo)注過(guò)程,則記錄與標(biāo)注者的標(biāo)注行為相關(guān)的信息,所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息具體可以為觸發(fā)時(shí)間點(diǎn)和停頓時(shí)長(zhǎng)信息,即是標(biāo)注者觸發(fā)標(biāo)注按鍵的時(shí)間點(diǎn)和每一次觸發(fā)的時(shí)長(zhǎng)。在標(biāo)注者沒(méi)有觸發(fā)標(biāo)注過(guò)程的情況下,則不做任何其他的相關(guān)處理,繼續(xù)播放所述音頻數(shù)據(jù),直至標(biāo)注者觸發(fā)了標(biāo)注過(guò)程再開(kāi)始記錄標(biāo)注信息,例如初始觸發(fā)時(shí)間點(diǎn)和初始停頓時(shí)長(zhǎng)信息等等。具體的,參考圖3所示,所述步驟S103在實(shí)際應(yīng)用中可以包括S301 :在第三次播放所述音頻數(shù)據(jù)的過(guò)程中,檢測(cè)標(biāo)注者是否觸發(fā)了標(biāo)注過(guò)程,如果是,則進(jìn)入步驟S302,如果否,則進(jìn)入步驟S304。需要說(shuō)明的是,檢測(cè)標(biāo)注者是否觸發(fā)了標(biāo)注過(guò)程,可以通過(guò)檢測(cè)標(biāo)注者是否觸發(fā)標(biāo)注按鍵來(lái)實(shí)現(xiàn),具體的介紹可以參考下一個(gè)實(shí)施例。S302 :記錄初始觸發(fā)時(shí)間點(diǎn)和初始停頓時(shí)長(zhǎng)信息。記錄初始觸發(fā)時(shí)間點(diǎn)和初始停頓時(shí)長(zhǎng)信息,需要說(shuō)明的是,在S302中記錄的初始觸發(fā)時(shí)間點(diǎn)和初始停頓時(shí)長(zhǎng)信息可以認(rèn)為是模擬過(guò)程,因?yàn)樵诘谒拇尾シ乓纛l數(shù)據(jù)的過(guò)程中記錄的觸發(fā)時(shí)間點(diǎn)和停頓時(shí)長(zhǎng)信息作為最終的音頻標(biāo)注數(shù)據(jù)。S303:第三次播放音頻數(shù)據(jù)完畢時(shí),停頓第三預(yù)定時(shí)間段,并在向標(biāo)注者第四次播放所述音頻數(shù)據(jù)的過(guò)程中,記錄最終觸發(fā)時(shí)間點(diǎn)和最終停頓時(shí)長(zhǎng)信息。所述第三預(yù)定時(shí)間段具體可以設(shè)置為一秒。需要說(shuō)明的是,在S303中記錄的最終觸發(fā)時(shí)間點(diǎn)和最終停頓時(shí)長(zhǎng)信息也可以與S302中的初始觸發(fā)時(shí)間點(diǎn)和初始停頓時(shí)長(zhǎng)信息進(jìn)行比較,或者取其平均值作為最終的音頻標(biāo)注數(shù)據(jù)都是可行的,具體可以根據(jù)實(shí)際情況或者用戶需求適應(yīng)性調(diào)整。S304 :不做任何其他的相關(guān)處理,繼續(xù)播放所述音頻數(shù)據(jù)。回到圖1,在步驟S104 :根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息。在本實(shí)施例中,可以采用將在第四次播放所述音頻數(shù)據(jù)過(guò)程中記錄的所述最終觸發(fā)時(shí)間點(diǎn)和最終停頓時(shí)長(zhǎng)信息作為音頻標(biāo)注信息的方式。
需要說(shuō)明的是,在本申請(qǐng)實(shí)施例中提及的預(yù)定時(shí)間段,都可以根據(jù)不同的實(shí)際需求進(jìn)行適應(yīng)性調(diào)整,本申請(qǐng)實(shí)施例就不再進(jìn)行限定。通過(guò)上述第一種韻律標(biāo)注的方法,可以通過(guò)多次向標(biāo)注者播放音頻數(shù)據(jù)的方式,能夠在標(biāo)注者熟悉音頻數(shù)據(jù)之后,再觸發(fā)音頻數(shù)據(jù)的標(biāo)注過(guò)程,并且通過(guò)重復(fù)標(biāo)注的方式,可以使得采用本實(shí)施例得到的音頻標(biāo)注數(shù)據(jù)更準(zhǔn)確,進(jìn)而也使得采用音頻標(biāo)注數(shù)據(jù)進(jìn)行語(yǔ)音合成的準(zhǔn)確度或者流暢程度都能夠滿足實(shí)際需求。具體的,參見(jiàn)圖4,本發(fā)明實(shí)施例提供了另一種韻律標(biāo)注的方法,可以包括
S401 :通過(guò)專用標(biāo)注設(shè)備的界面接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào)。在本實(shí)施例中,具體可以通過(guò)專用設(shè)備的界面來(lái)接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)也可以包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào)。S402 :依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù)。本步驟與第一種韻律標(biāo)注的方法實(shí)施例類似,在此不再贅述。S403:通過(guò)檢測(cè)標(biāo)注者是否觸發(fā)所述專用標(biāo)注設(shè)備的界面上的標(biāo)注按鈕來(lái)檢測(cè)是否觸發(fā)了標(biāo)注過(guò)程。在本實(shí)施例中,具體通過(guò)檢測(cè)標(biāo)注者是否觸發(fā)了專用標(biāo)注設(shè)備的界面上的標(biāo)注按鈕來(lái)檢測(cè)是否觸發(fā)了標(biāo)注過(guò)程。如果能夠接收到標(biāo)注者在標(biāo)注按鈕上的觸發(fā)信息,則認(rèn)為標(biāo)注者已經(jīng)觸發(fā)了標(biāo)注過(guò)程,這樣就可以通過(guò)檢測(cè)標(biāo)注按鈕的觸發(fā)信息來(lái)檢測(cè)是否開(kāi)始進(jìn)行標(biāo)注。S404:在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與標(biāo)注者的標(biāo)注行為相關(guān)的信息。S405:根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信
肩、OS406:將所述記錄的音頻標(biāo)注信息保存為可以用于網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)格式。在生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息之后,還將所述音頻標(biāo)注信息保存為可以用于網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)格式,例如可擴(kuò)展標(biāo)記語(yǔ)言(XML,Extensible Markup Language)格式的文件,可以將音頻標(biāo)注信息保存在存儲(chǔ)器中,每條聲音數(shù)據(jù)可以只保留最新的標(biāo)注記錄。通過(guò)本實(shí)施例中,如果待標(biāo)注的音頻數(shù)據(jù)有更新,則可以通過(guò)網(wǎng)絡(luò)下載或者本地下載重復(fù)執(zhí)行標(biāo)注流程,最后保存的音頻標(biāo)注信息可以通過(guò)USB接口導(dǎo)出或者通過(guò)網(wǎng)絡(luò)上傳到服務(wù)端。本實(shí)施例除了能夠方便得生成準(zhǔn)確的音頻標(biāo)注信息,進(jìn)而也使得語(yǔ)音合成的準(zhǔn)確度或者流暢程度都能夠滿足實(shí)際需求之外,還可以方便得通過(guò)檢測(cè)標(biāo)注按鈕的觸發(fā)信息來(lái)監(jiān)控是否需要進(jìn)行標(biāo)注,以及能夠方便的在網(wǎng)絡(luò)上實(shí)現(xiàn)音頻標(biāo)注信息的共享和發(fā)布。具體的,參見(jiàn)圖5,本發(fā)明實(shí)施例提供了第三種韻律標(biāo)注的方法,可以包括S501 :接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào)。S502 :依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù)。S503 :在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與標(biāo)注者的標(biāo)注行為相關(guān)的信息。S504:根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息。S505 :從任一標(biāo)注者的音頻標(biāo)注信息集合中抽取出至少兩個(gè)音頻標(biāo)注信息樣本。在本實(shí)施例中,在生成音頻標(biāo)注信息之后,針對(duì)任一個(gè)標(biāo)注者,還可以對(duì)其所有的音頻標(biāo)注信息進(jìn)行可信權(quán)重處理,用來(lái)檢測(cè)音頻標(biāo)注信息的可信程度。首先需要從任一標(biāo)注者的音頻標(biāo)注信息集合中抽取出至少兩個(gè)音頻標(biāo)注信息樣本。S506:依據(jù)所述至少兩個(gè)音頻標(biāo)注信息樣本獲取所述任一標(biāo)注者的標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)。在本步驟中需要依據(jù)抽取出的至少兩個(gè)音頻標(biāo)注信息樣本計(jì)算該任一標(biāo)注者的標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)。參考圖6所示,具體的,所述步驟S506在實(shí)際應(yīng)用中可以包括S601 :獲取每一個(gè)音頻標(biāo)注信息樣本中子標(biāo)注時(shí)長(zhǎng)的最小值。在實(shí)際應(yīng)用中,假設(shè)抽取出N條音頻標(biāo)注信息樣本,而每條標(biāo)注信息則有M個(gè)子標(biāo)注時(shí)長(zhǎng),則本步驟分別獲取N個(gè)子標(biāo)注時(shí)長(zhǎng)集合的最小值Min (T1, T2. . . Tn),獲取N個(gè)最小時(shí)長(zhǎng)信息。S602:依據(jù)獲取到的最小值計(jì)算每條音頻標(biāo)注信息中子標(biāo)注時(shí)長(zhǎng)的標(biāo)準(zhǔn)差值。依據(jù)所述N個(gè)最小的子標(biāo)注時(shí)長(zhǎng)信息,計(jì)算子標(biāo)注時(shí)長(zhǎng)的標(biāo)準(zhǔn)差值E。在本步驟中計(jì)算標(biāo)準(zhǔn)差值可以采用現(xiàn)有的計(jì)算公式,在此不再一一列舉額。S603:將最小的標(biāo)準(zhǔn)差值所對(duì)應(yīng)的音頻標(biāo)注信息中最小的子標(biāo)注時(shí)長(zhǎng)作為所述任一標(biāo)注者的標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)。因?yàn)橛?jì)算出的標(biāo)準(zhǔn)差值有N個(gè),所以將N個(gè)標(biāo)準(zhǔn)差值中最小的那個(gè)標(biāo)準(zhǔn)差值Min(E)所對(duì)應(yīng)的音頻標(biāo)注信息中最小的子標(biāo)注時(shí)長(zhǎng)作為所述任一標(biāo)注者的標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)Pi0S507:利用所述標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)對(duì)所述任一標(biāo)注者的音頻標(biāo)注信息集合進(jìn)行可信權(quán)
重處理。在步驟S603得到標(biāo)注者的標(biāo)注基準(zhǔn)時(shí)長(zhǎng)之后,利用標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)對(duì)該標(biāo)注者的音頻標(biāo)注信息集合進(jìn)行可信權(quán)重處理。參考圖7,所述步驟S507具體可以包括S701 :依據(jù)該標(biāo)注者的前N條音頻標(biāo)注信息的N個(gè)最小子標(biāo)注時(shí)長(zhǎng),計(jì)算所述N個(gè)最小子標(biāo)注時(shí)長(zhǎng)與所述基準(zhǔn)標(biāo)注時(shí)長(zhǎng)的標(biāo)準(zhǔn)差;其中,N為大于I的自然數(shù)。在本步驟中,每個(gè)用戶有一個(gè)標(biāo)準(zhǔn)基準(zhǔn)時(shí)長(zhǎng)Pi,再根據(jù)每個(gè)用戶標(biāo)注N條音頻數(shù)據(jù)的N條最小子標(biāo)注時(shí)長(zhǎng)Ti計(jì)算該N條最小子標(biāo)注時(shí)長(zhǎng)的標(biāo)準(zhǔn)差,計(jì)算公式如下
權(quán)利要求
1.一種專用標(biāo)注設(shè)備,包括 接收模塊,用于接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào); 播放模塊,用于依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù); 記錄模塊,用于在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與所述標(biāo)注者的標(biāo)注行為相關(guān)的信息; 生成模塊,用于根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息。
2.根據(jù)權(quán)利要求I所述的設(shè)備,所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息具體為觸發(fā)時(shí)間點(diǎn)和停頓時(shí)長(zhǎng)信息。
3.根據(jù)權(quán)利要求2所述的設(shè)備,所述播放模塊具體配置為 依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者第一次播放相對(duì)應(yīng)的音頻數(shù)據(jù); 在停頓第一預(yù)定時(shí)間段之后,向標(biāo)注者第二次播放所述音頻數(shù)據(jù);以及 在停頓第二預(yù)定時(shí)間段之后,向標(biāo)注者第三次播放所述音頻數(shù)據(jù)。
4.根據(jù)權(quán)利要求2所述的設(shè)備,所述記錄模塊包括 檢測(cè)子模塊,用于在第三次播放所述音頻數(shù)據(jù)時(shí),檢測(cè)標(biāo)注者是否觸發(fā)了標(biāo)注過(guò)程; 第一記錄子模塊,用于在所述檢測(cè)子模塊的結(jié)果為是時(shí),記錄初始觸發(fā)時(shí)間點(diǎn)和初始停頓時(shí)長(zhǎng)信息; 第二記錄子模塊,用于在第三次播放音頻數(shù)據(jù)完畢時(shí),停頓第三預(yù)定時(shí)間段,并在向標(biāo)注者第四次播放所述音頻數(shù)據(jù)的過(guò)程中,記錄最終初始觸發(fā)時(shí)間點(diǎn)和停頓時(shí)長(zhǎng)信息。
5.根據(jù)權(quán)利要求2所述的設(shè)備,所述生成模塊具體配置為 將在第四次播放所述音頻數(shù)據(jù)過(guò)程中記錄的所述最終觸發(fā)時(shí)間點(diǎn)和最終停頓時(shí)長(zhǎng)信息作為音頻標(biāo)注信息。
6.根據(jù)權(quán)利要求I所述的設(shè)備,所述接收模塊具體配置為 通過(guò)專用標(biāo)注設(shè)備的界面接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí)。
7.根據(jù)權(quán)利要求4所述的設(shè)備,所述檢測(cè)子模塊具體配置為 通過(guò)檢測(cè)標(biāo)注者是否觸發(fā)所述專用標(biāo)注設(shè)備的界面上的標(biāo)注按鈕來(lái)檢測(cè)是否觸發(fā)了標(biāo)注過(guò)程。
8.根據(jù)權(quán)利要求I所述的設(shè)備,所述專用標(biāo)注設(shè)備的界面的長(zhǎng)寬比例為2 1,所述標(biāo)注按鈕在所述專用標(biāo)注設(shè)備的界面上的位置采用黃金分割比設(shè)置,至少一個(gè)播放控制按鈕位于所述標(biāo)注按鈕下方2-3厘米處呈正方形排列,該播放控制按鈕用于控制所述音頻數(shù)據(jù)的播放順序;除所述播放控制按鈕之外的其他按鍵設(shè)置在所述專用標(biāo)注設(shè)備的界面的四周。
9.一種韻律標(biāo)注的方法,包括 接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào); 依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù); 在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與標(biāo)注者的標(biāo)注行為相關(guān)的信息;根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息。
10.根據(jù)權(quán)利要求I所述的方法,所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息具體為觸發(fā)時(shí)間點(diǎn)和停頓時(shí)長(zhǎng)信息。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種韻律標(biāo)注的方法及專用標(biāo)注設(shè)備,所述方法包括接收模塊,用于接收待標(biāo)注的音頻數(shù)據(jù)標(biāo)識(shí),所述音頻數(shù)據(jù)標(biāo)識(shí)包括音頻數(shù)據(jù)的批次和/或數(shù)據(jù)條目號(hào);播放模塊,用于依據(jù)所述音頻數(shù)據(jù)標(biāo)識(shí)向標(biāo)注者播放相對(duì)應(yīng)的音頻數(shù)據(jù);記錄模塊,用于在檢測(cè)到所述標(biāo)注者觸發(fā)了標(biāo)注過(guò)程的情況下,記錄與所述標(biāo)注者的標(biāo)注行為相關(guān)的信息;生成模塊,用于根據(jù)所述與標(biāo)注者的標(biāo)注行為相關(guān)的信息生成所述音頻數(shù)據(jù)的音頻標(biāo)注信息。通過(guò)本發(fā)明實(shí)施例,能夠使標(biāo)注的音頻標(biāo)注數(shù)據(jù)更準(zhǔn)確,進(jìn)而也使得采用音頻標(biāo)注數(shù)據(jù)進(jìn)行語(yǔ)音合成的準(zhǔn)確度或者流暢程度都能夠滿足實(shí)際需求。本發(fā)明實(shí)施例提供的專用標(biāo)注設(shè)備也更適合盲人使用。
文檔編號(hào)G10L15/22GK102881285SQ20111020428
公開(kāi)日2013年1月16日 申請(qǐng)日期2011年7月15日 優(yōu)先權(quán)日2011年7月15日
發(fā)明者張波, 孟遙, 于浩 申請(qǐng)人:富士通株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1