一種智能軟件的語(yǔ)音播報(bào)系統(tǒng)及語(yǔ)音播報(bào)方法_3

文檔序號(hào)：9668707閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種智能軟件的語(yǔ)音播報(bào)系統(tǒng)及語(yǔ)音播報(bào)方法

漲”，需要被念成“跌”，指數(shù)“3542”需要被念成“三千五百四十二點(diǎn)”，等等，這些需要對(duì)采集的文字信息進(jìn)行特殊的處理，使其適合股票領(lǐng)域的特定讀法，即股票領(lǐng)域的語(yǔ)義解析。具體包括:
[0067]首先，對(duì)采集到的文字信息進(jìn)行基于特定規(guī)則的正則化，比如基于”念成“點(diǎn)”、“ % ”念成“百分之”等特定規(guī)則，將“ 1.2%”正則化為“百分之一點(diǎn)二”，然后輸出經(jīng)正規(guī)化的文字信息，如“百分之一點(diǎn)二” ；
[0068]然后，對(duì)經(jīng)正則化的文字信息進(jìn)行標(biāo)注，比如，將“百分之一點(diǎn)二”標(biāo)注為“baifenzhiyidianer”，及更進(jìn)一步的音素級(jí)別詞性韻律標(biāo)注，轉(zhuǎn)化為經(jīng)標(biāo)注的具有特定讀法的文本信息。
[0069]步驟S003:建立和存儲(chǔ)聲音模型，包括:
[0070]首先，采集2-3個(gè)小時(shí)某播報(bào)人的聲音作為聲音數(shù)據(jù)源，對(duì)采集的該聲音數(shù)據(jù)源進(jìn)行語(yǔ)音標(biāo)注前端處理，得到文本標(biāo)注信息；
[0071]其次，提取文本標(biāo)注信息的基頻和頻譜的聲學(xué)特征；
[0072]接著，基于HMM的參數(shù)聚類和訓(xùn)練，形成聲學(xué)特征的聲音模型；
[0073]最后，存儲(chǔ)聲音模型。
[0074]通過(guò)建立不同音色的播報(bào)人(可以是具有瓦力機(jī)器人音色播報(bào)人，也可以是類似蠟筆小新、櫻桃小丸子等卡通人物的音色，也可以是時(shí)下網(wǎng)絡(luò)當(dāng)紅的名人聲音)的聲音模型，并進(jìn)行存儲(chǔ)，可以為后續(xù)的語(yǔ)音合成提供事先訓(xùn)練好的發(fā)音人的聲音模型，以供隨時(shí)調(diào)用，實(shí)現(xiàn)特定音色的文本播報(bào)，為語(yǔ)音播報(bào)增添樂(lè)趣。
[0075]步驟S004:調(diào)用存儲(chǔ)的聲音模型，根據(jù)聲音模型和決策樹(shù)預(yù)測(cè)得到文本信息對(duì)應(yīng)的聲學(xué)參數(shù)，將聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件，包括:
[0076]首先，對(duì)達(dá)到的文本信息，如“今日大盤上漲三十五點(diǎn)六點(diǎn)”，進(jìn)行詞性分析和韻律預(yù)測(cè)；
[0077]接下來(lái)，發(fā)出合成需求，調(diào)用已訓(xùn)練好的播報(bào)人的存儲(chǔ)的聲音模型，根據(jù)該調(diào)用的聲音模型和決策樹(shù)預(yù)測(cè)得到經(jīng)詞性分析和韻律預(yù)測(cè)的文本信息對(duì)應(yīng)的聲學(xué)參數(shù)；
[0078]最后，將預(yù)測(cè)得到的聲學(xué)參數(shù)送到參數(shù)合成器中進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件，如“今日大盤上漲35.6點(diǎn)”的聲音。完成整個(gè)特定音色文本播報(bào)過(guò)程。
[0079]采用本發(fā)明的語(yǔ)音播報(bào)系統(tǒng)及語(yǔ)音播報(bào)方法，中老年人可以在股票軟件中查看某個(gè)股票，隨之該頁(yè)面上會(huì)出現(xiàn)播報(bào)插件，點(diǎn)擊開(kāi)關(guān)，則進(jìn)行該頁(yè)面基本情況的播報(bào)，如:股票代碼:600001，股票名稱:浦發(fā)銀行，當(dāng)前價(jià)格:十五點(diǎn)四零元。如用戶需要買賣操作，播報(bào)插件開(kāi)啟后，會(huì)對(duì)用戶的操作進(jìn)行播報(bào)確認(rèn)后再下單，防止誤操作。如:買入股票代碼600001，股票名稱浦發(fā)銀行，1000股，報(bào)單價(jià)格十六元整。用戶在收到播報(bào)信息后確認(rèn)無(wú)誤即可下單，這樣可以做到準(zhǔn)確方便。
[0080]以上結(jié)合附圖及實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明，本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說(shuō)明對(duì)本發(fā)明做出種種變化例。因而，實(shí)施例中的某些細(xì)節(jié)不應(yīng)構(gòu)成對(duì)本發(fā)明的限定，本發(fā)明將以所附權(quán)利要求書界定的范圍作為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種智能軟件的語(yǔ)音播報(bào)系統(tǒng)，其特征在于，包括: 文字信息采集模塊，用于采集智能軟件中的文字信息；文本前端處理模塊，與所述文字信息采集模塊連接，用于將采集的所述文字信息轉(zhuǎn)化為具有特定讀法的文本信息；模型存儲(chǔ)模塊，用于建立和存儲(chǔ)聲音模型；語(yǔ)音合成模塊，與所述文本前端處理模塊和所述模型存儲(chǔ)模塊連接，用于調(diào)用所述模型存儲(chǔ)模塊存儲(chǔ)的聲音模型，根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到所述文本前端處理模塊傳送的文本信息對(duì)應(yīng)的聲學(xué)參數(shù)，將所述聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件；以及語(yǔ)音播放模塊，與所述語(yǔ)音合成模塊連接，用于播放所述語(yǔ)音文件。2.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng)，其特征在于:所述文字信息采集模塊與智能播報(bào)客戶端通信連接，所述智能播報(bào)客戶端為安插在智能軟件中進(jìn)行文字信息的采集的插件。3.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng)，其特征在于，所述文本前端處理模塊包括: 正規(guī)規(guī)則設(shè)置單元，與所述文字信息采集模塊連接，用于對(duì)采集到的所述文字信息進(jìn)行基于特定規(guī)則的正則化；以及文本轉(zhuǎn)化標(biāo)注單元，與所述正規(guī)規(guī)則設(shè)置單元連接，用于對(duì)經(jīng)正則化的所述文字信息進(jìn)行標(biāo)注，轉(zhuǎn)化為經(jīng)標(biāo)注的具有特定讀法的文本信息。4.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng)，其特征在于，所述模型存儲(chǔ)模塊包括: 語(yǔ)音標(biāo)注前端處理單元，用于采集聲音數(shù)據(jù)源，對(duì)采集的所述聲音數(shù)據(jù)源進(jìn)行語(yǔ)音標(biāo)注前端處理，得到文本標(biāo)注信息；特征參數(shù)抽取單元，與所述語(yǔ)音標(biāo)注前端處理單元連接，用于提取所述文本標(biāo)注信息的基頻和頻譜的聲學(xué)特征；訓(xùn)練單元，與所述特征參數(shù)抽取單元連接，用于基于隱馬爾可夫模型的參數(shù)聚類和訓(xùn)練，形成所述聲學(xué)特征的聲音模型；以及模型存儲(chǔ)單元，與所述訓(xùn)練單元連接，用于存儲(chǔ)所述聲音模型。5.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng)，其特征在于，所述語(yǔ)音合成模塊包括: 標(biāo)注存儲(chǔ)單元，與所述文本前端處理模塊連接，用于對(duì)所述文本前端處理模塊傳送的文本信息進(jìn)行詞性分析和韻律預(yù)測(cè)；參數(shù)預(yù)測(cè)單元，與所述標(biāo)注存儲(chǔ)單元和所述模型存儲(chǔ)模塊連接，用于調(diào)用所述模型存儲(chǔ)模塊存儲(chǔ)的聲音模型，根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到經(jīng)詞性分析和韻律預(yù)測(cè)的所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù)；以及合成器合成語(yǔ)音單元，與所述參數(shù)預(yù)測(cè)單元連接，用于將所述聲學(xué)參數(shù)送到參數(shù)合成器中進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件。6.一種智能軟件的語(yǔ)音播報(bào)方法，其特征在于，包括: 采集智能軟件中的文字信息；將采集的所述文字信息轉(zhuǎn)化為具有特定讀法的文本信息；建立和存儲(chǔ)聲音模型；調(diào)用存儲(chǔ)的聲音模型，根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù)，將所述聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件；以及播放所述語(yǔ)音文件。7.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法，其特征在于，采集智能軟件中的文字信息，包括:在智能軟件中安插用于采集文字信息的智能播報(bào)客戶端。8.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法，其特征在于，將采集的文字信息轉(zhuǎn)化為具有特定讀法的文本信息，包括: 對(duì)采集到的文字信息進(jìn)行基于特定規(guī)則的正則化；以及對(duì)經(jīng)正則化的所述文字信息進(jìn)行標(biāo)注，轉(zhuǎn)化為經(jīng)標(biāo)注的具有特定讀法的文本信息。9.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法，其特征在于，建立和存儲(chǔ)聲音模型，包括: 采集聲音數(shù)據(jù)源，對(duì)采集的所述聲音數(shù)據(jù)源進(jìn)行語(yǔ)音標(biāo)注前端處理，得到文本標(biāo)注信息; 提取所述文本標(biāo)注信息的基頻和頻譜的聲學(xué)特征；基于隱馬爾可夫模型的參數(shù)聚類和訓(xùn)練，形成所述聲學(xué)特征的聲音模型；以及存儲(chǔ)所述聲音模型。10.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法，其特征在于，調(diào)用存儲(chǔ)的聲音模型，根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù)，將所述聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件，包括: 對(duì)文本信息進(jìn)行詞性分析和韻律預(yù)測(cè)；調(diào)用存儲(chǔ)的聲音模型，根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到經(jīng)詞性分析和韻律預(yù)測(cè)的所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù)；以及將所述聲學(xué)參數(shù)送到參數(shù)合成器中進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件。
【專利摘要】本發(fā)明公開(kāi)了一種智能軟件的語(yǔ)音播報(bào)系統(tǒng)及語(yǔ)音播報(bào)方法，語(yǔ)音播報(bào)系統(tǒng)包括：文字信息采集模塊，用于采集文字信息；文本前端處理模塊，與文字信息采集模塊連接，用于將文字信息轉(zhuǎn)化為具有特定讀法的文本信息；模型存儲(chǔ)模塊，用于建立和存儲(chǔ)聲音模型；語(yǔ)音合成模塊，與文本前端處理模塊和模型存儲(chǔ)模塊連接，用于調(diào)用聲音模型，根據(jù)聲音模型和決策樹(shù)預(yù)測(cè)得到文本信息對(duì)應(yīng)的聲學(xué)參數(shù)，將聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成，輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件；以及語(yǔ)音播放模塊，與語(yǔ)音合成模塊連接，用于播放語(yǔ)音文件。本發(fā)明綜合利用文本處理、參數(shù)建模、語(yǔ)音合成等技術(shù)，提供智能的手機(jī)端/平板端文本播報(bào)功能，實(shí)現(xiàn)特定音色的文本播報(bào)。
【IPC分類】H04M1/725, G10L13/02
【公開(kāi)號(hào)】CN105427855
【申請(qǐng)?zhí)枴緾N201510757022
【發(fā)明人】王程程, 劉青松
【申請(qǐng)人】上海語(yǔ)知義信息技術(shù)有限公司
【公開(kāi)日】2016年3月23日
【申請(qǐng)日】2015年11月9日

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第3頁(yè)1 2 3

相關(guān)技術(shù)