漲”,需要被念成“跌”,指數(shù)“3542”需要被念成“三千五百四十二點(diǎn)”,等等,這些需要對(duì)采集的文字信息進(jìn)行特殊的處理,使其適合股票領(lǐng)域的特定讀法,即股票領(lǐng)域的語(yǔ)義解析。具體包括:
[0067]首先,對(duì)采集到的文字信息進(jìn)行基于特定規(guī)則的正則化,比如基于”念成“點(diǎn)”、“ % ”念成“百分之”等特定規(guī)則,將“ 1.2%”正則化為“百分之一點(diǎn)二”,然后輸出經(jīng)正規(guī)化的文字信息,如“百分之一點(diǎn)二” ;
[0068]然后,對(duì)經(jīng)正則化的文字信息進(jìn)行標(biāo)注,比如,將“百分之一點(diǎn)二”標(biāo)注為“baifenzhiyidianer”,及更進(jìn)一步的音素級(jí)別詞性韻律標(biāo)注,轉(zhuǎn)化為經(jīng)標(biāo)注的具有特定讀法的文本信息。
[0069]步驟S003:建立和存儲(chǔ)聲音模型,包括:
[0070]首先,采集2-3個(gè)小時(shí)某播報(bào)人的聲音作為聲音數(shù)據(jù)源,對(duì)采集的該聲音數(shù)據(jù)源進(jìn)行語(yǔ)音標(biāo)注前端處理,得到文本標(biāo)注信息;
[0071]其次,提取文本標(biāo)注信息的基頻和頻譜的聲學(xué)特征;
[0072]接著,基于HMM的參數(shù)聚類和訓(xùn)練,形成聲學(xué)特征的聲音模型;
[0073]最后,存儲(chǔ)聲音模型。
[0074]通過(guò)建立不同音色的播報(bào)人(可以是具有瓦力機(jī)器人音色播報(bào)人,也可以是類似蠟筆小新、櫻桃小丸子等卡通人物的音色,也可以是時(shí)下網(wǎng)絡(luò)當(dāng)紅的名人聲音)的聲音模型,并進(jìn)行存儲(chǔ),可以為后續(xù)的語(yǔ)音合成提供事先訓(xùn)練好的發(fā)音人的聲音模型,以供隨時(shí)調(diào)用,實(shí)現(xiàn)特定音色的文本播報(bào),為語(yǔ)音播報(bào)增添樂(lè)趣。
[0075]步驟S004:調(diào)用存儲(chǔ)的聲音模型,根據(jù)聲音模型和決策樹(shù)預(yù)測(cè)得到文本信息對(duì)應(yīng)的聲學(xué)參數(shù),將聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件,包括:
[0076]首先,對(duì)達(dá)到的文本信息,如“今日大盤上漲三十五點(diǎn)六點(diǎn)”,進(jìn)行詞性分析和韻律預(yù)測(cè);
[0077]接下來(lái),發(fā)出合成需求,調(diào)用已訓(xùn)練好的播報(bào)人的存儲(chǔ)的聲音模型,根據(jù)該調(diào)用的聲音模型和決策樹(shù)預(yù)測(cè)得到經(jīng)詞性分析和韻律預(yù)測(cè)的文本信息對(duì)應(yīng)的聲學(xué)參數(shù);
[0078]最后,將預(yù)測(cè)得到的聲學(xué)參數(shù)送到參數(shù)合成器中進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件,如“今日大盤上漲35.6點(diǎn)”的聲音。完成整個(gè)特定音色文本播報(bào)過(guò)程。
[0079]采用本發(fā)明的語(yǔ)音播報(bào)系統(tǒng)及語(yǔ)音播報(bào)方法,中老年人可以在股票軟件中查看某個(gè)股票,隨之該頁(yè)面上會(huì)出現(xiàn)播報(bào)插件,點(diǎn)擊開(kāi)關(guān),則進(jìn)行該頁(yè)面基本情況的播報(bào),如:股票代碼:600001,股票名稱:浦發(fā)銀行,當(dāng)前價(jià)格:十五點(diǎn)四零元。如用戶需要買賣操作,播報(bào)插件開(kāi)啟后,會(huì)對(duì)用戶的操作進(jìn)行播報(bào)確認(rèn)后再下單,防止誤操作。如:買入股票代碼600001,股票名稱浦發(fā)銀行,1000股,報(bào)單價(jià)格十六元整。用戶在收到播報(bào)信息后確認(rèn)無(wú)誤即可下單,這樣可以做到準(zhǔn)確方便。
[0080]以上結(jié)合附圖及實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說(shuō)明對(duì)本發(fā)明做出種種變化例。因而,實(shí)施例中的某些細(xì)節(jié)不應(yīng)構(gòu)成對(duì)本發(fā)明的限定,本發(fā)明將以所附權(quán)利要求書界定的范圍作為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種智能軟件的語(yǔ)音播報(bào)系統(tǒng),其特征在于,包括: 文字信息采集模塊,用于采集智能軟件中的文字信息; 文本前端處理模塊,與所述文字信息采集模塊連接,用于將采集的所述文字信息轉(zhuǎn)化為具有特定讀法的文本信息; 模型存儲(chǔ)模塊,用于建立和存儲(chǔ)聲音模型; 語(yǔ)音合成模塊,與所述文本前端處理模塊和所述模型存儲(chǔ)模塊連接,用于調(diào)用所述模型存儲(chǔ)模塊存儲(chǔ)的聲音模型,根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到所述文本前端處理模塊傳送的文本信息對(duì)應(yīng)的聲學(xué)參數(shù),將所述聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件;以及 語(yǔ)音播放模塊,與所述語(yǔ)音合成模塊連接,用于播放所述語(yǔ)音文件。2.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng),其特征在于:所述文字信息采集模塊與智能播報(bào)客戶端通信連接,所述智能播報(bào)客戶端為安插在智能軟件中進(jìn)行文字信息的采集的插件。3.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng),其特征在于,所述文本前端處理模塊包括: 正規(guī)規(guī)則設(shè)置單元,與所述文字信息采集模塊連接,用于對(duì)采集到的所述文字信息進(jìn)行基于特定規(guī)則的正則化;以及 文本轉(zhuǎn)化標(biāo)注單元,與所述正規(guī)規(guī)則設(shè)置單元連接,用于對(duì)經(jīng)正則化的所述文字信息進(jìn)行標(biāo)注,轉(zhuǎn)化為經(jīng)標(biāo)注的具有特定讀法的文本信息。4.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng),其特征在于,所述模型存儲(chǔ)模塊包括: 語(yǔ)音標(biāo)注前端處理單元,用于采集聲音數(shù)據(jù)源,對(duì)采集的所述聲音數(shù)據(jù)源進(jìn)行語(yǔ)音標(biāo)注前端處理,得到文本標(biāo)注信息; 特征參數(shù)抽取單元,與所述語(yǔ)音標(biāo)注前端處理單元連接,用于提取所述文本標(biāo)注信息的基頻和頻譜的聲學(xué)特征; 訓(xùn)練單元,與所述特征參數(shù)抽取單元連接,用于基于隱馬爾可夫模型的參數(shù)聚類和訓(xùn)練,形成所述聲學(xué)特征的聲音模型;以及 模型存儲(chǔ)單元,與所述訓(xùn)練單元連接,用于存儲(chǔ)所述聲音模型。5.如權(quán)利要求1所述的智能軟件的語(yǔ)音播報(bào)系統(tǒng),其特征在于,所述語(yǔ)音合成模塊包括: 標(biāo)注存儲(chǔ)單元,與所述文本前端處理模塊連接,用于對(duì)所述文本前端處理模塊傳送的文本信息進(jìn)行詞性分析和韻律預(yù)測(cè); 參數(shù)預(yù)測(cè)單元,與所述標(biāo)注存儲(chǔ)單元和所述模型存儲(chǔ)模塊連接,用于調(diào)用所述模型存儲(chǔ)模塊存儲(chǔ)的聲音模型,根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到經(jīng)詞性分析和韻律預(yù)測(cè)的所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù);以及 合成器合成語(yǔ)音單元,與所述參數(shù)預(yù)測(cè)單元連接,用于將所述聲學(xué)參數(shù)送到參數(shù)合成器中進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件。6.一種智能軟件的語(yǔ)音播報(bào)方法,其特征在于,包括: 采集智能軟件中的文字信息; 將采集的所述文字信息轉(zhuǎn)化為具有特定讀法的文本信息; 建立和存儲(chǔ)聲音模型; 調(diào)用存儲(chǔ)的聲音模型,根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù),將所述聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件;以及播放所述語(yǔ)音文件。7.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法,其特征在于,采集智能軟件中的文字信息,包括:在智能軟件中安插用于采集文字信息的智能播報(bào)客戶端。8.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法,其特征在于,將采集的文字信息轉(zhuǎn)化為具有特定讀法的文本信息,包括: 對(duì)采集到的文字信息進(jìn)行基于特定規(guī)則的正則化;以及 對(duì)經(jīng)正則化的所述文字信息進(jìn)行標(biāo)注,轉(zhuǎn)化為經(jīng)標(biāo)注的具有特定讀法的文本信息。9.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法,其特征在于,建立和存儲(chǔ)聲音模型,包括: 采集聲音數(shù)據(jù)源,對(duì)采集的所述聲音數(shù)據(jù)源進(jìn)行語(yǔ)音標(biāo)注前端處理,得到文本標(biāo)注信息; 提取所述文本標(biāo)注信息的基頻和頻譜的聲學(xué)特征; 基于隱馬爾可夫模型的參數(shù)聚類和訓(xùn)練,形成所述聲學(xué)特征的聲音模型;以及 存儲(chǔ)所述聲音模型。10.如權(quán)利要求6所述的智能軟件的語(yǔ)音播報(bào)方法,其特征在于,調(diào)用存儲(chǔ)的聲音模型,根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù),將所述聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件,包括: 對(duì)文本信息進(jìn)行詞性分析和韻律預(yù)測(cè); 調(diào)用存儲(chǔ)的聲音模型,根據(jù)所述聲音模型和決策樹(shù)預(yù)測(cè)得到經(jīng)詞性分析和韻律預(yù)測(cè)的所述文本信息對(duì)應(yīng)的聲學(xué)參數(shù);以及 將所述聲學(xué)參數(shù)送到參數(shù)合成器中進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件。
【專利摘要】本發(fā)明公開(kāi)了一種智能軟件的語(yǔ)音播報(bào)系統(tǒng)及語(yǔ)音播報(bào)方法,語(yǔ)音播報(bào)系統(tǒng)包括:文字信息采集模塊,用于采集文字信息;文本前端處理模塊,與文字信息采集模塊連接,用于將文字信息轉(zhuǎn)化為具有特定讀法的文本信息;模型存儲(chǔ)模塊,用于建立和存儲(chǔ)聲音模型;語(yǔ)音合成模塊,與文本前端處理模塊和模型存儲(chǔ)模塊連接,用于調(diào)用聲音模型,根據(jù)聲音模型和決策樹(shù)預(yù)測(cè)得到文本信息對(duì)應(yīng)的聲學(xué)參數(shù),將聲學(xué)參數(shù)進(jìn)行語(yǔ)音合成,輸出經(jīng)語(yǔ)音合成的語(yǔ)音文件;以及語(yǔ)音播放模塊,與語(yǔ)音合成模塊連接,用于播放語(yǔ)音文件。本發(fā)明綜合利用文本處理、參數(shù)建模、語(yǔ)音合成等技術(shù),提供智能的手機(jī)端/平板端文本播報(bào)功能,實(shí)現(xiàn)特定音色的文本播報(bào)。
【IPC分類】H04M1/725, G10L13/02
【公開(kāi)號(hào)】CN105427855
【申請(qǐng)?zhí)枴緾N201510757022
【發(fā)明人】王程程, 劉青松
【申請(qǐng)人】上海語(yǔ)知義信息技術(shù)有限公司
【公開(kāi)日】2016年3月23日
【申請(qǐng)日】2015年11月9日