輸入文本“二零一五年三月全國(guó)平均氣溫是五點(diǎn)八攝氏度?!?。應(yīng)當(dāng)理解的是,分詞步驟和轉(zhuǎn)換成拼音序列的步驟沒(méi)有嚴(yán)格的先后順序,可根據(jù)實(shí)際應(yīng)用進(jìn)行設(shè)置,此處不做限定。
[0025]當(dāng)輸入類(lèi)型為五筆輸入或OCR輸入時(shí),可將輸入文本轉(zhuǎn)換為字根序列,然后將字根序列分為多個(gè)字根,并根據(jù)第二糾錯(cuò)模型獲得與字根對(duì)應(yīng)的得分,再對(duì)得分小于第二預(yù)設(shè)閾值的字根進(jìn)行糾錯(cuò)。更具體地,可根據(jù)第二糾錯(cuò)模型獲得與得分小于第二預(yù)設(shè)閾值的字根相似的待選字根以及待選字根的得分,再將得分最高的待選字根替換掉得分小于第二預(yù)設(shè)閾值的字根,從而完成對(duì)得分小于第二預(yù)設(shè)閾值的字根的糾錯(cuò)。
[0026]舉例來(lái)說(shuō),當(dāng)輸入文本為OCR掃描獲得時(shí),原始文本“幼兒園”被誤識(shí)別為“幻兒園”,故此時(shí)的輸入文本為“幻兒園”??蓪⑤斎胛谋緸椤盎脙簣@”轉(zhuǎn)換為字根序列,然后將字根序列分為“Xnn”、“qtn”、“l(fā)fqV”三個(gè)字根,并獲得“xnn”對(duì)應(yīng)的得分為0.1分,“qtn”對(duì)應(yīng)的得分為0.3分,“l(fā)fqv”對(duì)應(yīng)的得分為0.55分。其中,“xnn”的得分小于第二預(yù)設(shè)閾值0.2分,則需要對(duì)字根“xnn”進(jìn)行糾錯(cuò),即對(duì)“幻”進(jìn)行糾錯(cuò)。具體地,可獲取多個(gè)與字根“xnn”相似的待選字根以及待選字根的得分,可獲取得分最高的字根“xln”,即漢字“幼”。從而可將字根“xnn”替換為字根“xln”,即將漢字“幻”替換為漢字“幼”,最后獲得糾錯(cuò)后的輸入文本為“幼兒園”。
[0027]此外,在根據(jù)第一糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理和根據(jù)第二糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理之后,還可獲得根據(jù)第一糾錯(cuò)模型糾錯(cuò)后的第一輸入文本及其得分,以及獲得根據(jù)第二糾錯(cuò)模型糾錯(cuò)后的第二輸入文本及其得分,然后將第一輸入文本和第二輸入文本中得分高者,作為糾錯(cuò)后的輸入文本。
[0028]本步驟的目的在于,在無(wú)法確認(rèn)輸入文本對(duì)應(yīng)的輸入類(lèi)型時(shí),可采用上述兩種方式對(duì)輸入文本分別進(jìn)行糾錯(cuò),然后獲取其中得分高者,作為最終糾錯(cuò)后的輸入文本,更加智能化。
[0029]S103,將糾錯(cuò)后的輸入文本合成為語(yǔ)音。
[0030]具體地,可對(duì)糾錯(cuò)后的輸入文本進(jìn)行注音,生成拼音序列,然后對(duì)拼音序列進(jìn)行結(jié)構(gòu)分析,生成韻律層級(jí)信息,再根據(jù)聲學(xué)模型將生成的韻律層級(jí)信息轉(zhuǎn)換為如基頻、譜等聲學(xué)參數(shù),最后將聲學(xué)參數(shù)合成語(yǔ)音或者從語(yǔ)音庫(kù)中獲取對(duì)應(yīng)的聲學(xué)片段拼接為語(yǔ)音。
[0031]本發(fā)明實(shí)施例的語(yǔ)音合成的方法,通過(guò)獲取輸入文本,并獲取輸入文本對(duì)應(yīng)的輸入類(lèi)型,根據(jù)輸入類(lèi)型確定糾錯(cuò)模型,并根據(jù)糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理,以及將糾錯(cuò)后的輸入文本合成為語(yǔ)音,可利用糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò),提升了文本輸入時(shí)的準(zhǔn)確性,進(jìn)而在語(yǔ)音合成時(shí),生成的語(yǔ)音信息更加自然流暢,易于理解,符合語(yǔ)言習(xí)慣,最終提升用戶使用體驗(yàn)。
[0032]圖2是根據(jù)本發(fā)明一個(gè)具體實(shí)施例的語(yǔ)音合成的方法的流程圖。
[0033]如圖2所示,語(yǔ)音合成的方法可包括:
[0034]S201,對(duì)輸入文本進(jìn)行預(yù)處理,生成預(yù)處理結(jié)果。
[0035]具體地,輸入文本為“2015年3月全國(guó)平斤氣溫是5.8°C ”,對(duì)其進(jìn)行預(yù)處理,獲得的預(yù)處理結(jié)果為“二零一五年三月全國(guó)平斤氣溫是五點(diǎn)八攝氏度”。
[0036]S202,對(duì)預(yù)處理結(jié)果進(jìn)行分詞操作,生成多個(gè)詞組。
[0037]對(duì)預(yù)處理結(jié)果“二零一五年三月全國(guó)平斤氣溫是五點(diǎn)八攝氏度”進(jìn)行分詞,獲得詞組“二零一五年”、“三月”、“全國(guó)”、“平”、“斤”、“氣溫”、“是”、“五點(diǎn)八”、“攝氏度”。
[0038]S203,對(duì)多個(gè)詞組進(jìn)行注音標(biāo)注,生成多個(gè)拼音詞組。
[0039]對(duì)上述詞組進(jìn)行注音標(biāo)注,分別生成拼音詞組“er ling yi wu nian”、“san yue”、“quan guo,,、“ping,,、“jin,,、“qi wen,,、“shi,,、“wu dian ba,,、“she shi du,,。
[0040]S204,根據(jù)糾錯(cuò)模型獲取拼音詞組對(duì)應(yīng)的漢字詞組及其得分。
[0041]由于同一拼音詞組可能對(duì)應(yīng)多個(gè)漢字詞組,因此可根據(jù)N-GRAM模型、HMM模型、CRF模型、深度神經(jīng)網(wǎng)絡(luò)模型等糾錯(cuò)模型,獲得以上拼音詞組對(duì)應(yīng)的得分最高的漢字詞組及該漢字詞組的得分。其中,漢字詞組的得分為拼音詞組轉(zhuǎn)換為該漢字詞組的概率值?!癳rling yi wu nian”對(duì)應(yīng)“二零一五年”且得分為0.95分,“san yue”對(duì)應(yīng)“三月”且得分為0.9分,“quan guo”對(duì)應(yīng)“全國(guó)”且得分為0.99,“ping”對(duì)應(yīng)“平”且得分為0.3分,“jin”對(duì)應(yīng)“斤”且得分為0.15分,“ qi wen”對(duì)應(yīng)“氣溫”且得分為0.88分,“ shi ”對(duì)應(yīng)“是”且得分為0.75分,“wu dian ba”對(duì)應(yīng)“五點(diǎn)八”且得分為0.67分,“she shi du”對(duì)應(yīng)“攝氏度”且得分為0.99分。
[0042]S205,對(duì)得分低于預(yù)設(shè)閾值的漢字詞組進(jìn)行糾錯(cuò)。
[0043]其中,“平”和“斤”的得分均小于預(yù)設(shè)閾值0.5分,因此需要對(duì)“平”和“斤”進(jìn)行糾錯(cuò)。具體地,“平”的聲母為“p”,“斤”的聲母為“j”,根據(jù)“p”和“j”這兩個(gè)聲母,可獲得多個(gè)待選漢字詞組如“平均”、“評(píng)價(jià)”、“啤酒”等,此時(shí)可根據(jù)N-GRAM模型、HMM模型、CRF模型、深度神經(jīng)網(wǎng)絡(luò)模型等糾錯(cuò)模型,獲取得分最高的“平均”這一漢字詞組,替換掉“平”和“斤”。
[0044]S206,生成糾錯(cuò)后的輸入文本。
[0045]替換掉“平”和“斤”后,可生成糾錯(cuò)后的輸入文本“二零一五年三月全國(guó)平均氣溫是五點(diǎn)八攝氏度?!薄?br>[0046]S207,將糾錯(cuò)后的輸入文本合成為語(yǔ)音。
[0047]具體地,可對(duì)糾錯(cuò)后的輸入文本進(jìn)行注音,生成拼音序列,然后對(duì)拼音序列進(jìn)行結(jié)構(gòu)分析,再根據(jù)聲學(xué)模型將生成的韻律層級(jí)信息轉(zhuǎn)換為如基頻、譜等聲學(xué)參數(shù),最后將聲學(xué)參數(shù)合成語(yǔ)音或者從語(yǔ)音庫(kù)中獲取對(duì)應(yīng)的聲學(xué)片段拼接為語(yǔ)音。
[0048]本發(fā)明實(shí)施例的語(yǔ)音合成的方法,通過(guò)獲取輸入文本,并獲取輸入文本對(duì)應(yīng)的輸入類(lèi)型,根據(jù)輸入類(lèi)型確定糾錯(cuò)模型,并根據(jù)糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理,以及將糾錯(cuò)后的輸入文本合成為語(yǔ)音,可利用糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò),提升了文本輸入時(shí)的準(zhǔn)確性,進(jìn)而在語(yǔ)音合成時(shí),生成的語(yǔ)音信息更加自然流暢,易于理解,符合語(yǔ)言習(xí)慣,最終提升用戶使用體驗(yàn)。
[0049]為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種語(yǔ)音合成的裝置。
[0050]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的語(yǔ)音合成的裝置的結(jié)構(gòu)示意圖。
[0051]如圖3所示,該語(yǔ)音合成的裝置可包括:獲取模塊110、糾錯(cuò)模塊120以及合成模塊130。其中,糾錯(cuò)模塊120可包括第一糾錯(cuò)單元121和第二糾錯(cuò)單元122。
[0052]獲取模塊110用于獲取輸入文本,并獲取輸入文本對(duì)應(yīng)的輸入類(lèi)型。
[0053]其中,輸入類(lèi)型可包括拼音輸入、五筆輸入、OCR輸入等。
[0054]舉例來(lái)說(shuō),輸入文本為“2015年3月全國(guó)平斤氣溫是5.8°C。”,對(duì)應(yīng)的輸入類(lèi)型為拼音輸入。
[0055]糾錯(cuò)模塊120用于根據(jù)輸入類(lèi)型確定糾