亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音合成的方法和裝置的制造方法_3

文檔序號(hào):8906475閱讀:來(lái)源:國(guó)知局
錯(cuò)模型,并根據(jù)糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理。具體地,糾錯(cuò)模塊120可包括第一糾錯(cuò)單元121和第二糾錯(cuò)單元122。
[0056]當(dāng)輸入類型為拼音輸入時(shí),第一糾錯(cuò)單元121可根據(jù)第一糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理,第一糾錯(cuò)模型是基于拼音序列數(shù)據(jù)訓(xùn)練得到的模型。具體地,第一糾錯(cuò)單元121可將輸入文本轉(zhuǎn)換為拼音序列,然后對(duì)輸入文本轉(zhuǎn)換而成的拼音序列進(jìn)行分詞,生成多個(gè)拼音詞組,再根據(jù)第一糾錯(cuò)模型獲得與拼音詞組對(duì)應(yīng)的漢字詞組及漢字詞組的得分,最后對(duì)得分小于第一預(yù)設(shè)閾值的漢字詞組進(jìn)行糾錯(cuò)。更具體地,可獲取得分小于第一預(yù)設(shè)閾值的漢字詞組中每個(gè)漢字對(duì)應(yīng)的聲母,然后根據(jù)聲母獲得對(duì)應(yīng)的多個(gè)待選漢字詞組,再根據(jù)第一糾錯(cuò)模型獲取得分最高的待選漢字詞組,并將得分小于第一預(yù)設(shè)閾值的漢字詞組替換為得分最高的待選漢字詞組,從而完成對(duì)得分小于第一預(yù)設(shè)閾值的漢字詞組的糾錯(cuò)。
[0057]舉例來(lái)說(shuō),當(dāng)輸入類型為拼音輸入時(shí),可將輸入文本為“2015年3月全國(guó)平斤氣溫是5.8°C?!鞭D(zhuǎn)換為拼音序列“ er ling yi wu nian san yue quan guo ping jin qi wenshi wu dian ba she shi du”,然后對(duì)該拼音序列進(jìn)行分詞,生成拼音詞組“er ling yi wunian,,、‘‘san yue,,、‘‘quan guo,,、‘‘ping,,、“jin,,、‘‘qi wen,,、‘‘shi,,、‘‘wu dian ba,,、‘‘she shidu”。由于同一拼音可對(duì)應(yīng)多個(gè)漢字,同一拼音詞組可對(duì)應(yīng)多個(gè)漢字詞組,因此可獲得以上拼音詞組對(duì)應(yīng)的漢字詞組及漢字詞組的得分。其中,漢字詞組的得分可為拼音詞組轉(zhuǎn)換為漢字詞組的概率值?!癳r ling yi wu nian”對(duì)應(yīng)“二零一五年”且得分為0.95分,“sanyue”對(duì)應(yīng)“三月”且得分為0.9分,“quan guo”對(duì)應(yīng)“全國(guó)”且得分為0.99,“ping”對(duì)應(yīng)“平”且得分為0.3分,“jin”對(duì)應(yīng)“斤”且得分為0.15分,“qi wen”對(duì)應(yīng)“氣溫”且得分為0.88分,“shi”對(duì)應(yīng)“是”且得分為0.75分,“wu dian ba”對(duì)應(yīng)“五點(diǎn)八”且得分為0.67分,“she shi du”對(duì)應(yīng)“攝氏度”且得分為0.99分。其中,“平”和“斤”的得分均小于第一預(yù)設(shè)閾值0.5分,因此需要對(duì)“平”和“斤”進(jìn)行糾錯(cuò)。具體地,“平”的聲母為“P”,“斤”的聲母為“ j ”,根據(jù)“P”和“ j ”這兩個(gè)聲母,可獲得多個(gè)待選漢字詞組如“平均”、“評(píng)價(jià)”、“啤酒”等,此時(shí)可獲取得分最高的“平均”這一漢字詞組,替換掉“平”和“斤”。最后,獲得糾錯(cuò)后的輸入文本“二零一五年三月全國(guó)平均氣溫是五點(diǎn)八攝氏度?!薄?yīng)當(dāng)理解的是,分詞步驟和轉(zhuǎn)換成拼音序列的步驟沒(méi)有嚴(yán)格的先后順序,可根據(jù)實(shí)際應(yīng)用進(jìn)行設(shè)置,此處不做限定。
[0058]當(dāng)輸入類型為五筆輸入或OCR輸入時(shí),第二糾錯(cuò)單元122可根據(jù)第二糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理,第二糾錯(cuò)模型是基于字根序列數(shù)據(jù)訓(xùn)練得到的模型。具體地,第二糾錯(cuò)單元122可將輸入文本轉(zhuǎn)換為字根序列,然后將字根序列分為多個(gè)字根,并根據(jù)第二糾錯(cuò)模型獲得與字根對(duì)應(yīng)的得分,再對(duì)得分小于第二預(yù)設(shè)閾值的字根進(jìn)行糾錯(cuò)。更具體地,可根據(jù)第二糾錯(cuò)模型獲得與得分小于第二預(yù)設(shè)閾值的字根相似的待選字根以及待選字根的得分,再將得分最高的待選字根替換掉得分小于第二預(yù)設(shè)閾值的字根,從而完成對(duì)得分小于第二預(yù)設(shè)閾值的字根的糾錯(cuò)。
[0059]舉例來(lái)說(shuō),當(dāng)輸入文本為OCR掃描獲得時(shí),原始文本“幼兒園”被誤識(shí)別為“幻兒園”,故此時(shí)的輸入文本為“幻兒園”??蓪⑤斎胛谋緸椤盎脙簣@”轉(zhuǎn)換為字根序列,然后將字根序列分為“Xnn”、“qtn”、“l(fā)fqV”三個(gè)字根,并獲得“xnn”對(duì)應(yīng)的得分為0.1分,“qtn”對(duì)應(yīng)的得分為0.3分,“l(fā)fqv”對(duì)應(yīng)的得分為0.55分。其中,“xnn”的得分小于第二預(yù)設(shè)閾值0.2分,則需要對(duì)字根“xnn”進(jìn)行糾錯(cuò),即對(duì)“幻”進(jìn)行糾錯(cuò)。具體地,可獲取多個(gè)與字根“xnn”相似的待選字根以及待選字根的得分,可獲取得分最高的字根“xln”,即漢字“幼”。從而可將字根“xnn”替換為字根“xln”,即將漢字“幻”替換為漢字“幼”,最后獲得糾錯(cuò)后的輸入文本為“幼兒園”。
[0060]應(yīng)當(dāng)理解的是,以上糾錯(cuò)模型可包括N-GRAM模型、HMM模型、CRF模型、深度神經(jīng)網(wǎng)絡(luò)模型中的一種。
[0061]此外,本發(fā)明實(shí)施例的語(yǔ)音合成的裝置的糾錯(cuò)模塊120還可包括第三糾錯(cuò)單元123。
[0062]在第一糾錯(cuò)單元121根據(jù)第一糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理和第二糾錯(cuò)單元122根據(jù)第二糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理之后,第三糾錯(cuò)單元123可獲得根據(jù)第一糾錯(cuò)模型糾錯(cuò)后的第一輸入文本及其得分,以及獲得根據(jù)第二糾錯(cuò)模型糾錯(cuò)后的第二輸入文本及其得分,然后將第一輸入文本和第二輸入文本中得分高者,作為糾錯(cuò)后的輸入文本。
[0063]第三糾錯(cuò)單元123的作用在于,在無(wú)法確認(rèn)輸入文本對(duì)應(yīng)的輸入類型時(shí),可同時(shí)采用兩種方式對(duì)輸入文本分別進(jìn)行糾錯(cuò),然后獲取其中得分高者,作為最終糾錯(cuò)后的輸入文本,更加智能化。
[0064]合成模塊130用于將糾錯(cuò)后的輸入文本合成為語(yǔ)音。
[0065]具體地,合成模塊130可對(duì)糾錯(cuò)后的輸入文本進(jìn)行注音,生成拼音序列,然后對(duì)拼音序列進(jìn)行結(jié)構(gòu)分析,生成韻律層級(jí)信息,再根據(jù)聲學(xué)模型將生成的韻律層級(jí)信息轉(zhuǎn)換為如基頻、譜等聲學(xué)參數(shù),最后將聲學(xué)參數(shù)合成語(yǔ)音或者從語(yǔ)音庫(kù)中獲取對(duì)應(yīng)的聲學(xué)片段拼接為語(yǔ)音。
[0066]本發(fā)明實(shí)施例的語(yǔ)音合成的裝置,通過(guò)獲取輸入文本,并獲取輸入文本對(duì)應(yīng)的輸入類型,根據(jù)輸入類型確定糾錯(cuò)模型,并根據(jù)糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò)處理,以及將糾錯(cuò)后的輸入文本合成為語(yǔ)音,可利用糾錯(cuò)模型對(duì)輸入文本進(jìn)行糾錯(cuò),提升了文本輸入時(shí)的準(zhǔn)確性,進(jìn)而在語(yǔ)音合成時(shí),生成的語(yǔ)音信息更加自然流暢,易于理解,符合語(yǔ)言習(xí)慣,最終提升用戶使用體驗(yàn)。
[0067]在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“中心”、“縱向”、“橫向”、“長(zhǎng)度”、“寬度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底” “內(nèi)”、“外”、“順時(shí)針”、“逆時(shí)針”、“軸向”、“徑向”、“周向”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡(jiǎn)化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對(duì)本發(fā)明的限制。
[0068]此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。
[0069]在本發(fā)明中,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“安裝”、“相連”、“連接”、“固定”等術(shù)語(yǔ)應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或成一體;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連,可以是兩個(gè)元件內(nèi)部的連通或兩個(gè)元件的相互
當(dāng)前第3頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1