作用關(guān)系,除非另有明確的限定。對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語在本發(fā)明中的具體含義。
[0070]在本發(fā)明中,除非另有明確的規(guī)定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接觸,或第一和第二特征通過中間媒介間接接觸。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或僅僅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或僅僅表示第一特征水平高度小于第二特征。
[0071]在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特征進(jìn)行結(jié)合和組合。
[0072]盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進(jìn)行變化、修改、替換和變型。
【主權(quán)項】
1.一種語音合成的方法,其特征在于,包括以下步驟: 51、獲取輸入文本,并獲取所述輸入文本對應(yīng)的輸入類型; 52、根據(jù)所述輸入類型確定糾錯模型,并根據(jù)所述糾錯模型對所述輸入文本進(jìn)行糾錯處理;以及 53、將糾錯后的所述輸入文本合成為語音。2.如權(quán)利要求1所述的方法,其特征在于,所述輸入類型包括拼音輸入、五筆輸入以及OCR輸入中的一種。3.如權(quán)利要求1或2所述的方法,其特征在于,所述步驟S2,包括: 當(dāng)所述輸入類型為所述拼音輸入時,根據(jù)第一糾錯模型對所述輸入文本進(jìn)行糾錯處理;或者 當(dāng)所述輸入類型為所述五筆輸入或所述OCR輸入時,根據(jù)第二糾錯模型對所述輸入文本進(jìn)行糾錯處理。4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)第一糾錯模型對所述輸入文本進(jìn)行糾錯處理,包括: 將所述輸入文本轉(zhuǎn)換為拼音序列,對所述拼音序列進(jìn)行分詞,以生成多個拼音詞組,并根據(jù)所述第一糾錯模型獲得與所述拼音詞組對應(yīng)的漢字詞組及所述漢字詞組的得分,以及對所述得分小于第一預(yù)設(shè)閾值的所述漢字詞組進(jìn)行糾錯。5.如權(quán)利要求4所述的方法,其特征在于,所述對所述得分小于第一預(yù)設(shè)閾值的所述漢字詞組進(jìn)行糾錯,具體包括: 獲取得分小于第一預(yù)設(shè)閾值的所述漢字詞組中每個漢字對應(yīng)的聲母,并根據(jù)所述聲母獲得對應(yīng)的多個待選漢字詞組,以及根據(jù)所述第一糾錯模型獲取得分最高的所述待選漢字詞組,并將所述得分小于第一預(yù)設(shè)閾值的所述漢字詞組替換為得分最高的所述待選漢字詞組。6.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)第二糾錯模型對所述輸入文本進(jìn)行糾錯處理,包括: 將所述輸入文本轉(zhuǎn)換為字根序列,將所述字根序列分為多個字根,并根據(jù)所述第二糾錯模型獲得與所述字根對應(yīng)的得分,以及對所述得分小于第二預(yù)設(shè)閾值的所述字根進(jìn)行糾錯O7.如權(quán)利要求3所述的方法,其特征在于,在所述根據(jù)第一糾錯模型對所述輸入文本進(jìn)行糾錯處理和所述根據(jù)第二糾錯模型對所述輸入文本進(jìn)行糾錯處理之后,還包括: 獲得根據(jù)所述第一糾錯模型糾錯后的第一輸入文本及其得分; 獲得根據(jù)所述第二糾錯模型糾錯后的第二輸入文本及其得分; 將所述第一輸入文本和所述第二輸入文本中得分高者,作為糾錯后的所述輸入文本。8.如權(quán)利要求1-7所述的方法,其特征在于,所述糾錯模型包括N-GRAM模型、HMM模型、CRF模型、深度神經(jīng)網(wǎng)絡(luò)模型中的一種。9.一種語音合成的裝置,其特征在于,包括: 獲取模塊,用于獲取輸入文本,并獲取所述輸入文本對應(yīng)的輸入類型; 糾錯模塊,用于根據(jù)所述輸入類型確定糾錯模型,并根據(jù)所述糾錯模型對所述輸入文本進(jìn)行糾錯處理;以及 合成模塊,用于將糾錯后的所述輸入文本合成為語音。10.如權(quán)利要求9所述的裝置,其特征在于,所述輸入類型包括拼音輸入、五筆輸入以及OCR輸入中的一種。11.如權(quán)利要求9或10所述的裝置,其特征在于,所述糾錯模塊,具體包括: 第一糾錯單元,用于當(dāng)所述輸入類型為所述拼音輸入時,根據(jù)第一糾錯模型對所述輸入文本進(jìn)行糾錯處理; 第二糾錯單元,用于當(dāng)所述輸入類型為所述五筆輸入或所述OCR輸入時,根據(jù)第二糾錯模型對所述輸入文本進(jìn)行糾錯處理。12.如權(quán)利要求11所述的裝置,其特征在于,所述第一糾錯單元,具體用于: 將所述輸入文本轉(zhuǎn)換為拼音序列,對所述拼音序列進(jìn)行分詞,以生成多個拼音詞組,并根據(jù)所述第一糾錯模型獲得與所述拼音詞組對應(yīng)的漢字詞組及所述漢字詞組的得分,以及對所述得分小于第一預(yù)設(shè)閾值的所述漢字詞組進(jìn)行糾錯。13.如權(quán)利要求12所述的裝置,其特征在于,所述第一糾錯單元,具體用于: 獲取得分小于第一預(yù)設(shè)閾值的所述漢字詞組中每個漢字對應(yīng)的聲母,并根據(jù)所述聲母獲得對應(yīng)的多個待選漢字詞組,以及根據(jù)所述糾錯模型獲取得分最高的所述待選漢字詞組,并將所述得分小于第一預(yù)設(shè)閾值的所述漢字詞組替換為得分最高的所述待選漢字詞組。14.如權(quán)利要求11所述的裝置,其特征在于,所述第二糾錯單元,具體用于: 將所述輸入文本轉(zhuǎn)換為字根序列,將所述字根序列分為多個字根,并根據(jù)所述第二糾錯模型獲得與所述字根對應(yīng)的得分,以及對所述得分小于第二預(yù)設(shè)閾值的所述字根進(jìn)行糾錯O15.如權(quán)利要求11所述的裝置,其特征在于,所述糾錯模塊,還包括: 第三糾錯單元,用于在所述根據(jù)第一糾錯模型對所述輸入文本進(jìn)行糾錯處理和所述根據(jù)第二糾錯模型對所述輸入文本進(jìn)行糾錯處理之后,獲得根據(jù)所述第一糾錯模型糾錯后的第一輸入文本及其得分,并獲得根據(jù)所述第二糾錯模型糾錯后的第二輸入文本及其得分,以及將所述第一輸入文本和所述第二輸入文本中得分高者,作為糾錯后的所述輸入文本。16.如權(quán)利要求9-15所述的裝置,其特征在于,所述糾錯模型包括N-GRAM模型、HMM模型、CRF模型、深度神經(jīng)網(wǎng)絡(luò)模型中的一種。
【專利摘要】本發(fā)明公開了一種語音合成的方法和裝置,其中,語音合成的方法包括:S1、獲取輸入文本,并獲取輸入文本對應(yīng)的輸入類型;S2、根據(jù)輸入類型確定糾錯模型,并根據(jù)糾錯模型對輸入文本進(jìn)行糾錯處理;以及S3、將糾錯后的輸入文本合成為語音。本發(fā)明實施例的語音合成的方法和裝置,通過獲取輸入文本,并獲取輸入文本對應(yīng)的輸入類型,根據(jù)輸入類型確定糾錯模型,并根據(jù)糾錯模型對輸入文本進(jìn)行糾錯處理,以及將糾錯后的輸入文本合成為語音,可利用糾錯模型對輸入文本進(jìn)行糾錯,提升了文本輸入時的準(zhǔn)確性,進(jìn)而在語音合成時,生成的語音信息更加自然流暢,易于理解,符合語言習(xí)慣,最終提升用戶使用體驗。
【IPC分類】G10L13/02
【公開號】CN104882139
【申請?zhí)枴緾N201510282063
【發(fā)明人】李秀林
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2015年9月2日
【申請日】2015年5月28日