用于漢語語音識別系統(tǒng)的連續(xù)語音處理方法和裝置的制作方法

文檔序號：2834365閱讀：331來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于漢語語音識別系統(tǒng)的連續(xù)語音處理方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種連續(xù)語音處理方法和裝置，用于判定合成語音的連續(xù)語音以獲得好的音質(zhì)。
以漢語為例，用于漢語語音合成系統(tǒng)的合成單位大體上分為兩類(1)單音節(jié)(408種，不包括4個(gè)音調(diào))和(2)音素(包括21個(gè)漢語拼音輔音和38個(gè)元音)。作為合成的單位，不管是單音節(jié)還是音素，一些因素，例如音素、音調(diào)、詞組結(jié)構(gòu)、在詞組中的位置、在句子中的位置和前后連接的音素，合成單位的這些因素正確地判定每種合成單位的連續(xù)語音，而這些因素都對合成語音的自然相似程度有很大影響。
傳統(tǒng)的用于漢語語音識別系統(tǒng)的連續(xù)語音處理方法和裝置已經(jīng)在R.O.C．上公開。專利申請?zhí)?0100559，標(biāo)題為“用于Text-to-speech system的連續(xù)語音處理方裝置?！?，圖9是一個(gè)以圖解說明的根據(jù)音素、音調(diào)和在句子中的位置確定連續(xù)語音的連續(xù)語音處理裝置的方框圖。如圖9所示，110表示一個(gè)記憶部分，用于儲存不同數(shù)據(jù)。120表示一個(gè)拼音句子輸入部分，用于輸入任何長度、由拼音標(biāo)識和音調(diào)標(biāo)識組成的拼音句子。130表示音節(jié)檢查部分，用于檢查從拼音句子輸入部分120輸入的帶音調(diào)標(biāo)識的句子的音節(jié)。150表示音節(jié)-音素查找儲存部分，用于儲存由每個(gè)音節(jié)組成的音素。140表示音素檢查部分，用于使用音節(jié)-音素查找儲存部分150在輸入拼音的句子檢查音素，并檢查在句子中每個(gè)音素的位置。170表示連續(xù)語音的數(shù)值數(shù)據(jù)儲存部分，用于儲存根據(jù)音素的種類、音素的音調(diào)和句子中音素的位置來定義的連續(xù)語音計(jì)算數(shù)據(jù)。160表示連續(xù)語音的檢查部分，用于計(jì)算音節(jié)的連續(xù)語音通過使用被檢查音素的指定數(shù)目，每個(gè)音素的音調(diào)和每個(gè)音素在句子中的位置作為索引關(guān)鍵字從連續(xù)語音的數(shù)值數(shù)據(jù)儲存部分170中檢索每個(gè)音素的連續(xù)語音的數(shù)字?jǐn)?shù)據(jù)。
如上所述的連續(xù)語音處理裝置，只考慮了音素、音調(diào)和在句子中音素的位置。至于合成單位是否組成詞組和在詞組中其位置的影響對于連續(xù)語音也同樣應(yīng)被考慮。例如，在一個(gè)三字詞組中，第二個(gè)字的連續(xù)語音是最短的，接下來是第一個(gè)字，而第三個(gè)字的連續(xù)語音是最長的。在例句“我爺爺最喜歡那張小桌子”中，“我爺爺”組成一個(gè)三字詞組。由傳統(tǒng)的連續(xù)語音處理裝置生成的連續(xù)語音第一個(gè)“爺”字和第二個(gè)“爺”字大約都是339ms。然而，用聲音記錄裝置測量自然語言發(fā)音的連續(xù)語音分別是275ms和302ms，從而，出現(xiàn)了一個(gè)相對較大的差異。因此，僅考慮音素、音調(diào)和在句子中音素的位置而得到的連續(xù)語音會導(dǎo)致合成語音質(zhì)量的降低。
因此，本發(fā)明的主要目的是提供一種用于漢語語音識別系統(tǒng)的能克服前述的缺點(diǎn)的連續(xù)語音處理方法和裝置。
根據(jù)本發(fā)明的第一方面，用漢語音素作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理方法，它包括構(gòu)造一個(gè)用于儲存漢語詞匯和相關(guān)信息的詞典。例如語音標(biāo)識、詞性、擴(kuò)展語法等；構(gòu)造一個(gè)用于儲存信息的音節(jié)-音素查找部分。例如對于所有漢語音節(jié)對應(yīng)每一個(gè)音節(jié)的音素指定的數(shù)目(包括輔音數(shù)目和元音數(shù)目)等；構(gòu)造一個(gè)基本的連續(xù)語音儲存部分，其中，該部分用于儲存按音素分類的基本連續(xù)語音信息；構(gòu)造一個(gè)連續(xù)語音參數(shù)儲存部分，根據(jù)每一個(gè)屬于音素的音節(jié)的音調(diào)，詞組構(gòu)成，在詞組中的位置，在句子中的位置和關(guān)聯(lián)音素的種類來儲存連續(xù)語音參數(shù)；在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較檢查每一個(gè)詞匯的音節(jié)的位置；根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)被檢查詞匯的語音；參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法；根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系把句子中的詞匯組合成詞組；用音調(diào)標(biāo)識在生成的文字語音標(biāo)識中檢查每一個(gè)音節(jié)；參照音節(jié)-音素查找部分的信息，檢查每個(gè)被檢查音節(jié)的音素格式。
從基本的連續(xù)語音儲存部分檢索每個(gè)被檢查音素的連續(xù)語音；并且從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成，詞組中的位置，句子中的位置和被檢查音素的前后相鄰音素的種類等相關(guān)的參數(shù)中計(jì)算組成每個(gè)被檢查音節(jié)的每個(gè)被檢查音素，并且計(jì)算被檢查音素的連續(xù)語音獲得每個(gè)被檢查音節(jié)的連續(xù)語音。
根據(jù)本發(fā)明的第二個(gè)方面，用漢語音節(jié)作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理方法，它包括下述步驟構(gòu)造一個(gè)用于儲存漢語詞匯和相關(guān)信息的詞典。例如語音標(biāo)識、詞性、擴(kuò)展語法等；構(gòu)造一個(gè)基本的連續(xù)語音儲存部分，其中，該部分用于儲存按音節(jié)分類的基本的連續(xù)語音信息。
構(gòu)造一個(gè)連續(xù)語音參數(shù)儲存部分，根據(jù)每一個(gè)音節(jié)的音調(diào)，詞組構(gòu)成，在詞組中的位置，在句子中的位置和連接的音節(jié)的種類來儲存連續(xù)語音參數(shù)；在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較檢查每一個(gè)詞匯的音節(jié)的位置；根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)被檢查詞匯的每個(gè)音節(jié)的語音；參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法；根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系把句子中的詞匯組合成詞組；用音調(diào)標(biāo)識在生成的文字語音標(biāo)識中檢查每一個(gè)音節(jié)；從基本的連續(xù)語音儲存部分檢索每個(gè)被檢查音節(jié)的連續(xù)語音；并且從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成，詞組中的位置，句子中的位置和被檢查音節(jié)的前后相鄰音節(jié)的種類等相關(guān)的參數(shù)中計(jì)算每個(gè)被檢查音節(jié)了連續(xù)語音。
根據(jù)本發(fā)明的第三個(gè)方面，用漢語音素作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理裝置，它包括一個(gè)詞典，用于儲存漢語詞匯和相關(guān)信息。例如語音標(biāo)識、詞性、擴(kuò)展語法等。
一個(gè)音節(jié)-音素查找部分，用于儲存信息。例如對于所有漢語音節(jié)對應(yīng)每一個(gè)音節(jié)的音素指定的數(shù)目(包括輔音指定數(shù)目和元音指定數(shù)目)等；一個(gè)基本的連續(xù)語音儲存部分，用于儲存基本的按音素分類的連續(xù)語音信息；一個(gè)連續(xù)語音參數(shù)儲存部分，用于根據(jù)屬于每個(gè)音素的每一個(gè)音節(jié)的音調(diào)、詞組構(gòu)成、在詞組中的位置、在句子中的位置和相連音素的種類儲存連續(xù)語音參數(shù)；一個(gè)詞匯檢查部分，用于在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較檢查每一個(gè)詞匯的音節(jié)的位置；一個(gè)語音識別生成部分，用于根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)被檢查詞匯的每個(gè)音節(jié)的語音；一個(gè)詞性和擴(kuò)展語法檢查部分，用于參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法；一個(gè)詞組擴(kuò)展部分，用于根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系把句子中的詞匯組合成詞組；一個(gè)音調(diào)/音節(jié)檢查部分，用音調(diào)標(biāo)識在生成的文字語音標(biāo)識中檢查每一個(gè)音節(jié)；一個(gè)音素檢查部分，用于參照音節(jié)-音素查找部分的信息檢查每個(gè)被檢查音節(jié)的音素格式；一個(gè)基本的連續(xù)語音判定部分，用于從基本的連續(xù)語音儲存部分檢索每個(gè)被檢查音素的連續(xù)語音；并且一個(gè)音節(jié)連續(xù)語音計(jì)算部分，用于從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成、詞組中的位置、句子中的位置和被檢查音素的前后相鄰音素的種類等相關(guān)的參數(shù)中計(jì)算組成每個(gè)被檢查音節(jié)的每個(gè)被檢查音素，并且計(jì)算被檢查音素的連續(xù)語音獲得每個(gè)被檢查音節(jié)的連續(xù)語音。
根據(jù)本發(fā)明的第四個(gè)方面，用漢語音節(jié)作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理裝置，它包括一個(gè)詞典，用于儲存漢語詞匯和相關(guān)信息。例如語音標(biāo)識、詞性、擴(kuò)展語法等。
一個(gè)基本的連續(xù)語音儲存部分，用于儲存基本的按音節(jié)分類的連續(xù)語音信息。
一個(gè)連續(xù)語音參數(shù)儲存部分，用于根據(jù)每個(gè)音節(jié)的音調(diào)、詞組構(gòu)成、在詞組中的位置、在句子中的位置和相連的音節(jié)的種類儲存連續(xù)語音參數(shù)一個(gè)詞匯檢查部分，用于在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較檢查每一個(gè)詞匯的音節(jié)的位置；一個(gè)語音識別生成部分，用于根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)被檢查詞匯的每個(gè)音節(jié)的語音；一個(gè)詞性/擴(kuò)展語法檢查部分，用于參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法；一個(gè)詞組擴(kuò)展部分，用于根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系把句子中的詞匯組合成詞組；一個(gè)音調(diào)/音節(jié)檢查部分，用音調(diào)標(biāo)識在生成的文字語音標(biāo)識中檢查每一個(gè)音節(jié)；一個(gè)基本的連續(xù)語音判定部分，用于從基本的連續(xù)語音儲存部分檢索每個(gè)被檢查音節(jié)的連續(xù)語音；并且一個(gè)音節(jié)連續(xù)語音計(jì)算部分，用于從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成、詞組中的位置、句子中的位置和被檢查音節(jié)的前后相鄰音節(jié)的種類等相關(guān)的參數(shù)中計(jì)算每個(gè)被檢查音節(jié)的連續(xù)語音。
根據(jù)數(shù)據(jù)結(jié)構(gòu)和本發(fā)明第一方面的連續(xù)語音處理方法的處理步驟，一個(gè)等待語音合成的漢語句子的任何長度最初要經(jīng)過一個(gè)詞匯檢查的步驟，在這里，句子中每個(gè)詞匯的音節(jié)的位置通過與儲存在前述的構(gòu)造的詞典中的詞匯進(jìn)行比較而被檢驗(yàn)。因此，每個(gè)檢查詞匯經(jīng)過一個(gè)語音標(biāo)識生成的步驟，并根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)音節(jié)的語音。隨后，通過一個(gè)詞性/擴(kuò)展語法的檢查步驟，每個(gè)詞匯的詞性和擴(kuò)展語法參照詞典被檢查。進(jìn)一步地，一個(gè)詞匯擴(kuò)展步驟，在句子中相鄰的詞匯根據(jù)擴(kuò)展語法和詞性的關(guān)系被組合成詞組。因此，通過音調(diào)/音節(jié)檢查步驟，用音調(diào)標(biāo)識來檢查在句子中生成語音標(biāo)識的每個(gè)音節(jié)。然后，一個(gè)音素檢查步驟，每個(gè)音節(jié)的音素格式參照前述的構(gòu)造的音節(jié)-音素查找部分被檢查。接下來，通過一個(gè)基本的連續(xù)語音判定步驟，每個(gè)語音的連續(xù)語音參照前述的構(gòu)造的基本連續(xù)語音儲存部分被檢查。最后，一個(gè)音節(jié)連續(xù)語音計(jì)算步驟，從基本的連續(xù)語音和與音調(diào)，詞組結(jié)構(gòu)，詞組的位置，在句子中的位置和音素格式的前后相鄰音素的種類相關(guān)的參數(shù)中計(jì)算在句子中每個(gè)組成音節(jié)的音素的連續(xù)語音，并且組成每個(gè)音節(jié)的音素的連續(xù)語音被累加獲得音節(jié)的連續(xù)語音。從結(jié)果來看，對于等待語音合成的漢語句子可以獲得遵從自然語音的音節(jié)連續(xù)語音。
根據(jù)數(shù)據(jù)結(jié)構(gòu)和本發(fā)明的第二方面的連續(xù)語音處理方法的處理步驟，一個(gè)等待語音合成的漢語句子的任何長度最初要經(jīng)過詞匯檢查的步驟，在這里句子中每個(gè)詞匯的音節(jié)的位置通過與儲存在前述構(gòu)造的詞典中的詞匯進(jìn)行比較而被檢驗(yàn)。然后，每個(gè)檢查的詞匯經(jīng)過一個(gè)語音標(biāo)識生成的步驟根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)音節(jié)的語音。隨后，通過一個(gè)詞性/擴(kuò)展語法的檢查步驟，每個(gè)詞匯的詞性和擴(kuò)展語法參照詞典被檢查。進(jìn)一步地，一個(gè)詞匯擴(kuò)展步驟，在句子中相鄰的詞匯根據(jù)擴(kuò)展語法和詞性的關(guān)系被組合成詞組。因此，通過音調(diào)/音節(jié)檢查步驟，在句子中生成語音標(biāo)識的每個(gè)音節(jié)用音調(diào)標(biāo)識來檢查。然后，通過一個(gè)基本的連續(xù)語音判定步驟，每個(gè)語音的連續(xù)語音參照前述的構(gòu)造的基本連續(xù)語音儲存部分被檢查。最后，一個(gè)音節(jié)連續(xù)語音計(jì)算步驟，從基本的連續(xù)語音和與音調(diào)，詞組結(jié)構(gòu)，詞組的位置，在句子中的位置和前后相鄰音素的種類相關(guān)的參數(shù)中計(jì)算在句子中每個(gè)組成音節(jié)的音節(jié)的連續(xù)語音，從結(jié)果來看，對于等待語音合成的漢語句子可以獲得遵從自然語音的音節(jié)連續(xù)語音。
根據(jù)本發(fā)明的第三方面的連續(xù)語音處理裝置的結(jié)構(gòu)，任何長度漢語句子的輸入該裝置后，一個(gè)詞匯檢查部分通過與儲存在前述構(gòu)造的詞典中的詞匯進(jìn)行比較檢查句子中每個(gè)詞匯的音節(jié)的位置。然后，一個(gè)語音標(biāo)識生成部分根據(jù)儲存在詞典中的語音標(biāo)識檢查每個(gè)的詞匯生成每個(gè)音節(jié)的語音。隨后，通過一個(gè)詞性/擴(kuò)展語法的檢查部分，參照詞典每個(gè)詞匯的詞性和擴(kuò)展語法被檢查。進(jìn)一步地，一個(gè)詞匯擴(kuò)展部分，在句子中相鄰的詞匯根據(jù)擴(kuò)展語法和詞性的關(guān)系被組合成詞組。其后，通過音調(diào)/音節(jié)檢查部分，用音調(diào)標(biāo)識來檢查句子中生成語音標(biāo)識的每個(gè)音節(jié)。然后，通過一個(gè)音素檢查部分，每個(gè)音節(jié)的音素格式參照前述的構(gòu)造的音節(jié)-音素查找部分被檢查。接下來，通過一個(gè)基本的連續(xù)語音判定部分，每個(gè)音素的連續(xù)語音參照前述的構(gòu)造的基本連續(xù)語音儲存部分被檢查。最后，通過一個(gè)音節(jié)連續(xù)語音計(jì)算步驟，從基本的連續(xù)語音和與音調(diào)，詞組結(jié)構(gòu)，詞組的位置，在句子中的位置和音素格式的前后相鄰音素的種類相關(guān)的參數(shù)中計(jì)算在句子中每個(gè)組成音節(jié)的音素的連續(xù)語音，并且組成每個(gè)音節(jié)的音素的連續(xù)語音被累加獲得音節(jié)的連續(xù)語音。音節(jié)的連續(xù)語音被輸出使用。
根據(jù)本發(fā)明的第四方面的連續(xù)語音處理裝置的結(jié)構(gòu)，任何長度的漢語句子輸入該裝置后，一個(gè)詞匯檢查部分檢查句子中每個(gè)詞匯的音節(jié)的位置通過與儲存在前述構(gòu)造的詞典中的詞匯進(jìn)行比較。然后，一個(gè)語音標(biāo)識生成部分檢查每個(gè)的詞匯根據(jù)儲存在詞典中的語音標(biāo)識生成每個(gè)音節(jié)的語音。隨后，通過一個(gè)詞性/擴(kuò)展語法的檢查部分，每個(gè)詞匯的詞性和擴(kuò)展語法參照詞典被檢查。進(jìn)一步地，一個(gè)詞匯擴(kuò)展部分，在句子中相鄰的詞匯根據(jù)擴(kuò)展語法和詞性的關(guān)系被組合成詞組。其后，通過音調(diào)/音節(jié)檢查部分，用音調(diào)標(biāo)識來檢查句子中生成語音標(biāo)識的每個(gè)音節(jié)。然后，通過一個(gè)基本的連續(xù)語音判定部分，每個(gè)音節(jié)的連續(xù)語音參照前述的構(gòu)造出來基本連續(xù)語音儲存部分被檢查。最后，通過一個(gè)音節(jié)連續(xù)語音計(jì)算步驟，從基本的連續(xù)語音和與音調(diào)，詞組結(jié)構(gòu)，詞組的位置，在句子中的位置和前后相鄰音節(jié)的種類相關(guān)的參數(shù)中計(jì)算在句子中每個(gè)組成音節(jié)的音素的連續(xù)語音。音節(jié)的連續(xù)語音被輸出使用。
附圖的簡單描述其他特點(diǎn)和本發(fā)明的優(yōu)點(diǎn)在下面的參照附圖的優(yōu)選實(shí)施例的詳細(xì)描述中變的顯而易見，其中

圖1是一個(gè)描述一個(gè)用于漢語語音識別系統(tǒng)的連續(xù)語音處理方法和裝置的優(yōu)選實(shí)施例的系統(tǒng)方框圖，其中，該系統(tǒng)根據(jù)本發(fā)明使用音素作為基本的處理單元。
圖2中的圖2A到2D是本發(fā)明優(yōu)選實(shí)施例的操作流程圖。
圖3是一個(gè)說明詞典的結(jié)構(gòu)的本發(fā)明優(yōu)選實(shí)施例的示意圖，在詞典中漢語詞條記錄在“詞匯”一欄中；與詞匯相對應(yīng)的語音儲存在“語音”欄中；與詞匯相對應(yīng)的詞性儲存在“詞性”欄中，N表示名詞，V表示動詞，J表示形容詞，A表示副詞，…；相鄰詞匯擴(kuò)展成為詞組的語法儲存在“擴(kuò)展語法”欄中，AN后面連接的名詞，BN前面連接的名詞，AV后面連接的動詞，BV前面連接的動詞，AA后面連接的副詞，BA前面連接的副詞AJ后面連接的形容詞，BJ前面連接的形容詞Ψ無擴(kuò)展語法圖4是本發(fā)明音節(jié)-音素查找部分的優(yōu)選實(shí)施例的的結(jié)構(gòu)圖。
圖5是根據(jù)本發(fā)明每個(gè)語音的基本連續(xù)語音儲存部分的優(yōu)選實(shí)施例的結(jié)構(gòu)圖。
圖6是本發(fā)明音節(jié)-音素查找部分的優(yōu)選實(shí)施例的結(jié)構(gòu)圖。
圖7是本發(fā)明元音參數(shù)子部分的優(yōu)選實(shí)施例的結(jié)構(gòu)圖。
圖8是根據(jù)本發(fā)明元音環(huán)境影響子部分的優(yōu)選實(shí)施例的結(jié)構(gòu)圖。其中該部分用于對前元音的連續(xù)語音的音素的影響。
圖9是用于語音識別的傳統(tǒng)的連續(xù)語音處理裝置的方框圖。
11表示一個(gè)詞匯檢查部分，通過與儲存在詞典中的詞匯比較檢查每個(gè)詞匯的音節(jié)的位置。
12表示一個(gè)儲存漢語詞匯和相應(yīng)的信息的詞典，例如語音標(biāo)識、詞性、擴(kuò)展句法等。如圖3中所示說明詞典12構(gòu)造的示意圖。
13表示一個(gè)語音標(biāo)識生成部分，用于尋找與詞典中每個(gè)被檢查詞匯相一致語音標(biāo)識。
14表示詞性/擴(kuò)展語法檢查部分，用于尋找與詞典中每個(gè)檢查詞匯相一致詞性和擴(kuò)展語法。
15表示詞組擴(kuò)展部分，用于把相鄰的詞匯用每個(gè)詞匯的詞性和擴(kuò)展語法組成詞組。
16表示一個(gè)音調(diào)/音節(jié)檢查部分，用于在生成的語音標(biāo)識中使用音調(diào)標(biāo)識檢查音節(jié)，并且用于存儲被檢查的音調(diào)。
17表示一個(gè)音節(jié)-音素查找部分，用于儲存每個(gè)單音節(jié)的語音標(biāo)識，并用于儲存組成相同音素的音素指定數(shù)目。如圖4所示說明音節(jié)-音素查找部分的結(jié)構(gòu)17的流程圖。
18表示一個(gè)音素檢查部分，用于使用音節(jié)-音素查找部分17的形成音調(diào)-檢查音節(jié)的檢查音素，并且用于存儲音素?cái)?shù)據(jù)。
19表示一個(gè)基本連續(xù)語音儲存部分，用于儲存從大量自然的語音數(shù)據(jù)的音素連續(xù)語音的統(tǒng)計(jì)分析中得到的基本的每個(gè)音素的連續(xù)語音。如圖5所示說明基本的連續(xù)語音儲存部分的19的結(jié)構(gòu)的流程圖，其中“@”表示無效的元音。
20表示一個(gè)基本的連續(xù)語音判定部分，用于檢查從基本的連續(xù)語音儲存部分19中的被檢查音素。
21表示構(gòu)造的連續(xù)語音參數(shù)儲存部分，該部分使用的信息包括音調(diào)，詞組結(jié)構(gòu)和每個(gè)音素在詞組中的位置，和在句子中的位置和相鄰音素的種類等。在本優(yōu)選實(shí)施例中，連續(xù)語音參數(shù)儲存部分21包括3個(gè)儲存子部分一個(gè)輔音參數(shù)子部分-一個(gè)元音參數(shù)子部分，該子部分用聲調(diào)，短語結(jié)構(gòu)和位置在詞組中的位置，和在句子中的位置和對于每個(gè)音素來說相鄰音素的種類構(gòu)造出來，一個(gè)元音環(huán)境影響子部分，該子部分用元音根據(jù)元音的連續(xù)語音在后面連接音素的影響構(gòu)造出來。如圖6,7,8所示說明連續(xù)語音參數(shù)儲存部分21的結(jié)構(gòu)。
22表示一個(gè)音節(jié)連續(xù)語音計(jì)算部分用于檢索音素的連續(xù)語音參數(shù)，用連續(xù)語音參數(shù)儲存部分21中使用信息，包括音調(diào)，在詞組中的位置，在句子中的位置和對于音素相鄰音素的種類等，作為索引關(guān)鍵字；該部分用于從基本連續(xù)語音和參數(shù)中的每個(gè)音素的連續(xù)語音計(jì)算；并且用于音+素的連續(xù)語音類加以獲得音節(jié)連續(xù)語音。
當(dāng)使用本裝置處理連續(xù)語音時(shí)，必須使用不同的寄存器和存儲緩沖器區(qū)域。雖然他們在圖1中被省略未顯示，但在實(shí)際應(yīng)用中它們是必須的，并且包括“TextBuffer”存儲緩沖器區(qū)域一用于儲存輸入句子的文本數(shù)據(jù)；“Pinyin”存儲緩沖器區(qū)域一用于儲存輸入句子的語音數(shù)據(jù)；
“wdi”寄存器一用于儲存句子中詞匯的指定數(shù)目(使用數(shù)字1,2,3,…等，1表示句子中的第一個(gè)詞匯)；“wd”矩陣寄存器-用于儲存在輸入的句子中每個(gè)檢查詞匯的數(shù)值(詞匯的起始位置，詞匯的長度)。例如，wd[4]=(5,2)表示在句子中的第四個(gè)詞匯起始自第五個(gè)音節(jié)并且有兩個(gè)音節(jié)的長度；“wd_type”矩陣寄存器-用于儲存在輸入的句子中每個(gè)檢查詞匯的詞性。例如wd_typewd_type[2]=N表示在句子中的第二個(gè)詞匯的詞性是名詞；“wd expand”矩陣寄存器-用于儲存在輸入的句子中每個(gè)檢查詞匯的擴(kuò)展語法。例如，wd_expand[1]=AN表在句子中的第一個(gè)詞匯的擴(kuò)展語法是后面連接名詞；wd-expand[1]=AN“i_wd_phr“矩陣寄存器-用于儲存在輸入的句子中每個(gè)詞組組成音節(jié)的數(shù)值(詞組的長度，詞組的位置)。例如，i_wd_phr[4]=(3,1)表示在句子中的第四一個(gè)音節(jié)形成了一個(gè)三音節(jié)詞組的第一個(gè)音節(jié)；“phr_start”寄存器-用于儲存在句子中詞組的起始位置；“phr_end”寄存器-用于儲存在句子中詞組的結(jié)束位置；“phr_length”寄存器-用于儲存在詞組的長度，以音節(jié)為單位；“i”寄存器-用于儲存在句子中音節(jié)的指定數(shù)目(使用數(shù)字1,2,3,…等)；“c”矩陣寄存器-用于儲存根據(jù)輸入句子的語音每個(gè)檢查音節(jié)的輔音指定數(shù)目；“v”矩陣寄存器-用于儲存根據(jù)輸入句子的語音每個(gè)檢查音節(jié)的元音指定數(shù)目；“t”矩陣寄存器-用于儲存根據(jù)輸入句子的語音每個(gè)檢查音節(jié)的音調(diào)標(biāo)識；“bc”矩陣寄存器-用于從基本連續(xù)語音儲存部分根據(jù)t[i]音節(jié)儲存一個(gè)(i)th音節(jié)的輔音基本連續(xù)語音；“tc”寄存器-用于儲存一個(gè)根據(jù)t[i]的來自輔音參數(shù)子部分的的(i)th音節(jié)的音調(diào)參數(shù)TC；“sc”寄存器-用于儲存位置影響參數(shù)Sc來自輔音參數(shù)子部分的根據(jù)位置坐標(biāo)I(如果檢測到c[I+1]和v[I+1]都等于0，這表示I已經(jīng)在句子的尾部；“pc”寄存器-用于儲存詞組影響參數(shù)Pc檢查來自輔音參數(shù)子部分根據(jù)I_wd_phr[I]；“dc”寄存器-用于儲存在句子中一個(gè)(I)音節(jié)的輔音連續(xù)語音，在該句子中dc=bc*tc*sc*pc；“bv”寄存器-用于儲存根據(jù)t[I]來自基本連續(xù)語音儲存部分的一個(gè)(I)th音節(jié)音調(diào)參數(shù)Tv的儲存；“tv”寄存器-用于儲存根據(jù)v[I]來自元音參數(shù)子部分的一個(gè)(I)th音節(jié)的音調(diào)參數(shù)Tv的儲存；“sv”寄存器-用于儲存位置影響參數(shù)Sv檢查來自輔音參數(shù)子部分的根據(jù)位置坐標(biāo)I(如果檢測到c[I+1]和v[I+1]都等于0，這表示I已經(jīng)在句子的尾部；“pv”寄存器-用于儲存根據(jù)I_wd_phr[I]檢查來自元音參數(shù)子部分的詞組影響參數(shù)Pv的儲存；“f”寄存器-用于檢查來自元音環(huán)境影響子部分的影響差數(shù)F使用c[I+1]作為檢索關(guān)鍵字(如果c[I+1]=0，則使用v[I+1])；“dv”寄存器-用于儲存在句子中一個(gè)(I)音節(jié)的元音連續(xù)語音，在該句子中dv=bv*tv*sv*pv+F；并且“d”矩陣寄存器-用于儲存在d[I]的句子中的一個(gè)(I)音節(jié)的連續(xù)語音語，在這里，d[I]=dc+dv.
圖2顯示用于漢語語音識別系統(tǒng)的連續(xù)語音處理裝置的優(yōu)選實(shí)施例的操作流程圖。在該裝置中使用音素作為基本處理單位。如圖2所示，在步驟S1中，句子的文本被輸進(jìn)TextBuffer存儲緩沖器區(qū)域中。
在步驟S2檢查是否目前輸入的文本關(guān)鍵字是一個(gè)文本的結(jié)束關(guān)鍵字，則進(jìn)行檢查。如果是，流程進(jìn)行步驟S3。否則，流程回到步驟S1。
在步驟S3中，檢查句子中的文本通過與詞典中詞匯，在句子中的位置和儲存在wd矩陣寄存器中的詞匯的比較找出每個(gè)詞匯。
在步驟S4中，根據(jù)在wd矩陣寄存器中的每個(gè)檢查詞匯，從詞典找到與詞匯相對應(yīng)的語音，并依次儲存在Pinyin儲存緩存器區(qū)域。
在步驟S5中，根據(jù)在wd矩陣寄存器中的每個(gè)檢查詞匯，從字典中找到與每個(gè)詞匯相對應(yīng)的詞性和擴(kuò)展語法，并且儲存分別儲存在wd_type和wd_expand矩陣寄存器中。
在步驟S6中，根據(jù)在wd矩陣寄存器中的每個(gè)檢查詞匯，與詞匯相對應(yīng)的每個(gè)音節(jié)的組成數(shù)據(jù)儲存在I_wd_phr矩陣寄存器中。
在步驟S7中，在wdi矩陣寄存器的數(shù)值設(shè)為1對詞組擴(kuò)展處理起始的第一個(gè)詞匯。
在步驟S8中，確定wdi(th)詞匯是否是擴(kuò)展語法。(如果數(shù)值為Ψ，表示詞匯沒有擴(kuò)展語法)如果是，流程進(jìn)行步驟S9，否則，流程進(jìn)行步驟S12。
在步驟S9中，根據(jù)擴(kuò)展語法，確定wdi(th)相鄰的前面或后面詞匯的詞性是否遵守，如果是，流程進(jìn)行步驟S10，否則，流程進(jìn)行步驟S12。
在步驟S10中，詞組擴(kuò)展操作開始。如果擴(kuò)展過程向前進(jìn)行，wdi-1被選擇作為詞匯被擴(kuò)展，如果過程擴(kuò)展向后進(jìn)行，wdi+1被選擇作為詞匯被擴(kuò)展，如果將要被擴(kuò)展的詞匯已被認(rèn)為擴(kuò)展成為詞組，這個(gè)詞組被認(rèn)為是一個(gè)被擴(kuò)展的詞組。相鄰的擴(kuò)展詞匯和將要被擴(kuò)展的詞匯結(jié)合組成一個(gè)擴(kuò)展的詞組。找到擴(kuò)展詞組的起始位置Phr_start和擴(kuò)展詞組的結(jié)束位置Phr end，并且擴(kuò)展詞組的長度計(jì)算如下Phr_length=Phr_end-Phr_start+1.起始位置Phr_start，結(jié)束位置Phr_end，和擴(kuò)展詞組的長度Phr_length隨后分別儲存在Phr_start,Phr_end,Phr_length中。
在步驟S11中，在i_wd_phr矩陣寄存器中的相應(yīng)的音節(jié)的數(shù)值根據(jù)擴(kuò)展詞組更新。特別地，i_wd_phr[phr_start]=(phr_length,1)i_wd_phr[phr_start+1]=(phr_length,2)i_wd_phr[phr_end]=(phr_length,phr_length)在步驟S12中，確定wdi是否已達(dá)到最后一個(gè)詞匯。如果是，流程進(jìn)行步驟S14結(jié)束詞組擴(kuò)展操作，否則，流程進(jìn)行步驟S13。
在步驟S13中，在wdi寄存器中的數(shù)值是以1為單位遞增，并且流程順序地返回步驟S8繼續(xù)詞組擴(kuò)展操作。
在步驟S14中，在i寄存器中的數(shù)值設(shè)為1，用在矩陣寄存器中的儲存音調(diào)，輔音，元音的坐標(biāo)。
在步驟S15中，對于音調(diào)還在Pinyin儲存緩存器區(qū)域被檢查和儲存的音節(jié)，音調(diào)用于找到單音節(jié)，而音節(jié)音調(diào)標(biāo)識儲存在t[i]中。
在步驟S16中，組成檢查單音節(jié)的語音指定數(shù)目從音節(jié)-音素查找部分被找到，在那里輔音指定數(shù)目儲存在c[i]中，元音指定數(shù)目儲存在v[i]中。
在步驟S17中，確定是否句子的檢查已完成。如果是，流程進(jìn)行步驟S19。否則，流程進(jìn)行步驟S18。
在步驟S18中，在寄存器i中的數(shù)值以1為遞增單位，然后流程返回步驟S15。
在步驟S19中，在寄存器i中的數(shù)值被重設(shè)為1用于起始自第一個(gè)音節(jié)連續(xù)語音的處理。
在步驟S20中，確定是否(i)音節(jié)包括一個(gè)輔音部分。如果是，流程進(jìn)行步驟S21。否則，流程進(jìn)行步驟S26。
在步驟S21中，組成檢查單輔音的指定數(shù)目作為索引關(guān)鍵字從基本的連續(xù)語音儲存部分連續(xù)語音Bc被找到，并且被儲存在寄存器中。
在步驟S22中，根據(jù)屬于輔音的音節(jié)的音調(diào)，音調(diào)的輔音連續(xù)語音參數(shù)Tc被從輔音參數(shù)的子部分找到并且儲存在tc寄存器中。
在步驟S23中，根據(jù)屬于輔音的音節(jié)的位置，在詞組中，從輔音參數(shù)子部分中輔音的詞組影響參數(shù)Pc被找到并儲存在pc寄存器中。
在步驟S24中，根據(jù)屬于輔音的音節(jié)的位置，在句子中，從輔音參數(shù)子部分中輔音的句子影響參數(shù)Sc被找到并儲存在Sc寄存器中。
在步驟S25中第(i)音節(jié)的輔音連續(xù)語音被計(jì)算(Dc=bc*tc*pc*sc)，并儲存在dc寄存器中。流程進(jìn)行步驟S27。
在步驟S26中，因?yàn)橐艄?jié)不包括輔音部分，在dc寄存器中的數(shù)值設(shè)為0。
在步驟S27中，用檢查元音的指定數(shù)目作為索引關(guān)鍵字從基本的連續(xù)語音儲存部分連續(xù)語音Bv被找到，并且被儲存在寄存器bv中。
在步驟S28中，根據(jù)屬于元音的音節(jié)的音調(diào)，從元音參數(shù)子部分中音調(diào)的元音連續(xù)語音Tv被找到并儲存在tc寄存器中。
在步驟S29中，根據(jù)屬于元音的音節(jié)的位置，在詞組中，從元音參數(shù)子部分中輔音的詞組影響參數(shù)Pc被找到并儲存在pc寄存器中。
在步驟S30中，根據(jù)屬于元音的音節(jié)的位置，在句子中，從元音參數(shù)子部分中輔音的句子影響參數(shù)Sv被找到并儲存在sv寄存器中。
在步驟S31中，用元音的后面連接音素作為索引關(guān)鍵字從元音環(huán)境影響儲存部分影響參數(shù)F被找到，并且被儲存在寄存器f中。
在步驟S32中，第(i)音節(jié)的元音連續(xù)語音被計(jì)算(Dv=bv*tv*pv*sv+f)，并儲存在dv寄存器中。
在步驟S33中，第(i)音節(jié)的連續(xù)語音被計(jì)算(D=dc+dv)，)，并儲存在d矩陣寄存器中的第(i)位置。
在步驟S34中，確定是否在句子中每個(gè)音節(jié)的連續(xù)語音已被判定。如果是，流程進(jìn)行步驟S36。否則，流程進(jìn)行步驟S35。
在步驟S35中，在i寄存器中的數(shù)值是以1為單位遞增，并且流程返回步驟S20繼續(xù)下一個(gè)音節(jié)的連續(xù)語音數(shù)據(jù)處理。
在步驟S36中，整個(gè)句子的每個(gè)音節(jié)的連續(xù)語音被輸出用于通過一個(gè)語音識別系統(tǒng)，并且裝置的操作結(jié)束。
對于優(yōu)選實(shí)施例的語音識別系統(tǒng)，說明前述的構(gòu)造的連續(xù)語音處理裝置的操作，用輸入句子“我爺爺最喜歡那張小桌子”為例該例子的工藝流程如下在步驟S1中，如圖1中說明用10句子輸入部分輸入句子，例如鍵盤，在步驟S2中，在文本中探測到一個(gè)結(jié)束關(guān)鍵字輸入結(jié)束。這時(shí)句子的文本數(shù)據(jù)“我爺爺最喜歡那張小桌子”儲存在TextBuffer[]儲存緩存器區(qū)域。
因此，在步驟S3中，通過與詞典12中的詞匯比較，詞匯檢查部分11檢查句子中的每個(gè)詞匯“我、”“爺爺、”“最、”、“喜歡、”“那張、”“小、”“桌子、”并且記錄句子中每個(gè)詞匯的起始位置和在矩陣寄存器中的一系列數(shù)目對中的詞匯字符數(shù)目(詞匯起始位置，詞匯長度)。因此，wd[1]=(1,1),…“我”wd[2]=(2,2),…“爺爺”wd[3]=(4,1),…“最”wd[4]=(5,2),…“喜歡”wd[5]=(7,2),…“那張”
wd[6]=(9,1),…“小”wd[7]=(10,1),…“桌子”按順序，在步驟S4中，根據(jù)記錄在wd[]中的每個(gè)詞匯，語音標(biāo)識生成部分在詞典中找到與每個(gè)詞匯相對應(yīng)的語音，并依次同樣地儲存在PinyinBuffer[]。同時(shí)，儲存在PinyinBuffer[]中的語音數(shù)據(jù)是"uo3ie2ie2zuei4xi3huanlna4zhanqlxiao3zhuolz5"然后，在步驟S5中，根據(jù)在記錄在wd[]中的每個(gè)詞匯，詞性和擴(kuò)展語法部分14從字典中找到與每個(gè)詞匯相對應(yīng)的詞性和擴(kuò)展語法，(詞典的內(nèi)容如圖3所示)，并且儲存分別儲存在wd_type和we_expand矩陣寄存器中。因而，_wd type[1]=N,wd_expand[1]=AN；……“我”wd_type[2]=N,wd_expand[2]=Ψ；……“爺爺”wd_type[3]=A,wd_expand[3]=AV,AJ；…… “最”wd_type[4]=V,wd_expand[4]=Ψ；…… “喜歡”wd_type[5]=J,wd_expand[5]=AN；……. “那張”wd_type[6]=J,wd_expand[6]=AN；…… “小”wd_type[7]=N,wd_expand[7]=Ψ；…… “桌子”其次，詞組擴(kuò)展部分15用于啟動詞組擴(kuò)展操作。最初，在步驟S6中，根據(jù)在wd矩陣寄存器中的每個(gè)檢查詞匯，對應(yīng)的組成詞匯的每個(gè)音節(jié)的組成信息以格式wd_phr[syllable position]+(phrase length,location in phrase)儲存在I_wd_phr矩陣寄存器中。因此，wd[1]=(1,1),wd_phr[1]=(1,1)； wd[2]=(2,2),wd_phr[2]=(2,1)；wd_phr[3]=(2,2)； wd[3]=(4,1),wd_phr[4]=(1,1)； wd[4]=(5,2),wd_phr[5]=(2,1)；wd_phr[6]=(2,2)； wd[71=(10,2), wd_Phr[10]=(2,1)；wd_phr[11]=(2,2) 此后，在步驟S7中wdi寄存器的數(shù)值設(shè)為1開始第一個(gè)詞匯“我”的擴(kuò)展處理。在步驟S8中確定wd_expand[wdi]=An后，擴(kuò)展語法的陳述語氣隨著一個(gè)后面連接的名詞(≠Ψ)，在步驟S9中檢查下一個(gè)詞匯的詞性。此時(shí)，wd_type[wdi+1]=N，遵守?cái)U(kuò)展語法AN,N的名詞的陳述語氣。因此，(wdi)th詞匯“我”和(wdi+1)th詞匯“爺爺”可以擴(kuò)展成為詞組從wd_phr[1],wd_phr[2]和wd_phr[3]擴(kuò)展的新詞組有一個(gè)起始位置Phr_start=1，一個(gè)結(jié)束位置Phr_end=3，和一個(gè)詞組長度phr_length=3-1+1=3，分別儲存在phr_start,phr_edn和phr_length寄存器中。在步驟10中。隨后，包括3個(gè)音節(jié)的與這個(gè)詞組相關(guān)的數(shù)值在步驟S11中在I_wd_phr矩陣寄存器更新如下然后，因?yàn)樵诓襟ES12中確定wdi必須達(dá)到最后一個(gè)詞匯，在步驟S13中wdi的數(shù)值以1為單位遞增繼續(xù)下一個(gè)詞匯“爺爺”的擴(kuò)展操作。在步驟S8中確定wd_expand[wai]=Ψ后，因?yàn)?，在步驟S12中確定wdi必須達(dá)到最后一個(gè)詞匯，在步驟S13中wdi的數(shù)值以1為單位重復(fù)遞增，步驟S8再次執(zhí)行。因此，第3個(gè)詞匯，第4個(gè)詞匯…直到第7個(gè)詞匯“桌子”都重復(fù)步驟S8,S9,S10,S11,S12,S13的過程。探測到句子中最后一個(gè)詞匯已達(dá)到步驟S12詞組擴(kuò)展操作結(jié)束。此時(shí)，在wd_phr矩陣寄存器中數(shù)值如下從前述可見，在詞匯“我”，“爺爺”，“最”，喜歡“，“那張”，“小”，“桌子，”進(jìn)行了詞組擴(kuò)展操作后，可以獲得詞組“我爺爺，”“最喜歡，”“那張，”“小桌子，”。
接下來，音調(diào)/音節(jié)檢查操作開始。最初，在步驟S14中寄存器i的數(shù)值設(shè)為1。在步驟S15中，音調(diào)/音節(jié)檢查部分16用于檢查第一個(gè)音節(jié)“uo3,”而第3個(gè)音調(diào)儲存在t[i]中。此后，在步驟S16中，與單音節(jié)“uo，”有關(guān)，語音檢查部分18用于尋找音節(jié)-音素查找部分17(其中儲存的內(nèi)容如圖4所示)，并且確定音素的指定數(shù)目，組成“Uo”為0(沒有輔音)和47(uo)，他們分別儲存在c[i]和v[i]中。因?yàn)樵诓襟ES17中確定wdi必須達(dá)到最后句尾，在步驟S18中i的數(shù)值以1為單位遞增，并且流程返回步驟S15。音調(diào)/音節(jié)檢查部分16用于檢查第二個(gè)音節(jié)“ie3,”而在步驟S16中第2個(gè)音調(diào)儲存在t[i]中。隨后，在步驟S16中，與單音節(jié)“ie，”有關(guān)，語音檢查部分18用于尋找音節(jié)-音素查找部分17(其中儲存的內(nèi)容如圖4所示)，并且確定音素的指定數(shù)目，組成”ie”為0(沒有輔音)和37(ie)，他們分別儲存在c[i]和v[i]中。重復(fù)步驟S8,S9,S10,S11,S12,S13直到到達(dá)句尾。此時(shí)，在不同的寄存器中數(shù)值如下t[1]=3,c[1]=0,v[1]=47；[uo3]t[2]=2,c[2]=0,v[2]=37；[ie2]t[31=2,c[3]=0,v[3]=37；[ie2]t[4]=4,c[4]=19,v[4]=49；[zuei4]t[5]=3,c[5]=14,V[5]=35；[xi3]t[6]=1,c[6]=11,v[6]=50；[huanl]′t[7]=4,c[7]=7,v[7]=22；[na4]t[8]=1,c[81=15,v[8]=32；[zhangl]t[9]=3,c[9] =14,v[9]=39；[xiao3]t[10]=1,c[10] =15,v[10]=47；[zhuol ]t[11]=5,c[11]=19,v[11]=59[z5]為清楚起見，單音節(jié)安排在圖4為了讓它們出現(xiàn)在典型的句子中。
在處理已達(dá)到句尾后，在步驟S19中寄存器i的數(shù)值再一次設(shè)為1從第一個(gè)音節(jié)開師始音節(jié)處理。因?yàn)樵诓襟ES20中確定第一個(gè)音節(jié)不包括一個(gè)輔音(c[1]=0)，在步驟S26中輔音連續(xù)語音的數(shù)值設(shè)為0。
然后，計(jì)算第一個(gè)音節(jié)的元音部分的連續(xù)語音。根據(jù)元音的指定數(shù)目v[1]=47，從圖5的劇本連續(xù)語音儲存部分19中得到159ms的基本連續(xù)語音，并且在步驟S27中儲存在bv中。接下來，下列參數(shù)從元音參數(shù)子部分(其內(nèi)容如圖7所示)中獲得因?yàn)閷儆谠粢艄?jié)的音調(diào)示第3個(gè)音調(diào)，所以得到數(shù)值1.3并在步驟S28中儲存在tv中。因?yàn)橐艄?jié)示三字符(wd_phr[1]=(3,1)；)的第一個(gè)音節(jié)，所以得到數(shù)值0.85，并且在步驟S29中儲存在pv中。因?yàn)橐艄?jié)示在句子的開始，所以得到1.28且在步驟S30中儲存在sv中。此后，用t[i+1]=37“ie，”元音的后面連接語音，作為檢索關(guān)鍵字，如圖8所示從元音環(huán)境影響因素子部分中獲得參數(shù)值+5并在步驟S31中儲存在f中。接著，在步驟S32中計(jì)算用于音節(jié)的元音部分的連續(xù)語音是dv=159*1.3*0.85*1.28+5=230ms。從而，計(jì)算第一個(gè)音節(jié)的連續(xù)語音結(jié)果是d[1]=0+230=230ms，并在步驟S33中儲存該值。
因?yàn)樵诓襟ES34中確定句子中的每個(gè)連續(xù)語音必須被判定，所以在步驟S35中i的數(shù)值以1為單位遞增，并且流程返回步驟S20。用前述的過程確定第二個(gè)音節(jié)“ie2，”的連續(xù)語音，在步驟S32中儲存在輔音連續(xù)語音dc寄存器和元音連續(xù)語音dv寄存器的數(shù)值分別是dc=0，而dv=271*1.25.0.8*1+5=276ms。從而，在步驟33中找到第二個(gè)音節(jié)的連續(xù)語音是d[2]=0+276=276ms。
同樣的過程重復(fù)用于第3個(gè)單音節(jié)，第4個(gè)單音節(jié)，…直到第11個(gè)單音節(jié)“z5.”，當(dāng)在步驟S34中確定已經(jīng)達(dá)到句尾時(shí)，在步驟S36中輸出每個(gè)音節(jié)連續(xù)語音，并且裝置的操作此后結(jié)束。
在本例中“我爺爺最喜歡那張小桌子”"uo3ie2ie2zuei4xi3huanlna4zhanqlxiao3zhuolz5"從每個(gè)音節(jié)得到的連續(xù)語音分別時(shí)230,276,300,219,246,360,199,268,297,207,139，這樣得到的數(shù)值與測得的自然語音連續(xù)語音非常接近，也就是229,275,302,216,243,362,195,269,293,205,140,因此，本連續(xù)語音處理裝置可以提供自然連續(xù)語音的人工合成語音。
本發(fā)明不受前述的實(shí)施例的限制。例如可用單音節(jié)替代語音作為根據(jù)本發(fā)明的用于漢語語音識別的連續(xù)語音處理裝置的基本連續(xù)語音計(jì)算單位。通過修改基本連續(xù)語音儲存部分以便單音節(jié)的連續(xù)語音的儲存，通過修改連續(xù)語音參數(shù)儲存部分的參數(shù)與單音節(jié)的計(jì)算參數(shù)相一致，語音檢查部分和音節(jié)-音素檢查部分同時(shí)可以省略。此外，在本裝置的詞組擴(kuò)展部分，除了使用詞組擴(kuò)展語法擴(kuò)展相鄰的詞匯成為詞組，在輸入過程中可以增加詞組標(biāo)識。作為選擇，創(chuàng)立高速緩沖存儲器以至輸入句子中的詞組可通過比較方法檢查。本發(fā)明的實(shí)施例以漢語為例，連續(xù)語音處理裝置同樣可以在其他語言的語音識別系統(tǒng)中實(shí)現(xiàn)。
如前所述，本發(fā)明不僅考慮了對于音素的連續(xù)語音的音素、音調(diào)、在句子中音素的位置和前后連接的音素的影響，而且也考慮了在集資中詞組結(jié)構(gòu)的影響和關(guān)于音素的連續(xù)語音的在詞組中音素的位置。因此，可以克服以前技術(shù)中連續(xù)語音不標(biāo)準(zhǔn)的問題，而且合成語音的連續(xù)語音數(shù)據(jù)比用以前技術(shù)生成的數(shù)據(jù)更精確，從而提供高品質(zhì)的語音合成。
在描述本發(fā)明的一種優(yōu)選實(shí)施例的同時(shí)，還應(yīng)理解本發(fā)明不受該特定實(shí)施例的限制，而在不違背本發(fā)明的精神的條件下可以作出一些變化和修改。為此，期待著用所附的權(quán)利要求書來覆蓋本發(fā)明和任何的或全部的這種變化和修正。
權(quán)利要求
1．一種用漢語音節(jié)作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理方法，包括一個(gè)構(gòu)造用于儲存漢語詞匯和相關(guān)信息的詞典的程序，例如語音標(biāo)識、詞性、擴(kuò)展語法等；一個(gè)構(gòu)造用于儲存信息的音節(jié)-音素查找部分的程序，例如對應(yīng)于所有漢語音節(jié)每一個(gè)音節(jié)的指定的音素?cái)?shù)目(包括輔音數(shù)目和元音數(shù)目)等；一個(gè)構(gòu)造基本的連續(xù)語音儲存部分的程序，其中，該部分用于根據(jù)音素儲存基本連續(xù)語音的分類信息；一個(gè)構(gòu)造連續(xù)語音參數(shù)儲存部分的程序，其中，該部分用于根據(jù)每一個(gè)音節(jié)屬于的音調(diào)儲存連續(xù)語音參數(shù)，詞組結(jié)構(gòu)和在詞組中的位置，在句子中的位置和相關(guān)音素的種類；一個(gè)在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較的檢查每個(gè)詞匯的音節(jié)的位置的程序；一個(gè)根據(jù)儲存在詞典中的語音標(biāo)識每個(gè)檢查詞匯的音節(jié)生成語音的程序；一個(gè)用參考詞典檢查每個(gè)檢查詞匯的詞性和擴(kuò)展語法的程序；一個(gè)句子中的詞匯根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系組合成詞組的程序；一個(gè)用音調(diào)標(biāo)識在生成的文字語音標(biāo)識識中檢查每一個(gè)音節(jié)的程序；一個(gè)參照音節(jié)-音素查找部分的信息檢查每個(gè)被檢查的音素格式；一個(gè)從基本連續(xù)語音儲存部分檢索每個(gè)被檢查的連續(xù)語音的程序；和一個(gè)計(jì)算每個(gè)被檢查音素的連續(xù)語音的程序。從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成、詞組中的位置、句子中的位置和被檢查音素前后相鄰音素的種類相關(guān)的參數(shù)被檢查的音素組成每個(gè)被檢查音節(jié)，并且計(jì)算被檢查的音素的連續(xù)語音獲得每個(gè)被檢查音節(jié)的連續(xù)語音。
2．一種用漢語音節(jié)作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理方法，包括一個(gè)構(gòu)造用于儲存漢語詞匯和相關(guān)信息的詞典的程序，例如語音標(biāo)識、詞性、擴(kuò)展語法等；一個(gè)構(gòu)造基本的連續(xù)語音儲存部分的程序，其中，該部分用于根據(jù)音節(jié)儲存基本連續(xù)語音的分類信息；一個(gè)構(gòu)造連續(xù)語音參數(shù)儲存部分的程序，其中，該部分用于根據(jù)每一個(gè)音節(jié)的音調(diào)儲存連續(xù)語音參數(shù)，詞組結(jié)構(gòu)和在詞組中的位置、在句子中的位置和相關(guān)音節(jié)的種類；一個(gè)在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較的檢查每個(gè)詞匯的音節(jié)的位置的程序；一個(gè)根據(jù)儲存在詞典中的語音標(biāo)識每個(gè)檢查詞匯的每個(gè)音節(jié)生成語音的程序；一個(gè)用參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法的程序；一個(gè)句子中的詞匯根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系組合成詞組的程序；一個(gè)用音調(diào)標(biāo)識在生成的文字語音標(biāo)識識中檢查每一個(gè)音節(jié)的程序；一個(gè)從基本連續(xù)語音儲存部分檢索每個(gè)被檢查的連續(xù)語音的程序；和一個(gè)計(jì)算從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成、詞組中的位置、句子中的位置和被檢查音素前后相鄰音素的種類相關(guān)的參數(shù)中每個(gè)被檢查的音節(jié)的連續(xù)語音程序。
3．一種用漢語音素作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理裝置，包括一個(gè)詞典，用于儲存漢語詞匯和相關(guān)信息。例如語音標(biāo)識、詞性、擴(kuò)展語法等；一個(gè)音節(jié)-音素查找部分，用于儲存信息。例如對應(yīng)于所有漢語音節(jié)每一個(gè)音節(jié)的指定的音素?cái)?shù)目(包括輔音的指定數(shù)目和元音的指定數(shù)目)等；一個(gè)基本的連續(xù)語音儲存部分，用于根據(jù)音素儲存基本連續(xù)語音的分類信息；一個(gè)連續(xù)語音參數(shù)儲存部分，用于根據(jù)每一個(gè)音節(jié)屬于的音調(diào)儲存連續(xù)語音參數(shù)，詞組結(jié)構(gòu)和在詞組中的位置、在句子中的位置和相關(guān)音素的種類；一個(gè)詞匯檢查部分，用于在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較的檢查每個(gè)詞匯的音節(jié)的位置；一個(gè)語音標(biāo)識生成部分，用于根據(jù)儲存在詞典中的語音標(biāo)識生成檢查每個(gè)被詞匯的語音；一個(gè)詞性/擴(kuò)展語法檢查部分，用于參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法的詞性和擴(kuò)展語法；一個(gè)詞組擴(kuò)展部分，用于根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系把詞匯組合成詞組；一個(gè)音調(diào)/音節(jié)檢查部分，用于在生成的文字語音標(biāo)識識中用音調(diào)標(biāo)識檢查每一個(gè)音節(jié)；一個(gè)音素檢查部分，用于參照音節(jié)-音素查找部分的信息檢查每個(gè)被檢查的音素格式；一個(gè)基本連續(xù)語音判定部分，從基本連續(xù)語音儲存部分檢索每個(gè)被檢查音素的連續(xù)語音；和一個(gè)音素的連續(xù)語音計(jì)算部分，用于計(jì)算每個(gè)被檢查音素的連續(xù)語音。從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成、詞組中的位置、句子中的位置和被檢查音素前后相鄰音素的種類相關(guān)的參數(shù)被檢查的音素組成每個(gè)被檢查音節(jié)，并且計(jì)算被檢查的音素的連續(xù)語音獲得每個(gè)被檢查音節(jié)的連續(xù)語音。
4．一種用漢語音節(jié)作為基本處理單元的漢語語音識別系統(tǒng)的連續(xù)語音處理裝置，包括一個(gè)詞典，用于儲存漢語詞匯和相關(guān)信息。例如語音標(biāo)識、詞性、擴(kuò)展語法等；一個(gè)基本的連續(xù)語音儲存部分，用于根據(jù)音節(jié)儲存基本的連續(xù)語音分類信息；一個(gè)連續(xù)語音參數(shù)儲存部分，用于根據(jù)每一個(gè)音節(jié)的音調(diào)，詞組結(jié)構(gòu)和在詞組中的位置、在句子中的位置和相關(guān)音素的種類來儲存連續(xù)語音參數(shù)；一個(gè)詞匯檢查部分，用于在一個(gè)任何長度的輸入句子里通過與儲存在詞典中的詞匯相比較的檢查每個(gè)詞匯的音節(jié)的位置；一個(gè)語音標(biāo)識生成部分，用于根據(jù)儲存在詞典中的語音標(biāo)識生成檢查每個(gè)被詞匯的語音；一個(gè)詞性/擴(kuò)展語法檢查部分，用于參考詞典檢查每個(gè)被檢查詞匯的詞性和擴(kuò)展語法的詞性和擴(kuò)展語法；一個(gè)詞組擴(kuò)展部分，用于根據(jù)擴(kuò)展語法和相鄰詞匯的詞性的關(guān)系把詞匯組合成詞組；一個(gè)音調(diào)/音節(jié)檢查部分，用于在生成的文字語音標(biāo)識識中用音調(diào)標(biāo)識檢查每一個(gè)音節(jié)；一個(gè)基本連續(xù)語音判定部分，從基本連續(xù)語音儲存部分檢索每個(gè)被檢查音素的連續(xù)語音；和一個(gè)音素的連續(xù)語音計(jì)算部分，用于計(jì)算從基本的連續(xù)語音和與音調(diào)、詞組構(gòu)成、詞組中的位置、句子中的位置和被檢查音素前后相鄰音素的種類相關(guān)的參數(shù)被檢查的音素組成每個(gè)被檢查音節(jié)每個(gè)被檢查音素的連續(xù)語音。
全文摘要
本發(fā)明的連續(xù)語音處理方法和裝置中,分析了大量的自然語音,已知單音節(jié)的連續(xù)語音會隨著一些因素變化,例如音素、音調(diào)、詞組結(jié)構(gòu)、在詞組中的位置,在句子中的位置和前后連接的音素等、用這些變化因素建立起來一個(gè)“連續(xù)語音參數(shù)儲存部分”,通過檢索連續(xù)語音參數(shù)和在音節(jié)連續(xù)語音計(jì)算中結(jié)合音節(jié)的基本連續(xù)語音,在句子中可以精確地確定每個(gè)單音節(jié)的連續(xù)語音。本發(fā)明的語音識別系統(tǒng)可以采用自然的連續(xù)語音合成語音。
文檔編號G10L13/00GK1315722SQ0013006
公開日2001年10月3日申請日期2000年10月26日優(yōu)先權(quán)日2000年3月28日
發(fā)明者孫世章, 謝琴韻申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細(xì)技術(shù)資料下載