利用語音輸入以建構(gòu)中文新詞的方法及裝置的制作方法

文檔序號：6514962閱讀：284來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：利用語音輸入以建構(gòu)中文新詞的方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語音辨識造詞的方法，特別是涉及一種非特定語者(Speaker-Independent)語音輸入以建構(gòu)新詞的方法及裝置，解決語音辨識系統(tǒng)，特別是非特定語者中文語音辨識系統(tǒng)，面臨詞匯不足時(shí)，一個(gè)方便的增加新詞匯的方式。
背景技術(shù)：
語音辨識(speech recognition)毫無疑問的是一種熱門的研究與商業(yè)課題。語音辨識通常是將輸入的語音取出特征參數(shù)，再與資料庫的樣本相比對，找出與輸入相異度低的樣本取出。然而新詞的出現(xiàn)，是語音辨識系統(tǒng)時(shí)常面臨的問題。非特定語者中文語音辨識系統(tǒng)(Speaker-independentMandarin speech recognition)目前增加新詞的方式，大致可分為以下二類1、鍵盤輸入圖1是鍵盤輸入造詞的方塊示意圖，包含鍵盤100、轉(zhuǎn)換器102、詞匯模組產(chǎn)生器104、音節(jié)到次音節(jié)模組辭典106、次音節(jié)模組108、語音辨識詞匯模組110，將新詞的中文字或其讀音利用鍵盤鍵入系統(tǒng)，必先經(jīng)過字轉(zhuǎn)音的程序，再將對應(yīng)的音節(jié)的次音節(jié)組(Sub-syllablemodels)串成詞匯模組，之后交由語音辨識詞匯模組建入資料庫，缺點(diǎn)為需要鍵盤。
2、重新訓(xùn)練新詞模型圖2是重新訓(xùn)練新詞模型的方塊示意圖，包含語音輸入單元200、擷取單元202、訓(xùn)練詞模組204與語音辨識詞匯模組206。利用語音輸入單元，搜集使用者該詞匯的發(fā)音取出特征值，產(chǎn)生訓(xùn)練詞的聲學(xué)模型，最后將所得資料交由語音辨識詞匯模組建入資料庫，缺點(diǎn)是不易大量收集、且容易流于需要特定使用者語音(Speaker-dependent)才能辨識。
雖然，上面提出增加新詞的技術(shù)，然而，目前為止，并沒有一個(gè)使用語音方式增加新詞的系統(tǒng)。當(dāng)面臨辭匯不足時(shí)，仍需靠鍵盤，或須經(jīng)由收集語音特征的方式，來建立新詞匯。
由此可見，上述現(xiàn)有的語音辨識系統(tǒng)顯然仍存在有不便與缺陷，而亟待加以進(jìn)一步改進(jìn)。為了解決語音辨識系統(tǒng)存在的問題，相關(guān)廠商莫不費(fèi)盡心思來謀求解決之道，但長久以來一直未見適用的設(shè)計(jì)被發(fā)展完成，而一般產(chǎn)品又沒有適切的結(jié)構(gòu)能夠解決上述問題，此顯然是相關(guān)業(yè)者急欲解決的問題。
有鑒于上述現(xiàn)有的語音辨識系統(tǒng)存在的缺陷，本發(fā)明人基于從事此類產(chǎn)品設(shè)計(jì)制造多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專業(yè)知識，并配合學(xué)理的運(yùn)用，積極加以研究創(chuàng)新，以期創(chuàng)設(shè)一種新型結(jié)構(gòu)的利用語音輸入以建構(gòu)中文新詞的方法及裝置，能夠改進(jìn)一般現(xiàn)有的語音辨識系統(tǒng)，使其更具有實(shí)用性。經(jīng)過不斷的研究、設(shè)計(jì)，并經(jīng)反復(fù)試作樣品及改進(jìn)后，終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。

發(fā)明內(nèi)容
本發(fā)明的目的在于，克服現(xiàn)有的語音辨識方法存在的缺陷，而提供一種新的利用語音輸入以建構(gòu)中文新詞的方法及裝置，所要解決的技術(shù)問題是使其可以解決語音辨識系統(tǒng)，特別是非特定語者中文語音辨識系統(tǒng)，面臨詞匯不足時(shí)，成為一個(gè)方便的增加新詞匯的方式，從而更加適于實(shí)用。
本發(fā)明的另一目的在于，提供一種利用語音輸入以建構(gòu)中文新詞的方法及裝置，所要解決的技術(shù)問題是使其解決語音辨識系統(tǒng)，特別是非特定語者中文語音辨識系統(tǒng)，面臨詞匯不足時(shí)，成為一個(gè)方便的增加新詞匯的方式，并提供一個(gè)人性化的使用界面而達(dá)到創(chuàng)造新詞匯，從而更加適于實(shí)用。
本發(fā)明的目的及解決其技術(shù)問題是采用以下技術(shù)方案來實(shí)現(xiàn)的。依據(jù)本發(fā)明提出的一種利用語音輸入以建構(gòu)中文新詞的方法，其包括以下步驟接收一語音訊號；擷取該語音訊號的一特征參數(shù)；根據(jù)一自然聲學(xué)模型以判斷與該特征參數(shù)相應(yīng)的音節(jié)或字元；儲存判斷所得的音節(jié)或字元；以及進(jìn)行上述步驟并組合所得到的所有音節(jié)或字元以建構(gòu)新詞。
本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進(jìn)一步實(shí)現(xiàn)。
前述的利用語音輸入以建構(gòu)中文新詞的方法，其中所述的語音訊號是以透過已知詞描述的方式輸入。
前述的利用語音輸入以建構(gòu)中文新詞的方法，其中所述的語音訊號是以注音描述方式輸入。
前述的利用語音輸入以建構(gòu)中文新詞的方法，其中所述的語音訊號是以拼音描述方式輸入。
前述的利用語音輸入以建構(gòu)中文新詞的方法，其中所述的儲存該音節(jié)或字元的步驟包括接收一判斷訊號；當(dāng)該判斷訊號表示該音節(jié)或字元為正確時(shí)，儲存該音節(jié)或字元。
本發(fā)明的目的及解決其技術(shù)問題還采用以下的技術(shù)方案來實(shí)現(xiàn)。依據(jù)本發(fā)明提出的一種利用語音輸入以建構(gòu)中文新詞的裝置，適用于接收一語音訊號以決定要新增至資料庫中的一新詞，該利用語音輸入以建構(gòu)新詞的裝置包括一語音輸入單元，接收外界輸入的該語音訊號；一特征擷取單元，擷取該語音訊號的一特征參數(shù)；一描述限制單元，儲存一聲學(xué)模型、一詞匯資料庫與一語言模型；一語音辨識模組，接收該特征參數(shù)，利用該特征參數(shù)從該描述限制單元中取得相應(yīng)的至少一描述語以及該描述語中與該新詞相關(guān)的一相關(guān)音節(jié)或相關(guān)字元，并根據(jù)該相關(guān)音節(jié)或相關(guān)字元自該詞匯資料庫中取得相應(yīng)的至少一音節(jié)或字元；一暫存單元，暫存該預(yù)測字匯做為該新詞的其中一部份；一音節(jié)/字元確認(rèn)單元，耦接至該語音辨識模組，判斷與該新詞相關(guān)的資料是否完全輸入完畢；以及一組合單元，在與該新詞相關(guān)的資料輸入完畢后，組合該暫存單元中所儲存的內(nèi)容并輸出組合結(jié)果為該新詞。
本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進(jìn)一步實(shí)現(xiàn)。前述的利用語音輸入以建構(gòu)中文新詞的裝置，其中該音節(jié)/字元確認(rèn)單元更包括提供一使用者界面以確認(rèn)該音節(jié)或字元是否正確，并在確認(rèn)該音節(jié)或字元正確時(shí)才儲存至該暫存單元中。
本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。由以上技術(shù)方案可知，為了達(dá)到前述發(fā)明目的，本發(fā)明的主要技術(shù)內(nèi)容如下本發(fā)明提出一種非特定語者中文語音輸入以建構(gòu)新詞的方法及裝置。中文的詞是由一個(gè)個(gè)中文字(字元)所組成，使用者對麥克風(fēng)逐一描述新詞的每個(gè)字元或音節(jié)，此裝置便將輸入的語音訊號數(shù)位化，以及從數(shù)位化后的語音訊號中取得該特征參數(shù)，利用語音辨識模組將特征參數(shù)與聲學(xué)模型、詞匯資料庫和語言模型作比對以判斷相應(yīng)的字元或音節(jié)，并將該字元與音節(jié)存入暫存單元，且經(jīng)由使用者確認(rèn)完成與否，若完成，則將暫存單元內(nèi)儲存的字元組與音節(jié)組交由組合單元組合為一新詞匯。
依照本發(fā)明一個(gè)較佳實(shí)施例所述，上述的語音辨識模組更包括一確認(rèn)模組以確認(rèn)字匯的正確性。
本發(fā)明因采用語音輸入創(chuàng)造新詞的方式，因此使用界面人性化且使語音判讀不會只能判讀固定使用者。
綜上所述，本發(fā)明特殊結(jié)構(gòu)的利用語音輸入以建構(gòu)中文新詞的方法及裝置，其能夠解決語音辨識系統(tǒng)，特別是非特定語者中文語音辨識系統(tǒng)，面臨詞匯不足時(shí)，提供一個(gè)方便的增加新詞匯的方式，并提供一個(gè)人性化的使用界面而達(dá)到創(chuàng)造新詞匯，從而更加適于實(shí)用。其具有上述諸多的優(yōu)點(diǎn)及實(shí)用價(jià)值，并在同類產(chǎn)品及方法中未見有類似的結(jié)構(gòu)設(shè)計(jì)及方法公開發(fā)表或使用而確屬創(chuàng)新，其不論在產(chǎn)品或功能上皆有較大的改進(jìn)，在技術(shù)上有較大的進(jìn)步，并產(chǎn)生了好用及實(shí)用的效果，且較現(xiàn)有的語音輸入系統(tǒng)具有增進(jìn)的多項(xiàng)功效，從而更加適于實(shí)用，而具有產(chǎn)業(yè)的廣泛利用價(jià)值，誠為一新穎、進(jìn)步、實(shí)用的新設(shè)計(jì)。
上述說明僅是本發(fā)明技術(shù)方案的概述，為了能夠更清楚了解本發(fā)明的技術(shù)手段，而可依照說明書的內(nèi)容予以實(shí)施，并為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂，以下特舉出多個(gè)較佳實(shí)施例，并配合附圖，詳細(xì)說明如下。

圖1是現(xiàn)有習(xí)知鍵盤輸入造詞法方塊示意圖。
圖2是現(xiàn)有習(xí)知重新訓(xùn)練新詞模型的方塊示意圖。
圖3是根據(jù)本發(fā)明利用語音輸入以建構(gòu)新詞的裝置方塊圖。
圖4是根據(jù)本發(fā)明利用語音輸入以建構(gòu)新詞的流程圖。
100鍵盤 102轉(zhuǎn)換器104詞匯模組產(chǎn)生器106音節(jié)到次音節(jié)模組辭典108次音節(jié)模組110、206語音辨識詞匯模組200語音輸入單元 202擷取單元204訓(xùn)練詞模組300描述語輸入單元302特征參數(shù)擷取單元 304語音辨識模組306描述限制單元 308音節(jié)/字元確認(rèn)單元310暫存單元 312組合單元400接收語音訊號 402擷取特征參數(shù)404進(jìn)行語音辨識，產(chǎn)生數(shù)個(gè)候選字元或音節(jié)406使用者篩選正確結(jié)果408暫存區(qū)410新詞輸入完成否412組合新詞模型具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效，以下結(jié)合附圖及較佳實(shí)施例，對依據(jù)本發(fā)明提出的利用語音輸入以建構(gòu)中文新詞的方法及裝置其具體實(shí)施方式
、步驟、特征及其功效，詳細(xì)說明如后。
請參閱圖3所示，是根據(jù)本發(fā)明一較佳實(shí)施例，為本裝置的方塊圖，用于語音輸入造詞系統(tǒng)包括一個(gè)描述語輸入單元300用以輸入語音并送至特征參數(shù)擷取單元302，特征參數(shù)擷取單元302用以擷取語音的特征參數(shù)并送至語音辨識模組304，語音辨識模組304的功能為將擷取單元302擷取的特征值與描述限制單元306內(nèi)的資料作搜尋及比對的動(dòng)作，其中描述限制單元306包含有聲學(xué)模型、詞匯資料庫與語言模型。語音辨識模組304的輸出，通常會有零至數(shù)個(gè)最可能的辨識結(jié)果，音節(jié)/字元確認(rèn)單元308是需要和使用者互動(dòng)，從中挑選出一個(gè)使用者認(rèn)為對的答案，若都沒有，則進(jìn)入描述語輸入單元300，請使用者(換個(gè)說法)再說一次。若有，將結(jié)果暫存至?xí)捍鎲卧?10，但新詞尚未輸入完畢，則還是進(jìn)入描述語輸入單元300，進(jìn)行下一個(gè)字元或音節(jié)的描述。當(dāng)新詞輸入完畢，音節(jié)/字元確認(rèn)單元308通知組合單元312進(jìn)行詞匯模型的組合。
依上述的實(shí)施例中，利用圖4流程圖說明，首先我們先接收語音訊號(步驟400)，將接收的語音訊號轉(zhuǎn)換成數(shù)位訊號后擷取出特征參數(shù)(步驟402)，再進(jìn)行語音辨識(步驟404)，判定輸入為何種描述語，根據(jù)描述語產(chǎn)生多數(shù)個(gè)候選字元或音節(jié)，經(jīng)由使用者篩選正確結(jié)果(步驟406)，使用者發(fā)覺無正確結(jié)果時(shí)，可回到圖3描述語輸入單元300裝置，使用者可換個(gè)描述，再說一次，重新接收語音訊號(步驟400)；或使用者可以決定放棄創(chuàng)造新詞匯，則此流程結(jié)束；若使用者篩選完成，則將使用者篩選字元或音節(jié)放到暫存區(qū)(步驟408)，下一步則要使用者確認(rèn)新詞輸入完成否(步驟410)，若未完成，則回到步驟400接收語音訊號重新該流程，若已完成，則把暫存區(qū)(步驟408)暫存資料組合新詞模型(步驟412)。
上面實(shí)施方法步驟中，接收語音訊號(步驟400)里面，使用者可以是透過已知詞的描述方式，例如“臺灣的臺”。或是利用注音的描述方式，例如“ㄊㄞ臺二聲臺”。或是拼音的描述方式，例如“t-a-i-2”，進(jìn)行描述。
又上面實(shí)施方法步驟中，進(jìn)行語音辨識(步驟404)，判定輸入為何種描述語，根據(jù)描述語產(chǎn)生多數(shù)個(gè)候選字元或音節(jié)，實(shí)行流程為分析語音辨識結(jié)果，以找出對應(yīng)字元或音節(jié)。若無法找到相對應(yīng)字元或音節(jié)，可以回到本發(fā)明裝置內(nèi)描述語輸入單元300再次重復(fù)該步驟。
以上所述，僅是本發(fā)明的較佳實(shí)施例而已，并非對本發(fā)明作任何形式上的限制，雖然本發(fā)明已以較佳實(shí)施例揭露如上，然而并非用以限定本發(fā)明，任何熟悉本專業(yè)的技術(shù)人員，在不脫離本發(fā)明技術(shù)方案范圍內(nèi)，當(dāng)可利用上述揭示的方法及技術(shù)內(nèi)容作出些許的更動(dòng)或修飾為等同變化的等效實(shí)施例，但是凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容，依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對以上實(shí)施例所作的任何簡單修改、等同變化與修飾，均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種利用語音輸入以建構(gòu)中文新詞的方法，其包括以下步驟接收一語音訊號；擷取該語音訊號的一特征參數(shù)；根據(jù)一自然聲學(xué)模型以判斷與該特征參數(shù)相應(yīng)的音節(jié)或字元；儲存判斷所得的音節(jié)或字元；以及進(jìn)行上述步驟并組合所得到的所有音節(jié)或字元以建構(gòu)新詞。
2.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法，其特征在于其中所述的語音訊號是以透過已知詞描述的方式輸入。
3.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法，其特征在于其中所述的語音訊號是以注音描述方式輸入。
4.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法，其特征在于其中所述的語音訊號是以拼音描述方式輸入。
5.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法，其特征在于其中所述的儲存該音節(jié)或字元的步驟包括接收一判斷訊號；當(dāng)該判斷訊號表示該音節(jié)或字元為正確時(shí)，儲存該音節(jié)或字元。
6.一種利用語音輸入以建構(gòu)中文新詞的裝置，適用于接收一語音訊號以決定要新增至資料庫中的一新詞，其特征在于該利用語音輸入以建構(gòu)新詞的裝置包括一語音輸入單元，接收外界輸入的該語音訊號；一特征擷取單元，擷取該語音訊號的一特征參數(shù)；一描述限制單元，儲存一聲學(xué)模型、一詞匯資料庫與一語言模型；一語音辨識模組，接收該特征參數(shù)，利用該特征參數(shù)從該描述限制單元中取得相應(yīng)的至少一描述語以及該描述語中與該新詞相關(guān)的一相關(guān)音節(jié)或相關(guān)字元，并根據(jù)該相關(guān)音節(jié)或相關(guān)字元自該詞匯資料庫中取得相應(yīng)的至少一音節(jié)或字元；一暫存單元，暫存該預(yù)測字匯做為該新詞的其中一部份；一音節(jié)/字元確認(rèn)單元，耦接至該語音辨識模組，判斷與該新詞相關(guān)的資料是否完全輸入完畢；以及一組合單元，在與該新詞相關(guān)的資料輸入完畢后，組合該暫存單元中所儲存的內(nèi)容并輸出組合結(jié)果為該新詞。
7.根據(jù)權(quán)利要求6所述的利用語音輸入以建構(gòu)中文新詞的裝置，其特征在于其中該音節(jié)/字元確認(rèn)單元更包括提供一使用者界面以確認(rèn)該音節(jié)或字元是否正確，并在確認(rèn)該音節(jié)或字元正確時(shí)才儲存至該暫存單元中。
全文摘要
本發(fā)明是關(guān)于一種利用語音輸入以建構(gòu)中文新詞的方法及裝置，其目的是要解決語音辨識系統(tǒng)，特別是非特定語者中文語音辨識系統(tǒng)，面臨詞匯不足時(shí)，一個(gè)方便的增加新詞匯的方式。中文的詞是由一個(gè)個(gè)中文字所組成，因此，把構(gòu)成詞的字描述完成，就是描述詞了。此方法是利用麥克風(fēng)逐一輸入描述中文字或其讀音的語音訊號，從語音訊號中取得特征參數(shù)，利用聲學(xué)模型、詞匯資料庫、語言模型與特征參數(shù)作比對以判斷相應(yīng)的字匯或音節(jié)，儲存至?xí)捍鎲卧Ｊ褂谜呖纱_認(rèn)完成與否，若完成，則將暫存單元內(nèi)儲存的字元組與音節(jié)組交由組合單元組合為一新詞匯。
文檔編號G06F17/28GK1815557SQ20051000734
公開日2006年8月9日申請日期2005年2月4日優(yōu)先權(quán)日2005年2月4日
發(fā)明者黃良聲, 蔡錦和, 王瑞璋, 沈家麟申請人:臺達(dá)電子工業(yè)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃良聲;蔡錦和;王瑞璋;沈家麟
技術(shù)所有人：臺達(dá)電子工業(yè)股份有限公司
我是此專利的發(fā)明人

上一篇：Fifo模塊以及具有fifo模塊的延遲均衡電路和速率匹配電路的制作方法
上一篇：一種分體式遙控鍵盤及其使用方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

語音輸入相關(guān)技術(shù)

語音輸入軟件相關(guān)技術(shù)

搜狗語音輸入相關(guān)技術(shù)

訊飛語音輸入相關(guān)技術(shù)

手機(jī)語音輸入軟件相關(guān)技術(shù)

win10語音輸入相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

利用語音輸入以建構(gòu)中文新詞的方法及裝置的制作方法