亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

利用語音輸入以建構(gòu)中文新詞的方法及裝置的制作方法

文檔序號:6514962閱讀:284來源:國知局
專利名稱:利用語音輸入以建構(gòu)中文新詞的方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音辨識造詞的方法,特別是涉及一種非特定語者(Speaker-Independent)語音輸入以建構(gòu)新詞的方法及裝置,解決語音辨識系統(tǒng),特別是非特定語者中文語音辨識系統(tǒng),面臨詞匯不足時(shí),一個(gè)方便的增加新詞匯的方式。
背景技術(shù)
語音辨識(speech recognition)毫無疑問的是一種熱門的研究與商業(yè)課題。語音辨識通常是將輸入的語音取出特征參數(shù),再與資料庫的樣本相比對,找出與輸入相異度低的樣本取出。然而新詞的出現(xiàn),是語音辨識系統(tǒng)時(shí)常面臨的問題。非特定語者中文語音辨識系統(tǒng)(Speaker-independentMandarin speech recognition)目前增加新詞的方式,大致可分為以下二類1、鍵盤輸入圖1是鍵盤輸入造詞的方塊示意圖,包含鍵盤100、轉(zhuǎn)換器102、詞匯模組產(chǎn)生器104、音節(jié)到次音節(jié)模組辭典106、次音節(jié)模組108、語音辨識詞匯模組110,將新詞的中文字或其讀音利用鍵盤鍵入系統(tǒng),必先經(jīng)過字轉(zhuǎn)音的程序,再將對應(yīng)的音節(jié)的次音節(jié)組(Sub-syllablemodels)串成詞匯模組,之后交由語音辨識詞匯模組建入資料庫,缺點(diǎn)為需要鍵盤。
2、重新訓(xùn)練新詞模型圖2是重新訓(xùn)練新詞模型的方塊示意圖,包含語音輸入單元200、擷取單元202、訓(xùn)練詞模組204與語音辨識詞匯模組206。利用語音輸入單元,搜集使用者該詞匯的發(fā)音取出特征值,產(chǎn)生訓(xùn)練詞的聲學(xué)模型,最后將所得資料交由語音辨識詞匯模組建入資料庫,缺點(diǎn)是不易大量收集、且容易流于需要特定使用者語音(Speaker-dependent)才能辨識。
雖然,上面提出增加新詞的技術(shù),然而,目前為止,并沒有一個(gè)使用語音方式增加新詞的系統(tǒng)。當(dāng)面臨辭匯不足時(shí),仍需靠鍵盤,或須經(jīng)由收集語音特征的方式,來建立新詞匯。
由此可見,上述現(xiàn)有的語音辨識系統(tǒng)顯然仍存在有不便與缺陷,而亟待加以進(jìn)一步改進(jìn)。為了解決語音辨識系統(tǒng)存在的問題,相關(guān)廠商莫不費(fèi)盡心思來謀求解決之道,但長久以來一直未見適用的設(shè)計(jì)被發(fā)展完成,而一般產(chǎn)品又沒有適切的結(jié)構(gòu)能夠解決上述問題,此顯然是相關(guān)業(yè)者急欲解決的問題。
有鑒于上述現(xiàn)有的語音辨識系統(tǒng)存在的缺陷,本發(fā)明人基于從事此類產(chǎn)品設(shè)計(jì)制造多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專業(yè)知識,并配合學(xué)理的運(yùn)用,積極加以研究創(chuàng)新,以期創(chuàng)設(shè)一種新型結(jié)構(gòu)的利用語音輸入以建構(gòu)中文新詞的方法及裝置,能夠改進(jìn)一般現(xiàn)有的語音辨識系統(tǒng),使其更具有實(shí)用性。經(jīng)過不斷的研究、設(shè)計(jì),并經(jīng)反復(fù)試作樣品及改進(jìn)后,終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。

發(fā)明內(nèi)容
本發(fā)明的目的在于,克服現(xiàn)有的語音辨識方法存在的缺陷,而提供一種新的利用語音輸入以建構(gòu)中文新詞的方法及裝置,所要解決的技術(shù)問題是使其可以解決語音辨識系統(tǒng),特別是非特定語者中文語音辨識系統(tǒng),面臨詞匯不足時(shí),成為一個(gè)方便的增加新詞匯的方式,從而更加適于實(shí)用。
本發(fā)明的另一目的在于,提供一種利用語音輸入以建構(gòu)中文新詞的方法及裝置,所要解決的技術(shù)問題是使其解決語音辨識系統(tǒng),特別是非特定語者中文語音辨識系統(tǒng),面臨詞匯不足時(shí),成為一個(gè)方便的增加新詞匯的方式,并提供一個(gè)人性化的使用界面而達(dá)到創(chuàng)造新詞匯,從而更加適于實(shí)用。
本發(fā)明的目的及解決其技術(shù)問題是采用以下技術(shù)方案來實(shí)現(xiàn)的。依據(jù)本發(fā)明提出的一種利用語音輸入以建構(gòu)中文新詞的方法,其包括以下步驟接收一語音訊號;擷取該語音訊號的一特征參數(shù);根據(jù)一自然聲學(xué)模型以判斷與該特征參數(shù)相應(yīng)的音節(jié)或字元;儲存判斷所得的音節(jié)或字元;以及進(jìn)行上述步驟并組合所得到的所有音節(jié)或字元以建構(gòu)新詞。
本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進(jìn)一步實(shí)現(xiàn)。
前述的利用語音輸入以建構(gòu)中文新詞的方法,其中所述的語音訊號是以透過已知詞描述的方式輸入。
前述的利用語音輸入以建構(gòu)中文新詞的方法,其中所述的語音訊號是以注音描述方式輸入。
前述的利用語音輸入以建構(gòu)中文新詞的方法,其中所述的語音訊號是以拼音描述方式輸入。
前述的利用語音輸入以建構(gòu)中文新詞的方法,其中所述的儲存該音節(jié)或字元的步驟包括接收一判斷訊號;當(dāng)該判斷訊號表示該音節(jié)或字元為正確時(shí),儲存該音節(jié)或字元。
本發(fā)明的目的及解決其技術(shù)問題還采用以下的技術(shù)方案來實(shí)現(xiàn)。依據(jù)本發(fā)明提出的一種利用語音輸入以建構(gòu)中文新詞的裝置,適用于接收一語音訊號以決定要新增至資料庫中的一新詞,該利用語音輸入以建構(gòu)新詞的裝置包括一語音輸入單元,接收外界輸入的該語音訊號;一特征擷取單元,擷取該語音訊號的一特征參數(shù);一描述限制單元,儲存一聲學(xué)模型、一詞匯資料庫與一語言模型;一語音辨識模組,接收該特征參數(shù),利用該特征參數(shù)從該描述限制單元中取得相應(yīng)的至少一描述語以及該描述語中與該新詞相關(guān)的一相關(guān)音節(jié)或相關(guān)字元,并根據(jù)該相關(guān)音節(jié)或相關(guān)字元自該詞匯資料庫中取得相應(yīng)的至少一音節(jié)或字元;一暫存單元,暫存該預(yù)測字匯做為該新詞的其中一部份;一音節(jié)/字元確認(rèn)單元,耦接至該語音辨識模組,判斷與該新詞相關(guān)的資料是否完全輸入完畢;以及一組合單元,在與該新詞相關(guān)的資料輸入完畢后,組合該暫存單元中所儲存的內(nèi)容并輸出組合結(jié)果為該新詞。
本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進(jìn)一步實(shí)現(xiàn)。前述的利用語音輸入以建構(gòu)中文新詞的裝置,其中該音節(jié)/字元確認(rèn)單元更包括提供一使用者界面以確認(rèn)該音節(jié)或字元是否正確,并在確認(rèn)該音節(jié)或字元正確時(shí)才儲存至該暫存單元中。
本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。由以上技術(shù)方案可知,為了達(dá)到前述發(fā)明目的,本發(fā)明的主要技術(shù)內(nèi)容如下本發(fā)明提出一種非特定語者中文語音輸入以建構(gòu)新詞的方法及裝置。中文的詞是由一個(gè)個(gè)中文字(字元)所組成,使用者對麥克風(fēng)逐一描述新詞的每個(gè)字元或音節(jié),此裝置便將輸入的語音訊號數(shù)位化,以及從數(shù)位化后的語音訊號中取得該特征參數(shù),利用語音辨識模組將特征參數(shù)與聲學(xué)模型、詞匯資料庫和語言模型作比對以判斷相應(yīng)的字元或音節(jié),并將該字元與音節(jié)存入暫存單元,且經(jīng)由使用者確認(rèn)完成與否,若完成,則將暫存單元內(nèi)儲存的字元組與音節(jié)組交由組合單元組合為一新詞匯。
依照本發(fā)明一個(gè)較佳實(shí)施例所述,上述的語音辨識模組更包括一確認(rèn)模組以確認(rèn)字匯的正確性。
本發(fā)明因采用語音輸入創(chuàng)造新詞的方式,因此使用界面人性化且使語音判讀不會只能判讀固定使用者。
綜上所述,本發(fā)明特殊結(jié)構(gòu)的利用語音輸入以建構(gòu)中文新詞的方法及裝置,其能夠解決語音辨識系統(tǒng),特別是非特定語者中文語音辨識系統(tǒng),面臨詞匯不足時(shí),提供一個(gè)方便的增加新詞匯的方式,并提供一個(gè)人性化的使用界面而達(dá)到創(chuàng)造新詞匯,從而更加適于實(shí)用。其具有上述諸多的優(yōu)點(diǎn)及實(shí)用價(jià)值,并在同類產(chǎn)品及方法中未見有類似的結(jié)構(gòu)設(shè)計(jì)及方法公開發(fā)表或使用而確屬創(chuàng)新,其不論在產(chǎn)品或功能上皆有較大的改進(jìn),在技術(shù)上有較大的進(jìn)步,并產(chǎn)生了好用及實(shí)用的效果,且較現(xiàn)有的語音輸入系統(tǒng)具有增進(jìn)的多項(xiàng)功效,從而更加適于實(shí)用,而具有產(chǎn)業(yè)的廣泛利用價(jià)值,誠為一新穎、進(jìn)步、實(shí)用的新設(shè)計(jì)。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,以下特舉出多個(gè)較佳實(shí)施例,并配合附圖,詳細(xì)說明如下。


圖1是現(xiàn)有習(xí)知鍵盤輸入造詞法方塊示意圖。
圖2是現(xiàn)有習(xí)知重新訓(xùn)練新詞模型的方塊示意圖。
圖3是根據(jù)本發(fā)明利用語音輸入以建構(gòu)新詞的裝置方塊圖。
圖4是根據(jù)本發(fā)明利用語音輸入以建構(gòu)新詞的流程圖。
100鍵盤 102轉(zhuǎn)換器104詞匯模組產(chǎn)生器106音節(jié)到次音節(jié)模組辭典108次音節(jié)模組110、206語音辨識詞匯模組200語音輸入單元 202擷取單元204訓(xùn)練詞模組300描述語輸入單元302特征參數(shù)擷取單元 304語音辨識模組306描述限制單元 308音節(jié)/字元確認(rèn)單元310暫存單元 312組合單元400接收語音訊號 402擷取特征參數(shù)404進(jìn)行語音辨識,產(chǎn)生數(shù)個(gè)候選字元或音節(jié)406使用者篩選正確結(jié)果408暫存區(qū)410新詞輸入完成否412組合新詞模型具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對依據(jù)本發(fā)明提出的利用語音輸入以建構(gòu)中文新詞的方法及裝置其具體實(shí)施方式
、步驟、特征及其功效,詳細(xì)說明如后。
請參閱圖3所示,是根據(jù)本發(fā)明一較佳實(shí)施例,為本裝置的方塊圖,用于語音輸入造詞系統(tǒng)包括一個(gè)描述語輸入單元300用以輸入語音并送至特征參數(shù)擷取單元302,特征參數(shù)擷取單元302用以擷取語音的特征參數(shù)并送至語音辨識模組304,語音辨識模組304的功能為將擷取單元302擷取的特征值與描述限制單元306內(nèi)的資料作搜尋及比對的動(dòng)作,其中描述限制單元306包含有聲學(xué)模型、詞匯資料庫與語言模型。語音辨識模組304的輸出,通常會有零至數(shù)個(gè)最可能的辨識結(jié)果,音節(jié)/字元確認(rèn)單元308是需要和使用者互動(dòng),從中挑選出一個(gè)使用者認(rèn)為對的答案,若都沒有,則進(jìn)入描述語輸入單元300,請使用者(換個(gè)說法)再說一次。若有,將結(jié)果暫存至?xí)捍鎲卧?10,但新詞尚未輸入完畢,則還是進(jìn)入描述語輸入單元300,進(jìn)行下一個(gè)字元或音節(jié)的描述。當(dāng)新詞輸入完畢,音節(jié)/字元確認(rèn)單元308通知組合單元312進(jìn)行詞匯模型的組合。
依上述的實(shí)施例中,利用圖4流程圖說明,首先我們先接收語音訊號(步驟400),將接收的語音訊號轉(zhuǎn)換成數(shù)位訊號后擷取出特征參數(shù)(步驟402),再進(jìn)行語音辨識(步驟404),判定輸入為何種描述語,根據(jù)描述語產(chǎn)生多數(shù)個(gè)候選字元或音節(jié),經(jīng)由使用者篩選正確結(jié)果(步驟406),使用者發(fā)覺無正確結(jié)果時(shí),可回到圖3描述語輸入單元300裝置,使用者可換個(gè)描述,再說一次,重新接收語音訊號(步驟400);或使用者可以決定放棄創(chuàng)造新詞匯,則此流程結(jié)束;若使用者篩選完成,則將使用者篩選字元或音節(jié)放到暫存區(qū)(步驟408),下一步則要使用者確認(rèn)新詞輸入完成否(步驟410),若未完成,則回到步驟400接收語音訊號重新該流程,若已完成,則把暫存區(qū)(步驟408)暫存資料組合新詞模型(步驟412)。
上面實(shí)施方法步驟中,接收語音訊號(步驟400)里面,使用者可以是透過已知詞的描述方式,例如“臺灣的臺”。或是利用注音的描述方式,例如“ㄊㄞ臺二聲臺”。或是拼音的描述方式,例如“t-a-i-2”,進(jìn)行描述。
又上面實(shí)施方法步驟中,進(jìn)行語音辨識(步驟404),判定輸入為何種描述語,根據(jù)描述語產(chǎn)生多數(shù)個(gè)候選字元或音節(jié),實(shí)行流程為分析語音辨識結(jié)果,以找出對應(yīng)字元或音節(jié)。若無法找到相對應(yīng)字元或音節(jié),可以回到本發(fā)明裝置內(nèi)描述語輸入單元300再次重復(fù)該步驟。
以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的方法及技術(shù)內(nèi)容作出些許的更動(dòng)或修飾為等同變化的等效實(shí)施例,但是凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對以上實(shí)施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種利用語音輸入以建構(gòu)中文新詞的方法,其包括以下步驟接收一語音訊號;擷取該語音訊號的一特征參數(shù);根據(jù)一自然聲學(xué)模型以判斷與該特征參數(shù)相應(yīng)的音節(jié)或字元;儲存判斷所得的音節(jié)或字元;以及進(jìn)行上述步驟并組合所得到的所有音節(jié)或字元以建構(gòu)新詞。
2.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法,其特征在于其中所述的語音訊號是以透過已知詞描述的方式輸入。
3.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法,其特征在于其中所述的語音訊號是以注音描述方式輸入。
4.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法,其特征在于其中所述的語音訊號是以拼音描述方式輸入。
5.根據(jù)權(quán)利要求1所述的利用語音輸入以建構(gòu)中文新詞的方法,其特征在于其中所述的儲存該音節(jié)或字元的步驟包括接收一判斷訊號;當(dāng)該判斷訊號表示該音節(jié)或字元為正確時(shí),儲存該音節(jié)或字元。
6.一種利用語音輸入以建構(gòu)中文新詞的裝置,適用于接收一語音訊號以決定要新增至資料庫中的一新詞,其特征在于該利用語音輸入以建構(gòu)新詞的裝置包括一語音輸入單元,接收外界輸入的該語音訊號;一特征擷取單元,擷取該語音訊號的一特征參數(shù);一描述限制單元,儲存一聲學(xué)模型、一詞匯資料庫與一語言模型;一語音辨識模組,接收該特征參數(shù),利用該特征參數(shù)從該描述限制單元中取得相應(yīng)的至少一描述語以及該描述語中與該新詞相關(guān)的一相關(guān)音節(jié)或相關(guān)字元,并根據(jù)該相關(guān)音節(jié)或相關(guān)字元自該詞匯資料庫中取得相應(yīng)的至少一音節(jié)或字元;一暫存單元,暫存該預(yù)測字匯做為該新詞的其中一部份;一音節(jié)/字元確認(rèn)單元,耦接至該語音辨識模組,判斷與該新詞相關(guān)的資料是否完全輸入完畢;以及一組合單元,在與該新詞相關(guān)的資料輸入完畢后,組合該暫存單元中所儲存的內(nèi)容并輸出組合結(jié)果為該新詞。
7.根據(jù)權(quán)利要求6所述的利用語音輸入以建構(gòu)中文新詞的裝置,其特征在于其中該音節(jié)/字元確認(rèn)單元更包括提供一使用者界面以確認(rèn)該音節(jié)或字元是否正確,并在確認(rèn)該音節(jié)或字元正確時(shí)才儲存至該暫存單元中。
全文摘要
本發(fā)明是關(guān)于一種利用語音輸入以建構(gòu)中文新詞的方法及裝置,其目的是要解決語音辨識系統(tǒng),特別是非特定語者中文語音辨識系統(tǒng),面臨詞匯不足時(shí),一個(gè)方便的增加新詞匯的方式。中文的詞是由一個(gè)個(gè)中文字所組成,因此,把構(gòu)成詞的字描述完成,就是描述詞了。此方法是利用麥克風(fēng)逐一輸入描述中文字或其讀音的語音訊號,從語音訊號中取得特征參數(shù),利用聲學(xué)模型、詞匯資料庫、語言模型與特征參數(shù)作比對以判斷相應(yīng)的字匯或音節(jié),儲存至?xí)捍鎲卧J褂谜呖纱_認(rèn)完成與否,若完成,則將暫存單元內(nèi)儲存的字元組與音節(jié)組交由組合單元組合為一新詞匯。
文檔編號G06F17/28GK1815557SQ20051000734
公開日2006年8月9日 申請日期2005年2月4日 優(yōu)先權(quán)日2005年2月4日
發(fā)明者黃良聲, 蔡錦和, 王瑞璋, 沈家麟 申請人:臺達(dá)電子工業(yè)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1