語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置的制作方法

文檔序號(hào)：2821280閱讀：209來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與系統(tǒng)，且特別是涉及一種使用自然語(yǔ)言對(duì)話的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置。
背景技術(shù)：
利用語(yǔ)音輸入的對(duì)話系統(tǒng)已經(jīng)日漸普及。使用者只要對(duì)如電話語(yǔ)音系統(tǒng)之類(lèi)的系統(tǒng)講出某項(xiàng)要求，例如想要查車(chē)次、航班、表演節(jié)目與其他各種問(wèn)答等，系統(tǒng)便會(huì)依據(jù)使用者的語(yǔ)音輸入，去找出問(wèn)題的答案。之后，再將答案以語(yǔ)音方式告知使用者。
例如，當(dāng)使用者使用語(yǔ)音對(duì)話系統(tǒng)時(shí)，以口語(yǔ)方式輸入「某年某月某日某時(shí)段，從甲地到乙地的航班資料」時(shí)，對(duì)話系統(tǒng)便可以從該輸入語(yǔ)句去整合出使用者所要的資訊。例如，對(duì)話系統(tǒng)會(huì)輸出「從甲地到乙地，在某年某月某日某時(shí)段，有…的航班」的訊息給使用者知道。隨著需求漸大，使用者所輸入的語(yǔ)句也變相對(duì)的復(fù)雜，而系統(tǒng)也需要更精確地從使用者所輸入的語(yǔ)音語(yǔ)句來(lái)整合輸出使用者所需要的語(yǔ)音輸出資訊。因此，如何辨識(shí)使用者的語(yǔ)音輸入并將便是相當(dāng)重要的課題。
請(qǐng)參閱圖1所示，一般自然語(yǔ)言對(duì)話系統(tǒng)的概念圖。此系統(tǒng)包括語(yǔ)音識(shí)別引擎(speech recognition)12與語(yǔ)言理解分析器(languageunderstanding)14，分別置放于對(duì)話管理系統(tǒng)16的前端。語(yǔ)音識(shí)別引擎12的輸出是提供給語(yǔ)言理解分析器14做為輸入，并于該處做語(yǔ)言分析。分析完畢后，語(yǔ)言理解分析器14的辨識(shí)結(jié)果便做為最后的對(duì)話管理的參考依據(jù)。
目前語(yǔ)音識(shí)別引擎是采取模型比對(duì)技術(shù)(pattern recognition)，一般有隱藏式馬可夫模型、分段機(jī)率式模型與類(lèi)神經(jīng)網(wǎng)路技術(shù)等等。輸入語(yǔ)音訊號(hào)的短時(shí)特征擷取參數(shù)串，輸出一個(gè)或多個(gè)可能的詞串，也有的輸出一個(gè)詞網(wǎng)(word graph或word lattice)。一般，輸出的詞串或詞網(wǎng)都只標(biāo)明詞，未有其他的標(biāo)注。
一般的「語(yǔ)言理解分析器」采用向下(Top-down)，向上(Bottom-up)，或混合式文法分析器(Parser)。將「語(yǔ)音識(shí)別引擎」輸出的詞串或詞網(wǎng)，根據(jù)預(yù)先寫(xiě)定的文法規(guī)則，解譯成具有文法架構(gòu)，或語(yǔ)義知識(shí)的語(yǔ)句。解譯的正確性與成功率，端視分析器的好壞與文法規(guī)則的良囿而定。通常，窄域(NarrowDomain)的語(yǔ)言理解容易寫(xiě)成可用的文法規(guī)則。然而，寬域(Wide Domain)的文法規(guī)則多半有所疏漏，容易掛一漏萬(wàn)。限于專(zhuān)家不易取得，專(zhuān)門(mén)知識(shí)的培養(yǎng)耗時(shí)，發(fā)展此類(lèi)自然語(yǔ)言對(duì)話系統(tǒng)很少，且費(fèi)錢(qián)費(fèi)時(shí)。
由此可見(jiàn)，上述現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)在方法、產(chǎn)品及使用上，顯然仍存在有不便與缺陷，而亟待加以進(jìn)一步改進(jìn)。為了解決語(yǔ)音輸入的對(duì)話系統(tǒng)存在的問(wèn)題，相關(guān)廠商莫不費(fèi)盡心思來(lái)謀求解決之道，但長(zhǎng)久以來(lái)一直未見(jiàn)適用的設(shè)計(jì)被發(fā)展完成，而一般的語(yǔ)音輸入的對(duì)話系統(tǒng)及其裝置又沒(méi)有適切的制造方法及結(jié)構(gòu)能夠解決上述問(wèn)題，此顯然是相關(guān)業(yè)者急欲解決的問(wèn)題。因此如何能創(chuàng)設(shè)一種新型結(jié)構(gòu)的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，便成了當(dāng)前業(yè)界極需改進(jìn)的目標(biāo)。
有鑒于上述現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)存在的缺陷，本發(fā)明人基于從事此類(lèi)產(chǎn)品設(shè)計(jì)制造多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專(zhuān)業(yè)知識(shí)，并配合學(xué)理的運(yùn)用，積極加以研究創(chuàng)新，以期創(chuàng)設(shè)一種新的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，能夠改進(jìn)一般現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)，使其更具有實(shí)用性。經(jīng)過(guò)不斷的研究、設(shè)計(jì)，并經(jīng)反復(fù)試作及改進(jìn)后，終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。

發(fā)明內(nèi)容
本發(fā)明的目的在于，克服現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)存在的缺陷，提出一種自然對(duì)話系統(tǒng)，其利用前述語(yǔ)音辨識(shí)與語(yǔ)言理解分析之方法與裝置，以分段語(yǔ)義概念來(lái)有效地增加語(yǔ)音辨識(shí)效率與正確性，并且使系統(tǒng)能以更接近自然對(duì)話方式來(lái)與使用者進(jìn)行對(duì)話。
本發(fā)明的目的及解決其技術(shù)問(wèn)題是采用以下技術(shù)方案來(lái)實(shí)現(xiàn)的。為了達(dá)到上述發(fā)明目的，依據(jù)本發(fā)明的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，本發(fā)明提出一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，包括接收語(yǔ)音輸入；依據(jù)分段語(yǔ)義概念多聯(lián)詞模型，將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；以及依據(jù)分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析。
在分析該些分段語(yǔ)義之前，更可以將各分段語(yǔ)義區(qū)分為有意義分段語(yǔ)義或無(wú)意義分段語(yǔ)義，并且剔除分段語(yǔ)義中的無(wú)意義分段語(yǔ)義。此外，有意義分段語(yǔ)義與無(wú)意義分段語(yǔ)義是以附加一標(biāo)示(tag)的方式來(lái)進(jìn)行。
本發(fā)明的目的及解決其技術(shù)問(wèn)題還采用以下技術(shù)方案來(lái)實(shí)現(xiàn)。又，為了達(dá)到上述發(fā)明目的，依據(jù)本發(fā)明的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，本發(fā)明更提供一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置，包括語(yǔ)音辨識(shí)模組，用以接收語(yǔ)音輸入，并依據(jù)分段語(yǔ)義概念多聯(lián)詞模型，將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；以及語(yǔ)音理解分析模組，依據(jù)分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析。
在上述裝置中，語(yǔ)音辨識(shí)模組更將各分段語(yǔ)義區(qū)分為有意義分段語(yǔ)義與無(wú)意義分段語(yǔ)義，并且語(yǔ)音理解分析模組剔除分段語(yǔ)義中的無(wú)意義分段語(yǔ)義。此外，語(yǔ)音辨識(shí)模組是以附加一標(biāo)示的方式來(lái)區(qū)分該有意義分段語(yǔ)義或該無(wú)意義分段語(yǔ)義。
本發(fā)明的目的及解決其技術(shù)問(wèn)題還采用以下技術(shù)方案來(lái)實(shí)現(xiàn)。又，為了達(dá)到上述發(fā)明目的，依據(jù)本發(fā)明的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，本發(fā)明更提出一種自然對(duì)話系統(tǒng)，其包括語(yǔ)音辨識(shí)模組，用以接收語(yǔ)音輸入，并依據(jù)分段語(yǔ)義概念多聯(lián)詞模型，將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；語(yǔ)音理解分析模組，其依據(jù)分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析；對(duì)話管理模組，依據(jù)語(yǔ)音理解分析模組的輸出，從數(shù)據(jù)庫(kù)中選出對(duì)應(yīng)的對(duì)話輸出；以及語(yǔ)音合成模組，依據(jù)該話管理模組的對(duì)話輸出，合成語(yǔ)音輸出訊號(hào)。
本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。借由上述技術(shù)方案，本發(fā)明語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置至少具有下列優(yōu)點(diǎn)分段處理的語(yǔ)言理解，不需要整句的文法規(guī)則，故簡(jiǎn)化了對(duì)話系統(tǒng)的設(shè)計(jì)復(fù)雜度，也降低了記憶體使用量的需求與加快了處理的速度。語(yǔ)音辨識(shí)輸出的語(yǔ)義相關(guān)標(biāo)示，則增加了語(yǔ)句分析時(shí)的便利。
「語(yǔ)音識(shí)別引擎」使用的分段語(yǔ)義概念多聯(lián)詞模型中，每個(gè)分段模型分別附有以其語(yǔ)義概念物件的次語(yǔ)句單位所收集的詞庫(kù)。因?yàn)椴灰哉錇閱挝?，與應(yīng)用范圍相關(guān)性較弱。所以可從不同的應(yīng)用范圍中收集累積，也可以應(yīng)用于不同的應(yīng)用范圍中。經(jīng)過(guò)長(zhǎng)時(shí)間的收集累積之后，將可以增廣其詞數(shù)與相連詞頻的覆蓋范圍(coverage)，進(jìn)而提高其辨識(shí)準(zhǔn)確性，不僅處理時(shí)的速度增快了，發(fā)展自然語(yǔ)言對(duì)話系統(tǒng)的整體效能更因而提升了。
綜上所述，本發(fā)明特殊的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，其利用分段語(yǔ)義概念，來(lái)有效地增加語(yǔ)音辨識(shí)效率與正確性。一自然對(duì)話系統(tǒng)，其利用前述語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置，以分段語(yǔ)義概念來(lái)有效地增加語(yǔ)音辨識(shí)效率與正確性，并且使系統(tǒng)能以更接近自然對(duì)話方式來(lái)與使用者進(jìn)行對(duì)話。
其具有上述諸多的優(yōu)點(diǎn)及實(shí)用價(jià)值，并在同類(lèi)方法及產(chǎn)品中未見(jiàn)有類(lèi)似的方法及結(jié)構(gòu)設(shè)計(jì)公開(kāi)發(fā)表或使用而確屬創(chuàng)新，其不論在方法、產(chǎn)品結(jié)構(gòu)或功能上皆有較大的改進(jìn)，在技術(shù)上有較大的進(jìn)步，并產(chǎn)生了好用及實(shí)用的效果，且較現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)具有增進(jìn)的多項(xiàng)功效，從而更加適于實(shí)用，而具有產(chǎn)業(yè)的廣泛利用價(jià)值，誠(chéng)為一新穎、進(jìn)步、實(shí)用的新設(shè)計(jì)。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述，為了能夠更清楚了解本發(fā)明的技術(shù)手段，而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施，并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂，以下特舉較佳實(shí)施例，并配合附圖，詳細(xì)說(shuō)明如下。

圖1是已知的自然語(yǔ)言對(duì)話系統(tǒng)的示意圖。
圖2是本發(fā)明的自然語(yǔ)言對(duì)話系統(tǒng)的示意圖。
圖3是分段語(yǔ)義概念多聯(lián)詞模型的概念示意圖。
圖4是分段次文法的語(yǔ)言理解分析的概念示意圖。
12、12’語(yǔ)音辨識(shí)模組14、14’語(yǔ)言理解分析模組16對(duì)話管理模組18語(yǔ)音合成20數(shù)據(jù)庫(kù)30多聯(lián)詞模型50全句文法分析器60分段語(yǔ)義概念多聯(lián)詞模型70分段次文法模組具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效，以下結(jié)合附圖及較佳實(shí)施例，對(duì)依據(jù)本發(fā)明提出的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置其具體實(shí)施方式
、方法、步驟、結(jié)構(gòu)、特征及其功效，詳細(xì)說(shuō)明如后。
首先，「語(yǔ)音辨識(shí)」與「語(yǔ)言理解」長(zhǎng)久以來(lái)被視為兩個(gè)獨(dú)立運(yùn)作的機(jī)制，分別由擅長(zhǎng)數(shù)位訊號(hào)處理及計(jì)算語(yǔ)言處理的專(zhuān)家各自鉆研。壁壘分明的結(jié)果，使得語(yǔ)義概念只存在于語(yǔ)言模型中，而與語(yǔ)音辨識(shí)機(jī)制無(wú)緣。然而，人類(lèi)是很自然的運(yùn)用這兩種技術(shù)無(wú)間。此一分段語(yǔ)義概念模型中介演算法則，乃針對(duì)此一問(wèn)題研發(fā)，改進(jìn)自然語(yǔ)言對(duì)話系統(tǒng)的辨識(shí)理解的效能，以及系統(tǒng)發(fā)展的效率。此概念即為本發(fā)明的要點(diǎn)。
請(qǐng)參閱圖2所示，為本發(fā)明的系統(tǒng)架構(gòu)示意圖，其中與圖1具有相同或類(lèi)似功能的構(gòu)件系標(biāo)上相同的標(biāo)號(hào)。此外，本發(fā)明的重點(diǎn)是在于如何使用分段語(yǔ)義來(lái)做語(yǔ)音的分析與辨識(shí)，亦即在語(yǔ)音辨識(shí)12’與語(yǔ)言理解分析14’兩個(gè)階段。
請(qǐng)參閱圖2所示，自然對(duì)話系統(tǒng)100包括語(yǔ)音辨識(shí)模組12’、語(yǔ)音理解分析模組14’、對(duì)話管理16、語(yǔ)音合成模組18與數(shù)據(jù)庫(kù)20。當(dāng)語(yǔ)音輸入至語(yǔ)音辨識(shí)模組12’時(shí)，語(yǔ)音辨識(shí)模組12’時(shí)會(huì)利用分段語(yǔ)義概念多聯(lián)詞模型(segmental word-concept-tag compound N-gram)來(lái)對(duì)輸入的語(yǔ)音進(jìn)行辨識(shí)，再將最佳語(yǔ)義概念標(biāo)示順序(N-best word-concept-tag compoundsequence)的結(jié)果傳送至語(yǔ)言理解分析模組14’。語(yǔ)言理解分析模組14’便依據(jù)分段次文法模組(segmental sub-grammars)70來(lái)進(jìn)行語(yǔ)言理解分析的處理，以輸出語(yǔ)義框架(semantic frame)給對(duì)話管理模組16。
對(duì)話管理模組16便依據(jù)輸入的語(yǔ)義框架去搜尋數(shù)據(jù)庫(kù)20中的資料，便將搜尋結(jié)果傳送到語(yǔ)音合成模組18，以進(jìn)行語(yǔ)音合成，之后再將合成的語(yǔ)音輸出。藉此，便可以依據(jù)使用者語(yǔ)音輸入的問(wèn)題，找出合適的應(yīng)答，在用語(yǔ)音的方式輸出給使用者知道。于是便達(dá)到自然語(yǔ)言對(duì)話的目的。后段包括對(duì)話管理16、語(yǔ)音合成模組18與數(shù)據(jù)庫(kù)20的模組可以采用已知的技術(shù)去處理，在此便不多做說(shuō)明與解釋。接下來(lái)將重點(diǎn)集中于前段的語(yǔ)音辨識(shí)模組12’與語(yǔ)音理解分析模組14’。
本發(fā)明是利用「分段語(yǔ)義概念多聯(lián)詞模型」60作為語(yǔ)音辨識(shí)及語(yǔ)言理解分析的中介樞紐。分段語(yǔ)義概念多聯(lián)詞模型60是采用大詞匯連續(xù)語(yǔ)音辨識(shí)(LVCSR)中普遍使用的多聯(lián)詞模型(N-gram)統(tǒng)計(jì)法則。根據(jù)以次語(yǔ)句為單位，在各種可能的應(yīng)用系統(tǒng)中收集累積的詞庫(kù)訓(xùn)練，嵌入語(yǔ)音辨識(shí)階段的語(yǔ)言模型中。這樣的分段語(yǔ)義概念多聯(lián)詞模型，取代了傳統(tǒng)自然語(yǔ)言對(duì)話系統(tǒng)的不分段多聯(lián)詞模型，輸出分段的語(yǔ)句轉(zhuǎn)譯。
接著詳細(xì)說(shuō)明「分段語(yǔ)義概念多聯(lián)詞模型」60，請(qǐng)參考圖3，其繪示「分段語(yǔ)義概念多聯(lián)詞模型」60架構(gòu)的示意圖。如圖3所示，「分段語(yǔ)義概念多聯(lián)詞模型」60還細(xì)分為「一般語(yǔ)言模型語(yǔ)料庫(kù)」、「語(yǔ)料庫(kù)分段解析」、「句型及分段語(yǔ)料庫(kù)組」與「根據(jù)句型及分段語(yǔ)料庫(kù)組進(jìn)行語(yǔ)言模型訓(xùn)練，最后合并成為單一語(yǔ)言模型」。
一般語(yǔ)言模型語(yǔ)料庫(kù)中的句子例句如下我想在十月三十日搭飛機(jī)，從臺(tái)北到莫斯科。進(jìn)行人工句子解析后，亦即進(jìn)行「分段解析」后的結(jié)果如下句型我想<時(shí)間>搭飛機(jī)，<行程>。
上述句子中包含所謂的<時(shí)間>詞組與<行程>詞組兩者。其中<時(shí)間>詞組為「在十月三十日」，<行程>詞組為「從臺(tái)北到莫斯科」。
在圖3中的「語(yǔ)料庫(kù)分段解析」與「句型及分段語(yǔ)料庫(kù)組」中，建立許多「句型語(yǔ)料庫(kù)」、「詞組語(yǔ)料庫(kù)」等等以供選擇，例如下面的例子。
「句型語(yǔ)料庫(kù)」的例子如下我想<時(shí)間>搭飛機(jī)，<行程>。
我要<時(shí)間><行程>的飛機(jī)票。
請(qǐng)給我<時(shí)間><行程>的飛機(jī)票。
幫我找<行程>的飛機(jī)。
<時(shí)間><行程>。
<行程>。
「<時(shí)間>詞組語(yǔ)料庫(kù)」的例子如下在十月三十日九月三日下個(gè)星期一五月的第二個(gè)禮拜天明天下午三點(diǎn)鐘「<行程>詞組語(yǔ)料庫(kù)」的例子如下從臺(tái)北到莫斯科去紐約從臺(tái)北經(jīng)曼谷到倫敦由香港轉(zhuǎn)機(jī)上海從高雄出發(fā)接著，據(jù)句型及分段語(yǔ)料庫(kù)組進(jìn)行語(yǔ)言模型訓(xùn)練，最后合并成為單一語(yǔ)言模型。其中一種做法如下句型語(yǔ)料庫(kù)→進(jìn)行一般語(yǔ)言模型訓(xùn)練→句型的語(yǔ)言模型；分段語(yǔ)料庫(kù)→進(jìn)行一般語(yǔ)言模型訓(xùn)練→分段語(yǔ)料庫(kù)的語(yǔ)言模型之后，合并上述語(yǔ)言模型成為單一語(yǔ)言模型，即為分段語(yǔ)義概念多聯(lián)詞模型。
請(qǐng)接著參閱圖4說(shuō)明圖2中的分段次文法的語(yǔ)言理解分析。分段次文法包含「辨識(shí)的結(jié)果分段化」、「各段落用相對(duì)的分段次文法進(jìn)行文法解析」以及「文法解析結(jié)果的合并」。
首先，關(guān)于辨識(shí)的結(jié)果分段化，再以上述的例句為例子，辨識(shí)的結(jié)果標(biāo)示著<時(shí)間>與<行程>的兩個(gè)詞組。
例句我想在<時(shí)間>十月三十日</時(shí)間>搭飛機(jī)，<行程>從臺(tái)北到莫斯科</行程>。
此句子便被自動(dòng)分成下面的句型句型我想<時(shí)間>搭飛機(jī)，<行程>。
其中的詞組如下<時(shí)間>詞組在十月三十日<行程>詞組從臺(tái)北到莫斯科接著，各段落用相對(duì)的分段次文法進(jìn)行文法解析。以上述例句為例，針對(duì)句型、<時(shí)間>詞組以及<行程>詞組三者各自進(jìn)行語(yǔ)言理解解析。
上述的句型為“我想<時(shí)間>搭飛機(jī)，<行程>”，用句型文法解析得到概念為<查詢(xún)某時(shí)間某行程的飛機(jī)>。
上述<時(shí)間>詞組為“在十月三十日”，用<時(shí)間>詞組文法解析后得到概念<月份＝十月>，以及概念<日期＝三十日>。
上述的<行程>詞組為“從臺(tái)北到莫斯科”，用<行程>詞組文法解析后得到概念<出發(fā)地＝臺(tái)北>，以及概念<到達(dá)地＝莫斯科>。
最后，將文法解析結(jié)果進(jìn)行合并。仍以上述分段次文法解析結(jié)果為例。在上述文法解析后所得到的概念如下概念<查詢(xún)某時(shí)間某行程的飛機(jī)>；概念<月份＝十月>與<日期＝三十日>；以及概念<出發(fā)地＝臺(tái)北>與<到達(dá)地＝莫斯科>。
另外，當(dāng)某分段無(wú)解析結(jié)果時(shí)，進(jìn)行合并的其他分段解析結(jié)果并不受影響。例如，在上述例句中不對(duì)<時(shí)間>詞組進(jìn)行<時(shí)間>詞組文法解析。解析后的結(jié)果如下句型“我想<時(shí)間>搭飛機(jī)，<行程>”用句型文法解析后得到概念<查詢(xún)某時(shí)間某行程的飛機(jī)>。<行程>詞組“從臺(tái)北到莫斯科”用<行程>詞組文法解析后，得到概念<出發(fā)地＝臺(tái)北>與概念<到達(dá)地＝莫斯科>。
將上述解析結(jié)果合并，得到以下結(jié)果概念<查詢(xún)某時(shí)間某行程的飛機(jī)>
概念<出發(fā)地＝臺(tái)北>與概念<到達(dá)地＝莫斯科>
綜上所述，在分段語(yǔ)義概念多聯(lián)詞模型60中，是把輸入的語(yǔ)音做有意義的分段，在從各分段中去辨識(shí)出它的語(yǔ)義。例如，當(dāng)使用者輸入語(yǔ)音「請(qǐng)問(wèn)在11月30日那天從臺(tái)北到洛杉磯的航班時(shí)刻表為何」時(shí)，里面就可以拆解出例如「在11月30日」「從臺(tái)北到洛杉磯」「航班時(shí)刻表」等之類(lèi)的有語(yǔ)義分段。換句話說(shuō)，在某年某月某日可以是一個(gè)分段語(yǔ)義、從某地到某地、從幾點(diǎn)到幾點(diǎn)、某某時(shí)刻表等。經(jīng)由此種方式，語(yǔ)音辨識(shí)可以把輸入到自然對(duì)話系統(tǒng)100中的語(yǔ)音資訊加以分析，擷取出具有意義的分段語(yǔ)義來(lái)，而揚(yáng)棄不需要的語(yǔ)詞。
從對(duì)話習(xí)慣可以知道當(dāng)一個(gè)起始字出現(xiàn)時(shí)，后面接著出現(xiàn)的其他字匯有多大的機(jī)率。藉由此概念，便可以達(dá)到擷取出分段語(yǔ)義的目的。如上例中，當(dāng)出現(xiàn)「從」時(shí)，便可以知道常出現(xiàn)的語(yǔ)義可能會(huì)有「從幾點(diǎn)到幾點(diǎn)」、「從某地到某地」等等之類(lèi)。語(yǔ)音辨識(shí)模組12’于是便可以據(jù)此來(lái)簡(jiǎn)化辨識(shí)的程序。亦即，只要從一句輸入的語(yǔ)音訊息中，擷取出各個(gè)分段語(yǔ)義便可以辨識(shí)的目的。而且以分段語(yǔ)義的方式來(lái)進(jìn)行時(shí)，并不需要對(duì)整句進(jìn)行文法分析，所以錯(cuò)誤率可以降低，亦即辨識(shí)正確率可以達(dá)為提升。例如「從」之后有地名時(shí)，便可以辨識(shí)出是「從某地到某地」的語(yǔ)義等。
此外，由于人在說(shuō)話時(shí)會(huì)有很多不需要且無(wú)意義的虛詞或語(yǔ)詞。若使用全句文法分析，便有可能造成無(wú)法分析或分析錯(cuò)誤的情形出現(xiàn)。因此，根據(jù)本發(fā)明的教示，語(yǔ)音辨識(shí)模組12’的輸出更可以包含詞標(biāo)示(tag)，分段語(yǔ)義概念標(biāo)示，以及其他語(yǔ)義相關(guān)標(biāo)示。藉由語(yǔ)義概念分段，加強(qiáng)了語(yǔ)音辨識(shí)處理的語(yǔ)義處理能力，簡(jiǎn)化了語(yǔ)言理解處理的復(fù)雜度。降低了文法寫(xiě)作的完整性要求，因而提升了發(fā)展自然語(yǔ)言對(duì)話系統(tǒng)的效率以及效果。
以中文語(yǔ)法為例，一般而言，語(yǔ)法的嚴(yán)謹(jǐn)度較為松散(例如相較于英文而言)，加字或漏字經(jīng)常發(fā)生，使得窮舉式的文法寫(xiě)作極為困難，對(duì)話系統(tǒng)的成功率也因此低落。換句話說(shuō)，我們無(wú)法針對(duì)每一種特例來(lái)做出對(duì)應(yīng)的詞庫(kù)以增加成功率。即使我們把每一種情況都考慮，但是最后也會(huì)造成數(shù)據(jù)庫(kù)或整個(gè)對(duì)話系統(tǒng)的過(guò)度膨脹與負(fù)擔(dān)。
本發(fā)明設(shè)計(jì)的語(yǔ)音辨識(shí)的輸出詞串，包含具有語(yǔ)義重要性的詞(標(biāo)示1)以及不具有語(yǔ)義重要性的詞(標(biāo)示0)。前者例如從、到、臺(tái)北、…等等。后者例如嗯、我是說(shuō)、…等等。語(yǔ)言理解的語(yǔ)句分析器只理會(huì)具有語(yǔ)義重要性的詞，而忽略不具有語(yǔ)義重要性的詞。因?yàn)槲姆ㄒ?guī)則不需理會(huì)那些不具有語(yǔ)義重要性的詞，因而大量降低文法寫(xiě)作的工作，并減少辨識(shí)時(shí)處理的可能句型總組合數(shù)量。
換句話說(shuō)，當(dāng)語(yǔ)音輸入到語(yǔ)音辨識(shí)模組12’后，語(yǔ)音辨識(shí)模組12’除了依據(jù)分段語(yǔ)義概念多聯(lián)詞模型60來(lái)對(duì)輸入的語(yǔ)音訊號(hào)找出各分段語(yǔ)義外，同時(shí)也對(duì)各個(gè)分段詞加上標(biāo)示，以標(biāo)示出該分段詞是有意義或沒(méi)有意義的。因此，當(dāng)語(yǔ)言理解分析模組14’接收到語(yǔ)音辨識(shí)模組12’所傳來(lái)的輸出結(jié)果，邊會(huì)依據(jù)標(biāo)示將一些沒(méi)有意義的語(yǔ)詞剔除，只留下有意義的分段語(yǔ)義。同時(shí)，語(yǔ)言理解分析模組14’僅會(huì)針對(duì)有意義的分段語(yǔ)義去做語(yǔ)言的理解與分析。此時(shí)，語(yǔ)言理解分析模組14’會(huì)依循所謂的分段次文法70來(lái)進(jìn)行語(yǔ)言的理解與分析，而不使用傳統(tǒng)的全句文法分析器來(lái)分析。很明顯地，語(yǔ)言理解分析模組14’所要處理的理解分析工作被大為簡(jiǎn)化。因?yàn)樵谡Z(yǔ)音辨識(shí)模組12’時(shí)已經(jīng)依據(jù)分段語(yǔ)義概念多聯(lián)詞模型60來(lái)挑出有意義的分段語(yǔ)義，因此語(yǔ)言理解分析模組14’所要處理的部分也就僅僅針對(duì)各分段來(lái)處理，因而正確率便大為提升。
如上所述，語(yǔ)音辨識(shí)輸出的分段語(yǔ)義概念標(biāo)示，自然地提供語(yǔ)言理解處理的分段處理能力。分段處理的語(yǔ)言理解，不需要整句的文法規(guī)則，故簡(jiǎn)化了對(duì)話系統(tǒng)的設(shè)計(jì)復(fù)雜度，也降低了記憶體使用量的需求與加快了處理的速度。語(yǔ)音辨識(shí)輸出的語(yǔ)義相關(guān)標(biāo)示，則增加了語(yǔ)句分析時(shí)的便利。
「語(yǔ)音識(shí)別引擎」使用的分段語(yǔ)義概念多聯(lián)詞模型中，每個(gè)分段模型分別附有以其語(yǔ)義概念物件的次語(yǔ)句單位所收集的詞庫(kù)。因?yàn)椴灰哉錇閱挝?，與應(yīng)用范圍相關(guān)性較弱。所以可從不同的應(yīng)用范圍中收集累積，也可以應(yīng)用于不同的應(yīng)用范圍中。經(jīng)過(guò)長(zhǎng)時(shí)間的收集累積之后，將可以增廣其詞數(shù)與相連詞頻的覆蓋范圍(coverage)，進(jìn)而提高其辨識(shí)準(zhǔn)確性。
總體而言，不僅處理時(shí)的速度增快了，發(fā)展自然語(yǔ)言對(duì)話系統(tǒng)的整體效能更因而提升了。
以上所述，僅是本發(fā)明的較佳實(shí)施例而已，并非對(duì)本發(fā)明作任何形式上的限制，雖然本發(fā)明已以較佳實(shí)施例揭露如上，然而并非用以限定本發(fā)明，任何熟悉本專(zhuān)業(yè)的技術(shù)人員，在不脫離本發(fā)明技術(shù)方案范圍內(nèi)，當(dāng)可利用上述揭示的方法及技術(shù)內(nèi)容作出些許的更動(dòng)或修飾為等同變化的等效實(shí)施例，但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容，依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾，均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，其特征在于其包括以下步驟接收一語(yǔ)音輸入；依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型，將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；以及依據(jù)一分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，其特征在于在分析該些分段語(yǔ)義之前更包括將各該些分段語(yǔ)義區(qū)分為一有意義分段語(yǔ)義或一無(wú)意義分段語(yǔ)義；以及剔除該分段語(yǔ)義中的該些無(wú)意義分段語(yǔ)義。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，其特征在于其中依據(jù)分段語(yǔ)義概念多聯(lián)詞模型的步驟更包括從一般語(yǔ)言模型語(yǔ)料庫(kù)，分析該語(yǔ)音輸入的句型；對(duì)該該語(yǔ)音輸入的句型進(jìn)行一語(yǔ)料庫(kù)分段解析，以得到該些分段語(yǔ)義；以及利用一句型語(yǔ)分段語(yǔ)料庫(kù)，對(duì)各該些分段語(yǔ)義進(jìn)行一語(yǔ)言模型訓(xùn)練，再合并成單一語(yǔ)言模型。
4.根據(jù)權(quán)利要求2所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，其特征在于其中所述的有意義分段語(yǔ)義或無(wú)意義分段語(yǔ)義是以附加一標(biāo)示(tag)的方式來(lái)進(jìn)行。
5.一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，其特征在于將接收到的一語(yǔ)音輸入；依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型，將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義。
6.根據(jù)權(quán)利要求5所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法，其特征在于其中依據(jù)分段語(yǔ)義概念多聯(lián)詞模型的步驟更包括從一般語(yǔ)言模型語(yǔ)料庫(kù)；分析該語(yǔ)音輸入的句型；對(duì)該該語(yǔ)音輸入的句型進(jìn)行一語(yǔ)料庫(kù)分段解析，以得到該些分段語(yǔ)義；以及利用一句型語(yǔ)分段語(yǔ)料庫(kù)，對(duì)各該些分段語(yǔ)義進(jìn)行一語(yǔ)言模型訓(xùn)練，再合并成單一語(yǔ)言模型。
7.一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置，其特征在于其包括以下步驟一語(yǔ)音辨識(shí)模組，用以接收一語(yǔ)音輸入，并依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型，將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；以及一語(yǔ)音理解分析模組，依據(jù)一分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析。
8.根據(jù)權(quán)利要求7所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置，其特征在于其中所述的語(yǔ)音辨識(shí)模組更將各該些分段語(yǔ)義區(qū)分為一有意義分段語(yǔ)義或一無(wú)意義分段語(yǔ)義，并且該語(yǔ)音理解分析模組剔除該分段語(yǔ)義中的該些無(wú)意義分段語(yǔ)義。
9.根據(jù)權(quán)利要求8所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置，其特征在于其中所述的語(yǔ)音辨識(shí)模組是以附加一標(biāo)示(tag)的方式來(lái)區(qū)分該有意義分段語(yǔ)義或該無(wú)意義分段語(yǔ)義。
10.一種自然對(duì)話系統(tǒng)，其特征在于其包括一語(yǔ)音辨識(shí)模組，用以接收一語(yǔ)音輸入，并依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型，將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；一語(yǔ)音理解分析模組，依據(jù)一分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析；一對(duì)話管理模組，依據(jù)該語(yǔ)音理解分析模組的輸出，從一數(shù)據(jù)庫(kù)中選出對(duì)應(yīng)的對(duì)話輸出；以及一語(yǔ)音合成模組，依據(jù)該對(duì)話管理模組的對(duì)話輸出，合成一語(yǔ)音輸出訊號(hào)。
11.根據(jù)權(quán)利要求10所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置，其特征在于其中所述的語(yǔ)音辨識(shí)模組更將各該些分段語(yǔ)義區(qū)分為一有意義分段語(yǔ)義或一無(wú)意義分段語(yǔ)義，并且該語(yǔ)音理解分析模組剔除該分段語(yǔ)義中的該些無(wú)意義分段語(yǔ)義。
12.根據(jù)權(quán)利要求10所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置，其特征在于其中所述的語(yǔ)音辨識(shí)模組是以附加一標(biāo)示(tag)的方式來(lái)區(qū)分該有意義分段語(yǔ)義或該無(wú)意義分段語(yǔ)義。
全文摘要
本發(fā)明是有關(guān)于一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置。該語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法依據(jù)分段語(yǔ)義概念多聯(lián)詞模型，將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義。將各該些分段語(yǔ)義附上標(biāo)示，以顯示各該些分段語(yǔ)義為有意義分段語(yǔ)義或無(wú)意義分段語(yǔ)義。剔除不具意義的分段語(yǔ)義，僅保留有意義的分段語(yǔ)詞。依據(jù)分段次文法，對(duì)有意義分段語(yǔ)詞進(jìn)行語(yǔ)言的理解分析，及其裝置有一語(yǔ)音辨識(shí)模組，用以接收一語(yǔ)音輸入，并依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型，將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義；以及一語(yǔ)音理解分析模組，依據(jù)一分段次文法，對(duì)該些分段語(yǔ)義進(jìn)行分析。
文檔編號(hào)G10L17/00GK1831937SQ20051005355
公開(kāi)日2006年9月13日申請(qǐng)日期2005年3月8日優(yōu)先權(quán)日2005年3月8日
發(fā)明者王瑞璋申請(qǐng)人:臺(tái)達(dá)電子工業(yè)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王瑞璋
技術(shù)所有人：臺(tái)達(dá)電子工業(yè)股份有限公司
我是此專(zhuān)利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

usb裝置無(wú)法辨識(shí)相關(guān)技術(shù)

語(yǔ)音辨識(shí)相關(guān)技術(shù)

電梯語(yǔ)音報(bào)站裝置相關(guān)技術(shù)

語(yǔ)音報(bào)警裝置相關(guān)技術(shù)

人體感應(yīng)語(yǔ)音裝置相關(guān)技術(shù)

扶梯語(yǔ)音提示裝置相關(guān)技術(shù)

自動(dòng)語(yǔ)音告警裝置相關(guān)技術(shù)

自動(dòng)語(yǔ)音裝置相關(guān)技術(shù)

紅外語(yǔ)音通信裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置的制作方法