專(zhuān)利名稱(chēng):語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與系統(tǒng),且特別是涉及一種使用自然語(yǔ)言對(duì)話的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置。
背景技術(shù):
利用語(yǔ)音輸入的對(duì)話系統(tǒng)已經(jīng)日漸普及。使用者只要對(duì)如電話語(yǔ)音系統(tǒng)之類(lèi)的系統(tǒng)講出某項(xiàng)要求,例如想要查車(chē)次、航班、表演節(jié)目與其他各種問(wèn)答等,系統(tǒng)便會(huì)依據(jù)使用者的語(yǔ)音輸入,去找出問(wèn)題的答案。之后,再將答案以語(yǔ)音方式告知使用者。
例如,當(dāng)使用者使用語(yǔ)音對(duì)話系統(tǒng)時(shí),以口語(yǔ)方式輸入「某年某月某日某時(shí)段,從甲地到乙地的航班資料」時(shí),對(duì)話系統(tǒng)便可以從該輸入語(yǔ)句去整合出使用者所要的資訊。例如,對(duì)話系統(tǒng)會(huì)輸出「從甲地到乙地,在某年某月某日某時(shí)段,有…的航班」的訊息給使用者知道。隨著需求漸大,使用者所輸入的語(yǔ)句也變相對(duì)的復(fù)雜,而系統(tǒng)也需要更精確地從使用者所輸入的語(yǔ)音語(yǔ)句來(lái)整合輸出使用者所需要的語(yǔ)音輸出資訊。因此,如何辨識(shí)使用者的語(yǔ)音輸入并將便是相當(dāng)重要的課題。
請(qǐng)參閱圖1所示,一般自然語(yǔ)言對(duì)話系統(tǒng)的概念圖。此系統(tǒng)包括語(yǔ)音識(shí)別引擎(speech recognition)12與語(yǔ)言理解分析器(languageunderstanding)14,分別置放于對(duì)話管理系統(tǒng)16的前端。語(yǔ)音識(shí)別引擎12的輸出是提供給語(yǔ)言理解分析器14做為輸入,并于該處做語(yǔ)言分析。分析完畢后,語(yǔ)言理解分析器14的辨識(shí)結(jié)果便做為最后的對(duì)話管理的參考依據(jù)。
目前語(yǔ)音識(shí)別引擎是采取模型比對(duì)技術(shù)(pattern recognition),一般有隱藏式馬可夫模型、分段機(jī)率式模型與類(lèi)神經(jīng)網(wǎng)路技術(shù)等等。輸入語(yǔ)音訊號(hào)的短時(shí)特征擷取參數(shù)串,輸出一個(gè)或多個(gè)可能的詞串,也有的輸出一個(gè)詞網(wǎng)(word graph或word lattice)。一般,輸出的詞串或詞網(wǎng)都只標(biāo)明詞,未有其他的標(biāo)注。
一般的「語(yǔ)言理解分析器」采用向下(Top-down),向上(Bottom-up),或混合式文法分析器(Parser)。將「語(yǔ)音識(shí)別引擎」輸出的詞串或詞網(wǎng),根據(jù)預(yù)先寫(xiě)定的文法規(guī)則,解譯成具有文法架構(gòu),或語(yǔ)義知識(shí)的語(yǔ)句。解譯的正確性與成功率,端視分析器的好壞與文法規(guī)則的良囿而定。通常,窄域(NarrowDomain)的語(yǔ)言理解容易寫(xiě)成可用的文法規(guī)則。然而,寬域(Wide Domain)的文法規(guī)則多半有所疏漏,容易掛一漏萬(wàn)。限于專(zhuān)家不易取得,專(zhuān)門(mén)知識(shí)的培養(yǎng)耗時(shí),發(fā)展此類(lèi)自然語(yǔ)言對(duì)話系統(tǒng)很少,且費(fèi)錢(qián)費(fèi)時(shí)。
由此可見(jiàn),上述現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)在方法、產(chǎn)品及使用上,顯然仍存在有不便與缺陷,而亟待加以進(jìn)一步改進(jìn)。為了解決語(yǔ)音輸入的對(duì)話系統(tǒng)存在的問(wèn)題,相關(guān)廠商莫不費(fèi)盡心思來(lái)謀求解決之道,但長(zhǎng)久以來(lái)一直未見(jiàn)適用的設(shè)計(jì)被發(fā)展完成,而一般的語(yǔ)音輸入的對(duì)話系統(tǒng)及其裝置又沒(méi)有適切的制造方法及結(jié)構(gòu)能夠解決上述問(wèn)題,此顯然是相關(guān)業(yè)者急欲解決的問(wèn)題。因此如何能創(chuàng)設(shè)一種新型結(jié)構(gòu)的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,便成了當(dāng)前業(yè)界極需改進(jìn)的目標(biāo)。
有鑒于上述現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)存在的缺陷,本發(fā)明人基于從事此類(lèi)產(chǎn)品設(shè)計(jì)制造多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專(zhuān)業(yè)知識(shí),并配合學(xué)理的運(yùn)用,積極加以研究創(chuàng)新,以期創(chuàng)設(shè)一種新的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,能夠改進(jìn)一般現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng),使其更具有實(shí)用性。經(jīng)過(guò)不斷的研究、設(shè)計(jì),并經(jīng)反復(fù)試作及改進(jìn)后,終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。
發(fā)明內(nèi)容
本發(fā)明的目的在于,克服現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)存在的缺陷,提出一種自然對(duì)話系統(tǒng),其利用前述語(yǔ)音辨識(shí)與語(yǔ)言理解分析之方法與裝置,以分段語(yǔ)義概念來(lái)有效地增加語(yǔ)音辨識(shí)效率與正確性,并且使系統(tǒng)能以更接近自然對(duì)話方式來(lái)與使用者進(jìn)行對(duì)話。
本發(fā)明的目的及解決其技術(shù)問(wèn)題是采用以下技術(shù)方案來(lái)實(shí)現(xiàn)的。為了達(dá)到上述發(fā)明目的,依據(jù)本發(fā)明的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,本發(fā)明提出一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,包括接收語(yǔ)音輸入;依據(jù)分段語(yǔ)義概念多聯(lián)詞模型,將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;以及依據(jù)分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析。
在分析該些分段語(yǔ)義之前,更可以將各分段語(yǔ)義區(qū)分為有意義分段語(yǔ)義或無(wú)意義分段語(yǔ)義,并且剔除分段語(yǔ)義中的無(wú)意義分段語(yǔ)義。此外,有意義分段語(yǔ)義與無(wú)意義分段語(yǔ)義是以附加一標(biāo)示(tag)的方式來(lái)進(jìn)行。
本發(fā)明的目的及解決其技術(shù)問(wèn)題還采用以下技術(shù)方案來(lái)實(shí)現(xiàn)。又,為了達(dá)到上述發(fā)明目的,依據(jù)本發(fā)明的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,本發(fā)明更提供一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置,包括語(yǔ)音辨識(shí)模組,用以接收語(yǔ)音輸入,并依據(jù)分段語(yǔ)義概念多聯(lián)詞模型,將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;以及語(yǔ)音理解分析模組,依據(jù)分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析。
在上述裝置中,語(yǔ)音辨識(shí)模組更將各分段語(yǔ)義區(qū)分為有意義分段語(yǔ)義與無(wú)意義分段語(yǔ)義,并且語(yǔ)音理解分析模組剔除分段語(yǔ)義中的無(wú)意義分段語(yǔ)義。此外,語(yǔ)音辨識(shí)模組是以附加一標(biāo)示的方式來(lái)區(qū)分該有意義分段語(yǔ)義或該無(wú)意義分段語(yǔ)義。
本發(fā)明的目的及解決其技術(shù)問(wèn)題還采用以下技術(shù)方案來(lái)實(shí)現(xiàn)。又,為了達(dá)到上述發(fā)明目的,依據(jù)本發(fā)明的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,本發(fā)明更提出一種自然對(duì)話系統(tǒng),其包括語(yǔ)音辨識(shí)模組,用以接收語(yǔ)音輸入,并依據(jù)分段語(yǔ)義概念多聯(lián)詞模型,將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;語(yǔ)音理解分析模組,其依據(jù)分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析;對(duì)話管理模組,依據(jù)語(yǔ)音理解分析模組的輸出,從數(shù)據(jù)庫(kù)中選出對(duì)應(yīng)的對(duì)話輸出;以及語(yǔ)音合成模組,依據(jù)該話管理模組的對(duì)話輸出,合成語(yǔ)音輸出訊號(hào)。
本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。借由上述技術(shù)方案,本發(fā)明語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置至少具有下列優(yōu)點(diǎn)分段處理的語(yǔ)言理解,不需要整句的文法規(guī)則,故簡(jiǎn)化了對(duì)話系統(tǒng)的設(shè)計(jì)復(fù)雜度,也降低了記憶體使用量的需求與加快了處理的速度。語(yǔ)音辨識(shí)輸出的語(yǔ)義相關(guān)標(biāo)示,則增加了語(yǔ)句分析時(shí)的便利。
「語(yǔ)音識(shí)別引擎」使用的分段語(yǔ)義概念多聯(lián)詞模型中,每個(gè)分段模型分別附有以其語(yǔ)義概念物件的次語(yǔ)句單位所收集的詞庫(kù)。因?yàn)椴灰哉錇閱挝?,與應(yīng)用范圍相關(guān)性較弱。所以可從不同的應(yīng)用范圍中收集累積,也可以應(yīng)用于不同的應(yīng)用范圍中。經(jīng)過(guò)長(zhǎng)時(shí)間的收集累積之后,將可以增廣其詞數(shù)與相連詞頻的覆蓋范圍(coverage),進(jìn)而提高其辨識(shí)準(zhǔn)確性,不僅處理時(shí)的速度增快了,發(fā)展自然語(yǔ)言對(duì)話系統(tǒng)的整體效能更因而提升了。
綜上所述,本發(fā)明特殊的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,其利用分段語(yǔ)義概念,來(lái)有效地增加語(yǔ)音辨識(shí)效率與正確性。一自然對(duì)話系統(tǒng),其利用前述語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置,以分段語(yǔ)義概念來(lái)有效地增加語(yǔ)音辨識(shí)效率與正確性,并且使系統(tǒng)能以更接近自然對(duì)話方式來(lái)與使用者進(jìn)行對(duì)話。
其具有上述諸多的優(yōu)點(diǎn)及實(shí)用價(jià)值,并在同類(lèi)方法及產(chǎn)品中未見(jiàn)有類(lèi)似的方法及結(jié)構(gòu)設(shè)計(jì)公開(kāi)發(fā)表或使用而確屬創(chuàng)新,其不論在方法、產(chǎn)品結(jié)構(gòu)或功能上皆有較大的改進(jìn),在技術(shù)上有較大的進(jìn)步,并產(chǎn)生了好用及實(shí)用的效果,且較現(xiàn)有的語(yǔ)音輸入的對(duì)話系統(tǒng)具有增進(jìn)的多項(xiàng)功效,從而更加適于實(shí)用,而具有產(chǎn)業(yè)的廣泛利用價(jià)值,誠(chéng)為一新穎、進(jìn)步、實(shí)用的新設(shè)計(jì)。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳實(shí)施例,并配合附圖,詳細(xì)說(shuō)明如下。
圖1是已知的自然語(yǔ)言對(duì)話系統(tǒng)的示意圖。
圖2是本發(fā)明的自然語(yǔ)言對(duì)話系統(tǒng)的示意圖。
圖3是分段語(yǔ)義概念多聯(lián)詞模型的概念示意圖。
圖4是分段次文法的語(yǔ)言理解分析的概念示意圖。
12、12’語(yǔ)音辨識(shí)模組14、14’語(yǔ)言理解分析模組16對(duì)話管理模組18語(yǔ)音合成20數(shù)據(jù)庫(kù)30多聯(lián)詞模型50全句文法分析器60分段語(yǔ)義概念多聯(lián)詞模型70分段次文法模組具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明提出的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置其具體實(shí)施方式
、方法、步驟、結(jié)構(gòu)、特征及其功效,詳細(xì)說(shuō)明如后。
首先,「語(yǔ)音辨識(shí)」與「語(yǔ)言理解」長(zhǎng)久以來(lái)被視為兩個(gè)獨(dú)立運(yùn)作的機(jī)制,分別由擅長(zhǎng)數(shù)位訊號(hào)處理及計(jì)算語(yǔ)言處理的專(zhuān)家各自鉆研。壁壘分明的結(jié)果,使得語(yǔ)義概念只存在于語(yǔ)言模型中,而與語(yǔ)音辨識(shí)機(jī)制無(wú)緣。然而,人類(lèi)是很自然的運(yùn)用這兩種技術(shù)無(wú)間。此一分段語(yǔ)義概念模型中介演算法則,乃針對(duì)此一問(wèn)題研發(fā),改進(jìn)自然語(yǔ)言對(duì)話系統(tǒng)的辨識(shí)理解的效能,以及系統(tǒng)發(fā)展的效率。此概念即為本發(fā)明的要點(diǎn)。
請(qǐng)參閱圖2所示,為本發(fā)明的系統(tǒng)架構(gòu)示意圖,其中與圖1具有相同或類(lèi)似功能的構(gòu)件系標(biāo)上相同的標(biāo)號(hào)。此外,本發(fā)明的重點(diǎn)是在于如何使用分段語(yǔ)義來(lái)做語(yǔ)音的分析與辨識(shí),亦即在語(yǔ)音辨識(shí)12’與語(yǔ)言理解分析14’兩個(gè)階段。
請(qǐng)參閱圖2所示,自然對(duì)話系統(tǒng)100包括語(yǔ)音辨識(shí)模組12’、語(yǔ)音理解分析模組14’、對(duì)話管理16、語(yǔ)音合成模組18與數(shù)據(jù)庫(kù)20。當(dāng)語(yǔ)音輸入至語(yǔ)音辨識(shí)模組12’時(shí),語(yǔ)音辨識(shí)模組12’時(shí)會(huì)利用分段語(yǔ)義概念多聯(lián)詞模型(segmental word-concept-tag compound N-gram)來(lái)對(duì)輸入的語(yǔ)音進(jìn)行辨識(shí),再將最佳語(yǔ)義概念標(biāo)示順序(N-best word-concept-tag compoundsequence)的結(jié)果傳送至語(yǔ)言理解分析模組14’。語(yǔ)言理解分析模組14’便依據(jù)分段次文法模組(segmental sub-grammars)70來(lái)進(jìn)行語(yǔ)言理解分析的處理,以輸出語(yǔ)義框架(semantic frame)給對(duì)話管理模組16。
對(duì)話管理模組16便依據(jù)輸入的語(yǔ)義框架去搜尋數(shù)據(jù)庫(kù)20中的資料,便將搜尋結(jié)果傳送到語(yǔ)音合成模組18,以進(jìn)行語(yǔ)音合成,之后再將合成的語(yǔ)音輸出。藉此,便可以依據(jù)使用者語(yǔ)音輸入的問(wèn)題,找出合適的應(yīng)答,在用語(yǔ)音的方式輸出給使用者知道。于是便達(dá)到自然語(yǔ)言對(duì)話的目的。后段包括對(duì)話管理16、語(yǔ)音合成模組18與數(shù)據(jù)庫(kù)20的模組可以采用已知的技術(shù)去處理,在此便不多做說(shuō)明與解釋。接下來(lái)將重點(diǎn)集中于前段的語(yǔ)音辨識(shí)模組12’與語(yǔ)音理解分析模組14’。
本發(fā)明是利用「分段語(yǔ)義概念多聯(lián)詞模型」60作為語(yǔ)音辨識(shí)及語(yǔ)言理解分析的中介樞紐。分段語(yǔ)義概念多聯(lián)詞模型60是采用大詞匯連續(xù)語(yǔ)音辨識(shí)(LVCSR)中普遍使用的多聯(lián)詞模型(N-gram)統(tǒng)計(jì)法則。根據(jù)以次語(yǔ)句為單位,在各種可能的應(yīng)用系統(tǒng)中收集累積的詞庫(kù)訓(xùn)練,嵌入語(yǔ)音辨識(shí)階段的語(yǔ)言模型中。這樣的分段語(yǔ)義概念多聯(lián)詞模型,取代了傳統(tǒng)自然語(yǔ)言對(duì)話系統(tǒng)的不分段多聯(lián)詞模型,輸出分段的語(yǔ)句轉(zhuǎn)譯。
接著詳細(xì)說(shuō)明「分段語(yǔ)義概念多聯(lián)詞模型」60,請(qǐng)參考圖3,其繪示「分段語(yǔ)義概念多聯(lián)詞模型」60架構(gòu)的示意圖。如圖3所示,「分段語(yǔ)義概念多聯(lián)詞模型」60還細(xì)分為「一般語(yǔ)言模型語(yǔ)料庫(kù)」、「語(yǔ)料庫(kù)分段解析」、「句型及分段語(yǔ)料庫(kù)組」與「根據(jù)句型及分段語(yǔ)料庫(kù)組進(jìn)行語(yǔ)言模型訓(xùn)練,最后合并成為單一語(yǔ)言模型」。
一般語(yǔ)言模型語(yǔ)料庫(kù)中的句子例句如下我想在十月三十日搭飛機(jī),從臺(tái)北到莫斯科。進(jìn)行人工句子解析后,亦即進(jìn)行「分段解析」后的結(jié)果如下句型我想<時(shí)間>搭飛機(jī),<行程>。
上述句子中包含所謂的<時(shí)間>詞組與<行程>詞組兩者。其中<時(shí)間>詞組為「在十月三十日」,<行程>詞組為「從臺(tái)北到莫斯科」。
在圖3中的「語(yǔ)料庫(kù)分段解析」與「句型及分段語(yǔ)料庫(kù)組」中,建立許多「句型語(yǔ)料庫(kù)」、「詞組語(yǔ)料庫(kù)」等等以供選擇,例如下面的例子。
「句型語(yǔ)料庫(kù)」的例子如下我想<時(shí)間>搭飛機(jī),<行程>。
我要<時(shí)間><行程>的飛機(jī)票。
請(qǐng)給我<時(shí)間><行程>的飛機(jī)票。
幫我找<行程>的飛機(jī)。
<時(shí)間><行程>。
<行程>。
「<時(shí)間>詞組語(yǔ)料庫(kù)」的例子如下在十月三十日九月三日下個(gè)星期一五月的第二個(gè)禮拜天明天下午三點(diǎn)鐘「<行程>詞組語(yǔ)料庫(kù)」的例子如下從臺(tái)北到莫斯科去紐約從臺(tái)北經(jīng)曼谷到倫敦由香港轉(zhuǎn)機(jī)上海從高雄出發(fā)接著,據(jù)句型及分段語(yǔ)料庫(kù)組進(jìn)行語(yǔ)言模型訓(xùn)練,最后合并成為單一語(yǔ)言模型。其中一種做法如下句型語(yǔ)料庫(kù)→進(jìn)行一般語(yǔ)言模型訓(xùn)練→句型的語(yǔ)言模型;分段語(yǔ)料庫(kù)→進(jìn)行一般語(yǔ)言模型訓(xùn)練→分段語(yǔ)料庫(kù)的語(yǔ)言模型之后,合并上述語(yǔ)言模型成為單一語(yǔ)言模型,即為分段語(yǔ)義概念多聯(lián)詞模型。
請(qǐng)接著參閱圖4說(shuō)明圖2中的分段次文法的語(yǔ)言理解分析。分段次文法包含「辨識(shí)的結(jié)果分段化」、「各段落用相對(duì)的分段次文法進(jìn)行文法解析」以及「文法解析結(jié)果的合并」。
首先,關(guān)于辨識(shí)的結(jié)果分段化,再以上述的例句為例子,辨識(shí)的結(jié)果標(biāo)示著<時(shí)間>與<行程>的兩個(gè)詞組。
例句我想在<時(shí)間>十月三十日</時(shí)間>搭飛機(jī),<行程>從臺(tái)北到莫斯科</行程>。
此句子便被自動(dòng)分成下面的句型句型我想<時(shí)間>搭飛機(jī),<行程>。
其中的詞組如下<時(shí)間>詞組在十月三十日<行程>詞組從臺(tái)北到莫斯科接著,各段落用相對(duì)的分段次文法進(jìn)行文法解析。以上述例句為例,針對(duì)句型、<時(shí)間>詞組以及<行程>詞組三者各自進(jìn)行語(yǔ)言理解解析。
上述的句型為“我想<時(shí)間>搭飛機(jī),<行程>”,用句型文法解析得到概念為<查詢(xún)某時(shí)間某行程的飛機(jī)>。
上述<時(shí)間>詞組為“在十月三十日”,用<時(shí)間>詞組文法解析后得到概念<月份=十月>,以及概念<日期=三十日>。
上述的<行程>詞組為“從臺(tái)北到莫斯科”,用<行程>詞組文法解析后得到概念<出發(fā)地=臺(tái)北>,以及概念<到達(dá)地=莫斯科>。
最后,將文法解析結(jié)果進(jìn)行合并。仍以上述分段次文法解析結(jié)果為例。在上述文法解析后所得到的概念如下概念<查詢(xún)某時(shí)間某行程的飛機(jī)>;概念<月份=十月>與<日期=三十日>;以及概念<出發(fā)地=臺(tái)北>與<到達(dá)地=莫斯科>。
另外,當(dāng)某分段無(wú)解析結(jié)果時(shí),進(jìn)行合并的其他分段解析結(jié)果并不受影響。例如,在上述例句中不對(duì)<時(shí)間>詞組進(jìn)行<時(shí)間>詞組文法解析。解析后的結(jié)果如下句型“我想<時(shí)間>搭飛機(jī),<行程>”用句型文法解析后得到概念<查詢(xún)某時(shí)間某行程的飛機(jī)>。<行程>詞組“從臺(tái)北到莫斯科”用<行程>詞組文法解析后,得到概念<出發(fā)地=臺(tái)北>與概念<到達(dá)地=莫斯科>。
將上述解析結(jié)果合并,得到以下結(jié)果概念<查詢(xún)某時(shí)間某行程的飛機(jī)>
概念<出發(fā)地=臺(tái)北>與概念<到達(dá)地=莫斯科>
綜上所述,在分段語(yǔ)義概念多聯(lián)詞模型60中,是把輸入的語(yǔ)音做有意義的分段,在從各分段中去辨識(shí)出它的語(yǔ)義。例如,當(dāng)使用者輸入語(yǔ)音「請(qǐng)問(wèn)在11月30日那天從臺(tái)北到洛杉磯的航班時(shí)刻表為何」時(shí),里面就可以拆解出例如「在11月30日」「從臺(tái)北到洛杉磯」「航班時(shí)刻表」等之類(lèi)的有語(yǔ)義分段。換句話說(shuō),在某年某月某日可以是一個(gè)分段語(yǔ)義、從某地到某地、從幾點(diǎn)到幾點(diǎn)、某某時(shí)刻表等。經(jīng)由此種方式,語(yǔ)音辨識(shí)可以把輸入到自然對(duì)話系統(tǒng)100中的語(yǔ)音資訊加以分析,擷取出具有意義的分段語(yǔ)義來(lái),而揚(yáng)棄不需要的語(yǔ)詞。
從對(duì)話習(xí)慣可以知道當(dāng)一個(gè)起始字出現(xiàn)時(shí),后面接著出現(xiàn)的其他字匯有多大的機(jī)率。藉由此概念,便可以達(dá)到擷取出分段語(yǔ)義的目的。如上例中,當(dāng)出現(xiàn)「從」時(shí),便可以知道常出現(xiàn)的語(yǔ)義可能會(huì)有「從幾點(diǎn)到幾點(diǎn)」、「從某地到某地」等等之類(lèi)。語(yǔ)音辨識(shí)模組12’于是便可以據(jù)此來(lái)簡(jiǎn)化辨識(shí)的程序。亦即,只要從一句輸入的語(yǔ)音訊息中,擷取出各個(gè)分段語(yǔ)義便可以辨識(shí)的目的。而且以分段語(yǔ)義的方式來(lái)進(jìn)行時(shí),并不需要對(duì)整句進(jìn)行文法分析,所以錯(cuò)誤率可以降低,亦即辨識(shí)正確率可以達(dá)為提升。例如「從」之后有地名時(shí),便可以辨識(shí)出是「從某地到某地」的語(yǔ)義等。
此外,由于人在說(shuō)話時(shí)會(huì)有很多不需要且無(wú)意義的虛詞或語(yǔ)詞。若使用全句文法分析,便有可能造成無(wú)法分析或分析錯(cuò)誤的情形出現(xiàn)。因此,根據(jù)本發(fā)明的教示,語(yǔ)音辨識(shí)模組12’的輸出更可以包含詞標(biāo)示(tag),分段語(yǔ)義概念標(biāo)示,以及其他語(yǔ)義相關(guān)標(biāo)示。藉由語(yǔ)義概念分段,加強(qiáng)了語(yǔ)音辨識(shí)處理的語(yǔ)義處理能力,簡(jiǎn)化了語(yǔ)言理解處理的復(fù)雜度。降低了文法寫(xiě)作的完整性要求,因而提升了發(fā)展自然語(yǔ)言對(duì)話系統(tǒng)的效率以及效果。
以中文語(yǔ)法為例,一般而言,語(yǔ)法的嚴(yán)謹(jǐn)度較為松散(例如相較于英文而言),加字或漏字經(jīng)常發(fā)生,使得窮舉式的文法寫(xiě)作極為困難,對(duì)話系統(tǒng)的成功率也因此低落。換句話說(shuō),我們無(wú)法針對(duì)每一種特例來(lái)做出對(duì)應(yīng)的詞庫(kù)以增加成功率。即使我們把每一種情況都考慮,但是最后也會(huì)造成數(shù)據(jù)庫(kù)或整個(gè)對(duì)話系統(tǒng)的過(guò)度膨脹與負(fù)擔(dān)。
本發(fā)明設(shè)計(jì)的語(yǔ)音辨識(shí)的輸出詞串,包含具有語(yǔ)義重要性的詞(標(biāo)示1)以及不具有語(yǔ)義重要性的詞(標(biāo)示0)。前者例如從、到、臺(tái)北、…等等。后者例如嗯、我是說(shuō)、…等等。語(yǔ)言理解的語(yǔ)句分析器只理會(huì)具有語(yǔ)義重要性的詞,而忽略不具有語(yǔ)義重要性的詞。因?yàn)槲姆ㄒ?guī)則不需理會(huì)那些不具有語(yǔ)義重要性的詞,因而大量降低文法寫(xiě)作的工作,并減少辨識(shí)時(shí)處理的可能句型總組合數(shù)量。
換句話說(shuō),當(dāng)語(yǔ)音輸入到語(yǔ)音辨識(shí)模組12’后,語(yǔ)音辨識(shí)模組12’除了依據(jù)分段語(yǔ)義概念多聯(lián)詞模型60來(lái)對(duì)輸入的語(yǔ)音訊號(hào)找出各分段語(yǔ)義外,同時(shí)也對(duì)各個(gè)分段詞加上標(biāo)示,以標(biāo)示出該分段詞是有意義或沒(méi)有意義的。因此,當(dāng)語(yǔ)言理解分析模組14’接收到語(yǔ)音辨識(shí)模組12’所傳來(lái)的輸出結(jié)果,邊會(huì)依據(jù)標(biāo)示將一些沒(méi)有意義的語(yǔ)詞剔除,只留下有意義的分段語(yǔ)義。同時(shí),語(yǔ)言理解分析模組14’僅會(huì)針對(duì)有意義的分段語(yǔ)義去做語(yǔ)言的理解與分析。此時(shí),語(yǔ)言理解分析模組14’會(huì)依循所謂的分段次文法70來(lái)進(jìn)行語(yǔ)言的理解與分析,而不使用傳統(tǒng)的全句文法分析器來(lái)分析。很明顯地,語(yǔ)言理解分析模組14’所要處理的理解分析工作被大為簡(jiǎn)化。因?yàn)樵谡Z(yǔ)音辨識(shí)模組12’時(shí)已經(jīng)依據(jù)分段語(yǔ)義概念多聯(lián)詞模型60來(lái)挑出有意義的分段語(yǔ)義,因此語(yǔ)言理解分析模組14’所要處理的部分也就僅僅針對(duì)各分段來(lái)處理,因而正確率便大為提升。
如上所述,語(yǔ)音辨識(shí)輸出的分段語(yǔ)義概念標(biāo)示,自然地提供語(yǔ)言理解處理的分段處理能力。分段處理的語(yǔ)言理解,不需要整句的文法規(guī)則,故簡(jiǎn)化了對(duì)話系統(tǒng)的設(shè)計(jì)復(fù)雜度,也降低了記憶體使用量的需求與加快了處理的速度。語(yǔ)音辨識(shí)輸出的語(yǔ)義相關(guān)標(biāo)示,則增加了語(yǔ)句分析時(shí)的便利。
「語(yǔ)音識(shí)別引擎」使用的分段語(yǔ)義概念多聯(lián)詞模型中,每個(gè)分段模型分別附有以其語(yǔ)義概念物件的次語(yǔ)句單位所收集的詞庫(kù)。因?yàn)椴灰哉錇閱挝?,與應(yīng)用范圍相關(guān)性較弱。所以可從不同的應(yīng)用范圍中收集累積,也可以應(yīng)用于不同的應(yīng)用范圍中。經(jīng)過(guò)長(zhǎng)時(shí)間的收集累積之后,將可以增廣其詞數(shù)與相連詞頻的覆蓋范圍(coverage),進(jìn)而提高其辨識(shí)準(zhǔn)確性。
總體而言,不僅處理時(shí)的速度增快了,發(fā)展自然語(yǔ)言對(duì)話系統(tǒng)的整體效能更因而提升了。
以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專(zhuān)業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的方法及技術(shù)內(nèi)容作出些許的更動(dòng)或修飾為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,其特征在于其包括以下步驟接收一語(yǔ)音輸入;依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型,將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;以及依據(jù)一分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,其特征在于在分析該些分段語(yǔ)義之前更包括將各該些分段語(yǔ)義區(qū)分為一有意義分段語(yǔ)義或一無(wú)意義分段語(yǔ)義;以及剔除該分段語(yǔ)義中的該些無(wú)意義分段語(yǔ)義。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,其特征在于其中依據(jù)分段語(yǔ)義概念多聯(lián)詞模型的步驟更包括從一般語(yǔ)言模型語(yǔ)料庫(kù),分析該語(yǔ)音輸入的句型;對(duì)該該語(yǔ)音輸入的句型進(jìn)行一語(yǔ)料庫(kù)分段解析,以得到該些分段語(yǔ)義;以及利用一句型語(yǔ)分段語(yǔ)料庫(kù),對(duì)各該些分段語(yǔ)義進(jìn)行一語(yǔ)言模型訓(xùn)練,再合并成單一語(yǔ)言模型。
4.根據(jù)權(quán)利要求2所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,其特征在于其中所述的有意義分段語(yǔ)義或無(wú)意義分段語(yǔ)義是以附加一標(biāo)示(tag)的方式來(lái)進(jìn)行。
5.一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,其特征在于將接收到的一語(yǔ)音輸入;依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型,將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義。
6.根據(jù)權(quán)利要求5所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法,其特征在于其中依據(jù)分段語(yǔ)義概念多聯(lián)詞模型的步驟更包括從一般語(yǔ)言模型語(yǔ)料庫(kù);分析該語(yǔ)音輸入的句型;對(duì)該該語(yǔ)音輸入的句型進(jìn)行一語(yǔ)料庫(kù)分段解析,以得到該些分段語(yǔ)義;以及利用一句型語(yǔ)分段語(yǔ)料庫(kù),對(duì)各該些分段語(yǔ)義進(jìn)行一語(yǔ)言模型訓(xùn)練,再合并成單一語(yǔ)言模型。
7.一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置,其特征在于其包括以下步驟一語(yǔ)音辨識(shí)模組,用以接收一語(yǔ)音輸入,并依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型,將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;以及一語(yǔ)音理解分析模組,依據(jù)一分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析。
8.根據(jù)權(quán)利要求7所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置,其特征在于其中所述的語(yǔ)音辨識(shí)模組更將各該些分段語(yǔ)義區(qū)分為一有意義分段語(yǔ)義或一無(wú)意義分段語(yǔ)義,并且該語(yǔ)音理解分析模組剔除該分段語(yǔ)義中的該些無(wú)意義分段語(yǔ)義。
9.根據(jù)權(quán)利要求8所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置,其特征在于其中所述的語(yǔ)音辨識(shí)模組是以附加一標(biāo)示(tag)的方式來(lái)區(qū)分該有意義分段語(yǔ)義或該無(wú)意義分段語(yǔ)義。
10.一種自然對(duì)話系統(tǒng),其特征在于其包括一語(yǔ)音辨識(shí)模組,用以接收一語(yǔ)音輸入,并依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型,將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;一語(yǔ)音理解分析模組,依據(jù)一分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析;一對(duì)話管理模組,依據(jù)該語(yǔ)音理解分析模組的輸出,從一數(shù)據(jù)庫(kù)中選出對(duì)應(yīng)的對(duì)話輸出;以及一語(yǔ)音合成模組,依據(jù)該對(duì)話管理模組的對(duì)話輸出,合成一語(yǔ)音輸出訊號(hào)。
11.根據(jù)權(quán)利要求10所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置,其特征在于其中所述的語(yǔ)音辨識(shí)模組更將各該些分段語(yǔ)義區(qū)分為一有意義分段語(yǔ)義或一無(wú)意義分段語(yǔ)義,并且該語(yǔ)音理解分析模組剔除該分段語(yǔ)義中的該些無(wú)意義分段語(yǔ)義。
12.根據(jù)權(quán)利要求10所述的語(yǔ)音辨識(shí)與語(yǔ)言理解分析的裝置,其特征在于其中所述的語(yǔ)音辨識(shí)模組是以附加一標(biāo)示(tag)的方式來(lái)區(qū)分該有意義分段語(yǔ)義或該無(wú)意義分段語(yǔ)義。
全文摘要
本發(fā)明是有關(guān)于一種語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法與裝置。該語(yǔ)音辨識(shí)與語(yǔ)言理解分析的方法依據(jù)分段語(yǔ)義概念多聯(lián)詞模型,將語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義。將各該些分段語(yǔ)義附上標(biāo)示,以顯示各該些分段語(yǔ)義為有意義分段語(yǔ)義或無(wú)意義分段語(yǔ)義。剔除不具意義的分段語(yǔ)義,僅保留有意義的分段語(yǔ)詞。依據(jù)分段次文法,對(duì)有意義分段語(yǔ)詞進(jìn)行語(yǔ)言的理解分析,及其裝置有一語(yǔ)音辨識(shí)模組,用以接收一語(yǔ)音輸入,并依據(jù)一分段語(yǔ)義概念多聯(lián)詞模型,將該語(yǔ)音輸入分割成多數(shù)個(gè)分段語(yǔ)義;以及一語(yǔ)音理解分析模組,依據(jù)一分段次文法,對(duì)該些分段語(yǔ)義進(jìn)行分析。
文檔編號(hào)G10L17/00GK1831937SQ20051005355
公開(kāi)日2006年9月13日 申請(qǐng)日期2005年3月8日 優(yōu)先權(quán)日2005年3月8日
發(fā)明者王瑞璋 申請(qǐng)人:臺(tái)達(dá)電子工業(yè)股份有限公司