亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種人機(jī)交互導(dǎo)航系統(tǒng)的制作方法

文檔序號(hào):2823532閱讀:450來(lái)源:國(guó)知局
專利名稱:一種人機(jī)交互導(dǎo)航系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,特別涉及人機(jī)交互語(yǔ)音系統(tǒng),具體的講是一種人機(jī)交互導(dǎo)航系統(tǒng)。
背景技術(shù)
隨著我國(guó)國(guó)民經(jīng)濟(jì)的快速發(fā)展,人民生活水平的大幅提高,作為我國(guó)重要經(jīng)濟(jì)命脈之一的交通運(yùn)輸業(yè)的發(fā)展也是突飛猛進(jìn),現(xiàn)今我國(guó)車輛的保有量呈現(xiàn)大幅增長(zhǎng)之勢(shì),并且隨著道路的四通八達(dá),行車難越來(lái)越多的體現(xiàn)在對(duì)交通線路的選擇上,對(duì)于駕駛員來(lái)說(shuō)選擇一條最佳的交通路線,避免走冤枉路已成了當(dāng)今駕駛員的必然選擇。目前國(guó)內(nèi)外普遍采用GPS自主導(dǎo)航方法來(lái)實(shí)現(xiàn)對(duì)車輛的導(dǎo)航。一般的GPS導(dǎo)航系統(tǒng)主要由處理器,顯示屏,觸摸屏和音頻處理裝置構(gòu)成,但是原有觸摸屏在使用中需要粘貼于顯示屏上,在其兩者調(diào)試到統(tǒng)一坐標(biāo)的前提下,用戶的手指的觸摸屏的移動(dòng)就類似鼠標(biāo)移動(dòng)的選擇功能,但是由于觸摸屏本身的構(gòu)造和材料限制,經(jīng)常會(huì)出現(xiàn)定位的漂移等現(xiàn)象,并且由于經(jīng)常用手指觸摸屏幕,以至于觸摸區(qū)域被弄臟和自然老化,這種單一使用手指的GPS觸摸屏在可靠性上很不穩(wěn)定,經(jīng)常需要定期維護(hù)。
最近的導(dǎo)航設(shè)備不但具有僅僅顯示地圖信息的功能,而且也具有作為信息終端裝置用來(lái)給用戶提供諸如到目的地的路由引導(dǎo)信息和在當(dāng)前位置附近的交通信息的許多種類的信息功能,中國(guó)專利02151633于2002年12月30號(hào)申請(qǐng)的一種基于GPS和GPRS(General PacketRadio Service)實(shí)現(xiàn)車輛網(wǎng)絡(luò)導(dǎo)航的方法,公開了一種能夠?qū)?dǎo)航信息通過(guò)語(yǔ)音輸出的技術(shù)方案,該系統(tǒng)能夠?qū)⒌貓D信息,當(dāng)前位置的交通信息和到達(dá)目的地方向指令通過(guò)語(yǔ)音消息形式傳遞給駕駛員。但是,駕駛員在使用該種系統(tǒng)時(shí)還是需要聚精會(huì)神的用手操作,如果駕駛員需要知道當(dāng)前路況信息或者目的地的信息,他必須一邊駕駛著汽車一邊用手操作該種導(dǎo)航系統(tǒng),這樣在現(xiàn)實(shí)路況和屏幕之間轉(zhuǎn)換視線,這樣操作的結(jié)果是他將不能把注意力集中在駕駛汽車上,這對(duì)駕駛員和其他人的生命安全造成了很大的威脅。
目前市場(chǎng)上出現(xiàn)的所謂語(yǔ)音導(dǎo)航系統(tǒng),只體現(xiàn)在輸出部分,即語(yǔ)音提示只是提示信息回放給用戶的一種方式,并不能提供語(yǔ)音輸入功能。另外,這種單向的信息傳遞方式對(duì)于駕駛員來(lái)說(shuō)也是很不方便的,駕駛員無(wú)法得知自己想知道的信息,系統(tǒng)只能夠簡(jiǎn)單的做出基本語(yǔ)音提示,駕駛員如果想知道別的信息,比如天氣等信息,必須通過(guò)對(duì)導(dǎo)航系統(tǒng)的物理操控才能獲得自己希望的信息。

發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種人機(jī)交互導(dǎo)航系統(tǒng),解決現(xiàn)有導(dǎo)航系統(tǒng)觸摸屏的不足,使用者必須使用手工操作才能從導(dǎo)航系統(tǒng)中獲得希望的信息,實(shí)現(xiàn)使用者與導(dǎo)航系統(tǒng)真正的交互。
本發(fā)明的目的還在于提供一種人機(jī)交互導(dǎo)航方法,解決現(xiàn)有導(dǎo)航系統(tǒng)單向語(yǔ)音提示,不能與使用者在語(yǔ)音上進(jìn)行交互的不足。
一種人機(jī)交互導(dǎo)航系統(tǒng),包括音頻輸出單元、全球定位單元,還包括音頻輸入單元、自動(dòng)語(yǔ)音識(shí)別單元、數(shù)據(jù)庫(kù)、語(yǔ)音合成單元;其中,所述音頻輸入單元與所述自動(dòng)語(yǔ)音識(shí)別單元相連接;所述自動(dòng)語(yǔ)音識(shí)別單元與所述全球定位單元相連接;所述全球定位單元與所述數(shù)據(jù)庫(kù)相連接;所述全球定位單元與所述語(yǔ)音合成單元相連接;所述語(yǔ)音合成單元與所述音頻輸出單元相連接;由音頻輸入單元采集用戶的音頻輸入數(shù)據(jù),自動(dòng)語(yǔ)音識(shí)別單元將該音頻輸入數(shù)據(jù)轉(zhuǎn)換成相應(yīng)的指令,全球定位單元執(zhí)行該指令并返回處理結(jié)果數(shù)據(jù),根據(jù)該處理結(jié)果數(shù)據(jù)搜索數(shù)據(jù)庫(kù)并輸出人機(jī)交互信息,語(yǔ)音合成單元將該人機(jī)交互信息轉(zhuǎn)換成語(yǔ)音通過(guò)音頻輸出單元進(jìn)行輸出。
還包括自然語(yǔ)音理解單元,所述自然語(yǔ)音理解單元連接于自動(dòng)語(yǔ)音識(shí)別單元與全球定位單元之間,用于進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令,將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
還包括人機(jī)交互管理單元,所述人機(jī)交互管理單元連接于全球定位單元與語(yǔ)音合成單元之間,根據(jù)語(yǔ)法學(xué),語(yǔ)義學(xué)和句法知識(shí),結(jié)合全球定位單元提供的信息,生成符合語(yǔ)法邏輯的人機(jī)交互信息。
還包括前置語(yǔ)音預(yù)處理單元,所述前置語(yǔ)音預(yù)處理單元連接于音頻輸入單元與自動(dòng)語(yǔ)音識(shí)別單元之間,濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
所述的音頻輸入單元為麥克陣列。
一種人機(jī)交互導(dǎo)航方法,包括如下步驟通過(guò)音頻輸入單元接收用戶的音頻輸入數(shù)據(jù);通過(guò)自動(dòng)語(yǔ)音識(shí)別步驟對(duì)用戶的音頻輸入數(shù)據(jù)進(jìn)行處理,將其轉(zhuǎn)換成相應(yīng)的指令;根據(jù)全球定位單元執(zhí)行指令結(jié)果,搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息;將所述人機(jī)交互信息通過(guò)語(yǔ)音合成單元輸出。
在所述自動(dòng)語(yǔ)音識(shí)別步驟后,還包括一自然語(yǔ)音理解步驟進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令,將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
所述根據(jù)全球定位單元執(zhí)行指令結(jié)果,搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息的步驟中,還包括一人機(jī)交互管理步驟根據(jù)根據(jù)語(yǔ)法學(xué),語(yǔ)義學(xué)和句法知識(shí),結(jié)合全球定位單元提供的信息,生成符合語(yǔ)法邏輯的人機(jī)交互信息。
在所述自動(dòng)語(yǔ)音識(shí)別步驟前,還包括一前置語(yǔ)音預(yù)處理步驟,濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
所述的人機(jī)交互信息為文本格式的數(shù)據(jù)。
本發(fā)明的有益效果在于,能夠使駕駛員在駕駛車輛的同時(shí)查詢需要的信息,并且不需要?jiǎng)邮只蛘咿D(zhuǎn)移視線對(duì)導(dǎo)航系統(tǒng)進(jìn)行控制,提高了駕駛的安全性和便利性,并且降低了對(duì)使用者的要求,使用者不需要進(jìn)行相關(guān)培訓(xùn)和專業(yè)知識(shí),只需要說(shuō)出所需信息提示,就可以通過(guò)本發(fā)明獲得相應(yīng)信息。


圖1為本發(fā)明系統(tǒng)結(jié)構(gòu)示意圖;圖2為本發(fā)明自動(dòng)語(yǔ)音識(shí)別過(guò)程示意圖;圖3為本發(fā)明人機(jī)交互導(dǎo)航系統(tǒng)的一個(gè)實(shí)施例示意圖;圖4為本發(fā)明人機(jī)交互導(dǎo)航系統(tǒng)的另一實(shí)施例示意圖。
具體實(shí)施例方式
下面,結(jié)合附圖對(duì)于本發(fā)明進(jìn)行如下詳細(xì)說(shuō)明。
圖1為本發(fā)明系統(tǒng)結(jié)構(gòu)示意圖。如圖所示,使用麥克陣列為一音頻輸入裝置,同時(shí),觸摸屏或者按鍵同樣可以在本發(fā)明中起到同現(xiàn)有技術(shù)中一樣的基本控制功能;在現(xiàn)有移動(dòng)工具中,例如汽車,手機(jī)等,在本發(fā)明人機(jī)交互導(dǎo)航系統(tǒng)的具體實(shí)現(xiàn)過(guò)程中,使用麥克陣列作為音頻輸入單元是因?yàn)槠鋵?duì)采集音頻信號(hào)源的效果比較好,當(dāng)然也可以使用類似的采集音頻信號(hào)的裝置。在經(jīng)過(guò)麥克陣列采集音頻輸入信號(hào)后,本發(fā)明的前置語(yǔ)音預(yù)處理單元對(duì)用戶的輸入進(jìn)行增強(qiáng),濾除外界噪音干擾,傳送給自動(dòng)語(yǔ)音識(shí)別單元(ASRAutomatic Speech Recognition),該自動(dòng)語(yǔ)音識(shí)別單元將這些語(yǔ)音特征與語(yǔ)音訓(xùn)練模板中的特征值相比較,將用戶輸入的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)格式的數(shù)據(jù)進(jìn)行輸出。自然語(yǔ)音理解單元(NLUNatural Language Understanding)接收從ASR傳送出的標(biāo)準(zhǔn)格式的數(shù)據(jù),并且繼續(xù)分析該命令數(shù)據(jù)的正確性,分析用戶語(yǔ)音所代表的意圖,將用戶不準(zhǔn)確的語(yǔ)音命令轉(zhuǎn)換為準(zhǔn)確命令信息。全球定位單元(GPSGlobalPosition System),執(zhí)行從NLU中傳送出的準(zhǔn)確命令信息,數(shù)據(jù)庫(kù)中存儲(chǔ)了相應(yīng)的地圖信息,包括地名、學(xué)校名、醫(yī)院名等信息,同時(shí)系統(tǒng)可以通過(guò)互聯(lián)網(wǎng)連接到服務(wù)中心及時(shí)更新相關(guān)路況信息等文本數(shù)據(jù),根據(jù)用戶的語(yǔ)音輸入命令在數(shù)據(jù)庫(kù)中查找目的地名等數(shù)據(jù)控制GPS單元進(jìn)行處理,通過(guò)查找數(shù)據(jù)庫(kù)確定現(xiàn)在位置和目標(biāo)地點(diǎn)等操作。人機(jī)交互管理單元(DMDialogue Management),在取得GPS執(zhí)行結(jié)果后生成與用戶語(yǔ)音命令相對(duì)應(yīng)的交互信息(本實(shí)施例中交互信息為交通指示信息和人機(jī)對(duì)話等文本類型數(shù)據(jù),也可以為其他類型的數(shù)據(jù)),處理結(jié)束后將交互信息和相關(guān)的交通指示信息傳送給語(yǔ)音轉(zhuǎn)換單元(TTSText To Speech),由TTS根據(jù)交互信息生成相應(yīng)的語(yǔ)音信息,通過(guò)揚(yáng)聲器進(jìn)行輸出。
如圖2所示為本發(fā)明自動(dòng)語(yǔ)音識(shí)別單元示意圖,通過(guò)前置語(yǔ)音預(yù)處理單元對(duì)用戶輸入的語(yǔ)音進(jìn)行預(yù)處理,提取相應(yīng)的聲波參數(shù),形成用戶語(yǔ)音輸入部分Y,通過(guò)聲學(xué)模型模塊(AMAcoustic model)對(duì)語(yǔ)音進(jìn)行處理,其中聲學(xué)模型是語(yǔ)音識(shí)別系統(tǒng)的底層模型,是影響識(shí)別系統(tǒng)性能最關(guān)鍵的一部分,聲學(xué)模型模塊的目標(biāo)是提供一種有效的描述方法,計(jì)算語(yǔ)音的特征矢量序列(即圖中經(jīng)過(guò)前置語(yǔ)音預(yù)處理單元生成的特征矢量序列)和每個(gè)發(fā)音樣本(即圖中發(fā)音字典中存儲(chǔ)的發(fā)音樣本)之間的距離,故聲學(xué)模型模塊的設(shè)計(jì)跟語(yǔ)言發(fā)音特點(diǎn)密切相關(guān)。在語(yǔ)音識(shí)別中,首先是模擬的語(yǔ)音信號(hào)在聲學(xué)前端的前置語(yǔ)音預(yù)處理單元被處理為特征矢量序列并過(guò)濾相伴語(yǔ)音數(shù)據(jù)一同傳入的噪音,這些特征矢量序列描述了語(yǔ)音信號(hào)的短時(shí)及普遍變化信息,經(jīng)過(guò)與發(fā)音字典中的發(fā)音樣本比較后,輸出用戶聲學(xué)模型模塊識(shí)別的運(yùn)算結(jié)果P(Y|W)。語(yǔ)言模型模塊(LMLanguage model)用于為所識(shí)別的詞序列提供語(yǔ)法和句法上的約束,尤其重要的是它提供了一種可以根據(jù)所給出詞序列W中的上下文而估計(jì)出某個(gè)詞在此詞序列中出現(xiàn)的概率的機(jī)制。理想的語(yǔ)言模型模塊應(yīng)該包括有關(guān)語(yǔ)言學(xué)上的、在識(shí)別系統(tǒng)中該語(yǔ)言所適用范圍的以及相關(guān)的一些信息,比如用戶輸入“開啟”,語(yǔ)言模型模塊就會(huì)聯(lián)想到以“開啟”為開始的詞組或者句子都有哪些組合的可能,“開啟系統(tǒng)”,“開啟音響”等,這些信息可以被LM利用來(lái)縮減所需要的搜索空間。利用語(yǔ)言模型模塊的運(yùn)算結(jié)果P(W)和聲學(xué)模型模塊的運(yùn)算結(jié)果P(Y|W)計(jì)算出用戶的輸入語(yǔ)音對(duì)應(yīng)的漢字串。
圖3為本發(fā)明人機(jī)交互語(yǔ)音導(dǎo)航的一個(gè)實(shí)施例,首先,語(yǔ)音波形文件作為輸入,例如,用戶可以對(duì)著話筒說(shuō)“打開導(dǎo)航系統(tǒng)”,語(yǔ)音時(shí)域信號(hào)通過(guò)A/D轉(zhuǎn)換器(前置語(yǔ)音預(yù)處理單元)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),在此基礎(chǔ)上,進(jìn)行特征提取,一般采用Mel頻率倒譜系數(shù)(MFCCMel-Frequency Cepstral Coefficients)為特征的26維或者39維特征參數(shù)來(lái)描述不同音節(jié)或者音素的屬性。將提取的特征與系統(tǒng)訓(xùn)練好的聲學(xué)模型進(jìn)行比較,找到最大(概率最大)可能的狀態(tài)序列。通過(guò)解碼器(Decoder)對(duì)該可能的序列進(jìn)行識(shí)別,語(yǔ)音識(shí)別的解碼算法為Viterbi搜索算法,用戶輸入的語(yǔ)音數(shù)據(jù)在經(jīng)過(guò)語(yǔ)言模型模塊處理后,由解碼器挑選出與用戶語(yǔ)音輸入最佳匹配的“打開導(dǎo)航系統(tǒng)”詞語(yǔ)序列。所有可能詞序列的數(shù)量隨系統(tǒng)所采用模型的數(shù)量、詞匯表大小、所用的語(yǔ)義約束成指數(shù)關(guān)系增加,使得大詞表語(yǔ)音識(shí)別算法對(duì)所需的運(yùn)算速度以及存儲(chǔ)空間提出了近乎苛刻的要求。語(yǔ)言模型(LM)用來(lái)為所識(shí)別的詞序列提供語(yǔ)法和句法上的約束。它提供了一種可以根據(jù)所給出詞序列W中的上下文而估計(jì)出某個(gè)詞在此詞序列中出現(xiàn)的概率的機(jī)制。通過(guò)語(yǔ)言學(xué)模型在包括有關(guān)語(yǔ)言學(xué)上的、在識(shí)別系統(tǒng)中該語(yǔ)言所適用范圍的以及相關(guān)的一些信息的約束,系統(tǒng)最后的輸出為對(duì)應(yīng)的漢字,例如“打開導(dǎo)航系統(tǒng)”,經(jīng)用戶輸入的波形轉(zhuǎn)換為對(duì)應(yīng)的漢字串。自然語(yǔ)言理解單元的作用在于提供一種人機(jī)對(duì)話的自由語(yǔ)法。例如,用戶可以說(shuō)“打開導(dǎo)航系統(tǒng)”或者“我要去清華大學(xué)怎么走”或者其他方式。通過(guò)自然語(yǔ)言理解單元的處理,將用戶不準(zhǔn)確的語(yǔ)音輸入信息進(jìn)一步合理解釋,例如“啟動(dòng)”,可以引導(dǎo)用戶方便、快捷的使用本系統(tǒng),而不需要用戶機(jī)械的記憶多條關(guān)鍵的控制命令。在系統(tǒng)正確分析出用戶的意圖之后,通過(guò)訪問系統(tǒng)預(yù)先設(shè)定的地圖數(shù)據(jù)庫(kù),通過(guò)查詢關(guān)鍵字找到用戶所需的詳細(xì)信息,并通過(guò)語(yǔ)音合成出自然的語(yǔ)音信號(hào)播放給用戶,其中也可以加入人機(jī)交互管理單元,根據(jù)用戶輸入的語(yǔ)音信息和GPS產(chǎn)生的處理結(jié)果,生成相應(yīng)的應(yīng)答文本數(shù)據(jù)和交通數(shù)據(jù)通過(guò)TTS單元和用戶實(shí)現(xiàn)實(shí)時(shí)交流。
如圖4所示,為應(yīng)用本發(fā)明人機(jī)交互語(yǔ)音導(dǎo)航系統(tǒng)的另一實(shí)施例。在無(wú)線網(wǎng)絡(luò)和全球定位系統(tǒng)(GPS)之間建立了一種相互協(xié)作的關(guān)系。通過(guò)語(yǔ)音或者按鍵方式觸發(fā)導(dǎo)航系統(tǒng),將城市區(qū)域地圖從某一個(gè)遠(yuǎn)程服務(wù)器在線傳送至手機(jī)上。通過(guò)GPRS技術(shù),確定收集持有者當(dāng)前的位置。利用本發(fā)明人機(jī)交互語(yǔ)音技術(shù)或者按鍵技術(shù),說(shuō)出要去的具體方位進(jìn)行查詢。目前系統(tǒng)的設(shè)計(jì)是考慮了手機(jī)內(nèi)存和計(jì)算能力的限制,每次使用時(shí)需要從遠(yuǎn)程服務(wù)器上動(dòng)態(tài)加載電子地圖,如果手機(jī)的內(nèi)存量擴(kuò)大到一定程度,則無(wú)須使用前動(dòng)態(tài)加載,電子地圖可以駐留在內(nèi)存中,每隔一定時(shí)間刷新一次即可。
本發(fā)明的有益效果在于,語(yǔ)音作為一種替代的輸入方式取代了傳統(tǒng)的按鍵或者觸摸屏,增強(qiáng)了駕駛員在駕駛過(guò)程中的安全性,并且增加了自然語(yǔ)言理解技術(shù),使人機(jī)對(duì)話更具有人性化。用戶無(wú)需記憶復(fù)雜的命令,所想即所說(shuō)。
以上具體實(shí)施方式
僅用于說(shuō)明本發(fā)明,而非用于限定本發(fā)明。
權(quán)利要求
1.一種人機(jī)交互導(dǎo)航系統(tǒng),包括音頻輸出單元、全球定位單元,其特征在于還包括音頻輸入單元、自動(dòng)語(yǔ)音識(shí)別單元、數(shù)據(jù)庫(kù)、語(yǔ)音合成單元;其中,所述音頻輸入單元與所述自動(dòng)語(yǔ)音識(shí)別單元相連按;所述自動(dòng)語(yǔ)音識(shí)別單元與所述全球定位單元相連接;所述全球定位單元與所述數(shù)據(jù)庫(kù)相連接;所述全球定位單元與所述語(yǔ)音合成單元相連接;所述語(yǔ)音合成單元與所述音頻輸出單元相連接;由音頻輸入單元采集用戶的音頻輸入數(shù)據(jù),自動(dòng)語(yǔ)音識(shí)別單元將該音頻輸入數(shù)據(jù)轉(zhuǎn)換成相應(yīng)的指令,全球定位單元執(zhí)行該指令并返回處理結(jié)果數(shù)據(jù),根據(jù)該處理結(jié)果數(shù)據(jù)搜索數(shù)據(jù)庫(kù)并輸出入機(jī)交互信息,語(yǔ)音合成單元將該人機(jī)交互信息轉(zhuǎn)換成語(yǔ)音通過(guò)音頻輸出單元進(jìn)行輸出。
2.根據(jù)權(quán)利要求1所述的一種人機(jī)交互導(dǎo)航系統(tǒng),其特征在于還包括自然語(yǔ)音理解單元,所述自然語(yǔ)音理解單元連接于自動(dòng)語(yǔ)音識(shí)別單元與全球定位單元之間,用于進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令,將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
3.根據(jù)權(quán)利要求1所述的一種人機(jī)交互導(dǎo)航系統(tǒng),其特征在于還包括人機(jī)交互管理單元,所述人機(jī)交互管理單元連接于全球定位單元與語(yǔ)音合成單元之間,根據(jù)語(yǔ)法學(xué),語(yǔ)義學(xué)和句法知識(shí),結(jié)合全球定位單元提供的信息,生成符合語(yǔ)法邏輯的人機(jī)交互信息。
4.根據(jù)權(quán)利要求1所述的一種人機(jī)交互導(dǎo)航系統(tǒng),其特征在于還包括前置語(yǔ)音預(yù)處理單元,所述前置語(yǔ)音預(yù)處理單元連接于音頻輸入單元與自動(dòng)語(yǔ)音識(shí)別單元之間,濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
5.根據(jù)權(quán)利要求1或4所述的一種人機(jī)交互導(dǎo)航系統(tǒng),其特征在于,所述的音頻輸入單元為麥克陣列。
6.一種人機(jī)交互導(dǎo)航方法,其特征在于包括如下步驟通過(guò)音頻輸入單元接收用戶的音頻輸入數(shù)據(jù);通過(guò)自動(dòng)語(yǔ)音識(shí)別步驟對(duì)用戶的音頻輸入數(shù)據(jù)進(jìn)行處理,將其轉(zhuǎn)換成相應(yīng)的指令;根據(jù)全球定位單元執(zhí)行指令結(jié)果,搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息;將所述人機(jī)交互信息通過(guò)語(yǔ)音合成單元合成語(yǔ)音并通過(guò)音頻輸出單元輸出。
7.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法,其特征在于,在所述自動(dòng)語(yǔ)音識(shí)別步驟后,還包括一自然語(yǔ)音理解步驟進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令,將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
8.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法,其特征在于,所述根據(jù)全球定位單元執(zhí)行指令結(jié)果,搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息的步驟中,還包括一人機(jī)交互管理步驟根據(jù)根據(jù)語(yǔ)法學(xué),語(yǔ)義學(xué)和句法知識(shí),結(jié)合全球定位單元提供的信息,生成符合語(yǔ)法邏輯的人機(jī)交互信息。
9.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法,其特征在于,在所述自動(dòng)語(yǔ)音識(shí)別步驟前,還包括一前置語(yǔ)音預(yù)處理步驟,濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
10.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法,其特征在于,所述的人機(jī)交互信息為文本格式的數(shù)據(jù)。
全文摘要
本發(fā)明涉及人機(jī)交互語(yǔ)音系統(tǒng),具體的講是一種人機(jī)交互導(dǎo)航系統(tǒng)。為了解決現(xiàn)有導(dǎo)航系統(tǒng)只能通過(guò)手工輸入的缺點(diǎn),提出了一種人機(jī)交互導(dǎo)航系統(tǒng)及方法,其方法包括如下步驟通過(guò)音頻輸入單元接收用戶的音頻輸入數(shù)據(jù);通過(guò)自動(dòng)語(yǔ)音識(shí)別步驟對(duì)用戶的音頻輸入數(shù)據(jù)進(jìn)行處理,將其轉(zhuǎn)換成相應(yīng)的指令;根據(jù)全球定位單元執(zhí)行指令結(jié)果搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息;將所述人機(jī)交互信息通過(guò)語(yǔ)音合成單元輸出。本發(fā)明的有益效果在于,增強(qiáng)了駕駛員在駕駛過(guò)程中的安全性,并且增加了自然語(yǔ)言理解技術(shù),使人機(jī)對(duì)話更具有人性化,用戶無(wú)需記憶復(fù)雜的命令,所想即所說(shuō)。
文檔編號(hào)G10L15/00GK1959628SQ20051011447
公開日2007年5月9日 申請(qǐng)日期2005年10月31日 優(yōu)先權(quán)日2005年10月31日
發(fā)明者王珩 申請(qǐng)人:西門子(中國(guó))有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1