一種人機(jī)交互導(dǎo)航系統(tǒng)的制作方法

文檔序號(hào)：2823532閱讀：450來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種人機(jī)交互導(dǎo)航系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域，特別涉及人機(jī)交互語(yǔ)音系統(tǒng)，具體的講是一種人機(jī)交互導(dǎo)航系統(tǒng)。
背景技術(shù)：
隨著我國(guó)國(guó)民經(jīng)濟(jì)的快速發(fā)展，人民生活水平的大幅提高，作為我國(guó)重要經(jīng)濟(jì)命脈之一的交通運(yùn)輸業(yè)的發(fā)展也是突飛猛進(jìn)，現(xiàn)今我國(guó)車輛的保有量呈現(xiàn)大幅增長(zhǎng)之勢(shì)，并且隨著道路的四通八達(dá)，行車難越來(lái)越多的體現(xiàn)在對(duì)交通線路的選擇上，對(duì)于駕駛員來(lái)說(shuō)選擇一條最佳的交通路線，避免走冤枉路已成了當(dāng)今駕駛員的必然選擇。目前國(guó)內(nèi)外普遍采用GPS自主導(dǎo)航方法來(lái)實(shí)現(xiàn)對(duì)車輛的導(dǎo)航。一般的GPS導(dǎo)航系統(tǒng)主要由處理器，顯示屏，觸摸屏和音頻處理裝置構(gòu)成，但是原有觸摸屏在使用中需要粘貼于顯示屏上，在其兩者調(diào)試到統(tǒng)一坐標(biāo)的前提下，用戶的手指的觸摸屏的移動(dòng)就類似鼠標(biāo)移動(dòng)的選擇功能，但是由于觸摸屏本身的構(gòu)造和材料限制，經(jīng)常會(huì)出現(xiàn)定位的漂移等現(xiàn)象，并且由于經(jīng)常用手指觸摸屏幕，以至于觸摸區(qū)域被弄臟和自然老化，這種單一使用手指的GPS觸摸屏在可靠性上很不穩(wěn)定，經(jīng)常需要定期維護(hù)。
最近的導(dǎo)航設(shè)備不但具有僅僅顯示地圖信息的功能，而且也具有作為信息終端裝置用來(lái)給用戶提供諸如到目的地的路由引導(dǎo)信息和在當(dāng)前位置附近的交通信息的許多種類的信息功能，中國(guó)專利02151633于2002年12月30號(hào)申請(qǐng)的一種基于GPS和GPRS(General PacketRadio Service)實(shí)現(xiàn)車輛網(wǎng)絡(luò)導(dǎo)航的方法，公開了一種能夠?qū)?dǎo)航信息通過(guò)語(yǔ)音輸出的技術(shù)方案，該系統(tǒng)能夠?qū)⒌貓D信息，當(dāng)前位置的交通信息和到達(dá)目的地方向指令通過(guò)語(yǔ)音消息形式傳遞給駕駛員。但是，駕駛員在使用該種系統(tǒng)時(shí)還是需要聚精會(huì)神的用手操作，如果駕駛員需要知道當(dāng)前路況信息或者目的地的信息，他必須一邊駕駛著汽車一邊用手操作該種導(dǎo)航系統(tǒng)，這樣在現(xiàn)實(shí)路況和屏幕之間轉(zhuǎn)換視線，這樣操作的結(jié)果是他將不能把注意力集中在駕駛汽車上，這對(duì)駕駛員和其他人的生命安全造成了很大的威脅。
目前市場(chǎng)上出現(xiàn)的所謂語(yǔ)音導(dǎo)航系統(tǒng)，只體現(xiàn)在輸出部分，即語(yǔ)音提示只是提示信息回放給用戶的一種方式，并不能提供語(yǔ)音輸入功能。另外，這種單向的信息傳遞方式對(duì)于駕駛員來(lái)說(shuō)也是很不方便的，駕駛員無(wú)法得知自己想知道的信息，系統(tǒng)只能夠簡(jiǎn)單的做出基本語(yǔ)音提示，駕駛員如果想知道別的信息，比如天氣等信息，必須通過(guò)對(duì)導(dǎo)航系統(tǒng)的物理操控才能獲得自己希望的信息。

發(fā)明內(nèi)容
本發(fā)明的目的在于，提供一種人機(jī)交互導(dǎo)航系統(tǒng)，解決現(xiàn)有導(dǎo)航系統(tǒng)觸摸屏的不足，使用者必須使用手工操作才能從導(dǎo)航系統(tǒng)中獲得希望的信息，實(shí)現(xiàn)使用者與導(dǎo)航系統(tǒng)真正的交互。
本發(fā)明的目的還在于提供一種人機(jī)交互導(dǎo)航方法，解決現(xiàn)有導(dǎo)航系統(tǒng)單向語(yǔ)音提示，不能與使用者在語(yǔ)音上進(jìn)行交互的不足。
一種人機(jī)交互導(dǎo)航系統(tǒng)，包括音頻輸出單元、全球定位單元，還包括音頻輸入單元、自動(dòng)語(yǔ)音識(shí)別單元、數(shù)據(jù)庫(kù)、語(yǔ)音合成單元；其中，所述音頻輸入單元與所述自動(dòng)語(yǔ)音識(shí)別單元相連接；所述自動(dòng)語(yǔ)音識(shí)別單元與所述全球定位單元相連接；所述全球定位單元與所述數(shù)據(jù)庫(kù)相連接；所述全球定位單元與所述語(yǔ)音合成單元相連接；所述語(yǔ)音合成單元與所述音頻輸出單元相連接；由音頻輸入單元采集用戶的音頻輸入數(shù)據(jù)，自動(dòng)語(yǔ)音識(shí)別單元將該音頻輸入數(shù)據(jù)轉(zhuǎn)換成相應(yīng)的指令，全球定位單元執(zhí)行該指令并返回處理結(jié)果數(shù)據(jù)，根據(jù)該處理結(jié)果數(shù)據(jù)搜索數(shù)據(jù)庫(kù)并輸出人機(jī)交互信息，語(yǔ)音合成單元將該人機(jī)交互信息轉(zhuǎn)換成語(yǔ)音通過(guò)音頻輸出單元進(jìn)行輸出。
還包括自然語(yǔ)音理解單元，所述自然語(yǔ)音理解單元連接于自動(dòng)語(yǔ)音識(shí)別單元與全球定位單元之間，用于進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令，將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
還包括人機(jī)交互管理單元，所述人機(jī)交互管理單元連接于全球定位單元與語(yǔ)音合成單元之間，根據(jù)語(yǔ)法學(xué)，語(yǔ)義學(xué)和句法知識(shí)，結(jié)合全球定位單元提供的信息，生成符合語(yǔ)法邏輯的人機(jī)交互信息。
還包括前置語(yǔ)音預(yù)處理單元，所述前置語(yǔ)音預(yù)處理單元連接于音頻輸入單元與自動(dòng)語(yǔ)音識(shí)別單元之間，濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
所述的音頻輸入單元為麥克陣列。
一種人機(jī)交互導(dǎo)航方法，包括如下步驟通過(guò)音頻輸入單元接收用戶的音頻輸入數(shù)據(jù)；通過(guò)自動(dòng)語(yǔ)音識(shí)別步驟對(duì)用戶的音頻輸入數(shù)據(jù)進(jìn)行處理，將其轉(zhuǎn)換成相應(yīng)的指令；根據(jù)全球定位單元執(zhí)行指令結(jié)果，搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息；將所述人機(jī)交互信息通過(guò)語(yǔ)音合成單元輸出。
在所述自動(dòng)語(yǔ)音識(shí)別步驟后，還包括一自然語(yǔ)音理解步驟進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令，將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
所述根據(jù)全球定位單元執(zhí)行指令結(jié)果，搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息的步驟中，還包括一人機(jī)交互管理步驟根據(jù)根據(jù)語(yǔ)法學(xué)，語(yǔ)義學(xué)和句法知識(shí)，結(jié)合全球定位單元提供的信息，生成符合語(yǔ)法邏輯的人機(jī)交互信息。
在所述自動(dòng)語(yǔ)音識(shí)別步驟前，還包括一前置語(yǔ)音預(yù)處理步驟，濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
所述的人機(jī)交互信息為文本格式的數(shù)據(jù)。
本發(fā)明的有益效果在于，能夠使駕駛員在駕駛車輛的同時(shí)查詢需要的信息，并且不需要?jiǎng)邮只蛘咿D(zhuǎn)移視線對(duì)導(dǎo)航系統(tǒng)進(jìn)行控制，提高了駕駛的安全性和便利性，并且降低了對(duì)使用者的要求，使用者不需要進(jìn)行相關(guān)培訓(xùn)和專業(yè)知識(shí)，只需要說(shuō)出所需信息提示，就可以通過(guò)本發(fā)明獲得相應(yīng)信息。

圖1為本發(fā)明系統(tǒng)結(jié)構(gòu)示意圖；圖2為本發(fā)明自動(dòng)語(yǔ)音識(shí)別過(guò)程示意圖；圖3為本發(fā)明人機(jī)交互導(dǎo)航系統(tǒng)的一個(gè)實(shí)施例示意圖；圖4為本發(fā)明人機(jī)交互導(dǎo)航系統(tǒng)的另一實(shí)施例示意圖。
具體實(shí)施例方式
下面，結(jié)合附圖對(duì)于本發(fā)明進(jìn)行如下詳細(xì)說(shuō)明。
圖1為本發(fā)明系統(tǒng)結(jié)構(gòu)示意圖。如圖所示，使用麥克陣列為一音頻輸入裝置，同時(shí)，觸摸屏或者按鍵同樣可以在本發(fā)明中起到同現(xiàn)有技術(shù)中一樣的基本控制功能；在現(xiàn)有移動(dòng)工具中，例如汽車，手機(jī)等，在本發(fā)明人機(jī)交互導(dǎo)航系統(tǒng)的具體實(shí)現(xiàn)過(guò)程中，使用麥克陣列作為音頻輸入單元是因?yàn)槠鋵?duì)采集音頻信號(hào)源的效果比較好，當(dāng)然也可以使用類似的采集音頻信號(hào)的裝置。在經(jīng)過(guò)麥克陣列采集音頻輸入信號(hào)后，本發(fā)明的前置語(yǔ)音預(yù)處理單元對(duì)用戶的輸入進(jìn)行增強(qiáng)，濾除外界噪音干擾，傳送給自動(dòng)語(yǔ)音識(shí)別單元(ASRAutomatic Speech Recognition)，該自動(dòng)語(yǔ)音識(shí)別單元將這些語(yǔ)音特征與語(yǔ)音訓(xùn)練模板中的特征值相比較，將用戶輸入的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)格式的數(shù)據(jù)進(jìn)行輸出。自然語(yǔ)音理解單元(NLUNatural Language Understanding)接收從ASR傳送出的標(biāo)準(zhǔn)格式的數(shù)據(jù)，并且繼續(xù)分析該命令數(shù)據(jù)的正確性，分析用戶語(yǔ)音所代表的意圖，將用戶不準(zhǔn)確的語(yǔ)音命令轉(zhuǎn)換為準(zhǔn)確命令信息。全球定位單元(GPSGlobalPosition System)，執(zhí)行從NLU中傳送出的準(zhǔn)確命令信息，數(shù)據(jù)庫(kù)中存儲(chǔ)了相應(yīng)的地圖信息，包括地名、學(xué)校名、醫(yī)院名等信息，同時(shí)系統(tǒng)可以通過(guò)互聯(lián)網(wǎng)連接到服務(wù)中心及時(shí)更新相關(guān)路況信息等文本數(shù)據(jù)，根據(jù)用戶的語(yǔ)音輸入命令在數(shù)據(jù)庫(kù)中查找目的地名等數(shù)據(jù)控制GPS單元進(jìn)行處理，通過(guò)查找數(shù)據(jù)庫(kù)確定現(xiàn)在位置和目標(biāo)地點(diǎn)等操作。人機(jī)交互管理單元(DMDialogue Management)，在取得GPS執(zhí)行結(jié)果后生成與用戶語(yǔ)音命令相對(duì)應(yīng)的交互信息(本實(shí)施例中交互信息為交通指示信息和人機(jī)對(duì)話等文本類型數(shù)據(jù)，也可以為其他類型的數(shù)據(jù))，處理結(jié)束后將交互信息和相關(guān)的交通指示信息傳送給語(yǔ)音轉(zhuǎn)換單元(TTSText To Speech)，由TTS根據(jù)交互信息生成相應(yīng)的語(yǔ)音信息，通過(guò)揚(yáng)聲器進(jìn)行輸出。
如圖2所示為本發(fā)明自動(dòng)語(yǔ)音識(shí)別單元示意圖，通過(guò)前置語(yǔ)音預(yù)處理單元對(duì)用戶輸入的語(yǔ)音進(jìn)行預(yù)處理，提取相應(yīng)的聲波參數(shù)，形成用戶語(yǔ)音輸入部分Y，通過(guò)聲學(xué)模型模塊(AMAcoustic model)對(duì)語(yǔ)音進(jìn)行處理，其中聲學(xué)模型是語(yǔ)音識(shí)別系統(tǒng)的底層模型，是影響識(shí)別系統(tǒng)性能最關(guān)鍵的一部分，聲學(xué)模型模塊的目標(biāo)是提供一種有效的描述方法，計(jì)算語(yǔ)音的特征矢量序列(即圖中經(jīng)過(guò)前置語(yǔ)音預(yù)處理單元生成的特征矢量序列)和每個(gè)發(fā)音樣本(即圖中發(fā)音字典中存儲(chǔ)的發(fā)音樣本)之間的距離，故聲學(xué)模型模塊的設(shè)計(jì)跟語(yǔ)言發(fā)音特點(diǎn)密切相關(guān)。在語(yǔ)音識(shí)別中，首先是模擬的語(yǔ)音信號(hào)在聲學(xué)前端的前置語(yǔ)音預(yù)處理單元被處理為特征矢量序列并過(guò)濾相伴語(yǔ)音數(shù)據(jù)一同傳入的噪音，這些特征矢量序列描述了語(yǔ)音信號(hào)的短時(shí)及普遍變化信息，經(jīng)過(guò)與發(fā)音字典中的發(fā)音樣本比較后，輸出用戶聲學(xué)模型模塊識(shí)別的運(yùn)算結(jié)果P(Y|W)。語(yǔ)言模型模塊(LMLanguage model)用于為所識(shí)別的詞序列提供語(yǔ)法和句法上的約束，尤其重要的是它提供了一種可以根據(jù)所給出詞序列W中的上下文而估計(jì)出某個(gè)詞在此詞序列中出現(xiàn)的概率的機(jī)制。理想的語(yǔ)言模型模塊應(yīng)該包括有關(guān)語(yǔ)言學(xué)上的、在識(shí)別系統(tǒng)中該語(yǔ)言所適用范圍的以及相關(guān)的一些信息，比如用戶輸入“開啟”，語(yǔ)言模型模塊就會(huì)聯(lián)想到以“開啟”為開始的詞組或者句子都有哪些組合的可能，“開啟系統(tǒng)”，“開啟音響”等，這些信息可以被LM利用來(lái)縮減所需要的搜索空間。利用語(yǔ)言模型模塊的運(yùn)算結(jié)果P(W)和聲學(xué)模型模塊的運(yùn)算結(jié)果P(Y|W)計(jì)算出用戶的輸入語(yǔ)音對(duì)應(yīng)的漢字串。
圖3為本發(fā)明人機(jī)交互語(yǔ)音導(dǎo)航的一個(gè)實(shí)施例，首先，語(yǔ)音波形文件作為輸入，例如，用戶可以對(duì)著話筒說(shuō)“打開導(dǎo)航系統(tǒng)”，語(yǔ)音時(shí)域信號(hào)通過(guò)A/D轉(zhuǎn)換器(前置語(yǔ)音預(yù)處理單元)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)，在此基礎(chǔ)上，進(jìn)行特征提取，一般采用Mel頻率倒譜系數(shù)(MFCCMel-Frequency Cepstral Coefficients)為特征的26維或者39維特征參數(shù)來(lái)描述不同音節(jié)或者音素的屬性。將提取的特征與系統(tǒng)訓(xùn)練好的聲學(xué)模型進(jìn)行比較，找到最大(概率最大)可能的狀態(tài)序列。通過(guò)解碼器(Decoder)對(duì)該可能的序列進(jìn)行識(shí)別，語(yǔ)音識(shí)別的解碼算法為Viterbi搜索算法，用戶輸入的語(yǔ)音數(shù)據(jù)在經(jīng)過(guò)語(yǔ)言模型模塊處理后，由解碼器挑選出與用戶語(yǔ)音輸入最佳匹配的“打開導(dǎo)航系統(tǒng)”詞語(yǔ)序列。所有可能詞序列的數(shù)量隨系統(tǒng)所采用模型的數(shù)量、詞匯表大小、所用的語(yǔ)義約束成指數(shù)關(guān)系增加，使得大詞表語(yǔ)音識(shí)別算法對(duì)所需的運(yùn)算速度以及存儲(chǔ)空間提出了近乎苛刻的要求。語(yǔ)言模型(LM)用來(lái)為所識(shí)別的詞序列提供語(yǔ)法和句法上的約束。它提供了一種可以根據(jù)所給出詞序列W中的上下文而估計(jì)出某個(gè)詞在此詞序列中出現(xiàn)的概率的機(jī)制。通過(guò)語(yǔ)言學(xué)模型在包括有關(guān)語(yǔ)言學(xué)上的、在識(shí)別系統(tǒng)中該語(yǔ)言所適用范圍的以及相關(guān)的一些信息的約束，系統(tǒng)最后的輸出為對(duì)應(yīng)的漢字，例如“打開導(dǎo)航系統(tǒng)”，經(jīng)用戶輸入的波形轉(zhuǎn)換為對(duì)應(yīng)的漢字串。自然語(yǔ)言理解單元的作用在于提供一種人機(jī)對(duì)話的自由語(yǔ)法。例如，用戶可以說(shuō)“打開導(dǎo)航系統(tǒng)”或者“我要去清華大學(xué)怎么走”或者其他方式。通過(guò)自然語(yǔ)言理解單元的處理，將用戶不準(zhǔn)確的語(yǔ)音輸入信息進(jìn)一步合理解釋，例如“啟動(dòng)”，可以引導(dǎo)用戶方便、快捷的使用本系統(tǒng)，而不需要用戶機(jī)械的記憶多條關(guān)鍵的控制命令。在系統(tǒng)正確分析出用戶的意圖之后，通過(guò)訪問系統(tǒng)預(yù)先設(shè)定的地圖數(shù)據(jù)庫(kù)，通過(guò)查詢關(guān)鍵字找到用戶所需的詳細(xì)信息，并通過(guò)語(yǔ)音合成出自然的語(yǔ)音信號(hào)播放給用戶，其中也可以加入人機(jī)交互管理單元，根據(jù)用戶輸入的語(yǔ)音信息和GPS產(chǎn)生的處理結(jié)果，生成相應(yīng)的應(yīng)答文本數(shù)據(jù)和交通數(shù)據(jù)通過(guò)TTS單元和用戶實(shí)現(xiàn)實(shí)時(shí)交流。
如圖4所示，為應(yīng)用本發(fā)明人機(jī)交互語(yǔ)音導(dǎo)航系統(tǒng)的另一實(shí)施例。在無(wú)線網(wǎng)絡(luò)和全球定位系統(tǒng)(GPS)之間建立了一種相互協(xié)作的關(guān)系。通過(guò)語(yǔ)音或者按鍵方式觸發(fā)導(dǎo)航系統(tǒng)，將城市區(qū)域地圖從某一個(gè)遠(yuǎn)程服務(wù)器在線傳送至手機(jī)上。通過(guò)GPRS技術(shù)，確定收集持有者當(dāng)前的位置。利用本發(fā)明人機(jī)交互語(yǔ)音技術(shù)或者按鍵技術(shù)，說(shuō)出要去的具體方位進(jìn)行查詢。目前系統(tǒng)的設(shè)計(jì)是考慮了手機(jī)內(nèi)存和計(jì)算能力的限制，每次使用時(shí)需要從遠(yuǎn)程服務(wù)器上動(dòng)態(tài)加載電子地圖，如果手機(jī)的內(nèi)存量擴(kuò)大到一定程度，則無(wú)須使用前動(dòng)態(tài)加載，電子地圖可以駐留在內(nèi)存中，每隔一定時(shí)間刷新一次即可。
本發(fā)明的有益效果在于，語(yǔ)音作為一種替代的輸入方式取代了傳統(tǒng)的按鍵或者觸摸屏，增強(qiáng)了駕駛員在駕駛過(guò)程中的安全性，并且增加了自然語(yǔ)言理解技術(shù)，使人機(jī)對(duì)話更具有人性化。用戶無(wú)需記憶復(fù)雜的命令，所想即所說(shuō)。
以上具體實(shí)施方式
僅用于說(shuō)明本發(fā)明，而非用于限定本發(fā)明。
權(quán)利要求
1.一種人機(jī)交互導(dǎo)航系統(tǒng)，包括音頻輸出單元、全球定位單元，其特征在于還包括音頻輸入單元、自動(dòng)語(yǔ)音識(shí)別單元、數(shù)據(jù)庫(kù)、語(yǔ)音合成單元；其中，所述音頻輸入單元與所述自動(dòng)語(yǔ)音識(shí)別單元相連按；所述自動(dòng)語(yǔ)音識(shí)別單元與所述全球定位單元相連接；所述全球定位單元與所述數(shù)據(jù)庫(kù)相連接；所述全球定位單元與所述語(yǔ)音合成單元相連接；所述語(yǔ)音合成單元與所述音頻輸出單元相連接；由音頻輸入單元采集用戶的音頻輸入數(shù)據(jù)，自動(dòng)語(yǔ)音識(shí)別單元將該音頻輸入數(shù)據(jù)轉(zhuǎn)換成相應(yīng)的指令，全球定位單元執(zhí)行該指令并返回處理結(jié)果數(shù)據(jù)，根據(jù)該處理結(jié)果數(shù)據(jù)搜索數(shù)據(jù)庫(kù)并輸出入機(jī)交互信息，語(yǔ)音合成單元將該人機(jī)交互信息轉(zhuǎn)換成語(yǔ)音通過(guò)音頻輸出單元進(jìn)行輸出。
2.根據(jù)權(quán)利要求1所述的一種人機(jī)交互導(dǎo)航系統(tǒng)，其特征在于還包括自然語(yǔ)音理解單元，所述自然語(yǔ)音理解單元連接于自動(dòng)語(yǔ)音識(shí)別單元與全球定位單元之間，用于進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令，將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
3.根據(jù)權(quán)利要求1所述的一種人機(jī)交互導(dǎo)航系統(tǒng)，其特征在于還包括人機(jī)交互管理單元，所述人機(jī)交互管理單元連接于全球定位單元與語(yǔ)音合成單元之間，根據(jù)語(yǔ)法學(xué)，語(yǔ)義學(xué)和句法知識(shí)，結(jié)合全球定位單元提供的信息，生成符合語(yǔ)法邏輯的人機(jī)交互信息。
4.根據(jù)權(quán)利要求1所述的一種人機(jī)交互導(dǎo)航系統(tǒng)，其特征在于還包括前置語(yǔ)音預(yù)處理單元，所述前置語(yǔ)音預(yù)處理單元連接于音頻輸入單元與自動(dòng)語(yǔ)音識(shí)別單元之間，濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
5.根據(jù)權(quán)利要求1或4所述的一種人機(jī)交互導(dǎo)航系統(tǒng)，其特征在于，所述的音頻輸入單元為麥克陣列。
6.一種人機(jī)交互導(dǎo)航方法，其特征在于包括如下步驟通過(guò)音頻輸入單元接收用戶的音頻輸入數(shù)據(jù)；通過(guò)自動(dòng)語(yǔ)音識(shí)別步驟對(duì)用戶的音頻輸入數(shù)據(jù)進(jìn)行處理，將其轉(zhuǎn)換成相應(yīng)的指令；根據(jù)全球定位單元執(zhí)行指令結(jié)果，搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息；將所述人機(jī)交互信息通過(guò)語(yǔ)音合成單元合成語(yǔ)音并通過(guò)音頻輸出單元輸出。
7.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法，其特征在于，在所述自動(dòng)語(yǔ)音識(shí)別步驟后，還包括一自然語(yǔ)音理解步驟進(jìn)一步提取自動(dòng)語(yǔ)音識(shí)別單元轉(zhuǎn)換的指令，將用戶不準(zhǔn)確的指令識(shí)別為特定的控制指令。
8.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法，其特征在于，所述根據(jù)全球定位單元執(zhí)行指令結(jié)果，搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息的步驟中，還包括一人機(jī)交互管理步驟根據(jù)根據(jù)語(yǔ)法學(xué)，語(yǔ)義學(xué)和句法知識(shí)，結(jié)合全球定位單元提供的信息，生成符合語(yǔ)法邏輯的人機(jī)交互信息。
9.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法，其特征在于，在所述自動(dòng)語(yǔ)音識(shí)別步驟前，還包括一前置語(yǔ)音預(yù)處理步驟，濾除用戶音頻輸入數(shù)據(jù)的干擾噪音并將其轉(zhuǎn)換為數(shù)字信號(hào)。
10.根據(jù)權(quán)利要求6所述的一種人機(jī)交互導(dǎo)航方法，其特征在于，所述的人機(jī)交互信息為文本格式的數(shù)據(jù)。
全文摘要
本發(fā)明涉及人機(jī)交互語(yǔ)音系統(tǒng)，具體的講是一種人機(jī)交互導(dǎo)航系統(tǒng)。為了解決現(xiàn)有導(dǎo)航系統(tǒng)只能通過(guò)手工輸入的缺點(diǎn)，提出了一種人機(jī)交互導(dǎo)航系統(tǒng)及方法，其方法包括如下步驟通過(guò)音頻輸入單元接收用戶的音頻輸入數(shù)據(jù)；通過(guò)自動(dòng)語(yǔ)音識(shí)別步驟對(duì)用戶的音頻輸入數(shù)據(jù)進(jìn)行處理，將其轉(zhuǎn)換成相應(yīng)的指令；根據(jù)全球定位單元執(zhí)行指令結(jié)果搜索數(shù)據(jù)庫(kù)并生成與用戶的人機(jī)交互信息；將所述人機(jī)交互信息通過(guò)語(yǔ)音合成單元輸出。本發(fā)明的有益效果在于，增強(qiáng)了駕駛員在駕駛過(guò)程中的安全性，并且增加了自然語(yǔ)言理解技術(shù)，使人機(jī)對(duì)話更具有人性化，用戶無(wú)需記憶復(fù)雜的命令，所想即所說(shuō)。
文檔編號(hào)G10L15/00GK1959628SQ20051011447
公開日2007年5月9日申請(qǐng)日期2005年10月31日優(yōu)先權(quán)日2005年10月31日
發(fā)明者王珩申請(qǐng)人:西門子(中國(guó))有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王珩
技術(shù)所有人：西門子(中國(guó))有限公司
我是此專利的發(fā)明人

上一篇：節(jié)奏樂器的制作方法
上一篇：具有噪音識(shí)別通話方法變更功能的移動(dòng)終端及其變更方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

下一代人機(jī)交互相關(guān)技術(shù)

人機(jī)交互相關(guān)技術(shù)

人機(jī)交互技術(shù)相關(guān)技術(shù)

人機(jī)交互界面相關(guān)技術(shù)

ios人機(jī)交互指南相關(guān)技術(shù)

人機(jī)交互專業(yè)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種人機(jī)交互導(dǎo)航系統(tǒng)的制作方法