亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于車載應(yīng)用的語音處理系統(tǒng)的制作方法

文檔序號(hào):2836169閱讀:205來源:國(guó)知局
專利名稱:基于車載應(yīng)用的語音處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種基于車載應(yīng)用的語音處理系統(tǒng)。
背景技術(shù)
隨著經(jīng)濟(jì)的發(fā)展及社會(huì)的進(jìn)步,汽車已逐漸成為大眾化的消費(fèi)品。汽車的消費(fèi)群體在不斷擴(kuò)張,消費(fèi)者對(duì)汽車的要求也越來越高。近年來,除經(jīng)濟(jì)性、動(dòng)力性外,在行車過程中的駕駛體驗(yàn)也成為了消費(fèi)者關(guān)注的焦點(diǎn)。車載設(shè)備的技術(shù)發(fā)展也隨之越來越深而被入。目前,汽車上大都搭載有具有例如音樂播放、廣播收聽、電子書閱讀等功能的車載設(shè)備。這些車載設(shè)備在行車過程中為用戶提供了多種娛樂及應(yīng)用功能的體驗(yàn)。而隨著液晶觸摸技術(shù)的發(fā)展,車載設(shè)備的控制面板也從傳統(tǒng)的按鍵面板轉(zhuǎn)換為液晶觸摸顯示屏,這些都進(jìn)一步提高了用戶使用的便利性,并且提供了更為直觀的用戶操作界面。此外,隨著移動(dòng)通信技術(shù)的發(fā)展,車載設(shè)備的技術(shù)也越來越像功能集成化發(fā)展。目前,有些車載設(shè)備已能通過最新的3G網(wǎng)絡(luò)實(shí)現(xiàn)語音通話、網(wǎng)絡(luò)瀏覽等功能,使得車載設(shè)備真正成為了一種能提供全方位功能體驗(yàn)的移動(dòng)應(yīng)用系統(tǒng)。然而,即使由于液晶觸摸技術(shù)的引入,用戶在行車過程中的操作方式仍未發(fā)生改變,任何的功能應(yīng)用仍需用戶通過手動(dòng)輸入操作指令來實(shí)現(xiàn)。對(duì)于一些復(fù)雜的功能應(yīng)用,這無疑增加了操作的復(fù)雜度。此外,行車過程中的安全性歷來是需要考慮的重要因素,頻繁的手動(dòng)操作也必然會(huì)分散駕駛者的注意力,由此為行車過程增加了很多安全隱患。

發(fā)明內(nèi)容
本發(fā)明解決的問題是提供一種基于車載應(yīng)用的語音處理系統(tǒng),簡(jiǎn)化車載功能應(yīng)用的操作復(fù)雜度,并且增強(qiáng)行車的安全性。為了解決上述問題,本發(fā)明提供了一種基于車載應(yīng)用的語音處理系統(tǒng),包括:車載端和服務(wù)器;所述車載端包括車載語音處理裝置和車載應(yīng)用處理裝置;所述車載語音處理裝置接收用戶的語音輸入,并形成語音請(qǐng)求發(fā)送至服務(wù)器;所述服務(wù)器在獲得所述語音請(qǐng)求后,基于所述語音請(qǐng)求形成錄音文件,并將所述錄音文件轉(zhuǎn)換成文本文件進(jìn)行識(shí)別,并基于識(shí)別結(jié)果形成語音特征信息,從所述語音特征信息中識(shí)別出所述語音請(qǐng)求包含的指令信息,并基于所述指令信息向所述應(yīng)用處理裝置提供應(yīng)用處理參數(shù);所述車載應(yīng)用處理裝置基于所述應(yīng)用處理參數(shù)執(zhí)行相應(yīng)車載應(yīng)用。與現(xiàn)有技術(shù)相比,上述方案具有以下優(yōu)點(diǎn):所述基于車載應(yīng)用的語音處理系統(tǒng)在實(shí)現(xiàn)車載功能應(yīng)用時(shí),僅需用戶通過語音方式輸入指令,車載語音處理裝置就會(huì)將所述語音轉(zhuǎn)換成語音請(qǐng)求發(fā)送至服務(wù)器,并由服務(wù)器基于所述語音請(qǐng)求反饋應(yīng)用處理參數(shù),從而車載應(yīng)用處理裝置就可基于所述應(yīng)用處理參數(shù)執(zhí)行相應(yīng)車載應(yīng)用。由于整個(gè)過程中,無需用戶進(jìn)行任何手動(dòng)操作,從而大大降低了用戶在實(shí)現(xiàn)車載應(yīng)用時(shí)的操作復(fù)雜度。此外,由于無需手動(dòng)操作,對(duì)于駕駛者而言,其在駕駛過程中就無需分散注意力進(jìn)行車載應(yīng)用操作,即,駕駛者可以在雙手不離開方向盤、視線不離開路面的情況下控制車載設(shè)備,從而提高駕駛者駕駛集中度,提高駕車安全性以及駕車體驗(yàn)。


圖1是本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的一種實(shí)施方式的結(jié)構(gòu)示意圖;圖2是本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的一種實(shí)施例中車載語音處理裝置的結(jié)構(gòu)不意圖;圖3是本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的一種實(shí)施例中服務(wù)器的結(jié)構(gòu)示意圖;圖4是圖3所示系統(tǒng)中語音轉(zhuǎn)換單元及指令識(shí)別單元的一種細(xì)化結(jié)構(gòu)示意圖;圖5是圖3中語音轉(zhuǎn)換單元的一種實(shí)現(xiàn)結(jié)構(gòu)示意圖;圖6是本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的另一種實(shí)施例中車載端及服務(wù)器的結(jié)構(gòu)不意圖;圖7是本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的又一種實(shí)施例中車載端的結(jié)構(gòu)示意圖。
具體實(shí)施例方式正如背景技術(shù)部分所述,現(xiàn)有車載設(shè)備中,任何的功能應(yīng)用仍需用戶通過手動(dòng)輸入操作指令來實(shí)現(xiàn)。從而,對(duì)于一些復(fù)雜的功能應(yīng)用,這無疑增加了操作的復(fù)雜度。并且,為行車過程增加了很多安全隱患。有鑒于此,本發(fā)明提供的基于車載應(yīng)用的語音處理系統(tǒng)通過對(duì)用戶發(fā)出的語音指令進(jìn)行轉(zhuǎn)換,獲得所述語音指令中包含的指令信息,根據(jù)所述指令信息啟動(dòng)并執(zhí)行應(yīng)用,以實(shí)現(xiàn)通過語音指令進(jìn)行車載應(yīng)用操作。下面結(jié)合附圖進(jìn)一步闡述本發(fā)明的基于車載應(yīng)用的語音處理系統(tǒng)。參照?qǐng)D1所示,本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的一種實(shí)施方式包括:車載端I和服務(wù)器2 ;所述車載端I包括車載語音處理裝置10和車載應(yīng)用處理裝置11 ;所述車載語音處理裝置10接收用戶的語音輸入,并形成語音請(qǐng)求發(fā)送至服務(wù)器2 ;所述服務(wù)器2在獲得所述語音請(qǐng)求后,基于所述語音請(qǐng)求形成錄音文件,并將所述錄音文件轉(zhuǎn)換成文本文件進(jìn)行識(shí)別,并基于識(shí)別結(jié)果形成語音特征信息,從所述語音特征信息中識(shí)別出所述語音請(qǐng)求包含的指令信息,并基于所述指令信息向所述應(yīng)用處理裝置11提供應(yīng)用處理參數(shù);所述車載應(yīng)用處理裝置11基于所述應(yīng)用處理參數(shù)執(zhí)行相應(yīng)車載應(yīng)用。上述實(shí)施方式中,在用戶通過語音方式輸入指令后,車載語音處理裝置10就會(huì)將所述語音轉(zhuǎn)換成語音請(qǐng)求發(fā)送至服務(wù)器2,并由服務(wù)器2基于所述語音請(qǐng)求反饋應(yīng)用處理參數(shù),從而車載應(yīng)用處理裝置11就可基于所述應(yīng)用處理參數(shù)執(zhí)行相應(yīng)車載應(yīng)用。由于整個(gè)過程中,無需用戶進(jìn)行任何手動(dòng)操作,從而大大降低了用戶在實(shí)現(xiàn)車載應(yīng)用時(shí)的操作復(fù)雜度。此外,由于無需手動(dòng)操作,對(duì)于駕駛者而言,其在駕駛過程中就無需分散注意力進(jìn)行車載應(yīng)用操作,即,駕駛者可以在雙手不離開方向盤、視線不離開路面的情況下控制車載設(shè)備,從而提高駕駛者駕駛集中度,提高駕車安全性以及駕車體驗(yàn)。參照?qǐng)D2所示,根據(jù)本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的一種實(shí)施例,所述車載語音處理裝置10可以包括:
語音輸入單元101,用于接收語音;請(qǐng)求處理單元102,在語音輸入單元接收到語音時(shí),基于所述語音形成語音請(qǐng)求發(fā)送至服務(wù)器。其中,所述語音輸入單元101可以為麥克風(fēng)。參照?qǐng)D3所示,根據(jù)本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的一種實(shí)施例,所述服務(wù)器2可以包括:語音轉(zhuǎn)換單元20,在獲得所述車載語音處理裝置10發(fā)送的所述語音請(qǐng)求后,基于所述語音請(qǐng)求形成錄音文件,并將所述錄音文件轉(zhuǎn)換成文本文件進(jìn)行識(shí)別,并基于識(shí)別結(jié)果形成語音特征信息;存儲(chǔ)單元22,用于存儲(chǔ)各種車載應(yīng)用的場(chǎng)景所對(duì)應(yīng)的場(chǎng)景指令文本,以及各種場(chǎng)景下的應(yīng)用操作所對(duì)應(yīng)的操作指令文本;指令識(shí)別單元21,從存儲(chǔ)單元22中搜索與語音轉(zhuǎn)換單元20轉(zhuǎn)換的語音特征信息匹配的場(chǎng)景指令文本,在搜索到匹配的場(chǎng)景指令文本時(shí),形成對(duì)應(yīng)的場(chǎng)景啟動(dòng)指令;以及從存儲(chǔ)單元22中搜索與語音轉(zhuǎn)換單元20轉(zhuǎn)換的語音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本時(shí),形成對(duì)應(yīng)的應(yīng)用操作指令;預(yù)處理單元23,在獲得對(duì)應(yīng)的場(chǎng)景啟動(dòng)指令后啟動(dòng),并在獲得對(duì)應(yīng)的應(yīng)用操作指令后,執(zhí)行預(yù)處理操作,并將預(yù)處理操作形成的應(yīng)用處理參數(shù)發(fā)送至所述車載應(yīng)用處理裝置11。參照?qǐng)D4所示,所述語音轉(zhuǎn)換單元20可以包括:文本識(shí)別庫201,用于存儲(chǔ)基準(zhǔn)詞條;錄音單元202,用于接收所述車載端發(fā)送的語音請(qǐng)求,并形成錄音文件;語音識(shí)別單元203,將所述錄音文件轉(zhuǎn)換成文本文件,并將所述文本文件中的詞條與所述文本識(shí)別庫201中的基準(zhǔn)詞條進(jìn)行比對(duì),在從所述文本識(shí)別庫201中獲得匹配的基準(zhǔn)詞條時(shí),基于所述匹配的基準(zhǔn)詞條形成語音特征信息。所述指令識(shí)別單元21可以包括:場(chǎng)景識(shí)別單元211,從存儲(chǔ)單元22中搜索與語音轉(zhuǎn)換單元20轉(zhuǎn)換的語音特征信息匹配的場(chǎng)景指令文本,在搜索到匹配的場(chǎng)景指令文本時(shí),形成對(duì)應(yīng)的場(chǎng)景啟動(dòng)指令;應(yīng)用操作識(shí)別單元212,從存儲(chǔ)單元22中搜索與語音轉(zhuǎn)換單元20轉(zhuǎn)換的語音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本時(shí),形成對(duì)應(yīng)的應(yīng)用操作指令。結(jié)合圖4和圖5所示,所述語音識(shí)別單元203可以包括:文本識(shí)別單元203a、詞條比對(duì)單元203b及語音特征信息形成單元203c ;所述文本識(shí)別單元203a,用于將所述錄音文件轉(zhuǎn)換成文本文件;所述詞條比對(duì)單元203b將所述文本文件中的詞條與所述文本識(shí)別庫201中的基準(zhǔn)詞條進(jìn)行比對(duì),獲得相應(yīng)的比對(duì)結(jié)果;所述語音特征信息形成單元203c,在比對(duì)結(jié)果的置信度大于預(yù)設(shè)置信度時(shí),確定所述文本文件中的詞條與所述文本識(shí)別庫201中的相應(yīng)基準(zhǔn)詞條匹配,并基于所述匹配的基準(zhǔn)詞條形成語音特征信息。所述車載應(yīng)用可以包括:短信應(yīng)用、網(wǎng)絡(luò)音樂應(yīng)用及導(dǎo)航應(yīng)用。以網(wǎng)絡(luò)音樂應(yīng)用為例,駕駛者可以通過麥克風(fēng)輸入語音指令“播放網(wǎng)絡(luò)音樂”。所述請(qǐng)求處理單元102會(huì)基于所述“播放網(wǎng)絡(luò)音樂”的語音指令形成語音請(qǐng)求發(fā)送至語音轉(zhuǎn)換單元20。所述錄音單元202會(huì)將所述語音請(qǐng)求錄音,并形成錄音文件后發(fā)送至所述文本識(shí)別單元203a。所述文本識(shí)別單元203a在獲得所述錄音文件后,會(huì)識(shí)別所述錄音文件中語音對(duì)應(yīng)的文本,從而將所述錄音文件轉(zhuǎn)換成文本文件。例如,所述文本識(shí)別單元203a會(huì)將所述錄音文件轉(zhuǎn)換成內(nèi)容為“播放網(wǎng)絡(luò)音樂”的文本文件。通常,為了增加轉(zhuǎn)換的準(zhǔn)確性,還會(huì)對(duì)所述錄音文件先進(jìn)行去噪處理,以濾除人聲音頻率外的其他頻段的聲音波形。所述文本識(shí)別庫201可以預(yù)先存入一些常用的詞條作為基準(zhǔn)詞條。例如,可以存入日常用語、包括車載應(yīng)用操作的一些會(huì)話用語所對(duì)應(yīng)的詞條。這些日常用語及會(huì)話用語所對(duì)應(yīng)的詞條通常以各自獨(dú)立的文本文件存入所述文本識(shí)別庫201,以方便后續(xù)比對(duì)時(shí)分別調(diào)用。所述詞條比對(duì)單元203b在從所述文本識(shí)別單元203a處獲得轉(zhuǎn)換的文本文件后,就會(huì)將所述文本文件中的詞條與所述文本識(shí)別庫201中的基準(zhǔn)詞條進(jìn)行比對(duì),并且在比對(duì)后將比對(duì)結(jié)果發(fā)送至所述語音特征信息形成單元203c。例如,所述詞條比對(duì)單元203b會(huì)將
所述文本識(shí)別庫201中與車載應(yīng)用操作的會(huì)話用語所對(duì)應(yīng)的文本文件--打開,并將其中
的基準(zhǔn)詞條與所述轉(zhuǎn)換的文本文件中的詞條一一進(jìn)行比對(duì),獲得多個(gè)比對(duì)結(jié)果。所述比對(duì)結(jié)果中包含所轉(zhuǎn)換的文本文件中的詞條與所述文本識(shí)別庫201中的基準(zhǔn)詞條匹配的置信度。所述語音特征信息形成單元203c在獲得所述比對(duì)結(jié)果后,會(huì)解析所述比對(duì)結(jié)果獲得所述置信度,在比對(duì)結(jié)果的置信度大于預(yù)設(shè)置信度時(shí),確定轉(zhuǎn)換的文本文件中的詞條與所述文本識(shí)別庫201中的相應(yīng)基準(zhǔn)詞條匹配。例如,當(dāng)轉(zhuǎn)換的文本文件中的詞條與所述文本識(shí)別庫201中“播放網(wǎng)絡(luò)音樂”這個(gè)基準(zhǔn)詞條的比對(duì)結(jié)果對(duì)應(yīng)的置信度都大于預(yù)設(shè)置信度時(shí),所述語音特征信息形成單元203c就會(huì)認(rèn)為轉(zhuǎn)換的文本文件中的詞條與“播放網(wǎng)絡(luò)音樂”這個(gè)基準(zhǔn)詞條匹配,則所 述語音特征信息形成單元203c可就此確定轉(zhuǎn)換的文本文件對(duì)應(yīng)的語音請(qǐng)求中包含“播放網(wǎng)絡(luò)音樂”的詞條,則所述語音特征信息形成單元203c會(huì)將所述詞條“播放網(wǎng)絡(luò)音樂”轉(zhuǎn)換為包括網(wǎng)絡(luò)音樂的語音特征信息。接下來,所述場(chǎng)景識(shí)別單元211和應(yīng)用操作識(shí)別單元212就會(huì)對(duì)所述語音識(shí)別單元202轉(zhuǎn)換的語音特征信息進(jìn)行識(shí)別。類似于語音特征庫201,存儲(chǔ)單元22中也預(yù)先存入了對(duì)應(yīng)各種車載應(yīng)用場(chǎng)景的場(chǎng)景指令文本,以及對(duì)應(yīng)所述車載應(yīng)用場(chǎng)景下各種應(yīng)用操作的操作指令文本。所述場(chǎng)景識(shí)別單元211根據(jù)所述網(wǎng)絡(luò)音樂的語音特征信息形成網(wǎng)絡(luò)音樂應(yīng)用場(chǎng)景啟動(dòng)指令。所述應(yīng)用操作識(shí)別單元212根據(jù)所述網(wǎng)絡(luò)音樂的語音特征信息形成打開某一網(wǎng)絡(luò)電臺(tái)的電臺(tái)開啟指令。然后,在獲得網(wǎng)絡(luò)音樂應(yīng)用場(chǎng)景啟動(dòng)指令,作為預(yù)處理單元的網(wǎng)絡(luò)電臺(tái)搜索單元啟動(dòng),并且依據(jù)打開某一網(wǎng)絡(luò)電臺(tái)的電臺(tái)開啟指令搜索相應(yīng)的網(wǎng)絡(luò)電臺(tái),并且獲取所述網(wǎng)絡(luò)電臺(tái)的鏈接信息,將所述鏈接信息作為網(wǎng)絡(luò)音樂應(yīng)用的應(yīng)用處理參數(shù)發(fā)送至車載應(yīng)用處理裝置11。而所述車載應(yīng)用處理裝置11在獲得所述網(wǎng)絡(luò)電臺(tái)的鏈接信息后,就會(huì)依據(jù)所述鏈接信息鏈接至所述網(wǎng)絡(luò)電臺(tái),獲取所述網(wǎng)絡(luò)電臺(tái)的頁面文件,以向用戶呈現(xiàn)所述網(wǎng)絡(luò)電臺(tái)的界面,并向用戶播放網(wǎng)絡(luò)電臺(tái)的歌曲。在其他應(yīng)用場(chǎng)景下,所述基于車載應(yīng)用的語音處理系統(tǒng)也可進(jìn)行類似的處理,通過識(shí)別出用戶語音中包含的指令類型及指令內(nèi)容,以啟動(dòng)并執(zhí)行相應(yīng)的車載應(yīng)用。參照?qǐng)D6所示,根據(jù)本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的另一種實(shí)施例,所述服務(wù)器2除包括上述實(shí)施例的各部件外,還可以包括提示信息形成單元24,在指令識(shí)別單元21識(shí)別出所述場(chǎng)景指令文本或所述操作指令文本時(shí),形成對(duì)應(yīng)所述場(chǎng)景指令文本或所述操作指令文本的提示信息,并發(fā)送至所述車載端。所述車載端還包括提示裝置12,在獲得所述提示信息后,向用戶進(jìn)行提示。所述提示裝置12可以為語音播報(bào)單元,例如車載音響。仍以前述“播放網(wǎng)絡(luò)音樂”的語音指令為例,則在指令識(shí)別單元21形成網(wǎng)絡(luò)音樂應(yīng)用場(chǎng)景啟動(dòng)指令及電臺(tái)開啟指令時(shí),所述提示信息形成單元24就形成提示信息:正在打開網(wǎng)絡(luò)電臺(tái)。而所述提示裝置12在獲得所述提示信息后,就通過語音播放的方式向用戶進(jìn)行提示。由于用戶可以通過所述提示信息獲知應(yīng)用操作的執(zhí)行過程,因而提高了用戶的使用體驗(yàn)。所述提示裝置12也可以為顯示單元,例如液晶觸摸屏。仍以前述“播放網(wǎng)絡(luò)音樂”的語音指令為例,則在指令識(shí)別單元21形成網(wǎng)絡(luò)音樂應(yīng)用場(chǎng)景啟動(dòng)指令及電臺(tái)開啟指令時(shí),所述提示信息形成單元24就形成提示信息:正在打開網(wǎng)絡(luò)電臺(tái)。而所述提示裝置12在獲得所述提示信息后,就通過顯示的方式向用戶進(jìn)行提示。。同樣地,由于用戶可以通過所述提示信息獲知應(yīng)用操作的執(zhí)行過程,因而提高了用戶的使用體驗(yàn)。此外,所述服務(wù)器還可以包括應(yīng)答信息存儲(chǔ)單元25,所述提示信息形成單元24還根據(jù)用戶基于所述提示信息反饋的確認(rèn)信息,從所述應(yīng)答信息存儲(chǔ)單元25中搜索與所述場(chǎng)景指令文本或所述操作指令文本對(duì)應(yīng)的應(yīng)答信息,并發(fā)送至所述車載端。例如,用戶基于前述提供的提示信息:正在打開網(wǎng)絡(luò)電臺(tái),通過麥克風(fēng)發(fā)送“確認(rèn)”的語音后,所述提示信息形成單元24就會(huì)從所述應(yīng)答信息存儲(chǔ)單元25中搜索與網(wǎng)絡(luò)音樂應(yīng)用場(chǎng)景對(duì)應(yīng)的應(yīng)答信息,例如,所述應(yīng)答信息可以為:很高興為您提供網(wǎng)絡(luò)音樂應(yīng)用服務(wù)。通過所述應(yīng)答信息,可以增強(qiáng)用戶與車載端的互動(dòng),進(jìn)一步提高用戶的使用體驗(yàn)。對(duì)應(yīng)地,在所述指令識(shí)別單元21未能搜索到匹配的場(chǎng)景指令文本或操作指令文本時(shí),所述提示信息形成單元24也可以向用戶提示識(shí)別失敗的信息??梢缘弥?,所述應(yīng)答信息及所述識(shí)別失敗的信息也可以通過顯示或語音播報(bào)的方式呈現(xiàn)給用戶。參照?qǐng)D7所示,在本發(fā)明基于車載應(yīng)用的語音處理系統(tǒng)的其他實(shí)施例中,所述車載端還可以包括觸發(fā)裝置13,用于基于用戶的請(qǐng)求啟動(dòng)所述車載語音處理裝置10。例如,設(shè)置觸發(fā)按鍵,當(dāng)用戶按下所述觸發(fā)按鍵時(shí),啟動(dòng)所述車載語音處理裝置10。此外,所述車載端還可以包括計(jì)時(shí)裝置14,在所述車載語音處理裝置10啟動(dòng)后計(jì)時(shí),在計(jì)時(shí)時(shí)間達(dá)到時(shí)間閾值且此期間車載語音處理裝置未接收到語音時(shí),關(guān)閉所述車載語音處理裝置。由此,在所述車載語音處理裝置啟動(dòng)后,但用戶長(zhǎng)時(shí)間未發(fā)出語音指令時(shí),可以通過關(guān)閉所述車載語音處理裝置以節(jié)省能源消耗,節(jié)省了使用成本。雖然本發(fā)明已以較佳實(shí)施例披露如上,但本發(fā)明并非限定于此。任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動(dòng)與修改,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求所限定的范圍為準(zhǔn)。
權(quán)利要求
1.一種基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,包括:車載端和服務(wù)器;所述車載端包括車載語音處理裝置和車載應(yīng)用處理裝置;所述車載語音處理裝置接收用戶的語音輸入,并形成語音請(qǐng)求發(fā)送至服務(wù)器;所述服務(wù)器在獲得所述語音請(qǐng)求后,基于所述語音請(qǐng)求形成錄音文件,并將所述錄音文件轉(zhuǎn)換成文本文件進(jìn)行識(shí)別,并基于識(shí)別結(jié)果形成語音特征信息,從所述語音特征信息中識(shí)別出所述語音請(qǐng)求包含的指令信息,并基于所述指令信息向所述應(yīng)用處理裝置提供應(yīng)用處理參數(shù);所述車載應(yīng)用處理裝置基于所述應(yīng)用處理參數(shù)執(zhí)行相應(yīng)車載應(yīng)用。
2.如權(quán)利要求1所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述車載語音處理裝置包括: 語音輸入單元,用于接收語音; 請(qǐng)求處理單元,在語音輸入單元接收到語音時(shí),基于所述語音形成語音請(qǐng)求發(fā)送至服務(wù)器。
3.如權(quán)利要求2所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述語音輸入單元為麥克風(fēng)。
4.如權(quán)利要求1所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述服務(wù)器包括: 語音轉(zhuǎn)換單元,在獲得所述車載語音處理裝置發(fā)送的所述語音請(qǐng)求后,基于所述語音請(qǐng)求形成錄音文件,并將所述錄音文件轉(zhuǎn)換成文本文件進(jìn)行識(shí)別,并基于識(shí)別結(jié)果形成語首特征 目息; 存儲(chǔ)單元,用于存儲(chǔ)各種車載應(yīng)用的場(chǎng)景所對(duì)應(yīng)的場(chǎng)景指令文本,以及各種場(chǎng)景下的應(yīng)用操作所對(duì)應(yīng)的操作指令文本; 指令識(shí)別單元,從存儲(chǔ)單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的場(chǎng)景指令文本,在搜索到匹配的場(chǎng)景指令文本時(shí),形成對(duì)應(yīng)的場(chǎng)景啟動(dòng)指令;以及從存儲(chǔ)單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本時(shí),形成對(duì)應(yīng)的應(yīng)用操作指令; 預(yù)處理單元,在獲得對(duì)應(yīng)的場(chǎng)景啟動(dòng)指令后啟動(dòng),并在獲得對(duì)應(yīng)的應(yīng)用操作指令后,執(zhí)行預(yù)處理操作,并將預(yù)處理操作形成的應(yīng)用處理參數(shù)發(fā)送至所述車載應(yīng)用處理裝置。
5.如權(quán)利要求4所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述語音轉(zhuǎn)換單元包括: 文本識(shí)別庫,用于存儲(chǔ)基準(zhǔn)詞條; 錄音單元,用于接收所述車載端發(fā)送的語音請(qǐng)求,并形成錄音文件; 語音識(shí)別單元,將所述錄音文件轉(zhuǎn)換成文本文件,并將所述文本文件中的詞條與所述文本識(shí)別庫中的基準(zhǔn)詞條進(jìn)行比對(duì),在從所述文本識(shí)別庫中獲得匹配的基準(zhǔn)詞條時(shí),基于所述匹配的基準(zhǔn)詞條形成語音特征信息。
6.如權(quán)利要求5所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述語音識(shí)別單元包括:文本識(shí)別單元、詞條比對(duì)單元及語音特征信息形成單元; 所述文本識(shí)別單元,用于將所述錄音文件轉(zhuǎn)換成文本文件; 所述詞條比對(duì)單元將所述文本文件中的詞條與所述文本識(shí)別庫中的基準(zhǔn)詞條進(jìn)行比對(duì),獲得相應(yīng)的比對(duì)結(jié)果; 所述語音特征信息形成單元,在比對(duì)結(jié)果的置信度大于預(yù)設(shè)置信度時(shí),確定所述文本文件中的詞條與所述文本識(shí)別庫中的相應(yīng)基準(zhǔn)詞條匹配,并基于所述匹配的基準(zhǔn)詞條形成語音特征信息。
7.如權(quán)利要求4所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述指令識(shí)別單元包括:場(chǎng)景識(shí)別單元及應(yīng)用操作識(shí)別單元; 場(chǎng)景識(shí)別單元,從存儲(chǔ)單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的場(chǎng)景指令文本,在搜索到匹配的場(chǎng)景指令文本時(shí),形成對(duì)應(yīng)的場(chǎng)景啟動(dòng)指令; 應(yīng)用操作識(shí)別單元,從存儲(chǔ)單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本時(shí),形成對(duì)應(yīng)的應(yīng)用操作指令。
8.如權(quán)利要求4所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述服務(wù)器還包括提示信息形成單元,在指令識(shí)別單元識(shí)別出所述場(chǎng)景指令文本或所述操作指令文本時(shí),形成對(duì)應(yīng)所述場(chǎng)景指令文本或所述操作指令文本的提示信息,并發(fā)送至所述車載端; 所述車載端還包括提示裝置,在獲得所述提示信息后,向用戶進(jìn)行提示。
9.如權(quán)利要求8所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述服務(wù)器還包括應(yīng)答信息存儲(chǔ)單元,所述提示信息形成單元還根據(jù)用戶基于所述提示信息反饋的確認(rèn)信息,從所述應(yīng)答信息存儲(chǔ)單元中搜索與所述場(chǎng)景指令文本或所述操作指令文本對(duì)應(yīng)的應(yīng)答信息,并發(fā)送至所述車載端; 所述提示裝置在獲得所述應(yīng)答信息后,向用戶進(jìn)行提示。
10.如權(quán)利要求8所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述提示信息形成單元在指令識(shí)別單元未能搜索到匹配的場(chǎng)景指令文本或操作指令文本時(shí),形成識(shí)別失敗的提示信息,并發(fā)送至所述車載端; 所述提示裝置在獲得所 述識(shí)別失敗的提示信息后,向用戶進(jìn)行提示。
11.如權(quán)利要求8至10任一項(xiàng)所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述提示裝置為語音播報(bào)單元。
12.如權(quán)利要求8至10任一項(xiàng)所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述提示裝置為顯示單元。
13.如權(quán)利要求1所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述車載端還包括觸發(fā)裝置,用于基于用戶的請(qǐng)求啟動(dòng)所述車載語音處理裝置。
14.如權(quán)利要求13所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述觸發(fā)裝置為觸發(fā)按鍵。
15.如權(quán)利要求13所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述車載端還包括計(jì)時(shí)裝置,在所述車載語音處理裝置啟動(dòng)后計(jì)時(shí),在計(jì)時(shí)時(shí)間達(dá)到時(shí)間閾值且此期間車載語音處理裝置未接收到語音時(shí),關(guān)閉所述車載語音處理裝置。
16.如權(quán)利要求1所述的基于車載應(yīng)用的語音處理系統(tǒng),其特征在于,所述車載應(yīng)用包括:短信應(yīng)用、網(wǎng)絡(luò)音樂應(yīng)用及導(dǎo)航應(yīng)用。
全文摘要
一種基于車載應(yīng)用的語音處理系統(tǒng),包括車載端和服務(wù)器;所述車載端包括車載語音處理裝置和車載應(yīng)用處理裝置;所述車載語音處理裝置接收用戶的語音輸入,并形成語音請(qǐng)求發(fā)送至服務(wù)器;所述服務(wù)器在獲得所述語音請(qǐng)求后,基于所述語音請(qǐng)求形成錄音文件,并將所述錄音文件轉(zhuǎn)換成文本文件進(jìn)行識(shí)別,并基于識(shí)別結(jié)果形成語音特征信息,從所述語音特征信息中識(shí)別出所述語音請(qǐng)求包含的指令信息,并基于所述指令信息向所述應(yīng)用處理裝置提供應(yīng)用處理參數(shù);所述車載應(yīng)用處理裝置基于所述應(yīng)用處理參數(shù)執(zhí)行相應(yīng)車載應(yīng)用。所述基于車載應(yīng)用的語音處理系統(tǒng)簡(jiǎn)化了用戶操作,提高了行車安全性。
文檔編號(hào)G10L15/26GK103187059SQ20111045000
公開日2013年7月3日 申請(qǐng)日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者楊建 , 張曉海 申請(qǐng)人:上海博泰悅臻電子設(shè)備制造有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1