基于深度的語境識別的制作方法_4

文檔序號：8303463閱讀：來源：國知局

，命令處理系統(tǒng)200可增加、修改或請求信息用于生成設(shè)備命令。
[0078]如圖5中說明的過程及其序列僅是說明性的。可以對過程和/或序列做出各種修改。例如，可執(zhí)行518語音識別以生成一組候選言語命令。接著，可根據(jù)駕駛員手勢的確定510從候選言語命令組選擇最終的言語命令。此外，可以并行執(zhí)行一個或多個過程。例如，在深度相機222處生成506深度影像可與生成516音頻信號并行執(zhí)行。
[0079]可替代實施例
[0080]在一種或多種實施例中，使用一個或多個相機以提高手勢檢測的準確性。相機也可拍攝彩色影像。彩色影像可檢測代表駕駛員手的皮膚色調(diào)。通過關(guān)聯(lián)彩色影像與深度影像，手或前臂的位置可以檢測得更加準確。此外，可以在車輛100中棚頂或別處的不同位置定位兩個或更多個相機以補足或替代在一個深度相機處所拍攝的深度影像。
[0081]在一種或多種實施例中，命令處理系統(tǒng)200的一個或多個組件可以通過與安裝在車輛100中的命令處理系統(tǒng)200通信的遠程服務器體現(xiàn)。例如，語音識別模塊256可體現(xiàn)在與安裝在車輛100中的命令處理系統(tǒng)200無線通信的遠程服務器中。
[0082]在一種或多種實施例中，命令處理系統(tǒng)200用于除了車輛的運輸裝置中。命令處理系統(tǒng)200可用于例如飛機或摩托車中。
[0083]盡管上面描述了幾種實施例，但是可以在本發(fā)明的范圍內(nèi)做出各種修改。因此，本發(fā)明的公開內(nèi)容是要說明而非限制所附權(quán)利要求書所述的本發(fā)明的范圍。
【主權(quán)項】
1.一種識別言語命令的計算機執(zhí)行方法，其包括: 通過放置在車輛中的深度相機拍攝至少一個深度影像，各個深度影像覆蓋用戶的至少部分并且包括表示從深度相機到用戶的所述至少部分的距離的像素；根據(jù)所拍攝的深度影像識別用戶的姿勢或手勢；以及根據(jù)所識別的姿勢或手勢生成手勢信息；根據(jù)手勢信息在有可能被用戶定為目標用于操作的多個設(shè)備中確定一個或多個設(shè)備; 選擇與被確定為目標的一個或多個設(shè)備相關(guān)聯(lián)的多個言語命令；在用戶做出姿勢或手勢的時候接收包括用戶的話語的音頻信號；以及通過使用所選擇的多個言語命令對音頻信號執(zhí)行語音識別來確定用于操作一個或多個設(shè)備的設(shè)備命令。
2.根據(jù)權(quán)利要求1所述的方法，其中，用戶的所述至少部分包括用戶的手或前臂。
3.根據(jù)權(quán)利要求1所述的方法，其中，深度相機安裝在車輛中的頭頂控制臺中，深度相機俯瞰用戶。
4.根據(jù)權(quán)利要求1所述的方法，其中，多個設(shè)備包括車輛中的至少導航系統(tǒng)和娛樂系統(tǒng)。
5.根據(jù)權(quán)利要求1所述的方法，其中，手勢信息表示用戶的手或前臂是否定位在自深度相機的距離之內(nèi)或者是否定位在自深度相機的所述距離之外，并且其中，響應于表示手或前臂定位在所述距離內(nèi)的手勢信息選擇第一組言語命令，并且其中，響應于表示手或前臂定位在所述距離外的手勢信息選擇第二組言語命令。
6.根據(jù)權(quán)利要求5所述的方法，其中，第一組言語命令與在車輛中執(zhí)行導航操作相關(guān)聯(lián)。
7.根據(jù)權(quán)利要求6所述的方法，其中，第一組言語命令包括用于識別或設(shè)置用于導航操作的興趣點的命令。
8.根據(jù)權(quán)利要求6所述的方法，其中，第二組言語命令與操作娛樂系統(tǒng)、空調(diào)控制系統(tǒng)或診斷系統(tǒng)相關(guān)聯(lián)。
9.一種用于識別言語命令的命令處理系統(tǒng)，其包括: 深度相機，其放置在車輛中并且能夠通過深度相機拍攝至少一個深度影像，各個深度影像覆蓋用戶的至少部分并且包括表示從深度相機到用戶的所述至少部分的距離的像素；以及手勢識別模塊，其結(jié)合至深度相機，手勢識別模塊能夠根據(jù)所拍攝的深度影像識別用戶的姿勢或手勢并且根據(jù)所識別的姿勢或手勢生成手勢信息；手勢識別接口，其能夠根據(jù)所識別的姿勢或手勢生成手勢信息；以及命令提取模塊，其能夠: 根據(jù)所接收的手勢信息在有可能被用戶定為目標用于操作的多個設(shè)備中確定一個或多個設(shè)備；選擇與被確定作為目標的一個或多個設(shè)備相關(guān)聯(lián)的多個言語命令；在用戶做出姿勢或手勢的時候接收包括用戶的話語的音頻信號；以及通過使用所選擇的多個言語命令對音頻信號執(zhí)行語音識別來確定用于操作一個或多個設(shè)備的設(shè)備命令。
10.根據(jù)權(quán)利要求9所述的命令處理系統(tǒng)，其中，用戶的所述至少部分包括用戶的手或前臂。
11.根據(jù)權(quán)利要求9所述的命令處理系統(tǒng)，其中，深度相機安裝在車輛中的頭頂控制臺中俯瞰用戶。
12.根據(jù)權(quán)利要求11所述的命令處理系統(tǒng)，其中，深度相機包括立體視覺相機，其輸送所拍攝的影像用于處理成至少一個深度影像。
13.根據(jù)權(quán)利要求9所述的命令處理系統(tǒng)，其中，所述多個設(shè)備包括車輛中的至少導航系統(tǒng)和娛樂系統(tǒng)。
14.根據(jù)權(quán)利要求9所述的命令處理系統(tǒng)，其中，手勢信息表示用戶的手或前臂是否定位在自深度相機的距離之內(nèi)或者是否定位在自深度相機的所述距離之外，并且其中，命令提取模塊響應于表示手或前臂定位在所述距離內(nèi)的手勢信息選擇第一組言語命令，并且響應于表示手或前臂定位在所述距離外的手勢信息選擇第二組言語命令。
15.根據(jù)權(quán)利要求14所述的命令處理系統(tǒng)，其中，第一組言語命令與在車輛中執(zhí)行導航操作相關(guān)聯(lián)。
16.根據(jù)權(quán)利要求14所述的命令處理系統(tǒng)，其中，第一組言語命令包括用于識別或設(shè)置用于導航操作的興趣點的命令。
17.根據(jù)權(quán)利要求16所述的命令處理系統(tǒng)，其中，第二組言語命令與操作娛樂系統(tǒng)、空調(diào)控制系統(tǒng)或診斷系統(tǒng)相關(guān)聯(lián)。
18.一種用于識別言語命令的永久性計算機可讀存儲介質(zhì)，當執(zhí)行時，構(gòu)造用來存儲指令的計算機可讀存儲介質(zhì)使處理器: 通過放置在車輛中的深度相機拍攝至少一個深度影像，各個深度影像覆蓋用戶的至少部分并且包括表示從深度相機到用戶的所述至少部分的距離的像素；根據(jù)所拍攝的深度影像識別用戶的姿勢或手勢；根據(jù)所識別的姿勢或手勢生成手勢信息；根據(jù)接收的手勢信息在有可能被用戶定為目標用于操作的多個設(shè)備中確定一個或多個設(shè)備；選擇與被確定為目標的一個或多個設(shè)備相關(guān)聯(lián)的多個言語命令；在用戶做出姿勢或手勢的時候接收包括用戶的話語的音頻信號；以及通過使用所選擇的多個言語命令對音頻信號執(zhí)行語音識別來確定用于操作一個或多個設(shè)備的設(shè)備命令。
19.根據(jù)權(quán)利要求18所述的計算機可讀存儲介質(zhì)，其中，用戶的所述至少部分包括用戶的手或前臂。
20.根據(jù)權(quán)利要求18所述的計算機可讀存儲介質(zhì)，其中，深度相機安裝在車輛中的頭頂控制臺中俯瞰用戶。
21.根據(jù)權(quán)利要求18所述的計算機可讀存儲介質(zhì)，其中，所述多個設(shè)備包括車輛中的至少導航系統(tǒng)和娛樂系統(tǒng)。
【專利摘要】一種基于從深度相機所檢測的用戶動作，用于選擇或修剪與語音識別關(guān)聯(lián)的適用言語命令的方法或系統(tǒng)。根據(jù)用戶的手或手臂的深度，確定言語命令的語境并選擇與所確定的語境對應的言語命令。然后使用所選擇的言語命令對音頻信號執(zhí)行語音識別。通過使用一組合適的言語命令，語音識別的準確性得到提高。
【IPC分類】G06K9-00
【公開號】CN104620257
【申請?zhí)枴緾N201380030981
【發(fā)明人】T·E·多克爾, J·霍爾梅斯, J·克拉斯特, S·山本, P·瓦格赫菲納扎里
【申請人】本田技研工業(yè)株式會社, 艾吉3技術(shù)有限責任公司
【公開日】2015年5月13日
【申請日】2013年4月15日
【公告號】EP2862125A1, US9092394, US20130339027, WO2013188002A1

完整全部詳細技術(shù)資料下載

當前第4頁1 2 3 4

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

深度人臉識別相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于深度的語境識別的制作方法_4