亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

遙控系統(tǒng)和裝置制造方法

文檔序號:6537311閱讀:155來源:國知局
遙控系統(tǒng)和裝置制造方法
【專利摘要】本發(fā)明是關于提供與用戶的語音命令相對應的命令信號的系統(tǒng)、裝置和方法。本發(fā)明包含音頻采集裝置,所述裝置用于接收包含命令的可聽信號并且將電信號提供給處理器。所述處理器基于所述多個命令的命令之間的聽覺關聯(lián)根據(jù)預定標準生成命令。視覺顯示裝置顯示了多個標志,并且一個用戶可操作的選擇和輸入裝置通過對應于命令的標志的選擇提供了所述命令的用戶選擇。
【專利說明】遙控系統(tǒng)和裝置
【技術領域】
[0001]本發(fā)明大體上涉及遙控系統(tǒng),且更具體而言,涉及用于數(shù)字裝置的操作的語音控制系統(tǒng)和方法。
【背景技術】
[0002]隨著并入軟件和硬件的數(shù)字裝置在現(xiàn)代社會變得越來越流行,用戶和這些裝置的軟件和硬件之間的互動變得越來越關鍵。這些數(shù)字裝置的范圍從傳統(tǒng)的臺式計算機、筆記本電腦、電信裝置、“智能手機”和平板計算機以及智能電視到便攜式數(shù)字音樂播放器以及游戲控制臺。
[0003]通過鼠標或鍵盤、手持式控制器或小鍵盤(或更加近期地)通過與觸摸屏接觸的操作的電-機械輸入是常見的方法,其中用戶的意圖由用戶傳達給在所述裝置上操作的軟件和硬件。在一些方面改變裝置的狀態(tài)以執(zhí)行命令、顯示按鍵,或改變執(zhí)行裝置中的程序狀態(tài)的用戶的意圖是通過此輸入方法促進的。
[0004]然而,對于某些用戶或者裝置而言通過基于接觸的方法向數(shù)字裝置發(fā)布命令可能并非是適當?shù)幕蛴行У摹A硗?,輸入的物理控制可以干擾裝置的用戶體驗。作為基于物理接觸的輸入設置的一個替代方案,或者與上述設置一起,語音控制技術已經(jīng)得到了利用?;谌?裝置互動方法的大多數(shù)語音控制常見的一個主要問題在于對用戶提供的輸入進行精確處理,以確定用于在所述數(shù)字裝置上執(zhí)行的對應的命令。
[0005]通常,不同用戶對詞的發(fā)音是不同的;并且即使是相同用戶對詞的發(fā)音也并不是隨著時間始終一致的。用戶語音中不同的因素的個體變化包含音調(diào)、速度以及音量,所有的這些意味著用戶的詞可以被語音處理算法解讀為潛在地意指多個不同的詞;并且因此造成電子裝置可能地執(zhí)行一系列與檢測到的詞對應的命令/輸入。
[0006]雖然用于處理話語的算法和技術是不斷地改進的,但是許多可用的商業(yè)產(chǎn)品的特征為語音處理系統(tǒng)對個人的話語中的信息的不準確的或者不正確的識別。當所述話語包含由用戶發(fā)布給所述裝置以控制所述裝置的操作的命令時這是尤其重要的。即使是在檢測語音命令和確定用于執(zhí)行的適合的命令時的相對較小的失敗率或者不常見的誤差也可以顯著地減少用戶對語音控制技術的信任和認可。
[0007]尤其對于語音控制技術而言,其中命令是由用戶針對在系統(tǒng)上執(zhí)行的特定的模式發(fā)布的,必需的是用戶能夠信任所述系統(tǒng)每次和次次都能夠精確地作出反應。偶爾或零星的失敗會減少系統(tǒng)的實際的和察覺到的可靠性,尤其是當不可逆的或重要的系統(tǒng)命令是使用語音控制系統(tǒng)來發(fā)布。失去對系統(tǒng)精確性的信任可以反過來使得用戶尋求除了語音之外的一些其他方法來與系統(tǒng)互動,只要所述其他方法被察覺為具有更多的響應性和可信賴性即可。
[0008]通常,當前的語音操作技術方法透過對用戶說出的話語進行分析,并且執(zhí)行被確定為與分析過的話語相對應的命令而利用信息。然而,所述命令可能并不是用戶所識別的,這意味著適合的命令并沒有在所述裝置上執(zhí)行?;蛘撸脩舻脑捳Z的分析可能得出沒有檢測到任何命令的結果;在這種情況下所述裝置將不會操作。任一結果都會導致用戶的挫折感的提高;因為他們不能夠控制所述裝置從而確保它執(zhí)行實際上由用戶說出的命令。
[0009]本發(fā)明被設計為基本上改善或者至少減少數(shù)字裝置的用戶語音操作中的操作方面的上述不足。

【發(fā)明內(nèi)容】

[0010]因此,本發(fā)明的一個目的在于克服或者至少部分地緩解與現(xiàn)有技術相關聯(lián)的不足中的至少一些。
[0011]廣義地說,本發(fā)明已經(jīng)描述了遙控系統(tǒng)和裝置。
[0012]根據(jù)本發(fā)明的優(yōu)選實施例,提供一種系統(tǒng)用于提供對應于用戶指定命令的命令信號,所述系統(tǒng)包括:
[0013]音頻采集裝置,所述音頻采集裝置具有用于從用戶接收音頻信號的輸入并且具有用于響應于該音頻信號提供電信號的輸出,其中所述音頻信號中包含用戶指定的命令;
[0014]處理器,所述處理器用于從音頻采集裝置接收所述電信號,并且用于基于所述電信號根據(jù)預定標準生成多個命令,其中所述預定標準是所述用戶指定命令與所述多個命令之間的聽覺關聯(lián);
[0015]視覺顯示裝置,所述視覺顯示裝置用于顯示多個標志,其中所述多個命令中的每個命令是由所述多個標志中的一個標志表示的;以及
[0016]用戶可操作的選擇和輸入裝置,所述裝置用于從所述多個命令中進行所述用戶確定命令的用戶選擇,方法是選擇對應于所述用戶確定命令的標志。
[0017]視情況而言,所述視覺顯示裝置可以位于遠離用戶的位置。
[0018]所述音頻采集裝置、視覺顯示裝置、處理器和所述用戶可操作的選擇和輸入裝置可以提供為彼此分開的離散組件,并且所述音頻采集裝置可以是在用戶附近的,從而接收來自用戶的所述音頻信號。
[0019]或者,所述處理器和所述用戶可操作的選擇和輸入裝置是提供在遠離所述視覺顯示裝置的整體裝置中的。
[0020]所述整體裝置可以包含音頻采集裝置。
[0021]所述用戶可操作的選擇和輸入裝置以及所述視覺顯示裝置可以是提供在整體手持式裝置中的。
[0022]所述整體手持式裝置還可包含所述音頻采集裝置。
[0023]所述整體手持式裝置可以是選自包含移動電話裝置、便攜式電子顯示裝置、遙控裝置等的群組。
[0024]所述用戶可操作的選擇和輸入裝置可以是通過與用戶的物理互動而操作的,并且是選自包含鼠標的操作、鍵盤的操作、一個或多個命令按鍵的致動、在所述顯示裝置的觸敏式顯示面板上感測用戶身體部分的位置、在三維空間中檢測所述音頻采集裝置的空間移動等的群組。
[0025]顯示在所述顯示裝置上的標志可以包含基底標志以及與所述基底標志間隔開來的多個標志,其中所述用戶可操作的選擇和輸入裝置包含運動檢測器,用于檢測指示所述基底標志與多個標志中的一個標志之間的空間關系的所述裝置的運動,使得用戶確定命令的選擇是通過檢測指示所述基底標志與指示所述用戶確定命令的標志之間的空間關系的輸入裝置的運動的。
[0026]指示基底標志與關聯(lián)于用戶確定命令的標志之間的空間關系的運動可以是選自位移、旋轉,或者在指示基底標志與相對于基底標志的關聯(lián)于用戶確定命令的標志之間的空間關系的方向上的運動。
[0027]所述系統(tǒng)可以經(jīng)配置以使得在所述運動的檢測時,頒布對應于所述用戶確定命令的命令號。
[0028]用戶確定命令的選擇可以是通過用戶的預定義完成動作來確認的,其中用戶的預定義完成動作是選自包含用戶可操作的選擇和輸入裝置的用戶可操作按鍵的激活、用戶可操作的選擇和輸入裝置在預定方向上的運動、用戶可操作的選擇和輸入裝置以預定速度的運動、用戶可操作的選擇和輸入裝置以預定加速度的運動等的群組。
[0029]用戶可操作的選擇和輸入裝置的運動的檢測可以是在用戶的預定啟動動作時啟動的。
[0030]用于用戶確定命令的選擇的用戶可操作的選擇和輸入裝置的運動的檢測可以是在所述裝置的按鍵激活時啟動的,并且其中用于輸入?yún)?shù)的選擇的所述裝置的運動的檢測在檢測到預定義完成動作時終止。
[0031]所述多個標志可以是布置成至少部分地沿周邊圍繞所述基底標志的?;蛘?,所述多個標志可以是布置為圍繞所述基底標志的周邊布置的。在所述多個標志的又一布置中可以是經(jīng)布置以從所述基底標志的周邊延伸的。
[0032]所述標志的形狀可以是選自包含正方形、五角形、六角形、八角形等形狀的群組。
[0033]所述系統(tǒng)可以經(jīng)配置以使得當用戶選擇指示用戶確定命令的所述多個標志中的一個時,顯示指示進一步輸入?yún)?shù)的第二多個標志。視情況而言,所顯示的所述第二多個標志是與所述第一多個標志的選定標志呈預定關系的。
[0034]所述預定關系可以選自包含字母順序的靠近性、鍵盤上的空間靠近性、字母數(shù)字的分組等的群組。
[0035]視情況而言,所述裝置可以是手持式遙控裝置。
[0036]在本發(fā)明的一個實施例中,所述運動檢測器可以是回轉式傳感器,所述傳感器經(jīng)配置以響應于相對于所述傳感器的一個或多個參考軸的角運動而產(chǎn)生信號。所述手持式遙控裝置可以包含運動檢測器,所述運動檢測器經(jīng)配置以檢測選自包含線加速度、角加速度、速度、位移等的群組中的一個或多個參數(shù)。
[0037]所述系統(tǒng)可以經(jīng)配置以使得在選擇用戶確定命令時,對應于選定的用戶確定命令的標志的一個或多個視覺特性的改變被顯示在所述顯示裝置上的。
[0038]視情況而言,在選擇用戶確定命令時,至少一個音頻信號、視覺信號或者觸覺信號可以從所述用戶可操作的選擇和輸入裝置中發(fā)出。
[0039]所述系統(tǒng)可以進一步包含來自處理器的輸出以提供一個或多個輸出控制信號用于控制一個或多個外部裝置。
[0040]在本發(fā)明的另一實施例中,可以提供用于提供對應于用戶指定命令的命令信號的系統(tǒng),所述用戶指定命令是由基于來自用戶的可聽信號的根據(jù)預定標準生成的多個命令中選出的,并且所述預定標準是所述用戶指定命令與所述多個命令之間的聽覺關聯(lián),并且其中所述多個命令中的每個命令是由多個標志中的一個標志表示的,所述系統(tǒng)包括:
[0041]音頻采集裝置,所述音頻采集裝置具有用于從用戶接收音頻信號的輸入并且具有用于響應于所述音頻信號提供電信號的輸出,其中所述音頻信號中包含用戶指定的命令;
[0042]處理器,所述處理器用于從音頻采集裝置接收所述電信號,并且用于基于所述電信號根據(jù)預定標準生成多個命令,
[0043]用戶可操作的選擇和輸入裝置,所述裝置用于從所述多個命令中進行所述用戶確定命令的用戶選擇,方法是選擇對應于所述用戶確定命令的標志。
[0044]在本發(fā)明的另一實施例中,提供用于提供對應于用戶指定命令的命令信號的裝置,所述用戶指定命令是由基于來自用戶的可聽信號的根據(jù)預定標準生成的多個命令中選出的,并且所述預定標準是所述用戶指定命令與所述多個命令之間的聽覺關聯(lián),并且其中所述多個命令中的每個命令是由多個標志中的一個標志表示的,所述裝置包括:
[0045]處理器,所述處理器接收由基于含有用戶指定命令的可聽信號而操作的音頻采集裝置提供的電信號,并且基于所述電信號生成所述多個命令,
[0046]用戶可操作的選擇和輸入裝置,所述裝置用于從所述多個命令中進行所述用戶確定命令的用戶選擇,方法是選擇對應于所述用戶確定命令的標志。
[0047]所述裝置可以進一步包括用于顯示多個標志的視覺顯示裝置。
[0048]所述裝置可以進一步包括音頻采集裝置,所述音頻采集裝置具有用于從用戶接收音頻信號的輸入并且具有用于將所述電信號提供給處理器的輸出。
[0049]所述裝置可以是選自包含移動電話裝置、便攜式電子數(shù)據(jù)顯示裝置、遙控裝置等的群組中的裝置。
[0050]視情況而言,所述裝置可以包含運動檢測器,所述運動檢測器經(jīng)配置以檢測選自包含線加速度、角加速度、速度、位移等的群組中的一個或多個參數(shù)。在本發(fā)明的一個實施例中,所述運動檢測器可以是回轉式傳感器,所述傳感器經(jīng)配置以響應于相對于所述傳感器的一個或多個參考軸的角運動而產(chǎn)生信號。
[0051]所述裝置可以經(jīng)配置以使得在選擇遙控可選擇的輸入?yún)?shù)時,對應于用戶的確定命令的標志的一個或多個視覺特性的改變是顯示在所述顯示裝置上的。在選擇用戶確定命令時,至少一個音頻信號、視覺信號或者觸覺信號可以從所述用戶可操作的選擇和輸入裝置中發(fā)出。
[0052]在本發(fā)明的另一實施例中,向數(shù)字裝置提供命令信號的方法,其中所述命令信號對應于由基于來自用戶的可聽信號的根據(jù)預定標準生成的多個命令中選出的用戶指定命令,所述預定標準是在所述用戶指定命令與所述多個命令之間的聽覺關聯(lián),并且其中所述多個命令中的每個命令是由視覺顯示裝置上的多個標志中的一個標志表示的,
[0053]所述方法包含以下步驟:
[0054](i)獲取其中含有用戶命令的可聽信號,其中響應于所述可聽信號提供電信號;
[0055](ii)在處理器中處理所述電信號以基于所述電信號根據(jù)預定標準生成多個命令,其中所述預定標準是所述用戶確定命令與所述多個命令之間的聽覺關聯(lián);
[0056](iii)在顯示裝置上顯示多個標志,其中所述多個標志各自表示所述多個命令中的一個命令;
[0057](iv)從所述多個命令中選擇一個命令,方法是選擇由所述視覺顯示裝置顯示的所述多個標志中的一個標志;其中所述標志是通過用戶與輸入裝置的物理互動而選擇的。
[0058]視情況而言,所述方法可以是在輸入裝置選自包含鼠標的操作、鍵盤的操作、一個或多個命令按鍵的致動、在所述顯示裝置的觸敏式顯示面板上感測用戶身體部分的位置、在三維空間中檢測所述音頻采集裝置的空間移動等的群組時進行的。
[0059]在執(zhí)行所述方法時,從所述多個命令中選擇一個命令可以是通過所述多個標志中的標志的選擇來執(zhí)行的,方法是檢測用戶的輸入裝置的空間移動,所述移動指示了所述基底標志與指示所述用戶選定命令的所述標志之間的空間關系。
【專利附圖】

【附圖說明】
[0060]下文中將通過實例并且參考附圖對本發(fā)明的優(yōu)選實施例進行詳細的說明,在附圖中:
[0061]圖1示出了用于與數(shù)字裝置互動的語音控制的遙控的系統(tǒng)的示例性示意圖。
[0062]圖2示出了用于與包含顯示器的電子裝置互動的系統(tǒng)的一個實施例的示意圖。
[0063]圖3a示出了系統(tǒng)的示例性示意性圖示,在所述系統(tǒng)中本發(fā)明的遙控裝置的一個實施例利用運動檢測器來確認檢測到的語音命令。
[0064]圖3b示出了系統(tǒng)的示例性示意性圖示,在所述系統(tǒng)中本發(fā)明的遙控裝置的一個實施例利用用戶致動按鍵來確認檢測到的語音命令。
[0065]圖4示出了在用于顯示裝置的操作中使用的根據(jù)本發(fā)明的一個實施例的遙控裝置的示例性圖示。
[0066]圖5a至圖5b示出了可能在圖4的顯示裝置上顯示的用于一個層級選擇的示例性的顯示的系列。
[0067]圖5c至圖5e示出了可能在圖4的顯示裝置上顯示的用于巢狀選擇的示例性的顯示系列。
[0068]圖6是另一示例性顯示,所述顯示可以在一旦檢測到語音命令時顯示以供用戶進行確認。
[0069]圖7a和圖7b示出了示例性的過程控制圖。
【具體實施方式】
[0070]參考圖1,示出了根據(jù)本發(fā)明的系統(tǒng)100的示例性示意圖。
[0071]系統(tǒng)100提供用于處理器110之間的互動,所述處理器用于發(fā)布與口頭的用戶命令105對應的命令信號112。用戶102是位于所述系統(tǒng)的外部的但是能夠與所述系統(tǒng)互動。所述口頭用戶命令105可能是由麥克風120或用于捕獲音頻信號的其他裝置檢測到的,并且以所屬領域的一般技術人員已知的方式將此類音頻信號轉化為電信號125。
[0072]基于來自所述麥克風的電信號,處理器110可經(jīng)配置以生成對應于電信號125的多個可能的命令135、基于預定標準或與處理器110通信的數(shù)據(jù)庫140的查詢進行選擇在視覺顯示裝置130上顯示此類多個命令用于用戶確認。用戶所期望的命令132包含在顯示器上顯示的多個命令中。
[0073]系統(tǒng)100進一步包括用戶可操作的選擇和輸入裝置150,所述裝置位于用戶的附近,并且其經(jīng)配置用于捕獲用戶輸入和所選擇的命令的確認。在特定實施例中,輸入裝置150可經(jīng)配置以從顯示在視覺顯示裝置130上的多個命令中選擇一個命令。
[0074]視覺顯示裝置130可以位于用戶的附近或者遠離用戶,并且顯示基于電信號125由處理器110根據(jù)預定標準生成的來自口頭的用戶命令105的可能的多個命令135,其包含用戶真正指定的命令信號112的視覺表示132。
[0075]用戶指定的命令信號112可以使得處理器110執(zhí)行使所示系統(tǒng)中的一個或多個組件發(fā)生改變的動作,例如,改變視覺顯示裝置130上的頻道,改變視覺顯示裝置的輸入。
[0076]或者,作為所屬領域的技術人員已知的,命令信號112實際上可以是傳遞到另一系統(tǒng)的,例如,用于家庭環(huán)境的照明控制系統(tǒng)。此系統(tǒng)可以是在用戶附近的(或者甚至可以是遠離用戶的)。所屬領域的技術人員應理解,一旦用戶指定的命令信號已經(jīng)生成并且經(jīng)用戶可操作選擇和輸入裝置的操作確認為正確,那么實際發(fā)布的命令信號112的執(zhí)行可以由所述系統(tǒng)的外部(或者內(nèi)部)的多個處理器來實施,以便執(zhí)行包含開啟/關閉照明開關、開門、改變電視的頻道、開啟空調(diào)、關閉咖啡機等不同的任務。應理解執(zhí)行由本發(fā)明的系統(tǒng)發(fā)布的命令信號的實際結果并不以任何方式受到限制。
[0077]所述系統(tǒng)可以經(jīng)配置以使得視覺顯示裝置130 (例如,電視)可以是位于墻壁上或者位于陳列架上的,而麥克風120、處理器110以及用戶選擇裝置150可以位于相同的物理單元中,其可以是由用戶保持在手中用于說話并且確認用戶的命令的手持式遙控裝置。
[0078]或者,所述系統(tǒng)可以經(jīng)配置以使得視覺顯示裝置130也位于與麥克風120、處理器110以及用戶選擇裝置150相同的物理單元中,所述物理單元例如,移動電話、智能手機、數(shù)據(jù)平板裝置或可以由用戶握持的類似物。在此設置中,響應于用戶的口頭命令,實際發(fā)布的命令信號可以改變移動電話本身的實際狀態(tài)。或者,實際發(fā)布的命令信號可以是從移動電話傳送到另一處理器的,用于在該處理器上執(zhí)行。
[0079]再者,用于捕獲來自用戶102的可聽信號105的麥克風120可以是位于房間的墻壁或者天花板中的,用于檢測由用戶在房間中說話而發(fā)布的可聽信號。使用例如遙控裝置、數(shù)字顯示裝置或者甚至移動電話等用戶選擇裝置中的任一者,用戶能夠確認從顯示給用戶的多個顯不命令中確認口頭命令。
[0080]用戶可以通過與用戶輸入選擇裝置的物理互動從多個由處理器生成的用戶指定命令中提供指定命令的確認。此互動可以包含:鼠標、鍵盤的操作、一個或多個命令按鍵的致動、在裝置的觸敏式顯示面板上感測用戶身體部分的位置或在除了語音之外的所屬領域的技術人員已知的其他人機互動。或者,在下文概述的本發(fā)明的另一實施例中,與裝置的互動可以是通過用戶選擇裝置的空間移動的檢測的。
[0081]圖2示出了詳細描述了與根據(jù)本發(fā)明的系統(tǒng)的一個實施例進行互動的典型步驟的示例性流程圖。
[0082]本發(fā)明的系統(tǒng)可以由用戶激活210,方法是通過用戶的預定的起始動作,例如按鍵的激活或者裝置的特定的可檢測的運動,或者頒布具有獨特特征的非常特異的關鍵詞,并且這種激活是可以由所述系統(tǒng)來檢測的。在特定實施例中,所述系統(tǒng)可以通過裝置在預定方向、速度、加速度及其組合下的運動被觸發(fā)以進入激活狀態(tài)。
[0083]一旦裝置已經(jīng)被激活,那么用戶可以向系統(tǒng)說出220他們所期望的命令,該命令是通過麥克風或者其他音頻采集裝置來檢測的。此采集裝置負責用戶語音的模擬聲波的捕獲并且將它們變換為所屬領域的技術人員已知的處理器中的表示此類聲波的電信號。[0084]命令信號的識別230是使用常規(guī)的語音匹配算法執(zhí)行的,其使用MFCC等處理對從信號中提取的數(shù)字化語音特征進行處理。一旦從語音信號中識別出特征,就將這些特征與某些命令的對應的特征(遠程地通過網(wǎng)絡或在本身裝置上)匹配。也可以利用使用動態(tài)編程技術的動態(tài)時間規(guī)整算法等匹配算法,或基于匹配方法的線性預測編碼、隱式馬爾可夫模型以及人工神經(jīng)網(wǎng)絡等其他技術而不會脫離本發(fā)明的范疇。所屬領域的技術人員應理解上述內(nèi)容并不構成詳盡的列表,并且也可以利用其他特定的算法。
[0085]此識別過程可以由處理器來執(zhí)行,方法是查詢數(shù)據(jù)庫,或者使用如上文所述的復合音處理算法,以便確定可能對應于由用戶所提供的信號的潛在的命令。所述匹配可以是針對儲存在數(shù)據(jù)庫上的先前已經(jīng)由用戶在培訓過程或類似情況中供應的命令的庫來進行的,或者可以是基于針對用戶供應的樣本的匹配過程來執(zhí)行的。
[0086]因此,將可以對應于用戶指定命令的命令顯示240給用戶以供他們確認。有利的是,由命令呈現(xiàn)的“匹配”的程度可用于從最高匹配到最低匹配來排序列表,用于呈現(xiàn)給用戶。
[0087]此顯示可以是遠離用戶并位于另外的顯示裝置上或者可以是位于用戶附近的,舉例來說,在手持式顯示裝置中,例如,平板裝置、計算機或者智能手機裝置。
[0088]用戶能夠從盡可能匹配地顯示的多個命令中進行選擇250,并且能夠通過除了說話之外的與系統(tǒng)的互動來確認他們的選擇。此類形式的人機互動是所屬領域的技術人員所熟知的,并且可以包括鼠標的操作、鍵盤的操作、一個或多個命令按鍵的致動、在顯示裝置的觸敏式顯示面板上感測用戶身體部分的位置、在三維空間或類似物中檢測音頻采集裝置的空間移動。
[0089]一旦已從多個可能命令中作出了用戶指定命令的選擇250,那么可以將所述命令頒布255給系統(tǒng)內(nèi)的處理器以執(zhí)行與該命令信號對應的特定任務?;蛘撸梢詫⒚钚盘?55頒布給系統(tǒng)外部的處理器,從而使得所述處理器執(zhí)行一些動作或者執(zhí)行一些預定的過程?;蛘撸绻M管已經(jīng)呈現(xiàn)給用戶多個選項,所述命令信號仍未由所述系統(tǒng)正確地識別,那么用戶可以選擇取消命令的頒布257,并且再次開始所述過程。
[0090]參看圖3a描繪的系統(tǒng),描述了裝置的語音控制遠程操作的一個具體實施例,所述裝置通過遙控裝置來操作,所述遙控裝置的操作是通過檢測遙控裝置的運動來進行的。對此實施例進行描述以提供理解并且此實施例僅僅是上文的特定的實施方式。所屬領域的技術人員應理解其他實施方式也是可能的,,其中與系統(tǒng)的互動不是通過如同上文所描述的遙控裝置的運動來介導的;并且與下文中的具體實施例的描述形成對比。
[0091]系統(tǒng)300包括遠程視覺顯示裝置320,用于顯示基底標志322以及與基底標志322間隔開來的第一多個標志324、326、328?;讟酥?22以及第一多個標志324、326、328是顯示在所述視覺顯示裝置上的,使得用戶可以遠程確認此類標志。如同上文中的詳細描述,所述標志是指示已經(jīng)由處理器310基于可聽信號的處理確定的潛在的對應的命令。
[0092]系統(tǒng)300還包括用戶可操作的選擇以及輸入裝置340,所述輸入裝置是提供給用戶用于遙控選擇輸入?yún)?shù)。裝置340包含運動檢測器345,用于檢測裝置340的運動,由此所述運動指示了基底標志322與第一多個標志324、326、328的標志之間的空間關系。
[0093]一個第一命令可以是在用戶在第一方向341上移動裝置340時被選擇,所述第一方向指示了基底標志322與第一標志324之間的空間關系,如同由與箭頭331的方向上的運動對應的箭頭341所示。
[0094]用戶隨后可以選擇另一輸入?yún)?shù),方法是在指不與另一標志326相關聯(lián)的另一輸入?yún)?shù)的方向上移動裝置340,如同由與如對應的箭頭332所示的基底標志322和另一標志326的空間關系對應的裝置340在方向342上的運動所描繪的。
[0095]類似地,又一選擇可以由用戶作出,方法是在與又一標志328的空間關系對應的方向343上移動裝置340,如同如圖所示按箭頭333從基底標志322進行設置。
[0096]將理解,多個命令中的命令的選擇是基于裝置340相對于選擇標志相對于如同在視覺顯示裝置上示出的基底標志322的所表示的空間關系的相對運動。無論裝置340在三維空間中位于何處,作為對應于其他標志與基底標志322之間的空間安置的裝置340的移動的事實是從多個命令中選擇此命令所基于的內(nèi)容。所屬領域的技術人員將了解裝置的所述運動還可以僅在二維空間中,例如在桌面上移動。
[0097]因此,無論裝置340的位置如何,第一標志的選擇之后還可以接著另一標志的選擇,方法是通過與所需的命令相關的標志的安置對應的矢量運動。
[0098]用于選擇標志的裝置340的運動可以是移位、旋轉,或其替代組合。
[0099]所屬領域的技術人員將了解,在朝向涉及必需命令的必需標志的方向上的運動完成時,可以按不同的方式提供用于必需命令的選擇的用戶的預定義動作的確認,而不會脫離本發(fā)明的范圍。
[0100]在本發(fā)明的一個實施例中,動作的完成可以通過除了在標志的方向上的裝置340的另一運動來確定。
[0101]或者,通過用戶的動作的完成可以包含用戶可操作按鍵的激活、預定方向上的裝置的運動、預定速度下的裝置的運動、預定加速度或類似的裝置的運動,或者其組合。再者,用戶能夠使用人機互動的其他模式向系統(tǒng)提供輸入,包含通過按鈕、鼠標、鍵盤的操作、觸敏式顯示屏上的身體部分的用戶定位等等。能夠提供確認的方法可以潛在地是除語音操作檢測之外的現(xiàn)有的人機介面技術。
[0102]對智能手機或者平板計算機等觸摸屏便攜式電子裝置的一個示例性操作模式進行討論。在此實施例中,同時使用語音/觸摸屏操作模式,用戶可以觸控對應于“語音”按鈕的顯示屏的區(qū)域,從而激活語音識別引擎。顯示屏通過標志的顯示或者顏色的改變等將已經(jīng)進入語音命令模式的信息告知給用戶。命令或命令的序列的檢測的末尾是通過用戶壓下語音按鈕來指示和/或確認的。
[0103]在語音命令已被檢測到之后,且潛在的候選已經(jīng)被識別用于用戶確認,由語音識別引擎確定的命令的可能選擇可以是圍繞“語音”按鈕顯示的以用于確認,方法是用戶通過滑動以及釋放他們的手指與智能手機或平板計算機接觸。應理解其他對替代性顯示布置也是可能的。
[0104]另外,遙控裝置340的運動開始的檢測可以是通過用戶的預定啟動動作來啟動的,例如,按鍵的激活或者遙控裝置340的特定的可檢測的運動,如同圖3b中所示的圖示所描繪的,或者通過檢測觸摸屏表面上的移動(未圖示)。
[0105]參考圖4,描繪了本發(fā)明的系統(tǒng)的一個示例性實施例200,其中用戶操作的遙控裝置340是用于顯示裝置310的操作的,所述顯示裝置可以是電視或者計算機顯示屏等。用戶操作的遙控裝置340可以包括一個或多個按鈕342。這些按鈕可以是布置成類似于那些顯示在顯示屏210上的;類似于布置為用于由用戶來的致動的另外的布置的按鈕或者可以替代地包含位于控制器自身上的較小的顯示屏。
[0106]因此,所述遙控裝置可以是移動電信裝置,例如,智能手機或平板計算機或類似物,在所述裝置上用于顯示單元的遙控的程序是可操作的。
[0107]在此實施例中,第一多個標志324、326、328是顯示在顯示器210上,并布置為參照于基底標志322間隔開來的且呈部分的周邊關系并且顯示在所述顯示器上。
[0108]因此,在朝向多個標志324、326、328中的一個的方向上從基底標志322的遙控裝置350的運動可以是可認知地由用戶確定的,使得所述運動與多個標志324、326、328中的一個標志的矢量空間安置相符。
[0109]在其他實施例或者替代性實施例中,所述多個標志324、326、328可以圍繞基底標志沿周邊延伸,并且可以是彼此等距地間隔開來的。
[0110]另外,所述多個標志可以是鄰近的或者從基底標志的參數(shù)中擴展的。所述標志的幾何結構和形狀可以是選自包含正方形、五角形、六角形、八角形等的群組。
[0111]所屬領域的技術人員將了解標志的空間關系和數(shù)目將影響相對運動中的用戶的認知過程,從而影響選擇標志,并且取決于視覺顯示裝置的分辨率以及裝置340的移動的分辨率和檢測質(zhì)量。
[0112]裝置340可以包括用于檢測裝置340的運動的運動檢測器345,由此所述運動指示了基底標志322與第一多個標志324、326、328中的標志之間的空間關系。
[0113]在其他實施例中,所述第一多個標志中的一個的選擇可以激活指示進一步輸入?yún)?shù)的第二多個標志,并且這些標志可以根據(jù)附圖所示顯示在視覺顯示裝置320上。所述第二多個標志的顯示可以是基于認知功能、標準、解讀的簡易性等顯示為與所述第一多個標志呈預定關系,舉例來說,預定關系可以是字母順序的靠近性、鍵盤上的空間靠近性、字母數(shù)字的分組、語言使用中的分組和認知選擇等。
[0114]當被選取時顯示在視覺顯示裝置320上的標志324、326、328可以是突出顯示的,從而在使用所述裝置和選擇重要參數(shù)時提高用戶的認知空間感覺。命令的選擇的確認可以是通過反饋指示給用戶的,例如,從裝置340發(fā)射的音頻信號、視覺信號、觸覺信號等。
[0115]在遙控裝置340包含運動檢測器345的情況下,運動檢測器345可經(jīng)配置以檢測一個或多個空間移動參數(shù),包含線加速度、角加速度、速度、位移等。
[0116]處理器(未圖示)可以是通過射頻傳輸、紅外或光通信、藍牙類型通信等無線通信與裝置340通信的。
[0117]所述處理器(未圖示)可以是通過有線連接與視覺顯示裝置310通信的?;蛘?,所屬領域的技術人員將了解處理器與視覺顯示裝置310之間的通信可以通過無線通信的方式。
[0118]另外,如所屬領域的技術人員將了解的,所述處理器隨后可并入到裝置340中,位于顯示屏310中或者系統(tǒng)中的一些其他位置處。
[0119]當選擇必需的輸入?yún)?shù)時,取決于系統(tǒng)的應用,所述處理器可以提供輸出信號給系統(tǒng)外部的另一裝置。
[0120]另外,所屬領域的技術人員將了解運動可以是由用戶通過替代的方法檢測的,例如每個采集系統(tǒng)中的外部光,能夠確定用戶的運動的移動和方向,且因此允許用戶選擇標志并且從而激活必需的輸入?yún)?shù)而不會與裝置350發(fā)生物理接觸。
[0121]所屬領域的技術人員將了解本發(fā)明提供了輸入?yún)?shù)的容易的認知識別以及其基于標志的選擇,當檢測到用戶的與對應的標志到基底標志的空間位移對應的適合的矢量移動時,使得選擇更加容易。
[0122]另外,無論裝置340的位置如何,裝置340在對應于標志相對于基底標志的矢量位移的方向上的移動提供了用戶的輸入和選擇的容易性。
[0123]再者,所屬領域的技術人員將了解所需的計算電力的量較低,因為裝置340的運動僅需要在裝置激活時確定,用于指示標志和命令的選擇的移動的開始,因此簡化了用于隨后的命令選擇的隨后標志的選擇過程。
[0124]參考圖5a至圖5e,使用先前討論的運動敏感型遙控裝置的一個實施例,呈現(xiàn)了圖4中描繪的系統(tǒng)的示例性操作模式。
[0125]所述系統(tǒng)的語音控制操作模式可以是通過特定命令的頒布、按鈕的致動或者提供給系統(tǒng)的一些其他輸入而啟動的。在正確模式啟動之后,用戶隨后可以說出用戶希望系統(tǒng)執(zhí)行的命令。用戶的話語可以是由麥克風捕獲的并且隨后傳遞給處理器,所述處理器提供可能潛在地對應于用于確認的口頭命令的多個可能命令,如上文所描述。
[0126]如同所描繪的這些命令可以是呈現(xiàn)有顯示在基底位置處的激活的標志的,并且在被用戶移動之前對應于三維真實空間中的遙控裝置的位置。所述激活的標志可以被制成對于用戶來說是視覺上不同的,包含通過改變顏色、陰影(如圖所示)或者通過增大文本和/或基底標志的背景或者其他類似技術,如同所屬領域的技術人員已知的。
[0127]一旦用戶激活了屏幕顯示,那么用戶可以通過如圖5a至圖5c所示的使用遙控裝置350以選擇處理器將要執(zhí)行的命令。
[0128]圖5a至圖5c所示的激活標志372可以表示由處理器使用語音識別算法確定的口頭命令的最佳的或主要的匹配。聽起來可能類似于口頭命令或者與口頭命令有特定背景關系的替代性命令374也可以圍繞基底激活標志372來顯示。這些標志可以圍繞基底標志按特定的空間關系進行布置。
[0129]如同在顯示器上所示的,“BBC世界”標志是位于中心“取消”標志的左下方;而“BBC ”標志是相對于中心標志位于對角地向上的左側的。此空間關系對于本發(fā)明的實施例的操作而言是非常重要的,其中用戶選擇的確認是通過三維空間中的用戶操作的遙控裝置的移動而提供的。
[0130]通過遙控裝置的按鈕的致動,處理器可經(jīng)配置以開始在三維空間中捕獲裝置的位
置信息。
[0131]為了確認檢測到的“BBC世界”命令用于系統(tǒng)的處理器的操作,在示例性實施例中用戶可以將遙控裝置移動到右下方,以選擇對應于“BCC世界”的標志并且使該標志成為激活的標志。因為所述標志相對于基底位置的方向是右下方位置,因此用戶將所述裝置移動到右下方位置以改變激活標志。
[0132]當根據(jù)三維空間中的裝置的用戶的運動使顯示的激活標志變?yōu)椤癇BC世界”時,用戶可以釋放遙控的按鈕,由此使得遙控裝置將設置命令頒布給處理器。
[0133]通過遙控裝置來確認已經(jīng)將命令頒布給處理器可以是通過從用戶可操作選擇和輸入裝置中發(fā)射的音頻信號、視覺信號或觸覺信號來提供的?;蛘撸_認的提供可以通過改變對應于顯示在所述顯示裝置上的選定的輸入?yún)?shù)的標志的一個或多個視覺特性。
[0134]在圖5a至圖5b中描繪的示例性實施例中,示出了可選的“巢狀”布置,其中用戶可以說出第一命令(“BBC世界”)、顯示對應于多個相關命令374的標志,以及對應于BBC世界命令375的標志。如圖5c和圖5d中所示,當選擇“更多”選項時所選定的標志可以是從進一步的層級中訪問的。一旦選擇此標志,那么如圖5d和圖5e所示可以提供進一步的菜單選項用于供用戶進行確認。在圖5a至圖5e中描繪的所有實施例中,通過用戶的口頭命令的確認可以通過確認運動獲得,隨后說出第二命令(“新”)。
[0135]如果采用過多的巢狀層級時這種互動模式可能是冗長的;并且因此它說明了本發(fā)明的系統(tǒng)如何可以進行配置并且重要的是利用適合的巢狀的層級。
[0136]圖6描繪了基于口頭命令“CNN”的可以呈現(xiàn)用于用戶的選擇的標志的進一步的顯示。所述顯示標志可以是基于語音識別軟件過程或者用戶的話語與可以顯示的可能的命令之間的一些其他關系的。所述顯示標志可以是圍繞基底標志布置的并且類似地三維空間中的空間關系可以表示確認適合的命令所需的遙控裝置的運動。應理解圖6的顯示標志僅僅是呈現(xiàn)標志的一種方式,并且并不限定任何方式。
[0137]圖7a、圖7b表示控制圖,其示出了根據(jù)本發(fā)明的一個示例性實施例的控制在用戶、語音識別引擎以及并入用戶介面的裝置之間通過的方式。
[0138]如圖所示,用戶激活裝置400,這將語音識別引擎410變?yōu)榫途w狀態(tài),等待輸入。用戶介面上的顯示可以指示裝置的狀態(tài)的改變420。在檢測到話語422時,獲取此話語并且傳遞給語音識別引擎424,此處它得到了識別并且確定了用于所述命令的潛在的候選426。裝置428的檢測狀態(tài)的結束可以是由用戶手動地觸發(fā)的(如圖7a中所示)或者是自動地觸發(fā)的(如圖7b中所示)。
[0139]可以通過在用戶介面上包含消息來詢問用戶再次激活裝置430,這可以隨后由用戶來執(zhí)行431?;蛘?,可以簡單地在用戶介面上呈現(xiàn)命令的替代性候選給用戶。這些可以根據(jù)針對先前儲存的命令與檢測到的語音信號的“匹配”程度來排序。或者,在不脫離本發(fā)明的范圍的情況下可以采用另外的排序/排列方法。
[0140]用戶可以從顯示的可能命令中以多種方式選擇對應于他們的期望的將要執(zhí)行的實際命令,包含語音/觸控或者如上文所示的其他選擇過程,如434中所示。
[0141]所述用戶選擇隨后可以傳送回用戶介面形式選擇并且在本地的裝置上執(zhí)行或者在遠離所述裝置的系統(tǒng)上執(zhí)行。(436)視情況而言,可以以視覺反饋供用戶驗證已執(zhí)行的命令(438 ),或者可以簡單地執(zhí)行所述命令而無需此類確認。
[0142]圖7b是基本上與圖7a相同的,不同之處在于用戶的話語的結束是在所示的系統(tǒng)中自動地檢測的。舉例來說,語音識別引擎可經(jīng)配置以檢測語音或聲音的不存在。
[0143]如同所屬領域的技術人員所理解的,當與現(xiàn)有技術語音控制系統(tǒng)相比時本發(fā)明的系統(tǒng)提供了增強水平的精確性。因為檢測到的語音命令是由用戶獨立地驗證的,因此如果基于檢測到的語音信號處理了不準確的命令,那么在系統(tǒng)實際上執(zhí)行所述命令之前用戶能夠攔截和/或校正此命令。這顯著地增大了用戶對系統(tǒng)的信任的水平,鑒于察覺到的提高的可靠性這繼而促進了用戶對此類裝置的語音控制操作模式的采用。
[0144]雖然已經(jīng)參考上文所述的實例或優(yōu)選實施例對本發(fā)明進行了說明,但是應理解上述內(nèi)容是用于輔助對本發(fā)明的理解的實例且并不意味著進行限制。對于所屬領域的技術人員而言是顯而易見的或者微不足道的變化或變體以及根據(jù)它們作出的改進都應被視作本發(fā)明的等效物。
[0145]舉例來說,位于用戶附近的遙控裝置可以是其中包含了所述系統(tǒng)的一些或者全部組件的整體式手持裝置。具體而言,在不脫離本發(fā)明的范圍的前提下,所述遙控裝置可以包含移動電話裝置、平板計算機等便攜式電子數(shù)據(jù)顯示裝置、帶有或不帶有顯示器等的遙控裝置。
【權利要求】
1.一種用于提供對應于用戶指定命令的命令信號的系統(tǒng),其特征在于,所述系統(tǒng)包括:音頻采集裝置,所述音頻采集裝置具有用于從用戶接收音頻信號的輸入并且具有用于響應于所述音頻信號提供電信號的輸出,其中所述音頻信號中包含所述用戶指定的命令; 處理器,所述處理器用于從所述音頻采集裝置接收所述電信號,并且用于基于所述電信號根據(jù)預定標準生成多個命令,其中所述預定標準是所述用戶指定命令與所述多個命令之間的聽覺關聯(lián); 視覺顯示裝置,所述視覺顯示裝置用于顯示多個標志,其中所述多個命令中的每個命令是由所述多個標志中的一個標志表示的;以及用戶可操作的選擇和輸入裝置,所述用戶可操作的選擇和輸入裝置用于從所述多個命令中進行所述用戶確定命令的用戶選擇,方法是選擇對應于所述用戶確定命令的所述標
ο
2.根據(jù)權利要求1所述的系統(tǒng),其特征在于,所述視覺顯示裝置是遠離用戶的。
3.根據(jù)權利要 求1或2所述的系統(tǒng),其特征在于,所述音頻采集裝置、視覺顯示裝置、處理器以及所述用戶可操作的選擇和輸入裝置提供為彼此分開的離散組件,并且所述音頻采集裝置是在用戶附近的,從而接收來自用戶的所述音頻信號。
4.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,所述處理器以及所述用戶可操作的選擇和輸入裝置是提供在遠離所述視覺顯示裝置的整體裝置中的。
5.根據(jù)權利要求4所述的系統(tǒng),其特征在于,所述整體裝置還包含所述音頻采集裝置。
6.根據(jù)權利要求1所述的系統(tǒng),其特征在于,所述處理器、所述用戶可操作的選擇和輸入裝置以及所述視覺顯示裝置是提供在整體手持式裝置中的。
7.根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述整體手持式裝置還包含所述音頻采集裝置。
8.根據(jù)權利要求6或7所述的系統(tǒng),其特征在于,所述整體手持式裝置是選自包含移動電話裝置、便攜式電子數(shù)據(jù)顯示裝置、遙控裝置等的群組。
9.根據(jù)權利要求1或2所述的系統(tǒng),其中所述用戶可操作的選擇和輸入裝置是通過與用戶的物理互動操作的并且是選自包含鼠標的操作、鍵盤的操作、一個或多個命令按鍵的致動、在所述顯示裝置的觸敏式顯示面板上感測用戶身體部分的位置、在三維空間中檢測所述音頻采集裝置的空間移動等的群組。
10.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,顯示在所述顯示裝置上的所述標志包含基底標志以及與所述基底標志間隔開來的多個標志,其中所述用戶可操作的選擇和輸入裝置包含運動檢測器,用于檢測指示所述基底標志與所述多個標志中的一個標志之間的空間關系的所述裝置的運動,使得所述用戶確定命令是通過指示所述基底標志與指示所述用戶確定命令的所述標志之間的所述空間關系的所述輸入裝置的運動的檢測來選擇的。
11.根據(jù)權利要求10所述的系統(tǒng),其特征在于,指示所述基底標志與關聯(lián)于所述用戶確定命令的標志之間的空間關系的所述運動是選自位移、旋轉、在指示所述基底標志與相對于所述基底標志關聯(lián)于所述用戶確定命令的所述標志之間的空間關系的方向上的運動的。
12.根據(jù)權利要求10所述的系統(tǒng),其特征在于,當檢測到所述運動時,頒布對應于所述用戶確定命令的命令信號。
13.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,所述用戶確定命令的選擇是通過用戶的預定義完成動作來確認的,其中用戶的所述預定義完成動作是選自包含所述用戶可操作的選擇和輸入裝置的用戶可操作按鍵的激活、所述用戶可操作的選擇和輸入裝置在預定方向上的運動、所述用戶可操作的選擇和輸入裝置以預定速度的運動、所述用戶可操作的選擇和輸入裝置以預定加速度的運動等的群組。
14.根據(jù)權利要求10所述的系統(tǒng),其特征在于,所述用戶可操作的選擇和輸入裝置的運動的檢測是基于用戶的預定啟動動作啟動的。
15.根據(jù)權利要求14所述的系統(tǒng),其特征在于,用于用戶確定命令的選擇的所述用戶可操作的選擇和輸入裝置的所述運動的檢測是在所述裝置的按鍵激活時啟動的,并且其中用于所述輸入?yún)?shù)的選擇的所述裝置的所述運動的檢測是在檢測到預定義的完成動作時終止的。
16.根據(jù)權利要求10所述的系統(tǒng),其特征在于,所述多個標志是布置成至少部分地沿周邊圍繞所述基底標志的。
17.根據(jù)權利要求10所述的系統(tǒng),其特征在于,所述多個標志是布置在圍繞所述基底標志的周邊布置的。
18.根據(jù)權利要求17所述的系統(tǒng),其特征在于,所述多個標志從所述基底標志的周邊延伸。
19.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,所述標志的形狀是選自包含正方形、五角形、六角形、八角形形狀等的群組。
20.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,當用戶選擇指示用戶確定命令的所述多個標志中的一個時,指示進一步輸入?yún)?shù)的第二多個標志被顯示。
21.根據(jù)權利要求20所述的系統(tǒng),其特征在于,顯示的所述第二多個標志是與所述第一多個標志的所述選定的標志呈預定關系的。
22.根據(jù)權利要求21所述的系統(tǒng),其特征在于,所述預定關系是選自包含字母順序的靠近性,或鍵盤上的空間靠近性、字母數(shù)字的分組等的群組。
23.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,所述裝置是手持式遙控裝置。
24.根據(jù)權利要求10所述的系統(tǒng),其特征在于,所述運動檢測器是回轉式傳感器,所述傳感器經(jīng)配置以響應于相對于所述傳感器的一個或多個參考軸的角運動而產(chǎn)生信號。
25.根據(jù)權利要求24所述的系統(tǒng),其特征在于,所述手持式遙控裝置包含運動檢測器,所述運動檢測器經(jīng)配置以檢測選自包含線加速度、角加速度、速度、位移等的群組中的一個或多個參數(shù)。
26.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,在選擇用戶確定命令時,對應于所述選定的用戶確定命令的標志的一個或多個視覺特性的改變被顯示在所述顯示裝置上的。
27.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,在選擇所述用戶確定命令時,至少一個音頻信號、視覺信號或者觸覺信號從所述用戶可操作的選擇和輸入裝置中發(fā)出。
28.根據(jù)權利要求1或2所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括來自所述處理器的輸出,用于提供一個或多個輸出控制信號,以控制一個或多個外部裝置。
29.一種用于提供對應于用戶指定命令的命令信號的系統(tǒng),其特征在于,所述用戶指定命令是由基于來自用戶的可聽信號的根據(jù)預定標準生成的多個命令中選出的,并且所述預定標準是在所述用戶指定命令與所述多個命令之間的聽覺關聯(lián),并且其中所述多個命令中的每個命令是由多個標志中的一個標志表示的,所述系統(tǒng)包括: 音頻采集裝置,所述音頻采集裝置具有用于從用戶接收音頻信號的輸入并且具有用于響應于所述音頻信號提供電信號的輸出,其中所述音頻信號中包含所述用戶指定的命令; 處理器,所述處理器用于從所述音頻采集裝置接收所述電信號,并且用于基于所述電信號根據(jù)預定標準生成多個命令; 用戶可操作的選擇和輸入裝置,所述裝置用于從所述多個命令中進行所述用戶確定命令的用戶選擇,方法是選擇對應于所述用戶確定命令的所述標志。
30.一種用于提供對應于用戶指定命令的命令信號的裝置,其特征在于,所述用戶指定命令是由基于來自用戶的可聽信號的根據(jù)預定標準生成的多個命令中選出的,并且所述預定標準是在所述用戶指定命令與所述多個命令之間的聽覺關聯(lián),并且其中所述多個命令中的每個命令是由多個標志中的一個標志表示的,所述裝置包括: 處理器,所述處理器接收由基于含有用戶指定命令的可聽信號而操作的音頻采集裝置提供的電信號,并且基于所述電信號生成所述多個命令, 用戶可操作的選擇和輸入裝置,所述裝置用于從所述多個命令中進行所述用戶確定命令的用戶選擇,方法是選擇對應于所述用戶確定命令的所述標志。
31.根據(jù)權利要求30所述的裝置,其特征在于,進一步包括用于顯示多個標志的視覺顯示裝置。
32.根據(jù)權利要求30或31所述的裝置,其特征在于,所述裝置進一步包含音頻采集裝置,所述音頻采集裝置具有用于從用戶接收所述音頻信號的輸入并且具有用于將所述電信號提供給所述處理器的輸出。
33.根據(jù)權利要求32所述的裝置,其特征在于,所述裝置可以是選自包含移動電話裝置、便攜式電子數(shù)據(jù)顯示裝置、遙控裝置等的群組中的裝置。
34.根據(jù)權利要求30所述的裝置,其特征在于,所述遙控裝置包含運動檢測器,所述運動檢測器經(jīng)配置以檢測選自包含線加速度、角加速度、速度、位移等的群組中的一個或多個參數(shù)。
35.根據(jù)權利要求34所述的裝置,其特征在于,所述運動檢測器是回轉式傳感器,所述傳感器經(jīng)配置以響應于相對于所述傳感器的一個或多個參考軸的角運動而產(chǎn)生信號。
36.根據(jù)權利要求32至35中任一項所述的裝置,其特征在于,在選擇遠程可選擇的輸入?yún)?shù)時,對應于用戶的確定命令的標志的一個或多個視覺特性的改變是顯示在所述顯示裝置上的。
37.根據(jù)權利要求32至35中任一項所述的裝置,其特征在于,在選擇所述用戶確定命令時,至少一個音頻信號、視覺信號或者觸覺信號從所述用戶可操作的選擇和輸入裝置中發(fā)出。
38.一種向數(shù)字裝置提供命令信號的方法,其特征在于,所述命令信號對應于由基于來自用戶的可聽信號的根據(jù)預定標準生成的多個命令中選出的用戶指定命令,所述預定標準是在所述用戶指定命令與所述多個命令之間的聽覺關聯(lián),并且其中所述多個命令中的每個命令是由視覺顯示裝置上的多個標志中的一個標志表示的,所述方法包含以下步驟: (i)獲取其中含有用戶命令的可聽信號,其中響應于所述可聽信號提供電信號, (ii)在處理器中處理所述電信號以基于所述電信號根據(jù)預定標準生成多個命令,其中所述預定標準是所述用戶確定命令與所述多個命令之間的聽覺關聯(lián); (iii)在顯示裝置上顯示多個標志,其中所述多個標志各自表示所述多個命令中的一個命令; (iv)從所述多個命令中選擇 一個命令,方法是選擇由所述視覺顯示裝置顯示的所述多個標志中的一個標志;其中所述標志是通過用戶與輸入裝置的物理互動選擇的。
39.根據(jù)權利要求38所述的向數(shù)字裝置提供命令信號的方法,其特征在于,所述輸入裝置是選自包含鼠標的操作、鍵盤的操作、一個或多個命令按鍵的致動、在所述顯示裝置的觸敏式顯示面板上感測用戶身體部分的位置、在三維空間中檢測所述音頻采集裝置的空間移動等的群組。
40.根據(jù)權利要求38或39所述的向數(shù)字裝置提供命令信號的方法,其特征在于,從所述多個命令中選擇一個命令是通過所述多個標志中的標志的選擇來執(zhí)行的,方法是檢測用戶的輸入裝置的空間移動,所述移動指示了所述基底標志與指示所述用戶選定命令的所述標志之間的空間關系。
【文檔編號】G06F3/01GK103970269SQ201410042270
【公開日】2014年8月6日 申請日期:2014年1月26日 優(yōu)先權日:2013年1月25日
【發(fā)明者】汪智沛 申請人:汪智沛
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1