專利名稱:遙控對象設(shè)備、遙控系統(tǒng)以及圖像處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及以在遙控發(fā)送器中的鍵操作與聲音遙控家電設(shè)備的系統(tǒng),特別是該系統(tǒng)內(nèi)的控制對象設(shè)備,還涉及搭載按照該系統(tǒng)的GUI(圖形用戶接口)的圖像處理裝置。
作為便利的反面,功能的增多使設(shè)備的操作變復(fù)雜。以用戶的操作簡單化作為目的,許多家電設(shè)備搭載了通過遙控發(fā)送器進(jìn)行的遙控系統(tǒng)。特別是,電視(TV)接收機(jī)或錄像機(jī)(VTR)等發(fā)揮畫面顯示功能的機(jī)器(以下稱為“圖像處理裝置”)通過其遙控系統(tǒng)實(shí)現(xiàn)下面所示的GUI用戶通過遙控使操作菜單顯示在畫面上。用戶進(jìn)而通過對遙控發(fā)送器的鍵操作使畫面上顯示的光標(biāo)移動(dòng),以此選擇一個(gè)菜單內(nèi)的類目。在所選類目還含有子目時(shí),在畫面上顯示這些子目的菜單。用戶通過同樣的光標(biāo)操作從該菜單中選擇一個(gè)子目。這樣,圖像處理裝置實(shí)行與所選操作對應(yīng)的功能。
上述那樣的采單的階層結(jié)構(gòu),隨著功能的進(jìn)一步增多而深層化且復(fù)雜化。這時(shí)在類目的選擇中,菜單的各階層間的移動(dòng)一般要進(jìn)行多次。因而遙控發(fā)送器的鍵操作必須長時(shí)間反復(fù)進(jìn)行。這樣的鍵操作的長時(shí)間反復(fù)進(jìn)行特別對中高年齡的用戶來說未必容易。因此,開發(fā)了利用聲音補(bǔ)充遙控發(fā)送器的鍵操作的遙控系統(tǒng)。在由這種系統(tǒng)形成的GUI中,例如用聲音指示菜單的各階層間的移動(dòng),用遙控發(fā)送器的鍵操作指示畫面上的光標(biāo)移動(dòng)。這樣,發(fā)揮了利用聲音控制與利用遙控發(fā)送器的鍵操作控制各自的優(yōu)點(diǎn),實(shí)現(xiàn)了操作性的提高。
已有的遙控系統(tǒng)中已知有電子技術(shù)出版社發(fā)行的《電視技術(shù)》1991年5月號第38-44頁揭示的VTR用聲音遙控技術(shù)。該遙控系統(tǒng)以VTR作為遙控對象設(shè)備,通過附帶聲音識(shí)別裝置的遙控發(fā)送器,用鍵操作與聲音實(shí)現(xiàn)對該VTR的遙控。
圖13是表示已有的遙控系統(tǒng)所含的遙控發(fā)送器100的結(jié)構(gòu)框圖。當(dāng)用戶按壓鍵盤101的一個(gè)鍵時(shí),遙控脈沖變換部102就按照該鍵選擇控制碼。再將該控制碼變換成電信號(以下稱“第一遙控脈沖P1”)并輸出。當(dāng)用戶向遙控發(fā)送器100的話筒106發(fā)聲時(shí),該聲音通過話筒106與低頻放大器107,變換成聲音信號S,輸入到聲音識(shí)別部108。聲音識(shí)別部108將聲音信號S與字典109中登錄的聲音識(shí)別對象數(shù)據(jù)作比較。通常按每個(gè)單詞登錄聲音識(shí)別對象數(shù)據(jù)。聲音識(shí)別部108從字典109中選擇與聲音信號S對應(yīng)的單詞W,并通知輸出控制部110。輸出控制部110對控制碼存儲(chǔ)部111進(jìn)行訪問,讀出與所通知的單詞W對應(yīng)的控制碼C。這里,控制碼存儲(chǔ)部111存儲(chǔ)著與字典109所登錄的單詞分別對應(yīng)的控制碼。輸出控制部110將讀出的控制碼C變換成電信號(以下稱“第二遙控脈沖P2”)并輸出。遙控脈沖選擇部103選擇第一遙控脈沖P1或第2遙控脈沖P2中的一個(gè),輸出到LED驅(qū)動(dòng)部。LED驅(qū)動(dòng)部104根據(jù)輸入的遙控脈沖P使紅外線發(fā)光二極管(LED)105發(fā)光。作為基于遙控脈沖的紅外線的調(diào)制方式,使用例如脈沖位置調(diào)制(PPM)。這樣,根據(jù)遙控脈沖P調(diào)制的紅外線(以下稱為“遙控信號”)R被發(fā)送到VTR200。
圖14是表示與上述已有的遙控系統(tǒng)的遙控對象設(shè)備、即VTR200內(nèi)的遙控有關(guān)的部分的框圖。受光部201包含光電二極管等受光元件,從外部輸入紅外線R。遙控信號檢波部202從受光部210接收的紅外線中檢測遙控發(fā)信器100的遙控信號R,并將其變換成遙控脈沖P。遙控脈沖解碼部203根據(jù)該遙控脈沖P將控制碼C解碼。設(shè)備控制部204對控制數(shù)據(jù)存儲(chǔ)部205進(jìn)行訪問,讀出與該控制碼C對應(yīng)的命令或控制數(shù)據(jù)D。而且根據(jù)該命令或控制數(shù)據(jù)D進(jìn)行規(guī)定的操作。這樣,上述遙控系統(tǒng)對VTR200實(shí)現(xiàn)了由遙控發(fā)送器100的鍵操作及聲音完成的遙控。
對VTR200的每一操作或應(yīng)該對VTR200提供的每一控制數(shù)據(jù),預(yù)先設(shè)定控制碼。例如對于表示電源通斷、錄像、重放、停止、快進(jìn)或倒帶等各操作的命令,或?qū)︿浵耦l道或錄像開始/結(jié)束時(shí)刻等控制數(shù)據(jù)的每一數(shù)據(jù),分配不同的控制碼??刂拼a與命令之間或控制碼與控制數(shù)據(jù)之間的對應(yīng)由控制數(shù)據(jù)存儲(chǔ)部205加以存儲(chǔ)。
在上述遙控系統(tǒng)中,對VTR200指定一個(gè)操作或一個(gè)控制數(shù)據(jù)時(shí),遙控發(fā)送器100與鍵操作或聲音的任一個(gè)的指示無關(guān)地選擇共同的控制碼,并變換成共同的遙控信號R。借助于此,VTR200對于遙控,可以與遙控發(fā)送器中的鍵操作或聲音的任一個(gè)的指示無關(guān)地使用圖14所示的共同結(jié)構(gòu)。
在用紅外線發(fā)送遙控信號時(shí)必須防止與由其它遙控系統(tǒng)產(chǎn)生的同樣的遙控信號之間的誤識(shí)別。因此不同的遙控系統(tǒng)間避免使用同一的控制碼。結(jié)果,對用紅外線的遙控系統(tǒng)的每一個(gè)系統(tǒng)分配的控制碼數(shù)目受到限制。因而每一類產(chǎn)品只能分配例如1字節(jié)(=256個(gè))左右。相反,遙控的對象設(shè)備的功能如上所述正在持續(xù)增加。例如衛(wèi)星數(shù)字廣播的頻道理論上是101-999個(gè),即使限于現(xiàn)行的也已經(jīng)包含200-300種。因此即使只單純地對應(yīng)頻道數(shù)的增加,控制碼數(shù)目也不夠。如上述的遙控系統(tǒng)那樣,在遙控發(fā)送器將共同的控制碼分配給用鍵操作的指示與用聲音的指示兩方面時(shí),控制碼數(shù)更是不足。實(shí)際上,用聲音指示選臺(tái)時(shí),當(dāng)前的聲音識(shí)別技術(shù)至少需要與選臺(tái)對象頻道組相同數(shù)量的單詞。另外,例如在用聲音直接指示利用EPG進(jìn)行節(jié)目檢索時(shí),應(yīng)該識(shí)別的單詞數(shù)必須要有100個(gè)左右。
這樣,對于一個(gè)操作,對用聲音的指示應(yīng)該分配的控制碼數(shù)目大幅度超過對用鍵操作的指示應(yīng)該分配的控制碼數(shù)。因此,在鍵操作與聲音兩方面的指示能夠共同的控制碼的數(shù)目僅限于極少量。結(jié)果上述的遙控系統(tǒng)缺乏功能的擴(kuò)展性。
已有的遙控系統(tǒng)中除了上面所述以外,已知有特開平7-30982號公報(bào)揭示的系統(tǒng)。該遙控系統(tǒng)以VTR作為遙控對象設(shè)備,通過帶話筒的遙控發(fā)送器用鍵操作與聲音實(shí)現(xiàn)對該VTR的遙控。但與上述遙控系統(tǒng)不同,遙控發(fā)送器根據(jù)用戶的聲音本身對紅外線施加頻率調(diào)制后發(fā)送。另一方面,在VTR、即遙控信號的接收側(cè)實(shí)行聲音識(shí)別。從而,如下所述,其功能的擴(kuò)展性比上述遙控系統(tǒng)來得高。
圖15是表示該已有的遙控系統(tǒng)所包含的遙控發(fā)送器300的結(jié)構(gòu)框圖。這里,對于與圖13所示的已有的遙控發(fā)送器100相同的結(jié)構(gòu),加注與圖13相同的符號。而且對于這些相同的結(jié)構(gòu)的詳情,援用上述說明。
當(dāng)用戶向遙控發(fā)送器300的話筒106發(fā)聲時(shí),該聲音通過話筒106與低頻放大器107,變換成聲音信號S,輸入到頻率調(diào)制部301。頻率調(diào)制部301根據(jù)該聲音信號S對規(guī)定的載波施行頻率調(diào)制。遙控脈沖選擇部103選擇第一遙控脈沖P1或經(jīng)頻率調(diào)制產(chǎn)生的聲音信號PS中的任意一個(gè),輸出到LED驅(qū)動(dòng)部104。LED驅(qū)動(dòng)部104根據(jù)第一遙控脈沖P1或經(jīng)頻率調(diào)制產(chǎn)生的聲音信號PS中的任意一個(gè)使32紅外線LED105發(fā)光。以此把遙控信號R送到VTR400。
圖16是表示上述已有的遙控系統(tǒng)中遙控對象設(shè)備即VTR400內(nèi)的與遙控及聲音識(shí)別有關(guān)的部分的框圖。在這里,對與圖14所示的已有的VTR200相同的結(jié)構(gòu)加注與圖14相同的符號。
遙控脈沖/聲音信號選擇部401通常選擇第一遙控信號檢測部202A作為輸出目的地。這時(shí),受光部201接受的遙控信號R輸往第一遙控信號檢測部202A。第一遙控信號檢測部202A從遙控信號R中檢測第一遙控脈沖P1。遙控脈沖解碼部20根據(jù)第一遙控脈沖P1對控制碼C進(jìn)行解碼。第一設(shè)備控制部204訪問第一控制數(shù)據(jù)存儲(chǔ)部205,讀出與該控制碼對應(yīng)的命令或控制數(shù)據(jù)D1。并且根據(jù)該命令或控制碼D1進(jìn)行規(guī)定的操作。這樣,實(shí)現(xiàn)了由遙控發(fā)送器300的鍵操作完成的遙控。
另一方面,通過聲音遙控如下所述進(jìn)行。第二遙控信號檢波部202B監(jiān)視從受光部201向控制脈沖/聲音信號選擇部401送出的遙控信號R,從中檢測指示聲音識(shí)別開始用的特定的遙控脈沖PT。該特定的遙控脈沖PT利用例如遙控發(fā)送器300中的操作鍵由遙控發(fā)送器300發(fā)送。當(dāng)?shù)诙b控信號檢測部202B檢測出特定的遙控脈沖PT時(shí),聲音識(shí)別起動(dòng)控制部402將遙控脈沖/聲音信號選擇部401的輸出目的地切換到FM檢波部403。這時(shí),受光部201接收到的遙控信號R輸入到FM檢波部403。以此使FM檢測部403起動(dòng)。所述特定的遙控脈沖PT也用第一遙控信號檢波部202A檢測。這時(shí),遙控脈沖解碼部203向聲音識(shí)別部404輸出規(guī)定的觸發(fā)脈沖T。以此使其聲音識(shí)別部404起動(dòng)。FM檢波部403從遙控信號R中檢測出通過頻率調(diào)制的聲音信號PS,解調(diào)成原來的聲音信號S。聲音識(shí)別部404將解調(diào)得到的聲音信號S與字典405中登錄的聲音識(shí)別對象數(shù)據(jù)作比較。聲音識(shí)別對象數(shù)據(jù)通常按單詞登錄。聲音識(shí)別部404從字典405中選擇與聲音信號S對應(yīng)的單詞W,通知第二設(shè)備控制部406。第二設(shè)備控制部406對第二控制數(shù)據(jù)存儲(chǔ)部407進(jìn)行訪問,讀出與所通知的單詞W對應(yīng)的命令或控制數(shù)據(jù)D2。在這里,第二控制數(shù)據(jù)存儲(chǔ)部407存儲(chǔ)與登錄于字典405中的各單詞對應(yīng)的命令及控制數(shù)據(jù)。第二設(shè)備控制部406進(jìn)而根據(jù)讀得的命令或控制數(shù)據(jù)D2進(jìn)行規(guī)定的操作。
在該遙控系統(tǒng)中,不是遙控發(fā)送器300,而是作為遙控對象設(shè)備的VTR400包含聲音識(shí)別部404與字典405。因而隨著例如字典405的詞匯的擴(kuò)充或算法的高級化帶來的電路規(guī)模的增大,不受遙控發(fā)送器300的尺寸以及耗電的限制。另一方面,遙控發(fā)送器300用紅外線發(fā)送聲音信號本身。從而,對用聲音的指示也可不分配控制碼,故不受控制碼數(shù)目限制。這樣,上述的遙控系統(tǒng)可容易地?cái)U(kuò)展可用聲音指示的功能,甚至聲音識(shí)別功能自身。
上述的遙控系統(tǒng)特別對用聲音的指示能提供例如下述的GUI。當(dāng)VTR400連接于TV接收機(jī)時(shí),第二設(shè)備控制部406根據(jù)用聲音的指示控制畫面顯示部408,使該TV接收機(jī)的畫面(以下稱“TV畫面”)顯示規(guī)定的畫像。利用這樣的圖像處理功能,在畫面上顯示與聲音識(shí)別有關(guān)的信息,反饋給用戶。這種信息包括例如對用戶的適當(dāng)發(fā)聲的定時(shí)的通知、經(jīng)識(shí)別的單詞或其候補(bǔ)的一覽表、或者經(jīng)識(shí)別的操作內(nèi)容等。而且,在發(fā)生與聲音識(shí)別有關(guān)的錯(cuò)誤時(shí),也可在畫面上顯示該出錯(cuò)信息。通過由這樣的畫面顯示進(jìn)行的信息反饋,用戶容易注意易于識(shí)別的發(fā)音、速度、音調(diào)、或音量。
圖13、14所示的已有的遙控系統(tǒng)中,遙控發(fā)送器使利用鍵操作的指示與利用聲音的指示兩者與共同的控制碼對應(yīng)。但是,在不同的遙控系統(tǒng)間避免使用相同的控制碼,因此分配給一個(gè)遙控系統(tǒng)的控制碼的數(shù)目受到限制。因而在圖13、14所示那樣的遙控系統(tǒng)中控制碼數(shù)目不夠,功能擴(kuò)展有困難。
圖15、16所示的已有的遙控系統(tǒng)中,不是遙控發(fā)送器而是遙控對象設(shè)備進(jìn)行聲音識(shí)別。從而隨著聲音識(shí)別功能的擴(kuò)展引起的電路規(guī)模的增大不受遙控發(fā)送器的大小以及耗電的限制。另一方面,遙控發(fā)送器用紅外線發(fā)送聲音信號本身。因而用聲音指示的種類不受控制碼數(shù)目的限制。這樣,圖15、16所示的遙控系統(tǒng)中功能的擴(kuò)展比圖13、圖14所示的系統(tǒng)更容易。
但是,圖15、16所示的已有的遙控系統(tǒng)存在如下問題。這種遙控系統(tǒng)中,VTR400那樣的遙控對象設(shè)備以遙控脈沖與聲音信號兩種數(shù)據(jù)形態(tài)利用控制信息。這樣,如圖16所示VTR400對遙控脈沖與聲音信號的每一個(gè)分別具有不同的控制系統(tǒng)。即具有根據(jù)利用遙控脈沖表示的控制碼C的第一設(shè)備控制部204與根據(jù)以聲音輸入的單詞W的第二設(shè)備控制部406的兩個(gè)設(shè)備控制部。這兩個(gè)設(shè)備控制部整體的電路規(guī)模受到底板(chassis)尺寸的限制。因而最好是將這些設(shè)備控制部用共用的CPU設(shè)計(jì)在同一基板上。但是控制信息的數(shù)據(jù)形態(tài)(即控制碼C與單詞W)的差異使兩設(shè)備控制部的統(tǒng)一復(fù)雜化。底板設(shè)計(jì)中特別是必須較大地變更僅用遙控脈沖的已有的遙控系統(tǒng)的結(jié)構(gòu)。這在技術(shù)上是困難的,而且由于涉及成本的升高,故不理想。
本發(fā)明的遙控對象設(shè)備,具有(A)遙控接收部,用于接收遙控信號,并將該遙控信號轉(zhuǎn)換為第一遙控脈沖;(B)聲音信號/遙控脈沖變換部,用于輸入聲音信號,選擇對應(yīng)于該聲音信號的控制碼,并將該控制碼變換為第二遙控脈沖;(C)遙控脈沖選擇部,用于根據(jù)規(guī)定的轉(zhuǎn)換信號,選擇第一遙控脈沖與第二遙控脈沖中的某一個(gè);以及(D)遙控脈沖處理部,用于從利用遙控脈沖選擇部所選的遙控脈沖中將控制碼解碼,并根據(jù)該控制碼進(jìn)行動(dòng)作控制。
這里,遙控信號由例如外部的遙控發(fā)送器發(fā)送。即遙控發(fā)送器包含鍵盤,用戶按壓的鍵盤的每個(gè)鍵所對應(yīng)的控制碼作為遙控信號被發(fā)送。上述的遙控對象設(shè)備與這樣的遙控發(fā)送器一起構(gòu)成一個(gè)遙控系統(tǒng)。
上述遙控對象設(shè)備進(jìn)行聲音識(shí)別。這時(shí),將由經(jīng)識(shí)別的聲音信號所表示的控制信息變換為遙控脈沖,并送至遙控脈沖處理部。這樣,應(yīng)由遙控脈沖處理部處理的控制信息以與已有的控制信息共同的數(shù)據(jù)形態(tài)即遙控脈沖表示。從而,即使用戶的控制信息以遙控發(fā)送器來的遙控信號或聲音信號中的任一種數(shù)據(jù)形態(tài)輸入時(shí),作為遙控脈沖處理部也可共用與以往相同的電路結(jié)構(gòu)。即遙控脈沖處理部容易被統(tǒng)一為與以往相同的一個(gè)系統(tǒng)。結(jié)果,底板設(shè)計(jì)方便了。
遙控脈沖選擇部根據(jù)由上述的切換信號產(chǎn)生的啟動(dòng)控制,在聲音信號/遙控脈沖變換部輸出第二遙控脈沖時(shí),向遙控脈沖處理部輸入該第二遙控脈沖,阻斷來自遙控接收部的第一遙控脈沖。這樣,遙控脈沖處理部排他地處理第一遙控脈沖與第二遙控脈沖。從而也可對各不相同的功能在第一遙控脈沖與第二遙控脈沖之間分配共同的控制碼。而且也可以例如以共同的機(jī)殼或電纜等連接聲音信號/遙控脈沖變換部與遙控脈沖選擇部,使第二遙控脈沖不泄漏到遙控對象設(shè)備之外。這樣可以使第二遙控脈沖表示的控制碼與其他遙控系統(tǒng)的控制碼重復(fù)。結(jié)果可以分配任意種類的代碼或數(shù)據(jù)碼作為由第二遙控脈沖表示的控制碼。也就是說,利用第二遙控脈沖表示的控制碼數(shù)目不受像利用第一遙控脈沖表示的控制碼數(shù)目那樣的限制。這樣,上述的遙控對象設(shè)備容易擴(kuò)展能用聲音指示的功能。
上述的遙控對象設(shè)備中,最好是(1)聲音/信號/遙控脈沖變換部具有(a)含有聲音識(shí)別對象數(shù)據(jù)的字典;(b)聲音識(shí)別部,用于計(jì)算各所述聲音信號與所述聲音識(shí)別對象數(shù)據(jù)的相似度,根據(jù)這些相似度選擇能夠?qū)?yīng)于所述聲音信號的聲音識(shí)別對象數(shù)據(jù)的候補(bǔ)或誤碼;(c)控制碼存儲(chǔ)部,用于存儲(chǔ)分別對應(yīng)于聲音識(shí)別對象數(shù)據(jù)與所述誤碼的控制碼;以及(d)輸出控制部,用于從控制碼存儲(chǔ)部讀出與聲音識(shí)別對象數(shù)據(jù)的候補(bǔ)或所述誤碼對應(yīng)的控制碼,將該控制碼變換為第二遙控脈沖,并與所述切換信號一起輸出到遙控脈沖選擇部;(B)遙控脈沖處理部具有(a)遙控脈沖解碼部,用于對由遙控脈沖選擇部選擇的遙控脈沖進(jìn)行解碼,將其變換為與該遙控脈沖對應(yīng)的控制碼;(b)控制數(shù)據(jù)存儲(chǔ)部,用于存儲(chǔ)與各控制碼分別對應(yīng)的控制數(shù)據(jù)與命令;以及(c)設(shè)備控制部,用于從控制數(shù)據(jù)存儲(chǔ)部讀出與由遙控脈沖解碼部解碼的控制碼對應(yīng)的控制數(shù)據(jù)或命令,并基于這些控制數(shù)據(jù)和命令進(jìn)行規(guī)定的動(dòng)作控制。
該遙控對象設(shè)備也可以具有含非易失性記錄媒體的參數(shù)保存部。這時(shí),也可以(A)聲音識(shí)別部向輸出控制部輸出聲音識(shí)別參數(shù);(B)控制碼存儲(chǔ)部存儲(chǔ)與該聲音識(shí)別參數(shù)對應(yīng)的控制碼;(C)輸出控制部從控制碼存儲(chǔ)部讀出該控制碼,并將其變換成所述第二遙控脈沖,輸出到遙控脈沖選擇部;(D)控制數(shù)據(jù)存儲(chǔ)部存儲(chǔ)與所述控制碼對應(yīng)的聲音識(shí)別參數(shù),
(E)設(shè)備控制部從控制數(shù)據(jù)存儲(chǔ)部讀出與由遙控脈沖解碼部解碼的所述控制碼對應(yīng)的聲音識(shí)別參數(shù),并將這些聲音識(shí)別參數(shù)寫入?yún)?shù)保存部。在這里,非易失性記錄媒體最好是快速(flash)存儲(chǔ)器,即匯總消去型EEPROM。
聲音識(shí)別參數(shù)包含例如音質(zhì)等級(將聲首長度引起的頻率對功率譜偏移經(jīng)過標(biāo)準(zhǔn)化后的等級)等音響分析參數(shù)或似然閾值。由于利用第二遙控脈沖表示的控制碼數(shù)目十分多,因此也可以對聲音識(shí)別參數(shù)分配這些控制碼的一部分。這樣,可對參數(shù)保存部通知聲音識(shí)別部設(shè)定的聲音識(shí)別參數(shù)。這樣,通過用非易失記錄媒體存儲(chǔ)聲音識(shí)別參數(shù),則不論電源的通斷都能保持有關(guān)聲音識(shí)別的學(xué)習(xí)履歷。結(jié)果,在電源再接入時(shí)可迅速實(shí)現(xiàn)聲音識(shí)別參數(shù)的最佳化。
在上述的遙控對象設(shè)備中,聲音信號/遙控脈沖變換部也可包含(A)聲音輸入部,用于輸入用戶的聲音并變換為所述的聲音信號,(B)起動(dòng)控制部,用于按照所述聲音信號的振幅起動(dòng)聲音信號/遙控脈沖變換部。所述遙控對象設(shè)備直接或用有線方式輸入用戶的聲音信號。從而,在包含該遙控對象設(shè)備的遙控系統(tǒng)中,遙控發(fā)送器也可與已有的遙控發(fā)送器相同。而且,由于聲音信號/遙控脈沖變換部通過檢測出聲音信號的振幅并自動(dòng)起動(dòng),因此用戶只向遙控對象設(shè)備發(fā)聲,就可由聲音執(zhí)行遙控。
本發(fā)明的遙控系統(tǒng)具有(A)遙控發(fā)送器,用于發(fā)送遙控信號,而且包含(a)聲音輸入部,用于輸入用戶的聲音并變換為聲音信號;(b)無線發(fā)送部,用于以所述聲音信號調(diào)制由超聲波、紅外線或電波形成的載波并向外部發(fā)送;(B)上述遙控對象設(shè)備,聲音信號/遙控脈沖變換部包含(a)無線接收部,用于接收所述載波;(b)起動(dòng)控制部,用于根據(jù)所述載波的振幅起動(dòng)所述聲音信號/遙控脈沖變換部。
該遙控系統(tǒng)中,利用無線方式將聲音信號從遙控發(fā)送器輸入遙控對象設(shè)備。這樣,聲音輸入部不受電纜等的制約,可置于用戶近旁。從而可抑制周圍的噪聲混入聲音信號。而且由于聲音信號/遙控脈沖變換部通過檢測出載波自動(dòng)起動(dòng),故用戶只向遙控發(fā)送器輸入聲音,可由聲音執(zhí)行遙控。
本發(fā)明的圖像處理裝置,具有按照設(shè)備控制部的控制顯示規(guī)定的圖像用的畫面顯示部,而且是上述遙控對象設(shè)備,(A)控制數(shù)據(jù)存儲(chǔ)部使對于畫面顯示部的控制數(shù)據(jù)與命令以及畫面顯示部顯示用的顯示數(shù)據(jù)分別對應(yīng)規(guī)定的控制碼加以存儲(chǔ);(B)設(shè)備控制部從控制數(shù)據(jù)存儲(chǔ)部讀出與由遙控脈沖解碼部從第二遙控脈沖解碼的控制碼對應(yīng)的顯示數(shù)據(jù),由畫面顯示部顯示該顯示數(shù)據(jù)。在這里,所述顯示數(shù)據(jù)也可包含文本數(shù)據(jù)。該文本數(shù)據(jù)中包含例如聲音識(shí)別對象數(shù)據(jù)的候補(bǔ)、表示聲音識(shí)別錯(cuò)誤的文字、或聲音識(shí)別參數(shù)。此外,該顯示數(shù)據(jù)也可包含圖像數(shù)據(jù)。該圖像數(shù)據(jù)中包含例如表示聲音識(shí)別錯(cuò)誤的圖像、表示發(fā)聲時(shí)刻的圖像、或者表示聲音識(shí)別參數(shù)用的圖像(例如音質(zhì)等級指示器)。
所述的圖像處理裝置特別對用聲音的指示可提供例如下述的GUI。設(shè)備控制部根據(jù)用聲音的指示控制畫面顯示部,并將所述顯示數(shù)據(jù)顯示在畫面上。這樣,有關(guān)聲音識(shí)別的信息對用戶進(jìn)行視覺上的反饋。該信息包含例如對用戶的適當(dāng)發(fā)聲定時(shí)的通知、經(jīng)識(shí)別的單詞或其候補(bǔ)的一覽表、或經(jīng)識(shí)別的操作內(nèi)容。而且,在發(fā)生與聲音識(shí)別相關(guān)的錯(cuò)誤時(shí),也可在畫面上顯示該出錯(cuò)信息。通過由這樣的畫面顯示產(chǎn)生的信息的反饋,用戶容易注意易識(shí)別的發(fā)音、速度、音調(diào)、或音量。
本發(fā)明的新穎特征雖都在所附的權(quán)利要求所述的范圍內(nèi),但本發(fā)明與結(jié)構(gòu)、內(nèi)容兩方面有關(guān),從聯(lián)系附圖并理解下述的詳細(xì)說明中可更好地理解并評價(jià)其他的目的與特征。
圖2是表示本發(fā)明的實(shí)施例1的遙控系統(tǒng)所含有的遙控發(fā)送器10的結(jié)構(gòu)框圖。
圖3是表示本發(fā)明的實(shí)施例1的DTV20內(nèi)的有關(guān)遙控系統(tǒng)的一部分的框圖。
圖4是表示本發(fā)明的實(shí)施例1的聲音/遙控脈沖變換部30的動(dòng)作細(xì)節(jié)的流程圖。
圖5是表示對于本發(fā)明的實(shí)施例1的遙控脈沖選擇部23,第1遙控脈沖P1與第二遙控脈沖P2的切換的詳細(xì)流程圖。
圖6是表示對于本發(fā)明的實(shí)施例1的DTV20,有關(guān)用聲音的遙控的設(shè)備控制部25的動(dòng)作細(xì)節(jié)的流程圖。
圖7是表示對于本發(fā)明的實(shí)施例1的聲音信號/遙控脈沖變換部30,聲音識(shí)別參數(shù)的送出的細(xì)節(jié)的流程圖。
圖8是表示對于本發(fā)明的實(shí)施例1的設(shè)備控制部25,聲音識(shí)別參數(shù)的接收及保存的細(xì)節(jié)的流程圖。
圖9是表示對于本發(fā)明的實(shí)施例1的DVT20中的GUI,根據(jù)各控制碼,TV畫面28A顯示的圖像數(shù)據(jù)的例圖。
圖10是表示本發(fā)明的實(shí)施例2的DTV20A的遙控系統(tǒng)的外觀示意圖。
圖11是表示本發(fā)明的實(shí)施例2的遙控系統(tǒng)所含有的遙控發(fā)送器10A的結(jié)構(gòu)框圖。
圖12是表示本發(fā)明的實(shí)施例2的DTV20A內(nèi)的有關(guān)遙控系統(tǒng)部分的框圖。
圖13是表示已有的遙控系統(tǒng)的一例中所含的遙控發(fā)送器100的結(jié)構(gòu)框圖。
圖14是表示已有的遙控系統(tǒng)的一例中的遙控對象設(shè)備即VTR200內(nèi)與遙控有關(guān)部分的框圖。
圖15是表示已有的遙控系統(tǒng)的另一例中所含的遙控發(fā)送器400的結(jié)構(gòu)框圖。
圖16是表示已有的遙控系統(tǒng)的另一例中的遙控對象設(shè)備即VTR400內(nèi)的與遙控及聲音識(shí)別有關(guān)部分的框圖。
附圖的一部分或全部以圖示為目的示意表達(dá)描繪,不一定真實(shí)地描出這里表示的主要部件的實(shí)際的相對尺寸和位置。
實(shí)施例1本發(fā)明的實(shí)施例1的圖像處理裝置是數(shù)字電視接收機(jī)(以下簡稱DTV)。該DTV中搭載用通過裝話筒的遙控發(fā)送器的鍵操作與聲音實(shí)現(xiàn)的遙控系統(tǒng)。
圖1是表示本發(fā)明的實(shí)施例1的DTV20的遙控系統(tǒng)外觀示意圖。用戶按壓遙控發(fā)送器10的鍵盤中的一鍵。這時(shí),與該鍵對應(yīng)的控制信息(例如目標(biāo)頻道號等)從第一紅外線LED 4K發(fā)送到DTV20作為例如用紅外線的遙控信號RK。該信號RK由DTV20的第一受光部20接收并解碼出對應(yīng)的控制信息。由此執(zhí)行該控制信息的指示操作。例如在TV畫面28A映出與鍵盤1的每個(gè)鍵對應(yīng)的頻道的節(jié)目。這樣,實(shí)現(xiàn)通過用遙控發(fā)送器10的鍵操作的遙控。
用戶一邊按壓遙控發(fā)送器的發(fā)聲鈕8,一邊對話筒5輸入表示對于DTV20的控制信息(例如目標(biāo)頻道號等)的聲音V。這時(shí),該聲音V被變換為例如用紅外線表示的聲音信號RV并由第二紅外線LED 4V發(fā)送到DTV20。RV由聲音信號/遙控脈沖變換部30的第二受光部31接收并解碼出對應(yīng)的控制信息。經(jīng)解碼的控制信息通過例如電纜38傳送至DTV20主體,執(zhí)行與該控制信息對應(yīng)的操作。例如在TV畫面28A映出聲音V指出的目標(biāo)頻道的節(jié)目。這樣,實(shí)現(xiàn)以使用遙控發(fā)送器10的按-講(press-to-talk)方式的、通過聲音的遙控。
實(shí)施例1的遙控系統(tǒng),由于遙控發(fā)送器10內(nèi)裝話筒5,故用戶與話筒5之間距離近。從而容易避免周圍噪聲等對話筒5的侵入??梢愿呔鹊貙?shí)現(xiàn)聲音識(shí)別。
圖2是表示上述遙控系統(tǒng)所包含的遙控發(fā)送器10的結(jié)構(gòu)框圖。鍵盤1如圖1所示,包含與各頻道號對應(yīng)的選臺(tái)鈕、在TV畫面上使作為GUI顯示的光標(biāo)移動(dòng)用的上下左右鈕1a、以及執(zhí)行決定操作用的決定鈕。各個(gè)鍵盤1對應(yīng)不同的控制信息。控制信息包括例如頻道號等的控制數(shù)據(jù)、以及用于指示電源通斷、音量調(diào)節(jié)、聲音多模式切換、雙畫面顯示等畫面顯示模式的切換等的命令??刂菩畔⒁砸?guī)定的格式碼(以下稱作“控制碼”)表示,例如用1比特的碼來識(shí)別。遙控脈沖變換部2識(shí)別用戶所按的鍵1的一鍵。選擇該鍵對應(yīng)的控制碼,作為電信號輸出(以下稱為“第一遙控脈沖P1”)。第一LED驅(qū)動(dòng)部3K根據(jù)第一遙控脈沖P1,使第一紅外線LED 4K點(diǎn)亮、熄滅。這時(shí)載波利用PPM調(diào)制。這樣經(jīng)調(diào)制的紅外線即遙控信號RK被送往DTV20。
與鍵盤1的每一個(gè)對應(yīng)的控制碼以紅外線的遙控信號RK被發(fā)往DTV20。這時(shí)作為與鍵盤1的每一個(gè)對應(yīng)的控制碼,采用例如向財(cái)團(tuán)法人家電制品協(xié)會(huì)預(yù)先登錄的控制碼,使DTV20不致將從其他同樣的遙控系統(tǒng)發(fā)出的遙控信號誤認(rèn)為其遙控信號RK。財(cái)團(tuán)法人家電制品協(xié)會(huì)規(guī)定的控制碼格式(以下稱為“家制協(xié)格式”)包含1比特的類別碼與1比特的數(shù)據(jù)碼。類別碼表示例如TV或VTR等的制品類別,分配給每一生產(chǎn)商。因此在家制協(xié)格式中利用類別識(shí)別遙控系統(tǒng)。即不同的遙控系統(tǒng)間由于類別碼不同,故避免使用同一控制碼。數(shù)據(jù)碼表示實(shí)際的控制信息。因此在家電制格式中每類制品即每個(gè)遙控系統(tǒng)可使用最多256種碼作為控制碼。即是說,能作為利用一個(gè)遙控系統(tǒng)的遙控信號RK使用的控制碼數(shù)目限制在最多256個(gè)。
話筒5將用戶的聲音V輸入并變換為電信號。低頻放大器6從利用話筒5變換的電信號中提取與聲音V對應(yīng)的頻率成分并作為聲音信號S輸出。頻率調(diào)制部7根據(jù)聲音信號5的振幅變動(dòng)對規(guī)定的高頻載波實(shí)行頻率調(diào)制,作為頻率調(diào)制波PS輸出。第二LED驅(qū)動(dòng)部3V根據(jù)聲音信號形成的調(diào)頻波PS使第二紅外線LED 4V的電流量變動(dòng)。由此,第二紅外線LED 4V按照調(diào)頻波PS改變發(fā)光輸出。這樣,由經(jīng)調(diào)制的紅外線形成的聲音信號RV被送往DTV20。
第一紅外線LED 4K與第二紅外線LED 4V最好發(fā)不同波長的紅外線。這樣,DTV20能容易地識(shí)別遙控信號RK與由紅外線形成的聲音信號RV。此外,也可以第一紅外線LED 4K與第2紅外線LED 4V采用共同的紅外線LED,第一LED驅(qū)動(dòng)部3K與第二LED驅(qū)動(dòng)部3V采用共用的LED驅(qū)動(dòng)部。但這時(shí)有必要使例如遙控信號PK與紅外線形成的聲音信號RV每一個(gè)包含不同的識(shí)別碼。
發(fā)聲鈕8是驅(qū)動(dòng)電力供給部9用的開關(guān)。電力供給部9被驅(qū)動(dòng)時(shí),就對低頻放大器6、調(diào)頻部7、以及第二LED驅(qū)動(dòng)部3V供電。只有用戶按下發(fā)聲鈕8期間,才將用戶的聲音V作為紅外線形成的聲音信號RV送往DTV20。這樣遙控發(fā)送器10實(shí)現(xiàn)通過按講方式的聲音V的發(fā)送。
圖3是表示DTV20內(nèi)的遙控系統(tǒng)有關(guān)部分的框圖。第一受光部21含有光電二極管等受光元件,檢測來自外部的紅外線。這里,檢測對象的紅外線的波長與遙控發(fā)送器10的第一紅外線LED 4K的波長相等。遙控信號檢測部22從第一受光部21檢測出的紅外線中識(shí)別來自遙控發(fā)送器10識(shí)別的遙控信號RK,并變換為第一遙控脈沖P1。遙控脈沖選擇部23一般選擇遙控信號檢波部22作為輸入源。即,第一遙控脈沖P1通常被輸往遙控脈沖解碼部24。遙控脈沖解碼部24根據(jù)第一遙控脈沖P1將其控制碼C解碼,并通知設(shè)備控制部25。設(shè)備控制部25接收該控制碼C時(shí),對控制數(shù)據(jù)存儲(chǔ)部26進(jìn)行訪問??刂茢?shù)據(jù)存儲(chǔ)部26存儲(chǔ)著與每個(gè)控制碼對應(yīng)的命令或控制數(shù)據(jù)。設(shè)備控制部25從控制數(shù)據(jù)存儲(chǔ)部26讀出與輸入的控制碼C對應(yīng)的命令或數(shù)據(jù)D。進(jìn)而根據(jù)該命令或控制數(shù)據(jù)D控制例如畫面顯示部28等功能部,執(zhí)行規(guī)定的操作。
聲音信號/遙控脈沖變換部30利用以下的結(jié)構(gòu)接收來自遙控發(fā)送器10的由紅外線形成的聲音信號RV,并對此進(jìn)行聲音識(shí)別。用與利用第1遙控脈沖P1所示的控制碼以共同的格式對利用經(jīng)識(shí)別的聲音表示的控制信息進(jìn)行編碼。經(jīng)編碼的控制信息(即控制碼)作為與第一遙控脈沖P1共同格式的電信號(以下稱“第二遙控脈沖P2”)輸出。第二受光部31含有發(fā)電二極管受光元件,檢測來自外部的紅外線。這里,檢測對象的紅外線的波長等于遙控發(fā)送器10的第二紅外線LED 4V的波長。FM檢波部32從第二受光部31相測出的紅外線中提取由遙控發(fā)送器10的第二紅外線LED 4V形成的載波并通知載波檢測部33。而且從該載波的頻率變動(dòng)檢測出的聲音信號形成的頻率調(diào)制波,解碼成原來的聲音信號S。載波檢測部33將FM檢波部提取的載波的振幅與規(guī)定的電平作比較,當(dāng)載波振幅超過該規(guī)定電平增大時(shí),載波檢測部33使聲音識(shí)別開始信號T轉(zhuǎn)移的邏輯上的真狀態(tài)(以下稱作“認(rèn)定”)。另一方面,當(dāng)載波振幅比規(guī)定電平更低時(shí),載波檢測部33使聲音識(shí)別開始信號T轉(zhuǎn)移為邏輯上的偽狀態(tài)(以下稱“取消”)。這里,邏輯上的真/偽狀態(tài)在正邏輯中對應(yīng)于高/低電壓狀態(tài),在負(fù)邏輯對應(yīng)于低/高電壓狀態(tài)。
來自載波檢測部33的聲音識(shí)別開始信號T進(jìn)行認(rèn)定期間,聲音識(shí)別部34起動(dòng)。聲音識(shí)別部34將來自FM檢測部32的聲音信號S與登錄于字典35的聲音識(shí)別對象數(shù)據(jù)加以比較。聲音識(shí)別對象數(shù)據(jù)通常登錄成一個(gè)個(gè)單詞。聲音識(shí)別部34從字典35中選擇與聲音信號S對應(yīng)的單詞W并通知輸出控制部36。輸出控制部36在接收到來自聲音識(shí)別部34的單詞W的通知時(shí)對控制碼存儲(chǔ)部37進(jìn)行訪問。控制碼存儲(chǔ)部37存儲(chǔ)著與登錄于字典的每個(gè)單詞分別對應(yīng)的控制碼。輸出控制部36從控制碼存儲(chǔ)部37讀出與由聲音識(shí)別部34通知的單詞W對應(yīng)的控制碼C。這里,控制碼存儲(chǔ)部37存儲(chǔ)的控制碼C由與第一遙控脈沖P1所表示的控制碼共用的格式、例如家制協(xié)格式定義。即用2比特的碼識(shí)別。輸出控制部36將從控制碼存儲(chǔ)部37讀出的控制碼變換為第二遙控脈沖P2并輸往遙控脈沖選擇部23。
輸出控制部36在送出第二遙控脈沖P2時(shí),先對遙控脈沖切換信號N進(jìn)行認(rèn)定。在該認(rèn)定以后僅待機(jī)規(guī)定時(shí)間(例如100毫秒)后通過例如電纜38將第二遙控脈沖P2送往遙控脈沖選擇部23。在遙控脈沖切換信號N的認(rèn)定時(shí)遙控脈沖選擇部23選擇輸出控制部26作為輸入源。由此,第二遙控脈沖P2被輸入遙控脈沖解碼部24。遙控脈沖解碼部24根據(jù)第二遙控脈沖P2解碼出控制碼C。這里,第二遙控脈沖P2與第一遙控脈沖P1是共同格式的,所以遙控脈沖解碼部23對第二遙控脈沖P2不與第一遙控脈沖P1區(qū)別地進(jìn)行同樣的解碼。
向遙控脈沖解碼部24輸入第二遙控脈沖P2的開始,僅從遙控脈沖選擇部23進(jìn)行的輸入切換后起滯后上述規(guī)定時(shí)間。遙控脈沖解碼部24將滯后判斷為遙控脈沖無輸入狀態(tài)(無操作NOP)。這樣,遙控脈沖解碼部24能將接著輸入的第二遙控脈沖P2跟此前輸入的第一遙控脈沖P1明確地區(qū)別開來。遙控脈沖解碼部24將解碼后的控制碼C通知設(shè)備控制部25。這時(shí)檢測出遙控脈沖切換信號N的認(rèn)定,將該控制碼C是由聲音信號/遙控脈沖變換部30產(chǎn)生的事實(shí)通知設(shè)備控制部25。
利用第二遙控脈沖P2所表示的控制碼與利用第一遙控脈沖P1所表示的控制碼是共同的格式。因此設(shè)備控制部25并不特別區(qū)別這兩者的遙控脈沖而可同樣地處理。即設(shè)備控制部25在接收利用第二遙控脈沖P2所表示的控制碼C時(shí),對控制數(shù)據(jù)存儲(chǔ)部26進(jìn)行訪問??刂茢?shù)據(jù)存儲(chǔ)部26存儲(chǔ)著與各控制碼對應(yīng)的命令或控制數(shù)據(jù)。設(shè)備控制部25從控制數(shù)據(jù)26讀出與輸入的控制碼C對應(yīng)的命令或控制數(shù)據(jù)D。并根據(jù)該命令或控制數(shù)據(jù)D控制例如畫面顯示部28等功能部,執(zhí)行規(guī)定的操作。這樣,在實(shí)施例1的遙控系統(tǒng)中,對第一遙控脈沖P1與第二遙控脈沖P2中任一個(gè)都共同地使用遙控脈沖解碼部24與設(shè)備控制部25。特別是它們被構(gòu)成為與已有的電路相同的一個(gè)系統(tǒng)的控制電路。結(jié)果底板設(shè)計(jì)容易。
第二遙控脈沖P2通過例如電纜38,僅在從聲音信號/遙控脈沖變換部30至遙控脈沖選擇部23之間傳送。即是說,第二遙控脈沖P2不泄漏到DTV20的外部。因而與第一遙控脈沖P1不同,不為與DTV20同樣的其他遙控對象設(shè)備所接收。因此,利用第二遙控脈沖P2所表示的控制碼與利用第一遙控脈沖P1表示的控制碼不同,與其他遙控系統(tǒng)中的控制碼重復(fù)也無妨。例如在家制協(xié)格式中,利用第一遙控脈沖P1所表示的控制碼的總數(shù)被限于數(shù)據(jù)碼的數(shù)據(jù)量(最大1比特=256個(gè)),而利用第二遙控脈沖P2所表示的控制碼的總數(shù)允許達(dá)到類別碼與數(shù)據(jù)碼的全部數(shù)據(jù)量(2比特=4096個(gè))。這樣,在實(shí)施例1的遙控系統(tǒng)中,作為通過聲音的控制信息可能分配的控制碼數(shù)目是豐富的。結(jié)果容易擴(kuò)展可利用聲音指示的功能。
實(shí)施例1的DTV20利用上述結(jié)構(gòu),根據(jù)以下的流程實(shí)現(xiàn)特別是通過聲音的遙控。圖4為表示聲音信號/遙控脈沖變換部30的動(dòng)作細(xì)節(jié)的流程。
(步驟S1)用戶一邊按下遙控發(fā)送器10的發(fā)聲鈕,一邊將表示控制信息的聲音V輸入到話筒5。這時(shí),第二紅外線LED 4V發(fā)光,并將紅外線形成的載波發(fā)送到DTV20。用戶的聲音V作為該載波的頻率調(diào)制被傳送。FM檢波部32從第二受光部31檢測出的紅外線中提取由遙控發(fā)送器10的第二紅外線LED 4V形成的載波,并通知載波檢測部33。當(dāng)該載波的振幅超過規(guī)定電平增大時(shí),載波檢測部33對聲音識(shí)別開始信號T進(jìn)行認(rèn)定。聲音識(shí)別部34檢測該聲音識(shí)別開始信號T的上升沿。
(步驟S2)聲音識(shí)別部34將聲音識(shí)別開始檢測信號T的認(rèn)定通知輸出控制部36。由此,示出控制部36將表示音識(shí)別開始的控制碼(以下稱作“識(shí)別開始碼”)變換為第二遙控脈沖P2并送出。
(步驟S3)FM檢波部32從上述載波中檢測由聲音信號形成的頻率調(diào)制波,并解調(diào)成原來的聲音信號S。聲音識(shí)別部34對該聲音信號進(jìn)行識(shí)別處理。具體地說,首先將聲音信號S與登錄于字典的每個(gè)單詞作比較,計(jì)算雙方的似然性。接著,根據(jù)該似然性,按規(guī)定條件決定第一候補(bǔ)單詞W。
(步驟S4)判斷識(shí)別處理是否正常地進(jìn)行,即第一候補(bǔ)單詞是否正確地決定。例如利用所計(jì)算的似然性對登錄于字典35的單詞的任一個(gè)都不滿足規(guī)定條件,就在第一候被單詞未決定時(shí)判斷為有識(shí)別錯(cuò)誤。在無識(shí)別錯(cuò)誤時(shí),處理進(jìn)到步驟S5。有識(shí)別錯(cuò)誤時(shí)處理向步驟S7分支。
在以下的情況下也判斷為有識(shí)別錯(cuò)誤。用戶按下遙控發(fā)送器10的發(fā)聲鈕在發(fā)聲途中誤中斷時(shí),遙控發(fā)送器10中第二紅外線1ED 4V的發(fā)光突然停止。這時(shí),聲音信號/遙控脈沖變換部30中利用FM檢波部32取出的載波振幅突然下降到載波檢測部33設(shè)定定規(guī)定電平之下。遙控發(fā)送器10的第二紅外線LED 4V出射的紅外線PV在發(fā)聲途中被障礙物遮住時(shí),或由于遙控發(fā)送器10內(nèi)裝的電池的消耗使第二紅外線LED 4V的輸出在發(fā)聲涂中顯著衰減時(shí),載波的振幅也同樣急劇減小。根據(jù)載波振幅的減小,載波檢測部33對聲音識(shí)別開始信號取消。聲音識(shí)別部34在檢測出聲音識(shí)別信號T的下降沿時(shí)中斷識(shí)別處理,對于該中斷前的一定時(shí)間測量聲音的平均功率。如該平均功率大于規(guī)定的平均功率,則判斷為有所謂“發(fā)聲途中的載波遺失”的識(shí)別錯(cuò)誤。
(步驟S5)輸出控制部36從聲音識(shí)別部取出第一候補(bǔ)的單詞W。
(步驟S6)輸出控制部36控制碼存儲(chǔ)部37進(jìn)行取數(shù)取,從后者讀出第一候補(bǔ)單詞W對應(yīng)的控制碼C。并將讀出的控制碼C變換成第二遙控脈沖P2并送出。
(步驟S7)
聲音識(shí)別部34中斷識(shí)別處理。而且對每個(gè)原因?qū)⒆R(shí)別錯(cuò)誤有關(guān)的信息通知輸出控制部36。輸出控制部36從控制碼存儲(chǔ)部37讀出該通知的信息對應(yīng)的控制碼(以下稱作錯(cuò)誤碼)。將該錯(cuò)誤碼變換為第二遙控脈沖P2并送出。
(步驟S8)用戶停止按壓遙控發(fā)送器10的發(fā)聲鈕8。由此在遙控發(fā)送器10中停止第二紅外線LED 4V中停止第二紅外線LED 4V的發(fā)光。在聲音信號/遙控脈沖變換部30中,F(xiàn)M檢波部32取出的載波的振幅下降至載波檢測部33設(shè)定的規(guī)定電平之下。這時(shí),載波檢測部33取消聲音識(shí)別開始信號T。聲音識(shí)別部34檢測該聲音識(shí)別開始信號T的下降沿。
(步驟S9)聲音識(shí)別部34將聲音識(shí)別開始檢測信號T的取消通知輸出控制部36。由此,輸出控制部36將表示聲音識(shí)別結(jié)束的控制碼(以下稱識(shí)別結(jié)束碼)變換為第二遙控脈沖P2,并送出之。
圖5表示遙控脈沖選擇部23的進(jìn)行的第一遙控脈沖P1與第二遙控脈沖P2之間的切換的細(xì)節(jié)的流程圖。
(步驟S11)聲音信號/遙控脈沖變換部3C中,輸出控制部36在第2遙控脈沖P2的送出之前對遙控脈沖切換信號N進(jìn)行認(rèn)定。遙控脈沖選擇部23檢測遙控脈沖切換信號N的認(rèn)定,選擇輸出控制部36作為輸入源。由此對遙控脈沖選擇部23的輸入從第一遙控脈沖P1切換到第二遙控脈沖P2。
(步驟S12)輸出控制部36從遙控脈沖切換信號N的認(rèn)定起待機(jī)約100msce。在待機(jī)期間,不向遙控脈沖解碼部24輸入遙控脈沖。由此,遙控脈沖解碼部24判斷NOP。
(步驟S13)從遙控脈沖切換信號N的認(rèn)定起約經(jīng)過10msec后,輸出控制部36向控制脈沖選擇部23送出第二遙控脈沖dP2。遙控脈沖解碼部24從第二遙控脈沖P2中解碼出控制碼C,并通知設(shè)備控制部25。
(步驟S14)輸出控制部36在第二遙控脈沖P2送出結(jié)束時(shí)僅待機(jī)約100msec。在待機(jī)期間不向遙控脈沖解碼部24輸入遙控脈沖。由此,遙控脈沖解碼部判斷NOP。
(步驟S15)
輸出控制部36在從第二遙控脈沖P2送出結(jié)束后經(jīng)過約100msec,對遙控脈沖切換信號N進(jìn)行認(rèn)定。遙控脈沖選擇部23檢測遙控脈沖切換信號N的認(rèn)定,再次選擇遙控信號檢波部22作為輸入源。由此,對遙控脈沖選擇部23的輸入從第二遙控脈沖P2向第一遙控脈沖P1切換。
遙控脈沖選擇部23如上述那樣互相排他性地向遙控脈沖解碼部24輸入第一遙控脈沖P1與第二遙控脈沖P2,從而避免了兩個(gè)脈沖的沖突。從而在遙控發(fā)送器10中通過鍵操作的遙控與通過聲音的遙控之間良好地實(shí)現(xiàn)了遙控脈沖解碼部24與設(shè)備控制部25的共用。而且,聲音信號/遙控脈沖變換部30中的控制碼也可以與遙控發(fā)送器10呂的控制碼重復(fù)。
通過遙控脈沖選擇部23的遙控脈沖切換時(shí)對遙控脈沖解碼部24的輸入實(shí)際上是經(jīng)過一定時(shí)間的停止期間后切換的。遙控脈沖解碼部24將該停止期間判斷為NOP,從而能正確地區(qū)別在該停止期前分別輸入的不同的遙控脈沖。也就是說,防止了將在遙控脈沖切換前后分別輸入的第一遙控脈沖P1與第二遙控脈沖P2誤認(rèn)為相連的遙控脈沖。因而即使頻繁地切換第一遙控脈沖P1與第二遙控脈沖P2時(shí),遙控脈沖解碼部24也能從各自的遙控脈沖中正確地解碼出控制碼。
圖6表示與用聲音的遙控有關(guān)的DTV20的設(shè)備控制部25的動(dòng)作細(xì)節(jié)的流程圖。
(步驟S21)設(shè)備控制部25從聲音信號/遙控脈沖變換部30接收識(shí)別開始碼。這時(shí),設(shè)備控制部25對控制數(shù)據(jù)存儲(chǔ)部26進(jìn)行訪問。讀出識(shí)別開始碼對應(yīng)的控制數(shù)據(jù)。這里,該控制數(shù)據(jù)包含例如,表示聲音識(shí)別開始的文本數(shù)據(jù)或圖像數(shù)據(jù)和用于指示畫面顯示部的命令,使這些數(shù)據(jù)顯示在畫面上。
(步驟S22)設(shè)備控制部25按照中述命令控制畫面顯示部28,由此將上述文本數(shù)據(jù)或圖像數(shù)據(jù)顯示在TV畫面上。
(步驟S23)設(shè)備控制部25接收由第二遙控脈沖P2表示的控制碼。這時(shí),設(shè)備控制部25對控制數(shù)據(jù)存儲(chǔ)部26進(jìn)行訪問,讀出該控制碼對應(yīng)的控制數(shù)據(jù)。這里,在聲音信號/遙控脈沖變換部30正常地決定了第一候補(bǔ)單詞W時(shí),從控制數(shù)據(jù)存儲(chǔ)部26讀出該單詞W對應(yīng)的數(shù)據(jù)或命令。另一方面,在設(shè)備控制部25接收的控制碼是錯(cuò)誤時(shí),就從控制數(shù)據(jù)存儲(chǔ)部26讀出該錯(cuò)碼表示的識(shí)別錯(cuò)誤有關(guān)的信息。
(步驟S24)判斷從控制數(shù)據(jù)存儲(chǔ)部26讀出的控制數(shù)據(jù)是否與識(shí)別錯(cuò)誤有關(guān)的信息。在控制數(shù)據(jù)不是與識(shí)別錯(cuò)誤有關(guān)的信息時(shí),處理進(jìn)入步驟S25,否則處理向步驟S27分支。
(步驟S25)根據(jù)聲音信號/遙控脈沖變換部30決定的第一候補(bǔ)單元W對應(yīng)的控制數(shù)據(jù),設(shè)備控制部25控制DTV20內(nèi)的功能部。例如該控制數(shù)據(jù)含有表示頻道切換的命令和目標(biāo)頻道編號時(shí),設(shè)備控制部25控制畫面顯示部28,在TV畫面上顯示該目標(biāo)頻道的節(jié)目。
(步驟S26)設(shè)備控制部25從控制數(shù)據(jù)存儲(chǔ)部26讀出表示第一候補(bǔ)單詞W的文本數(shù)據(jù),利用畫面顯示部顯示于TV畫面上。而且也可以從控制數(shù)據(jù)存儲(chǔ)部26讀出表示聲音識(shí)別成功的圖像數(shù)據(jù),利用畫面顯示部28顯示于TV畫面上。這樣,按照通過聲音的指示,DTV20執(zhí)行的動(dòng)作內(nèi)容通知給用戶。
(步驟S27)設(shè)備控制部25從控制數(shù)據(jù)存儲(chǔ)部26讀出表示識(shí)別錯(cuò)誤的因素的文本數(shù)據(jù)并利用畫面顯示部顯示在TV畫面上。而且也可以從控制數(shù)據(jù)存儲(chǔ)部26讀出表示識(shí)別錯(cuò)誤的圖像數(shù)據(jù)并利用畫面顯示部顯示在TV畫面上。這樣,通過聲音的指示未被DTV20識(shí)別的事實(shí)與其原因一起通知給用戶。
(步驟S28)設(shè)備控制部接收識(shí)別結(jié)束碼。這時(shí),設(shè)備控制部25進(jìn)行暫停處理,僅在規(guī)定時(shí)間內(nèi)維持步驟S26或步驟S27中的文本數(shù)據(jù)或圖像數(shù)據(jù)的顯示。
(步驟S29)設(shè)備控制部25控制畫面顯示部28,消去在步驟S26或步驟S27中顯示的文本數(shù)據(jù)或圖像數(shù)據(jù)。在步驟S26或S27中TV畫面上以文本數(shù)據(jù)或圖像數(shù)據(jù)顯示由DTV20聲音識(shí)別結(jié)果有關(guān)的信息。由此,用戶可視覺地判斷通過聲音的指示是否被正確地識(shí)別。而且在厚在誤識(shí)別的情況下,用戶可視覺地掌握其內(nèi)容。此外,通過調(diào)節(jié)步驟S28中文本數(shù)據(jù)或圖像數(shù)據(jù)的顯示時(shí)間,用戶能視覺地判斷應(yīng)該發(fā)聲下一次聲音指示的時(shí)間。
利用第二遙控脈沖P2表示的控制碼數(shù)目與利用第一遙控脈沖P1表示的控制碼數(shù)目不同,不受限制。因此利用第二遙控脈沖P2表示的控制碼數(shù)目是豐富的。例如也可對利用聲音識(shí)別部34設(shè)定的聲音識(shí)別參數(shù)分配這些控制碼中的一部分。聲音識(shí)別參數(shù)例如包含音質(zhì)級別等音響分析參數(shù)或似然性閾值。
聲音識(shí)別參數(shù)也可作為控制碼由聲音識(shí)別部34通知設(shè)備控制部25。設(shè)備控制部25按類別將所通知的聲音識(shí)別參數(shù)寫入?yún)?shù)保存部27(參照圖3)。由此可保持經(jīng)聲音識(shí)別部34優(yōu)化的聲音識(shí)別參數(shù)。參數(shù)保存部27含有非易失性存儲(chǔ)媒體,較好的是閃存。此外也可包含硬盤。由此可與DTV20的電源通斷無關(guān)地保存經(jīng)優(yōu)化的聲音識(shí)別參數(shù)。當(dāng)電源再接通時(shí),聲音識(shí)別部34基于基數(shù)保存部27保持的聲音識(shí)別參數(shù),能迅速地實(shí)現(xiàn)新參數(shù)的優(yōu)化。
經(jīng)聲音識(shí)別部34優(yōu)化后的聲音識(shí)別參數(shù)按以下的流程通知設(shè)備控制部,并由參數(shù)保存部27存儲(chǔ)。圖7表示由聲音信號/遙控脈沖變換部30產(chǎn)生的聲音識(shí)別參數(shù)的送出的詳細(xì)流程圖。
(步驟S31)聲音識(shí)別部34對輸出控制部36指示取出聲音識(shí)別參數(shù)。這時(shí)輸出控制部36從控制碼存儲(chǔ)部37讀出表示聲音識(shí)別參數(shù)轉(zhuǎn)送開始的控制碼(以下稱參數(shù)轉(zhuǎn)送開始碼),并變換為第二遙控脈沖P2,送出之。
(步驟S32)輸出控制部36從聲音識(shí)別部34取出聲音識(shí)別參數(shù)。
(步驟S33)輸出控制部36從控制碼存儲(chǔ)部37讀出表示的聲音識(shí)別部34取出的聲音識(shí)別參數(shù)第一個(gè)的類別與值的控制碼。將這些控制碼依次變換成第二遙控脈沖P2,送出之。
(步驟S34)輸出控制部36向聲音識(shí)別部34進(jìn)行訪問并判斷是否剩下應(yīng)取出的聲音識(shí)別參數(shù)。在剩下來送出的聲音識(shí)別參數(shù)時(shí),處理返回步驟S32。在全部轉(zhuǎn)送完聲音識(shí)別參數(shù)時(shí),處理進(jìn)入步驟S35。
(步驟S35)輸出控制部36從控制碼存儲(chǔ)部37讀出表示聲音識(shí)別參數(shù)轉(zhuǎn)送結(jié)束的控制碼(以下稱參數(shù)轉(zhuǎn)送結(jié)束碼),變換成第二遙控脈沖P2,送出之。
圖8表示由設(shè)備控制部25接收與保存聲音識(shí)別參數(shù)的細(xì)節(jié)的流程圖。
(步驟S41)遙控脈沖解碼部24對來自第二遙控脈沖P2的參數(shù)轉(zhuǎn)送開始碼進(jìn)行解碼,并通知設(shè)備控制部25。由此,設(shè)備控制部25掌握接著輸入的控制碼表示聲音識(shí)別參數(shù)的情況。
(步驟S42)遙控脈沖解碼部24對來自第二遙控脈沖的控制碼進(jìn)行解碼,并通知設(shè)備控制部25。后者從控制數(shù)據(jù)存儲(chǔ)部26讀出該控制碼對應(yīng)的聲音識(shí)別參數(shù)。讀出的聲音識(shí)別參數(shù)依次暫存于緩沖器。
(步驟S43)遙控脈沖解碼部24對來自第二遙控脈沖的參數(shù)轉(zhuǎn)送結(jié)束碼進(jìn)行解碼,并通知設(shè)備控制部25。后者從控制數(shù)據(jù)存儲(chǔ)部26讀出暫存于緩沖器的聲音識(shí)別參數(shù)對應(yīng)的文字?jǐn)?shù)據(jù)或圖像數(shù)據(jù)。
(步驟S44)設(shè)備控制部25利用畫面顯示部在TV畫面上顯示步驟S43中讀出的文本數(shù)據(jù)或圖像數(shù)據(jù)。由此向用戶反饋這些參數(shù)的類別與值。基于這些參數(shù),用戶可容易地達(dá)到識(shí)別容易的發(fā)音、速度、音調(diào)、或音量。
(步驟S45)設(shè)備控制部25再將緩沖器中暫存的聲音參數(shù)值按類別寫入?yún)?shù)保存部27。
這樣,利用參數(shù)保存部存儲(chǔ)聲音識(shí)別參數(shù),能與DTV20的電源通斷無關(guān)地保持與聲音識(shí)別有關(guān)的學(xué)習(xí)履歷。結(jié)果當(dāng)電源再接入時(shí),利用保存部27保存的履歷,能迅速實(shí)現(xiàn)聲音識(shí)別參數(shù)的優(yōu)化。
實(shí)施例1的DTV20利用上述的遙控系統(tǒng)實(shí)現(xiàn)下述的GUI。用戶按下遙控發(fā)送器10的發(fā)聲鈕8(參照圖1)。由此第二紅外線LED 4V發(fā)光(參照圖2)。DTV20的聲音信號/遙控脈沖變換部30中,通過第二受光部31,F(xiàn)M檢波部32檢測來自第二紅外線LED 4V的載波(參照圖3)。載波檢測部33檢測出該載波的振幅超過一定電平增大的情況,對聲音識(shí)別開始信號進(jìn)行確認(rèn)。由此,聲音識(shí)別部34起動(dòng),開始聲音識(shí)別。
聲音識(shí)別部34對輸出控制部36通知聲音識(shí)別的開始。輸出控制部36這時(shí)對控制碼存儲(chǔ)部37進(jìn)行訪問,讀出用于通知聲音識(shí)別開始的命令對應(yīng)的控制碼即識(shí)別開始碼。表1為聲音識(shí)別有關(guān)的命令或聲音識(shí)別參數(shù)與控制碼之間的對應(yīng)表,以及根據(jù)這些控制碼執(zhí)行的DTV20的操作與TV畫面28A上顯示的文本數(shù)據(jù)或圖像數(shù)據(jù)之間的對應(yīng)表的一例。
表1
這里,第一列與第二列之間的對應(yīng)由聲音信號/遙控脈沖變換部30內(nèi)的控制碼存儲(chǔ)部37(參照圖3)保存。另一方面,第二列與第三~五列之間的對應(yīng)由控制數(shù)據(jù)存儲(chǔ)部26保持。輸出控制部36對控制碼存儲(chǔ)部37進(jìn)行訪問,參照表1的第一列與第二列相當(dāng)?shù)膶?yīng)表。由此,讀出識(shí)別開媽碼“OF/FE”。并將該碼變換為第二遙控脈沖P2送至設(shè)備控制部25。
設(shè)備控制部25接收遙控脈沖解碼部24從第二遙控脈沖解碼得到的識(shí)別開始碼“OF/FE”。這時(shí),對控制數(shù)據(jù)存儲(chǔ)部26進(jìn)行訪問,參照表1的第三~五列相當(dāng)?shù)膶?yīng)表。由此,讀出識(shí)別開始碼“OF、FE”對應(yīng)的命令、文本數(shù)據(jù)、以及圖像數(shù)據(jù)。在表1表示的例中,讀出用于指示稱作“聲音識(shí)別畫板”的圖像A1向TV畫面的顯示的命令、作為顯示于“聲音識(shí)別畫板”A1內(nèi)的圖像數(shù)據(jù)1M的“圖形1”、以及作為顯于于“聲音識(shí)別畫板”內(nèi)的文本數(shù)據(jù)TX的“文本1”。圖9為根據(jù)每個(gè)控制碼例示了于TV畫面28A的圖像數(shù)據(jù)。這里,圖像數(shù)據(jù)既有圖形4與圖形5那樣單一的靜止畫,也有圖形1-3那樣的運(yùn)動(dòng)畫。表2為例表示根據(jù)每個(gè)控制碼顯示在TV畫面28A的文本數(shù)據(jù)的表。
表2
設(shè)備控制部25根據(jù)從控制數(shù)據(jù)存儲(chǔ)部26讀出的命令控制畫面顯示部28,如圖1所示那樣向TV畫面28A顯示聲音識(shí)別畫板A1。圖1的例中在聲音識(shí)別畫板A1中特別顯示了圖9的“圖形1”和表2的“文本1”。這樣,向用戶通知DTV20的聲音識(shí)別的開始準(zhǔn)備就緒。由此,用戶能準(zhǔn)確掌握按下遙控發(fā)送器10的發(fā)聲鈕8之后的發(fā)聲開始的時(shí)刻。
用戶一邊按下遙控發(fā)送器10的發(fā)聲鈕一邊發(fā)聲例如表示選臺(tái)目標(biāo)的頻道編號的單詞“1頻道”(參照圖1)。這一連串的聲音V通過遙控發(fā)送器10內(nèi)的話筒5與低頻放大器6作為聲音信號輸入。通過頻率調(diào)制,將該聲音信號S變換為由來自第二紅外線LED 4V的紅外線形成聲音信號RV,并送出之(參照圖2)。在DTV20的聲音信號/遙控脈沖變換部30中通過第二受光部31,F(xiàn)M檢波部32檢測來自第二紅外線LED 4V的聲音信號RV,解調(diào)成原來的聲音信號S(參照圖3)。聲音識(shí)別部34將解調(diào)的聲音信號S與登錄在字典35中的單詞中的每一個(gè)作比較,并計(jì)算似然性。基于該似然性,按照規(guī)定條件決定第1候補(bǔ)的單詞W。正常進(jìn)行識(shí)別處理時(shí),對于例如上述的聲音“1頻道”,正確地決定登錄在字典35中的叫做“1頻道”的單詞作為第一候補(bǔ)單詞W。
輸出控制部36從聲音識(shí)別部34取出第一候補(bǔ)單詞W。而且對控制碼存儲(chǔ)部37進(jìn)行訪問。表3為登錄于字典35中的單詞與控制碼之間的對應(yīng)表以及根據(jù)這些控制碼執(zhí)行的DTV20的操作與TV畫面顯示的文本數(shù)據(jù)或畫像數(shù)據(jù)之間的對應(yīng)表的一例。
表3
這里,第一列與第二列之間的對應(yīng)利用聲音信號/遙控脈沖變換部30內(nèi)的控制碼存儲(chǔ)部37(圖3參照)來保持。另一方面,第二列與第三~五列之間的對應(yīng)利用控制數(shù)據(jù)存儲(chǔ)部26來保持。輸出控制部36對控制碼存儲(chǔ)部37進(jìn)行取數(shù),參照表3的第一列與第二列相當(dāng)?shù)膶?yīng)。由此,讀出與單詞“1頻道”對應(yīng)的控制碼“00/00”。而且將該控制碼變換為第二遙控脈沖P2,送至設(shè)備控制部。設(shè)備控制部25接收利用遙控脈沖解碼部24從第二遙控脈沖P2解碼得到的控制碼“00/00″。這時(shí),對控制數(shù)據(jù)存儲(chǔ)部26進(jìn)行取數(shù),參照表3的第二列與第三~五列相當(dāng)?shù)膶?yīng)表。由此,讀出控制碼”00/00對應(yīng)的命令、文本數(shù)據(jù)以及圖像數(shù)據(jù)。在表3所示的例中,讀出用于對TV調(diào)諧器指示與頻道“1”相當(dāng)?shù)奈恢?的選臺(tái)的命令、作為顯示在聲音識(shí)別畫板A1(參照圖1)內(nèi)的圖像數(shù)據(jù)1M的“圖形2”(參照圖9)、以及作為顯示于聲音識(shí)別畫板A1內(nèi)的文本數(shù)據(jù)TX的“圖形2”(參照圖2)。這里,表2的文本2的內(nèi)容中,“~”中插入表示選臺(tái)目標(biāo)的頻道編號的文本數(shù)據(jù)例如“1CH”。設(shè)備控制部25首先控制畫面顯示部28,使TV畫面28A顯示“圖形2”與“文本2”的第一句“選臺(tái)1CH”。接著控制TV調(diào)諧器(未圖示)使選臺(tái)位置1。再控制畫面顯示部,使TV畫面28A顯示“文本2”的第二句“已選臺(tái)1CH”。這樣將通過經(jīng)識(shí)別的聲音搪行的選臺(tái)與其選臺(tái)目標(biāo)通知用戶。由此,用戶可明確地掌握DTV20如何識(shí)別由聲音產(chǎn)生的指示。
對于用聲音的指示可分配的控制碼數(shù)目與對遙控發(fā)送器10中的鍵操作可分配的控制碼不同,不受限制。如表3中所例示的那樣,用聲音可指示的功能包含選臺(tái),多種多樣。例如當(dāng)用戶發(fā)送“足球”時(shí),TV畫面上首先將“檢索足球”的“文本5”的第一句作為文本數(shù)據(jù)TX加以顯示。再由EPG對“足球”作種類檢索,并將其檢索結(jié)果一覽表與“已檢索足球”的“文本5”的第二句一起顯示于TV畫面28A。這里,在指示選臺(tái)或利用EPG的檢索等需要較長處理時(shí)間的操作時(shí),如“文本2”或“文本5”那樣在DTV20的操作前后使文本數(shù)據(jù)TX改變。由此用戶能明確掌握DTV20正在執(zhí)行用聲音指示的操作中。結(jié)果使用戶能感覺等待時(shí)間較短。
聲音識(shí)別部34在不能決定第一候補(bǔ)單詞時(shí),或檢測出“發(fā)聲途中的載波遺失”時(shí),便判斷有識(shí)別錯(cuò)誤,并中斷識(shí)別處理。對其每個(gè)主要原因向輸出控制部36通知識(shí)別錯(cuò)誤有關(guān)的信息。輸出控制部36從控制碼存儲(chǔ)部37讀出該通知的信息對應(yīng)的控制碼即誤驪。表4為識(shí)別錯(cuò)誤的內(nèi)容與誤碼之間的對應(yīng)表,以及與按照這些誤碼顯示于TV畫面28A的文本數(shù)據(jù)或圖像數(shù)據(jù)之間的對應(yīng)表的一例。
表4
這里,由控制碼存儲(chǔ)部37(參照圖3)保持第一列與第二列之間的對應(yīng)。另一方面,由控制數(shù)據(jù)存儲(chǔ)部26保持第二列與第三、四列之間的對應(yīng)。輸出控制部36對控制碼存儲(chǔ)部37進(jìn)行取數(shù),參照表3的第一列與第二列相當(dāng)?shù)膶?yīng)表。例如當(dāng)所通知的識(shí)別錯(cuò)誤存在“發(fā)聲途中的載波遺失”時(shí),讀出誤碼“OF/06”。再將該誤碼變換為第二遙控脈沖P2,送向設(shè)備控制部。設(shè)備控制部25接收由遙控脈沖解碼部24從第二遙控脈沖P2解碼得到的誤碼“OF/06”。這時(shí),對控制數(shù)據(jù)存儲(chǔ)部26取數(shù),參照表4的第二與第三、四列相當(dāng)?shù)膶?yīng)表。由此讀出誤碼“OF/06”對應(yīng)的文本數(shù)據(jù)與圖像數(shù)據(jù)。表4表示的例子中,讀出“圖形3”作為顯示于“聲音識(shí)別畫板A內(nèi)的圖像數(shù)據(jù)1M”,讀出“文本13”作為文本數(shù)據(jù)TX。設(shè)備控制部25控制畫面顯示部28使在畫面28A上顯示“圖形3”與“文本13”。結(jié)果,用戶可理解在發(fā)聲途中由于松開發(fā)聲鈕引起紅外線中斷因而產(chǎn)生識(shí)別錯(cuò)誤。
識(shí)別錯(cuò)誤如表4所例示的那樣有多種原因。例如用戶的聲音、音質(zhì)、或發(fā)聲時(shí)間不合適;周圍噪聲過大,S/N過小;或發(fā)聲的單詞錯(cuò)誤等原因,有時(shí)候聲音識(shí)別部34不能識(shí)別聲音信號所表示的單詞。此外,有時(shí)候?qū)ψR(shí)別的單詞得到的似然性,對登錄于字典35中的任一個(gè)單詞都不滿足規(guī)定條件。例如,當(dāng)聲音識(shí)別部34判斷為遙控發(fā)送器10的話筒5捕捉的聲音等級過大時(shí),輸出控制部36就送出所謂“聲音過大”的識(shí)別錯(cuò)誤的內(nèi)容對應(yīng)的誤碼“OF/02”。設(shè)備控制部25使在畫面28A上顯示誤碼“OF/02”對應(yīng)的“文本9”(參照表2)與“圖形3”(參照圖9)。由此,用戶容易掌握識(shí)別錯(cuò)誤的發(fā)生及其原因是過大的音量引起的。結(jié)果在重新進(jìn)行用聲音指示時(shí),用戶可注意抑低音量等的錯(cuò)誤回避方法。如上所述,由DTV20引起的識(shí)別錯(cuò)誤與其錯(cuò)誤內(nèi)容一起通知用戶。從而用戶在重新進(jìn)行用聲音指示時(shí)可恰當(dāng)?shù)鼗乇茏R(shí)別錯(cuò)誤的再發(fā)生。
用戶也可執(zhí)行下述的“話筒測試”,即執(zhí)行使聲音識(shí)別部34產(chǎn)生的聲音識(shí)別參數(shù)最佳化。用戶發(fā)聲“話筒測試”。當(dāng)聲音識(shí)別部34正確地識(shí)別該聲音為所謂“話筒測試”的單詞時(shí),輸出控制部36就向設(shè)備控制部25送出該單詞對應(yīng)的控制碼“OF/9F”(參照表3)。設(shè)備控制部25從控制數(shù)據(jù)存儲(chǔ)部26讀出該控制碼對應(yīng)的命令、文本數(shù)據(jù)、以及圖像數(shù)據(jù)。在表3所示的例中,讀出指示“話筒測試”的圖像A2(參照圖1)在TV畫面28A上顯示用的命令、作為顯示于“聲音識(shí)別畫板”A1內(nèi)的文本數(shù)據(jù)TX的“文本25”(參照表2)、以及作為顯示于“話筒測試”A2內(nèi)的圖像數(shù)據(jù)的“圖像4”(參照圖9)。設(shè)備控制部25利用該命令控制畫面顯示部28,在TV畫面28A上顯示“話筒測試”A2與“文本15”。聲音識(shí)別部34基于“話筒測試”那樣的聲音,從用戶的聲音固定的特征頻率區(qū)中使聲音識(shí)別參數(shù)最佳化。特別是,將聲道長度引起的頻率對功率譜偏移作為音質(zhì)等級進(jìn)行指標(biāo)記,分析最高似然性對應(yīng)的音質(zhì)等級的最佳值α。聲音識(shí)別部34對聲音識(shí)別參數(shù)的最佳化作成功時(shí),輸出控制部36向設(shè)備控制部25送出通知聲音識(shí)別參數(shù)的最佳化成功用的命令“話筒測試結(jié)果通知(OF)”所對應(yīng)的控制碼“08/52”(參照表1)。由此,設(shè)備控制部25使“文本1b”(參照表2)與“圖形5”(參照圖9)顯示于TV畫面28A。輸出控制部接著從聲音識(shí)別部取出含有音質(zhì)等級的最佳值α的經(jīng)優(yōu)化的聲音識(shí)別參數(shù)。例如音質(zhì)等級的最佳值α為-2時(shí),輸出控制部36向設(shè)備控制部25送出通知音質(zhì)等級α=-2用的命令所對應(yīng)的控制為“08/61”(參照表1)。由此,設(shè)備控制部25將“圖形5”的音質(zhì)等級的顯示調(diào)合到所通知的最佳值α。這里,圖9中描出“圖形5”作為表示“音質(zhì)等級α=-2”的圖像。當(dāng)音質(zhì)等級的最佳值為其他值時(shí),就按照該值改變描于“圖形5”的指示器G的位置以及音質(zhì)等級的值H。通過這些顯示,用戶能明確地掌握聲音識(shí)別部34能實(shí)現(xiàn)聲音識(shí)別參數(shù)的最佳值。
聲音識(shí)別部34在成功實(shí)現(xiàn)聲音識(shí)別參數(shù)最佳化時(shí),該最佳化的聲音識(shí)別參數(shù)也可如下述地利用參數(shù)保存部27(參照圖3)加以存儲(chǔ)。輸出控制部36將參數(shù)轉(zhuǎn)送開始碼“OE/10”(參照表1)送往設(shè)備控制部25。而且向設(shè)備控制部25依次送出經(jīng)最佳化的聲音識(shí)別參數(shù)的每一個(gè)對應(yīng)的控制碼。這些參數(shù)全被送出結(jié)束時(shí),輸出控制部36向設(shè)備控制部25送出參數(shù)轉(zhuǎn)送結(jié)束碼“OE/11”(參照表1)。設(shè)備控制部25在接收參數(shù)轉(zhuǎn)送開始碼后,將從輸出控制部接收的一連串的控制碼的第一個(gè)對應(yīng)的聲音識(shí)別參數(shù)依次從控制數(shù)據(jù)存儲(chǔ)部26轉(zhuǎn)送到緩沖器。而在接收到參數(shù)轉(zhuǎn)送結(jié)束碼時(shí),將轉(zhuǎn)存于緩存器的一連串的聲音識(shí)別參數(shù)存儲(chǔ)到參數(shù)保存部27。這樣,經(jīng)最佳化的聲音識(shí)別參數(shù)利用參數(shù)保存部27內(nèi)的非易失存儲(chǔ)媒體加以存儲(chǔ)。由此,可與DTV20的電源通斷無關(guān)地保持聲音識(shí)別有關(guān)的學(xué)習(xí)履歷。結(jié)果當(dāng)電源再次接通時(shí),利用所保持的聲音識(shí)別參數(shù)的履歷,可迅速實(shí)現(xiàn)聲音識(shí)別參數(shù)的最佳化。
聲音識(shí)別部34在對用戶的聲音“話筒測試”的識(shí)別失敗,或?qū)β曇糇R(shí)別參數(shù)的最佳化失敗時(shí),輸出控制部36對設(shè)備控制部25送出通知聲音識(shí)別參數(shù)的最佳化失敗用的命令“話筒測試結(jié)果通知(NG)”對應(yīng)的控制碼“08/53”(參照表1)。由此,設(shè)備控制部25使在畫面28A顯示“文本17”(參照表2)與“圖形4”(參照圖9)。通過這些顯示,用戶可明顯地掌握聲識(shí)別部34處于未能實(shí)現(xiàn)聲音參數(shù)的最佳化的狀態(tài)。由此,用戶設(shè)法采用抑制周圍噪聲等的對策。
實(shí)施例1的遙控系統(tǒng)利用紅外線作為通信媒體。此外也可利用電波作為通信媒體。這時(shí)作為遙控發(fā)送器10可利用攜帶電話、PHS、或PDA。特別是PHS、W-CDMA方式采用的第三代移動(dòng)體通信終端或根據(jù)藍(lán)牙(注冊商標(biāo))規(guī)格的通信終端等有可能高品位地傳送聲音信號。從而將它們用于實(shí)施例1的遙控系統(tǒng)中的聲音信號的傳送時(shí),能實(shí)現(xiàn)可靠性高的聲音識(shí)別。
實(shí)施例2
本發(fā)明實(shí)施例2的圖像處理裝置與實(shí)施例1同樣是DTV,搭載有通過在遙控發(fā)送器的鍵操作與聲音實(shí)現(xiàn)的遙控系統(tǒng)。但是與實(shí)施例1不同,遙控發(fā)送器不含聲音輸入端,作為遙控對象設(shè)備的DTV通過話筒直接輸入用戶的聲音。對于其他的結(jié)構(gòu)及動(dòng)作,實(shí)施例2與實(shí)施例1相同。
圖10表示本發(fā)明實(shí)施例2的DTV20A的遙控系統(tǒng)的外觀示意圖。用戶按壓遙控發(fā)送器10A的鍵盤1的一個(gè)鍵。這時(shí),該鍵對應(yīng)的控制信息(例如目標(biāo)頻道編號)作為例如紅外線形成的遙控信號RK從紅外線LED 4K發(fā)送至DTV20A。利用DTV20的受光部21接收該遙控信號RK,解碼對應(yīng)的控制信息。由此執(zhí)行該控制信息所表示的操作。例如在TV畫面28A顯示鍵盤1的每個(gè)鍵對應(yīng)的頻道編號。這樣實(shí)現(xiàn)通過遙控發(fā)送器10A的鍵操作的遙控。
用戶對DTV20A的話筒5A輸入表示的DTV20A的控制信息(例如目標(biāo)頻道編號)的聲音V。這里,話筒5A與DTV20的聲音信號/遙控脈沖變換部30A連接。用戶的聲音V通過話筒5A直接輸入聲音信號/遙控脈沖變換部30A,解碼對應(yīng)的控制信息。經(jīng)解碼的控制信息例如通過電纜38傳送到DTV20A本體,執(zhí)行該控制信息對應(yīng)的操作。例如在TV畫面28A顯示聲音V所表示的目標(biāo)頻道的節(jié)目。這樣,實(shí)現(xiàn)了通過聲音的遙控。
以下對實(shí)施例2說明其也實(shí)施例1不同的部分,對共同部分則援用對實(shí)施例1中的說明。圖11表示包含在上述實(shí)施例2的遙控系統(tǒng)中的遙控發(fā)送器10A結(jié)構(gòu)的框圖。這里,對與實(shí)施例1的遙控發(fā)送器10相同的結(jié)合附注與圖2相同的符號,其說明援用實(shí)施例1的說明。比較圖2與圖11可見,實(shí)施例2的遙控發(fā)送器10A除了來自實(shí)施例1的遙控發(fā)送器10的聲音輸入有關(guān)的結(jié)構(gòu)之外,實(shí)質(zhì)上是相同的。
圖12表示實(shí)施例2的DTV20內(nèi)的遙控系統(tǒng)有關(guān)部分的框圖。這里,對與實(shí)施例1的DTV20相的結(jié)構(gòu)附注與圖3相同的符號,其說明援用實(shí)施例1的說明。
聲音信號/遙控脈沖變換部30A由以下構(gòu)成,直接輸入用戶的聲音V,變換成聲音信號S,對其進(jìn)行聲音識(shí)別,由經(jīng)識(shí)別的聲音所表示的控制信息與實(shí)施例1同樣地在與第一遙控脈沖P1所表示的控制碼共用的格式進(jìn)行編碼,作為與第一遙控脈沖P1共用的格式即第二遙控脈沖P2輸出。話筒5A輸入用戶的聲音V并變換為電信號。低頻放器6A從話筒5A所變換的電信號中提取聲音V對應(yīng)的頻率成分,作為聲音信號S送到聲音識(shí)別部34。電平檢測部33A將低頻放大器6A所提取的聲音信號S的振幅與規(guī)定的電平作比較。當(dāng)聲音信號S的振幅超過該規(guī)定電平、增大時(shí),電平檢測部33A僅在規(guī)定時(shí)間對聲音識(shí)別開始信號T進(jìn)行認(rèn)定。另一方面,當(dāng)聲音信號S的振幅低于該規(guī)定電平維持一定時(shí)間時(shí),電平檢測部33A就取消聲音識(shí)別開始信號T。
實(shí)施例2的DTV20A中與實(shí)施例1的DTV20不同,用戶的聲音直接輸入。從而對于與按講方式有關(guān)的識(shí)別錯(cuò)誤例如在發(fā)聲途中由中止發(fā)聲鈕的按壓等引起的識(shí)別錯(cuò)誤,其處理并不需要。因此減輕了聲音識(shí)別部34等的處理負(fù)擔(dān)。
一旦對實(shí)施例2的聲音信號/遙控脈沖變換部30A輸入了聲音信號,就與實(shí)施例1相同地進(jìn)行處理。因此除了聲音輸入不同之外,實(shí)施例2實(shí)現(xiàn)與實(shí)施例1同樣地遙控系統(tǒng),故實(shí)施例2能發(fā)揮與實(shí)施例1同樣的以下的效果。首先,由于第一遙控脈沖P1與第二遙控脈沖P2按照共同的格式,故遙控脈沖解碼部24與控制控制部25對這些遙控脈沖的任一個(gè)也都共用。它們用與已有的電路同樣的一個(gè)系統(tǒng)的控制電路來構(gòu)成。結(jié)果底板設(shè)計(jì)容易。而且,第二遙控脈沖P2不向外泄漏地僅在從聲音信號/遙控脈沖變換部30A至遙控脈沖選擇部23之間傳送。因此,利用第二遙控脈沖P2表示的控制碼與利用第一遙控脈沖P1表示的控制碼不同,即使與其他遙控系統(tǒng)的控制碼重復(fù)地?zé)o妨。這樣,實(shí)施例2的遙控系統(tǒng)中,可分配作為用聲音的控制信息的控制碼數(shù)目是豐富的。結(jié)果可容易地?cái)U(kuò)展可用聲音指示的功能。
本發(fā)明的遙控對象設(shè)備進(jìn)行聲音識(shí)別。這時(shí),經(jīng)識(shí)別的聲音信號所表示的控制信息被變換為遙控脈沖送至設(shè)備控制部。這樣,用與已有的共用的數(shù)據(jù)形態(tài)即遙控脈沖表示應(yīng)由設(shè)備控制部處理的控制信息。因此,即使用來自遙控發(fā)送器的遙控信號或聲音信號中的任一種的數(shù)據(jù)形態(tài)輸入來自用戶的控制信息,設(shè)備控制部也可共用與以往同樣的電路構(gòu)成。即是說,設(shè)備控制部容易被統(tǒng)合成與以往相同的一個(gè)系統(tǒng)。結(jié)果,底板設(shè)計(jì)容易。
遙控脈沖選擇部在聲音信號/遙控脈沖變換部輸出第二遙控脈沖時(shí),將該第二遙控脈沖輸向遙控脈沖解碼部,阻斷來自遙控接收部的第一遙控脈沖。這樣,遙控脈沖解碼部排他性地處理第一遙控脈沖與第二遙控脈沖。因此也可對其他功能分別分配在第一遙控脈沖與第二遙控之間共同的控制碼。而且也可將聲音信號/遙控脈沖變換部與遙控脈沖選擇部之間做在例如共同的殼體內(nèi)或用電纜連接,使第二遙控脈沖不泄漏到遙控對象設(shè)備之外。由此能使第二遙控脈沖所表示的控制碼與其他遙控系統(tǒng)的控制碼重復(fù)。結(jié)果,作為第二遙控脈沖中所表示的控制碼可分配任意的類別碼或數(shù)據(jù)碼。特別是第二遙控脈沖所表示的控制碼數(shù)目與第一遙控脈沖不同,不受利用遙控信號表示的遙控碼數(shù)目的制約。這樣,本發(fā)明的遙控對象設(shè)備能容易擴(kuò)展可用聲音指示的功能。
本發(fā)明的圖像處理處理是上述本發(fā)明的遙控對象設(shè)備,特別對用聲音的指示能提供例如下述的GUI。設(shè)備控制部根據(jù)用聲音的指示控制畫面顯示部,顯示有關(guān)聲音識(shí)別的信息。由此,將該信息視覺性地反饋給用戶。該信息包含例如對用戶的適當(dāng)?shù)陌l(fā)音時(shí)刻的通知、經(jīng)識(shí)別的單詞或其它候補(bǔ)一覽表、或者經(jīng)認(rèn)別的操作內(nèi)容。而且在有關(guān)聲音識(shí)別產(chǎn)生錯(cuò)誤時(shí),也可在畫面上顯示該錯(cuò)誤信息。通過這種畫面顯示的信息的反饋,用戶能注意識(shí)別容易的發(fā)音、速度、音調(diào)或音量。這樣,本發(fā)明的圖像處理裝置特別對于用聲音的遙控能提高操作性。
關(guān)于以上所述的本發(fā)明的最佳實(shí)施例形態(tài)的揭示不應(yīng)作為有意限定的形態(tài)來解釋。本發(fā)明所屬領(lǐng)域內(nèi)的技術(shù)人員閱讀該揭示后,當(dāng)能無誤地明確理解各種變更及改良。作為理所當(dāng)然的歸結(jié),這些變更及改良分明不背離本發(fā)明的精神及范圍。應(yīng)該理解所附的權(quán)利要求范圍涵蓋這些變更及改良。
權(quán)利要求
1.一種遙控對象設(shè)備(20、20A),其特征在于,具有(A)遙控接收部(21+22),用于接收遙控信號(RK),并將該遙控信號(RK)轉(zhuǎn)換為第一遙控脈沖(P1);(B)聲音信號/遙控脈沖變換部(30、30A),用于輸入聲音信號(S),選擇對應(yīng)于該聲音信號(S)的控制碼(C),并將該控制碼(C)變換為第二遙控脈沖(P2);(C)遙控脈沖選擇部(23),用于根據(jù)規(guī)定的轉(zhuǎn)換信號(N),選擇第一遙控脈沖(P1)與第二遙控脈沖(P2)中的某一個(gè);以及(D)遙控脈沖處理部(24+25+26),用于根據(jù)利用所述遙控脈沖選擇部(23)選擇的遙控脈沖(P)將控制碼(C)解碼,并根據(jù)該控制碼(C)進(jìn)行動(dòng)作控制。
2.如權(quán)利要求1所述的遙控對象設(shè)備(20、20A),其特征在于,(A)所述聲音信號/遙控脈沖變換部(30、30A)具有(a)含有聲音識(shí)別對象數(shù)據(jù)(W)的字典;(b)聲音識(shí)別部(34),用于計(jì)算所述聲音信號(S)與各所述聲音識(shí)別對象數(shù)據(jù)(W)的相似度,根據(jù)它們的相似度選擇應(yīng)該與所述聲音信號(S)對應(yīng)的聲音識(shí)別對象數(shù)據(jù)(W)的候補(bǔ)或誤碼;(c)控制碼存儲(chǔ)部(37),用于存儲(chǔ)所述聲音識(shí)別對象數(shù)據(jù)(W)與所述誤碼之間分別對應(yīng)的控制碼(C);以及(d)輸出控制部(36),用于從所述控制碼存儲(chǔ)部(37)讀出與所述聲音識(shí)別對象數(shù)據(jù)(W)的候補(bǔ)或所述誤碼對應(yīng)的控制碼(C),變換該控制碼(C)為所述第二遙控脈沖(P2),并與所述切換信號(N)一起輸出到所述遙控脈沖選擇部(23);(B)所述遙控脈沖處理部,具有(a)遙控脈沖解碼部(24),用于解碼由所述遙控脈沖選擇部(23)選擇的遙控脈沖(P),變換為與該遙控脈沖(P)對應(yīng)的控制碼(C);(b)控制數(shù)據(jù)存儲(chǔ)部(26),用于存儲(chǔ)與各所述控制碼(C)對應(yīng)的控制數(shù)據(jù)與命令(D);以及(c)設(shè)備控制部(25),用于從所述控制數(shù)據(jù)存儲(chǔ)部(26)讀出與由所述遙控脈沖解碼部(24)解碼的控制碼(C)對應(yīng)的控制數(shù)據(jù)或命令(D),并基于這些控制數(shù)據(jù)或命令(D)進(jìn)行規(guī)定的動(dòng)作控制。
3.如權(quán)利要求2所述的遙控對象設(shè)備(20、20A),其特征在于,(A)所述遙控對象設(shè)備具有含有非易失性記錄媒體的參數(shù)保存部(27);(B)所述聲音識(shí)別部(34)向輸出控制部(36)輸出聲音識(shí)別參數(shù);(C)所述控制碼存儲(chǔ)部(37)存儲(chǔ)與所述聲音參數(shù)對應(yīng)的控制碼(C);(D)所述輸出控制部(36)從控制碼存儲(chǔ)部(37)讀出所述控制碼(C),并將該控制碼(C)變換成所述第二遙控脈沖(P2),輸出到所述遙控脈沖選擇部(23);(E)所述控制數(shù)據(jù)存儲(chǔ)部(26)存儲(chǔ)與所述控制碼(C)對應(yīng)的所述聲音識(shí)別參數(shù),(F)所述設(shè)備控制部(25)從所述控制數(shù)據(jù)存儲(chǔ)部(26)讀出與由所述遙控脈沖解碼部(24)解碼的所述控制碼對應(yīng)的所述聲音識(shí)別參數(shù),并將這些聲音識(shí)別參數(shù)寫入所述參數(shù)保存部(27)。
4.如權(quán)利要求1所述的遙控對象設(shè)備(20A),其特征在于,所述聲音信號/遙控脈沖變換部(30A)包含(A)聲音輸入部(5A+6A),用于輸入用戶的聲音(V)并變換為所述的聲音信號(S),(B)起動(dòng)控制部(33A),用于按照所述聲音信號(S)的振幅起動(dòng)所述聲音信號/遙控脈沖變換部(30A)。
5.一種遙控系統(tǒng),其特征在于,具有(A)遙控發(fā)送器,包含(a)聲音輸入部(5+6),用于輸入用戶的聲音(V)并變換為聲音信號(S);(b)無線發(fā)送部(7+3V+4V),用于以所述聲音信號(S)調(diào)制由超聲波、紅外線或電波形成的載波并向外部發(fā)送;并發(fā)送所述遙控信號(RK);(B)權(quán)利要求1所述的遙控對象設(shè)備(20),所述聲音信號/遙控脈沖變換部(30)包含(a)無線接收部(31+32),用于接收所述載波(RV);(b)起動(dòng)控制部(33),用于根據(jù)所述載波(RV)的振幅起動(dòng)聲音信號/遙控脈沖變換部(30)。
6.一種圖像處理裝置,具有根據(jù)所述設(shè)備控制部(25)顯示規(guī)定的圖像用的畫面顯示部(28),且是權(quán)利要求2所述的遙控對象設(shè)備,其特征在于,(A)所述控制數(shù)據(jù)存儲(chǔ)部(26)使對于所述畫面顯示部(28)的控制數(shù)據(jù)、命令(D)以及由所述畫面顯示部(28)顯示用的顯示數(shù)據(jù)(圖9、表1~4)分別對應(yīng)規(guī)定的控制碼(C)加以存儲(chǔ);(B)所述設(shè)備控制部(25)從所述控制數(shù)據(jù)存儲(chǔ)部(26)讀出與用所述遙控脈沖解碼部(24)根據(jù)第二遙控脈沖(P2)解碼的控制碼(C)對應(yīng)的顯示數(shù)據(jù)(圖9、表1~4),用所述畫面顯示部(28)顯示該顯示數(shù)據(jù)(圖9、表1~4)。
7.如權(quán)利要求6所述的圖像處理裝置,其特征在于,所述顯示數(shù)據(jù)包含文本數(shù)據(jù)。
8.如權(quán)利要求6所述的圖像處理裝置,其特征在于,所述顯示數(shù)據(jù)包含圖像數(shù)據(jù)。
全文摘要
本發(fā)明涉及遙控對象設(shè)備、遙控系統(tǒng)以及圖像處理裝置。聲音信號/遙控脈沖變換部(30)以紅外線(RV)從遙控發(fā)送器輸入聲音信號進(jìn)行聲音識(shí)別。用經(jīng)識(shí)別的單詞(W)表示的控制信息被變換成與用遙控信號(RK)表示的控制碼相同格式的控制碼(C)。各控制碼作為共同格式的第一遙控脈沖(P1)與第二遙控脈沖(P2)輸入到遙控脈沖選擇部(23)。遙控脈沖選擇部(23)根據(jù)遙控脈沖轉(zhuǎn)換信號(N)將第一遙控脈沖(P1)與第二遙控脈沖(P2)中的某一個(gè)排他性地輸入遙控脈沖解碼部(24)。
文檔編號G10L15/26GK1420708SQ0215228
公開日2003年5月28日 申請日期2002年11月19日 優(yōu)先權(quán)日2001年11月19日
發(fā)明者石原俊英 申請人:松下電器產(chǎn)業(yè)株式會(huì)社