亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音識(shí)別設(shè)備和消費(fèi)者電子系統(tǒng)的制作方法

文檔序號(hào):2822420閱讀:307來源:國知局
專利名稱:語音識(shí)別設(shè)備和消費(fèi)者電子系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及語音識(shí)別設(shè)備,該設(shè)備包括--一消音模塊,它包括用于接收來自話筒的音頻信號(hào)的音頻輸入;用于接收來自聲源的音頻信號(hào)的音頻輸入;所述消音模塊可進(jìn)行操作以通過消除來自話筒信號(hào)的聲源信號(hào)而產(chǎn)生語音信號(hào)以及--一語音識(shí)別器,它用于識(shí)別上述語音信號(hào)的至少一部分。
本發(fā)明還涉及一種消費(fèi)者電子系統(tǒng),它包括至少兩個(gè)聲源設(shè)備、上述消音模塊以及上述語音識(shí)別器。
本發(fā)明還涉及上述消音模塊。
US5255326公開了一種消費(fèi)者電子系統(tǒng),該系統(tǒng)帶有多個(gè)音頻/視頻設(shè)備,這些設(shè)備與用于再現(xiàn)聲音的環(huán)繞聲放大器相連。所述放大器具有音頻輸入,它們用于諸如TV、磁帶播放機(jī)、光盤播放機(jī)和無線電之類的各個(gè)可能的獨(dú)立音頻/視頻源。一般地說,音頻輸入能接收立體聲音頻信號(hào)。用戶選擇再現(xiàn)哪個(gè)聲源的音頻信號(hào)。放大器中的環(huán)繞聲處理器對(duì)選定的信號(hào)進(jìn)行處理。通過與放大器相連的揚(yáng)聲器來放大和再現(xiàn)經(jīng)處理的信號(hào)。還將經(jīng)處理的信號(hào)傳給微處理器或個(gè)人計(jì)算機(jī)。用話筒從用戶獲得語音。話筒信號(hào)除語音之外還包含被再現(xiàn)的音頻。計(jì)算機(jī)從話筒信號(hào)中減去經(jīng)處理的音頻信號(hào),以便獲得語音信號(hào)。語音信號(hào)由語音識(shí)別器來加以識(shí)別。用識(shí)別的輸出對(duì)系統(tǒng)進(jìn)行控制。
最近,只要滿足某些條件,語音識(shí)別就具有合理的精確度。例如,在通過話筒接收的信號(hào)中存在有高度音頻/噪音的情況下,識(shí)別精度會(huì)顯著下降。周知的系統(tǒng)消除了放大器所產(chǎn)生的音頻成分。但是,實(shí)際上,大多數(shù)用戶具有一個(gè)以上的能產(chǎn)生聲音或噪音的設(shè)備。例如,如果在周知的系統(tǒng)中用戶總是觀看TV并用TV的放大器來再現(xiàn)聲音而不是用外部環(huán)繞聲放大器,那么,TV的聲音就不會(huì)被計(jì)算機(jī)所消除,從而導(dǎo)致嚴(yán)重劣化的識(shí)別。
本發(fā)明的目的是提供一種語音識(shí)別設(shè)備、一種消費(fèi)者電子系統(tǒng)以及一種如前所述類型的能更加靈活地消除對(duì)語音識(shí)別有影響的音頻的的消音模塊。
為了滿足本發(fā)明的上述目的,所述消音模塊包括至少兩個(gè)音頻輸入,它們用于接收來自相應(yīng)獨(dú)立聲源的音頻信號(hào),所述消音模塊可進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)信號(hào)而生成語音信號(hào)。
通過這種方式,所述語音識(shí)別設(shè)備不再嚴(yán)格地與一個(gè)類似于環(huán)繞聲放大器的聲音(音頻/噪音)生成設(shè)備相連,而是可與任何預(yù)定數(shù)量的聲音生成設(shè)備一道工作。例如,所述識(shí)別設(shè)備可為獨(dú)立的音頻放大器(例如為再現(xiàn)來自無線電或CD的音頻信號(hào))、TV放大器、免提電話中的放大器等工作。此外,可用獨(dú)立的話筒來獲得由諸如通風(fēng)器(例如起居室內(nèi)或PC內(nèi)的)、真空吸塵器、往來車輛等裝置產(chǎn)生的干擾聲(例如噪音)信號(hào)。這種方法最好還用在開放的辦公室中,在那里,多個(gè)用戶可能會(huì)同時(shí)講話(例如在PC上口述或有電話交談)。這些“干擾”聲的話筒信號(hào)會(huì)被饋送進(jìn)語音識(shí)別設(shè)備并被消除。除其它用戶的聲音以外,這種話筒還能記錄其它聲音例如PC產(chǎn)生的類似于Windows聲音信號(hào)的聲音或諸如游戲之類程序產(chǎn)生的聲音。最佳的是,這種話筒放置在干擾源附近,從而獲得了盡可能“干凈的”干擾。另外,可使用話筒陣列。話筒信號(hào)可按任何適當(dāng)?shù)姆绞絺鹘o語音識(shí)別設(shè)備。例如,用獨(dú)立的導(dǎo)線、用無線傳輸(例如RF)或者通過總連線。
可用語音識(shí)別設(shè)備來進(jìn)行語音-文本轉(zhuǎn)換(聽寫)。這就能使得用戶在聽寫文本的同時(shí)聽音樂。還能消除噪音,例如由用于進(jìn)行識(shí)別的PC中的風(fēng)扇或盤所產(chǎn)生的噪音。
在附屬權(quán)利要求2所述的最佳實(shí)施例中,所述語音識(shí)別設(shè)備用于對(duì)包括該識(shí)別設(shè)備置本身以外的設(shè)備的設(shè)備進(jìn)行聲音控制。這些設(shè)備最好包括音頻/視頻設(shè)備(例如TV、盤播放器/記錄器、磁帶播放器/記錄器、音頻調(diào)諧器、機(jī)頂盒等)以及諸如與計(jì)算機(jī)相關(guān)產(chǎn)品之類的可在家庭網(wǎng)絡(luò)中找到的其它設(shè)備(例如打印機(jī)、掃描儀等)、保安產(chǎn)品、家用電器和溫度控制裝置。用于將控制信息傳給這類設(shè)備的適當(dāng)裝置是周知的。
依照附屬權(quán)利要求3的措施,用遙控信息來控制所述設(shè)備。通過這種方式,可在不需要在所有受控設(shè)備中引入語音識(shí)別的情況下,按簡(jiǎn)單和成本-效益高的方式對(duì)設(shè)備進(jìn)行聲控。還可以對(duì)現(xiàn)有不具有聲控能力的設(shè)備進(jìn)行控制。最佳的是,所述語音識(shí)別設(shè)備能按從通用預(yù)編程或?qū)W習(xí)遙控中所周知的方式來控制多種不同的設(shè)備,其中,通過語音而不是擊鍵來啟動(dòng)命令。這就能控制多種不同類型和結(jié)構(gòu)的設(shè)備。
如附屬權(quán)利要求4的措施所限定的那樣,用音頻通訊網(wǎng)絡(luò)接收來自外部聲源的聲音。所述網(wǎng)絡(luò)可以是有線的,也可以是無線的??梢允腔邳c(diǎn)對(duì)點(diǎn)的連接。最佳的是使用串行總線,以便使得多個(gè)源以成本效益好的方式連接于語音識(shí)別設(shè)備。就主流PC環(huán)境中的聽寫而言,最好使用USB或類似的網(wǎng)絡(luò)。就主流音頻/視頻環(huán)境中的語音控制而言,最好使用IEEE1394。
如附屬權(quán)利要求5的措施所限定的那樣,在將命令信息從語音識(shí)別設(shè)備傳給系統(tǒng)中其它設(shè)備時(shí),用同樣的通訊網(wǎng)絡(luò)將音頻傳給語音識(shí)別設(shè)備。最佳的是,使用了基于IEEE1394的網(wǎng)絡(luò)。IEEE1394支持多種獨(dú)立的可用于傳遞音頻的同步數(shù)據(jù)流。所述音頻可通過網(wǎng)絡(luò)進(jìn)行廣播或直接發(fā)送給語音識(shí)別設(shè)備。此外,IEEE1394可傳遞符合HAVi協(xié)議的命令信息如附屬權(quán)利要求6的措施所限定的那樣,所述語音設(shè)備不需要能再現(xiàn)提供給它的音頻信號(hào)。這樣,可獲得更大的靈活性。例如,所述語音識(shí)別設(shè)備可以是用于控制系統(tǒng)中其它設(shè)備的獨(dú)立的控制裝置。在這種結(jié)構(gòu)中,除就設(shè)備或系統(tǒng)的控制對(duì)用戶的可聽反饋以外,所述設(shè)備不能產(chǎn)生任何音頻輸出。同樣,用于接收外部源的音頻的音頻輸入以排它的方式用于消除的目的。例如,所述語音識(shí)別設(shè)備可最佳地用于將諸如TV、DVD播放器和音頻系統(tǒng)之類的獨(dú)立裝置合并成家庭影院系統(tǒng)。在這種集成系統(tǒng)中,語音識(shí)別設(shè)備可包括額外的控制智能,以便將各個(gè)裝置的功能合并成系統(tǒng)行為。例如,類似“DVD播放”這樣的聲音命令可導(dǎo)致語音識(shí)別設(shè)備不僅啟動(dòng)DVD播放器而且啟動(dòng)TV和放大器并形成預(yù)定的信號(hào)連接。
所述設(shè)備還可被合并進(jìn)TV,其中,在許多系統(tǒng)中,TV具有一個(gè)額外的輸入以接收音頻輸出信號(hào)是足夠用的了,所述音頻輸出信號(hào)能提供音頻系統(tǒng)產(chǎn)生的音頻。TV通常不用于再現(xiàn)來自音頻系統(tǒng)的任何源信號(hào)。因此,接收這種信號(hào)的主要功能能消除來自話筒信號(hào)的信號(hào)。甚至不可能再現(xiàn)這種音頻信號(hào)。通過能消除來自外部源的音頻,例如用戶能在TV上觀看到圖文電視或WebTV功能并通過語音來控制這種功能,同時(shí)聽CD(外部源,音頻系統(tǒng)的一部分)。與此相似,用戶可通過TV中的語音控制器來控制CD。
為了滿足上述目的,消費(fèi)者電子系統(tǒng)包括至少兩個(gè)聲源設(shè)備一消音模塊,該模塊包括一音頻輸入,它用于接收來自話筒的音頻信號(hào);以及至少兩音頻輸入,它們用于接收來自聲源設(shè)備的相應(yīng)一個(gè)的獨(dú)立音頻信號(hào);所述消音模塊能進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)而產(chǎn)生一語音信號(hào);以及—語音識(shí)別器,它識(shí)別上述語音信號(hào)的至少一部分。
為了滿足本發(fā)明的上述目的,消音模塊包括一音頻輸入,它用于接收來自話筒的音頻信號(hào);至少兩個(gè)音頻輸入,它們用于接收來自相應(yīng)獨(dú)立聲源的音頻信號(hào);所述消音模塊能進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)而產(chǎn)生一語音信號(hào)。
參照附圖中所示的實(shí)施例可以看出本發(fā)明的上述和其它方面,附圖中

圖1示出了本發(fā)明消音模塊100的框圖;圖2說明了使用了多個(gè)話筒;圖3示出了包括語音識(shí)別器的實(shí)施例;以及圖4示出了本發(fā)明的系統(tǒng)。
圖1示出了本發(fā)明的消音模塊100的框圖。模塊100包括一音頻輸入110,它用于接收來自話筒的信號(hào)110。適用于語音識(shí)別目的的話筒是周知的。話筒通常提供單聲道音頻信號(hào)。就聽寫而言,最好使用頭戴式話筒?;蛘呤褂梅胖迷谳^靠近用戶(例如半米的距離)的話筒。就語音控制而言,話筒可放置得更遠(yuǎn)一些(例如幾米的距離)。模塊100包括若干個(gè)音頻輸入,它們用于接收來自相應(yīng)獨(dú)立聲源的音頻信號(hào)。示出了兩個(gè)音頻輸入120和130。一個(gè)音頻輸入用于接收一個(gè)聲源的所有相關(guān)音頻信號(hào)。一個(gè)音頻信號(hào)通常是立體聲信號(hào),在這種情況下,所述輸入可以具有兩個(gè)獨(dú)立的輸入接頭,它們用于接收立體聲信號(hào)。環(huán)繞聲編碼信號(hào)甚至可具有5或6個(gè)獨(dú)立的接頭(例如前左、前右、后左、后右、中心、輔助低音)。就本發(fā)明而言,可將這種信號(hào)看作是一個(gè)信號(hào)。消音模塊100可進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)而產(chǎn)生語音信號(hào)。其中,消除一種音頻信號(hào)是周知的并且通常認(rèn)為是音頻回音消除。例如,這可包括從話筒信號(hào)中減去所述音頻信號(hào)??删屯ㄟ^音頻輸入之一接收到的音頻信號(hào)來估算出話筒信號(hào)中出現(xiàn)的音頻信號(hào)的時(shí)間延遲和振幅。例如用周知的統(tǒng)計(jì)相關(guān)技術(shù)來進(jìn)行這種估算。本發(fā)明的消音模塊可通過依次順序地消除各個(gè)信號(hào)來消除多個(gè)音頻信號(hào)。因此,模塊100可按順序包括多個(gè)消音單元,其中,第一個(gè)單元消除來自話筒信號(hào)的第一音頻信號(hào),第二個(gè)單元消除來自第一單元的輸出的第二音頻信號(hào),等等。具體地說,由于所有的消音單元均位于同一模塊內(nèi),故能易于補(bǔ)償各消音模塊內(nèi)所引入的延時(shí)。例如,序列中號(hào)碼為N的消音單元的話筒輸入(通過緩存)延時(shí)該消音單元中的延時(shí)的(N-1)倍。最佳的是,模塊100在一個(gè)合成過程中消除多個(gè)信號(hào)。非預(yù)公開的專利申請(qǐng)書EP8920206.3(PHN17514)中說明了消除多個(gè)信號(hào)的最佳方式,這種算法的細(xì)節(jié)在此作為參考。
在圖2所示的實(shí)施例中,不使用一個(gè)話筒也能獲得來自獨(dú)立話筒的輸入。所述話筒可位于通常的話筒陣列內(nèi),其中,每個(gè)話筒均覆蓋一不同的方向。最佳的是,消音模塊100用于消費(fèi)者電子系統(tǒng),其中,所述系統(tǒng)中的多個(gè)設(shè)備帶有一話筒。圖2示出了這種系統(tǒng)。在這種系統(tǒng)中,音頻裝置200具有內(nèi)置式話筒202(或話筒輸入)以及話筒信號(hào)輸出204。與此相類似,TV210帶有內(nèi)置式話筒212(或話筒輸入)以及話筒信號(hào)輸出214。消音模塊100位于系統(tǒng)的另一個(gè)設(shè)備220內(nèi)。在本例中,設(shè)備220也帶有內(nèi)置式話筒222(或話筒輸入)。設(shè)備220具有兩個(gè)話筒輸入224和226,它們用于接收來自相應(yīng)輸出204和214的話筒信號(hào)。將所有的話筒信號(hào)(在本例中為兩個(gè)外部話筒信號(hào)和一個(gè)內(nèi)部話筒信號(hào))提供給射束形成器240。該射束形成器將話筒信號(hào)組合起來,從而導(dǎo)致合成的話筒信號(hào)的更高的效率和分辨率。所述射束形成器選擇甚至還“跟蹤”聲源。一般地說,可識(shí)別較大聲的聲源信號(hào)(通常是人講話聲),并且,在多個(gè)話筒輸入信號(hào)中跟蹤這種聲源信號(hào)。將射束形成器的輸出信號(hào)提供給消聲器100的話筒輸入110。還示出了設(shè)備220的用于接收來自相應(yīng)外部設(shè)備的音頻信號(hào)的兩個(gè)音頻輸入228和230。在所示的系統(tǒng)中,外部音頻輸入228和230連接于音頻裝置200和TV210的相應(yīng)的音頻線性輸出206和216。在所述設(shè)備220中,外部音頻輸入228和230連接于消音模塊100的相應(yīng)音頻輸入120和130。
圖3示出了另一個(gè)實(shí)施例,其中,將消音模塊100產(chǎn)生的語音信號(hào)140提供給語音識(shí)別器300。語音識(shí)別器最好位于與模塊100相同的設(shè)備內(nèi)。如果需要的話,識(shí)別器300也位于一獨(dú)立的設(shè)備內(nèi)。例如,獨(dú)立的消音模塊可位于若干個(gè)房間內(nèi),其中,僅使用一個(gè)中心識(shí)別器,它可識(shí)別接收自任一模塊內(nèi)的語音。識(shí)別的結(jié)果可用于諸如聽寫(語音至文本)、控制或信息檢索之類的多種應(yīng)用。示出了控制器310,它響應(yīng)被識(shí)別出的命令而執(zhí)行控制活動(dòng)??刂苹顒?dòng)可限于控制器310位于其中的設(shè)備的操作。具體地說,如果控制單元位于構(gòu)成較大系統(tǒng)的一部分的設(shè)備內(nèi),如圖3所示,那么,控制單元還最好控制其它設(shè)備的操作。為此,控制器可通過控制通訊網(wǎng)絡(luò)如虛線所示將命令信息發(fā)給系統(tǒng)內(nèi)的其它設(shè)備??捎枚喾N方式來形成所述網(wǎng)絡(luò)。例如,可用專用控制鏈路將具有控制器310的設(shè)備220連接于其它設(shè)備200和210。這種鏈路可通過一個(gè)或多個(gè)控制信號(hào)線起作用。為了獲得簡(jiǎn)單的控制鏈路,最好發(fā)送呈遙控信息形式的控制信息,該信息一般通過紅外信號(hào)來傳遞。一般地說,可使用能將信息從控制設(shè)備220傳給其它設(shè)備的單向遙控系統(tǒng)。就更復(fù)雜的控制而言,還可以使用雙向遙控系統(tǒng)。遙控系統(tǒng)本身是周知的,因而不作詳細(xì)說明。最佳的是,控制器310可由用戶來加以“編程”,因此,控制器310能依照特定的控制系統(tǒng)和這些設(shè)備的信息來控制系統(tǒng)中的設(shè)備。為此,控制器包括與通用預(yù)先編程或?qū)W習(xí)遙控的邏輯相類似的邏輯。最佳的是,用戶可為要由控制器310發(fā)出的特定命令信息指定語音命令。這例如可通過讓用戶對(duì)來自預(yù)定語音命令列表(例如“播放”或“開始”)中的給定控制信息(例如用于播放磁帶的VCR指令)進(jìn)行選擇來加以實(shí)現(xiàn)。可用與揚(yáng)聲器無關(guān)的識(shí)別來識(shí)別這種預(yù)定的語音命令。另外,用于可指定他自己的語音命令,在這種情況下,最好使用與揚(yáng)聲器有關(guān)的識(shí)別。語音識(shí)別和指定語音命令本身是周知的。
在圖4所示的實(shí)施例中,設(shè)備200、210和220通過通訊網(wǎng)絡(luò)400相連。這種網(wǎng)絡(luò)可用于傳遞多種類型的數(shù)據(jù),諸如-音頻信號(hào)(一般呈數(shù)字形式,作為同步數(shù)據(jù)流來傳遞),
-話筒信號(hào)(一般當(dāng)作用于傳遞的音頻信號(hào)來加以處理),-控制指令/信息。
最佳的是,同一網(wǎng)絡(luò)能提供多種或甚至是所有這些傳遞形式。在圖4所示的實(shí)例中,通過所述網(wǎng)絡(luò)來傳遞音頻信號(hào)和控制信號(hào)。為此,語音識(shí)別設(shè)備220包括本身是周知的通訊接口410,以便從通過網(wǎng)絡(luò)傳遞的制器數(shù)據(jù)中檢索出音頻信號(hào)并將音頻信號(hào)提供給消音模塊。通過同一通訊接口410來傳送控制器310生成的命令信息。
通常難以進(jìn)行類似于音頻/視頻設(shè)備或家用電器的CE設(shè)備的語音控制,因?yàn)?,?duì)用戶來說經(jīng)常會(huì)不清楚可以使用哪些語音命令。具體地說,在大型或先進(jìn)系統(tǒng)中,可控功能的數(shù)量是很大的并且可以有變化。盡管對(duì)PC進(jìn)行語音控制的用戶可使用幫助工具,以獲得所有可能語音命令的概觀,但是,CE設(shè)備的用戶接口的可能性有更多的限制。為了克服這些問題,控制器最好能進(jìn)行操作以便向用戶提供在當(dāng)時(shí)可以根據(jù)其說出命令的信息。在這種所謂的前饋中,命令列表限于那些可加以執(zhí)行的由所涉及的系統(tǒng)或設(shè)備的狀態(tài)或給定控制層次/順序或上下文所確定的命令。作為一個(gè)實(shí)例,如果用集中控制器來控制系統(tǒng)中的某些或所有設(shè)備,那么,初始的前饋列表可僅包含設(shè)備選擇命令(例如“TV”、“VCR”、“CD”),這些命令通知控制器用戶要控制那個(gè)設(shè)備。其次,就控制層次/序列或選定設(shè)備的狀態(tài)而言,前饋列表僅包含那些被選定設(shè)備的命令,這些命令可由選定的設(shè)備來加以執(zhí)行。
就控制層次/序列而言,目前某些設(shè)備不能直接訪問當(dāng)時(shí)可加以控制的所有功能。一般地說,僅可通過層次菜單來對(duì)TV中音頻、視頻和調(diào)諧進(jìn)行高級(jí)裝置。在頂層菜單,用戶選定要加以控制的功能組。在第二層次,用戶通常控制選定功能組中的特定功能。有時(shí)甚至使用更多的菜單層。就受語音控制的設(shè)備而言,最好在合理的情況下直接訪問盡可能多的功能。依照本發(fā)明,就有高度功能的設(shè)備而言,也可將層次方法用于語音控制。這就會(huì)限制可能的語音命令的數(shù)量(僅限于當(dāng)前選定的語音命令組中的那些命令),以便提高識(shí)別的可靠性,同時(shí)進(jìn)行以后可說出的語音命令的有效前饋。
除使用語音命令的預(yù)定層次/序列以外或者代替使用語音命令的預(yù)定層次/序列,還通過僅允許可就所涉及的設(shè)備的狀態(tài)或系統(tǒng)的狀態(tài)加以執(zhí)行的那些命令而限制可說出的命令的列表。例如,如果CD播放器不含有盤,則前饋列表可僅含有“彈出”和“待機(jī)”命令,而如果加載了盤,則可以有較多命令的列表。在本發(fā)明的另一個(gè)實(shí)施例中,前饋列表不僅取決于設(shè)備的固定狀態(tài)行為,而且取決于可變的上下文信息。例如,如果TV顯示出了例如從因特網(wǎng)或電子編程指南(EPG)中檢索出的信息,那么,該信息本身可對(duì)那個(gè)語音命令是可能的產(chǎn)生影響。就因特網(wǎng)頁而言,鏈接是可說出的,就EPG頁而言,所述程序是可選的,以便進(jìn)行觀看或記錄。瀏覽命令也是可以說出的。內(nèi)容可確定前饋列表的另一個(gè)實(shí)例是這樣的情形,其中,盤內(nèi)容的功能是可變的。例如,如果來裝載了僅有一個(gè)索引的盤,則所述反饋?zhàn)至斜聿话ㄋ饕x擇命令。如果盤包括八個(gè)軌道,則僅可通過語音選定頭八個(gè)軌道。與此相似,如果在VCR中裝載了拷貝保護(hù)的磁帶,則“錄制”命令不能使用因而不需要在前饋列表中。
可用與設(shè)備的控制層次有關(guān)的信息對(duì)控制器進(jìn)行預(yù)先編程。具體地說,如果控制器是正在受控的設(shè)備的一部分,則該控制器可很容易地控制所述層次的哪一部分是活動(dòng)的并按此裝載或編譯前饋列表。如果控制器不是正在受控的設(shè)備的一部分,則控制器最好獲得來自正在受控的產(chǎn)品的相關(guān)信息??赏ㄟ^通訊網(wǎng)絡(luò)來獲得這種信息??捎枚喾N方式來獲得上述信息。例如,控制器可從所涉及的設(shè)備獲得整個(gè)控制層次。然后,控制器本身可例如根據(jù)用戶(通過語音命令或遙控)的輸入控制所述層次的哪一部分是活動(dòng)的??刂破鬟€可在接收到來自用戶的輸入時(shí)檢查哪一部分是活動(dòng)的。另外,正在受控的設(shè)備可將其當(dāng)前狀態(tài)通知給控制器。用于執(zhí)行狀態(tài)監(jiān)視或自動(dòng)狀態(tài)更新的通訊協(xié)議是周知的。代替控制器獲得整個(gè)的控制層次/序列,所述控制器還可僅檢索出控制層次的以后活動(dòng)部分所形成的或者所述設(shè)備的以后活動(dòng)狀態(tài)所允許的命令集部分。
可按任何的適當(dāng)方式例如通過在視覺或聽覺上提供可說出的命令來實(shí)際提供前饋列表。
權(quán)利要求
1.一種語音識(shí)別設(shè)備,包括一消音模塊,它包括用于接收來自話筒的音頻信號(hào)的音頻輸入;用于接收來自聲源的音頻信號(hào)的音頻輸入;所述消音模塊可進(jìn)行操作以通過消除來自話筒信號(hào)的聲源信號(hào)而產(chǎn)生語音信號(hào);以及一語音識(shí)別器,它用于識(shí)別上述語音信號(hào)的至少一部分;所述語音識(shí)別設(shè)備的特征在于,所述消音模塊包括至少兩個(gè)音頻輸入,它們用于接收來自相應(yīng)獨(dú)立聲源的音頻信號(hào);所述消音模塊可進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)信號(hào)而生成語音信號(hào)。
2.如權(quán)利要求1的語音識(shí)別設(shè)備,其中,該語音識(shí)別設(shè)備包括一控制器,它用于響應(yīng)該語音識(shí)別器識(shí)別出的用戶口述指令而通過控制通訊網(wǎng)絡(luò)將至少一個(gè)命令信息發(fā)送給其它設(shè)備。
3.如權(quán)利要求2的語音識(shí)別設(shè)備,其中,所述控制器根據(jù)與其它設(shè)備相關(guān)的遙控信息來發(fā)送前述至少一個(gè)命令信息。
4.如權(quán)利要求1的語音識(shí)別設(shè)備,其中,通過音頻通訊網(wǎng)絡(luò)從所述語音識(shí)別設(shè)備外部的聲源接收上述音頻信號(hào)中的至少一個(gè)。
5.如權(quán)利要求3和4的語音識(shí)別設(shè)備,其中,所述音頻通訊網(wǎng)絡(luò)與前述控制通訊網(wǎng)絡(luò)相同。
6.如權(quán)利要求1的語音識(shí)別設(shè)備,其中,所述語音識(shí)別設(shè)備包括至少一個(gè)音頻輸入,它用于從該語音識(shí)別設(shè)備外部的聲源接收一音頻信號(hào);為基本上消除這種來自話筒信號(hào)的音頻信號(hào)而接收所述音頻信號(hào)。
7.一種消費(fèi)者電子系統(tǒng),該系統(tǒng)包括至少兩個(gè)聲源設(shè)備一消音模塊,該模塊包括一音頻輸入,它用于接收來自話筒的音頻信號(hào);以及至少兩個(gè)音頻輸入,它們用于接收來自聲源設(shè)備的相應(yīng)一個(gè)的獨(dú)立音頻信號(hào);所述消音模塊能進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)而產(chǎn)生一語音信號(hào);以及—語音識(shí)別器,它用于識(shí)別上述語音信號(hào)的至少一部分。
8.如權(quán)利要求7的系統(tǒng),其中,該系統(tǒng)包括—控制單元,它用于響應(yīng)該語音識(shí)別器識(shí)別出的用戶口述指令而通過通訊網(wǎng)絡(luò)將至少一個(gè)命令信息發(fā)送給系統(tǒng)中的設(shè)備。
9.如權(quán)利要求8的系統(tǒng),其中,通過通訊網(wǎng)絡(luò)從相關(guān)的聲源設(shè)備接收上述音頻信號(hào)中的至少一個(gè)。
10.如權(quán)利要求9的系統(tǒng),其中,所述消音模塊位于所述的系統(tǒng)的設(shè)備內(nèi),其中,所述設(shè)備包括至少一個(gè)音頻輸入,它用于從該設(shè)備外部的聲源設(shè)備接收一音頻信號(hào),為基本上消除這種來自話筒信號(hào)的音頻信號(hào)而接收所述音頻信號(hào)。
11.一種消音模塊,該模塊包括一音頻輸入,它用于接收來自話筒的音頻信號(hào);至少兩個(gè)音頻輸入,它們用于接收來自相應(yīng)獨(dú)立聲源的音頻信號(hào);所述消音模塊能進(jìn)行操作以便通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)而產(chǎn)生一語音信號(hào)。
全文摘要
-語音識(shí)別設(shè)備包括一消音模塊(100)。該模塊包括一音頻輸入(110),它用于接收來自話筒的音頻信號(hào)。所述模塊包括至少兩個(gè)音頻輸入(120、130),它們用于接收來自相應(yīng)獨(dú)立聲源的音頻信號(hào)。所述消音模塊能通過消除來自話筒信號(hào)的獨(dú)立聲源信號(hào)中的至少兩個(gè)而產(chǎn)生一語音信號(hào)。所述語音識(shí)別器用于識(shí)別上述語音信號(hào)的至少一部分。
文檔編號(hào)G10L21/02GK1322348SQ00802032
公開日2001年11月14日 申請(qǐng)日期2000年9月14日 優(yōu)先權(quán)日1999年9月23日
發(fā)明者P·A·P·考夫霍茨 申請(qǐng)人:皇家菲利浦電子有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1