專利名稱:周圍電話系統(tǒng)中的對(duì)話檢測(cè)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用電信系統(tǒng)控制至少一個(gè)設(shè)備的方法。本發(fā)明還涉及電信系統(tǒng)和計(jì)算機(jī)程序。
背景技術(shù):
Harma, A. , "Ambient telephony: scenarios and research challenges,,, Proc. INTERSPEECH 2007, August 2007給出了開(kāi)發(fā)用于家庭環(huán)境的全規(guī)模周圍電話方面的技術(shù)挑戰(zhàn)的綜述。周圍電話是基于擴(kuò)音器和麥克風(fēng)的陣列的揚(yáng)聲器電話系統(tǒng),所述擴(kuò)音器和麥克風(fēng)分布在家庭環(huán)境中并且經(jīng)由家庭網(wǎng)絡(luò)彼此連接。該系統(tǒng)可以經(jīng)由連接到因特網(wǎng)、蜂窩電話網(wǎng)絡(luò)以及可能的傳統(tǒng)地面線路的中心設(shè)備接收來(lái)自任何源的呼叫。音頻再現(xiàn)可以以空間選擇的方式執(zhí)行。例如,用戶可以與另一人進(jìn)行對(duì)話,使得另一人看起來(lái)隨著談話者從一個(gè)房間到另一個(gè)房間平穩(wěn)地移動(dòng),或者使得存在若干同時(shí)打開(kāi)的連接并且在家庭環(huán)境的空間分開(kāi)的位置中獲得聯(lián)系。從一個(gè)設(shè)備和一個(gè)空間位置到另一個(gè)設(shè)備和空間位置移動(dòng)呼叫的可能性是周圍電話的中心特征之一。在其中到遠(yuǎn)程呼叫者的若干同時(shí)連接在任一時(shí)刻打開(kāi)的方案(scenario)中,一些遠(yuǎn)程呼叫者實(shí)際上可能不在任何給定時(shí)間存在。如果周圍電話系統(tǒng)能夠在基本上不使其使用復(fù)雜化的情況下適應(yīng)變化的使用要求,那么這將是有用的。
發(fā)明內(nèi)容
希望的是提供一種上述類型的方法、系統(tǒng)和計(jì)算機(jī)程序,其在其中到遠(yuǎn)程終端的連接打開(kāi)的方案中允許使電話系統(tǒng)適應(yīng)變化的要求而無(wú)需來(lái)自用戶的大量顯式輸入。所述方法被提供,其包括
-獲得傳送來(lái)自至少一個(gè)遠(yuǎn)程電信終端和來(lái)自用于與至少一個(gè)本地輸出設(shè)備形成至少一個(gè)本地電信終端的至少一個(gè)本地輸入設(shè)備的信息的信號(hào),連接在遠(yuǎn)程和本地電信終端之間是打開(kāi)的;
-使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端的用戶之間的對(duì)話輪換(turn-taking)相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述電信終端中的至少兩個(gè)傳送的信息; 以及
-當(dāng)確定是否滿足所述至少一個(gè)準(zhǔn)則時(shí)調(diào)節(jié)至少一個(gè)用于控制設(shè)備的輸出信號(hào)。通過(guò)使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述至少兩個(gè)電信終端傳送的信息,可以檢測(cè)打開(kāi)的一個(gè)或多個(gè)連接是否被使用。用戶不必為系統(tǒng)提供任何附加的命令以檢測(cè)對(duì)話是否正在進(jìn)行。可以根據(jù)與外部呼叫者的對(duì)話是否正在進(jìn)行通過(guò)向所述至少一個(gè)設(shè)備提供適當(dāng)?shù)妮敵鲂盘?hào)而適應(yīng)性調(diào)節(jié)本地環(huán)境。例如,可以根據(jù)與外部呼叫者的對(duì)話是否正在進(jìn)行而使提供聽(tīng)覺(jué)輸出的設(shè)備靜音。所述方法考慮了以下事實(shí)許多類型的電信網(wǎng)絡(luò)允許連接對(duì)于用戶具有很少邊際成本或者沒(méi)有邊際成本地持久地打開(kāi)。對(duì)于這樣的網(wǎng)絡(luò),打開(kāi)的連接由于延長(zhǎng)的時(shí)間段而可能未被有效使用。事實(shí)上,所述方法提供了一種用于這樣的網(wǎng)絡(luò)的存
在性管理。應(yīng)當(dāng)注意到,US2005/0251386公開(kāi)了一種對(duì)話檢測(cè)器,該對(duì)話檢測(cè)器包括信號(hào)預(yù)調(diào)節(jié)器,其響應(yīng)來(lái)自對(duì)象的源音頻信號(hào)并且產(chǎn)生預(yù)強(qiáng)調(diào)信號(hào);比較器,其耦合來(lái)接收預(yù)強(qiáng)調(diào)信號(hào)并且產(chǎn)生分辨率和采樣率降低且指示預(yù)強(qiáng)調(diào)信號(hào)的至少一個(gè)特性的脈沖;以及分析單元,其響應(yīng)產(chǎn)生的脈沖并且利用自適應(yīng)規(guī)則和指示的預(yù)強(qiáng)調(diào)信號(hào)的特性以便從中確定對(duì)象進(jìn)行的對(duì)話的存在性。該已知的系統(tǒng)僅僅使用了來(lái)自一個(gè)麥克風(fēng)或其他源的源音頻信號(hào)以便捕獲口頭表達(dá)。不存在以下公開(kāi)內(nèi)容獲得傳送來(lái)自連接在其間打開(kāi)的至少兩個(gè)電信終端的信息的信號(hào)。由此可見(jiàn),也不存在以下公開(kāi)內(nèi)容使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述至少兩個(gè)電信終端傳送的信息。事實(shí)上,該已知的系統(tǒng)只能區(qū)分語(yǔ)音和背景噪聲。進(jìn)一步注意到,US6766019公開(kāi)了一種用在聲學(xué)回聲消除器中的雙向談話檢測(cè)方法,所述聲學(xué)回聲消除器用于降低接收室中產(chǎn)生的不希望的回聲,該接收室接收包含進(jìn)入的語(yǔ)音的遠(yuǎn)端信號(hào)并且產(chǎn)生其中具有不希望的回聲的返回信號(hào)。該方法包括計(jì)算歸一化互相關(guān)估計(jì),該歸一化互相關(guān)估計(jì)代表通過(guò)遠(yuǎn)端信號(hào)的協(xié)方差歸一化并且進(jìn)一步通過(guò)返回信號(hào)的方差歸一化的遠(yuǎn)端信號(hào)與返回信號(hào)之間的互相關(guān)。該已知的系統(tǒng)并不執(zhí)行隨著時(shí)間的從所述至少兩個(gè)電信終端傳送的信息的分析, 并且所述分析沒(méi)有使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)通信終端的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則。相反地,執(zhí)行了進(jìn)入信號(hào)與本地輸入信號(hào)是否相同(指示回聲)的瞬時(shí)分析。本方法的一個(gè)實(shí)施例包括隨著時(shí)間相對(duì)于彼此分析從所述電信終端中的至少兩個(gè)傳送的音頻信息。與例如視頻信息形成對(duì)照的是,特定閾值音量以上的音頻信息將以與源對(duì)對(duì)話的貢獻(xiàn)相應(yīng)的脈沖串出現(xiàn)。這使得確定兩個(gè)或更多音頻信號(hào)的源之間的對(duì)話類交互的存在性相對(duì)容易。無(wú)需語(yǔ)音識(shí)別,而基于視頻信息確定對(duì)話類交互通常將要求用于檢測(cè)對(duì)話類交互的圖像分析。該分析可以包括例如基于臉部檢測(cè)和分析檢測(cè)嘴唇運(yùn)動(dòng),自動(dòng)手勢(shì)識(shí)別,例如語(yǔ)音活動(dòng)期間手的運(yùn)動(dòng),以及聆聽(tīng)和談話期間的(虛擬)眼睛接觸。應(yīng)當(dāng)指出的是,在該實(shí)施例中并沒(méi)有排除視聽(tīng)信號(hào)的分析。與文本消息相比較,音頻信息更適合分析以便檢測(cè)與對(duì)話輪換相應(yīng)的類型的交互。文本消息通常也會(huì)要求至少分析主題標(biāo)題以確定它們是否涉及特定討論,例如電子論壇上主辦的討論。通常,僅僅基于到這種論壇的貼子的時(shí)間流檢測(cè)對(duì)話是困難的。該實(shí)施例的一個(gè)變型包括在檢測(cè)到與電信終端的對(duì)應(yīng)用戶之間的對(duì)話輪換相應(yīng)的類型的交互時(shí)建立電信終端之間的視頻鏈接。關(guān)于這點(diǎn),建立可以簡(jiǎn)單地表示從遠(yuǎn)程終端接收的視頻信號(hào)現(xiàn)在在先前沒(méi)有提供這樣的輸出的本地輸出設(shè)備上再現(xiàn),而不管視頻信號(hào)是否可用。在該變型中已經(jīng)實(shí)現(xiàn)的效果在于,使得屏幕空間在其他時(shí)間可用于其他用途,例如再現(xiàn)視頻內(nèi)容,如電視廣播、相片圖像等等。然而,優(yōu)選地,當(dāng)建立視頻鏈接時(shí),視頻數(shù)據(jù)通信開(kāi)始,從而作為附加的效果,經(jīng)濟(jì)地利用了可用的帶寬。
在一個(gè)實(shí)施例中,向至少一個(gè)設(shè)備提供輸出信號(hào)以便產(chǎn)生聽(tīng)覺(jué)輸出,其中該輸出信號(hào)引起聽(tīng)覺(jué)輸出音量的調(diào)節(jié)。效果在于,增加了傳送到例如本地電信終端的語(yǔ)音信息的可理解性。這種終端的用戶可以以適合于充分欣賞音樂(lè)的音量聆聽(tīng)音樂(lè),直到自動(dòng)地確定對(duì)話已經(jīng)開(kāi)始。本方法的一個(gè)實(shí)施例包括,當(dāng)確定在本地電信終端的至少一個(gè)用戶以及遠(yuǎn)程電信終端中的特定終端的用戶方面沒(méi)有滿足所述至少一個(gè)準(zhǔn)則時(shí),使得來(lái)自該特定遠(yuǎn)程電信終端的信息停止由至少一個(gè)本地輸出設(shè)備復(fù)現(xiàn)。效果在于,遠(yuǎn)程電信終端的用戶不必通過(guò)中斷該終端與本地終端之間的連接的預(yù)定命令主動(dòng)地終止呼叫。尤其是在允許連接以很少的額外成本或者沒(méi)有額外成本地保持打開(kāi)的系統(tǒng)中,這確保了來(lái)自遠(yuǎn)程電信終端的信號(hào)不在本地電信終端的環(huán)境中連續(xù)地復(fù)現(xiàn)。 在話音通信系統(tǒng)的情況下,本地用戶不經(jīng)受來(lái)自遠(yuǎn)程電信終端的背景噪聲的持久刺耳的聲
曰°所述方法的一個(gè)實(shí)施例包括,當(dāng)確定在與多個(gè)本地輸入設(shè)備和本地輸出設(shè)備有關(guān)的特定位置處的用戶以及特定遠(yuǎn)程電信終端的用戶方面沒(méi)有滿足所述至少一個(gè)準(zhǔn)則時(shí),使得從該特定遠(yuǎn)程電信終端傳送的信息在本地輸出設(shè)備的選定子集處復(fù)現(xiàn)。效果在于,允許調(diào)節(jié)周圍電話系統(tǒng),其中連接“跟隨”用戶從建筑物內(nèi)的一個(gè)位置到另一個(gè)位置。在該變型中,只有到特定用戶與其進(jìn)行對(duì)話類交互的那些遠(yuǎn)程呼叫者的連接才隨著用戶移動(dòng)。一方面,這意味著當(dāng)用戶移動(dòng)時(shí),更少的連接必須移動(dòng)。另一方面,可以向本地電信終端的兩個(gè)或更多用戶中的每一個(gè)提供僅僅來(lái)自他們與其進(jìn)行對(duì)話的那些外部呼叫者的信息。尤其是在所述兩個(gè)或更多用戶處于不同房間中的情況下,這使得對(duì)話更清楚,防止混淆或者甚至不能聽(tīng)見(jiàn)通信伙伴。所述方法的一個(gè)實(shí)施例包括,當(dāng)確定在所述至少一個(gè)本地電信終端的至少一個(gè)特定用戶方面沒(méi)有滿足所述至少一個(gè)準(zhǔn)則時(shí),根據(jù)至少一個(gè)本地輸入設(shè)備接收的輸入調(diào)節(jié)至少一個(gè)用于控制設(shè)備的輸出信號(hào)。效果在于,允許按照若干不同的使用方案調(diào)節(jié)本地電信終端處的環(huán)境設(shè)置。特別地,即使在沒(méi)有確定引起至少一個(gè)本地輸入設(shè)備接收的輸入的用戶參與對(duì)話的情況下,該輸入的存在性也用作例如開(kāi)始用于話音激活的用戶接口的語(yǔ)音分析或者使環(huán)境適于兩個(gè)本地用戶之間的對(duì)話的線索。輸入完全不存在可能導(dǎo)致另一組調(diào)節(jié),例如將形成本地電信終端的所有設(shè)備移入“備用”模式。所述方法的一個(gè)實(shí)施例包括,當(dāng)確定在電信終端的用戶方面滿足所述至少一個(gè)準(zhǔn)則時(shí),利用狀態(tài)指示器通過(guò)通信網(wǎng)絡(luò)傳送與用戶關(guān)聯(lián)的標(biāo)識(shí)。該標(biāo)識(shí)可以是用戶與其關(guān)聯(lián)地注冊(cè)的終端。消息可以廣播或者以另外的方式傳輸?shù)礁采w網(wǎng)絡(luò),該覆蓋網(wǎng)絡(luò)可以是與用來(lái)傳送被分析的信息以便檢測(cè)與對(duì)話輪換相應(yīng)的交互的網(wǎng)絡(luò)不同的網(wǎng)絡(luò)。效果在于,自動(dòng)地實(shí)現(xiàn)存在性管理系統(tǒng),其特別地不依賴于顯式用戶輸入。所述方法的一個(gè)實(shí)施例包括,當(dāng)檢測(cè)到與傳送來(lái)自多個(gè)本地輸入設(shè)備中的少于全部本地輸入設(shè)備的信息的本地用戶和特定遠(yuǎn)程電信終端的用戶之間的對(duì)話相應(yīng)的類型的交互時(shí),調(diào)節(jié)信息從其傳送到該特定遠(yuǎn)程電信終端的本地輸入設(shè)備的選擇。效果在于,遠(yuǎn)程用戶接收更少的背景噪聲。來(lái)自本地用戶的信息對(duì)于遠(yuǎn)程用戶更可理解。
一個(gè)實(shí)施例包括,當(dāng)檢測(cè)到與傳送來(lái)自多個(gè)本地輸入設(shè)備中的少于全部本地輸入設(shè)備的信息的本地用戶和任何遠(yuǎn)程電信終端的用戶之間的對(duì)話相應(yīng)的類型的交互時(shí),基于這些本地輸入設(shè)備的已知位置推斷本地用戶的位置。特別是在所述信息為音頻信息的情況下,這種基于音頻的定位方法與本文提出的對(duì)話檢測(cè)方法結(jié)合變得強(qiáng)大得多。特別地,這意味著該定位方法僅通過(guò)使用被確定為攜帶用戶對(duì)對(duì)話類交互的貢獻(xiàn)并且沒(méi)有攜帶例如背景噪聲的信號(hào)來(lái)實(shí)現(xiàn)。所述方法的一個(gè)實(shí)施例包括檢測(cè)在僅僅遠(yuǎn)程電信終端的組的用戶方面滿足所述至少一個(gè)準(zhǔn)則,以及
-將至少一個(gè)用于標(biāo)識(shí)所述遠(yuǎn)程終端組的信號(hào)提供給用于建立僅僅形成所述組的遠(yuǎn)程終端之間的直接連接的系統(tǒng)。效果在于,尤其是在周圍電話系統(tǒng)中包含了本地電信終端的情況下,消除了不必要的呼叫中繼和大量背景噪聲。依照另一個(gè)方面,依照本發(fā)明的電信系統(tǒng)包括
-用于通過(guò)電信網(wǎng)絡(luò)建立至少一個(gè)遠(yuǎn)程電信終端與形成至少一個(gè)本地電信終端的至少一個(gè)本地輸入設(shè)備和至少一個(gè)本地輸出設(shè)備的組件之間的連接的設(shè)備;
-信號(hào)處理系統(tǒng),其用于處理傳送來(lái)自所述電信終端中的至少兩個(gè)的信息的信號(hào),連接在所述電信終端之間是打開(kāi)的,
其中該信號(hào)處理系統(tǒng)被設(shè)置成使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述至少兩個(gè)電信終端傳送的信息;以及
-接口,其用于提供控制至少一個(gè)設(shè)備的輸出信號(hào),其中所述系統(tǒng)被設(shè)置成當(dāng)確定所述至少一個(gè)準(zhǔn)則是否被滿足時(shí)根據(jù)該確定的結(jié)果調(diào)節(jié)輸出信號(hào)。所述電信系統(tǒng)響應(yīng)情況的變化而無(wú)需來(lái)自用戶的顯式命令。在一個(gè)實(shí)施例中,所述系統(tǒng)被設(shè)置成執(zhí)行依照本發(fā)明的方法。依照本發(fā)明的另一方面,提供了一種包含一組指令的計(jì)算機(jī)程序,其在結(jié)合到機(jī)器可讀介質(zhì)中時(shí),能夠使得具有信息處理能力的系統(tǒng)執(zhí)行依照本發(fā)明的方法。
下面將參照附圖描述本發(fā)明,在附圖中
圖1示意性地示出了包括兩個(gè)遠(yuǎn)程終端的通信網(wǎng)絡(luò)中的周圍電話系統(tǒng); 圖2示意性地示出了周圍電話系統(tǒng)中的個(gè)人(individual)電話設(shè)備的功能部件; 圖3示意性地示出了周圍電話系統(tǒng)中的主電話或代理電話的功能部件; 圖4示意性地示出了代表來(lái)自有效(active)對(duì)話中的兩個(gè)用戶的語(yǔ)音信號(hào)的兩個(gè)通道中的語(yǔ)音活動(dòng);以及
圖5為示出若干方式的流程圖,在這些方式中,對(duì)話檢測(cè)用來(lái)控制周圍電話系統(tǒng)中的會(huì)話管理、發(fā)起和終止。
具體實(shí)施例方式通過(guò)舉例的方式,圖1中示出了連接到電信網(wǎng)絡(luò)3的兩個(gè)遠(yuǎn)程終端1、2。具有三個(gè)空間5-7的建筑物4形成具有到網(wǎng)絡(luò)3的至少一個(gè)連接的本地環(huán)境。網(wǎng)絡(luò)3是廣域網(wǎng),并且可以例如包括蜂窩電話、POTS網(wǎng)絡(luò)或?qū)拵Щヂ?lián)網(wǎng)絡(luò)。通信可以經(jīng)由直接連接進(jìn)行,但是優(yōu)選地為基于數(shù)據(jù)分組的。在下文中,將假設(shè)通信是基于話音的,具有可選的視頻圖像,例如視頻會(huì)議應(yīng)用的情況。相同的原理也應(yīng)用于個(gè)人之間的其他信息通信方法,包括文本消息傳送、在公告牌上發(fā)布消息等等。在這些其他實(shí)例中,像在本實(shí)例中一樣,使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)終端的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從遠(yuǎn)程終端1、2以及從建筑物4中的實(shí)際或虛擬本地終端傳送的信息。檢測(cè)的對(duì)話用來(lái)控制周圍電話系統(tǒng)中的會(huì)話發(fā)起、終止和管理以及可選地控制建筑物4中的設(shè)備。有關(guān)檢測(cè)的對(duì)話的信息也用來(lái)由周圍電話系統(tǒng)控制音頻再現(xiàn)和捕獲。網(wǎng)絡(luò)連接性越來(lái)越基于其中不計(jì)呼叫分鐘的統(tǒng)一費(fèi)率訂購(gòu)模型(flat-rate subscription model)。因此,常見(jiàn)的是具有非常長(zhǎng)時(shí)間的呼叫,這些呼叫不再打開(kāi)或關(guān)閉, 而是以許多不同的方式部分地打開(kāi)。因此,將存在許多情形,其中存在對(duì)若干遠(yuǎn)程終端1、2 打開(kāi)的連接,而沒(méi)有連接由用戶用來(lái)傳送信息。例如,用戶可以在甚至不在他的計(jì)算機(jī)附近的情況下登錄對(duì)等覆蓋網(wǎng)絡(luò)。在所說(shuō)明的實(shí)施例中,周圍電話系統(tǒng)由個(gè)人聯(lián)網(wǎng)電話單元構(gòu)成,這些單元優(yōu)選地使用無(wú)線網(wǎng)絡(luò)連接。然而,這里概述的原理也適用于這樣的系統(tǒng),其中多個(gè)麥克風(fēng)和擴(kuò)音器連接到相同的電話系統(tǒng),例如家庭內(nèi)部通信系統(tǒng)或有線電話系統(tǒng)。這里概述的方法在這個(gè)實(shí)例中由周圍電話系統(tǒng)執(zhí)行,從而在呼叫者與用戶之間進(jìn)行區(qū)分,呼叫者用來(lái)指遠(yuǎn)程終端 1、2的用戶并且用戶用來(lái)指建筑物4內(nèi)的個(gè)人。主電話單元8包括到電信網(wǎng)絡(luò)3的接口,并且單獨(dú)地示于圖3中。在所示的實(shí)例中,存在到因特網(wǎng)、普通老式電話系統(tǒng)和蜂窩電話網(wǎng)絡(luò)的接口 9-11。在可替換的實(shí)施例中, 可以使用更少的和其他類型的接口。在其他的個(gè)人電話單元12、13經(jīng)由主電話單元8與遠(yuǎn)程終端1、2通信的意義上,也可以將主電話單元看作代理電話單元。個(gè)人電話單元中的第一個(gè)12詳細(xì)地示于圖2中,其他的單元是相同的。主電話單元8包括圖1中所示的周圍電話系統(tǒng)中的個(gè)人電話單元。每個(gè)個(gè)人電話單元12、13和主電話單元8與至少一個(gè)麥克風(fēng)14-16和至少一個(gè)揚(yáng)聲器17-19接口。在所示的實(shí)施例中,第二個(gè)人電話單元13以及主電話單元8中包含的個(gè)人電話單元也與對(duì)應(yīng)相機(jī)20、21和顯示設(shè)備22、23接口。輸出信號(hào)可以從第二個(gè)人電話單元13提供給外部照明設(shè)備M以及諸如收音機(jī)或電視機(jī)之類的娛樂(lè)設(shè)備25。這些連接中的一個(gè)或多個(gè)也可以經(jīng)由無(wú)線網(wǎng)絡(luò)或者用于家庭自動(dòng)化的某種網(wǎng)絡(luò)實(shí)現(xiàn)。參照?qǐng)D2,對(duì)于個(gè)人電話單元12操縱的到遠(yuǎn)程呼叫者的每個(gè)連接提供單獨(dú)的呼叫單元沈。接口 27包括解碼器和輸入緩沖器。在所示的實(shí)例中,接口 27包括包含G. 722解碼器和輸入緩沖器的RTP (實(shí)時(shí)分組協(xié)議)套接字接口。它接收來(lái)自IP (互聯(lián)網(wǎng)協(xié)議)套接字(未示出)的RTP數(shù)據(jù)。再現(xiàn)單元觀使得解碼的音頻數(shù)據(jù)能夠由揚(yáng)聲器17再現(xiàn)。它至少部分地在控制單元四的控制下操作,該控制單元也實(shí)現(xiàn)幾何模型,并且反過(guò)來(lái)從主電話單元8接收例如依照SIP (會(huì)話發(fā)起協(xié)議)協(xié)議且作為基于IP的TCP (傳輸控制協(xié)議)分組而攜帶的消息形式的控制信號(hào)。延遲線30被提供用于向輸入信號(hào)處理單元31提供參考信號(hào)。該參考信號(hào)使得輸入信號(hào)處理單元31能夠執(zhí)行聲學(xué)回聲消除。輸入信號(hào)處理單元31也執(zhí)行自動(dòng)增益控制,并且可以執(zhí)行其他的信號(hào)處理功能以便提供攜帶來(lái)自用戶的音頻信息的信號(hào)。輸入信號(hào)處理單元31也接收來(lái)自控制單元四的控制信號(hào)。該輸入信號(hào)處理單元將攜帶音頻信息的信號(hào)提供給G. 722解碼器和輸出RTP套接字32并且提供給語(yǔ)音活動(dòng)檢測(cè)(SAD)系統(tǒng)33。典型的SAD系統(tǒng)33使用這樣的算法,該算法根據(jù)短的音頻片段計(jì)算一定數(shù)量的特性特征并且使用這些特性特征確定聲音片段是否是語(yǔ)音、非語(yǔ)音或者靜音??梢詧?zhí)行任何類型的語(yǔ)音活動(dòng)檢測(cè)(也稱為話音活動(dòng)檢測(cè))算法。在以下文獻(xiàn)中給出了若干實(shí)例
Bhou-Gazale, S. and Assaleh, K. , "A robust endpoint detection of speech for noisy environments with application to automatic speech recognition,,, Proc. ICASSP 2002, Orlando, Florida, May 2002 ;
Davis, A. et al. , "Statistical voice activity detection using low/variance spectrum estimation and an adaptive threshold,,,IEEE Trans, on audio, speech and language processing, 14(2),2006,pp. 412-424;以及
Huang, L, and Yang, C. , "A novel approach to robust speech detection in car environments", IEEE Int. Conf. on Acoustics, Speech and Signal Processing, 3(5-9), 2000, pp. 1751-1754。已經(jīng)注意到,SAD系統(tǒng)33的功能也可以僅僅在主電話單元8中實(shí)現(xiàn),其接收經(jīng)由 G. 722解碼器和輸出RTP套接字32提供的信號(hào)。該功能也可以實(shí)現(xiàn)為輸入信號(hào)處理單元 31中執(zhí)行的回聲消除和語(yǔ)音增強(qiáng)算法的一部分。語(yǔ)音活動(dòng)檢測(cè)的輸出經(jīng)常是二進(jìn)制值。它也可以是例如置信度值。針對(duì)預(yù)定持續(xù)時(shí)間間隔的語(yǔ)音活動(dòng)檢測(cè)的結(jié)果通過(guò)建筑物4中的網(wǎng)絡(luò)發(fā)送到主電話單元8。參照?qǐng)D3,主電話單元8為向其打開(kāi)連接的每個(gè)外部呼叫者(在這種情況下與遠(yuǎn)程終端1、2相應(yīng))創(chuàng)建呼叫實(shí)例34。呼叫實(shí)例34利用語(yǔ)音增強(qiáng)功能35以提供攜帶音頻信息的傳輸?shù)絺€(gè)人電話單元12、13中的一個(gè)或多個(gè)的信號(hào)。該信號(hào)也經(jīng)受語(yǔ)音活動(dòng)檢測(cè)36。語(yǔ)音增強(qiáng)功能35的輸出和攜帶音頻信息且與呼叫實(shí)例34關(guān)聯(lián)的其他信號(hào)二者都在特別地輸出到揚(yáng)聲器17-19中的一個(gè)或多個(gè)之前提交給剩余的AEC 37。對(duì)話活動(dòng)檢測(cè)單元38接收來(lái)自第一個(gè)人電話單元12中的SAD系統(tǒng)33和其他個(gè)人電話單元中的相似系統(tǒng)二者以及來(lái)自語(yǔ)音活動(dòng)檢測(cè)功能36的輸出,該語(yǔ)音活動(dòng)檢測(cè)功能應(yīng)用到從呼叫實(shí)例34關(guān)聯(lián)的遠(yuǎn)程終端1、2傳送的信息。對(duì)話活動(dòng)檢測(cè)單元38的輸出是代表使用關(guān)聯(lián)的遠(yuǎn)程終端1、2的呼叫者與包括個(gè)人電話單元12、13中的一個(gè)或多個(gè)的環(huán)境中的本地用戶之間的對(duì)話類交互的存在性的瞬時(shí)概率的值。這些輸出被提供給主控制單元 39以便控制周圍電話系統(tǒng)本身或者其外部的設(shè)備,例如娛樂(lè)設(shè)備25或者外部照明設(shè)備M 等等,如將要解釋的。可以以若干不同的方式檢測(cè)對(duì)話輪換。參照?qǐng)D4,示出了兩個(gè)音頻信息流40、41, 一個(gè)信息流來(lái)自遠(yuǎn)程終端1、2之一,并且另一個(gè)信息流來(lái)自個(gè)人電話單元12、13之一或主電話單元8的用戶。后一流41事實(shí)上可以通過(guò)使用例如W02007/086042中描述的分割技術(shù)將音頻信號(hào)分割成與提供音頻信息給電話單元8、12、13之一的若干用戶之一關(guān)聯(lián)的片段來(lái)獲得。流40、41包括由SAD系統(tǒng)33和SAD功能36確定的靜音時(shí)段42、43和語(yǔ)音時(shí)段 44,450
與對(duì)話輪換相應(yīng)的交互類型的檢測(cè)基于若干原理
1.對(duì)于大多數(shù)對(duì)話而言,在對(duì)話中,在任一時(shí)刻只有一個(gè)談話者是活動(dòng)的;
2.談話者輪流談話,使得活動(dòng)/靜音談話者的通道交替;
3.兩個(gè)通道中的連續(xù)靜音意味著在參與者之間不存在活動(dòng)的對(duì)話輪換;
4.一個(gè)通道中的非交替語(yǔ)音活動(dòng)意味著不存在通道之間的對(duì)話活動(dòng),而是存在例如由相同遠(yuǎn)程終端1、2拾取的兩個(gè)呼叫者之間的對(duì)話;
5.如果語(yǔ)音時(shí)段44、45與靜音時(shí)段42、43之間的輪換在通道之間不同步,那么在所討論的通道之間不存在對(duì)話輪換。這就是為什么隨著時(shí)間相對(duì)于彼此分析流40、41的原因。一種檢測(cè)對(duì)話輪換的可能的算法如下Λ η為音頻幀標(biāo)號(hào)并且命」為通道7 中的幀包含SAD系統(tǒng)33或SAD功能36確定的語(yǔ)音的似然率。在一個(gè)簡(jiǎn)單的實(shí)例中, Pl (η)的值可以是0 (無(wú)語(yǔ)音)或者1 (語(yǔ)音)。存在初始化為零的四個(gè)狀態(tài)變量/^msm⑶7、 Presence2、Conflict、Silence。存在如下初始化的三個(gè)另外的狀態(tài)變量
gl = 0.9 ; g2 = 0. 99 ;以及 g3 = 0.995。以偽代碼表示,該算法如下運(yùn)行
1.確定通道1和2中的當(dāng)前幀/7的VAD狀態(tài)并且評(píng)估
if pi (η) >0 AND p2(n)==Q,
Presencel := gl ^Presencel+ (1-gl);
Presence2 := g2^Presence2 ;
Conflict := g2^Conflict\
Silence := g3^Silence;
end
if p2(n)>Q AND pl(n)==Q, Presence2 := gl ^Presence2+ (1 -gl); Presencel := g2^Presencel; Conflict := g2^Conflict\ Silence := g3^Silence; end
if p2(n)>Q AND pi (n) >0, Presencel := g2^Presencel+(1~g2); Presence2 := g2^Presence2+ {\~g2); Conflic t ·. 二 gl 爾 Con flic t+{l~gl); Silence := g3^Silence; end
if p2(n)==Q AND pl(n)==Q, Presencel := g3^Presencel; Presence2 := g3^Presence2 ; Conflict := g3^Conflict\Silence = g3^Silence+ i.l~g3); end
Conversation (η)-Presencel^Presence2 _ Conflict-Silence ; 2. η: =n+l go to step 1。當(dāng)Conversation (n)的當(dāng)前值超過(guò)特定閾值時(shí),檢測(cè)到對(duì)話。因此,算法隨著時(shí)間評(píng)估信息,因?yàn)樗呛箢櫺缘?backward-looking),狀態(tài)變量確保Conversation的當(dāng)前值基于在先音頻幀的評(píng)估。同時(shí),由于它是對(duì)話是否存在的連續(xù)演進(jìn)的確定,因而它適合作為用于控制設(shè)備的輸出信號(hào)的基礎(chǔ)。上面概括的基本方法可以尤其是根據(jù)可用的計(jì)算資源以各種不同的方式增強(qiáng)。例如,除了狀態(tài)變量/¥£^£ ^7、/^e1Sez7CeA Conflict、Silence之外或者作為這些狀態(tài)變量的替代物,可以使用在更長(zhǎng)的觀測(cè)時(shí)段(若干音頻幀)上計(jì)算的狀態(tài)變量。這些狀態(tài)變量包括在兩個(gè)或更多信號(hào)中的若干分鐘的語(yǔ)音活動(dòng)檢測(cè)值上計(jì)算的相關(guān)或互信息度量。在自然對(duì)話中,聆聽(tīng)參與者經(jīng)常向談話者提供簡(jiǎn)短話語(yǔ)(“是的”、“好的”、“真的?”、“嗯”等等)形式的反饋。這經(jīng)常稱為反向通道語(yǔ)音活動(dòng)。其可以基于這些話語(yǔ)簡(jiǎn)短(<ls)并且由相對(duì)較長(zhǎng)的靜音分開(kāi)這一事實(shí)在來(lái)自遠(yuǎn)程終端1、2之一以及來(lái)自個(gè)人電話單元12、13之一或主電話單元8的用戶的音頻信息流40、41內(nèi)單獨(dú)地檢測(cè)。反向通道活動(dòng)檢測(cè)可以用作附加的狀態(tài)變量,或者它可以用來(lái)修改例如狀態(tài)變量Cb/7/7ici,其中僅當(dāng)一定時(shí)間片段的重疊語(yǔ)音活動(dòng)不代表來(lái)自另一談話者的反向通道活動(dòng)時(shí)檢測(cè)到?jīng)_突 (conflict)。另外的特征可以從輪換的時(shí)間精細(xì)結(jié)構(gòu)導(dǎo)出。例如,第二音頻信息流41中的語(yǔ)音活動(dòng)時(shí)段45的終點(diǎn)與第一音頻信息流40中的后續(xù)語(yǔ)音活動(dòng)時(shí)段44的起點(diǎn)之間的時(shí)間點(diǎn)以及相反情況之間的時(shí)間差值可以用作對(duì)話輪換的質(zhì)量度量。在對(duì)話類交互的情況下,與非對(duì)話交互相比,對(duì)于說(shuō)話者的若干變化測(cè)量的該時(shí)間差值具有稍微正的平均值和低的方差。在后一種情況下,時(shí)間差值具有零平均值和大的方差。為了提高檢測(cè)說(shuō)話者變化的精度,可以利用音頻信息內(nèi)容的分析增強(qiáng)語(yǔ)音活動(dòng)檢測(cè)。特別地,對(duì)于音頻信息流40、41,可以分析音高(pitch)。在許多語(yǔ)言中,說(shuō)出的話語(yǔ)結(jié)束之前的上升的音高表示對(duì)另一談話者的疑問(wèn)。如果這接著是另一談話者的語(yǔ)音活動(dòng),其可能地在小的停頓之后,那么這種類型的變化可以標(biāo)記為問(wèn)題-回答結(jié)構(gòu),其可以表征為用來(lái)檢測(cè)對(duì)話類交互的對(duì)話模型中的特征(狀態(tài)變量)。應(yīng)當(dāng)注意到,上面詳細(xì)地描述的算法基于使用一階積分器確定的若干狀態(tài)變量的動(dòng)態(tài)時(shí)間演進(jìn)。各種不同的線性和非線性濾波和積分算法可以用作可替換方案。代替使用特征的線性組合以形成代表對(duì)話活動(dòng)的似然率的特征Conversation,對(duì)話的檢測(cè)可以基于不同于線性檢測(cè)(或回歸)模型的其他模型,包括基于判別分析、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的各種不同類型的數(shù)據(jù)分類方法。特征Conversation也可以是具有0與1之間的標(biāo)度上的值的連續(xù)似然率變量,而不是二進(jìn)制變量。最后,代替使用固定參數(shù)以用于時(shí)間演進(jìn)(W,g2, g3)和檢測(cè)邏輯(步驟2)的是, 單獨(dú)的技術(shù)可以用來(lái)最優(yōu)化用于不同用戶和呼叫者或者不同情境的參數(shù)。例如,可以單獨(dú)地對(duì)于系統(tǒng)的每對(duì)對(duì)話伙伴或者每個(gè)本地用戶和標(biāo)識(shí)的定期遠(yuǎn)程呼叫者調(diào)整對(duì)話檢測(cè)器。類似地,根據(jù)傳送正被分析的音頻信息的信號(hào)是來(lái)自第一或第二個(gè)人電話單元12、13還是來(lái)自主電話單元8,所述參數(shù)和/或檢測(cè)邏輯可以不同。對(duì)話檢測(cè)的方法通常相當(dāng)難于實(shí)時(shí)實(shí)現(xiàn)。然而,在諸如電信系統(tǒng)之類的中介環(huán)境 (mediated environment)中,它們的實(shí)現(xiàn)在較低計(jì)算成本下變得可行,因?yàn)橐呀?jīng)清楚每個(gè)音頻信息流來(lái)自何處。這與在裝有麥克風(fēng)的房間中的人之間進(jìn)行對(duì)話檢測(cè)的系統(tǒng)形成對(duì)照,因?yàn)樵谀抢锼械穆曇舯徊东@并且必須首先歸屬于房間中的各個(gè)人。通常,建筑物4中的周圍電話系統(tǒng)提供了一種空間音頻輸入/輸出系統(tǒng),該系統(tǒng)可以加以控制,使得當(dāng)用戶從空間5-7之一移動(dòng)到另一空間時(shí)呼叫者跟隨用戶。也可能具有與環(huán)境中的不同用戶的多個(gè)同時(shí)呼叫以及還有保留打開(kāi)或駐留在特定位置,但是不活動(dòng)的呼叫。在其中存在若干呼叫者,來(lái)自周圍電話系統(tǒng)的與所述呼叫者的連接在任何給定時(shí)間打開(kāi)的情況下,用戶應(yīng)當(dāng)能夠發(fā)信號(hào)告知系統(tǒng)哪個(gè)呼叫者打算移動(dòng)。例如,如果第一用戶正在第一空間5中與呼叫者A對(duì)話并且第二用戶在相同空間中與呼叫者B對(duì)話,那么當(dāng)?shù)谝挥脩粢苿?dòng)到第二空間6時(shí),系統(tǒng)確保只有到呼叫者A的連接移動(dòng)到第二空間6。這要求跟蹤用戶,而且也要求確定第一用戶參加的有效對(duì)話。該確定如下面參照?qǐng)D5解釋的自動(dòng)地執(zhí)行。也存在呼叫者A和B只與彼此對(duì)話的可能性。在這種方案下,系統(tǒng)可以關(guān)閉周圍電話系統(tǒng)與呼叫者A和B的遠(yuǎn)程終端1、2之間的連接。系統(tǒng)也可以檢測(cè)僅局部地存在對(duì)話,即不涉及任何外部呼叫者的第一和第二用戶之間的對(duì)話。參照?qǐng)D5,給出了由周圍電話系統(tǒng)執(zhí)行且涉及尤其在電話/視頻會(huì)議系統(tǒng)的會(huì)話管理情境中的各種示例性控制應(yīng)用的方法的概要。在上面已經(jīng)詳細(xì)說(shuō)明的第一步驟46中,獲得將來(lái)自遠(yuǎn)程終端1、2中的至少一個(gè)的信息傳送到建筑物4中的周圍電話系統(tǒng)的主電話單元8的信號(hào)。此外,個(gè)人電話單元12、 13和主電話單元8獲得攜帶來(lái)自用戶的音頻信息的信號(hào)??蛇x地(步驟47),如所解釋的, 將這些本地信號(hào)分割成來(lái)自不同用戶的貢獻(xiàn)。然后,使用例如上面詳細(xì)說(shuō)明的算法,通過(guò)使用至少一個(gè)用于檢測(cè)與呼叫者和用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從遠(yuǎn)程終端1、2和本地終端傳送的信息,檢測(cè)對(duì)話(步驟48)。同時(shí),跟蹤建筑物4中的用戶(步驟49)以便確定他們當(dāng)前位于空間5-7中的哪個(gè)空間。在一種變型中,使用標(biāo)簽(例如RFID (射頻識(shí)別)標(biāo)簽)和位于建筑物4內(nèi)的讀取器跟蹤用戶。在另一個(gè)實(shí)施例中,使用基于音頻的定位方法,即通過(guò)確定來(lái)自麥克風(fēng)14-16的信號(hào)的相對(duì)信號(hào)強(qiáng)度跟蹤用戶。在該后一種變型中,不同樣地標(biāo)識(shí)和跟蹤用戶,而是確定并行步驟48中檢測(cè)的對(duì)話中的每個(gè)本地參與者位于何處。其他跟蹤方法可以作為可替換方案使用或者在該步驟49中組合使用。如果確定特定本地用戶不參與檢測(cè)的對(duì)話,但是音頻信息仍然清楚地從該用戶傳送,那么至少一個(gè)用于根據(jù)至少一個(gè)本地輸入設(shè)備接收的輸入控制設(shè)備的輸出信號(hào)可以由主電話單元8或者個(gè)人電話單元12、13之一提供。特別地,不存在對(duì)話的情況下的話音輸入可以用作使得話音激活的用戶接口能夠允許用戶例如設(shè)置新的連接(呼叫特定遠(yuǎn)程終端 1、2)、控制娛樂(lè)設(shè)備25的揚(yáng)聲器17-19的音量等等的線索。另一方面,如果確定用戶參與檢測(cè)的對(duì)話,那么通過(guò)電信網(wǎng)絡(luò)3傳送與用戶關(guān)聯(lián)的標(biāo)識(shí)(步驟50)。該消息適當(dāng)?shù)貫橥ㄟ^(guò)對(duì)等網(wǎng)絡(luò)的消息,用以指示用戶對(duì)于其他活動(dòng)或另外的對(duì)話類交互的可用性。該消息可以包括在并行步驟49中確定的用戶位置的另外指示。 當(dāng)然,如果確定用戶在建筑物中,但不是任何檢測(cè)的對(duì)話中的參與者,那么狀態(tài)的傳送也將涉及傳輸與用戶可用于對(duì)話類交互的指示共同地傳送與用戶關(guān)聯(lián)的標(biāo)識(shí)的消息。應(yīng)當(dāng)注意到,在沒(méi)有單獨(dú)地標(biāo)識(shí)用戶的情況下,例如因?yàn)橹挥谢谝纛l的定位方法被使用,那么與用戶關(guān)聯(lián)的標(biāo)識(shí)可以僅僅包括周圍電話系統(tǒng)的標(biāo)識(shí),或者可能地包括個(gè)人電話單元12、13和主電話單元8代表的本地終端之一的標(biāo)識(shí)。特別地,如果檢測(cè)到新的對(duì)話,涉及迄今未用于對(duì)話的個(gè)人電話單元12、13,例如第二電話單元13,那么可以通過(guò)向第二電話單元13以及因而向與其附接的相機(jī)20和顯示設(shè)備22提供控制信號(hào)而打開(kāi)到遠(yuǎn)程呼叫者的視頻鏈接(步驟51)。因此,例如,顯示設(shè)備22 的內(nèi)容可以從娛樂(lè)變化為其他呼叫參與者的圖像。僅在檢測(cè)到一個(gè)或多個(gè)呼叫者與第二電話單元13鄰近的用戶之間的對(duì)話時(shí)接通相機(jī)20確保了不持久地傳輸來(lái)自建筑物4內(nèi)的圖像,而是僅在需要時(shí)將其傳輸?shù)竭h(yuǎn)程終端。用戶不必給出任何命令以提供該效果,而是只需參與對(duì)話。此外,如果檢測(cè)到新的對(duì)話,那么可以使被設(shè)置成產(chǎn)生與正在進(jìn)行的通信無(wú)關(guān)的聽(tīng)覺(jué)輸出的娛樂(lè)設(shè)備25靜音(步驟52),或者至少可以通過(guò)提供用于控制娛樂(lè)設(shè)備25的適當(dāng)?shù)妮敵鲂盘?hào)而自動(dòng)地降低聽(tīng)覺(jué)輸出的音量。在這個(gè)方面,也考慮完全關(guān)斷娛樂(lè)設(shè)備25以
及調(diào)節(jié)音量。在所說(shuō)明的實(shí)施例中,使用遠(yuǎn)程終端1、2之一的呼叫者與被確定為處于電話單元 12、13之一的環(huán)境中的本地用戶之間的對(duì)話的檢測(cè)用來(lái)選擇復(fù)現(xiàn)來(lái)自遠(yuǎn)程終端1、2中的特定終端的音頻信號(hào)所在的電話單元(步驟53),并且使得音頻信息停止由其他電話單元8、 12、13復(fù)現(xiàn)。因此,在先前向所有電話單元8、12、13打開(kāi)連接的情況下,緊鄰它們之一的用戶與遠(yuǎn)程呼叫者之間的對(duì)話的檢測(cè)將使得從遠(yuǎn)程呼叫者使用的特定遠(yuǎn)程終端1、2傳送的音頻信息在本地輸出設(shè)備(即揚(yáng)聲器17-19)的選定子集處復(fù)現(xiàn),所述選定子集可以是一個(gè)這樣的輸出設(shè)備。類似地,當(dāng)通過(guò)確定用戶的位置或者通過(guò)監(jiān)視來(lái)自這些設(shè)備的音頻信號(hào)的相對(duì)強(qiáng)度和/或內(nèi)容而檢測(cè)到本地用戶正傳送來(lái)自所述輸入設(shè)備(即麥克風(fēng)14-16)中的少于所有的輸入設(shè)備的信息時(shí),調(diào)節(jié)信息從其傳送到呼叫者使用的遠(yuǎn)程終端1、2的麥克風(fēng) 14-16的選擇。因此,將向遠(yuǎn)程呼叫者提供更清楚地理解的音頻信息。應(yīng)當(dāng)注意到,所述周圍電話系統(tǒng)也通過(guò)使用至少一個(gè)用于檢測(cè)與遠(yuǎn)程終端的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則而相對(duì)于彼此分析從兩個(gè)遠(yuǎn)程終端1、2傳送的信息??赡馨l(fā)生的是,該分析得到以下結(jié)論存在不涉及建筑物4中的任何用戶的遠(yuǎn)程終端 1、2用戶之間的有效對(duì)話。在這種情況下,主電話單元8將消息傳輸?shù)竭h(yuǎn)程終端1、2 (步驟 54),向它們告知呼叫者和/或他們的電信終端的身份并且指示直接的對(duì)話是可能的。該消息可以例如依照SIP (會(huì)話發(fā)起協(xié)議)協(xié)議。如果并且當(dāng)使用遠(yuǎn)程終端1、2的呼叫者接受該消息時(shí),建立起使用遠(yuǎn)程終端1、2的呼叫者之間的新呼叫,其不再通過(guò)建筑物4中的主電話單元8而中繼。因此,當(dāng)檢測(cè)到在包括僅僅遠(yuǎn)程終端1、2的電信終端組的用戶方面滿足所述至少一個(gè)用于檢測(cè)對(duì)話類交互的準(zhǔn)則時(shí),主電話單元8提供至少一個(gè)標(biāo)識(shí)遠(yuǎn)程終端1、 2組的信號(hào)以便建立僅僅形成該組的遠(yuǎn)程終端1、2之間的直接連接。在當(dāng)前實(shí)例中,信號(hào)發(fā)送到這些終端,但是在另一個(gè)實(shí)施例中,信號(hào)可以通過(guò)網(wǎng)絡(luò)3發(fā)送到某種交換管理連接。如果用戶在建筑物4內(nèi)移動(dòng),那么這被檢測(cè)到(步驟49)。已知該特定用戶參與哪
13個(gè)對(duì)話類交互(步驟48)。檢測(cè)到用戶正參與哪些對(duì)話類交互以及特別地與哪些遠(yuǎn)程終端 1、2的用戶交互之后,執(zhí)行選擇使外部呼叫者“移動(dòng)”到哪個(gè)電話單元8、12、13的步驟55。 該步驟陽(yáng)類似于當(dāng)檢測(cè)到新的對(duì)話時(shí)執(zhí)行的相應(yīng)步驟53。特別地,調(diào)節(jié)信息從其傳送到所涉及的遠(yuǎn)程終端1、2的本地輸入設(shè)備(即麥克風(fēng)14-16)的選擇。確定了在用戶的位置變化之后他或他要使用的電話單元8、12、13中的最合適的電話單元,使外部呼叫者移動(dòng)56。換言之,當(dāng)檢測(cè)到在電話單元8、12、13的第一個(gè)處不再存在本地用戶與遠(yuǎn)程終端1、2中的特定終端的用戶之間的對(duì)話時(shí),來(lái)自該特定遠(yuǎn)程終端的信息停止在電話單元8、12、13的第一個(gè)處復(fù)現(xiàn)。這使得在定位用戶之后其開(kāi)始在電話單元 8、12、13中的不同電話單元處復(fù)現(xiàn)。此外,當(dāng)檢測(cè)到對(duì)話類交互隨用戶移動(dòng)到新的電話單元8、12、13時(shí),控制該新的電話單元的鄰域中的外部設(shè)備。特別地,可以使娛樂(lè)設(shè)備25靜音,可以打開(kāi)視頻鏈接并且可以控制照明設(shè)備M以照亮第二電話單元13的環(huán)境以便提高通過(guò)視頻鏈接提供的畫(huà)面質(zhì)量,或者在任何情況下強(qiáng)調(diào)說(shuō)話者是誰(shuí)。通過(guò)檢測(cè)遠(yuǎn)程終端1、2之一的用戶與本地用戶之間的對(duì)話類交互,進(jìn)行所有上述調(diào)節(jié)且事實(shí)上使得這些調(diào)節(jié)成為可能。原則上,無(wú)需使用控制面板或遠(yuǎn)程控制單元的附加用戶輸入。應(yīng)當(dāng)指出的是,上述實(shí)施例說(shuō)明了而不是限制了本發(fā)明,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求書(shū)的范圍的情況下應(yīng)當(dāng)能夠設(shè)計(jì)出許多可替換的實(shí)施例。在權(quán)利要求書(shū)中,置于括號(hào)之間的任何附圖標(biāo)記都不應(yīng)當(dāng)被視為限制了權(quán)利要求。動(dòng)詞“包括/包含” 并沒(méi)有排除存在權(quán)利要求中未列出的元件或步驟。元件之前的措詞“一”或“一個(gè)”并沒(méi)有排除存在多個(gè)這樣的元件。在相互不同的從屬權(quán)利要求中陳述了特定的技術(shù)措施這一事實(shí)并不意味著這些技術(shù)措施的組合不可以加以利用。例如,代替使用個(gè)人電話單元12、13的是,可以利用僅僅一個(gè)與圍繞建筑物4分布的麥克風(fēng)和揚(yáng)聲器接口的終端實(shí)現(xiàn)周圍電話系統(tǒng)。盡管已經(jīng)使用其中檢測(cè)語(yǔ)音活動(dòng)的實(shí)例解釋了檢測(cè)對(duì)話的方法,但是此外或者作為可替換方案可以使用基于內(nèi)容的分析以便檢測(cè)語(yǔ)音的存在性。而且,在提供了視頻鏈接的情況下,可以與音頻和/或視頻信號(hào)有關(guān)地使用視頻分析以便確定對(duì)話類交互是否正在發(fā)生。例如,在從本地用戶傳送音頻信息的同時(shí)在遠(yuǎn)程用戶的視頻圖像中的運(yùn)動(dòng)的缺乏或者聆聽(tīng)姿勢(shì)的檢測(cè)將是對(duì)話類交互的良好指示器。類似地,散布于有效身體運(yùn)動(dòng)時(shí)段的運(yùn)動(dòng)缺乏或聆聽(tīng)姿勢(shì)的時(shí)段也可以是對(duì)話類交互的良好指示。在分析到“白板”環(huán)境的貼子流的情況下,類似的方法可以用來(lái)區(qū)分不同的對(duì)話類交互。
權(quán)利要求
1.一種使用電信系統(tǒng)控制至少一個(gè)設(shè)備(8,12,13,20-25)的方法,包括-獲得傳送來(lái)自至少一個(gè)遠(yuǎn)程電信終端(1,2)和來(lái)自用于與至少一個(gè)本地輸出設(shè)備 (17-19)形成至少一個(gè)本地電信終端的至少一個(gè)本地輸入設(shè)備(14-16)的信息的信號(hào),連接在遠(yuǎn)程和本地電信終端之間是打開(kāi)的;-使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端(1,2,8,12,13)的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述電信終端(1,2,8,12,13)中的至少兩個(gè)傳送的信息(40,41);以及-當(dāng)確定是否滿足所述至少一個(gè)準(zhǔn)則時(shí)調(diào)節(jié)至少一個(gè)用于控制設(shè)備(8,12,13,20-25) 的輸出信號(hào)。
2.依照權(quán)利要求1的方法,包括隨著時(shí)間相對(duì)于彼此分析從電信終端(1,2,8,12,13) 中的至少兩個(gè)傳送的音頻信息。
3.依照權(quán)利要求2的方法,包括在檢測(cè)到與電信終端(1,2,8,12,13)的對(duì)應(yīng)用戶之間的對(duì)話輪換相應(yīng)的類型的交互時(shí)建立電信終端(1,2,8,12,13)之間的視頻鏈接。
4.依照權(quán)利要求1的方法,其中向至少一個(gè)設(shè)備(25)提供輸出信號(hào)以便產(chǎn)生聽(tīng)覺(jué)輸出,其中該輸出信號(hào)引起聽(tīng)覺(jué)輸出音量的調(diào)節(jié)。
5.依照權(quán)利要求1的方法,包括當(dāng)確定在本地電信終端的至少一個(gè)用戶以及遠(yuǎn)程電信終端(1,2)中的特定終端的用戶方面沒(méi)有滿足所述至少一個(gè)準(zhǔn)則時(shí),使得來(lái)自該特定遠(yuǎn)程電信終端(1,2)的信息停止由至少一個(gè)本地輸出設(shè)備(17-19)復(fù)現(xiàn)。
6.依照權(quán)利要求1的方法,包括當(dāng)確定在與多個(gè)本地輸入設(shè)備(14-16)和本地輸出設(shè)備(17-19)有關(guān)的特定位置處的用戶以及特定遠(yuǎn)程電信終端(1,2)的用戶方面沒(méi)有滿足所述至少一個(gè)準(zhǔn)則時(shí),使得從該特定遠(yuǎn)程電信終端(1,2)傳送的信息在本地輸出設(shè)備 (17-19)的選定子集處復(fù)現(xiàn)。
7.依照權(quán)利要求1的方法,包括當(dāng)確定在所述至少一個(gè)本地電信終端的至少一個(gè)特定用戶方面沒(méi)有滿足所述至少一個(gè)準(zhǔn)則時(shí),根據(jù)至少一個(gè)本地輸入設(shè)備(14-16)接收的輸入調(diào)節(jié)至少一個(gè)用于控制設(shè)備的輸出信號(hào)。
8.依照權(quán)利要求1的方法,包括當(dāng)確定在電信終端(1,2,8,12,13)的用戶方面滿足所述至少一個(gè)準(zhǔn)則時(shí),利用狀態(tài)指示器通過(guò)通信網(wǎng)絡(luò)(3)傳送與用戶關(guān)聯(lián)的標(biāo)識(shí)。
9.依照權(quán)利要求1的方法,包括當(dāng)檢測(cè)到與傳送來(lái)自多個(gè)本地輸入設(shè)備(14-16)中的少于全部本地輸入設(shè)備的信息的本地用戶和特定遠(yuǎn)程電信終端(1,2)的用戶之間的對(duì)話相應(yīng)的類型的交互時(shí),調(diào)節(jié)信息從其傳送到該特定遠(yuǎn)程電信終端(1,2)的本地輸入設(shè)備 (14-16)的選擇。
10.依照權(quán)利要求1的方法,包括當(dāng)檢測(cè)到與傳送來(lái)自多個(gè)本地輸入設(shè)備(14-16)中的少于全部本地輸入設(shè)備的信息的本地用戶和任何遠(yuǎn)程電信終端(1,2)的用戶之間的對(duì)話相應(yīng)的類型的交互時(shí),基于這些本地輸入設(shè)備(14-16)的已知位置推斷本地用戶的位置。
11.依照權(quán)利要求1的方法,包括-檢測(cè)在僅僅遠(yuǎn)程電信終端(1,2)的組的用戶方面滿足所述至少一個(gè)準(zhǔn)則,以及-將至少一個(gè)用于標(biāo)識(shí)遠(yuǎn)程終端(1,2)組的信號(hào)提供給用于建立僅僅形成所述組的遠(yuǎn)程終端(1,2 )之間的直接連接的系統(tǒng)。
12.一種電信系統(tǒng),包括-用于通過(guò)電信網(wǎng)絡(luò)(3 )建立至少一個(gè)遠(yuǎn)程電信終端(1,2 )與形成至少一個(gè)本地電信終端的至少一個(gè)本地輸入設(shè)備(14-16)和至少一個(gè)本地輸出設(shè)備(17-19)的組件之間的連接的設(shè)備(8);-信號(hào)處理系統(tǒng)(8,12,13),其用于處理傳送來(lái)自電信終端(1,2,8,12,13)中的至少兩個(gè)的信息的信號(hào),連接在所述電信終端之間是打開(kāi)的,其中該信號(hào)處理系統(tǒng)被設(shè)置成使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端(1,2,8,12,13) 的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述至少兩個(gè)電信終端(1,2,8,12,13)傳送的信息(40,41);以及-接口(32),其用于提供控制至少一個(gè)設(shè)備(8,12,13,20-25)的輸出信號(hào),其中所述系統(tǒng)被設(shè)置成當(dāng)確定所述至少一個(gè)準(zhǔn)則是否被滿足時(shí)根據(jù)該確定的結(jié)果調(diào)節(jié)輸出信號(hào)。
13.依照權(quán)利要求12的電信系統(tǒng),被設(shè)置成執(zhí)行依照權(quán)利要求1-11中任何一項(xiàng)的方法。
14.一種包含一組指令的計(jì)算機(jī)程序,其在結(jié)合到機(jī)器可讀介質(zhì)中時(shí),能夠使得具有信息處理能力的系統(tǒng)執(zhí)行依照權(quán)利要求1-11中任何一項(xiàng)的方法。
全文摘要
一種使用電信系統(tǒng)控制至少一個(gè)設(shè)備(8,12,13,20-25)的方法,包括獲得傳送來(lái)自至少一個(gè)遠(yuǎn)程電信終端(1,2)和來(lái)自用于與至少一個(gè)本地輸出設(shè)備(17-19)形成至少一個(gè)本地電信終端的至少一個(gè)本地輸入設(shè)備(14-16)的信息的信號(hào),連接在遠(yuǎn)程和本地電信終端之間是打開(kāi)的;使用至少一個(gè)用于檢測(cè)與對(duì)應(yīng)電信終端(1,2,8,12,13)的用戶之間的對(duì)話輪換相應(yīng)的類型的交互的準(zhǔn)則隨著時(shí)間相對(duì)于彼此分析從所述電信終端(1,2,8,12,13)中的至少兩個(gè)傳送的信息(40,41);以及當(dāng)確定是否滿足所述至少一個(gè)準(zhǔn)則時(shí)調(diào)節(jié)至少一個(gè)用于控制設(shè)備(8,12,13,20-25)的輸出信號(hào)。
文檔編號(hào)H04L12/28GK102160335SQ200980136665
公開(kāi)日2011年8月17日 申請(qǐng)日期2009年9月9日 優(yōu)先權(quán)日2008年9月18日
發(fā)明者A·S·哈馬 申請(qǐng)人:皇家飛利浦電子股份有限公司