專利名稱:用于通信裝置中免提電話操作的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,更具體而言,涉及在蜂窩電話或其他通信裝置中產(chǎn)生更清楚、更可靠的免提電話操作的技術(shù)。
背景技術(shù):
在蜂窩手機和其他通信裝置中,便利以及有效的免提電話操作成為希望的特征。關(guān)心交通安全的團體在某些情況下禁止駕車時的蜂窩電話手持操作。配備有免提電話特征的手機和其他裝置允許用戶將裝置放在車內(nèi)靜止位置或其他位置,同時仍然執(zhí)行正常的通話和其他電話接入。
然而,給蜂窩電話配備有效的免提電話性能并不是普通的集成作業(yè)。一種實際困難是,多數(shù)蜂窩電話是小型裝置,在相互相隔幾英寸的范圍內(nèi)包含耳機揚聲器以及集成的麥克風(fēng),從而使得單元更緊湊。因此,揚聲器路徑和麥克風(fēng)路徑同時都活動的雙工類型操作會產(chǎn)生不希望的反饋,因為揚聲器的輸出經(jīng)空氣和外殼振動泄漏到麥克風(fēng)。當(dāng)揚聲器音量增加時,例如在嘈雜的汽車或房間內(nèi),該反饋問題變得更加嚴重。
回波消除電路是已知的,可將其連接到蜂窩電話或其他裝置的麥克風(fēng)路徑上,從而消除揚聲器發(fā)出的一部分反饋能量。不幸的是,目前的回波消除電路僅能消除大約35dB,而來自揚聲器的能量可能大于嵌入式麥克風(fēng)傳送的能量35dB以上,從而甚至當(dāng)包含回波消除電路時,回波和反饋依然存在。
一種解決揚聲器問題的方案是嘗試物理隔離手機中的揚聲器和麥克風(fēng)。例如,可將用于免提電話操作的揚聲器放在手機的背面部分,從而減少從揚聲器直接撞擊到麥克風(fēng)上的聲音。然而,此種布局使得不面對揚聲器的用戶難以聽到聲音,而且某些揚聲器能量仍然通過蜂窩或其他方式泄漏到麥克風(fēng)。
另一種對反饋的解決方案是防止揚聲器路徑和麥克風(fēng)路徑同時操作。該單向操作使得直接反饋變得不可能,但導(dǎo)致了單向通信,這要求兩端用戶發(fā)信號通知他們講話的結(jié)束,并等待響應(yīng)。希望更有效、更自然的免提電話操作。還存在其他問題。
發(fā)明內(nèi)容
克服現(xiàn)有技術(shù)中這些和其他問題的本發(fā)明涉及用于通信裝置內(nèi)免提電話操作的一種系統(tǒng)和方法,其中嵌入式智能同時管理裝置的揚聲器路徑和麥克風(fēng)路徑,以降低不希望的回波和反饋,同時仍然保持通話話音的感官質(zhì)量。在本發(fā)明的一個實施例中,諸如蜂窩電話手機或其他裝置的通信裝置會結(jié)合雙語音活動檢測電路,用于同時監(jiān)測揚聲器和麥克風(fēng)路徑內(nèi)的信號能量和其它特性,并根據(jù)動態(tài)閾值或其他自適應(yīng)或其他標(biāo)準(zhǔn)對一個或另一個路徑進行控制。在另一個實施例中,諸如由于大于平均背景噪聲而引起的過早信號失落問題通過在傳送控制到麥克風(fēng)路徑之前應(yīng)用保持揚聲器路徑開放的懸空時間(hangtime)參數(shù)來防止,直到經(jīng)過最小時間間隔。也可在本發(fā)明的實施例中采用被應(yīng)用到觸發(fā)控制從揚聲器路徑改變到麥克風(fēng)路徑或相反情況的標(biāo)準(zhǔn),包括取消較低閾值,當(dāng)?shù)陀谠撻撝禃r,自動斷開揚聲器路徑并將控制傳遞到麥克風(fēng)路徑。
將參考附隨
本發(fā)明,其中相同元件用相同參考標(biāo)記表示,其中圖1顯示根據(jù)本發(fā)明實施例的包括免提電話操作的雙向通信平臺。
圖2(A)-2(C)顯示根據(jù)本發(fā)明實施例的關(guān)于輸入和輸出話音的處理。
圖3顯示根據(jù)本發(fā)明實施例的揚聲器控制操作。
圖4(A)和4(B)顯示根據(jù)本發(fā)明實施例的關(guān)于輸入和輸出話音的處理。
圖5顯示根據(jù)本發(fā)明實施例的輸入和輸出話音的包絡(luò)。
圖6顯示根據(jù)本發(fā)明實施例的動態(tài)輸入插入閾值及其他話音處理。
圖7顯示根據(jù)本發(fā)明實施例的使用動態(tài)插入閾值和其他話音處理的輸入插入例子。
圖8顯示根據(jù)本發(fā)明實施例的免提電話控制操作。
圖9(A)和9(B)顯示根據(jù)本發(fā)明實施例的關(guān)于輸入和輸出話音的處理。
圖10(A)和10(B)顯示根據(jù)本發(fā)明實施例的包括插入懸空時間的輸出和輸入路徑控制。
圖11顯示根據(jù)本發(fā)明實施例的免提電話控制操作。
圖12(A)和12(B)顯示根據(jù)本發(fā)明實施例的關(guān)于輸入和輸出話音的處理。
圖13顯示根據(jù)噪聲條件下通常的遠端處理的揚聲器路徑激活。
圖14(A)和14(B)顯示根據(jù)本發(fā)明實施例的噪聲條件下的揚聲器路徑激活。
具體實施例方式
圖1顯示具有根據(jù)本發(fā)明實施例的免提電話性能的通信裝置的結(jié)構(gòu)。圖1所示裝置可以包括例如蜂窩電話手機,允許語音的有線或無線裝置(諸如聯(lián)網(wǎng)的基于IP的語音(VoIP)或ISDN電話裝置),雙向無線通信裝置,調(diào)制解調(diào)器或混合電話/調(diào)制解調(diào)器裝置,經(jīng)免提電話基站連接到公共交換電話網(wǎng)絡(luò)(PSTN)的有線或無線電話,或其他通信裝置或平臺。通常,根據(jù)顯示的結(jié)構(gòu),該通信裝置包括麥克風(fēng)路徑128以及揚聲器路徑130,麥克風(fēng)路徑128包括麥克風(fēng)102或其他的聲音或其他輸入轉(zhuǎn)換器(transducer),揚聲器路徑130包括揚聲器120或其他的聲音或其他輸出轉(zhuǎn)換器。在實施例中,通常相同時刻在麥克風(fēng)路徑128和揚聲器路徑130中僅有一個是激活的,從而避免兩個轉(zhuǎn)換器之間的反饋。在其他實施例中可能有其他模式。有時分別將麥克風(fēng)路徑128稱為輸入或近端信道,將揚聲器路徑130稱為輸出或遠端信道。
麥克風(fēng)路徑128內(nèi)的麥克風(fēng)102可連接到麥克風(fēng)增益控制104,用于適當(dāng)?shù)脑黾踊蛩p麥克風(fēng)102的輸出。麥克風(fēng)增益控制104的輸出被傳送到回波消除器106,從而去除從揚聲器120泄漏到麥克風(fēng)102的任何反饋的一部分,包括回波?;夭ㄏ?06例如可用硬件、軟件、或二者的固件組合實施?;夭ㄏ?06例如可用商業(yè)可購得的部分實施,例如由Oki半導(dǎo)體或其他公司制造的專用集成電路,或使用軟件模塊,諸如摩托羅拉公司制造的DSP56000系列數(shù)字信號處理器、德州儀器公司或其他公司制造的數(shù)字信號處理器的回波消除器模塊。在實施例中,回波消除器106可結(jié)合或采用已知的回波消除算法,例如和國際電信聯(lián)盟(ITU)標(biāo)準(zhǔn)G.165相關(guān)或結(jié)合其內(nèi)的算法,或其他消除算法或技術(shù)。在實施例中,回波消除器106可降低回波或其他反饋大約35dB或更多,但通常不能完全消除麥克風(fēng)102產(chǎn)生的信號內(nèi)存在的全部反饋。
回波消除器106的輸出被傳送到語音編碼器108,語音編碼器108為了無線或其他傳輸目的壓縮或處理語音輸入。語音編碼器108可用已知的語音壓縮或其他算法實施,例如和ITU標(biāo)準(zhǔn)(諸如ITU G.711、G.723、G.726、G.729)相關(guān)或結(jié)合其內(nèi)的算法或其他協(xié)議。這些標(biāo)準(zhǔn)或協(xié)議可結(jié)合或采用例如低延遲碼激勵線性預(yù)測(LD-CELP)語音編碼算法,該算法可在8KHz編碼2.5毫秒幀數(shù)字化電話帶寬語音或音頻信號,或采用其他的數(shù)字化或其他技術(shù)??梢允褂闷渌Z音壓縮/解壓縮(編解碼)算法、軟件或標(biāo)準(zhǔn)。語音編碼器108可實施為硬件、軟件或二者組合的固件,包括使用可編程數(shù)字信號處理器或其他組件。
在語音編碼器108編碼用戶的語音輸入之后,編碼的語音被傳送到調(diào)制解調(diào)器發(fā)射模塊110。調(diào)制解調(diào)器發(fā)射模塊110可準(zhǔn)備編碼后的信號用于經(jīng)天線或其他的空中或其他接口的無線或其他傳輸,例如產(chǎn)生用于語音或其他通信的800/900MHz、1.9GHz或其他蜂窩、PCS或其他頻譜的無線傳輸。
在接收側(cè),調(diào)制解調(diào)器接收機模塊126可連接到蜂窩天線或其他射頻(RF)源或其他的要捕獲無線或其他能量的源,下變換和/或解調(diào)無線載波信號。調(diào)制解調(diào)器接收模塊126可傳送解調(diào)后的接收信號到語音解碼器124。語音解碼器124通常執(zhí)行和語音編碼器108相反的操作,例如解壓縮來自遠程用戶或另一個蜂窩手機或其他裝置的遠端語音。語音解碼器124的輸出被傳送到揚聲器增益控制122,該控制提供用于驅(qū)動揚聲器120的解碼語音的放大或衰減,揚聲器120例如是在蜂窩手機或其他轉(zhuǎn)換器內(nèi)的耳機揚聲器。語音解碼器124的輸出還被傳送到回波消除器106以執(zhí)行回波檢測和消除處理。
在諸如圖1所示的本發(fā)明的實施例中,麥克風(fēng)路徑128和揚聲器路徑130可能各自都連接到進一步的電路以監(jiān)測和管理通信裝置的免提電話操作。更具體的,回波消除器106的輸出還被傳送到輸入語音活動檢測器(VAD)114。語音解碼器124的輸出也類似的被傳送到輸出語音活動檢測器(VAD)118。輸入VAD 114和輸出VAD 118的每一個都可用硬件、軟件或二者組合的固件實施。輸入VAD 114和輸出VAD 118例如都可用微處理器、數(shù)字信號處理器或其他處理器實施。VAD 114和VAD 118都可產(chǎn)生語音能量包絡(luò)、語音采樣、語音呈現(xiàn)(voice-present)或相對于背景或其它類型噪聲用于識別語音信息存在的其它類型的語音檢測信號或功能。輸入VAD 114以及輸出VAD118例如可編程用于執(zhí)行語音檢測算法,例如涉及或結(jié)合在ITU標(biāo)準(zhǔn)或其他之內(nèi)的,例如根據(jù)或關(guān)于ITU G.711、G.723、G.726、G.729或其他標(biāo)準(zhǔn)。輸入VAD 114和輸出VAD 118可相互連接,從而允許之間的直接通信。
輸入VAD 114和輸出VAD 118中每一個的輸出可被傳送到雙工仲裁器116。雙工仲裁器116可用諸如微處理器或數(shù)字信號處理器的硬件、軟件或二者組合的固件實施,以執(zhí)行監(jiān)控任務(wù),仲裁和管理麥克風(fēng)路徑128、揚聲器路徑130及其他資源的激活,從而增強免提電話和其他操作。雙工仲裁器116例如可確定何時輸入(近端,或通信裝置的手持用戶)語音能量是顯著的,而同時輸出(遠端或遠程用戶)語音能量可以忽略,從而雙工仲裁器116可激活麥克風(fēng)路徑128來捕獲本地語音,同時禁止或靜音揚聲器路徑130,因為將遠端用戶解釋為未講話或傳送。
相反,在輸入VAD 114檢測的輸入語音能量可以忽略而輸出VAD118檢測的輸出語音能量是顯著的情況中,雙工仲裁器116可激活揚聲器路徑130,同時禁止麥克風(fēng)路徑128,從而可通過揚聲器120聽到遠端用戶的語音。
另一方面,在輸入VAD 114和輸出VAD 118在各自路徑上都檢測到顯著的語音能量的時間間隔期間,雙工仲裁器116可應(yīng)用選擇標(biāo)準(zhǔn)以決定激活哪條路徑。如圖2(A)-2(C)所示,間隔可能在輸入VAD 114(圖2(B))和輸出VAD 118(圖2(A))都檢測到語音能量大于各自的檢測閾值時出現(xiàn),并給雙工仲裁器116提供語音檢測信號,顯示為門功能。
如圖2(C)所示,當(dāng)兩個VAD信號都是活動的時,雙工仲裁器116可選擇激活一條或另一條路徑。如附圖所示,在實施例中,當(dāng)在麥克風(fēng)102識別出語音時,雙工仲裁器116將控制切換到麥克風(fēng)路徑128(輸入信道),甚至當(dāng)推測的(presumed)語音信號提供的能量的絕對值小于輸出VAD 118的輸出時。可以應(yīng)用該判定標(biāo)準(zhǔn),因為麥克風(fēng)路徑128內(nèi)的語音內(nèi)容的能量通常遠遠小于揚聲器路徑130的,甚至當(dāng)用戶用正常話音在麥克風(fēng)102附近講話的時候,該麥克風(fēng)的靈敏度僅在將蜂窩手機或其他裝置放在遠離用戶的地方才降低。
此類型操作允許通話中近端和遠端用戶語音之間的無縫轉(zhuǎn)換,并防止諸如信道封鎖的人為因素。在實施例中,如圖所示,雙工仲裁器116還可以和適度噪聲產(chǎn)生和替換模塊112通信,該模塊也可用硬件、軟件或二者組合的固件實施。適度噪聲產(chǎn)生和替換模塊112還可以和麥克風(fēng)增益控制104以及揚聲器增益控制122通信,以在路徑轉(zhuǎn)換、靜點(諸如麥克風(fēng)路徑128和揚聲器路徑130都靜音)期間或其他時刻輸出白噪聲或其他相對令人愉快或無害的聲音。在其他實施例中或在其他條件下,雙工仲裁器116會根據(jù)用于判定處理的不同固定或動態(tài)標(biāo)準(zhǔn)控制麥克風(fēng)路徑128或揚聲器路徑130。
例如在圖3所示實施例中,用于對麥克風(fēng)路徑128進行控制的閾值可根據(jù)語音編碼器產(chǎn)生的能量及其他參數(shù)動態(tài)計算。在步驟302,處理開始。在步驟304,將來自麥克風(fēng)102的麥克風(fēng)采樣和來自揚聲器120的揚聲器采樣傳送到回波消除器106。在步驟306,語音編碼器108處理回波消除器106的輸出。在步驟308,稱為“ib_break_in_thresh”并被用于確定對麥克風(fēng)路徑128進行控制同時靜音揚聲器路徑130的插入閾值根據(jù)當(dāng)前離散語音幀(n)的輸出語音(或揚聲器)能量以及語音編碼器參數(shù)動態(tài)計算。在實施例中,該計算可以是或包括以下計算算法1ib_break_in_thresh(n)=β*ob_r0(n);IF(ib_break_in_thresh(n)>ib_break_in_thresh(n-1))ib_break_in_thresh(n)=β*ob_r0(n);ELSEib_break_in_thresh(n)=α* ib_break_in_thresh(n-1)+(1-α)*β*ob_r0(n);
END其中ob_r0(n)=幀n的輸出語音能量;n=當(dāng)前語音幀;β=能量標(biāo)量;以及α=衰減率。
在步驟310,語音編碼器108的輸出還被傳送到輸入語音包絡(luò)產(chǎn)生器132,在實施例中該產(chǎn)生器可集成到VAD 114中或和輸入VAD 114相連接。輸入語音包絡(luò)產(chǎn)生器132產(chǎn)生代表語音能量的活動包絡(luò),例如麥克風(fēng)路徑128內(nèi)信號能量的活動平均值或其他表示??杉傻絍AD118中或和輸出VAD 118相連接的輸出語音包絡(luò)產(chǎn)生器134可類似的根據(jù)揚聲器路徑130內(nèi)的信號產(chǎn)生包絡(luò)輸出。
在步驟312,將得到的語音包絡(luò)和當(dāng)前輸入插入閾值(ib_break_in_thresh)比較。如果輸入語音包絡(luò)超過閾值,則處理進行到步驟314,在此雙工仲裁器116靜音揚聲器路徑130,并激活或不靜音麥克風(fēng)路徑128,從而允許捕獲近端用戶語音并傳送到遠端用戶。如果輸入語音的包絡(luò)未超過輸入插入閾值(ib_break_in_thresh),則處理進行到步驟316,在此可終止當(dāng)前幀處理,隨后處理重復(fù),繼續(xù)進行其他任務(wù)或結(jié)束。
圖4(A)和4(B)分別顯示根據(jù)圖3所示實施例產(chǎn)生的揚聲器采樣和經(jīng)回波消除的麥克風(fēng)采樣。圖5說明用于根據(jù)本實施例產(chǎn)生的輸入和輸出信號的示范性語音包絡(luò)。如圖所示,在某些時刻,輸入信號會超過輸出信號,而在另一些時刻,輸出信號會大于輸入信號。
圖6顯示在示范性輸入動態(tài)插入閾值上覆蓋輸出(揚聲器路徑130)語音能量,還顯示了用于比較的固定輸入插入閾值。如圖所示,輸入插入閾值可以是算法1參數(shù)的動態(tài)函數(shù),或是隨時間變化的至少部分跟蹤和該輸入語音競爭的輸出語音能量的閾值。因此,在輸出語音能量相對較高的時間間隔,輸入插入閾值上升到比較高的水平,迫使在麥克風(fēng)102的近端語音靈敏度更高以捕獲該信道。相反,和固定閾值方法不同,輸入插入閾值可在輸出語音能量降低的時間間隔內(nèi)衰減,從而相對較低的近端語音就能激活麥克風(fēng)路徑128。
圖7顯示根據(jù)圖3所示實施例產(chǎn)生的輸入語音包絡(luò)、輸入插入動態(tài)閾值以及輸入插入例子。如圖所示,輸入插入例子可在相對較平靜的輸出信道驅(qū)動輸入插入閾值到較低電平的時間周期內(nèi)出現(xiàn),使得麥克風(fēng)路徑128甚至用較低能量語音也能捕獲該信道。
當(dāng)編碼語音起伏多變或包含幅度上的較大擺動或其他人為因素時,此時這些輸入可能造成在麥克風(fēng)路徑128和揚聲器路徑130之間快速切換,或其他的“競爭”或其他不希望的情況。在圖8所示本發(fā)明的實施例中,雙工仲裁器116和其他協(xié)作組件會在允許從麥克風(fēng)路徑128到揚聲器路徑130的控制轉(zhuǎn)換之前插入延遲間隔或懸空時間,反之亦然。懸空時間的引入是為了防止當(dāng)近端和遠端語音一方或二者包含快速變化的幅度時的此種競爭情況的。
如圖8所示,在步驟802,處理開始。在步驟804,來自麥克風(fēng)102的近端采樣由語音編碼器108處理。在步驟806,來自遠端用戶的輸出語音由語音解碼器124處理。在步驟808,回波消除器106接收語音編碼器108和語音解碼器124的輸出以抑制回波和其他反饋因素。在步驟810,回波消除后的輸入語音和解碼輸出語音被分別傳送到輸入語音包絡(luò)產(chǎn)生器132和輸出語音包絡(luò)產(chǎn)生器134,以產(chǎn)生語音能量包絡(luò)或其他函數(shù)。
在步驟812,例如根據(jù)圖3所示實施例或其他來產(chǎn)生輸入插入閾值(ib_break_in_threshold)和輸出插入閾值(ob_break_in_threshold)。在步驟814,遞減輸入懸空時間(ib_hangtime)和輸出懸空時間(ob_hangtime)至少之一,或如果通信裝置在諸如啟動或重置操作的初始化模式中,則設(shè)定為初始值。在步驟816,確定是否激活了揚聲器路徑130。如果沒有激活揚聲器路徑130,則處理進行到步驟818,在此確定是否激活了麥克風(fēng)路徑128。
如果沒有激活麥克風(fēng)路徑128,則處理進行到步驟822,在此激活或不靜音麥克風(fēng)路徑128,同時禁止或靜音揚聲器路徑130。在步驟822之后,控制進行到步驟840,在此當(dāng)前幀的處理結(jié)束,隨后處理重復(fù),繼續(xù)其他任務(wù)或結(jié)束。
如果在步驟818確定麥克風(fēng)路徑128是開啟(on)的,則處理進行到步驟820,在此確定輸出語音包絡(luò)(ob_env)是否大于輸出插入閾值(ob_break_in_threshold)。如果輸出語音包絡(luò)(ob_env)大于輸出插入閾值(ob_break_in_threshold),則處理進行到步驟824,在此確定輸入懸空時間(ib_hangtime)是否到期。如果輸入懸空時間(ib_hangtime)沒有到期,則處理進行到步驟822,在此再次激活或不靜音麥克風(fēng)路徑128,同時禁止或靜音揚聲器路徑130。
如果在步驟824輸入懸空時間(ib_hangtime)到期,則處理進行到步驟826,在此設(shè)定輸出懸空時間(ob_hangtime)以開始用于揚聲器路徑130的懸空時間周期。輸出懸空時間(ob_hangtime)例如可被設(shè)定為固定時間量,如4秒或根據(jù)實施例的其他值。在實施例中,可在動態(tài)基礎(chǔ)上計算或設(shè)定輸出懸空時間,例如作為已有輸入或輸出懸空時間、在輸入或輸出路徑上檢測到的語音能量以及其他變量的函數(shù)。在步驟828,禁止或靜音麥克風(fēng)路徑128,同時激活或不靜音揚聲器路徑130,此后控制進行到步驟840,在此當(dāng)前幀的處理結(jié)束,隨后處理重復(fù),繼續(xù)其他任務(wù)或結(jié)束。
如果在步驟820確定輸出語音包絡(luò)(ob_env)沒有超出輸出插入閾值(ob_break_in_threshold),則處理進行到步驟822,在此激活或不靜音麥克風(fēng)路徑128,同時禁止或靜音揚聲器路徑130。然后控制進行到步驟840,在此當(dāng)前幀的處理結(jié)束,隨后處理重復(fù),繼續(xù)其他任務(wù)或結(jié)束。
如果在步驟816確定揚聲器路徑130是開啟的,則處理進行到步驟830,在此確定輸入語音包絡(luò)(ib_env)是否超過輸入插入閾值(ib_break_in_threshold)。如果輸入語音包絡(luò)(ib_env)沒有超過輸入插入閾值(ib_break_in_threshold),則處理進行到步驟832,在此激活或不靜音揚聲器路徑130,同時禁止或靜音麥克風(fēng)路徑128。該步驟之后,控制進行到步驟840,在此當(dāng)前幀的處理結(jié)束,隨后處理重復(fù),繼續(xù)其他任務(wù)或結(jié)束。
如果在步驟830確定輸入語音包絡(luò)(ib_env)超過輸入插入閾值(ib_break_in_threshold),則處理進行到步驟834,在此確定輸出懸空時間(ob_hangtime)是否到期。如果輸出懸空時間(ob_hangtime)沒有到期,則處理進行到步驟832,在此激活或不靜音揚聲器路徑130,同時禁止或靜音麥克風(fēng)路徑128。
如果在步驟834確定輸出懸空時間(ob_hangtime)到期,則處理進行到步驟836,在此將輸入懸空時間(ib_hangtime)設(shè)定為固定時間量,例如4秒或根據(jù)實施例的其他值。在實施例中,可在動態(tài)基礎(chǔ)上計算或設(shè)定輸入懸空時間,例如作為已有輸入或輸出懸空時間、在輸入或輸出路徑上檢測到的語音能量以及其他變量的函數(shù)。然后處理進行到步驟828,在此禁止或靜音揚聲器路徑130,同時激活或不靜音麥克風(fēng)路徑128。此步驟之后控制進行到步驟840,在此當(dāng)前幀的處理結(jié)束,隨后處理重復(fù),繼續(xù)其他任務(wù)或結(jié)束。
在圖8所示本發(fā)明的實施例中,對麥克風(fēng)路徑128或揚聲器路徑130進行控制是根據(jù)一個以上標(biāo)準(zhǔn)的。這些標(biāo)準(zhǔn)包括超出語音包絡(luò)閾值而且插入懸空時間,在所述懸空時間期間當(dāng)前活動路徑可以保持控制,而不管其他路徑上的活動。輸入和輸出懸空時間在實施例中可以是固定或動態(tài)的,并可根據(jù)情況遞增或遞減。例如,在噪聲或其他參數(shù)增加的時間期間,懸空時間之一或二者都可以遞增,或在噪聲或其他參數(shù)降低的時間期間,可以遞減懸空時間之一或二者。因此實現(xiàn)了語音或其他交互的較大連貫性。
圖9(A)顯示了來自揚聲器120的語音采樣,圖9(B)顯示了來自麥克風(fēng)102的語音采樣,它們可以根據(jù)圖8所示實施例進行處理。圖10(A)顯示了得到的輸出語音包絡(luò)(ob_env)和輸出插入閾值(ob_break_in_threshold)。
圖10(A)還顯示了輸出懸空時間(ob_hangtime)間隔的應(yīng)用,在所述輸出懸空時間間隔期間,揚聲器路徑130保持控制并繼續(xù)被激活,而不管在麥克風(fēng)路徑128內(nèi)是否存在能量語音。相反,圖10(B)顯示了輸入語音包絡(luò)(ib_env)和輸入插入閾值(ib_break_in_threshold)。圖10(B)還顯示了輸入懸空時間(ib_hangtime)間隔的應(yīng)用,在所述輸入懸空時間間隔期間,麥克風(fēng)路徑128保持控制并繼續(xù)被激活,而不管在揚聲器路徑128內(nèi)是否存在能量語音。這些延遲間隔的引入會增加近端和遠端用戶在免提電話操作期間的連貫性靈敏度。
在特別嘈雜的環(huán)境中,例如在城市區(qū)域中,當(dāng)汽車窗戶打開時,在播放嘈雜的語音消息期間或在其他時刻,摩擦音或其他信號分量可能易于觸發(fā)揚聲器路徑130使之靜音,甚至當(dāng)存在還算清晰的(still-intelligible)語音時。這可能是由于當(dāng)遠端用戶輸入惡化到噪聲時輸出靜音閾值的正常交叉使得揚聲器路徑130被關(guān)閉。在圖11所示本發(fā)明實施例中,可通過去除輸出關(guān)閾值(ob_off_threshlold)并允許揚聲器路徑130占據(jù)信道直至麥克風(fēng)路徑128包含能量語音時來解決此影響,而非將揚聲器路徑130配置為在該閾值之下時自動切斷。
如圖所示,處理在步驟1102開始。在步驟1104,來自麥克風(fēng)102的近端采樣由語音編碼器108處理。在步驟1106,來自遠端用戶的輸出語音由語音解碼器124處理。在步驟1108,回波消除器106接收語音編碼器108和語音解碼器124的輸出從而抑制回波和其他反饋因素。在步驟1110,回波消除后的輸入語音和解碼后的輸出語音被分別傳送到輸入語音包絡(luò)產(chǎn)生器132和輸出語音包絡(luò)產(chǎn)生器134,以產(chǎn)生語音能量包絡(luò)或其他函數(shù)。
在步驟1112,產(chǎn)生輸入開閾值(ib_on_threshold)和輸出開閾值(ob_on_threshold),例如和圖3所示實施例類似。在步驟1114,雙工仲裁器116應(yīng)用控制邏輯根據(jù)路徑的當(dāng)前語音包絡(luò),鎖定到麥克風(fēng)路徑128或揚聲器路徑130。
在步驟1116,確定輸出包絡(luò)(ob_env)是否超過輸出開閾值(ob_on_threshold)。如果輸出包絡(luò)(ob_env)沒有超過輸出開閾值(ob_on_threshold),則處理進行到步驟1118,在此確定輸入包絡(luò)(ib_env)是否超過輸入開閾值(ib_on_threshold)。如果輸入包絡(luò)(ib_env)超過輸入開閾值(ib_on_threshold),則處理進行到步驟1120,在此確定是否揚聲器路徑130是鎖定的,即揚聲器路徑130目前控制諸如無線蜂窩或其他連接的通信信道。如果揚聲器路徑130被鎖定,則麥克風(fēng)路徑128以及揚聲器路徑130的狀態(tài)從步驟1102的處理開始就保持不變,控制進行到步驟1128,在此結(jié)束當(dāng)前幀的處理,隨后重復(fù)處理,繼續(xù)其他任務(wù)或結(jié)束。
如果在步驟1120確定揚聲器路徑130未被鎖定,則處理進行到步驟1122,在此禁止或靜音揚聲器路徑130,同時激活或不靜音麥克風(fēng)路徑128。然后處理進行到步驟1128進行重復(fù),繼續(xù)進行其他任務(wù)或結(jié)束。
如果在步驟1118確定輸入包絡(luò)(ib_env)沒有超過輸入開閾值(ib_on_threshold),則處理進行到步驟1128進行重復(fù),繼續(xù)進行其他任務(wù)或結(jié)束。
如果在步驟1116確定輸出包絡(luò)(ob_env)超過輸出開閾值(ob_on_threshold),則處理進行到步驟1124,在此確定麥克風(fēng)路徑128是否被鎖定。如果沒有鎖定麥克風(fēng)路徑128,則控制進行到步驟1126,在此激活或不靜音揚聲器路徑130,同時禁止或靜音麥克風(fēng)路徑128。然后處理進行到步驟1128進行重復(fù),繼續(xù)進行其他任務(wù)或結(jié)束。類似的,如果在步驟1124確定麥克風(fēng)路徑128是鎖定的,則從在步驟1102的處理開始麥克風(fēng)路徑128和揚聲器路徑130的狀態(tài)就保持不變,控制進行到步驟1128進行重復(fù),繼續(xù)進行其他任務(wù)或結(jié)束。
圖12(A)顯示來自揚聲器120的包含摩擦音和其他噪聲分量的采樣,圖12(B)顯示來自麥克風(fēng)102的相同時刻的采樣,二者可例如根據(jù)圖11所示實施例一同被處理。圖13顯示當(dāng)運行于不采用本發(fā)明的信號上時可能發(fā)生的免提電話控制,包括由于摩擦音和其他噪聲因素在開、關(guān)狀態(tài)之間快速切換揚聲器路徑130。
圖14(A)在另一方面顯示根據(jù)圖11所示本發(fā)明的實施例得到的免提電話的操作,其中甚至在相對嘈雜的背景周期期間揚聲器路徑130也保持信道控制,這在部分上是因為去除了輸出關(guān)閾值,從而允許揚聲器路徑130保持激活。不是不斷或定時的切換,而是揚聲器路徑保持激活直至麥克風(fēng)路徑128由于能量語音超過了輸入開閾值而適當(dāng)?shù)夭东@信道控制,如圖14(B)所示。從而得到更平滑更連貫的通話。
上述根據(jù)本發(fā)明的對用于免提電話操作的系統(tǒng)和方法的說明是示范性的,本領(lǐng)域技術(shù)人員可做出結(jié)構(gòu)和設(shè)備上的變化。如,雖然本發(fā)明被描述為包含輸入VAD 114和輸出VAD 118形式的離散語音檢測器,但在實施例中,這兩個語音活動檢測器的功能或部分功能可組合到一個部分中,或組合到一個軟件模塊中。根據(jù)本發(fā)明可以管理兩條以上的路徑。類似的,雖然本發(fā)明是關(guān)于包括回波消除器106的輸入路徑說明的,但在其他噪聲抑制器類型的實施例或省略或修改組件的應(yīng)當(dāng)注意到運行本發(fā)明的通信裝置可以是或包括蜂窩電話,但還可以包括其他通信平臺,例如有線或無線電話,雙向無線裝置,用于無線電話的基站,能啟用網(wǎng)絡(luò)的無線通信裝置,例如802.11a,802.11b,802.11g或其他短程或遠距電話或其他單元,以及其他設(shè)備。
此外,雖然本發(fā)明是關(guān)于免提電話結(jié)構(gòu)進行說明的,其中控制免提電話操作的電子智能和蜂窩電話或其他通信裝置集成在一起,但在其他實施例中,可以在連接到通信裝置的附件中嵌入或共享該智能。例如,可在可拆卸的電池、耳機裝置、桌面或其他固定或非佩戴式的免提電話單元或在其他附件或部分中嵌入或共享該智能。例如,該智能可通過連接到蜂窩電話的汽車音頻系統(tǒng)啟動免提電話操作。
在添加或增強通信裝置內(nèi)免提電話性能的可拆卸或連接式單元的例子中,嵌入在附件裝置上的智能可以通過例如RS-232的串行端口、通用串行總線(USB)或通用異步接收機/發(fā)射機(UART)連接、紅外數(shù)據(jù)(IrDA)端口、射頻鏈路、或其他串行、并行或其他數(shù)據(jù)端口或其他連接和通信裝置的電子器件通信。因此本發(fā)明的范圍僅由附隨的權(quán)利要求來限定。
權(quán)利要求
1.一種管理通信裝置內(nèi)免提電話操作的系統(tǒng),包括第一語音活動檢測器,配置用于和通信裝置的輸入路徑通信,所述第一語音活動檢測器根據(jù)所述輸入路徑內(nèi)的信號產(chǎn)生至少第一語音數(shù)據(jù);第二語音活動檢測器,配置用于和通信裝置的輸出路徑通信,所述第二語音活動檢測器根據(jù)所述輸出路徑內(nèi)的信號產(chǎn)生至少第二語音數(shù)據(jù);以及處理器,和所述第一語音活動檢測器以及第二語音活動檢測器通信,所述處理器根據(jù)所述第一語音數(shù)據(jù)和第二語音數(shù)據(jù)至少之一控制所述輸入路徑和輸出路徑至少之一。
2.根據(jù)權(quán)利要求1的系統(tǒng),其中,所述通信裝置包括蜂窩電話、允許語音的網(wǎng)絡(luò)裝置以及電話裝置至少之一。
3.根據(jù)權(quán)利要求1的系統(tǒng),其中,所述第一語音數(shù)據(jù)包括第一語音能量信號、第一語音包絡(luò)、第一語音采樣以及第一語音呈現(xiàn)信號至少之一。
4.根據(jù)權(quán)利要求1的系統(tǒng),其中,所述第二語音數(shù)據(jù)包括第二語音能量信號、第二語音包絡(luò)、第二語音采樣以及第二語音呈現(xiàn)信號至少之一。
5.根據(jù)權(quán)利要求1的系統(tǒng),其中,由處理器執(zhí)行的控制包括根據(jù)第一語音數(shù)據(jù)和第二語音數(shù)據(jù)的比較,將通信信道的控制授予所述輸入路徑和輸出路徑之一。
6.根據(jù)權(quán)利要求5的系統(tǒng),其中,所述通信信道包括無線通信信道。
7.一種管理通信裝置內(nèi)免提電話操作的系統(tǒng),包括語音活動檢測裝置,其和通信裝置的輸入路徑以及輸出路徑中的每一個通信,所述語音活動檢測裝置根據(jù)所述輸入路徑內(nèi)的信號產(chǎn)生至少第一語音數(shù)據(jù),以及根據(jù)所述輸出路徑內(nèi)的信號產(chǎn)生至少第二語音數(shù)據(jù);以及處理裝置,配置用于和所述語音活動檢測裝置通信,所述處理裝置根據(jù)所述第一語音數(shù)據(jù)和第二語音數(shù)據(jù)至少之一控制所述輸入路徑和輸出路徑至少之一。
8.一種管理通信裝置內(nèi)免提電話操作的系統(tǒng),包括第一語音活動檢測器,配置用于和通信裝置的輸入路徑通信,所述第一語音活動檢測器根據(jù)應(yīng)用于所述輸入路徑內(nèi)信號的至少第一語音閾值來產(chǎn)生至少第一語音檢測信號;第二語音活動檢測器,配置用于和通信裝置的輸出路徑通信,所述第二語音活動檢測器根據(jù)應(yīng)用于所述輸出路徑內(nèi)信號的至少第二語音閾值來產(chǎn)生至少第二語音檢測信號;以及處理器,和所述第一語音活動檢測器以及第二語音活動檢測器通信,所述處理器根據(jù)至少所述第一語音檢測信號和第二語音檢測信號的比較來控制所述輸入路徑和輸出路徑至少之一。
9.一種管理通信裝置內(nèi)免提電話操作的系統(tǒng),包括處理器,該處理器被配置用于執(zhí)行語音活動檢測代碼,接收來自通信裝置的輸入路徑和輸出路徑中每一個的輸入,該可執(zhí)行語音活動檢測代碼根據(jù)應(yīng)用于所述輸入路徑內(nèi)信號的至少第一語音閾值產(chǎn)生至少第一語音檢測信號,并根據(jù)應(yīng)用于所述輸出路徑內(nèi)信號的至少第二語音閾值產(chǎn)生至少第二語音檢測信號,以及仲裁代碼,該仲裁代碼根據(jù)所述第一語音檢測信號和第二語音檢測信號至少之一來控制所述輸入路徑和輸出路徑至少之一。
10.一種管理通信裝置內(nèi)免提電話操作的系統(tǒng),包括第一語音活動檢測器,配置用于和通信裝置的輸入路徑通信,所述第一語音活動檢測器根據(jù)所述輸入路徑內(nèi)的信號產(chǎn)生至少第一語音檢測信號;第二語音活動檢測器,配置用于和通信裝置的輸出路徑通信,所述第二語音活動檢測器根據(jù)所述輸出路徑內(nèi)的信號產(chǎn)生至少第二語音檢測信號;以及處理器,其和所述第一語音活動檢測器以及第二語音活動檢測器通信,所述處理器根據(jù)至少所述第一語音檢測信號和第二語音檢測信號的比較以及輸入懸空時間和輸出懸空時間至少之一,控制免提電話的操作,以將通信信道的控制授予所述輸入路徑和輸出路徑至少之一。
全文摘要
本發(fā)明提供一種具有管理免提電話操作從而甚至在使用單向傳輸模式時也更接近正常通話的智能的蜂窩電話或其他通信裝置??梢允褂秒p語音活動檢測器(114,118)來連續(xù)監(jiān)測麥克風(fēng)路徑(128)和揚聲器路徑(130),以評估各個信道的能量和其他特性,并根據(jù)動態(tài)標(biāo)準(zhǔn)在一個和另一個之間切換。在噪聲環(huán)境中,在允許切換之前應(yīng)用懸空時間以避免過早信號失落??梢哉{(diào)整其他用于觸發(fā)信道捕獲的標(biāo)準(zhǔn),從而去除較低閾值,其中在該閾值之下自動切斷揚聲器路徑(130)。
文檔編號H04M9/08GK1692618SQ03822820
公開日2005年11月2日 申請日期2003年7月24日 優(yōu)先權(quán)日2002年7月26日
發(fā)明者普拉提克·德賽, 阿里·拜布迪安, 黃展鵬 申請人:摩托羅拉公司