個人化帶寬擴展的制作方法
【專利說明】
【背景技術】
[0001]信號的帶寬擴展是眾所周知且可經(jīng)界定為使其中含有有用內(nèi)容或效果的信號的頻率范圍(帶寬)擴大的過程。近年來,帶寬擴展已經(jīng)用于經(jīng)譯碼語音和音頻的高頻增強中,例如電話系統(tǒng)中的語音。因此,舉例來說,窄帶電話語音的質(zhì)量可通過帶寬擴展而改善。
[0002]一種類型的已知帶寬擴展稱為盲帶寬擴展。盲帶寬擴展技術用以再造窄帶音頻信號的高頻帶。這些方法增加如電話或無線電通信系統(tǒng)中經(jīng)由窄頻帶發(fā)射的信號的感知質(zhì)量。
[0003]然而,現(xiàn)有的盲帶寬擴展技術使用一般化模型用于執(zhí)行帶寬擴展。此些一般化模型通常在用于任意說話者的帶寬擴展中使用,其可導致不準確或不良的用戶體驗。
【發(fā)明內(nèi)容】
[0004]本系統(tǒng)和方法是針對個人化(即,說話者可導出)帶寬擴展,其中用于帶寬擴展的模型對每一特定用戶個人化(例如,定制)。
[0005]在一實施方案中,執(zhí)行訓練階段以產(chǎn)生對用戶個人化的帶寬擴展模型。所述模型可隨后在涉及所述用戶的電話呼叫期間在帶寬擴展階段中使用。使用所述個人化帶寬擴展模型的所述帶寬擴展階段將當較高頻帶(例如,寬帶)不可用且所述呼叫正在較低頻帶(例如,窄帶)上進行時激活。
[0006]在一實施方案中,在其中可識別用戶(例如,通過呼叫者ID)的寬帶呼叫期間在遠端臺(例如,移動電話)處訓練模型(對用戶個人化,以使得其是基于說話者可導出信息)。
[0007]在另一實施方案中,在呼叫期間在近端臺處(例如,在用戶的移動電話處)訓練模型(應注意,不管網(wǎng)絡條件如何近端都可俘獲寬帶語音)。
[0008]在另一實施方案中,以用戶的話音或以由移動臺的所有者選擇的目標話音在移動臺處(不在電話呼叫期間)離線訓練模型。離線訓練涉及當電話不在用于電話呼叫時記錄用戶的話音或目標話音。
[0009]提供此
【發(fā)明內(nèi)容】
而以簡化形式引入下文在【具體實施方式】中進一步描述的概念選擇。本
【發(fā)明內(nèi)容】
并不希望識別所主張的標的物的關鍵特征或基本特征,也并非意圖用于限制所主張的標的物的范圍。
【附圖說明】
[0010]當結(jié)合附圖閱讀時,更好地理解前述
【發(fā)明內(nèi)容】
以及說明性實施例的以下詳細描述。出于說明實施例的目的,圖式中展示實施例的實例構(gòu)造;然而,所述實施例不限于所揭示的特定方法和工具。在圖式中:
[0011]圖1是其中可產(chǎn)生且使用個人化帶寬擴展的示范性系統(tǒng)的框圖;
[0012]圖2是用于個人化帶寬擴展的訓練的方法的實施方案的操作流程;
[0013]圖3是執(zhí)行個人化帶寬擴展的方法的實施方案的操作流程;
[0014]圖4是用于個人化帶寬擴展的訓練的方法的另一實施方案的操作流程;
[0015]圖5是用于個人化帶寬擴展的訓練的方法的另一實施方案的操作流程;
[0016]圖6是用于個人化帶寬擴展的訓練的方法的另一實施方案的操作流程;
[0017]圖7是執(zhí)行用于基于譜包絡/激勵的個人化帶寬擴展的訓練的方法的實施方案的操作流程;
[0018]圖8是可與基于譜包絡/激勵的個人化帶寬擴展一起使用的實例映射表的圖;
[0019]圖9是可與基于譜包絡/激勵的個人化帶寬擴展一起使用的另一實例映射表的圖;
[0020]圖10是執(zhí)行基于譜包絡/激勵的個人化帶寬擴展的方法的實施方案的操作流程;
[0021]圖11是實例移動臺的圖;以及
[0022]圖12展示示范性計算環(huán)境。
【具體實施方式】
[0023]以下參考且并入有圖式的詳細說明描述且圖解說明一或多個具體實施例。并非為了限制而是僅為了舉例說明和教示而提供的這些實施例是以充足的細節(jié)展示和描述,以使所屬領域的技術人員能夠?qū)嵺`所主張的內(nèi)容。因此,出于簡潔起見,所述描述可能省略所屬領域的技術人員已知的某些信息。
[0024]圖1是其中可(基于說話者可導出信息)產(chǎn)生且用以從所接收窄帶(NB)語音信號形成寬帶(WB)語音信號的個人化帶寬擴展的示范性系統(tǒng)100的框圖。系統(tǒng)100可用以產(chǎn)生具有比對應所接收模擬信號的頻率范圍大的頻率范圍的模擬信號。因此,信號是否為寬帶信號或窄帶信號取決于其與另一者的關系。雖然本文所描述的實例和實施方案指代從NB語音信號產(chǎn)生WB語音信號,但本系統(tǒng)和方法并不限于此,因為本文所揭示的系統(tǒng)和方法可用于從語音信號的任何其它集合產(chǎn)生語音信號的任何集合,例如從超寬帶(SWB)到WB或SffB 到 NB。
[0025]如圖所示,系統(tǒng)100包含可由發(fā)射方使用的近端臺110,以及可由接收方使用的遠端臺150。近端臺110和遠端臺150可各自為用于通信的裝置,例如移動臺或計算裝置。相對于圖11描述實例移動臺800,且相對于圖12描述實例計算裝置900。
[0026]近端臺110和遠端臺150可經(jīng)由一或多個發(fā)射通道145通信。所述通信可包括從近端臺I1到遠端臺150發(fā)射對應于說話者的語音發(fā)聲105 (話音數(shù)據(jù))的窄帶版本的窄帶語音信號。遠端臺150可使用對說話者訓練(即,基于說話者可導出信息)以產(chǎn)生且輸出說話者的語音發(fā)聲105的對應寬帶版本的模型163。如在此進一步所描述,取決于實施方案,模型123、163可經(jīng)在近端臺110或遠端臺150訓練、產(chǎn)生且存儲。
[0027]因此,語音發(fā)聲105和經(jīng)訓練模型123、163或數(shù)據(jù)(取決于實施方案)可經(jīng)由一或多個發(fā)射通道145發(fā)射。更確切地說,發(fā)射器125根據(jù)(例如)一或多個電信發(fā)射標準將說話者的語音發(fā)聲105 (話音數(shù)據(jù))轉(zhuǎn)換為原始語音發(fā)聲105的窄帶版本以用于發(fā)射。原始語音發(fā)聲的窄帶版本和經(jīng)訓練的模型或數(shù)據(jù)的發(fā)射可大體上以同時方式發(fā)生或(例如)可在發(fā)射過程期間在單獨的時間發(fā)生。適合于在此實例中以及在下文闡述的實例中使用的發(fā)射信道包含電話網(wǎng)信道、無線蜂窩式網(wǎng)絡信道、無線對講機系統(tǒng)、有線網(wǎng)絡或類似物。在此些發(fā)射系統(tǒng)中使用的窄帶語音信號可限于300HZ-3.4kHz的帶寬,其對應于用以使用全球移動通信系統(tǒng)(GSM)網(wǎng)絡發(fā)射語音信號的帶寬。
[0028]取決于實施方案,近端臺110可包括訓練模塊115、可存儲一或多個經(jīng)訓練模型123的存儲裝置120 (例如,存儲器)、發(fā)射器125、特征提取模塊130以及語音合成器135。類似地但不相同地,取決于實施方案,遠端臺150可包括訓練模塊155、可存儲一或多個經(jīng)訓練模型163的存儲裝置160 (例如,存儲器)、接收器165、特征提取模塊170以及語音合成器175。
[0029]在一些實施方案中,可不需要或使用近端臺110處的語音合成器135。舉例來說,在使用僅從近端臺110中的WB輸入的特征域比較機制的實施方案中,可不產(chǎn)生真實語音且因此可不需要或使用語音合成器135。在此情況下(其使用特征域相似性比較來計算每一現(xiàn)有條目與輸入之間的相似性),將模型和特征(例如NB特征)發(fā)送到遠端臺150以使得WB語音可在遠端臺150處合成。然而,在使用“按合成分析”機制以通過比較實際WB輸入與合成WB輸入而學習模型的實施方案中,可使用語音合成器135。此類型的實施方案使用合成語音信號域相似性比較來計算每一現(xiàn)有條目與輸入之間的相似性。
[0030]在近端臺110處從近端臺110的用戶接收語音發(fā)聲105。語音發(fā)聲105用以提供個人化帶寬擴展,其中用于帶寬擴展的模型是對每一特定用戶個人化(例如,定制)。
[0031]在一實施方案中,執(zhí)行訓練階段以產(chǎn)生對用戶個人化的帶寬擴展模型(在本文中也被稱作“模型”)。可使用訓練模塊115在近端臺110處或使用訓練模塊155在遠端臺150處執(zhí)行訓練階段。由訓練模塊115產(chǎn)生的個人化帶寬擴展模型123可存儲在存儲裝置120中,且由訓練模塊155產(chǎn)生的模型163可存儲在存儲裝置160中。存儲裝置120、160可存儲一個以上模型(例如,對不同用戶個人化)且可呈例如數(shù)據(jù)庫的形式。
[0032]取決于實施方案,近端臺110和/或遠端臺150可包括特征提取模塊(例如,分別為特征提取模塊130、170)。特征提取模塊從用戶的語音提取寬帶特征,且這些寬帶特征用于產(chǎn)生訓練模型。
[0033]經(jīng)訓練模型123、163可存儲在用戶的電話(例如,近端臺110)中,或發(fā)送到其它用戶的電話(例如,遠端臺150)。基于寬帶訓練數(shù)據(jù),可隨后在涉及用戶的窄帶呼叫期間使用模型123、163。使模型在電話呼叫的再生側(cè)(S卩,在遠端臺150處)可用。
[0034]因此,例如模型123或模型163的模型可隨后在涉及與所述模型相關聯(lián)的用戶的電話呼叫期間在帶寬擴展階段中使用。電話呼叫可經(jīng)由一或多個發(fā)射信道145在近端臺110與遠端臺150之間發(fā)生。確切地說,近端臺110的發(fā)射器125可經(jīng)由發(fā)射信道145將其已接收的語音發(fā)射到遠端臺的接收器165。使用個人化帶寬擴展模型的帶寬擴展階段將在較高頻帶(例如,寬帶)不可用且