用于音頻數(shù)據(jù)處理的方法、設(shè)備和系統(tǒng)的制作方法
【專利摘要】對從說話的人接收到的音頻數(shù)據(jù)進行濾波的方法和設(shè)備包括用于該說話者的特定濾波器??墒占f話者的語音的音頻特性,并且可形成特定濾波器以降低噪聲同時還增強語音質(zhì)量。例如,如果說話者的語音不包含特定頻率,則濾波器可消除處于此頻率的噪聲以使噪聲消除變得容易并減少不需要的處理用于清理的聲譜。另外,可從收集的音頻特性中識別說話者的語音的強度頻率并且能以較細粒度對那些頻譜進行濾波以提供增強由通信設(shè)備傳輸或輸出的說話者的語音數(shù)據(jù)的語音質(zhì)量的說話者特定濾波器。還可基于用戶的預(yù)定義聽力頻譜來輸出音頻數(shù)據(jù)。
【專利說明】用于音頻數(shù)據(jù)處理的方法、設(shè)備和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信系統(tǒng),諸如利用蜂窩電話、移動計算機設(shè)備、平板計算機、膝上型 計算機或其他終端設(shè)備的通信系統(tǒng)。更特別地,本發(fā)明涉及被配置成編輯接收到的音頻數(shù) 據(jù)以改善為了記錄或傳輸而接收的語音數(shù)據(jù)的語音質(zhì)量的系統(tǒng)、方法和設(shè)備。
【背景技術(shù)】
[0002] 電信端點常常配備有降噪聲設(shè)備。此類設(shè)備通常被配置成對由設(shè)備接收到的語音 數(shù)據(jù)進行濾波(filter)以在該數(shù)據(jù)被輸出或作為輸出音頻數(shù)據(jù)被傳輸時傳送更好的語音內(nèi) 容。然而,在此類降噪聲機構(gòu)中使用的濾波器通常是被設(shè)計成以一般方式來處理音頻的通 用濾波器。結(jié)果,降噪聲可未能提供對于輸出音頻數(shù)據(jù)的語音質(zhì)量或其他屬性方面的很大 改善。
[0003] 我們已經(jīng)確定需要新的方法和設(shè)備來改善基于接收到的音頻數(shù)據(jù)而輸出的音頻 輸出的音頻特性。在我們的方法和設(shè)備的一些實施例中,輸出的音頻可被配置成利用基于 用戶進行說話和進行傾聽的說話和聽力簡檔(profile)的聽力和說話參數(shù)。
【發(fā)明內(nèi)容】
[0004] 提供了傳輸語音數(shù)據(jù)的方法。所述方法的實施例可包括步驟:通信設(shè)備提示用戶 說話以獲得用戶的語音樣本以識別用戶語音的時域、頻域、發(fā)聲屬音(vocal dominants)和 音域(vocal range)中的至少一個,通信設(shè)備基于用戶的語音樣本來確定對于用戶語音的 語音度量(metrics),通信設(shè)備存儲用戶語音的語音度量,通信設(shè)備從用戶接收語音數(shù)據(jù), 通信設(shè)備基于用戶語音的語音度量、時域、頻域、發(fā)聲屬音和音域中的所述至少一個來修改 接收到的語音數(shù)據(jù),并且通信設(shè)備將經(jīng)修改的語音數(shù)據(jù)傳輸給另一設(shè)備,使得經(jīng)修改的語 音數(shù)據(jù)可輸出到至少一個接收者。
[0005] 所述方法的一些實施例可包括附加步驟或修改。例如,所述方法還可包括步驟:通 信設(shè)備產(chǎn)生用于向用戶發(fā)出的音調(diào)(tone),因此用戶聽到該音調(diào),通信設(shè)備接收識別音調(diào) 對于用戶而言可聽見時的音量(volume)設(shè)置的輸入,并且通信設(shè)備基于接收到的識別音調(diào) 對于用戶而言可聽見時的音量設(shè)置的輸入來確定用戶的聽力簡檔。另外,所述方法的實施 例可包括步驟:通信設(shè)備基于用戶的聽力簡檔調(diào)整由通信設(shè)備接收的音頻數(shù)據(jù)的音量而以 更大聲的音量輸出音頻數(shù)據(jù)。
[0006] 在一個實施例中,所述方法可包括步驟:通信設(shè)備將用戶的聽力簡檔傳輸給另一 通信設(shè)備且另一通信設(shè)備在將音頻數(shù)據(jù)傳輸給所述通信設(shè)備之前基于用戶的聽力簡檔來 修改該音頻數(shù)據(jù)。在一個實施例中,所述另一設(shè)備在將音頻數(shù)據(jù)傳輸給用戶之前可通過如 下方式來修改音頻數(shù)據(jù):使音頻頻譜內(nèi)用戶的聽力簡檔指示對于用戶而言不可聽見的音頻 數(shù)據(jù)的部分從音頻數(shù)據(jù)中省略以使得傳輸?shù)囊纛l數(shù)據(jù)不包含處于用戶的不可聽見的音頻 頻譜內(nèi)的音頻。在其他實施例中,可由所述另一通信設(shè)備通過如下方式來修改音頻數(shù)據(jù):增 加音頻數(shù)據(jù)的音量,使得處于傳輸?shù)囊纛l數(shù)據(jù)內(nèi)的所有傳輸?shù)恼Z音數(shù)據(jù)在用戶的可聽見的 音頻頻譜內(nèi)。
[0007] 對于某些實施例,用戶語音的語音度量包括基于用戶的語音的時域、語音的頻域、 語音的發(fā)聲屬音和語音的音域的參數(shù)。通信設(shè)備可基于語音度量、時域、頻域、發(fā)聲屬音中 的至少一個來修改語音數(shù)據(jù)。用戶語音的音域能包括通信設(shè)備去除接收到的語音數(shù)據(jù)中的 在用戶語音的頻域之外的頻率范圍內(nèi)的部分。通信設(shè)備基于用戶語音的語音度量、時域、頻 域、發(fā)聲屬音和音域中的至少一個來修改語音數(shù)據(jù)還可包括通信設(shè)備將用戶的語音的基于 用戶語音的語音度量、時域、頻域、發(fā)聲屬音和音域中的至少一個的參數(shù)應(yīng)用于接收到的語 音數(shù)據(jù)的噪聲消除處理。
[0008] 通信設(shè)備可以是許多類型的設(shè)備中的任何一個。例如,通信設(shè)備可以是服務(wù)器、工 作站、桌面型計算機、平板計算機、移動蜂窩電話、因特網(wǎng)設(shè)備、膝上型計算機、智能電話、個 人數(shù)字助理、移動計算機設(shè)備或通信終端。在一些實施例中,通信設(shè)備還可被配置成確定接 收到的語音數(shù)據(jù)來自用戶。
[0009] 還提供了通信系統(tǒng)。通信系統(tǒng)的一些實施例可包括被配置成利用以上論述的方法 的實施例的通信系統(tǒng),以下將對其進一步論述。
[0010] 還提供了非瞬時性計算機可讀介質(zhì)。所述非瞬時性計算機可讀介質(zhì)具有存儲在其 上的應(yīng)用,所述應(yīng)用定義了方法,在所述應(yīng)用被通信設(shè)備執(zhí)行時由通信設(shè)備執(zhí)行所述方法。 所述方法可包括一種方法的上述實施例中的任何一個,以下將對其進一步論述。例如,所述 方法的實施例可包括步驟:通信設(shè)備提示用戶說話以獲得用戶的語音樣本以識別用戶語音 的時域、頻域、發(fā)聲屬音和音域中的至少一個,通信設(shè)備基于用戶的語音樣本來確定對于用 戶語音的語音度量,通信設(shè)備存儲用戶語音的語音度量并使那些保存的語音度量與用戶相 關(guān)聯(lián),通信設(shè)備從用戶接收語音數(shù)據(jù),通信設(shè)備基于用戶語音的時域、頻域、發(fā)聲屬音和音 域中的至少一個來修改接收到的語音數(shù)據(jù),并且通信設(shè)備將經(jīng)修改的語音數(shù)據(jù)傳輸給另一 設(shè)備。
[0011] 由計算機可讀介質(zhì)的應(yīng)用定義的方法的一些實施例還可包括步驟:通信設(shè)備產(chǎn)生 用于向用戶發(fā)出的音調(diào),因此用戶聽到該音調(diào),通信設(shè)備接收識別音調(diào)對于用戶而言可聽 見時的音量設(shè)置的輸入,并且通信設(shè)備基于接收到的識別音調(diào)對于用戶而言可聽見時的音 量設(shè)置的輸入而確定用戶的聽力簡檔。通信設(shè)備還可基于用戶的聽力簡檔調(diào)整由通信設(shè)備 接收到的音頻數(shù)據(jù)的音量而以更大聲的音量輸出音頻數(shù)據(jù)。通信設(shè)備可將用戶的聽力簡檔 傳輸給另一通信設(shè)備且另一通信設(shè)備可在將音頻數(shù)據(jù)傳輸給通信設(shè)備之前基于用戶的聽 力簡檔來修改該音頻數(shù)據(jù)。在一個實施例中,所述另一設(shè)備在將音頻數(shù)據(jù)傳輸給用戶之前 可通過如下方式來修改音頻數(shù)據(jù):使音頻頻譜內(nèi)用戶的聽力簡檔指示對于用戶而言不可聽 見的音頻數(shù)據(jù)的部分從音頻數(shù)據(jù)中省略以使得傳輸?shù)囊纛l數(shù)據(jù)不包含處于用戶的不可聽 見的音頻頻譜內(nèi)的音頻。在其他實施例中,可由所述另一通信設(shè)備通過如下方式來修改音 頻數(shù)據(jù):增加音頻數(shù)據(jù)的音量,使得處于傳輸?shù)囊纛l數(shù)據(jù)內(nèi)的所有傳輸?shù)恼Z音數(shù)據(jù)在用戶 的可聽見的音頻頻譜內(nèi)。
[0012] 在由應(yīng)用定義的方法的某些實施例中,通信設(shè)備基于用戶語音的時域、頻域、發(fā)聲 屬音和音域中的至少一個來修改語音數(shù)據(jù)能包括許多步驟。例如,此類修改可包括通信設(shè) 備去除接收到的語音數(shù)據(jù)中的在用戶語音的頻域之外的頻率范圍內(nèi)的部分,并且通信設(shè)備 將用戶的語音的基于用戶語音的時域、頻域、發(fā)聲屬音和音域中的至少一個的參數(shù)應(yīng)用于 接收到的語音數(shù)據(jù)的噪聲消除處理。
[0013] 隨著本發(fā)明的某些目前優(yōu)選實施例和實踐該優(yōu)選實施例的某些目前優(yōu)選方法的 以下描述的進行,本發(fā)明的其他細節(jié)、目的以及優(yōu)點將變得顯而易見。
【專利附圖】
【附圖說明】
[0014] 在附圖中示出用于提供通多個信設(shè)備之間的通信的目前優(yōu)選設(shè)備、系統(tǒng)和裝置, 并且其中還示出實踐它們的某些目前優(yōu)選方法。應(yīng)理解的是,在圖中所使用的相似附圖標 記可標識相似部件。
[0015] 圖1是通信設(shè)備的示例性實施例的框圖,所述通信設(shè)備可例如是服務(wù)器、計算機 設(shè)備、工作站、平板計算機、膝上型計算機、電話設(shè)備、因特網(wǎng)設(shè)備、個人數(shù)字助理、智能電 話、蜂窩電話、電話或其他類型的通信終端。應(yīng)理解的是,在通信設(shè)備的實施例內(nèi)可包括不 止一個麥克風和不止一個揚聲器(例如,通信設(shè)備的一些實施例可包括一個耳用揚聲器和 擴音器,并且可包括兩個麥克風,一個用于周圍音頻檢測且一個用于周圍噪聲消除)。
[0016] 圖2是用于傳輸語音數(shù)據(jù)或音頻數(shù)據(jù)的示例性方法的流程圖。
[0017] 圖3是用于輸出語音數(shù)據(jù)或音頻數(shù)據(jù)的示例性方法的流程圖。
[0018] 圖4是通信系統(tǒng)的示例性實施例的框圖。
【具體實施方式】
[0019] 參考圖1-4,通信設(shè)備可以是諸如服務(wù)器或工作站之類的計算機設(shè)備或終端設(shè)備, 諸如桌面型計算機、平板計算機、移動蜂窩電話、因特網(wǎng)設(shè)備、膝上型計算機、智能電話、個 人數(shù)字助理、移動計算機設(shè)備或通信終端。在系統(tǒng)的一個實施例中,網(wǎng)絡(luò)24可包括經(jīng)由通 信路徑而被通信連接的第一和第二通信終端21、22,所述通信路徑經(jīng)由計算機設(shè)備25而被 建立和保持。網(wǎng)絡(luò)24可以是廣域網(wǎng)或局域網(wǎng),比如在所述系統(tǒng)的一些實施例中是企業(yè)網(wǎng) 絡(luò)。
[0020] 圖4中所示的系統(tǒng)的第一和第二通信終端21和22每個都可以是圖1中所示的通 信設(shè)備的實施例。備選地,圖4中所示的計算機設(shè)備25可用作可以是圖1中所示的通信設(shè) 備的實施例的諸如交換機設(shè)備、媒體服務(wù)器或電話會議服務(wù)器之類的電話型通信設(shè)備或媒 體通信設(shè)備。
[0021] 通信設(shè)備可包括被通信連接到包括接收機單元3a和發(fā)射機單元3b的收發(fā)機單元 3的處理器單元1、顯示單元2、諸如麥克風6和攝像機傳感器8之類的至少一個輸入設(shè)備、 存儲器5以及揚聲器4。收發(fā)機單元3可包括用于經(jīng)由蜂窩網(wǎng)絡(luò)、無線網(wǎng)絡(luò)連接或其他網(wǎng)絡(luò) 連接進行數(shù)據(jù)傳輸和接收的接收機單元3a和發(fā)射機單元3b,或者可被配置成經(jīng)由近場通 信、符合藍牙的通信或其他類型的無線通信機制而形成無線連接,或者允許諸如經(jīng)由例如 通用串行總線連接實現(xiàn)的有線連接之類的有線連接。在一些實施例中,通信設(shè)備也可包括 附加收發(fā)機單元。
[0022] 處理器單元1可以是中央處理單元,諸如微處理器、互連微處理器或其他硬件處 理器元件。存儲器5可以是在其上存儲有至少一個應(yīng)用7的非瞬時性計算機可讀介質(zhì),應(yīng) 用7定義由通信設(shè)備執(zhí)行的方法,例如諸如圖2或3中所示的方法。存儲器5可包括硬盤 驅(qū)動器、閃盤驅(qū)動器、光盤或硬盤或能夠存儲數(shù)據(jù)達非瞬時性時間段的其他類型計算機可 讀介質(zhì)。還可將諸如語音數(shù)據(jù)庫12和聽力數(shù)據(jù)庫13之類的數(shù)據(jù)集以及可在運行應(yīng)用7時 被通信設(shè)備利用的其他數(shù)據(jù)存儲在存儲器5中。
[0023] 揚聲器4可包括發(fā)出音頻的多個揚聲器,并且麥克風6可以是記錄由用戶發(fā)出的 音頻以便接收該音頻數(shù)據(jù)的輸入設(shè)備。例如,麥克風6可包括檢測周圍噪聲的第一麥克風 和用于消除周圍噪聲的第二麥克風,并且揚聲器4可包括用于向一個人耳發(fā)出噪聲的第一 揚聲器和作為擴音器的第二揚聲器。顯示單元2可以是液晶顯示器或其他顯示設(shè)備??蓪?顯示單元2配置為輸入設(shè)備和輸出設(shè)備,比如用來直觀地輸出數(shù)據(jù)同時還允許用戶通過觸 摸顯示器的不同部分來提供輸入的觸摸屏顯示器。諸如按鈕、鍵盤、藍牙頭戴式耳機或藍牙 耳機或鼠標之類的其他類型輸入設(shè)備也可以是可連接到處理器單元1,使得用戶可利用該 輸入設(shè)備來向設(shè)備提供輸入。
[0024] 通信設(shè)備可經(jīng)由處理器單元1來運行應(yīng)用7。應(yīng)用7可定義當所述應(yīng)用運行時由 通信設(shè)備執(zhí)行的方法。此類方法的示例可從圖2和3領(lǐng)會到。例如,通信設(shè)備可運行應(yīng)用 以創(chuàng)建聽力簡檔以便存儲在聽力數(shù)據(jù)庫中以用于傳輸或輸出接收的音頻,或者可生成在語 音數(shù)據(jù)庫中使用的語音簡檔,其可用來在傳輸經(jīng)由麥克風6接收到的語音數(shù)據(jù)之前增強該 語音數(shù)據(jù)以修改該接收到的語音數(shù)據(jù)以提高清晰度、減少該接收到的語音數(shù)據(jù)內(nèi)的噪聲, 或者另外增強語音數(shù)據(jù)以使得傳輸?shù)恼Z音數(shù)據(jù)具有增強的質(zhì)量。
[0025] 例如,通信設(shè)備可運行應(yīng)用并提示用戶經(jīng)由麥克風6輸入語音輸入,使得能夠收 集用戶語音的語音數(shù)據(jù)以定義用戶語音簡檔以便保存在語音數(shù)據(jù)庫12中。可記錄用戶說 話的語音,使得能準備針對用戶定義特定濾波器的語音簡檔并將其作為用戶語音簡檔而保 存在語音數(shù)據(jù)庫12中。備選地,語音數(shù)據(jù)庫12可保存參數(shù)用于在用戶被檢測為說話者時 將該參數(shù)發(fā)送到濾波器,使得該濾波器根據(jù)語音數(shù)據(jù)庫12中針對該用戶定義的語音參數(shù) 對從該用戶記錄的任何語音數(shù)據(jù)進行濾波。
[0026] 通信設(shè)備可經(jīng)由顯示單元2向用戶發(fā)送輸出以提示用戶以不同的音量或以不同 的速度提供某些語音數(shù)據(jù)以獲得用戶的語音樣本。用戶語音的采樣可利用用戶語音的不同 發(fā)聲和頻率的采樣。例如,對用戶的提示輸出可讓用戶以不同的八度音(例如以低音或以高 音)或以不同的速度(例如緩慢地和快速地)說出某個短語,以在由用戶在滿足那些條件時 說出該短語時記錄該短語。還可經(jīng)由音頻指引用戶用他或她偏好的語言重復(fù)具有用于語音 分析的顯著音素的特定句子。隨后評定記錄的語音數(shù)據(jù)以確定用戶說出的語音可能不包含 什么頻率和什么頻率是用戶語音的強度(strength)(例如,當用戶說話時,用戶的語音最常 存在的頻率范圍)。
[0027] 在評定用戶的語音之后,通信設(shè)備可確定用戶的語音不包含特定頻率。在用戶的 語音內(nèi)不存在的頻率范圍因此可被濾波器切掉,使得當記錄用于向另一設(shè)備發(fā)送的用戶的 語音時,沒有在那些頻率內(nèi)的聲音被輸出或傳輸給另一設(shè)備,比如當通信設(shè)備經(jīng)由攝像機 傳感器8和麥克風6來記錄視頻時或者當用戶使用通信設(shè)備進行電話呼叫時可做的。不包 括用戶語音的此頻率范圍的去除能消除在用戶語音的記錄期間可存在的噪聲,并且可減少 在保存被記錄的語音數(shù)據(jù)或傳輸該語音數(shù)據(jù)之前進行如下處理的需要:執(zhí)行可針對該語音 數(shù)據(jù)執(zhí)行的降噪聲或其他語音數(shù)據(jù)清理。
[0028] 另外,可根據(jù)用戶語音的采樣來確定作為用戶語音的強范圍(例如,其中用戶的語 音幾乎始終存在的范圍)的頻率范圍??勺R別被確定為用戶語音的強度的頻率范圍內(nèi)的用 戶語音的濾波,使得可以較細粒度(finer granularity)來對此類頻譜進行濾波。
[0029] 在一個實施例中,可通過對在用戶說出他或她經(jīng)由顯示單元2被提示說出的單詞 或短語時記錄的記錄語音樣本的評定來定義用戶的語音簡檔并確定范圍(ranged)。然后可 通過通信設(shè)備分析記錄的語音樣本來評定用戶的發(fā)聲的時域、頻域以及屬音。然后可將用 戶語音的經(jīng)評定的參數(shù)保存在語音數(shù)據(jù)庫12中,用于出于增強從用戶接收到的任何語音 數(shù)據(jù)的目的而定義用戶語音的濾波,所述語音數(shù)據(jù)用于與視頻記錄相關(guān)聯(lián)地保存或經(jīng)由語 音通道、媒體傳輸、電話呼叫或其他語音數(shù)據(jù)傳輸而傳輸。應(yīng)理解的是,要傳輸?shù)恼Z音數(shù)據(jù) 的增強可與可由通信設(shè)備執(zhí)行的噪聲消除并行地發(fā)生。噪聲消除和語音增強可在經(jīng)由噪聲 消除和語音增強被修改的語音數(shù)據(jù)的分組化之前發(fā)生。然后可將分組化的經(jīng)修改的語音數(shù) 據(jù)傳輸給另一設(shè)備。
[0030] 通信設(shè)備還可提示用戶響應(yīng)于經(jīng)由至少一個揚聲器4輸出的所發(fā)出的音頻而向 通信設(shè)備提供輸入,使得可確定并在聽力數(shù)據(jù)庫13中存儲用戶的聽力簡檔。聽力數(shù)據(jù)庫13 然后可在處理接收到的音頻數(shù)據(jù)時使用,并且還可在處理要被輸出或傳輸給另一設(shè)備的語 音數(shù)據(jù)時被利用。例如,特定用戶可具有這樣的頻譜:用戶對其不那么敏感,或者當任何音 頻落在該頻譜內(nèi)時不能聽到該音頻。此類頻譜可在用戶的聽力簡檔中被識別,并且隨后用 來修改將要被輸出給該用戶或要被傳輸給與該用戶相關(guān)聯(lián)的諸如用戶的電話或蜂窩電話 之類的設(shè)備的語音數(shù)據(jù)。
[0031] 例如,通信設(shè)備可提示用戶對經(jīng)由揚聲器4以不同的響度水平發(fā)出的一系列音調(diào) 進行響應(yīng)。由用戶提供的輸入可指示在什么音量或響度水平下用戶能夠聽到不同的發(fā)出的 音調(diào),并且可提示用戶檢測經(jīng)由一個耳用揚聲器單獨地針對每個耳朵以及還有經(jīng)由擴音器 而針對兩只耳朵一起以不同響度水平發(fā)出的相同音調(diào)系列。由用戶提供的輸入然后可被通 信設(shè)備用來確定針對用戶的每只耳朵以及針對用戶的兩只耳朵的聽力閾值。然后可將用戶 的聽力簡檔與用戶鏈接并以許多方式來利用。另外,還可將形成的聽力簡檔發(fā)送到可向通 信設(shè)備發(fā)送音頻數(shù)據(jù)的其他設(shè)備或與用戶相關(guān)聯(lián)的其他設(shè)備,使得可利用用戶的聽力簡檔 來修改要被發(fā)送給用戶的語音數(shù)據(jù)以增強該數(shù)據(jù)對該用戶的清晰度。
[0032] 例如,聽力簡檔可通過處于聽力數(shù)據(jù)庫13內(nèi)而被存儲在通信設(shè)備的存儲器5中。 通信設(shè)備然后可調(diào)整接收到的語音數(shù)據(jù)的響度,使得不在用戶可聽見的頻率內(nèi)的語音數(shù)據(jù) 或其他音頻數(shù)據(jù)被修改,使得輸出的語音數(shù)據(jù)是用戶可聽見的。例如,可通過音頻路徑將聽 力簡檔應(yīng)用于實時傳輸協(xié)議("RTP")解碼器或其他音頻均衡器以提供此類調(diào)整。用戶自己 的通信設(shè)備內(nèi)的聽力簡檔可因此調(diào)整接收的數(shù)據(jù)要被發(fā)出時的音量設(shè)置,使得其改善該數(shù) 據(jù)對用戶的清晰度。
[0033] 作為另一示例,可將聽力簡檔發(fā)送到另一通信設(shè)備,使得傳輸給用戶的通信設(shè)備 的音頻數(shù)據(jù)可被要將該數(shù)據(jù)傳輸給用戶的設(shè)備修改以經(jīng)由用戶的聽力簡檔來計及用戶的 特定聽力能力。例如,接收用戶的聽力簡檔的傳輸通信設(shè)備可基于用戶的聽力簡檔來對要 被傳輸給與該用戶相關(guān)聯(lián)的通信設(shè)備的語音數(shù)據(jù)增強其降噪聲??尚薷囊獋鬏?shù)恼Z音數(shù) 據(jù),使得該語音數(shù)據(jù)在用戶的聽力簡檔的頻譜內(nèi)以改善傳輸數(shù)據(jù)對用戶的清晰度。傳輸設(shè) 備還可,或備選地,修改要傳輸給用戶的通信設(shè)備的音頻數(shù)據(jù)以避免、省略或另外廢棄在用 戶根本不具有敏感性的頻譜或在該頻譜內(nèi)接近聾的頻譜內(nèi)的音頻,使得可節(jié)省與音頻數(shù)據(jù) 的該部分的傳輸和接收相關(guān)聯(lián)的帶寬和處理能力。
[0034] 用戶的通信設(shè)備可將用戶的聽力簡檔或通信設(shè)備的聽力數(shù)據(jù)庫13發(fā)送到傳輸設(shè) 備,使得其能夠被該另一設(shè)備保存以用于音頻數(shù)據(jù)的未來調(diào)用或其他傳輸。該另一設(shè)備可 使用戶的聽力簡檔與用戶通信設(shè)備的地址(比如,該設(shè)備的電話號碼或網(wǎng)際協(xié)議地址)相關(guān) 聯(lián),使得利用該地址的任何通信可導(dǎo)致使用用戶的聽力簡檔來修改要被傳輸給該用戶的通 信設(shè)備的語音數(shù)據(jù)或其他音頻數(shù)據(jù)。傳輸設(shè)備也可保存該簡檔以用于基于設(shè)備地址的關(guān) 聯(lián)、諸如與用戶相關(guān)聯(lián)的電話號碼和利用具有該地址的設(shè)備建立的呼叫而在未來通信會話 中使用。還可使用戶的聽力簡檔與用戶被關(guān)聯(lián)到的諸如語音郵箱或電子郵件地址之類的其 他設(shè)備相關(guān)聯(lián),使得被傳輸給這些其他設(shè)備或地址的音頻數(shù)據(jù)被修改以改善音頻數(shù)據(jù)對該 信息被尋址到的用戶的清晰度。
[0035] 在通信設(shè)備的一些實施例中,用戶可在呼叫或其他通信會話期間進行輸入以促使 將消息發(fā)送給參與通信會話的另一設(shè)備。所進行的該輸入可向呼叫伙伴指示用戶不想在特 定會話期間或在任何未來呼叫或未來通信會話期間應(yīng)用與該用戶相關(guān)聯(lián)的聽力簡檔。此類 輸入可啟動消息以撤銷在進行呼叫或其他通信會話期間由另一設(shè)備對要被發(fā)送給該設(shè)備 的聽力簡檔的使用或可被傳輸??蓚溥x地在特定通信會話之后或之前發(fā)送此類消息。例如, 可在用戶創(chuàng)建新的聽力簡檔或語音簡檔時發(fā)送此類消息??蛇B同替換聽力簡檔或語音簡檔 一起發(fā)送此類消息以便由另一設(shè)備保存以在后續(xù)通信會話中使用。
[0036] 應(yīng)理解的是,修改語音數(shù)據(jù)或其他音頻數(shù)據(jù)以在該數(shù)據(jù)被輸出給特定用戶時改善 該數(shù)據(jù)對該用戶的清晰度可導(dǎo)致使音頻數(shù)據(jù)偏移(skewing),以將該數(shù)據(jù)放置在對該用戶 而言更敏感的頻譜部分。此類偏移可導(dǎo)致說話者的語音特性被改變。但是,這還可導(dǎo)致改 善通信對用戶的清晰度,使得在諸如電話呼叫或會議呼叫之類的通信會話期間實際上更多 的數(shù)據(jù)被用戶聽到并被用戶理解。
[0037] 應(yīng)領(lǐng)會到的是,第一通信終端21和第二通信終端22每個可具有用于在兩個設(shè)備 之間的電話呼叫期間使用的語音數(shù)據(jù)庫和聽力數(shù)據(jù)庫。每個通信終端可修改向該終端的麥 克風中說話的用戶的語音數(shù)據(jù),使得傳輸?shù)恼Z音數(shù)據(jù)被修改以改善其對接收終端的用戶的 清晰度。在一個預(yù)期的備選施例中,諸如在通信會話期間在兩個終端的傳輸路徑內(nèi)的計算 機設(shè)備25之類的交換機設(shè)備可具有聽力和語音數(shù)據(jù)庫,并基于特定用戶的聽力簡檔來修 改要被傳輸給該用戶的音頻數(shù)據(jù),以接收音頻數(shù)據(jù)的輸出和將該音頻數(shù)據(jù)傳輸給接收方的 說話者的語音簡檔。
[0038] 在通信設(shè)備的一些實施例中,不止一個用戶可利用該設(shè)備。不同的用戶可創(chuàng)建不 同的聽力簡檔和不同的語音簡檔。例如,每個使用可利用通信設(shè)備來使聽力簡檔和語音簡 檔被創(chuàng)建、保存和傳輸,如上文所論述的??蓪⑿纬傻挠脩艉啓n保存在相同設(shè)備的存儲器中 并與用戶標識鏈接以區(qū)別不同的用戶。每個用戶然后可以許多方式中的任何一個來識別其 自己。例如,每個用戶可輸入將該用戶識別為當前正在使用該設(shè)備的用戶的唯一登錄標識 或代碼。登錄標識可包括輸入個人標識號或以預(yù)定義的觸摸序列按壓通信設(shè)備的觸摸屏顯 示器的某些部分,以輸入用戶的參考號或標識碼。在檢測到此類輸入的用戶標識時,通信設(shè) 備然后可利用針對所識別用戶的語音和聽力數(shù)據(jù)庫內(nèi)的簡檔。作為另一選項,用戶可通過 經(jīng)由輸入設(shè)備來進行輸入以選擇用戶特定簡檔來選擇用戶的特定簡檔。在一些實施例中, 通信設(shè)備可默認地使用戶的聽力和語音簡檔與經(jīng)由輸入的標識識別的用戶相關(guān)聯(lián)。用戶然 后可提供輸入以撤銷此類設(shè)置或改變該設(shè)置。
[0039] 雖然以上已示出并描述了通信設(shè)備、通信系統(tǒng)以及其制造和使用方法的某些目前 優(yōu)選實施例,但應(yīng)清楚地理解的是,本發(fā)明不限于此,而是可在隨附權(quán)利要求的范圍內(nèi)另外 不同地實施和實踐。
【權(quán)利要求】
1. 一種傳輸語音數(shù)據(jù)的方法,包括: 通信設(shè)備提示用戶說話以獲得用戶的語音樣本以識別用戶語音的時域、頻域、發(fā)聲屬 音和音域中的至少一個; 所述通信設(shè)備基于用戶的語音樣本來確定對于用戶語音的語音度量; 所述通信設(shè)備存儲用戶語音的語音度量; 所述通信設(shè)備從用戶接收語音數(shù)據(jù); 所述通信設(shè)備基于用戶語音的語音度量、時域、頻域、發(fā)聲屬音和音域中的所述至少一 個來修改接收到的語音數(shù)據(jù);以及 所述通信設(shè)備將經(jīng)修改的語音數(shù)據(jù)傳輸給另一設(shè)備,使得所述經(jīng)修改的語音數(shù)據(jù)能輸 出到至少一個接收者。
2. 根據(jù)權(quán)利要求1所述的方法,還包括: 所述通信設(shè)備生成用于向用戶發(fā)出的音調(diào),因此用戶聽到音調(diào); 所述通信設(shè)備接收識別音調(diào)對于用戶而言可聽見時的音量設(shè)置的輸入;以及 所述通信設(shè)備基于接收到的識別音調(diào)對于用戶而言可聽見時的音量設(shè)置的輸入來確 定用戶的聽力簡檔。
3. 根據(jù)權(quán)利要求2所述的方法,還包括: 所述通信設(shè)備基于用戶的聽力簡檔來調(diào)整由所述通信設(shè)備接收到的音頻數(shù)據(jù)的音量 而以更大聲的音量輸出音頻數(shù)據(jù)。
4. 根據(jù)權(quán)利要求2所述的方法,還包括: 所述通信設(shè)備將用戶的聽力簡檔傳輸給另一通信設(shè)備; 所述另一通信設(shè)備在將音頻數(shù)據(jù)傳輸給所述通信設(shè)備之前基于用戶的聽力簡檔來修 改該音頻數(shù)據(jù)。
5. 根據(jù)權(quán)利要求4所述的方法,其中,用戶語音的語音度量包括基于用戶的語音的時 域、語音的頻域、語音的發(fā)聲屬音和語音的音域的參數(shù);以及 其中,所述另一通信設(shè)備在將音頻數(shù)據(jù)傳輸給所述通信設(shè)備之前基于用戶的聽力簡檔 來修改該音頻數(shù)據(jù)包括使音頻頻譜內(nèi)的經(jīng)由用戶的聽力簡檔被識別為對于用戶而言不可 聽見的音頻數(shù)據(jù)的部分省略以使得傳輸?shù)囊纛l數(shù)據(jù)不包含音頻數(shù)據(jù)的該部分。
6. 根據(jù)權(quán)利要求1、權(quán)利要求2、權(quán)利要求3、權(quán)利要求4或權(quán)利要求5所述的方法,其 中,所述通信設(shè)備基于用戶語音的語音度量、時域、頻域、發(fā)聲屬音和音域中的所述至少一 個來修改語音數(shù)據(jù)包括所述通信設(shè)備去除接收到的語音數(shù)據(jù)中的在用戶語音的頻域之外 的頻率范圍內(nèi)的部分。
7. 根據(jù)權(quán)利要求6所述的方法,其中,所述通信設(shè)備基于用戶語音的語音度量、時域、 頻域、發(fā)聲屬音和音域中的所述至少一個來修改語音數(shù)據(jù)還包括所述通信設(shè)備將用戶的語 音的基于用戶語音的語音度量、時域、頻域、發(fā)聲屬音和音域中的至少一個的參數(shù)應(yīng)用于接 收到的語音數(shù)據(jù)的噪聲消除處理。
8. 根據(jù)權(quán)利要求1、權(quán)利要求2、權(quán)利要求3、權(quán)利要求4、權(quán)利要求5、權(quán)利要求6或權(quán) 利要求7所述的方法,其中,所述通信設(shè)備是服務(wù)器、工作站、桌面型計算機、平板計算機、 移動蜂窩電話、因特網(wǎng)設(shè)備、膝上型計算機、智能電話、個人數(shù)字助理、移動計算機設(shè)備或通 信終端中的一個,并且其中所述方法還包括: 所述通信設(shè)備確定接收到的語音數(shù)據(jù)來自用戶。
9. 一種被配置成利用權(quán)利要求1-7的方法的通信系統(tǒng)。
10. -種非瞬時性計算機可讀介質(zhì),具有存儲在其上的應(yīng)用,所述應(yīng)用定義當所述應(yīng)用 被通信設(shè)備執(zhí)行時由所述通信設(shè)備執(zhí)行的方法,所述方法包括: 所述通信設(shè)備提示用戶說話以獲得用戶的語音樣本以識別用戶語音的時域、頻域、發(fā) 聲屬音和音域中的至少一個; 所述通信設(shè)備基于用戶的語音樣本來確定對于用戶語音的語音度量; 所述通信設(shè)備存儲用戶語音的語音度量并使那些保存的語音度量與用戶相關(guān)聯(lián); 所述通信設(shè)備從用戶接收語音數(shù)據(jù); 所述通信設(shè)備基于用戶語音的時域、頻域、發(fā)聲屬音和音域中的至少一個來修改接收 到的語音數(shù)據(jù);以及 所述通信設(shè)備將經(jīng)修改的語音數(shù)據(jù)傳輸給另一設(shè)備。
11. 根據(jù)權(quán)利要求10所述的計算機可讀介質(zhì),其中所述方法還包括: 所述通信設(shè)備生成用于向用戶發(fā)出的音調(diào),因此用戶聽到音調(diào); 所述通信設(shè)備接收識別音調(diào)對于用戶而言可聽見時的音量設(shè)置的輸入;以及 所述通信設(shè)備基于接收到的識別音調(diào)對于用戶而言可聽見時的音量設(shè)置的輸入來確 定用戶的聽力簡檔。
12. 根據(jù)權(quán)利要求11所述的計算機可讀介質(zhì),其中所述方法還包括: 所述通信設(shè)備基于用戶的聽力簡檔來調(diào)整由所述通信設(shè)備接收到的音頻數(shù)據(jù)的音量 而以更大聲的音量輸出音頻數(shù)據(jù)。
13. 根據(jù)權(quán)利要求11所述的計算機可讀介質(zhì),其中,所述通信設(shè)備是第一通信設(shè)備并 且方法還包括: 所述通信設(shè)備將用戶的聽力簡檔傳輸給第二通信設(shè)備;以及 第二通信設(shè)備在將音頻數(shù)據(jù)傳輸給第一通信設(shè)備之前基于用戶的聽力簡檔來修改該 音頻數(shù)據(jù),使得被傳輸給第一通信設(shè)備的經(jīng)修改的音頻數(shù)據(jù)省略在第一音頻頻譜內(nèi)的音頻 數(shù)據(jù)的任何部分,第一音頻頻譜是被用戶的聽力簡檔識別為對用戶不可聽見的音頻的音頻 頻譜。
14. 根據(jù)權(quán)利要求10所述的計算機可讀介質(zhì),其中,所述通信設(shè)備基于用戶語音的時 域、頻域、發(fā)聲屬音和音域中的所述至少一個來修改語音數(shù)據(jù)包括所述通信設(shè)備去除接收 到的語音數(shù)據(jù)中的在用戶語音的頻域之外的頻率范圍內(nèi)的部分。
15. 根據(jù)權(quán)利要求14所述的計算機可讀介質(zhì),其中,所述通信設(shè)備基于用戶語音的時 域、頻域、發(fā)聲屬音和音域中的所述至少一個來修改語音數(shù)據(jù)還包括所述通信設(shè)備將用戶 的語音的基于用戶語音的時域、頻域、發(fā)聲屬音和音域中的至少一個的參數(shù)應(yīng)用于接收到 的語音數(shù)據(jù)的噪聲消除處理。
【文檔編號】G10L21/02GK104160443SQ201280071289
【公開日】2014年11月19日 申請日期:2012年11月20日 優(yōu)先權(quán)日:2012年11月20日
【發(fā)明者】B.卡里米-切爾坎迪, F.M.庫希里, S.W.阿利 申請人:統(tǒng)一有限責任兩合公司