專利名稱:確定音頻設備的質量的制作方法
確定音頻設備的質量 背景
采用連網的計算設備進行實時通信正變得越來越流行。這可采取例如互聯(lián)
網語音傳輸協(xié)議(VOIP)電話、啟用音頻的聊天程序、web視頻會議、以及音 頻和視頻流等形式。提供最高質量的音頻和/或視頻體驗會是提供實時通信音頻 客戶端的許多公司之間的重要區(qū)分要素。在許多情況下,用戶擁有能夠用于通 信會話的多個音頻設備。實時音頻客戶端通常要求用戶選擇并配置音頻設備以 用來進行通話。然而,音頻客戶端不能保證所選音頻設備會帶來有質量的通信 體驗,或甚至不能指示所選設備是否提供了最佳配置選項。
本說明書中的此背景一節(jié)所包括的信息僅出于技術參考的目的而被包括 于此,并且不應被視為限定本發(fā)明的范圍的主題。
此處所描述和請求保護的技術針對計算機系統(tǒng)中的特定音頻輸出或輸入 設備或其組合的質量的自動檢測。存儲于計算設備的存儲器中的模范樣本音頻 文件通過與該計算機系統(tǒng)相連的揚聲器輸出設備被播放。由此產生的聲音被與 該計算機系統(tǒng)相連的擴音器輸入設備捕獲并轉換以生成一個捕獲的音頻信號, 供計算機系統(tǒng)錄音和處理。該捕獲的音頻信號與樣本音頻信號進行相關,以確 定捕獲的音頻信號的保真度。
用于將捕獲的音頻信號與樣本音頻信號進行相關的算法在將捕獲的音頻 信號與樣本音頻信號作比較時會考慮例如以下因素中的一個或多個相對的能 級或強度、存在的頻率的范圍、失真水平和信噪比。其它音頻質量因素可另外 地或替換地被用來計算樣本音頻信號與捕獲的音頻信號之間的相對音頻質量。 可計算設備質量得分來向用戶提供不同音頻設備配置之間的相對評價的簡單 指示。當自動比較完所有可能的設備組合并激活具有最高設備質量得分的配置 后,計算機系統(tǒng)可自動選擇出一對最優(yōu)的音頻輸入和輸出設備。在某些實現(xiàn)中,制品被提供為計算機程序產品。計算機程序產品的一個實 現(xiàn)提供計算機系統(tǒng)可讀的并且對計算機程序進行編碼的計算機程序存儲介質。 計算機程序產品的另一個實現(xiàn)還可以以計算機數據信號被提供,該計算機數據 信號通過計算機系統(tǒng)體現(xiàn)在載波中并對計算機程序進行編程。提供本概述以便 以簡化的形式介紹將在以下詳細描述中進一步描述的一些概念。本概述并非意 在確定所請求保護的主題的關鍵特征或必要特征,也并不用來限制所請求保護 的主題的范圍。所請求保護的主題的其它特征、細節(jié)、用途以及優(yōu)點,隨著各 種實施例和實現(xiàn)進一步在附圖中示出并在所附權利要求中被定義,將從下面的 各種實施例和實現(xiàn)的更具體的書面詳細描述中變得顯而易見。
附圖簡述
圖1示出具有多個附連的音頻設備的示例性個人計算機系統(tǒng)。
圖2示出計算機系統(tǒng)中用于確定音頻設備配置的質量的示例性模塊。 圖3示出由模塊執(zhí)行的用來確定音頻設備質量的一系列示例性操作。 圖4示出被執(zhí)行來確定音頻設備質量得分的另一系列示例性操作。 圖5示出用于進行實時通信會話以及其它音頻輸入和輸出功能的示例性計 算機系統(tǒng)。
詳細描述
此處描述的技術實現(xiàn)提供對與計算機系統(tǒng)相關聯(lián)的音頻設備配置的質量 的自動確定。此技術幫助進行實時通信會話以及其它音頻環(huán)境會話的計算機系 統(tǒng)的用戶確保被選擇進行這種會話的設備包括盡可能最佳的音頻質量配置。例 如,當進行音頻會議(例如使用個人計算機系統(tǒng)的VOIP電話呼叫)時,必須 要有音頻輸入設備(例如擴音器)和音頻輸出設備(例如一個或多個揚聲器) 兩者才能進行通信會話。如果所選擴音器和各揚聲器中的任一個或兩者均沒有 被適當地配置或者組合在一起時運行差,則由于不佳的音頻質量,用戶會有令 人沮喪的通信體驗。此處所描述的系統(tǒng)和方法自動幫助計算機系統(tǒng)的用戶來提 供關于音頻輸入和輸出設備的最優(yōu)配置的信息,以便在通信會話期間最大化音 頻體驗的質量。計算機系統(tǒng)的用戶可能會面對能被用來通信會話的各種可任選音頻設備。 例如,計算機系統(tǒng)可具有任意一個或多個內置擴音器、具有內置擴音器的顯示
器、具有內置擴音器的web攝像頭、具有手持聽筒和喇叭擴音器選項的VOIP 電話、具有擴音器和頭戴受話器的頭戴式耳機、內置揚聲器、具有內置揚聲器 和外置揚聲器的顯示器、以及與具有揚聲器的獨立家庭音頻系統(tǒng)的連接。
例如,圖1示出配備有各種音頻外圍設備的示例性個人計算機系統(tǒng)100。 典型的個人計算機系統(tǒng)100可包括計算機102和與計算機102相連的視頻監(jiān)視 器104、鍵盤108和鼠標108。計算機102可具有用于產生聲音的內置揚聲器 118。視頻監(jiān)視器104還可配有一對揚聲器110。此外,個人計算機系統(tǒng)100 的用戶還可給計算機102附上一組外置揚聲器112。個人計算機系統(tǒng)100還可 包括用于進行網絡視頻會議的視頻攝像機與擴音器114的組合。用戶還可附連 組合了耳機揚聲器和擴音器的頭戴式耳機116以用于參加VOIP或網絡視頻會 議。
在一個示例性音頻配置中,計算機系統(tǒng)可自動選擇并激活設備的最佳配置 以用于期望的音頻會話。樣本音頻文件可通過與計算機系統(tǒng)相連的揚聲器設備 輸出。該樣本音頻文件可被存儲在與計算機系統(tǒng)相關聯(lián)的存儲器中,或可通過 網絡從遠程計算機系統(tǒng)訪問。該樣本音頻文件可被轉換成模擬信號并被傳輸至 揚聲器?;蛘撸筛鶕恢噶罴瘉硗瑫r生成音頻信號。在揚聲器是數字的,即 揚聲器具有模數轉換器的情況下,該樣本音頻文件可被直接傳輸至揚聲器。揚 聲器將模擬音頻信號轉換成聲學能量以在空氣中產生聲波。
在揚聲器播放樣本音頻文件的同一時間段內執(zhí)行測試來記錄擴音器所接 收的聲音。包括對應于樣本音頻文件的聲音的任何聲波被擴音器拾取,并同樣 地被轉換成模擬音頻信號。該模擬音頻信號被計算機系統(tǒng)轉化成數字數據格 式。或者,在數字擴音器的情況下,聲波可直接被轉換成用于輸入到計算機的 數字信號。
如果需要,被擴音器捕獲的音頻數據以及樣本音頻文件被轉換成一共同的 數據格式。然后,來自捕獲的聲音的音頻數據與來自模范音頻樣本文件的音頻 數據相比較,以確定捕獲的音頻數據的總體質量和保真度。捕獲的音頻數據與 模范音頻樣本進行相關的算法會比較幾個因素,包括例如相對的能級或強度、存在的頻率的范圍、失真水平和信噪比??苫谶@些因素來計算一設備質量得 分,并向用戶提供對音頻設備配置的質量的簡單指示。
當自動比較完所有可能的設備組合并激活具有最高設備質量得分的配置 后,計算機系統(tǒng)可自動選擇出一對最優(yōu)的音頻輸入和輸出設備?;蛘撸纱_定 與計算機系統(tǒng)相連的音頻設備(例如擴音器和揚聲器)的質量,并報告用戶。 然后,用戶可手動選擇音頻設備的另一個配置用于測試,并基于各自的質量得 分最終為音頻會話選擇最佳配置。
圖2示出具有用于實現(xiàn)質量確定技術的組件和模塊的示例性計算機系統(tǒng) 200。兩個示例性外圍設備,擴音器202和揚聲器204,與計算機系統(tǒng)200相連。 擴音器202作為音頻捕獲模塊206的輸入設備與計算機系統(tǒng)200相連。揚聲器 204作為音頻呈現(xiàn)模塊208的輸出設備與計算機系統(tǒng)200相連。
擴音器202可以是內置于計算機系統(tǒng)200的硬件設備,或者是通過有線或 無線連接與計算機系統(tǒng)200相連的外部設備。類似地,揚聲器204可以是內置 于計算機系統(tǒng)200的硬件設備,或者是通過有線或無線連接與計算機系統(tǒng)200 相連的外部設備。揚聲器204可以是單個喇叭、 一對喇叭、或是多個喇叭的系 統(tǒng),例如在"環(huán)繞"配置中?;蛘撸瑪U音器202和揚聲器204可被組合于一單 個設備,例如電話手持聽筒或頭戴式耳機中。
如圖2所示,自動設備配置檢測功能由例如虛線210所示出的在計算機系 統(tǒng)200的內核和用戶模式兩者內都具有資源的計算機系統(tǒng)200的資源和指令層 的組合來實現(xiàn)。在其它操作系統(tǒng)和計算環(huán)境中,這種組件和模塊可在軟件體系 結構的其它層上被控制。內核管理包括處理器、存儲器、低層硬件接口的機器 硬件資源,并通過例如設備驅動程序、存儲器管理例程、調度器和系統(tǒng)調用來 控制例如用戶模式組件等其它軟件組件訪問這些資源的方式。
音頻捕獲模塊206和音頻呈現(xiàn)模塊208兩者均駐留在內核中。音頻捕獲模 塊206將擴音器202轉換的模擬音頻信號從聲波轉換成數字數據信號,例如脈 沖編碼調制(PCM)、壓縮盤原始(CDR)數據或其它常見的數據格式,以供 計算機系統(tǒng)200的進一步處理。PCM數據可具有各種質量,例如,PCM16、 PCM 32或PCM 48。音頻呈現(xiàn)模塊208將例如波形音頻(WAV)格式、MPEG1、 數字聲音模塊(DSM)格式或其它常見的數據格式等數字音頻文件轉換成模擬音頻信號,以供揚聲器204進行聲學轉換。
其它功能在用戶模式中被實現(xiàn)為操作擴音器202和音頻捕獲模塊206所接 收的音頻數據以及其它數據的軟件處理例程。質量檢測模塊212包括樣本音頻 文件214、信號處理器216以及信號相關和質量管理模塊218。樣本音頻文件 214可被質量檢測模塊212執(zhí)行的操作訪問,并被傳輸至音頻呈現(xiàn)模塊208和 信號處理器216中的任一個或兩者。樣本音頻文件214作為輸出至揚聲器204 的模范音頻樣本被傳輸至音頻呈現(xiàn)模塊208,以便進行對揚聲器204和擴音器 202的質量配置測試。
樣本音頻文件214可以是一個數字音頻文件,例如WAV文件,它被選作 為所產生的聲音的特征。例如,樣本音頻文件214可產生包括通過擴音器202 能容易檢測到的特定頻率范圍的聲音,或者產生能提供對揚聲器204和擴音器 202的組合的頻率響應的較好指示的聲音。樣本音頻文件214可另外被選擇用 來產生對用戶悅耳的聲音(例如,音樂序列),或提供對用戶有價值的信息(例 如,配置指令或廣告)。
從擴音器202所接收的音頻信號還從音頻捕獲模塊206傳輸至信號處理 216模塊。信號處理器216可處理來自音頻捕獲模塊206的音頻信號和樣本音 頻文件214中的任一個或兩者,以便將音頻信號轉換成一共同數據格式,以供 音頻信號的比較為目的。音頻信號(和其它數字數據信號)可被轉化成任何格 式并以該格式存儲。例如,如果來自音頻捕獲模塊206的音頻信號是PCM格 式的,而音頻樣本文件214是WAV格式的,則信號處理器216可將音頻樣本 文件214轉換成PCM格式?;蛘撸盘柼幚砥骺蓪碜砸纛l捕獲模塊206的 音頻信號轉換成WAV格式。在又一個實例中,當第三種格式,例如音頻互換 文件格式(AIFF),能幫助質量檢測模塊212進行進一步處理時,來自音頻捕 獲模塊206的音頻信號和音頻樣本文件214兩者均可被信號處理器216轉換成 這種格式。
一旦信號處理器216處理了來自音頻捕獲模塊206的音頻信號和樣本音頻 文件214中的任一個或兩者,信號相關和質量測量模塊218就將捕獲的音頻信 號與樣本音頻文件214作比較,以確定質量測量值。來自音頻捕獲模塊206的 音頻信號與樣本音頻文件214的比較有益于確定對音頻設備配置的質量的客觀測量。
在質量評估之前,信號相關和質量測量模塊218可辨別擴音器202拾取的 聲音是由揚聲器產生的還是僅僅是擴音器202所處環(huán)境的環(huán)境聲音。該信號相 關功能力求不斷比較來自擴音器202的捕獲的音頻信號的窗口或快照,以標識 捕獲的音頻信號與樣本音頻文件214之間的合理相關,從而確保相關的音頻數 據被比較。
在對應于揚聲器204播放樣本音頻文件214的那段時間的特定時間窗口期 間內捕獲和記錄來自擴音器202的音頻信號可幫助信號相關功能。因此,信號 相關和質量檢測模塊218將對應于來自音頻捕獲模塊206的音頻信號的數據的 例如頻率、強度和時序等特性與來自音頻樣本文件214的數據作比較,以確定 是否存在數據的匹配。如果數據確實相關,則如圖3和圖4在此處進一步描述 的,信號相關和質量檢測模塊218對捕獲的數據進行質量分析并生成用于特定 音頻設備配置的質量得分。
如圖2所示,計算機系統(tǒng)200還包括在用戶模式內運行的音頻應用程序 222。音頻應用程序222可以是被用戶例示的、將控制正被配置的例如擴音器 202和揚聲器204等輸入和輸出設備的軟件程序。示例性音頻應用程序可以是 VOIP客戶端和啟用音頻的聊天程序。或者,音頻應用程序222可僅僅是一個 音頻設備配置程序,例如,被例示來安裝新的音頻設備或優(yōu)化以前安裝的音頻 設備的特性的"向導"程序。
"音頻設備質量測量"220應用程序接口 (API)用作質量檢測模塊212 中的信號相關和質量測量模塊218之間的接口 ,以向音頻應用程序222傳輸帶 有配置質量得分的數據。音頻應用程序222可采用來自音頻設備質量測量API 220的數據來向用戶傳送關于音頻設備配置的信息。例如,如果該指示表示由 揚聲器204產生的并在擴音器202處被捕獲的聲音強度為弱,則音頻應用程序 222警示用戶例如通過增加揚聲器204上的輸出音量或通過移動來進行故障檢 修?;蛘?,音頻應用程序222可推薦用戶選擇另一個揚聲器選項,例如,從外 部揚聲器設置切換為內置于附連的監(jiān)視器的替換揚聲器,以便確定該替換揚聲 器是否帶來更好的質量。在一個示例性形式中,音頻應用程序222可通過圖形 用戶界面(GUI)中的消息向用戶提供警示(例如,可在顯示監(jiān)視器上展示一"彈出"窗口)。
第二API,即音頻設備選擇API 224,也與音頻應用程序222接口,并且 還與擴音器202和揚聲器204通過其與計算機系統(tǒng)200連接的輸入和輸出端口 接口。(盡管沒有在圖2中示出,但音頻應用程序222可另外與帶有獨立API 的音頻呈現(xiàn)模塊208接口 ,以便在揚聲器204上產生來自由音頻應用程序222 進行的通信會話(例如,VOIP電話呼叫)的聲音)。音頻設備選擇API 224 激活與所選擴音器202和揚聲器204配置相連接的輸入端口或輸出端口 。例如, 用戶的計算機系統(tǒng)200可具有多個擴音器202,例如,集成于顯示監(jiān)視器的第 一擴音器和集成于web攝像頭的第二擴音器,以及具有多個揚聲器204,例如, 與計算機系統(tǒng)200線連的第一組揚聲器和集成于顯示監(jiān)視器的第二組揚聲器。
音頻應用程序222可詢問用戶喜歡用哪個擴音器或哪組揚聲器以用于音頻 通信目的。音頻應用程序222可通過音頻設備選擇API 224打開和關閉適當的 數據端口來激活期望的擴音器202和揚聲器204的組合。音頻應用程序222還 可調用音頻設備選擇API 224來自動循環(huán)于與計算機系統(tǒng)200相連接的任何可 用設備中,以便找到具有最高質量得分的音頻設備配置。
圖3示出由計算機系統(tǒng)執(zhí)行來執(zhí)行自動質量檢測功能的一系列示例性操 作。在圖2的計算機系統(tǒng)200的示例性配置的上下文中,信號相關和質量測量 模塊被配置成為與計算機系統(tǒng)連接的每一可能的擴音器/揚聲器配置確定客觀 的質量等級。盡管是在圖2的計算機系統(tǒng)的上下文中描述的,但應該理解的是, 此處描述的操作可以由除計算機系統(tǒng)200之外的任何系統(tǒng)來執(zhí)行。此外,所描 述的操作中的任何一個操作可由硬件、軟件、固件或任何其組合來執(zhí)行。
一開始,在選擇操作302中,音頻應用程序或者自動選擇或者提示用戶選 擇初始音頻設備配置以用于例如音頻通信會話等音頻會話。這樣的提示或者請 求可通過顯示監(jiān)視器上的GUI消息來展示。 一旦選擇了配置,播放操作304 使得樣本音頻文件被傳輸至音頻呈現(xiàn)設備以便通過所選揚聲器回放。
捕獲操作306記錄被擴音器拾取的聲波,這包括由揚聲器產生的與樣本音 頻文件相關的聲音。該聲波被擴音器轉換為模擬信號,該模擬信號被音頻捕獲 模塊進一步轉換為數字音頻格式。在轉換操作308中,該樣本音頻文件還可被 信號處理器訪問并被轉換成能容易與捕獲的音頻數據的格式作比較的數據格式。例如,如果捕獲的音頻數據是PMC格式的,而樣本音頻文件是WAV格
式的,則可將樣本音頻文件從WAV轉換成PMC。在替換操作中(圖3中未示
出),信號處理器可將捕獲的音頻數據轉換成樣本音頻文件的格式。在又一個
替換操作中(圖3中未示出),捕獲的音頻數據和樣本音頻文件兩者的數據格
式可被轉換成第三個共同的格式。
一旦樣本音頻文件和捕獲的音頻數據都是一個共同格式,則第一分析操作
310分析對應于經轉換的樣本文件的音頻信號的頻率范圍和能級。第二分析操 作312類似地分析對應于捕獲的音頻數據的音頻信號的頻率范圍和能級。第二 分析操作312可對捕獲的音頻數據的窗口或快照進行連續(xù)分析,以幫助相關操 作314。
相關操作314標識捕獲的音頻信號的每一窗口的頻率范圍和能級與轉換的 樣本文件的頻率范圍和能級的合理相關,以確保相關的音頻數據在質量確定過 程中被比較。換言之,相關過程試圖鑒別出捕獲的音頻信號中是被揚聲器播放 的樣本音頻文件的錄音的那部分。音頻信號的頻率范圍和能級不需要完全一
致,但只需合理地接近即可。被認為是合理接近的差值的閾值或范圍可以是預 先確定的或是用戶可設置的。相關操作314可以通過從對應于揚聲器播放樣本 音頻文件的那個時間段的特定時間段內選擇窗口來縮小用來査看相關的捕獲 的音頻信號的窗口。
一旦識別出捕獲的音頻信號和樣本音頻文件之間的相關,計算操作316計 算例如特定擴音器/揚聲器的組合等音頻設備配置的音頻質量得分。音頻質量得 分是基于樣本音頻文件產生的音頻信號的音頻質量與擴音器捕獲的音頻信號 之間的保真度因素。保真度因素可包括音頻信號之間的相對能量、頻率范圍的 相似度、信號失真以及信噪比。圖3更詳細地描述了一個示例性計算操作。
査詢操作318可自動確定是否存在另外的設備配置。如果是,則計算機系 統(tǒng)返回至選擇操作302來選擇擴音器和揚聲器的替換配置用于質量分析。計算 機系統(tǒng)標識每一個功能性的、附連的揚聲器和擴音器設備,并在每個可能的擴 音器和揚聲器對中循環(huán)迭代,以執(zhí)行圖3中枚舉的質量測試過程。
或者,查詢操作318可通過GUI詢問用戶是否希望確定其它設備配置的質 量。如果是,則計算機系統(tǒng)返回至選擇操作302來選擇擴音器和揚聲器的替換配置,以用于質量分析。如果用戶不希望確定其它設備配置的質量或者計算機
自動確定不存在其它配置,則展示/選擇操作320或者(例如,通過GUI消息) 向用戶展示所分析的每個設備配置的音頻質量得分,或者基于音頻質量得分的 比較自動選擇最佳設備配置,或者進行以上兩者。
圖4示出用于計算音頻設備配置的質量得分的示例性過程。這些操作可在 例如圖2的計算機系統(tǒng)200中的質量檢測模塊212的信號相關和質量測量模塊 218內發(fā)生。如圖4所示,接收操作402通過音頻捕獲模塊和信號處理器接收 來自擴音器的捕獲的音頻信號數據。捕獲的音頻信號數據在第一確定操作404 中被分析,在該第一確定操作中,測量捕獲的音頻信號的音量特性,例如音量 強度、信噪比、動態(tài)范圍以及總諧波失真。接著,第二確定操作406檢查捕獲 的音頻信號的頻率特性,例如頻率范圍(例如,捕獲的音頻信號中存在的最高 和最低頻率)、頻率成份(例如,捕獲的音頻信號中存在的明顯不同的頻率) 以及強度(例如,捕獲音頻信號在特定頻率上的強度)。
一旦確定了捕獲的音頻信號的音量和頻率特性,在相關操作408中,它們 與樣本音頻文件的對應的音量和頻率特性進行相關??梢耘c對捕獲的音頻信號 的分析同時地對對應于樣本音頻文件的樣本音頻信號執(zhí)行相同的音量和頻率 分析,以便提供用于相關操作的值?;蛘?,由于樣本音頻文件被預先選擇并且 已知,所以樣本音頻文件的音量和頻率特性可以僅是存儲器中保存的數據并可 用于比較操作。然后,在計算操作410中,分析相關數據以找出捕獲的音頻信 號和樣本音頻文件之間的保真度。
在計算操作410中,可使用"最小平方"法來確定樣本音頻文件的原始信 號與捕獲的音頻信號之間的相對保真度。最小平方法是一種數學優(yōu)化方法,它 試圖通過嘗試最小化一數據與一預測值之差(稱為殘差)的平方和來找出一組 數據(在此例中即捕獲的音頻信號)與一預測值(在此例中即樣本音頻文件) 之間的"最佳配合"。捕獲的音頻信號的保真度受音頻配置質量的影響,例如 揚聲器和擴音器中的每一個的頻率響應、擴音器的靈敏度、揚聲器的音量、擴 音器和揚聲器的互相之間的物理放置、音頻設備所處的物理環(huán)境以及環(huán)境噪 聲。
然后,在計算操作412中,計算對應于用于經確定和比較的每一個音量和頻率特性的保真度的最小平方差的值,并且該值被認為是特定音頻設備配置的 音頻質量得分?;谔囟ㄌ匦詫σ纛l質量的貢獻的重要性,每個特性被分配一 個不同的權重,或按照該權重來縮放。該音頻質量得分被保存并與其它可用音 頻設備配置的音頻質量得分作比較,并且具有最高音頻質量得分的配置被自動 選擇或推薦用戶在計算機系統(tǒng)中操作它以用于通信會話或針對于特定音頻應 用程序。
或者,或除此之外,可展示對應于最高音頻質量得分的最前面的一組音頻 配置。此外,可向用戶展示指示某種音頻設備配置最適合于特定環(huán)境或最適合 特定用戶的反饋。例如, 一種音頻設備配置可能很適用于戶外,而另一種更適 當計算設備位于小區(qū)域時使用。作為另一個示例, 一種音頻設備配置可能更適 合產生較高頻率范圍的聲音的女性嗓音,而另一種配置可能更適合產生較低頻 率范圍的聲音的男性嗓音。
圖5示出可被用來通過網絡進行實時通信會話并且此處所描述的質量測量 技術可在其中操作的示例性計算系統(tǒng)500。在一個實現(xiàn)中,計算系統(tǒng)500可由 臺式或膝上型計算機來實施,盡管其它實現(xiàn),例如視頻游戲控制臺、機頂盒、 便攜式游戲系統(tǒng)、個人數字助理以及移動電話,可包含所描述的技術。計算機 系統(tǒng)500通常包括至少一個處理單元502和存儲器504。取決于計算機系統(tǒng)500 的確切配置及類型,存儲器504可以是易失性的(例如,RAM)、非易失性的 (例如,ROM和閃存)或兩者的某一組合。如虛線506所示出的,計算機系 統(tǒng)500的最基本配置僅需包括處理單元502和存儲器504。
計算機系統(tǒng)500還可包括用于存儲器存儲或檢索的其它設備。這些設備可 以是可移動存儲設備508或不可移動存儲設備510,例如用于在磁或光介質上 的存儲器存儲和檢索的磁盤驅動器、磁帶驅動器和光驅動器。存儲介質可包括 易失性和非易失性介質,可移動和不可移動兩者,并且可用多種配置中的任何 一種來提供,例如,可被用來存儲數據并能被處理單元502訪問的RAM、ROM、 EEPROM、閃存、CD-ROM、 DVD或其它光存儲介質、磁帶盒、磁帶、磁盤 或其它磁存儲設備或任何其它存儲器技術或介質。信息可被存儲于采用存儲例 如計算機可讀指令、數據結構和程序模塊等數據的任何方法或技術的存儲介質 上。計算機系統(tǒng)500還可具有允許系統(tǒng)500與其它設備通信的一個或多個通信 接口 512。通信接口可與局域網(LAN)、廣域網(WAN)、電話網絡、電纜 網絡、因特網、直接線連接、例如射頻、紅外、微波、或聲學等無線網絡、或 允許設備間的數據傳輸的其它網絡相連。數據一般通過例如載波或其它傳輸介 質等已調制數據信號通過網絡發(fā)送至通信介質512或從通信介質512發(fā)送。已 調制數據信號是以在該信號中編碼數據的方式設置或改變特性的電磁信號。
計算機系統(tǒng)500還可具有各種數據設備514和輸出設備516。示例性輸入 設備514可包括鍵盤、鼠標、手寫板、觸摸屏設備、掃描儀、視覺輸入設備和 擴音器或其它聲音輸入設備。示例性輸出設備516可包括顯示監(jiān)視器、打印機 和揚聲器。這樣的輸入設備514和輸出設備516可與計算機系統(tǒng)500集成,或 者它們可以通過有線或無線(例如,通過藍牙協(xié)議)與計算機系統(tǒng)500連接。 這些集成的或外圍輸入和輸出設備一般是公知的,并且不在此處做進一步討 論。在一種實現(xiàn)中,實現(xiàn)用于確定音頻質量(包括例如樣本音頻文件)的方法 或模塊的程序指令被包含于存儲器504和存儲設備508和510中,并被處理單 元502執(zhí)行。例如音頻呈現(xiàn)模塊和音頻捕獲模塊執(zhí)行的其它功能可被計算機系 統(tǒng)500的非易失性存儲器504中的操作系統(tǒng)執(zhí)行。
此處描述的技術被實現(xiàn)為一個或多個系統(tǒng)中的邏輯操作和/或模塊。邏輯操 作可被實現(xiàn)為在一個或多個計算機系統(tǒng)中執(zhí)行的由處理器實現(xiàn)的步驟序列,以 及被實現(xiàn)為在一個或多個計算機系統(tǒng)內的互連機器或電路模塊。同樣,關于由 模塊執(zhí)行或實現(xiàn)的操作,提供各種組件模塊的描述。所得的實現(xiàn)是選擇的問題, 并取決于實現(xiàn)所述技術的底層系統(tǒng)的性能要求。因此,組成此處所描述的技術 的實施例的邏輯操作以不同的方式稱為操作、步驟、對象或模塊。此外,應該 理解,邏輯操作可按任何順序執(zhí)行,除非明確申明或者權利要求語言固有地需 要的特定順序。
以上說明書、示例和數據提供對本發(fā)明的示例性實施例的結構和使用的描 述。盡管以上以一定的具體程度或者參考了一個或多個單獨實施例,但本領域 的技術人員可在不脫離本發(fā)明的精神和范圍的情況下枚舉出所公開的實施例 的各種更改。特別是,應該理解,所描述的技術可獨立于個人計算機被采用。 由此,可預期到其它實施例。希望的是,在以上描述中所包含的以及在附圖中所顯示的所有內容應該被解釋為僅是說明具體實施例的,而不是限制。在不脫 離所附權利要求中所定義的本發(fā)明的基本要素的情況下可在細節(jié)或結構上作 出改變。
權利要求
1. 一種用于確定包括與計算機系統(tǒng)(200, 500)相連接的擴音器(202) 和揚聲器(204)的音頻設備配置的質量的方法,所述方法包括通過所述揚聲器(202)輸出(304)從存儲于所述計算機系統(tǒng)(200, 500) 的存儲器(504)中的樣本音頻文件(214)產生的樣本聲音;通過所述擴音器(202)捕獲(306)所述樣本聲音來產生捕獲的音頻信號; 分析(310)所述捕獲的音頻信號的音頻特性;將所述捕獲的音頻信號的音頻特性與對應于所述樣本音頻文件的樣本音 頻信號的已知特性進行相關(314);以及基于對應于所述音頻設備配置的相關的音頻特性來計算(306)質量測量值。
2. 如權利要求1所述的方法,其特征在于,所述方法還包括將所述擴音器 捕獲的所述樣本聲音轉換(308)成捕獲的音頻信號。
3. 如權利要求1所述的方法,其特征在于,所述方法還包括向所述計算機 系統(tǒng)的用戶展示(320)對所述質量測量值的指示。
4. 如權利要求1所述的方法,其特征在于,所述分析操作還包括處理所述 樣本音頻信號與所述捕獲的音頻信號中的至少一個,以將所述樣本音頻信號、 所述捕獲的音頻信號或這兩個信號轉換成一共同的格式(308)。
5. 如權利要求1所述的方法,其特征在于,所述分析操作還包括分析所述 捕獲的音頻信號的頻率范圍和能級中的至少一個(310)。
6. 如權利要求1所述的方法,其特征在于,所述計算操作還包括計算所述 相關的音頻特性的最小平方值(410)。
7. 如權利要求1所述的方法,其特征在于,所述計算操作還包括將加權因 子應用于所述相關的音頻特性。
8. 如權利要求1所述的方法,其特征在于,或者所述揚聲器(204)包括 多個揚聲器,或者所述擴音器(202)包括多個擴音器,或這兩者均包括多個 揚聲器和擴音器,由此引入多個音頻設備配置,并且其中,所述方法還包括為所述多個音頻設備配置中的每一個在權利要求1的操作中迭代循環(huán) (318)。
9. 如權利要求8所述的方法,其特征在于,所述方法還包括在多個音頻設 備配置中選擇具有所述多個音頻設備配置的每一個的質量測量值中最高質量 測量值的一個音頻設備配置(320)。
10. —種具有用于執(zhí)行實現(xiàn)如權利要求1所述的方法的計算機過程的計算 機可執(zhí)行指令的計算機可讀介質。
11. 一種用于確定包括與計算機系統(tǒng)(200, 500)相連接的擴音器(202) 和揚聲器(204)的音頻設備配置的質量的方法,所述方法包括通過所述揚聲器(202)輸出(304)從存儲于所述計算機系統(tǒng)(200, 500) 的存儲器(504)中的樣本音頻文件(214)產生的樣本聲音;通過所述擴音器捕獲(306, 402)所述樣本聲音以產生捕獲的音頻信號; 確定所述捕獲的音頻信號的音量特性(312, 404); 確定所述捕獲的音頻信號的頻率特性(312, 406); 確定對應于所述樣本音頻文件的樣本音頻信號的音量特性(310);確定所述樣本音頻信號的頻率特性(310);基于所述捕獲的音頻信號的音量特性和頻率特性與所述樣本音頻信號的 音量特性和頻率特性的分別比較,計算所述音頻設備配置的保真度測量值(316)。
12. 如權利要求11所述的方法,其特征在于,所述音量特性包括音量強度、 信噪比、動態(tài)范圍和總諧波失真中的至少一個(404)。
13. 如權利要求11所述的方法,其特征在于,所述頻率特性包括頻率范圍、 頻率成分和頻率強度中的至少一個(406)。
14. 如權利要求11所述的方法,其特征在于,所述計算操作還包括將加權 因子應用于所述頻率特性、所述音量特性、或這兩者中的一個或多個。
15. 如權利要求ll所述的方法,其特征在于,所述計算操作還包括相應地 計算(410)所述捕獲的音頻信號的音量特性和頻率特性與所述樣本音頻信號 的音量特性和頻率特性之間的最小平方值。
16. 如權利要求ll所述的方法,其特征在于,或者所述揚聲器(204)包 括多個揚聲器,或者所述擴音器(202)包括多個擴音器,或這兩者均包括多 個揚聲器和擴音器,由此引入多個音頻設備配置,并且其中,所述方法還包括-為所述多個音頻設備配置中的每一個在權利要求11的操作中迭代循環(huán) (318)。
17. 如權利要求16所述的方法,其特征在于,所述方法還包括在多個音 頻設備配置中選擇具有所述多個音頻設備配置中的每一個的保真度測量值中 最高保真度測量值的一個音頻設備配置(320)。
18. —種具有用于執(zhí)行實現(xiàn)如權利要求11所述的方法的計算機過程的計 算機可執(zhí)行指令的計算機可讀介質。
19. 一種確定音頻設備配置的質量的計算機系統(tǒng)(200, 500),所述計算 機系統(tǒng)包括處理器(502);所述處理器(502)可訪問的、并存儲樣本音頻文件(214)的存儲器(504); 受所述處理器(502)控制、并能夠輸出從所述樣本音頻文件(214)產生 的樣本聲音的揚聲器(204, 516);受所述處理器(502)控制、并能夠接收所述樣本聲音來產生捕獲的音頻 信號的擴音器(202, 514),其中所述揚聲器(204)和擴音器(202) —起構 成所述音頻設備配置;以及受所述處理器(502)控制的質量檢測模塊(218),所述質量檢測模塊 訪問所述存儲器中的所述樣本音頻文件, 產生來自所述樣本音頻文件的樣本音頻信號, 接收來自所述擴音器的所述捕獲的音頻信號, 分析所述捕獲的音頻信號的音頻特性,將所述捕獲的音頻信號的音頻特性與所述樣本音頻信號的已知特性 進行相關,以及基于對應于所述音頻設備配置的所述相關的音頻特性來計算質量測 量值。
20.如權利要求19所述的計算機系統(tǒng)(200, 500),其特征在于, 或者所述揚聲器(204)包括多個揚聲器,或者所述擴音器(202)包括多個擴音器,或這兩者均包括多個揚聲器和擴音器,由此引入多個音頻設備配置;并且所述計算機系統(tǒng)(200, 500)還包括適用于在用于所述樣本聲音的輸出和所述樣本聲音的接收的每個音頻設備配置中自動迭代循環(huán)的設備選擇模塊(224)。
全文摘要
確定計算機系統(tǒng)中的特定音頻設備配置的質量。存儲于計算設備上的存儲器中的模范樣本音頻文件通過與計算機系統(tǒng)相連接的揚聲器被播放。由此產生的聲音被與計算機系統(tǒng)相連接的擴音器捕獲并生成捕獲的音頻信號。該捕獲的音頻信號與樣本音頻信號進行相關以確定該捕獲的音頻信號的保真度。該捕獲的音頻信號與樣本音頻信號進行相關的算法可考慮音頻信號的音量和頻率特性。計算出設備質量得分并且計算機系統(tǒng)可自動選擇最優(yōu)的音頻設備配置。
文檔編號H04B3/20GK101313482SQ200680043155
公開日2008年11月26日 申請日期2006年10月30日 優(yōu)先權日2005年11月17日
發(fā)明者A·W·卡蘭茨, W·L·隆尼 申請人:微軟公司