記錄系統(tǒng)110還可包含額外方向性麥克風(fēng)。額外麥克風(fēng)220及麥克風(fēng)230為方向性麥克風(fēng)且可布置成列且沿各種方向定向。
[0028]應(yīng)注意,音頻處理系統(tǒng)260可經(jīng)配置以保存不具有任何增強(qiáng)處理(如音頻的不同分量的噪聲及回聲消除或衰減或抑制)的原始聲學(xué)音頻信號(hào)。由麥克風(fēng)220及230捕獲且轉(zhuǎn)換為數(shù)字信號(hào)的原始聲學(xué)音頻可保存于存儲(chǔ)器存儲(chǔ)裝置250中以在于圖形顯示器系統(tǒng)280上顯示視頻且經(jīng)由揚(yáng)聲器270播放與視頻相關(guān)聯(lián)的音頻時(shí)進(jìn)行進(jìn)一步后處理。在一些實(shí)施例中,可連同所記錄的原始聲學(xué)音頻信號(hào)一起存儲(chǔ)輸入提示信號(hào)(舉例來(lái)說(shuō),主要及次要聲學(xué)信號(hào)的能量之間的麥克風(fēng)間能級(jí)差(ILD))。在進(jìn)一步實(shí)施例中,所述輸入提示信號(hào)可包含(舉例來(lái)說(shuō))音高顯著、信號(hào)類型分類、揚(yáng)聲器識(shí)別等等。在所記錄的音頻信號(hào)及任選地相關(guān)聯(lián)視頻的回放期間期間,最初聲學(xué)音頻信號(hào)及所記錄的提示信號(hào)可用于修改在回放期間提供的音頻。
[0029]除回放視頻以外,圖形顯示系統(tǒng)280還可經(jīng)配置以提供用戶圖形接口。在一些實(shí)施例中,可利用與圖形顯示系統(tǒng)相關(guān)聯(lián)的觸摸屏從用戶接收輸入。當(dāng)用戶在所記錄的視頻的回放期間觸摸屏幕時(shí)可經(jīng)由圖標(biāo)或文字按鈕將選項(xiàng)提供給用戶。在特定實(shí)施例中,用戶可通過(guò)點(diǎn)擊對(duì)象或通過(guò)圍繞所述對(duì)象繪制幾何圖形(舉例來(lái)說(shuō)圓圈或矩形)來(lái)選擇所播放視頻中的一或多個(gè)對(duì)象。所述一或多個(gè)選定對(duì)象可與對(duì)應(yīng)聲源相關(guān)聯(lián)。
[0030]圖3是展示在所記錄的視頻的回放期間提供給用戶的選項(xiàng)的實(shí)例性屏幕300??山?jīng)由音頻記錄系統(tǒng)110的圖形顯示器系統(tǒng)280提供所述選項(xiàng)。在回放期間,用戶可使用標(biāo)準(zhǔn)“播放/停止”、“后退”及“快進(jìn)”按鈕410播放、停止、暫停所記錄的音頻信號(hào)及相關(guān)聯(lián)視頻、使其快進(jìn)及后退。另外,在回放期間,用戶可改變音頻模式(舉例來(lái)說(shuō))以減少噪聲,聚焦于一或多個(gè)聲源等等。一或多個(gè)額外控制或選項(xiàng)按鈕420是可用的以使得用戶能夠控制回放及對(duì)不同音頻模式的改變或者兩個(gè)或兩個(gè)以上音頻處理模式之間的雙態(tài)切換。舉例來(lái)說(shuō),可存在對(duì)應(yīng)于每一音頻模式的一個(gè)按鈕。按壓按鈕中的一者可選擇對(duì)應(yīng)于所述按鈕的音頻模式。在一些實(shí)施例中,用戶可選擇所播放視頻中的一或多個(gè)對(duì)象以便向音頻記錄系統(tǒng)指示將聚焦于哪一聲源。舉例來(lái)說(shuō),可通過(guò)雙擊對(duì)象或通過(guò)圍繞視頻屏幕的一部分繪制圓圈或另一預(yù)定幾何圖形而實(shí)施對(duì)對(duì)象的選擇,所述部分與所要聲源相關(guān)聯(lián)。在一些進(jìn)一步實(shí)施例中,在選擇視頻中的聲源之后,可經(jīng)由圖形用戶接口將進(jìn)度條提供給用戶。使用所述進(jìn)度條,用戶可設(shè)置選定聲源的合意音量級(jí)。在特定實(shí)施例中,用戶可通過(guò)選擇屏幕上的視頻的對(duì)應(yīng)部分(舉例來(lái)說(shuō),通過(guò)圍繞與非所要聲源相關(guān)聯(lián)的對(duì)象繪制“十字”符號(hào)或另一預(yù)定幾何圖形)來(lái)指導(dǎo)音頻記錄系統(tǒng)使所播放的視頻中的一或多個(gè)聲源衰減。
[0031]用戶在實(shí)時(shí)收聽(tīng)最初或經(jīng)處理聲學(xué)信號(hào)時(shí)可在不同后處理模式之間切換以將不同音頻模式的所感知到的音頻質(zhì)量進(jìn)行比較。音頻處理模式可包含不同的方向性音頻捕獲配置(舉例來(lái)說(shuō),DirAc、音頻焦點(diǎn)(Aud1 Focus)、音頻變焦(Aud1 Zoom)等等)以及多媒體處理塊(舉例來(lái)說(shuō),低音提升、多頻帶壓縮、立體聲噪聲偏壓抑制、均衡濾波器等等)。在一些實(shí)施例中,音頻處理模式可使得用戶能夠選擇噪聲抑制量,引導(dǎo)音頻朝向場(chǎng)景、敘述者或兩者等等。
[0032]在圖3中所展示的實(shí)例性屏幕300中,按鈕“不處理”、“場(chǎng)景”、“敘述者”、“敘述”及“再處理”是可用的。通過(guò)觸摸“不處理”、“場(chǎng)景”、“敘述者”、“敘述”按鈕,可選擇實(shí)時(shí)音頻處理模式中的一者。在選擇處理模式之后,音頻記錄系統(tǒng)110可繼續(xù)播放修改為選定模式的音頻。使正播放的音頻信號(hào)與相關(guān)聯(lián)視頻保持同步。
[0033]舉例來(lái)說(shuō),“場(chǎng)景”可包含源自視頻中可見(jiàn)的一或多個(gè)音頻源(舉例來(lái)說(shuō),人、動(dòng)物、機(jī)器、無(wú)生命對(duì)象、自然現(xiàn)象等等)的聲音。舉例來(lái)說(shuō),“敘述者”可包含源自攝像機(jī)的操作者及/或視頻中不可見(jiàn)的其它音頻源(舉例來(lái)說(shuō),人、動(dòng)物、機(jī)器、無(wú)生命對(duì)象、自然現(xiàn)象等等)的聲首。
[0034]通過(guò)實(shí)例而非限制的方式,用戶可播放包括音頻及視頻部分的記錄。用戶可在回放期間通過(guò)使用(舉例來(lái)說(shuō))按鈕“后退”、“播放/暫停”、“快進(jìn)”、“場(chǎng)景”、“敘述者”及其它按鈕來(lái)觸摸或以其它方式激活屏幕。當(dāng)用戶觸摸或以其它方式激活場(chǎng)景按鈕時(shí),音頻記錄系統(tǒng)可經(jīng)配置以使得視頻部分繼續(xù)與經(jīng)修改以提供與場(chǎng)景音頻模式相關(guān)聯(lián)的經(jīng)驗(yàn)的聲音部分一起播放。用戶可繼續(xù)收聽(tīng)(且觀看)記錄以確定用戶是否偏好場(chǎng)景音頻模式。用戶可任選地使記錄后退到較早時(shí)間(如果需要)。類似地,用戶可觸摸或以其它方式致動(dòng)敘述者按鈕,且作為響應(yīng),音頻記錄系統(tǒng)經(jīng)配置以使得視頻部分繼續(xù)與經(jīng)修改以提供與敘述者音頻模式相關(guān)聯(lián)的經(jīng)驗(yàn)的聲音部分一起播放。用戶可繼續(xù)收聽(tīng)記錄以確定用戶是否偏好敘述者音頻模式。
[0035]通過(guò)進(jìn)一步實(shí)例而非限制的方式,如果用戶確定敘述者音頻模式為其中應(yīng)存儲(chǔ)記錄的模式,那么用戶按壓“再處理”按鈕,且音頻記錄系統(tǒng)可開(kāi)始根據(jù)由用戶選擇的最新音頻模式處理(在后臺(tái))整個(gè)音頻及視頻。用戶可繼續(xù)收聽(tīng)/觀看或可(舉例來(lái)說(shuō))通過(guò)退出應(yīng)用程序來(lái)停止,而過(guò)程繼續(xù)直到完成(在后臺(tái))。用戶可經(jīng)由相同或不同應(yīng)用程序追蹤后臺(tái)進(jìn)程狀態(tài)。
[0036]后臺(tái)進(jìn)程可經(jīng)配置以任選地移除與最初視頻相關(guān)聯(lián)的最初麥克風(fēng)記錄以便節(jié)省存儲(chǔ)器存儲(chǔ)裝置250中的空間。在一些實(shí)施例中,后臺(tái)進(jìn)程可任選地經(jīng)配置以刪除與最初視頻相關(guān)聯(lián)的所存儲(chǔ)的最初音頻,舉例來(lái)說(shuō),以節(jié)省音頻記錄系統(tǒng)的存儲(chǔ)器中的空間。根據(jù)各種實(shí)施例,音頻記錄系統(tǒng)還可壓縮音頻信號(hào)(舉例來(lái)說(shuō),最初聲學(xué)信號(hào)、經(jīng)信號(hào)處理的聲學(xué)信號(hào)、對(duì)應(yīng)于音頻模式中的一或多者的聲學(xué)信號(hào)等等)中的至少一者,舉例來(lái)說(shuō),以節(jié)省音頻記錄系統(tǒng)的存儲(chǔ)器中的空間。用戶可上傳經(jīng)處理音頻及視頻。
[0037]圖4展示提供可用于處理與由音頻記錄系統(tǒng)110回放的視頻相關(guān)聯(lián)的音頻的實(shí)例性音頻處理模式的細(xì)節(jié)的表400。舉例來(lái)說(shuō),表示為“不處理”的音頻處理模式指示音頻處理系統(tǒng)不可修改所播放的音頻。
[0038]當(dāng)選擇“敘述者”模式時(shí),音頻處理系統(tǒng)經(jīng)配置以聚焦于所播放音頻中的近源分量(“敘述者”),抑制噪聲分量且使遠(yuǎn)源分量(“場(chǎng)景”)衰減。
[0039]當(dāng)選擇“場(chǎng)景”模式時(shí),音頻處理系統(tǒng)經(jīng)配置以聚焦于遠(yuǎn)源分量(“場(chǎng)景”),抑制噪聲且使近源分量(“敘述者”)衰減。
[0040]當(dāng)選擇“敘述”模式時(shí),音頻處理系統(tǒng)可操作以聚焦于近源分量(“敘述者”)及遠(yuǎn)源分量(“場(chǎng)景”)且抑制噪聲。
[0041]可存在用戶按壓按鈕與音頻模式的改變之間的延時(shí),然而在一些實(shí)施例中,滯后不可被用戶感知到或?qū)τ谟脩魹榭山邮艿?。舉例來(lái)說(shuō),延遲可為大約100毫秒。
[0042]可由音頻記錄系統(tǒng)110 (圖2中所展示)的音頻處理系統(tǒng)260基于與最初原始音頻信號(hào)一起經(jīng)記錄的輸入提示信號(hào)(如麥克風(fēng)間能級(jí)差、能級(jí)顯著、音高顯著、信號(hào)類型分類、揚(yáng)聲器識(shí)別等等)而實(shí)施分量衰減及噪聲抑制。在一些實(shí)施例中,為了抑制噪聲,音頻處理系統(tǒng)可包含噪聲減少模塊。在2010年7月8日申請(qǐng)的標(biāo)題為“用于聯(lián)合地優(yōu)化單麥克風(fēng)或多麥克風(fēng)系統(tǒng)中的噪聲減少及話音質(zhì)量的方法(Method for Jointly OptimizingNoise Reduct1n and Voice Quality in a Mono or Mult1-Microphone System),,的第12/832,901號(hào)美國(guó)專利申請(qǐng)案中更詳細(xì)地論述適合于執(zhí)行噪聲減少的實(shí)例性音頻處理系統(tǒng),所述美國(guó)專利申請(qǐng)案的揭示內(nèi)容出于所有目的而以引用方式并入本文中。
[0043]圖5是根據(jù)實(shí)例性實(shí)施例展示用于在視頻回放期間的動(dòng)態(tài)音頻空間感改變的方法500的步驟的流程圖??墒褂脠D2中所展示的音頻記錄系統(tǒng)110實(shí)施實(shí)例性方法500的步驟。方法500可在步驟502中開(kāi)始接收音頻,所述音頻為連同相關(guān)聯(lián)視頻一起記錄的最初聲學(xué)信號(hào)。在步驟504中,方法500繼續(xù)播放音頻。在步驟506中,在播放音頻時(shí)接收處理模式。在步驟508中,可響應(yīng)于處理模式實(shí)時(shí)修改正播放的音頻。在可選步驟510中,可在繼續(xù)播放音頻時(shí)在后臺(tái)進(jìn)程中根據(jù)處理模式再處理整個(gè)音頻,且將其存儲(chǔ)于存儲(chǔ)器中。
[