專利名稱:無聲檢測的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及檢測音頻信號中的無聲。本發(fā)明還涉及在廣告檢測中利用這種無聲檢測。
背景技術(shù):
EP 1 006 685 A2公開了一種用于處理電視信號以及檢測電視信號中廣告片的出現(xiàn)的方法和裝置。廣告候選段檢測器根據(jù)寂靜段和場景變化點來檢測廣告候選段。廣告特征量檢測器判斷該廣告候選段是否具有廣告片的各種特征,并根據(jù)判斷結(jié)果給廣告特征值增加一個預(yù)定值。廣告特征量檢測器將最終廣告特征值與預(yù)定閾值進(jìn)行比較,并根據(jù)比較結(jié)果判斷廣告候選段是否是廣告段。寂靜段檢測器將數(shù)字化音頻信號的電平與閾值進(jìn)行比較以檢測寂靜段,并將比較結(jié)果輸出到場景變化檢測器。另外還參考EP 1 087 557 A2。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種有利的無聲檢測。為此,本發(fā)明提供如獨立權(quán)利要求中定義的用于檢測無聲的方法、無聲檢測器和接收機(jī)。附屬權(quán)利要求中定義有利實施例。
根據(jù)本發(fā)明的第一方面,當(dāng)局部信號功率低于給定固定或相關(guān)閾值時,檢測無聲,局部信號功率低于給定固定或相關(guān)閾值的持續(xù)時間在第一范圍內(nèi),并且信號功率下降速率和局部功率偏移中的至少一個參數(shù)在各自的另一范圍內(nèi)。在局部信號功率電平下降到給定固定或相關(guān)閾值功率電平以下的時刻之前或在該時刻附近,確定信號功率下降速率,并且在局部信號功率電平低于給定固定或相關(guān)閾值功率電平的持續(xù)時間中的至少部分時間期間,確定局部信號功率偏移。線性偏移和/或下降速率被用于過濾部分無聲,這種無聲可以是能感知的但與廣告檢測無關(guān)。除了下降速率或作為對下降速率的補(bǔ)充,可以利用上升速率,在局部信號功率電平上升到高于給定固定或相關(guān)閾值功率電平的時刻附近確定上升功率。
在優(yōu)選實施例中,無聲開始時間、無聲持續(xù)時間和局部信號功率電平被用于后續(xù)統(tǒng)計模型中,以確定連續(xù)檢測到的無聲之間的內(nèi)容是否為廣告片。這些參數(shù)可在無聲檢測中得到,并因此能夠有利地重用于確定連續(xù)檢測到無聲之間的內(nèi)容是否真的是廣告片。
當(dāng)音頻信號包括量化樣本塊、即具有一組比例因子的給定塊時,無聲檢測最好從壓縮音頻信號提取這組比例因子,并且根據(jù)比例因子的組合估計給定塊中的信號功率。給定塊可以是音頻幀或音頻幀的一部分。能夠容易地從壓縮音頻中提取比例因子。本發(fā)明的這個方面是基于這樣一種理解比例因子表示與其有關(guān)的樣本的最大可能值。因此,比例因子的組合,如平方比例因子的和給出信號功率的粗略估計,這只需有限的計算負(fù)荷。這種粗略估計對于某些應(yīng)用是完全足夠的,比如例如廣告檢測器中的無聲檢測。更有利的是只利用這組比例因子的子集。通過只利用整個比例因子組的子集,進(jìn)一步減少了計算負(fù)荷。這可能導(dǎo)致更低的精確度,但與如用于廣告片的無聲檢測等的一些應(yīng)用關(guān)系不大??梢酝ㄟ^省略時間方向和/或頻率方向中的比例因子執(zhí)行子集的形成。例如,子集可以只包括壓縮音頻信號中可得到的多個窄帶子信號的子集,子集最好包括若干較低頻率的子信號的比例因子。在壓縮音頻信號是立體聲或多聲道信號的情況下,可以只利用可得到聲道的子集。
注意,WO 96/3271 A1公開了一種壓縮和解壓縮音頻信號以用于數(shù)字傳輸?shù)南到y(tǒng),其中輔助數(shù)據(jù)可以與音頻數(shù)據(jù)復(fù)用并編碼并以可對其進(jìn)行解碼的這樣一種方式傳送。這份文檔在第159頁公開了最小比例因子值的計算從而檢查另一頻道中是否出現(xiàn)音頻。
本發(fā)明還涉及一種用于傳送節(jié)目的方法和裝置,這種節(jié)目至少包括音頻信號,其中對音頻信號中具有相對低的信號功率電平的時間間隔進(jìn)行檢測,并且其中在所述時間間隔中引入附加無聲,其中附加無聲比所述時間間隔短,并且在所述時間間隔期間,附加無聲的信號功率電平低于音頻信號的信號功率電平。通過在低功率時間間隔中提供附加無聲,傳送了若干利用無聲檢測控制廣告檢測器的標(biāo)記。在低功率時間間隔中提供附加無聲的優(yōu)點在于,與在高信號功率時間間隔中增加無聲相比,這些附加無聲的能聽度低。無聲的功率偏移電平以及功率下降/上升速率最好在對應(yīng)于接收機(jī)側(cè)的無聲檢測器的范圍內(nèi)。本發(fā)明還提供一種信號和一種存儲媒體。
將參考附圖對本發(fā)明的這些和其它方面進(jìn)行說明并使本發(fā)明的這些和其它方面變得清楚。
附圖中圖1示意根據(jù)本發(fā)明的實施例的接收機(jī);圖2示意例示音頻幀,它包括32個子帶,將每個子帶細(xì)分為3塊,每塊包括12個量化樣本并具有比例因子;圖3示意圖2的例示音頻幀,其中為各個子帶選擇最大比例因子,用灰色加亮了可能的選擇;圖4示意一個例示圖,其中圓圈表示所檢測無聲的局部信號功率,而十字表示這些局部信號功率的平均值;以及圖5示意與圖4有關(guān)的例示似然函數(shù)。
附圖只示意有助于理解本發(fā)明的實施例的那些部分。
具體實施例方式
圖1示意了根據(jù)本發(fā)明的一個實施例的接收機(jī)1,用于接收壓縮音頻信號[A]。接收機(jī)1包括輸入10,用于獲得壓縮音頻信號[A]。輸入10可以是天線、網(wǎng)絡(luò)連接、讀裝置等。接收機(jī)1還包括無聲檢測器11,用于檢測壓縮音頻信號中的無聲,以及影響塊12,用于根據(jù)無聲檢測來影響音頻信號。塊12可以是如解碼器,用于對壓縮音頻信號進(jìn)行解碼,其中所述解碼根據(jù)所檢測的無聲。塊12也可以是跳越塊,用于根據(jù)所檢測的無聲跳過部分壓縮音頻??梢栽鰪?qiáng)無聲檢測器11從而形成廣告檢測器。在解碼過程中可以跳過檢測到的廣告片??梢詫⑹苡绊懙囊纛l信號A輸出到輸出裝置13,其中該信號A是解碼的或仍是壓縮的。輸出13可以是網(wǎng)絡(luò)連接、再現(xiàn)裝置或記錄裝置。壓縮音頻信號[A]可以包括在節(jié)目流中,其中節(jié)目流還包括視頻信號。在這種情況下,可以根據(jù)壓縮音頻信號中檢測到的無聲在塊12中影響至少部分節(jié)目信號。有利的應(yīng)用是一種只存儲非廣告內(nèi)容的存儲裝置。
根據(jù)本發(fā)明的實施例的廣告檢測器自動檢測視聽流中的廣告塊。這允許在任何一種諸如關(guān)鍵幀提取、編輯或回放的處理期間,跳過廣告片。對于多個音頻特征,在滑動窗口上測量局部統(tǒng)計并將其與廣告片的統(tǒng)計模型進(jìn)行比較。通過這種比較,得到歸一化似然函數(shù),此函數(shù)表明音頻信號如何在局部與廣告片類似??梢赃m當(dāng)?shù)赜|發(fā)此似然函數(shù)用于廣告檢測。選擇統(tǒng)計窗口以使其詳細(xì)描述局部分析并且堅固的抵抗局部不規(guī)則性和波動性,這些并不影響檢測。該算法適合于某些情形,這些情形可以沿單個流變化或在兩個流之間變化。該算法獨立于視頻。盡管如此,仍然可以包括視頻分析以增強(qiáng)或擴(kuò)展這種分類。該算法可以被用于多種存儲系統(tǒng)。
許多音頻編碼器(如MPEG-1層1/2/3、MPEG-2層1/2/3、MPEG-2AAC、MPEG-4 AAC、AC-3)是頻域編碼器。它們將源頻譜分成多個窄帶子信號并對各個頻率分量或樣本分別進(jìn)行量化。根據(jù)比例因子并根據(jù)位分配對頻率分量或樣本進(jìn)行量化。這些比例因子可以被視作頻率分量或樣本的最大值的指示符。
在AC-3中,頻率分量被表示為尾數(shù).2(-指數(shù))表示。這里指數(shù)作為各個尾數(shù)的比例因子,等于2(-指數(shù))。
在MPEG-1層2中,窄帶子信號被分為具有12個量化樣本的若干組,其中每組具有相應(yīng)的比例因子。這個比例因子對應(yīng)于與其相關(guān)的樣本的最大值。
檢測算法最好利用比例因子的子集。在全部窄帶子信號或其子集中,通過計算比例因子的平方來計算信號功率的上限。
現(xiàn)在更詳細(xì)地描述利用MPEG音頻壓縮的實施例。在MPEG層2中,對應(yīng)于48kHz、44.1kHz或32kHz的采樣率,分別在24毫秒、26.1毫秒或36毫秒的時間間隔劃分音頻信號。在每個這種時間間隔中,將信號編碼編碼為一幀。參考圖1,每個幀間隔被分為三部分并且信號被分解為32個子帶分量。對于各個子帶分量和幀的各個三分之一部分(圖1中的一個矩形),根據(jù)比例因子并根據(jù)適當(dāng)選擇的若干比特來對12個樣本進(jìn)行量化。比例因子給出了12個樣本的絕對值的上限估計。這種估計可能不是非常精確,但是廣告檢測不需要過分精確。可以從各個音頻幀提取比例因子,其計算負(fù)荷可忽略不計,因為它們可以在幀中直接以偽對數(shù)指數(shù)得到。只需要對有限的一些幀信頭進(jìn)行解碼。不需要解壓縮。
在立體聲模式中,每個聲道自身具有每幀96個比例因子。檢測算法只選擇左聲道或右聲道的各個子帶中的最大比例因子(見圖2)緩沖32個值并將其轉(zhuǎn)換為線性(不是對數(shù)的)格式。例如,對于48kHz的音頻采樣率,根據(jù)標(biāo)準(zhǔn)只利用子帶0…26它給出每24毫秒27個樣本,也就是1125樣本/秒,這是廣告檢測器中非常普通的輸入數(shù)據(jù)速率。計算緩沖比例因子的平方,從而獲得子帶信號功率的上限。接下來將它們用作(1)它們的和給出總短時功率的上限;(2)它們可被用于計算短時帶寬估計;下表給出了用于MPEG-1層2中的比例因子的一些偽對數(shù)指數(shù)(見ISO/IEC 11172-31993中的表B.1)
下面給出了音頻幀j的短時功率估計幀_功率j≈∑(比例因子)j,i2≈∑100.6-0.2·指數(shù)或者,有可能利用查找表尋找比例因子。在給定時刻對子帶數(shù)量執(zhí)行求和。當(dāng)利用子帶的子集時,必須對子帶總數(shù)或根據(jù)應(yīng)用對所用子帶數(shù)量執(zhí)行求和。
無聲檢測基于以下方面的嵌套閾值1)局部信號功率電平,通過利用如以上所示的幀功率2)無聲持續(xù)時間;以及至少一個以下參數(shù)3)無聲期間的局部功率線性偏移;以及4)無聲開始前的局部功率下降速率;以及5)無聲結(jié)束時的局部功率上升速率;因為信號功率特性極大地取決于無聲檢測器工作的環(huán)境,所以無聲檢測器最好是自適應(yīng)的。因此,為了使其是自適應(yīng)的,將局部功率電平相關(guān)參數(shù)(即1)、3)和/或4))與它們在時間上的平均值進(jìn)行比較。局部信號功率的典型閾值是0.01,即局部信號功率應(yīng)該小于信號功率的時間平均值的百分之一。通過利用長度為w幀的自適應(yīng)窗口來計算時間平均。以下是實際方案平均_幀_功率-1=0 其中j為幀指數(shù)。
無聲持續(xù)時間是局部信號電平低于給定固定或自適應(yīng)閾值功率電平的持續(xù)時間。線性偏移是至少部分無聲持續(xù)時間上(幀功率減去平均幀功率)的總和。線性偏移和下降/上升速率被用于過濾部分無聲,這種無聲可以是能感知的但與廣告檢測無關(guān)。最好利用如上所述的比例因子來確定例如每音頻幀或部分音頻幀的局部信號功率電平。
廣告塊中廣告片之間的無聲持續(xù)時間間斷的實際范圍是3/25秒到20/25秒。
對無聲開始時間、無聲持續(xù)時間和無聲局部功率電平的值進(jìn)行緩沖,用于下述統(tǒng)計計算。廣告片的特征在于以下特征的局部統(tǒng)計模型1)兩個連續(xù)的所檢測無聲之間的時間間距;2)所檢測無聲的局部信號功率電平(絕對的和/或相對的)3)無聲持續(xù)時間;以及4)音頻信號的局部帶寬;可以根據(jù)以下方式中的比例因子計算音頻幀j的局部帶寬 每個特征得到0.5歸一的似然函數(shù),其值在0到1之間。它表示這種特征的局部統(tǒng)計與廣告片局部統(tǒng)計的類似程度。然后,將不同的似然函數(shù)與不同的權(quán)組合,以獲得全局似然函數(shù),仍是0.5歸一的,這種全局似然函數(shù)得出某個時間的所有信息。計算時間軸上每個點的全局似然函數(shù),它被緩沖為無聲開始時間。值0.5主要表示“總不定度”或“0.5的概率在廣告塊內(nèi)”??梢砸圆煌姆绞嚼盟迫缓瘮?shù)。它可以被適當(dāng)?shù)赜|發(fā)以檢測廣告邊界??梢杂蛇M(jìn)一步分析和分類的算法利用這種似然函數(shù)(用作廣告片和非廣告片之間的歸一化軟分類),還可選地使用音頻特征??梢詮慕y(tǒng)計上分析不同水平的視頻特征(比如單亮度、單色度幀檢測、場景變化檢測)以及應(yīng)用同一似然方法或其它方法的音頻特征。以及根據(jù)上述音頻分析開發(fā)并測試了具有回填(refilling)的觸發(fā)廣告檢測。0.5歸一似然函數(shù)L(t)可被用于判定所檢測的無聲是否屬于廣告塊。可以借助于函數(shù)Q(L(t))完成,其中Q(L(t))被定義為如下Q(L(t))=1如果L(t)>0.5Q(L(t))=0如果L(t)<=0.5,其中值0和1分別表示所檢測的無聲屬于非廣告塊和廣告塊。
在實際實施例中,只有當(dāng)廣告片序列持續(xù)至少60秒時才檢測得到。如果僅在小于45秒的短間隔似然函數(shù)低于0.5,則Q(t)被設(shè)置1。這個過程被稱為“內(nèi)部回填”。內(nèi)部回填消除了零星的內(nèi)部遺漏檢測?!巴獠炕靥睢睉?yīng)用在廣告片的開始和結(jié)束時。例如如果ti,ti+1,…ti+N,…為所檢測無聲開始的瞬間序列并且L(ti)=0.2L(ti+1)=0.4L(ti+2)=0.6L(tj)>0.5對于各個j=i+3,…,i+NL(tj)<0.5對于j>i+N并且如果Ti+2-ti+1<45.0秒Ti+N+1-ti+N<45.0秒則
Q(L(ti))=0Q(L(ti+1))=1Q(L(ti+2))=1…Q(L(ti+N+1))=1Q(L(tj))=0對于j>i+N+1外部回填對于避免系統(tǒng)遺漏第一和最后一點是有效的。這個事實與開窗的具體情況有關(guān)。外部和內(nèi)部回填可被視為特殊的非線性濾波、上部驅(qū)動??梢岳脧V告塊的通用統(tǒng)計模型。對一天中不同時間和/或不同種類的節(jié)目(肥皂劇、談話節(jié)目、足球比賽等)和/或不同頻道采用不同廣告塊模型,有可能精煉統(tǒng)計細(xì)節(jié)。盡管這對于獲得滿意的性能不是必需的,但它當(dāng)然可以改進(jìn)性能。這是目標(biāo)系統(tǒng)的復(fù)雜性與其性能之間的折衷選擇。對于一個信道,檢測的自適應(yīng)性最好隨時間的情況變化。此外最好具有頻道切換的自適應(yīng)性。具體地說,單個頻道的局部最小噪聲電平可以隨時間而變化,并且從一個頻道到另一頻道可以發(fā)生明顯地變化這對于無聲檢測是關(guān)鍵的。除此之外,廣告塊統(tǒng)計模式中的自適應(yīng)性不是關(guān)鍵的,但是有用的。系統(tǒng)可以實現(xiàn)為對局部最小噪聲電平的完全自訓(xùn)練(自適應(yīng))。唯一的約束是每當(dāng)轉(zhuǎn)換頻道時對算法進(jìn)行復(fù)位。這是因為在初始化時期自適應(yīng)性快而以后自適應(yīng)性較慢,這時適應(yīng)性和精確度之間的折衷選擇。如果使該算法在任何時候都是快速自適應(yīng)的,那么檢測的精確度將降低,這是因為在廣告塊內(nèi)部,相對快的自適應(yīng)將降低精確度。在實際的實施例中,切換自適應(yīng)性只在開始的幾分鐘(即任何相繼的切換都復(fù)位)有效,而循單個頻道的自適應(yīng)性則一直保持。通過不對稱方案確保自適應(yīng)性的穩(wěn)定性。當(dāng)最小噪聲電平降低時,自適應(yīng)性比其增加時快。這意味著例如在檢測到的無聲其局部功率能量低于之前檢測到的無聲局部功率能量時,無聲檢測的局部功率能量閾值下降地也相對快??梢猿霈F(xiàn)兩種錯誤遺漏廣告檢測或者錯誤廣告檢測。這兩種錯誤都相當(dāng)?shù)筒⑶蚁抻趶V告塊的開始或結(jié)束部分??傊撍惴ㄊ庆`活的判定參數(shù)可以改變兩種出錯率之間的折衷,取決于哪種更相關(guān)。例如,如果廣告塊檢測是自動關(guān)鍵幀提取的預(yù)處理,那么低的遺漏檢測率更為重要。對于簡單的重放來說,低錯誤檢測更為相關(guān)。參考所選特征(但可以加上其它的),不進(jìn)行子帶分析就有可能分別估計局部功率能量和帶寬。低采樣率時在兩分鐘(可以選擇其它值)對稱滑動窗口上需要帶寬值。因此,可以例如通過對連續(xù)段間隔FFT的少數(shù)點進(jìn)行平均來估計帶寬值。有可能逐項或全局地實現(xiàn)一個或多個似然函數(shù)不同形式的歸一化和組合。實際實現(xiàn)基于逐項或全局地組合乘積并且再歸一化。該乘積基本上是從布爾集{0、1}擴(kuò)展到連續(xù)間隔
的布爾“與”。它確保良好的選擇性。概括地說,某個時刻會同時軟性地加上了不同條件。這些條件不需要完全地實現(xiàn),但必需實現(xiàn)它們的大部分。相反,加法組合應(yīng)是布爾“或”的一種擴(kuò)展,它并不確保足夠的選擇性。進(jìn)一步的選擇性和堅固性由對持續(xù)時間閾值似然性的硬判定確保。似然性-噪聲容限還由內(nèi)部回填確保。
以下例示中考慮了36分鐘的記錄。該記錄從電源的最后部分開始。秒[646,866]包括廣告片。在秒866開始TV演出。其它廣告片在間隔[1409,1735]秒。圖4用圓圈畫出在各個所檢測無聲期間計算的局部信號功率。十字表示這些值的向后平均。顯然,廣告無聲(間隔[646,866]和[1409,1735]中)主要是較低功率的剪輯無聲??梢约s略地注意到,無聲在廣告片中的不同分布。例如,它們之中的大部分相距10-30秒。如圖所示的那些統(tǒng)計詳細(xì)內(nèi)容被用于似然函數(shù)估計中。圖5畫出所得到的似然函數(shù)。填充觸發(fā)檢測到[648,866]和[1408,1735]。
可能的改動1)可能緩沖更大部分的比例因子。也可能對它們作二次取樣。當(dāng)前從96個左聲道比例因子中選擇32個被證明是有效的。
2)可能選擇不同的音頻特征組。當(dāng)然在引入其它特征之前仔細(xì)的調(diào)查研究是必需的。
3)如上所述,可能實現(xiàn)一個或幾個似然函數(shù)不同形式的歸一化和組合。當(dāng)前實現(xiàn)基于乘積組合并且再歸一化。該乘積主要是從布爾集{0,1}擴(kuò)展到連續(xù)間隔
的布爾“與”。它確保了良好的選擇性。半和是布爾“或”的一種擴(kuò)展,但它并不確保足夠的選擇性。
4)能夠修改觸發(fā)全局似然函數(shù)并回填的選擇,例如如果利用了不同的開窗形式和/或不同的音頻特征。
5)也可以通過直接處理比例因子而獲得特定音頻序列的識別,比如許多廣播電臺在廣告塊的開始和/或結(jié)束時有規(guī)律地放置的那些。
在發(fā)射機(jī)側(cè),有可能通過使剪輯無聲更好的被檢測的方式,例如通過降低它們的信號功率、通過修改無聲持續(xù)時間、通過提高信號功率下降速率、和/或通過降低無聲期間的功率偏移,來調(diào)整該剪輯無聲,從而幫助似然函數(shù)。相反,也有可能通過增加它們的信號功率,例如通過引入噪聲、通過修改無聲持續(xù)時間、通過降低信號功率下降速率和/或通過提高無聲期間的功率偏移,從而降低剪輯無聲的可檢測性。另外,還有可能在信號中引入假剪輯無聲。在實際實施例中,具有與剪輯無聲類似的低功率的0.15秒的假剪輯無聲和30秒的間距將可能破壞廣告塊檢測。最好在已存在諸如語音無聲的無聲中插入假剪輯無聲。在那種情況下,一般用戶很難注意到它們。
算法檢測視聽素材中的廣告塊并標(biāo)記其邊界。接下來,在任何類型的處理,比如瀏覽、自動片尾創(chuàng)建、編輯或簡單重放期間,能夠跳過廣告塊。這種功能能夠被集成到多種類型的存儲系統(tǒng)中,并具有非常低的附加成本。能夠在數(shù)據(jù)采集期間實時地或離線地將此功能應(yīng)用到存儲素材中。
應(yīng)該注意,上述實施例用于說明而非限制本發(fā)明,本領(lǐng)域的技術(shù)人員將能夠設(shè)計出許多備選實施例,而不背離所附權(quán)利要求的范圍。在權(quán)利要求書中,任何放置于括弧中的標(biāo)號都不應(yīng)被理解為限制該權(quán)利要求。單詞“包含”不排除權(quán)利要求中所列的那些以外的部件或步驟的存在。本發(fā)明可以借助于包含一些分立部件的硬件、以及一個合適程序設(shè)計的計算機(jī)來實現(xiàn)。在裝置權(quán)利要求中列舉了一些裝置,這些裝置中的一些可以用同一個硬件實施。起碼的事實是在相互不同的從屬權(quán)利要求中敘述的某些措施并不表示不能有利地使用這些措施的組合。
權(quán)利要求
1.一種傳送節(jié)目的方法,所述節(jié)目至少包括音頻信號,所述方法包括檢測所述音頻信號中具有相對低的信號功率電平的時間間隔,以及在所述時間間隔中引入附加無聲,其中所述附加無聲比所述時間間隔短,并且在所述時間間隔期間所述附加無聲的信號功率電平小于所述音頻信號的信號功率電平。
2.一種用于傳送節(jié)目的發(fā)射機(jī),所述節(jié)目至少包括音頻信號,所述發(fā)射機(jī)包括用于檢測所述音頻信號中具有相對低的信號功率電平的時間間隔的裝置,以及用于在所述時間間隔中引入附加無聲的裝置,其中所述附加無聲比所述時間間隔短,并且在所述時間間隔期間所述附加無聲的信號功率電平小于所述音頻信號的信號功率電平。
3.一種節(jié)目,至少包括音頻信號,所述音頻信號包括出現(xiàn)在具有相對低的信號功率電平的時間間隔中的附加無聲,其中所述附加無聲較短并且其信號功率電平在所述時間間隔期間小于所述音頻信號的信號功率電平。
4.一種存儲媒體,在其上存儲了如權(quán)利要求3所述的信號。
全文摘要
在局部信號功率低于給定固定或相關(guān)閾值時檢測無聲,局部信號功率低于給定固定或相關(guān)閾值的持續(xù)時間在第一范圍內(nèi),并且信號功率下降/上升速率和局部功率偏移中的至少一個參數(shù)在各自的另一范圍內(nèi)。本發(fā)明還涉及在接收機(jī)(1)中利用這樣的無聲檢測。
文檔編號H04N5/44GK1612607SQ20041009568
公開日2005年5月4日 申請日期2002年5月10日 優(yōu)先權(quán)日2001年5月11日
發(fā)明者A·斯特拉, J·A·D·尼斯瓦德巴, M·巴比里, F·斯尼德爾 申請人:皇家菲利浦電子有限公司