專利名稱:搜索和記錄媒體信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一個用于記錄可能包含不需要的信號成分的媒體信道中的有限時間信號序列的方法和系統(tǒng)。例如,本發(fā)明可用于記錄無線電播送中的音樂。
背景技術(shù):
自從無線電和電視技術(shù)最初被開發(fā)出來以后,就開始流行記錄無線電和電視上的音樂和其他播送。其例子可包括歌曲、電影和音樂事件。記錄被制作得既能保存還能重復(fù)欣賞一段特定的被欣賞的播送,同時不必限于只能在播送時收聽/觀看。記錄(例如記錄來自無線電播送的音樂)的一個問題是大部分情況下聽眾不知道將播送哪首歌。在許多情況下,在意識到某首歌曲應(yīng)該從開始就被記錄時,該歌曲已經(jīng)被播放了一會兒了。此外,如果不知道播送時間,為了一首特定歌曲留意無線電廣播或為了一部特定的電影而觀看是很耗時的。
隨著CD、DVD和其他存儲媒介上的音樂和電影的價格的增長,獲得這些娛樂的新的較便宜的替換方法已經(jīng)被開發(fā)出來?,F(xiàn)在互聯(lián)網(wǎng)在或多或少合法或不合法地傳播不同文件格式的音樂中扮演著更大的角色。尤其地,音樂和電影以諸如MP3等格式被復(fù)制并對互聯(lián)網(wǎng)上的一般公眾可用。具有搜索引擎可使用戶獲得免費音樂的主頁的巨大的用戶數(shù)量顯示了對免費音樂的興趣;這種主頁的一個例子是Napster.com。
同樣有趣地注意到,很大一部分收聽音樂的人對于正在收聽哪個藝術(shù)家的音樂所知甚少,只是收聽播送混合的藝術(shù)家的音樂的無線電臺,他們并不是總認識這些藝術(shù)家。消費者對于來自特定流派的音樂比對于來自特定藝術(shù)家的音樂更感興趣也表現(xiàn)在對于具有混合樂團/藝術(shù)家的音樂CD的增長的興趣上。
專利申請DE19810114說明了一個用于在選定的無線電信道上對播送的音樂進行搜索并匹配先前存儲的音樂部分(稱為關(guān)鍵字),以便當這些關(guān)鍵字與播送的歌曲匹配時自動記錄選定的歌曲。對于每首將被搜索和記錄的歌曲,以歌曲開始的一部分的形式出現(xiàn)的起始關(guān)鍵字和以歌曲的結(jié)束部分的形式出現(xiàn)的終止關(guān)鍵字被存儲在收音機的一個存儲器中。那些預(yù)先選擇的關(guān)鍵字與多個無線電信道上播送的每種東西進行比較,當發(fā)現(xiàn)一個關(guān)鍵字時,則中間部分被記錄。也可能通過存儲類別關(guān)鍵字來搜索某種特定類型的音樂,用于匹配和記錄特定音樂類別,如流行音樂、搖滾音樂、古曲音樂和其他類型的音樂。
這種記錄音樂的方法的一個缺點是只有被預(yù)先存儲在諸如一張CD上的先前選擇的以所謂音樂關(guān)鍵字的部分的形式出現(xiàn)的音樂能夠與無線電信道進行匹配以記錄所需的音樂。不可能從收音機播放的任何歌曲中提取一個或多個關(guān)鍵字用于連續(xù)地與無線電信道進行匹配,使聽眾能夠自動獲得該歌曲的完整長度的版本。另一個缺點是不可能完整記錄沒有不合需要的信號成分的音樂,因為關(guān)鍵字之間的任何東西都被記錄,這意味著不合需要的信號成分,如談話和由于劣質(zhì)播送而引起的失真會被包括在音樂中。在無線電播送中無線電廣播中的談話者或廣告打斷音樂的情況是很常見的。
發(fā)明內(nèi)容
本發(fā)明旨在通過提供一個用于搜索和記錄媒體信道中的所需源材料的過程和裝置來解決上述問題,其中所述源材料包含不合需要的信號成分,其中同樣的源材料在相同的信道或不同的信道中至少被播送兩次。一段源材料可以是一首歌曲,一部電影或者其他任何有限時間的能夠被視為與其他材料分離的東西。尤其地,如果需要,信號被連續(xù)緩沖在至少一個媒體信道上的接收部件中的存儲器中。下一步可包括通過一個連接到接收部件的激活部件識別和選擇所需的源材料。從這個所需的源材料中將取出一個片段部分或一個片段表示作為搜索關(guān)鍵字。在執(zhí)行本發(fā)明一個版本中,裝置也可自動選擇搜索關(guān)鍵字。然后位于搜索關(guān)鍵字周圍的媒體信號可被存儲在一個存儲器中。搜索關(guān)鍵字與存儲的其他媒體信號或當前播送的媒體信號相比較。如果檢測到搜索關(guān)鍵字第二次出現(xiàn),則比較在時域上與搜索關(guān)鍵字相連的信號部分。通過比較發(fā)現(xiàn)充分相同的信號序列被識別為屬于相同的源材料。通過識別第一信號片段和第二信號片段之間的公共片段可以找出公共部分的開始和結(jié)束,從而找出源材料的全部或部分的開始和結(jié)束。這些公共片段可被存儲以便將來使用。
下一步可重復(fù)上面提到的檢測搜索關(guān)鍵字、在存儲器中存儲以及比較媒體信號,其中被識別為來源于相同源材料的信號片段可補充先前發(fā)現(xiàn)的公共片段。這將產(chǎn)生比最初獲得的更長、更完整和質(zhì)量更高的源材料片段。
重復(fù)將被一個終止閾值所終止,從而一段可接受的具有足夠質(zhì)量的長的公共片段已被識別并存儲在最終存儲器位置,以便將來播放。
本發(fā)明為用戶提供了一種獨特的連續(xù)獲得諸如音樂和電影等源材料的記錄新方法。如果本發(fā)明被用于無線電播送,則本發(fā)明能夠連續(xù)記錄在無線電廣播上重復(fù)的所有歌曲,并將它們保存在一個播放列表中以便將來使用。此外,當本裝置的用戶聽到他希望記錄的歌曲時,用戶只需按下一個按鈕以自動獲得該歌曲的完整長度的記錄。本發(fā)明將辨別無線電廣播中的音樂、廣告和談話。
參考附圖以更好地理解本發(fā)明和說明實現(xiàn)本發(fā)明的一種方法,其中
圖1示意性地說明了創(chuàng)建音樂的一個片段或一個片段表示的一個搜索關(guān)鍵字的過程,該音樂被存儲在一個存儲器中,用于比較和匹配諸如無線電信道上的相同音樂;圖2說明了一個用于通過使用存儲的搜索關(guān)鍵字識別音樂的過程的例子;圖3說明了如何通過連續(xù)匹配搜索關(guān)鍵字和在諸如無線電信道上播送的音樂來從重復(fù)的檢測、比較和存儲基本相同的音樂序列中創(chuàng)建更完整的音樂的一個例子;圖4例示了一個用于創(chuàng)建更多搜索關(guān)鍵字的過程的例子;以及圖5顯示了一個在使用第一搜索關(guān)鍵字匹配和檢測后創(chuàng)建附加搜索關(guān)鍵字的過程的一個例子。
具體實施例方式
以下是一個用于搜索和記錄包含不合需要的信號成分的媒體信道中的源材料的過程和裝置,其中相同的源材料在相同的媒體信道或不同的媒體信道上被播送至少兩次。該方法辨別需要的源材料和不合需要的源材料,如談話、廣告和失真。源材料的例子可以是音樂、電影或類似的東西。在本發(fā)明中采用在一個無線電播送中搜索和記錄暢銷歌曲作為說明性例子。要理解的是本發(fā)明不限于識別和記錄暢銷歌曲;它也可被用于電影、音樂電視和其他類型的源材料。搜索和記錄可通過一個重復(fù)過程完成,該過程包括查找、比較和存儲搜索關(guān)鍵字指示的來自將被記錄的源材料的信號片段。
根據(jù)本發(fā)明,用戶可通過使用本方法和裝置,在任何時刻選擇記錄當前在媒體信道上播送到接收部件的源材料。在執(zhí)行本發(fā)明的一種方法中,用戶也可使源材料自動從媒體信道上被記錄。裝置將自動識別整個源材料或部分源材料的開始和結(jié)束,并將這些部分保存以便將來使用。
源材料的一個例子可以是一首在一個無線電信道上播送到一個收音機的暢銷歌曲。通過使用此方法,用戶不必再進行手工勞動,一段時間后就可獲得存儲在裝置中的該暢銷歌曲的高質(zhì)量完整長度的版本。用戶可以在播放歌曲的任何時刻僅通過按下一個按鈕來開始記錄其完整版本。通過使用本發(fā)明的方法,裝置還可自動提取無線電播送中的音樂,并單獨記錄每首歌曲。從而使得裝置用戶擁有在無線電廣播中播放的單首音樂的連續(xù)更新的列表。本發(fā)明為本發(fā)明的用戶提供了至少兩種獲得音樂的獨特方法。一種方法是在聽到所需的歌曲時按下按鈕,另一種方法是讓裝置自動記錄全部歌曲并將它們保存在一個播放列表中。
在媒體信道上被發(fā)送到一個接收元件,如收音機、電視機、PC或類似裝置的媒體信號,如無線電播送和電視播送,被臨時存儲在一個或多個緩沖存儲器中。在本發(fā)明的裝置的緩沖存儲器中,較早存儲的媒體信號將被最新播送的一個或多個信道的媒體信號連續(xù)替換。媒體信號可被用戶訪問,用戶可激活裝置。
通過這種連續(xù)緩沖和將媒體信號臨時存儲到一個或多個存儲位置、緩沖存儲器,并調(diào)整為諸如5天的臨時存儲期,則可能在某時刻注意到記錄了完整的源材料,如下面詳細說明的。甚至當用戶在源材料播送末期才決定記錄時,也可能進行記錄。
當用戶或裝置指示要記錄某個源材料時,在該時間點的媒體信號的一個片段或一個片段的表示可被選擇為一個搜索關(guān)鍵字。搜索關(guān)鍵字也可以來自整個源材料。
裝置也可保存被記錄的媒體信號中搜索關(guān)鍵字周圍充分長的部分;對于暢銷歌曲,充分長度可以是激活時刻之前和之后的5分鐘。此過程為用戶提供了當時播送的源材料的整個播送。記錄功能的激活可通過按下一個按鈕、轉(zhuǎn)動一個轉(zhuǎn)輪或激活一個手柄或接收機上的其他任何部件完成。激活也可由裝置自動完成。這種自動激活可被隨機觸發(fā)、周期觸發(fā)或被播送的某種可識別的特征觸發(fā)。在無線電播送中的音樂的例子中,此方法使裝置能夠自動建立已經(jīng)在無線電廣播中播放的音樂列表。音樂可像在普通CD播放器上那樣存儲,使用戶可以一首接一首地收聽歌曲。
激活時刻之前和之后的被記錄部分的必要長度可通過估計該種類型的源材料的可能長度來確定。對于暢銷歌曲,多數(shù)情況下激活時刻前后的5分鐘應(yīng)該是足夠的。存儲在存儲器中的源材料的媒體信號播送可能包含不合需要的信號成分。例如,在無線電播送中,至少在歌曲開始或結(jié)束時,談話打斷音樂的情況是很常見的。雖然多數(shù)時候一段音樂在無線電廣播中播放時,其大部分是在無打斷的情況下播送的,但有時電臺的音樂節(jié)目主持人甚至可能在音樂播放的中間打斷。
另一個問題是不知道在存儲的記錄中源材料何時開始和結(jié)束。本發(fā)明提供了一種如何在一個連續(xù)的媒體信號中找到源材料的開始和結(jié)束的解決方法,例如在連續(xù)的無線電播送中找到歌曲的開始和結(jié)束的方法。如果裝置自動激活,它可連續(xù)記錄在無線電廣播中重復(fù)的音樂,從而能夠自動從無線電廣播中保存歌曲。
圖1說明了一個用于創(chuàng)建源材料的一個片段或該片段的一個表示的一個搜索關(guān)鍵字100的過程。媒體信號10可能是例如一段音樂12,它可能包含不合需要的信號成分102、104和其他在歌曲12前后的不合需要的片段103、105。在圖1中所需的源材料12由粗線標記。片段12具有一個開始13和一個結(jié)束15。搜索關(guān)鍵字100可被用于檢測相同的源材料(如相同的音樂)的先前的播送和將來的播送。檢測可通過將搜索關(guān)鍵字的內(nèi)容與存儲在緩沖存儲器中的或?qū)韺⒈徊ニ偷拿襟w信號的片段進行匹配和比較來完成。檢測所需源材料的先前或?qū)淼牟ニ涂赏ㄟ^直接匹配搜索關(guān)鍵字實現(xiàn)。也可通過識別可能包含源材料的播送的片段然后以一種或多種方法和以一個或多個步驟檢查這些部分以測試它們是否實際來自所需的源材料的過程實現(xiàn)。媒體信號10宜長于所需的源材料12,以確保整個源材料12最終被記錄。
在保存部分媒體信號用于將來的比較時,媒體信號10應(yīng)在搜索關(guān)鍵字前后延伸一段長度足夠容納整個源材料的時間。例如,多數(shù)流行音樂短于5分鐘,并且由于記錄激活可在播放該音樂的任何時刻發(fā)生,因此最好在激活時刻前后各保存5分鐘,以確保捕捉了整段音樂。這樣媒體信號10可為約10分鐘。當然,可根據(jù)需要選擇任何時間段。
當檢測到搜索關(guān)鍵字100的第二次充分相同的實例時,在時域上與搜索關(guān)鍵字相連的信號片段被比較。通過它們自己之間的比較發(fā)現(xiàn)為充分相同的信號片段被識別為來自相同的源材料12。通過在第一信號片段和第二信號片段之間識別公共片段,可以找到公共部分的開始和結(jié)束,從而找到源材料的全部或部分的開始和結(jié)束。
如下文所說明的,本發(fā)明的重復(fù)過程通過復(fù)制同一源材料已經(jīng)播送或?qū)⒁ニ偷陌姹局械奈幢粨p壞的干凈信號片段來逐步替換這些被損壞的片段102、104,從而把這些信號片段的破壞減少到最小。本發(fā)明一個重要假設(shè)是對于同一源材料的每次播送,所需源材料的接收是充分相同的,例如,一首歌曲每次在無線電廣播播送時,其接收是接近相同的。而不合需要的信號片段,如談話、廣告和失真,在相同的歌曲每次被播放時通常是不同的。
圖2顯示了一個檢測一個媒體信號20的第二片段的過程,該媒體信號20包含與片段10充分相同的部分從而能夠被視為來自相同源材料,所述檢測通過匹配搜索關(guān)鍵字100和搜索關(guān)鍵字的第二相同或接近相同的實例200。應(yīng)注意媒體信號20在所需的源材料22開始處具有較短的被損壞片段202,該源材料具有一個開始24和一個結(jié)束26。但是,信號20具有與信號10的片段104相比相對較長的被損壞片段204。兩個媒體信號相同的部分是107和109之間的時間,這些可被保存為公共片段。本發(fā)明的重復(fù)過程的一個目的是利用相對較短的失真片段202但忽略相對較長的片段204。
如上面所提到的,媒體信號宜連續(xù)的緩沖在緩沖存儲器中。通過識別搜索關(guān)鍵字100與該搜索關(guān)鍵字相同或接近相同的第二實例200而檢測到的媒體信號20還可通過將測試擴展到超越搜索關(guān)鍵字的范圍(可能采用其他方法)來進一步測試其相似度。當給出足夠證據(jù)表明它們來自相同的源材料時,片段20可被復(fù)制到一個存儲器或者存儲器中或者它的開始或結(jié)束點被存儲。此操作可通過復(fù)制搜索關(guān)鍵字的第二實例200之前的足夠長的片段和搜索關(guān)鍵字的第二實例200之后的足夠長的片段來完成。此操作防止了該可能用于進一步處理以獲得所需源材料的復(fù)本的信號片段在緩沖存儲器被新的媒體信號再次填充時消失。在本發(fā)明的一個實施方式中,裝置不是在存儲器間移動媒體信號,而是將媒體信號存儲在其原來的位置,并且在預(yù)定的時間內(nèi)不覆蓋它。
搜索關(guān)鍵字的識別和媒體信號的保存使得兩個的媒體信號(即媒體信號10、20)被存儲。媒體信號20與最初存儲的媒體信號10比較。兩個媒體信號10、20相同或接近相同的部分被看作不含有不符合需要的信號成分并因此被視作所需源材料的至少一部分。這可以是例如所需歌曲的一部分或全部,不包含干擾的談話或廣告。在這種情況下,信號10的片段106與信號20的片段206相同。公共片段將被保存以便將來使用,例如,以便將來收聽。片段106、206前后的媒體信號10、20不匹配或相同的片段被假定為表示不合需要的信號成分。尤其地,片段106可被存儲在存儲器中并通過將來的重復(fù)添加,直到所需的整個源材料12已被存儲在最終存儲器中或達到一個終止閾值。這樣,源材料12的片段106可用于播放,并且片段106具有一個識別的結(jié)束109和一個識別的開始107。
由于只有媒體信號中相同或充分相同的部分被識別,因此在片段106第一次被保存時,可能只有所需源材料12的較短的片段106被識別。如果用戶幸運的話,他或她可能在第一次發(fā)現(xiàn)搜索關(guān)鍵字的第二實例時獲得整個源材料,如整首歌曲。
在執(zhí)行本發(fā)明的一個較簡單的方法中,裝置僅完成一次過程。第一次發(fā)現(xiàn)的包含搜索關(guān)鍵字的復(fù)本的公共片段被用作識別源材料的開始和結(jié)束。此過程在下面的圖1和圖2中說明。本發(fā)明的這個較簡單的版本可能只將第一次識別的公共部分作為最終版本提供給裝置用戶,從而使用戶找到整個源材料的機率較小。
為了增加找到整個源材料(如無線電廣播上的整首歌曲12)的機率,上述過程被重復(fù)多次。這樣,檢測媒體信號、存儲檢測到的媒體信號在一個存儲器中以及比較媒體信號以找出匹配的公共片段的步驟可繼續(xù)。一個目的是通過將新匹配的片段添加到存儲最終存儲器中的信號片段106,來配對補充先前識別的媒體片段106的相同的媒體信號,從而檢測到更多公共片段。此重復(fù)導(dǎo)致越來越長的公共片段106存儲在最終存儲器中。
圖3說明了如何通過重復(fù)匹配媒體信號70的搜索關(guān)鍵字112、媒體信號80的片段703中的搜索關(guān)鍵字114和媒體信號90的片段705中的搜索關(guān)鍵字116這一過程而從中產(chǎn)生一個幾乎完整且無損壞的源材料110。媒體信號70包含所需的源材料702,它具有一個開始704和一個結(jié)束706。應(yīng)注意媒體信號70、80、90包含相同的源材料,搜索關(guān)鍵字112、114、116也是相同或接近相同的。片段118可被添加到存儲在最終存儲器中的公共片段中,因為信號80的片段120與信號90的片段122相同。同樣地,片段124可被添加到存儲在最終存儲器中的公共片段中,因為媒體信號90的片段126與媒體信號70的片段128相同。如果開始點130和結(jié)束點132表示公共片段的開始和結(jié)束,則片段110幾乎覆蓋了整個源材料702。丟失的片段僅為信號片段702的開始704處的片段133和結(jié)束706處的片段135。過程可以以這種方式繼續(xù)重復(fù),直到已經(jīng)記錄了整個源材料。
為防止包括比較和添加過程的重復(fù)搜索過程永遠繼續(xù),可設(shè)置終止閾值。這可以是預(yù)定的重復(fù)搜索過程的重復(fù)步驟數(shù)目。另一種替換方式可為使用媒體信號的一個已知和可識別的特征作為過程的終止。重復(fù)的終止也可在多個添加的公共片段的長度比某個值小時被觸發(fā),因為這種情況表明可能不會有更多源材料的片段被找到。也可設(shè)置為當不管進行了多少次相同源材料的識別都沒有另外的公共片段被添加時被停止。
當一個公共片段第一次被發(fā)現(xiàn)時,該公共片段可被存儲在一個最終存儲器中,并準備被用戶播放。這將為用戶提供重復(fù)欣賞公共片段的選項,例如,通過將一個音樂再現(xiàn)裝置連接到最終存儲器重復(fù)欣賞一首歌曲。隨著時間過去,可向每首歌曲添加歌曲的新的部分,從而為聽眾提供所需音樂的更長和更完整的版本。
在執(zhí)行本發(fā)明的另一個較簡單的方法中,裝置完成上面說明的如圖1和圖2所示的識別過程,并完成如上面和圖3所說明的重復(fù)過程,但裝置不是將公共片段加在一起,而只是使用源材料的可能的最長的識別部分,即最長的公共片段,作為最終版本。本發(fā)明的這個較簡單的版本使裝置用戶找出整個源材料機率較小,但此裝置可能更容易開發(fā)。
圖4說明了創(chuàng)建媒體信號30中的多個搜索關(guān)鍵字300、310、320的一個例子。此方法在媒體信號包含大量不合需要的信號成分時尤其有用。此方法增加了搜索關(guān)鍵字300、310、320中至少一個不包含不合需要的信號成分的機率。
在所說明的例子中,只有搜索關(guān)鍵字310不包含不合需要的信號成分,并能夠當以后在存儲器中發(fā)現(xiàn)源材料31或重新播送源材料31時與一個相同的搜索關(guān)鍵字匹配。搜索關(guān)鍵字300和320不太可能在以后的媒體信號中匹配,因為在以后的播送中不合需要的信號成分不太可能以完全相同的方式重復(fù)。過程可被設(shè)計為檢測相同信號的補充片段對,以便通過將這些附加的公共片段添加到存儲器中的公共片段來完成被識別的公共片段。
此方法提高了發(fā)現(xiàn)并識別在存儲器中或下次播送的所需源材料的未損壞部分的機率。此方法還加速了發(fā)現(xiàn)和獲得可接受長度的所需源材料31的過程。整個過程可以以上面說明的重復(fù)步驟重復(fù)。
圖5顯示了一個用于在匹配和檢測到媒體信號40的第一個搜索關(guān)鍵字400之后創(chuàng)建媒體信號50的片段501中的搜索關(guān)鍵字500、510、520的過程。該過程通過將三個搜索關(guān)鍵字510、500和520與媒體信號60進行比較繼續(xù)。搜索關(guān)鍵字520與搜索關(guān)鍵字620充分相同,從而表明片段間的一個匹配。如上文所指出的,媒體信號40、50、60可能包含相同的源材料,但三個不同的媒體信號具有不同量的干擾源材料的不合需要的信號成分,如談話和廣告。這提供了比較存儲的三個至少包含部分相同源材料的版本40、50、60的機會。由于在搜索關(guān)鍵字400和搜索關(guān)鍵字500之間有匹配,因此第一公共片段402可保存在最終存儲器中。上述重復(fù)將在使用搜索關(guān)鍵字發(fā)現(xiàn)其他公共片段時將公共片段添加到公共片段402之前和之后。
由于在搜索關(guān)鍵字400和搜索關(guān)鍵字500之間有匹配,媒體信號40被假定為與媒體信號50至少有一部分來自相同的源材料。不同之處在于兩個信號均具有不同量的不合需要的信號成分。一個重要的特征是由于在搜索關(guān)鍵字520和搜索關(guān)鍵字620之間有匹配,因此媒體信號40、50被假定為與媒體信號60具有公共部分,從而這些媒體信號來自相同的源材料。這意味著媒體信號60的信號片段602與媒體信號40的片段404是充分相同的,從而此公共片段能被添加到最終存儲器中的公共片段中。整個過程可以以上述重復(fù)步驟重復(fù)。
本發(fā)明的重復(fù)方法的一個目的是在最終存儲器中獲得源材料的一個不包含任何不合需要的信號片段(如談話、廣告、失真等)的完整長度版本。
在本發(fā)明的一個替換實施方式中,該方法借助于一個是源材料的一個選定片段或該片段的表示的搜索關(guān)鍵字來識別源材料,源材料是例如無線電廣播中的暢銷歌曲。例如,搜索關(guān)鍵字可表示所需的暢銷歌曲的一個很短的片段或該片段的表示。所需的源材料可通過識別搜索關(guān)鍵字和媒體信號之間的相似度來識別。
有多種可能的方法可用來確定搜索關(guān)鍵字和媒體信號片段之間的相似程度。例如,當媒體信號的一個片段與相同的或其他的媒體信號的其他片段卷積時,可使用相關(guān)來獲得表達兩個有關(guān)片段間的相似程度的值。該值越大,則存在越高的相似度,從而它們來自相同的源材料的機率越高。
一般地,正確的匹配,即被調(diào)查的片段實際上來自取出搜索關(guān)鍵字的相同的源材料的相同的時間段時,相關(guān)過程中涉及的片段越長,則將產(chǎn)生比周圍的錯誤時間段更清晰的具有更高的匹配值的模式,從而在相關(guān)過程中使用較長的片段是有利的。但是,較長的片段也需要較多的處理功率,因此對于可使用的片段長度有一個實際限制。
可使用其他方法確定媒體信號的片段之間的相似。在一種稱為消去(cancellation)的方法中,搜索關(guān)鍵字正如在相關(guān)方法中一樣是一個媒體信號的一個片段,然后它與媒體信號的其他片段進行比較。首先對將要對相似度進行比較的搜索關(guān)鍵字和媒體信號的片段的增益進行歸一化以便他們具有幾乎相同的增益。然后從來自一個片段的抽樣中減去來自另一個片段的抽樣,這些差的絕對值被加起來獲得最終的消去值。如果片段是完全相同的,則得到的值將為零。在實際應(yīng)用中,正確的匹配將產(chǎn)生非常低的消去值。此方法被稱為消去是因為如果片段是相同的則它們將彼此消去,或者如果它們非常相似則將幾乎彼此消去。
對于消去也和對于相關(guān)一樣,在過程中涉及越長的片段則將產(chǎn)生越清晰的準確匹配。
在過程中使用較長的片段對上面提到的兩個方法相關(guān)和消去都是有益的。由于由處理能力的限制引起的對于可使用的片段長度的實際限制,因此已設(shè)計出相關(guān)和消去的修改版本。這些方法只是不包含過程中的每個抽樣,而是取每第N個抽樣,其中N可以是1以及1以上的任何數(shù)字。N甚至可以不是一個固定的值,甚至可以在一個處理值的計算內(nèi)的不同步驟之間發(fā)生變化。包含媒體信號的每第N個抽樣的方法可被用于大多數(shù)其他用于識別搜索關(guān)鍵字和媒體信號的一個片段之間的相似性的方法。不同處理值的步驟序列不必相同。在每個處理值被計算時,應(yīng)對搜索關(guān)鍵字和被調(diào)查的片段采用相同的步驟。這些新設(shè)計的方法被稱為修改后的相關(guān)和修改后的消去。
這些修改后的方法在搜索匹配和搜索源材料的開始和結(jié)束時可給出非常清晰的結(jié)果,但不使用過程中的每個抽樣的代價是偏離準確匹配的平均噪聲水平將比包含所有抽樣時的噪聲水平高。
在執(zhí)行本發(fā)明的一種方法中,裝置可通過將歸一化其各自的增益作為比較過程的一部分來解決以不同增益播送的媒體信號的比較問題。增益的歸一化也可以作為記錄媒體信號的過程的一部分來完成。如果用來確定搜索關(guān)鍵字和媒體信號之間的相似程度的比較方法為相關(guān)方法或其他任何結(jié)果依賴于信號鏈的增益的方法,則一個補償增益變化的方法可用來歸一化測量。有幾種可能的方法,如在音頻的情況下,使用無線電臺經(jīng)常使用的一種音頻壓縮機來防止發(fā)射機的過載,同時發(fā)出盡可能大的音響。
本發(fā)明的一個具有許多優(yōu)點的特別方法是用感興趣的片段中的抽樣的絕對值之和來歸一化被計算的相似值。此方法可以有效地消除不同的信號增益的影響,例如當一個DJ在兩個不同的場合以不同的增益設(shè)置在混合控制臺中播放相同的歌曲時。
當相關(guān)或修改后的相關(guān)被用作確定搜索關(guān)鍵字片段和媒體信號的片段之間的相似度的方法時,預(yù)先知道準確匹配時的相關(guān)值將為多高是有益的。由于考查的是由于來自相同源材料而幾乎相同的媒體信號,因此可能預(yù)先知道準確匹配時預(yù)期的片段將是什么樣子的。準確匹配必須與搜索關(guān)鍵字片段非常相似。因此,只要通過將搜索關(guān)鍵字片段與其本身相關(guān)并借助于搜索關(guān)鍵字片段的抽樣的絕對值的移動平均來歸一化所得的結(jié)果,就可能預(yù)先計算出準確匹配的預(yù)期的相關(guān)值。這個值可以被稱為T值。當尋找可能為準確匹配的結(jié)果的相關(guān)值時,一個搜索標準可以是相關(guān)值與預(yù)期的T值接近。
T值的另一個用處在于試圖確定相同源材料的記錄質(zhì)量時。當幾個信號片段被發(fā)現(xiàn)確定為來自相同的源材料時,則可能使用T值指示有關(guān)其關(guān)于噪聲、干擾和失真的相對質(zhì)量的一些東西。如果不僅在準確匹配時計算媒體信號的T值,則部分或整個片段上的連續(xù)T值都被計算。此片段可以與來自相同源材料的另一片段相關(guān)并比較產(chǎn)生的相關(guān)值和相應(yīng)的T值。這里必須注意的是要被比較的信號片段應(yīng)在時間上對齊并在增益上歸一化,并且在T值的計算中的抽樣數(shù)目應(yīng)該與相關(guān)中的抽樣數(shù)目相同。如果片段是相同的,則先前計算的T值應(yīng)與后來計算的相關(guān)值完全相等。由于假定兩個片段都來自相同的源材料,因此任何對預(yù)期的T值的偏離都可能是由于某種不合需要的信號變化產(chǎn)生的。對預(yù)期的T值偏離越大,則片段之間的差異可能越大。也可假定如果相關(guān)值接近T值,則兩個片段具有高質(zhì)量,因為不太可能損壞兩個片段的隨機擾動是相同的。
可比較多個片段獲得其相對質(zhì)量的指示。對于三個片段,可比較片段1和2,然后1和3,最后2和3。這種確定媒體信號的片段的質(zhì)量的方法可用于設(shè)置何時一個片段將被作為足夠好的片段接受的標準,它還能用作選擇具有相似質(zhì)量的片段。后者在來自相同源材料的不同記錄的片段被拼接在一起以形成源材料的較長的連續(xù)片段時是很重要的。在播放拼接成的較長的片段時,突然注意到質(zhì)量的跳躍對用戶而言可能是一種干擾。
當使用消去作為確定媒體信號的片段之間的相似度的方法時,則匹配時的預(yù)期值可能接近零。相似程度決定了消去值與零的距離。消去可用于確定何時片段是相似的,并且該方法也可以用于在片段被確定為來自相同的源材料時,確定片段之間的相對質(zhì)量。雖然片段在增益上被歸一化并且在時間上準確地對齊,但來自相同源材料的相同部分的兩個片段被噪聲和其他干擾污染得越多,則預(yù)期消去值將越多地偏離零。
在一個替換方式中,媒體信號的片段的搜索和匹配僅在可用數(shù)據(jù)的子集和/或該數(shù)據(jù)的變換上執(zhí)行。這可以通過多種方法完成?;蛘哐b置在創(chuàng)建搜索關(guān)鍵字時僅使用組成該材料的抽樣的小部分。另一種方法是裝置可將媒體信號記錄在兩個或多個單獨的文件中,一個或多個搜索文件和一個或多個用于將來使用(如用于播放)的文件。搜索文件可能是媒體信號的記錄,但具有較低的帶寬,或者可能是僅包含特定頻率區(qū)間的文件。搜索文件也可以是記錄的媒體信號的表示。搜索文件可用于創(chuàng)建搜索關(guān)鍵字,也可用于搜索搜索關(guān)鍵字的第二次出現(xiàn)。搜索文件也可以用于查找源材料的開始和結(jié)束。對于在無線電廣播上播送的音樂,搜索文件可以是較低抽樣率(如,6kHz)的媒體信號的單獨記錄。此搜索文件可用于創(chuàng)建搜索關(guān)鍵字和查找搜索關(guān)鍵字的其他出現(xiàn)以及查找源材料的開始和結(jié)束。然后此開始和結(jié)束信息可被用于在完整質(zhì)量的記錄中查找源材料的開始和結(jié)束。使用單獨的搜索文件的一個原因是減小對處理功率的需要。
在執(zhí)行本發(fā)明的另一種方法,裝置創(chuàng)建一個搜索關(guān)鍵字并在存儲在一個硬盤驅(qū)動器上的文件中搜索它。如果只有處理器速度足夠快,則限制裝置速度的因素是訪問存儲在硬盤驅(qū)動器上的媒體信號的速度。其缺點是硬盤驅(qū)動器必須被連續(xù)地訪問,從而連續(xù)地耗用功率。在執(zhí)行本發(fā)明的另一種方法中,裝置將在播送媒體信號時連續(xù)創(chuàng)建多個搜索關(guān)鍵字,并同時搜索多個搜索關(guān)鍵字。由于搜索可在裝置的RAM存儲器中完全完成,因而此方法減少了訪問來自最終的硬盤驅(qū)動器的信息的需要,從而節(jié)省了裝置的功率。例如,通過從硬盤驅(qū)動器或播送中下載一小時音樂或搜索文件至RAM存儲器上,并用多個搜索關(guān)鍵字搜索RAM存儲器,則硬盤獲得了休息,從而裝置可節(jié)省電池功率,并且工作得更快。
在執(zhí)行本發(fā)明的另一方法中,裝置可以一種分級的方法執(zhí)行信號片段的搜索和匹配,首先選出數(shù)個可能的匹配,然后用更精確的方法從可能的匹配中找出準確的匹配。例如,完成此方法的一種方法可為首先計算搜索關(guān)鍵字和媒體信號之間的相關(guān),識別具有與搜索關(guān)鍵字足夠高的相關(guān)的媒體信號的片段,在完成此操作后以另一種更精確的方法測試識別的片段。所述其他方法可為使用更長的搜索關(guān)鍵字或某種完全不同的方法。
用于查找源材料的復(fù)本的搜索關(guān)鍵字可以以不同的方法組成。在執(zhí)行本發(fā)明的一種方法中,所使用的搜索關(guān)鍵字是媒體信號的較短的片段,如0.1-2秒長的片段。在執(zhí)行本發(fā)明的另一種方法中,搜索關(guān)鍵字可為片段的一個表示,例如通過對該片段作一個數(shù)學(xué)變換或通過提取某些說明性特征。在執(zhí)行本發(fā)明的另一種方法中,搜索關(guān)鍵字長得多,并且也可用來結(jié)合壓縮或使用程序或算法說明一個媒體信號。不同類型的搜索關(guān)鍵字也可以結(jié)合在一起使用以便更好地查找所需的媒體信號。
在比較過程中也可以不只使用抽樣,即媒體信號的瞬時幅度值,還可以為音樂編索引以便短的信號片段可被存儲在該片段具有某些將該片段與其他音樂區(qū)別開來的特征的位置。例如,一首歌曲可能具有一個獨特的鼓樂片段,只有一部分鼓樂片段被存儲并與其他媒體信號比較,直到找到相同的鼓樂片段。一旦此鼓樂片段被再次播放,則該片段被存儲在一個編入索引的存儲器中,以便不必搜索整個存儲器而只搜索存儲器編入索引的部分。鼓樂片段可通過某種數(shù)學(xué)算法進行變換以便減少必要的存儲要求或促進匹配。
在執(zhí)行本發(fā)明的另一種方法,搜索和比較存儲的搜索關(guān)鍵字與當前的媒體信號或記錄的播送的步驟可通過連續(xù)搜索特定頻率完成。例如,搜索關(guān)鍵字可能不包含整個頻率寄存器,而只包含特定的預(yù)定頻率。當用于無線電播送中的音樂時,搜索關(guān)鍵字可能僅包含30-31Hz和13000-13100Hz的頻率。30-31Hz的信號可用于識別在一定時間間隔內(nèi)的一定長度的歌曲中的相同的鼓聲。類似地,13000-13100Hz信號可用于識別在特定時間間隔和長度中的相同的吉它聲。因此搜索過程可通過只搜索無線電播送的30-31Hz信號來完成。當在存儲器中發(fā)現(xiàn)在30-31Hz頻率上的匹配信號時,則搜索和比較13000-13100Hz頻率。如果媒體信號在13000-13100Hz頻率具有相同的吉它聲,則它被假定為相同的媒體信號。
與搜索整個頻率范圍相比,僅比較頻率寄存器的特定部分可產(chǎn)生更佳的功率利用率。源材料的開始和結(jié)束也可通過比較少數(shù)頻率發(fā)現(xiàn)。只要信號片段的被比較頻率是充分相同的,則被比較的信號片段被認為是相同的。
搜索過程可能搜索媒體信號中識別被播送的源材料的嵌入碼。例如,在數(shù)字無線電播送中,可能發(fā)送代碼識別當前正在播放的音樂。某些CD包含識別每條磁軌的藝術(shù)家和歌曲的代碼。這種編碼信息可用于查找所需的歌曲。然后此信息可被一個過程所利用,用于查找歌曲的復(fù)本,定位其開始和結(jié)束,并剪切掉不合需要的信號成分。
為了快速查找源材料,例如在一個已經(jīng)記錄的無線電播送中查找一首歌曲,接收元件的存儲能力至少必須能夠存儲2-3小時的播送。對于標準MP3格式的音樂,這是存儲約100-200MB的音樂。存儲器也可以大得多以便能夠包含一段更長時間段中的多個不同的媒體信道。存儲器也可以包含裝置已發(fā)現(xiàn)的源材料的先前記錄。
搜索過程可由用戶在注意到其希望記錄的源材料時觸發(fā),或由裝置本身觸發(fā)。當裝置不被手動觸發(fā)的搜索請求占用時,它可以自動創(chuàng)建搜索關(guān)鍵字并執(zhí)行搜索以建立存儲在存儲器中的公共片段庫或列表。這些已經(jīng)在媒體信號中重復(fù)的公共片段的列表可于將來搜索或以后由用戶播放。這種自動搜索在無線電臺只播放有限數(shù)目的歌曲時尤其有用,例如一個播前40名的無線電臺。對于具有更多種音樂的電臺,需要搜索更大的緩沖存儲器,以查找重復(fù)的歌曲,但只要一首歌曲被重復(fù)則裝置將識別它并保存它。當用戶希望記錄一首歌曲時,裝置可能已經(jīng)進行了長時間的幾次重復(fù)了,以便聽眾不必等待所有重復(fù)的完成就可獲得整首歌曲。通過在已經(jīng)識別和保存的源材料之中開始搜索過程,搜索可能快得多,因為所需的源材料可能早已經(jīng)被裝置識別和保存了。
在以下發(fā)明的一個版本中裝置測試搜索關(guān)鍵字以確保其包含足夠的有用信息。例如,如果裝置本身已經(jīng)自動生成一個搜索關(guān)鍵字,則如果它位于播送中間的無聲部分,它可能沒有任何作用。這也可能在手動觸發(fā)搜索請求時發(fā)生。通過略微改變獲得搜索關(guān)鍵字的方法,可使搜索關(guān)鍵字盡可能唯一。這可使找到搜索關(guān)鍵字的匹配的機率更大。
提高搜索關(guān)鍵字的質(zhì)量的一種方法是測試幾個接近激活時刻的可能的搜索關(guān)鍵字,并選擇一個被認為最獨特的搜索關(guān)鍵字,獨特的意義是指對找到所需的匹配信號片段最有用。當搜索關(guān)鍵字在播送的無聲時刻被觸發(fā)時,提高搜索關(guān)鍵字的質(zhì)量的另一種方法是將搜索關(guān)鍵字的取出移動到無聲之前的時刻或之后的時刻。此方法使得裝置能夠獲得包含更多信息的搜索關(guān)鍵字。
當搜索關(guān)鍵字已和媒體信號的另一片段進行比較,并且如某種設(shè)置的標準所指示,它們來自相同源材料的相同部分的可能性很大時,則可發(fā)生識別過程的第二步驟。如果這實際上是一個準確匹配,則可假定通過在兩個片段中匹配時刻前后移動某段時間,并再執(zhí)行新的比較,可能信號仍然非常相似從而仍然來自相同的源材料。在片段中的某點,相似度將低于某個水平,則可假定已達到相似片段的部分的端點??梢砸韵嗨频姆椒ㄋ阉髁硪欢它c。
端點搜索可以以多種方法執(zhí)行??赏ㄟ^在片段上連續(xù)移動測試直到達到被視為可接受的最低相似水平來測試片段,該點被確定為一個端點。也可能從先前的比較點跳開一段特定的時間并再次測試,如果仍然視為足夠相似則重復(fù)此跳躍和測試直到相似水平低于某個點。然后可減小步長并逆轉(zhuǎn)跳躍方向。此新點被測試并再次減小步長。如果現(xiàn)在片段被視為足夠相似則變換新的跳步方向,或者如果片段被視為不足夠相似則新的跳步方向不變。繼續(xù)重復(fù)過程直到達到預(yù)定的最小步長,此點被視為端點。另一端點可通過相同的方法獲得。
由于被比較的片段可能來自不同的媒體播放器,也可能在不同的時間點獲得,因此其間可能有一定的速度差異。因此,不能假定當在片段中從先前比較的點跳開某個時間段時兩個片段之間的比較可確切地在新的點指示最大的相似度。應(yīng)在一個片段中的此點向前跳躍一段時間,然后從此點到理論點之后足夠靠后的點之間執(zhí)行比較,并注意在何處達到最高的相似度。更數(shù)學(xué)化的表達為,在一個片段中跳開時間tJUMP,并在另一片段中跳開tJUMP-M,其中M表示一個抽樣數(shù)目。然后對后一片段中的tJUMP-M周圍的部分和另一片段的tJUMP周圍的相同長度的部分進行比較。然后減小M并重復(fù)此過程直到M達到一個特定值,通常為-M,此時過程終止。
通過假設(shè)裝置容量和所涉及的其他可能影響記錄速度的變量,可以確定tJUMP處預(yù)期的匹配位置周圍的一個區(qū)間,該區(qū)間仍然因為充分接近而被接受,以表示該點處的片段仍然來自相同源材料,只要此點處的相似度也充分高。上述方法可被擴展以為我們提供另一種增加特定點處的片段來自相同源材料的概率的方法。第一種方法當然是根據(jù)某種方法計算相似度,如果該值比某個設(shè)定水平好,則它可能是一個準確匹配。第二種進一步確保此點的片段來自相同源材料的方法是注意實際達到最大相似度時與理論點在時域上的距離。例如,我們可以假設(shè)比較過程在此點之前的1000個抽樣開始,繼續(xù)到此點之后的1000個抽樣,并且先前已確定準確匹配必須出現(xiàn)在理論點之前或之后的10個抽樣之內(nèi)?,F(xiàn)在可以計算所有2000個可能的比較并注意在哪一點獲得最佳值。
如果此值在離理論點10個抽樣之內(nèi),則此點處的片段來自相同源材料的概率增加。兩個不相關(guān)的片段在此20個抽樣范圍內(nèi)將指示其最高相似度的概率為20/2000=0.01??煽吹嚼碚擖c周圍的搜索范圍越長,則越可以信任極限內(nèi)的最大相似點。
在已在設(shè)定的極限內(nèi)跳躍數(shù)步并發(fā)現(xiàn)足夠的相似度時,可減小極限以備將來的跳躍。這是由于從一步到另一步與預(yù)期點的偏差可能是相同的,當已確定預(yù)期偏差是多少時,則可能在此偏差周圍設(shè)定一個更窄的極限。裝置容量和影響片段的記錄速度的其他因素在短時間內(nèi)不太可能變化。這兩種方法,即測量相似程度和只接受在預(yù)期的時間點周圍的某個時間限內(nèi)具有最大相似度的點,可同時使用或單獨使用。
在以下發(fā)明的一個版本中,方法還包括一個計數(shù)器,它對部分或完全檢測到相同源材料的次數(shù)進行計數(shù)。也可以在識別到搜索關(guān)鍵字的第二次實例時計次數(shù)。本方法的一個應(yīng)用是一首歌曲被播放的次數(shù)越多,最終獲得的歌曲記錄的質(zhì)量較高以及幾乎整首歌曲被記錄的可能性越高。
在本發(fā)明的一個版本中,計數(shù)也可被用于生成源材料列表,該源材料列表根據(jù)源材料在某個時間段中在一個或多個媒體信道上被播放的次數(shù)排列。對于無線電廣播,該方法可用于創(chuàng)建某個或多個無線電臺上周播放最多的音樂的列表,并可根據(jù)該音樂的播放頻率對其進行排名。
在本發(fā)明的一個版本中,該方法也可生成基于用戶的選擇和偏好的列表。用戶在源材料被播放時識別它,激活裝置從而該源材料可被自動保存在聽眾選擇列表中。這可能是一個列表或多個對于不同源材料類型或用戶的列表;例如,對于無線電廣播,可能有一個硬搖滾列表,一個流行音樂列表以及裝置的主要用戶的一個朋友創(chuàng)建的一個列表。
在本發(fā)明的一個版本中,用戶也可以對媒體信道進行分類以便在相同格式媒體信道上播放的源材料被保存在相同的列表或庫中。例如,對于無線電廣播,一個庫可包含硬搖滾,它們來自用戶知道會播放該類音樂的無線電臺,另一個庫用于來自該類無線電臺的軟音樂,依此類推。
在執(zhí)行本發(fā)明的一個版本中,裝置也可以識別何時某個源材料的播放頻率較低并將這樣的源材料從列表刪除。例如,如果每次播放源材料之間的時間段超過指定時間,則源材料將被視為不那么流行從而從頂級列表中被刪除。
如先前所指出的,本方法可刪除特定的不合需要的信號成分,如廣告。例如,本方法可刪除短于一定時間段(如三十秒或一分鐘)的公共片段,因為多數(shù)廣告比所需的源材料短。裝置可識別不合需要的信號成分并將它們保存在單獨的列表中。
本方法還可刪除被發(fā)現(xiàn)為在較長的時間段中相同的信號片段。完成此操作是為了刪除重新播送的整個節(jié)目。例如,如果一個無線電播送與另一個播送有多于五至十分鐘的時間都相同,則很可能不是一首歌曲,而是整個節(jié)目的重播,從而希望記錄單首歌曲的用戶對其是不敢興趣的。這些時間參數(shù)可由用戶調(diào)整,以便其既可用裝置記錄單獨的源材料也可記錄源材料集。
在本發(fā)明的一個版本中,裝置也可以生成用戶不希望接受到的材料列表。此操作可通過用戶在播放不合需要的材料時激活按鈕來完成。在無線電廣播的情況中,此列表可包括廣告、談話、鈴聲等。然后這些信號片段可被存儲在不合需要列表中,然后可以用來將這些片段從所需材料的列表中篩選出來。用戶也可以將需要列表中的源材料標記為不合需要,從而使其以后不再被播放或呈現(xiàn)給用戶。
在執(zhí)行本發(fā)明的一種方法中,用戶不會接受到直接播送而是一個稍微延遲的版本,以便裝置有時間在不合需要的信號成分到達用戶之前將其刪除,并用需要的內(nèi)容填充這些間隙。此操作可通過自動搜索播送中的不合需要的信號成分,并在檢測到不合需要的信號成分改變延時以跳過該信號成分。這樣最終可能創(chuàng)建大到足夠用先前記錄的需要的材料來填充的間隙,當它們的播放結(jié)束時,該源可被切換回到先前的節(jié)目。
裝置也可以在遇到特定情況時自動更改媒體信道,如無電線臺。例如,裝置可在一定時間段(如每五分鐘或每24小時)后更改無線電臺。它也可以在一段時間后沒有發(fā)現(xiàn)新歌曲時更改無線電臺。更改到新的媒體信道可擴充可被發(fā)現(xiàn)的源材料數(shù)目。裝置也可被編程以便在一個媒體信道上查找預(yù)定數(shù)目(如20個)的源材料,然后切換媒體信道在第二媒體信道上查找預(yù)定數(shù)目的不同的源材料。裝置也可以在一個特定時間段后沒有找到任何新的源材料時更改媒體信道,如在48小時內(nèi)都沒有找到新的源材料時更改。裝置也可以在無法找到可識別的媒體信號時切換媒體信道,如播送出了問題或發(fā)射機未激活時。
裝置也可以將來自多個媒體信道的信號存儲在一個緩沖存儲器中。搜索多個媒體信道可增加最終獲得整個所需要的源材料(如一整首歌曲)的機率。
在使用本發(fā)明的一種方法,裝置可重新開始重復(fù)過程以實現(xiàn)更高質(zhì)量的源材料記錄。例如,當記錄來自無線電播送的音樂時,可能已經(jīng)獲得所需歌曲的非常短的一段或者它的質(zhì)量比需要的低。在該種情況下,裝置或使用激活部件的用戶可啟動一過程以從已經(jīng)記錄的源材料的公共片段中獲得新的搜索關(guān)鍵字,這將引起在存儲器或播送中對所需源材料的新搜索。
在本發(fā)明的另一個版本中,所述裝置將連接到一個外部系統(tǒng),以對所需源材料進行命名。此方法可由裝置將所需源材料的一部分或來自所需源材料的搜索關(guān)鍵字發(fā)送到外部系統(tǒng)并獲得識別該源材料的回復(fù)來實現(xiàn)。如果本方法用于無線電播送中的音樂,裝置將連接到該系統(tǒng)并發(fā)送一段已記錄的音樂以便識別。依次的,識別系統(tǒng)可將音樂的標題、藝術(shù)家或樂團發(fā)送到裝置。這使用戶不僅收聽音樂而且得知標題并知道哪位藝術(shù)或樂團在播放。此識別可自動完成或由用戶觸發(fā)。
已記錄的來自相同源材料的相同部分的媒體片段的質(zhì)量,即與源材料的接近度,可通過利用對相同源材料的多個記錄來提高。例如,如果裝置發(fā)現(xiàn)三個媒體信號包含相同的源材料,則可通過用來自其他兩個相同的因此被視為不含不合需要的信號成分的媒體信號的相應(yīng)的片段取代不合需要的信號成分的片段來刪除不合需要的信號成分。尤其地,如果第一媒體信號的某個片段與第二媒體信號的相同片段具有較低的相似度但第二片段和第三片段之間的相似度較高,則可設(shè)計本方法以便用第二或第三媒體信號的相應(yīng)片段取代第一媒體信號的該片段。
搜索關(guān)鍵字可以以相似的方法運作,因為搜索關(guān)鍵字將只識別高于某個預(yù)定的相似值的片段。如果相似值設(shè)置得太高,則可能會有確實來自相同源材料的片段被搜索關(guān)鍵字遺漏的危險。如果相似值設(shè)置得太低,則錯誤的信號片段或來自正確源材料的播送質(zhì)量較差的信號片段可能被選擇。
當然,裝置也可以被設(shè)置選擇具有相等相似值的片段,而不是僅僅最大化音響質(zhì)量,以避免某些音響片段非常清楚而其他的不是那么清楚。換句話說,一整首歌曲可具有一個較小的可接受的并且水平均勻分布的失真。
用在本發(fā)明的一個版本中的一個提高媒體信號質(zhì)量的方法是將來自相同源材料的時間對齊的記錄一個抽樣一個抽樣地加起來,并用參加相加過程的記錄數(shù)去除得到的幅度值。所需信號不會被影響,因為在所有記錄中它都是相同的。不合需要的信號成分,如噪聲和失真,不會像需要的信號信息那樣不受影響。噪聲和其他相似類型的不合需要的信息,可被視為實際上或多或少是隨機的,因此當兩個具有相同的平均噪聲水平的信號被加在一起時,平均噪聲水平不會加倍。平均上,如果噪聲信號具有相同的平均噪聲水平,則得到的噪聲水平的增加程度僅為加在一起的噪聲信號的數(shù)目的平方根。當所需信號部分的幅度通過用參加過程的記錄數(shù)去除幅度值來恢復(fù)時,平均噪聲水平將減小到低于原來的記錄的噪聲水平。
當相同源材料的記錄中的噪聲水平的差異大于一定水平時,則實際上只選擇最佳的記錄而不要試圖通過將記錄加起來來提高質(zhì)量比較好。除噪聲和類似信號外的其他類型的不合需要的信號信息也可以用此方法減少。
如果只有相同源材料的兩個記錄,且它們的質(zhì)量相差相當大,則很難說其中哪個是最佳或他們是否具有大致相同的質(zhì)量。這種情況的一個解決辦法是將兩個記錄加起來并將得到的幅度值除以2。可能其中一個記錄比另一個好得多,最好是已經(jīng)挑選出此記錄,但如果不可能是挑選出的話,則處理過的版本將是最佳選擇。
如果源材料片段來自無線電播送或來自其他易產(chǎn)生干擾的播送信道,則可從接收機中的信號強度獲得一個可能的質(zhì)量指標。較弱的接收一般包含更多噪聲且失真度更大。其他接收到的信號的參數(shù)也可被測量并被用于給出所獲得源材料的質(zhì)量指標。
在以下發(fā)明的一個版本中,本發(fā)明的重復(fù)過程將新的無干擾的源材料片段添加到存儲在存儲器中的源材料片段中。裝置可通過對兩個片段的相似度執(zhí)行一個數(shù)學(xué)計算來匹配兩個將拼接在一起的片段,以便,例如,第一片段的末尾與第二片段的開始精確匹配,從而使得兩個片段在時間上的放置是確切的。裝置可測試不同的重疊,當相似度最高時,裝置將兩個片段合并在一起,以便用戶可能不會注意到第一片段已經(jīng)添加到第二片段中。
在以下發(fā)明的一個版本中,裝置自動檢查信號片段是否以顛倒的相位播送。具有顛倒相位的信號片段與以相反相位播放的信號片段相比可能具有負的相似性或相關(guān)性,雖然它們來自相同源材料的相同部分。裝置可檢查搜索關(guān)鍵字的正和負的相似度以便能夠使用顛倒相位的信號片段。在以下發(fā)明的一個版本中,如果裝置檢測到媒體信號之一的相位顛倒,則裝置可通過在將兩個媒體信號合并在一起之前更改一個媒體信號的相位來自動進行調(diào)整。
要合并在一起的片段的抽樣點可能沒有對齊,使得合并時在最終合并后的片段中在交會點處可能出現(xiàn)不連續(xù)。為使要合并在一起的兩個片段的過渡盡可能平滑,可在交會點附近一段有限時間內(nèi)逐漸數(shù)學(xué)伸展或壓縮一個或兩個片段的信號,以便兩個片段之間的合并能夠在沒有不連續(xù)的情況下發(fā)生。解決此不連續(xù)問題的另一種方法可為數(shù)學(xué)地移動一個或兩個片段的抽樣點,使過渡不會出現(xiàn)不連續(xù)。
媒體信號可為無線電播送、電視播送、計算機網(wǎng)絡(luò)上的播送、計算機文件、已存儲在裝置上的文件或類似的東西。
媒體信道可為無線電或電視網(wǎng)絡(luò)、移動電話網(wǎng)絡(luò)、計算機網(wǎng)絡(luò)或類似的東西。
接收部件可為收音機、電視機、VCR、個人計算機、移動電話或其他用于接收媒體信號的裝置。
激活部件可為按鈕、杠桿、計算機程度、算法、方向盤或類似的部件。也可以是聲控、紅外線或藍牙連接,無線連接或這些部件的組合。
以上所有部件可為使用的以及編程的、自動化的或時間控制的激活部件。
播送中的不合需要的信號成分可能是無線電廣播中的談話者、DJ、VJ、電視人、讀者或新聞或類似的人或物的語音。播送中的不合需要的信號成分也可能是由較弱的播送或由于其他任何打斷或干擾的播送的原因引起的。
源材料可為一段音樂、一部電影、一個廣告、一個電視節(jié)目、新聞、演講、音響效果、電影效果或類似的事物。
檢測部件可由一個用于頻率濾波的LP濾波器、HP濾波器、BP濾波器、BS濾波器或激活和數(shù)字濾波器構(gòu)造或一個計算機程序、一個處理器或一個算法組成。
重復(fù)部件可為例如一個計算機程序或一個算法。
最終存儲器可為媒體信號播放器中的一個內(nèi)部存儲器。最終存儲器也可為一個CD-R、迷你光碟、軟盤、硬盤驅(qū)動器、磁帶記錄機、多媒體卡、壓縮閃速卡或其他外部或內(nèi)部存儲器或以上各種的組合。最終存儲器也可為一個外部或內(nèi)部存儲器的一部分或緩沖存儲器的一部分。
播放部件可為一個CD播放器、迷你光碟播放器、盒式錄音機、立體聲裝置、收音機、電視機、VCR、MP3播放器、PC、PDA或其他任何用于媒體播放的裝置。
實現(xiàn)上述發(fā)明的目標的上述過程和裝置既可包含軟件也可包含硬件或包含二者的結(jié)合。
雖然已經(jīng)根據(jù)首選構(gòu)成和實施方式說明了本發(fā)明,但要理解可在不背離以下權(quán)利要求的精神和范圍的情況下對其進行一定的替換和更改。
權(quán)利要求
1.一種在一個接收裝置中接收一個媒體信號的方法,包括存儲由接收裝置接收到的媒體信號(10、20、30、40、50、60、70、80、90),媒體信號包含不合需要的信號成分(102、103、104、105、202、204);在媒體信號中選擇一個第一搜索關(guān)鍵字(100、112、400);搜索一個與第一搜索關(guān)鍵字基本相同的第二搜索關(guān)鍵字(114、200、500、512、520);將出現(xiàn)在第一搜索關(guān)鍵字之前和之后的媒體信號第一片段(106、128、402、404、702)與出現(xiàn)在第二搜索關(guān)鍵字之前和之后的第二片段(120、206、501)相比較;識別第一片段和第二片段之間的第一公共片段(106、206、702、703)。
2.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括搜索一個與第一搜索關(guān)鍵字基本相同的第三搜索關(guān)鍵字(116、620);將出現(xiàn)在第三搜索關(guān)鍵字之前和之后的媒體信號第三片段(122、126、602)與第一片段和第二片段進行比較;識別第一片段和第三片段之間的第二公共片段(702、705)或第二片段和第三片段之間的第三公共片段(120、122)。
3.根據(jù)權(quán)利要求2的方法,其中該方法進一步包括將第一公共片段與第二公共片段連接起來形成一個媒體信號片段(110)。
4.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括通過使用一個第一激活部件手動激活裝置的步驟。
5.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括自動激活裝置的步驟。
6.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括創(chuàng)建第一和第二搜索關(guān)鍵字的步驟;存儲第一和第二搜索關(guān)鍵字;以及用第一和第二搜索關(guān)鍵字進行搜索。
7.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括計算第二搜索關(guān)鍵字和第一搜索關(guān)鍵字之間的一個相似因子。
8.根據(jù)權(quán)利要求1的方法,其中裝置在建立一個抽樣搜索關(guān)鍵字時使用媒體信號的每第(n)個抽樣以及;在使用該抽樣搜索關(guān)鍵字進行搜索時使用媒體信號相同的每第(n)個抽樣;以及使參數(shù)(n)的值等于或大于1。
9.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括歸一化媒體信號的信號增益。
10.根據(jù)權(quán)利要求2的方法,其中該方法進一步包括選擇第一公共片段、第二公共片段和第三公共片段中的一個最長信號片段。
11.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括制作媒體信號的幾個復(fù)本或媒體信號的幾個表示,并存儲媒體信號的所述復(fù)本或表示。
12.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括對接收到一個被識別的公共片段的次數(shù)進行計數(shù)。
13.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括對第二搜索關(guān)鍵字與第一搜索關(guān)鍵字基本相同的次數(shù)進行計數(shù)。
14.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括產(chǎn)生公共片段的一個第一列表。
15.根據(jù)權(quán)利要求14的方法,其中該方法進一步包括通過激活裝置上的一個第二激活部件識別不合需要的公共片段,并將不合需要的公共片段保存在一個第二列表中。
16.根據(jù)權(quán)利要求14的方法,其中該方法進一步包括選擇短于一個預(yù)定時間段的公共片段,并將這些較短的公共片段保存在一個第三列表中。
17.根據(jù)權(quán)利要求16的方法,其中該方法進一步包括從第一列表中排除第三列表中的公共片段。
18.根據(jù)權(quán)利要求15的方法,其中該方法進一步包括從第一列表中排除第二列表中的公共片段。
19.根據(jù)權(quán)利要求1的方法,其中該方法包括選擇長于第一預(yù)定時間段的公共片段,并從第一列表中排除長于第二預(yù)定時間段的選中的公共片段。
20.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括,比較在接收第一公共片段的時間段中在接收裝置的輸入處的第一信號強度與在接收第二公共片段的時間段中在接收裝置的輸入處的第二信號強度;以及在第一信號強度大于第二信號強度時選擇第一片段和在第二信號強度大于第一信號強度時選擇第二片段。
21.根據(jù)權(quán)利要求2的方法,其中該方法進一步包括確定第一公共片段中第一和第二片段之間的一個第一相似度,以及確定第二公共片段中第二片段和第三片段之間的一個第二相似度;以及當?shù)谝幌嗨贫缺鹊诙嗨贫蕊@示更高的相似程度時選擇第一公共片段,當?shù)诙嗨贫缺鹊谝幌嗨贫蕊@示更高的相似程度時選擇第二公共片段。
22.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括根據(jù)一個預(yù)定時間段內(nèi)公共片段被識別的頻率產(chǎn)生公共片段的一個第四列表。
23.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括根據(jù)公共片段上次被識別后經(jīng)歷的時間產(chǎn)生公共片段的一個第五列表。
24.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括在已經(jīng)經(jīng)過一段預(yù)定時間且沒有新的公共片段被識別時更改媒體信道。
25.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括在接收裝置上次更改媒體信道后已經(jīng)過一段預(yù)定的時間時更改媒體信道。
26.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括在一個特定數(shù)目的新公共片斷被識別時更改媒體信道。
27.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括搜索多個與第一搜索關(guān)鍵字基本相同的搜索關(guān)鍵字;以及識別與產(chǎn)生所選擇的第一搜索關(guān)鍵字的信號片段基本相同的第四信號片段。
28.根據(jù)權(quán)利要求1的方法,其中該方法進一步包括歸一化媒體信號的信號增益,其中歸一化因子來自于一個選中片段中的抽樣的絕對值之和。
全文摘要
本方法和一個系統(tǒng)是用于定位和記錄可能包含不合需要的信號成分(102、103、104、105、202、204)的媒體信道中的有限時間信號序列(10、20、30、40、50、60、70、80、90),例如,記錄無線電播送中的音樂。信號在一個存儲器中連續(xù)緩沖。用戶識別所需的源材料。從這個所需的源材料中可選出一個片段作為一個搜索關(guān)鍵字(100、112、400)。裝置也可自動選擇搜索關(guān)鍵字。如果檢測到搜索關(guān)鍵字第二次實例(114、200、500、510、520),在時間上連接到搜索關(guān)鍵字的信號序列被比較。經(jīng)過比較充分相同的信號序列被識別為屬于相同的所需要的源材料。下一步是以上過程的重復(fù),產(chǎn)生一個比最初的公共片段更長且質(zhì)量更高的源材料片段。
文檔編號G10L25/78GK1493029SQ02805462
公開日2004年4月28日 申請日期2002年2月21日 優(yōu)先權(quán)日2001年2月23日
發(fā)明者雅各布·伯格, 雅各布 伯格, 伯格, 理卡德·伯格, 阿爾內(nèi), 湯瑪斯·阿爾內(nèi) 申請人:快速捕獲器公司