專利名稱:錄制流式音頻的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于一種錄制流式音頻(Streamed Audio)的方法,且特別是有關(guān) 一種基于屬性來錄制流式音頻的方法及裝置。
背景技術(shù):
目前許多無(wú)線電臺(tái)除了廣播節(jié)目外,亦同時(shí)通過音頻流(audio stream)的方 式在因特網(wǎng)供使用者聆聽節(jié)目。如此,無(wú)線電臺(tái)只需額外利用較小成本便能獲得 更多的聽眾。然而,對(duì)于想要錄制收音機(jī)內(nèi)容的使用者而言,目前沒有錄制個(gè)人 歌曲的簡(jiǎn)單手段。
雖然市面上供模擬與數(shù)字電視機(jī)用的個(gè)人錄像機(jī)(Personal Video Recorder, PVR)系統(tǒng)是常見的,但目前沒有這種裝置為無(wú)線電臺(tái)廣播而存在。這 種情況存在的主要理由是為節(jié)目排程上的差異電視臺(tái)的內(nèi)容單元通常是電視表 演節(jié)目,故此產(chǎn)生頗為單純的節(jié)目表,而且有便于公布與容易依循之利。無(wú)線電 臺(tái)的內(nèi)容通常是以歌曲作為內(nèi)容單元,這樣使得電臺(tái)難以預(yù)先公布準(zhǔn)確與可作依 循的時(shí)間表。
對(duì)某些型式的表演節(jié)目(例如由聽眾所點(diǎn)唱的歌曲的節(jié)目)而言,這些時(shí)間表 是不可能公布的。此外,各家流式音訊服務(wù)所提供的內(nèi)容其格式的不盡相同,要 錄制一流式音頻服務(wù)的一部分,亦因此變得更為復(fù)雜為了成功的播放音訊,需 要從此服務(wù)處取得相對(duì)信息,但大多數(shù)的裝置只有在此錄音裝置首次聯(lián)機(jī)至此服 務(wù)時(shí)才能取得之。
盡管這樣,人們?nèi)匀粚?duì)于錄制無(wú)線電臺(tái)節(jié)目這方面存在一定的需求,例如使 用者有興趣的類型的全部節(jié)目,或是對(duì)于使用者而言在別處無(wú)法取得的某些歌曲 或某些歌手的歌曲。
發(fā)明內(nèi)容
因此,本發(fā)明的一個(gè)目的是提供一種基于使用者偏好的一個(gè)或多個(gè)屬性 來錄制流式音頻的方法及裝置。
本發(fā)明通過提供一種錄制來自一音頻流的音訊的方法來達(dá)成上述目的。 此方法包含下述步驟。首先接收并快取記錄音頻流。然后,通過檢測(cè)一靜音
(silence)期間并通過分析此音頻流的元數(shù)據(jù)(metadata),來決定對(duì)應(yīng)于至少一屬 性的一音軌(tmck)是否開始。如是,則將一開頭標(biāo)記在此快取記錄的音頻流中。 接著,通過檢測(cè)一靜音期間并通過分析此音頻流的元數(shù)據(jù),來決定是否結(jié)束 此音軌。如是,則將一結(jié)尾標(biāo)記在此快取記錄的音頻流中。最后,基于由標(biāo) 記在此快取記錄的音頻流中的開頭與結(jié)尾所表示的此快取記錄的音頻流的一 區(qū)段來建立一音頻文檔。
本發(fā)明通過更進(jìn)一步提供一種錄制來自一音頻流的裝置來達(dá)成上述目 的。此錄制裝置包含一接口、 一儲(chǔ)存單元與一處理器。此接口接收一屬性。 此儲(chǔ)存單元接收并快取記錄此音頻流。通過檢測(cè)一靜音期間與通過分析此音
頻流的元數(shù)據(jù),此處理器決定對(duì)應(yīng)于此屬性的一音軌是否開始。如是,則將 一開頭標(biāo)記在此快取記錄的音頻流中。然后,通過檢測(cè)一靜音期間與通過分 析此音頻流的元數(shù)據(jù),此處理器決定是否結(jié)束此音軌。如是,則在將一結(jié)尾 標(biāo)記在此快取記錄的音頻流中。最后,此處理器基于標(biāo)記在此快取記錄的音 頻流中的此開頭與結(jié)尾所表示的此快取記錄的音頻流的一區(qū)段,來建立一音 頻文檔。
為讓本發(fā)明之上述目的、特征、和優(yōu)點(diǎn)能更明顯易懂,下文特舉一較佳 實(shí)施例,并配合附圖進(jìn)行詳細(xì)說明如下-
圖1顯示一因特網(wǎng)收錄音機(jī)的方塊圖。
圖2顯示用以從一因特網(wǎng)電臺(tái)錄制流式音頻的方法的流程圖。 圖3A顯示音軌開頭的檢測(cè)步驟的流程圖。 圖3B顯示音軌結(jié)尾的檢測(cè)步驟的流程圖。
具體實(shí)施例方式
圖1顯示一因特網(wǎng)(網(wǎng)際網(wǎng)絡(luò))收錄音機(jī)的一實(shí)施例的方塊圖。因特網(wǎng)收
錄音機(jī)100包含一處理器101、 一接口 102以及一儲(chǔ)存單元103,例如一存儲(chǔ) 器或硬式磁盤驅(qū)動(dòng)器。為了聆聽收音機(jī),此使用者通過此人機(jī)接口 102選擇 一因特網(wǎng)電臺(tái)或一音頻流服務(wù),而錄音機(jī)100接著將通過此因特網(wǎng)110向?qū)?于此電臺(tái)的因特網(wǎng)電臺(tái)服務(wù)器提出收聽電臺(tái)節(jié)目的請(qǐng)求。在另一實(shí)施例中, 此錄音機(jī)100可連結(jié)至一單元,例如一計(jì)算機(jī)或一網(wǎng)絡(luò)裝置,用以與一音頻 流服務(wù)相通。然后,音頻數(shù)據(jù)是從此服務(wù)器以音頻串流方式傳輸至此錄音機(jī) 100,在此錄音機(jī)100上被譯碼,且可選擇地被播放并被輸出至可能外接或內(nèi) 接的一耳機(jī)或一揚(yáng)聲器112。于本實(shí)施例中,是將此處理器101程序化以錄制 一筆音頻內(nèi)容(譬如,對(duì)應(yīng)于由使用者所輸入或選擇的至少一屬性的一表演節(jié) 目或歌曲),并因此建立一期望的音頻文檔。處理器101,例如一微處理器或 微控制器,決定期望的音頻內(nèi)容是否在此音頻流中開始或結(jié)束。處理器101 依據(jù)此決定,而在此儲(chǔ)存單元103中的音頻流的儲(chǔ)存或快取記錄的內(nèi)容中標(biāo) 記一開頭與一結(jié)尾。處理器101更進(jìn)一步基于由標(biāo)記在此快取記錄的內(nèi)容中 的開頭與結(jié)尾所表示的一區(qū)段,來建立期望的音頻文檔。
圖2顯示用以從一因特網(wǎng)電臺(tái)錄制流式音頻的方法的流程圖。此方法始 于步驟201,讓使用者選擇一個(gè)或多個(gè)因特網(wǎng)電臺(tái),以從其中錄制欲求的內(nèi)容。 接著,于步驟203中,使用者設(shè)定用以描述其所欲錄制的內(nèi)容的一個(gè)或多個(gè) 屬性,設(shè)定的方式譬如通過經(jīng)由此接口 102輸入數(shù)據(jù)或自一選項(xiàng)表(List)中 選取的選項(xiàng)。此屬性可能是一個(gè)關(guān)鍵詞或一連串的關(guān)鍵詞,例如歌曲名稱、 表演者名稱、作曲家或類型或表演節(jié)目名稱。然后,于步驟205中,此錄音 機(jī)100接收此音頻流,并快取記錄此音頻流的串流內(nèi)容在此儲(chǔ)存單元103上, 其中記錄的內(nèi)容可保留其本來壓縮的格式。為了更進(jìn)一步的使用記錄的串流 內(nèi)容,此錄音機(jī)100可附帶儲(chǔ)存從內(nèi)容標(biāo)頭所得的信息,其是說明此音頻流 是以何種方式編碼的信息,如,此內(nèi)容的位率、信道數(shù)以及取樣率。
在步驟205中快取記錄此串流內(nèi)容時(shí),此錄音機(jī)100執(zhí)行步驟207至步 驟213,用以錄制對(duì)應(yīng)至由使用者所指定的這些屬性的一音軌。此音軌可被廣 義地視為一筆音頻內(nèi)容,例如歌曲或表演節(jié)目。于步驟207中,錄音機(jī)100
決定是否檢測(cè)到對(duì)應(yīng)于這些屬性的音軌的一開頭。于步驟209中,如果檢測(cè) 到,則將一開頭標(biāo)記在此快取記錄的內(nèi)容中,亦即,如在步驟205中所提及 的被快取記錄的的音頻流的串流內(nèi)容中。接著,于步驟211,此錄音機(jī)100決 定是否檢測(cè)到那個(gè)音軌的一結(jié)尾。如果檢測(cè)到,則如在步驟213中所示的將 一結(jié)尾標(biāo)記在此快取記錄的內(nèi)容中。最后,此錄音機(jī)100使用事先所儲(chǔ)存的 串流描述并加上此快取記錄的內(nèi)容中以標(biāo)記介定的區(qū)段來建立新的音頻文 檔。使用者接著可在此錄音機(jī)或另一個(gè)播放裝置(Playback device)上播放此 錄制文檔。以下更進(jìn)一步探討分別用以標(biāo)記對(duì)應(yīng)于該些屬性的歌曲的開頭與 結(jié)尾的檢測(cè)步驟207與步驟211。
從因特網(wǎng)電臺(tái)找出音頻流中的一音軌的開頭與結(jié)尾是很困難的。確認(rèn)歌 曲、音軌或表演節(jié)目的中斷的一種方法,是使用說明此音頻流的內(nèi)容(譬如作 曲家、歌曲名稱、播音員、主持人及/或表演節(jié)目的名稱)的元數(shù)據(jù)(metadata)。 然而,提供這種信息的元數(shù)據(jù)的位置時(shí),常因?yàn)橛梢纛l格式所加諸的限制而 與音軌的開頭不同步。識(shí)別音軌的中斷的第二種方法,是確認(rèn)被譯碼的音頻 信號(hào)的靜音期間;然而,此音軌本身可包含數(shù)個(gè)靜音期間。
為了解決此問題,于一個(gè)實(shí)施例中使用上述兩種方法的組合。錄音機(jī)100 通過檢測(cè)靜音的期間與一靜音期間(例如大約1或2秒)內(nèi)的元數(shù)據(jù)的改變, 來決定音軌的開頭與結(jié)尾。因?yàn)橹钡揭呀?jīng)播放此音軌,才可能得到元數(shù)據(jù), 故錄音機(jī)100必須保持快取記錄被下載的音頻流并為了將快取記錄的內(nèi)容截 取為片段標(biāo)記可能的開始或結(jié)束點(diǎn)。被下載的音頻流必須被快取記錄,直到 一開始或結(jié)束點(diǎn)被明確識(shí)別為止。檢測(cè)步驟207與211是更進(jìn)一步分別詳細(xì) 說明于圖3A與圖3B中。
圖3A顯示音軌開頭的檢測(cè)步驟207的一實(shí)施例的流程圖。于步驟301, 錄音機(jī)100首先檢測(cè)是否檢測(cè)到一靜音期間。于步驟303,如果被檢測(cè)到,則 如步驟205中所示的將一靜音標(biāo)記在此快取記錄的內(nèi)容中。然后,如步驟305 所示,在此靜音期間之內(nèi)或之后,對(duì)目前的元數(shù)據(jù)作分析。接著,于步驟307, 基于元數(shù)據(jù)而決定檢測(cè)到的靜音是否為一新的音軌的開頭,決定的方式為譬 如通過比較目前的元數(shù)據(jù)與先前的元數(shù)據(jù)以達(dá)成。如果此元數(shù)據(jù)是與先前的 不同,則此靜音之后的音軌是為新的一個(gè)音軌;如否,則此方法繼續(xù)至步驟
301。于步驟309,基于元數(shù)據(jù)與這些屬性以決定此音軌是否欲被錄制。舉例 而言,由使用者所指定的這些屬性是與目前的元數(shù)據(jù)比較,用以決定新的音 軌是否待被錄制。如果目前的元數(shù)據(jù)是對(duì)應(yīng)至這些屬性,則決定將此靜音可 視為是此音軌的開頭,如在步驟311中所表示的。
圖3B顯示音軌結(jié)尾的檢測(cè)步驟211的一實(shí)施例的流程圖。于步驟321中, 錄音機(jī)100首先決定是否檢測(cè)到一靜音期間。于步驟323,如果被檢測(cè)到,則 將一靜音標(biāo)記在此快取記錄的內(nèi)容中。然后,如步驟325所示,分析在此靜 音之內(nèi)或之后的目前的元數(shù)據(jù)。接著,于步驟327,基于此元數(shù)據(jù)以決定此檢 測(cè)到的靜音是否為一新的音軌的結(jié)尾,譬如通過比較目前的元數(shù)據(jù)與先前的 元數(shù)據(jù)以作決定。如步驟329中所示,如果目前的元數(shù)據(jù)是與先前者不同, 則此靜音是對(duì)應(yīng)至此音軌的結(jié)尾;否則此方法繼續(xù)至步驟321。
依據(jù)本發(fā)明之上述實(shí)施例的流式音頻的錄制方法可通過靜音期間與包含 于此音頻流中的元數(shù)據(jù)以找到正確的內(nèi)容,并安排錄制。對(duì)使用者而言,此 方法使得錄制來自音頻流的特定內(nèi)容變得相當(dāng)容易,因?yàn)槭褂谜卟恍柚来?音軌開頭與結(jié)尾的正確的時(shí)間,尤其在此音軌為歌曲時(shí)更是如此。對(duì)于其它 型式的內(nèi)容而言,例如語(yǔ)言課程或記錄片影集的連續(xù)影集,此實(shí)施例使得錄 制整個(gè)影集變的更加容易。再者,能夠儲(chǔ)存數(shù)據(jù)并與音頻流服務(wù)相通的可攜 式裝置(例如數(shù)字音樂播放機(jī)、個(gè)人數(shù)字助理或行動(dòng)電話)均可被視為并被實(shí) 施為此因特網(wǎng)收錄音機(jī)100,如上述所具體表現(xiàn)的。此實(shí)施例甚至可被應(yīng)用在 以某些儲(chǔ)存與錄制能力為特色的相當(dāng)?shù)碗A的裝置上。
綜上所述,雖然本發(fā)明已以一較佳實(shí)施例揭示如上,然而其并非用以限 定本發(fā)明。本發(fā)明所屬技術(shù)領(lǐng)域中具有通常知識(shí)者,在不脫離本發(fā)明的精神 和范圍內(nèi),當(dāng)可作各種的等同的更動(dòng)與潤(rùn)飾。因此,本發(fā)明的保護(hù)范圍當(dāng)視 后附的本申請(qǐng)權(quán)利要求范圍所界定的為準(zhǔn)。
權(quán)利要求
1.一種錄制來自一音頻流的音訊的方法,包含以下步驟接收并快取記錄該音頻流;通過檢測(cè)一靜音期間并通過分析該音頻流的元數(shù)據(jù),來決定對(duì)應(yīng)于至少一屬性的一音軌是否開始,如是,則將一開頭對(duì)應(yīng)地標(biāo)記在該快取記錄的音頻流中;通過檢測(cè)一靜音期間并通過分析該音頻流的元數(shù)據(jù),來決定是否結(jié)束此音軌,如是,則將一結(jié)尾對(duì)應(yīng)地標(biāo)記在該快取記錄的音頻流中;以及基于標(biāo)記在該快取記錄的音頻流中的該開頭與該結(jié)尾所表示的該快取記錄的音頻流的一區(qū)段,來建立一音頻文檔。
2. 如權(quán)利要求1所述的方法,其特征在于該決定音軌是否開始的步驟包含如果檢測(cè)到一靜音期間,則將一靜音標(biāo)記在該快取記錄的音頻流中; 分析該音頻流的該元數(shù)據(jù);以及通過比較該分析的元數(shù)據(jù)與先前的元數(shù)據(jù)并通過比較該分析的元數(shù)據(jù)與 該屬性,來決定該靜音期間是否對(duì)應(yīng)至一新音軌的一開頭。
3. 如權(quán)利要求2所述的方法,其特征在于該分析步驟是在該靜音期間之 后被執(zhí)行。
4. 如權(quán)利要求2所述的方法,其特征在于如果該分析的元數(shù)據(jù)不同于該 先前的元數(shù)據(jù)且該分析的元數(shù)據(jù)是對(duì)應(yīng)至該屬性,則決定該靜音期間是對(duì)應(yīng) 至該新音軌的該開頭。
5. 如權(quán)利要求1所述的方法,其特征在于該決定音軌是否結(jié)束的步驟包含如果檢測(cè)到一靜音期間,則將一靜音標(biāo)記在該快取記錄的音頻流中; 分析該音頻流的該元數(shù)據(jù);以及通過比較該分析的元數(shù)據(jù)與先前的元數(shù)據(jù)來決定該靜音期間是否對(duì)應(yīng)至 該音軌的該結(jié)尾。
6. 如權(quán)利要求5所述的方法,其特征在于該分析步驟是在該靜音期間之后被執(zhí)行。
7. 如權(quán)利要求5所述的方法,其特征在于如果該分析的元數(shù)據(jù)不同于該 先前的元數(shù)據(jù),則決定該靜音期間是對(duì)應(yīng)至該音軌的該結(jié)尾。
8. —種錄制來自一音頻流的音訊的裝置,該裝置包含 一接口,其用以接收一屬性;一儲(chǔ)存單元,其用以接收與快取記錄該音頻流;以及 一處理器,其被程序化用以決定一靜音期間是否發(fā)生并分析該音頻流的元數(shù)據(jù),以決定對(duì) 應(yīng)于該屬性的一音軌是否在該音頻流中開始;當(dāng)該音軌開始時(shí),將一開頭標(biāo)記在該快取記錄的記錄的音頻流中;決定一靜音期間是否發(fā)生并分析該音頻流的元數(shù)據(jù),以決定是 否在該開頭被標(biāo)記在該快取記錄的音頻流之后結(jié)束該音軌;當(dāng)該音軌結(jié)束時(shí),將一結(jié)尾標(biāo)記在該快取記錄的音頻流中;以及基于標(biāo)記在該快取記錄的音頻流中的該開頭與該結(jié)尾所表示的 該快取記錄的音頻流的一區(qū)段,來建立一音頻文檔。
9. 如權(quán)利要求8所述的裝置,其特征在于為了決定該音軌的該開頭,該 處理器是被程序化用以-在檢測(cè)到一靜音期間時(shí),將一靜音標(biāo)記在該快取記錄的音頻流中; 分析該音頻流的該元數(shù)據(jù);以及比較該分析的元數(shù)據(jù)與先前的元數(shù)據(jù)并比較該分析的元數(shù)據(jù)與該屬性, 以決定該靜音期間是否對(duì)應(yīng)至一新音軌的一開頭。
10. 如權(quán)利要求9所述的裝置,其特征在于在該靜音期間之后,該處理 器分析該元數(shù)據(jù)。
11. 如權(quán)利要求9所述的裝置,其特征在于如果該分析的元數(shù)據(jù)不同于 該先前的元數(shù)據(jù)且該分析的元數(shù)據(jù)是對(duì)應(yīng)至該屬性,則該處理器決定該靜音 期間是對(duì)應(yīng)至該音軌的該開頭。
12. 如權(quán)利要求8所述的裝置,其特征在于為了決定該音軌的該結(jié)尾,該處理器是被程序化用以如果檢測(cè)到一靜音期間,則將一靜音標(biāo)記在該快取記錄的音頻流中; 分析該音頻流的該元數(shù)據(jù);以及比較該分析的元數(shù)據(jù)與先前的元數(shù)據(jù),以決定該靜音期間是否對(duì)應(yīng)至該 音軌的該結(jié)尾。
13. 如權(quán)利要求12所述的裝置,其特征在于在該靜音期間之后,該處理器分析該元數(shù)據(jù)。
14. 如權(quán)利要求12所述的裝置,其特征在于如果該分析的元數(shù)據(jù)不同于該先前的元數(shù)據(jù),則該處理器檢測(cè)到該靜音期間是對(duì)應(yīng)至該音軌的該結(jié)尾。
全文摘要
本發(fā)明提供一種錄制來自一音頻流的方法及裝置。此方法接收并快取此音頻流。通過檢測(cè)一靜音期間并通過分析此音頻流的元數(shù)據(jù),來決定對(duì)應(yīng)于至少一屬性的一音軌是否開始。如是,則將一開頭標(biāo)記在此快取記錄的音頻流中。接著,通過檢測(cè)一靜音期間并通過分析此音頻流的元數(shù)據(jù),來決定是否結(jié)束此音軌。如是,則將一結(jié)尾標(biāo)記在此快取記錄的音頻流中。最后,基于標(biāo)記在此快取記錄的音頻流中的此開頭與結(jié)尾所表示的此快取記錄的音頻流的一區(qū)段來建立一音頻文檔。
文檔編號(hào)G11B20/10GK101169954SQ20061015985
公開日2008年4月30日 申請(qǐng)日期2006年10月27日 優(yōu)先權(quán)日2006年10月27日
發(fā)明者史蒂芬·莫爾斯 申請(qǐng)人:智易科技股份有限公司