專利名稱:記錄裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對視頻信號和音頻信號進行編碼而將其保存在磁盤
和光盤等中的硬盤記錄器和DVD記錄器等視頻音頻記錄裝置等,尤 其涉及例如用于商業(yè)廣告(CM: commercial message)廣4番的判別和 概要重放等的、具有抽取音頻特征量的功能等的裝置。
背景技術(shù):
在現(xiàn)有的視頻音頻記錄裝置中,例如,公知有為了對所廣播的視
法的裝置(例如,參照專利文獻l)。
另外,近年來正在使用通過將視頻音頻信號數(shù)字化而將其記錄在 硬盤等存儲裝置中的記錄裝置。在這些記錄裝置中,雖然通過存儲裝 置的大容量化而已能大量記錄視頻音頻廣播等,但預先記錄非壓縮的 視頻音頻信號是低效的,因此通常使用MPEG ( Motion Picture Expert Group:運動圖像專家組, 一種壓縮比率較大的活動圖象和聲音的壓 縮標準)2等的壓縮手段對視頻音頻信號進行編碼來進行記錄。當重 放時將其擴展后進行重放。
在這種裝置中,由于已經(jīng)能夠大量記錄視頻音頻信號,因此更加 希望能夠僅視聽需要的場景(scene)。即自動CM檢測、除去等的必 要性正在提高,而且重要場景檢測功能等也變得更為重要。為實現(xiàn)這 些功能,就需要分析視頻音頻信號的內(nèi)容。
如上所述,作為對視頻音頻信號進行編碼來進行記錄并進行CM 檢測等的裝置,公知有具備與編碼部獨立地設(shè)置的CM檢測部等,并 根據(jù)被編碼而保存在存儲器中的音頻信號來檢測CM的裝置(例如, 參照專利文獻2)。
專利文獻1:日本特開平8- 317342號公報 專利文獻2:日本特開2002 - 247516號公才艮
發(fā)明內(nèi)容
但是,如上所述,當利用與編碼部獨立地設(shè)置的CM4企測部等進 行CM檢測等時,為了進行自動除去CM等處理而取得檢測結(jié)果與視 頻音頻信號的哪部分對應的對應關(guān)系是較為困難的。即在由編碼部進 行了編碼的視頻音頻信號和抽取出的特征量等中,與哪一 時刻的視頻 音頻信號一致、取得同步、以及進行對應是較為困難的。因此,由于 要存儲表示對應關(guān)系的信息、進行利用了該信息的添加對應的處理, 所以出現(xiàn)了電路和微碼(microcode)等變得復雜、導致電路規(guī)模增大 等這樣的問題。
鑒于上述問題,本發(fā)明的目的在于,能夠容易地取得從視頻信號 和音頻信號中抽取出的特征量等與視頻音頻信號等的對應關(guān)系,且能 夠減少或不需要用于進行對應的信息和處理,還容易謀求電路規(guī)模的 降低等。
為了解決上述問題,本發(fā)明實施方式的第一裝置的特征在于,具有..
編碼單元,用于對視頻信號和音頻信號的至少一者進行編碼,生 成具有標題的編碼信號;
記錄單元,用于將上述編碼信號記錄在記錄介質(zhì)中;
特征抽取單元,用于抽取上述視頻信號或上述音頻信號中的預定 特征狀態(tài)或特征量;
抽取結(jié)果設(shè)定單元,在編碼信號的標題中的、多個編碼信號中設(shè)
定為相同值的固定值區(qū)域內(nèi),設(shè)定上述特征抽取單元的抽取結(jié)果。
本發(fā)明實施方式的第二裝置的特征在于,在第一記錄裝置中,上 述特征抽取單元抽取上述音頻信號中的無聲狀態(tài)、振幅、以及頻率分
布中的至少一者。
本發(fā)明實施方式的第三裝置的特征在于,在第一記錄裝置中,上
述特征抽取單元抽取上述視頻信號中的振幅和頻率分布中的至少一 者。
由此,在標題的固定值區(qū)域內(nèi)設(shè)定有從視頻信號和音頻信號中抽 取出的特征量等,與視頻音頻信號等相對應。另外,設(shè)定在固定值區(qū) 域內(nèi)的數(shù)據(jù)即使被上述特征量等所覆蓋,但由于對于多個標題是共用 的值,因此也能夠容易地進行還原。
根據(jù)第一記錄裝置,本發(fā)明的實施方式的第四裝置特征在于,上 述特征抽取單元使用用于對視頻信號或音頻信號進行編碼的演算結(jié) 果來進行上述抽取。
由此,能夠容易地謀求特征抽取單元和編碼單元的電路、程序代 碼的公用化。
本發(fā)明實施方式的第五裝置的特征在于,在第一記錄裝置中,在 進行了基于上述特征抽取單元的抽取之后,進行上述編碼。
本發(fā)明實施方式的第六裝置的特征在于,在第五記錄裝置中,還 具有緩沖存儲部,上述編碼單元和上述特征抽取單元,根據(jù)上述緩沖
存儲部的保存內(nèi)容來進行上述編碼或抽取,
并且,上述編碼單元使所生成的編碼信號保存在上述緩沖存儲部中。
由此,即使在通過編碼而重寫編碼前的緩沖存儲部的保存內(nèi)容的 情況下,也能恰當?shù)剡M行基于特征抽取單元的抽取。
本發(fā)明實施方式的第七裝置的特征在于,在第一記錄裝置中,還 具有固定值還原單元,將在上述標題的固定值區(qū)域內(nèi)設(shè)定有抽取結(jié)果 的編碼信號還原為設(shè)定有原固定值的編碼信號。
本發(fā)明實施方式的第八裝置的特征在于,在第七記錄裝置中,上
記錄介質(zhì)中。
由此,能夠容易地謀求與不進行特征抽取的裝置的交換性等。 本發(fā)明實施方式的第九裝置的特征在于,在第七記錄裝置中,上 述記錄單元將在上述標題的固定值區(qū)域內(nèi)設(shè)定有抽取結(jié)果的編碼信 號記錄在上述記錄介質(zhì)中,
而上述固定值還原單元對從上述記錄介質(zhì)所再現(xiàn)的編碼信號進 行上述還原。
由此,能夠容易地謀求與不進行特征抽取的裝置的交換性等,并 且還能夠容易減少記錄介質(zhì)所需要的存儲容量。
根據(jù)本發(fā)明,能夠容易地取得從視頻音頻信號抽取出的特征量等 與視頻音頻信號的對應關(guān)系,并且減少或不需要用于進行對應的信息 和處理,還能夠容易地謀求電路規(guī)模的降低等。
圖1是表示本發(fā)明實施方式的視頻音頻記錄裝置的主要部分結(jié)構(gòu) 的框圖。
圖2是表示圖1中的音頻編碼部101的具體結(jié)構(gòu)的框圖。 圖3是表示圖1中的音頻編碼部101的動作例子的時序圖。 圖4是表示寫入硬盤的存儲內(nèi)容等的例子的說明圖。
標號說明
101音頻編碼部 101a工作存儲器 101b特征抽取部 101c編碼處理部 102纟見頻編碼部 103碼分多路復用部
具體實施例方式
以下,根據(jù)附圖詳細說明本發(fā)明的實施方式。
本發(fā)明實施方式的視頻音頻記錄裝置如圖l所示,例如包括分別 對通過進行視頻音頻廣播而輸入的音頻信號或視頻信號進行編碼的 音頻編碼部101和一見頻編碼部102、以及對已被編碼的音頻信號和一見
頻信號進行多路復用的碼分多路復用部(code multiplexing section) 103。這樣的視頻音頻記錄裝置沒有進行特別限定,例如可應用于通 過對圖像信號進行編碼而將其保存在硬盤中的硬盤記錄器、內(nèi)置硬盤 記錄器的電氣設(shè)備、內(nèi)置硬盤記錄器的電視裝置、內(nèi)置硬盤記錄器的 錄像記錄器、內(nèi)置硬盤記錄器的DVD播放器等,作為這些裝置用的 半導體集成電路的一部分等而形成。
例如,如圖2所示,在上述音頻編碼部101中設(shè)置有工作存儲器 101a、特征抽取部101b、以及編碼處理部101c。
上述工作存儲器101a保存編碼前后的音頻信號。通過在編碼前后 兼用工作存儲器101a而能夠把電路和輸入信號線控制在較少的數(shù)量 上,從而易于降低電路規(guī)模,但并不限定于此。
特征抽取部101b,例如根據(jù)保存在工作存儲器101a中的編碼前 的音頻信號來進行無聲部分、音頻信號的振幅電平、頻率分布等特征 量的抽取。抽取結(jié)果如下所述,被嵌入到通過編碼而生成的數(shù)據(jù)包的 標題中的固定值區(qū)域內(nèi)。
另外,編碼處理部101c,例如以MPEG2等方式進行編碼處理, 生成包括標題的數(shù)據(jù)包。具體而言,例如生成包括PES標題的PES (Packetized Elementary Stream:打包基本流)的凄t據(jù)包。
上述特4正抽取部101b,具體而言,例如當編碼處理部101c ;故構(gòu) 成為通過使用了微碼等的軟件處理來進行音頻編碼處理時,不需要特 別設(shè)置用于特征抽取的電路,而僅設(shè)置軟件的代碼就能夠容易地實 現(xiàn)。但并不限定于此,在僅通過軟件處理無法實現(xiàn)無聲^r測處理和特 征量抽取處理的情況下,也可以由硬件來進行無聲檢測處理等的 一部 分或全部。
在如上所述那樣構(gòu)成的視頻音頻記錄裝置中,如圖3所示那樣, 進行無聲部分和特征量的抽取。此時,通常是編碼前的數(shù)據(jù)量比編碼 后的數(shù)據(jù)量多,但圖3為了便于說明,描述為相同的數(shù)據(jù)量。 (S101 )
使用音頻編碼部101,例如對第n- 1的音頻信號進行編碼處理,
在編碼音頻信號[n- l]被保存在工作存儲器101a中的狀態(tài)下,當輸入 下一預定量的輸入音頻信號[n]時,由該輸入音頻信號[n]覆蓋編碼音 頻信號[n- l]。
(5102)
例如,使用編碼處理部101c,根據(jù)保存在工作存儲器101a中的 輸入音頻信號[n],生成PTS (Presentation Time Stamp) 、 DTS (Decodeing Time Stamp)等時刻信息等并生成包括固定值[n]的標題 [n]。上述固定值[n],例如是在每個數(shù)據(jù)包中沒有變化,即為對于一 系列的(至少為多個)數(shù)據(jù)包相等地設(shè)定的值。所生成的標題[n]被保 存在工作存儲器101a中(標題[n-l]被覆蓋)。
(5103)
使用特征抽取部101b,根據(jù)保存在工作存儲器101a中的輸入音 頻信號[n],抽取其音頻是否為無聲、振幅、頻率分布等。在此,例如 在由軟件進行無聲檢測等的情況下,通過執(zhí)行該軟件,保存在工作存 儲器101a中的音頻信號被讀入到數(shù)字信號處理電路中。另外,當由 硬件進行無聲檢測等時,從工作存儲器101a輸出的信號被輸入到無 聲檢測電路等中。
作為無聲等的檢測結(jié)果,表示是否為無聲部分和各種特征量的信 息,作為特征量[n]與固定值[n]置換而被嵌入標題[n]中。即在進行編 碼時,為了表示編碼數(shù)據(jù)的內(nèi)容、表示編碼數(shù)據(jù)的時刻信息等而添加 標題,但在那樣的標題部分存在只要用于編碼(編碼狀態(tài)時)以及其 它的參數(shù)不變更就不發(fā)生變化的固定值部分時,通過將抽取出的特征 量嵌入那樣的固定值部分中,能夠保存抽取出的特征量,并傳送至基 于該特征量進行處理的部分,不需要重新確保寄存器區(qū)域和外部存儲 器區(qū)域等。根據(jù)需要,也可以建立用于表示在固定值部分已進行了多 路復用的標志。另外,例如作為DVD記錄器,當對于全部數(shù)據(jù)包為 固定值時,該固定值即使在該DVD記錄器的后級的處理部中也是已 知信息,因此不需要全部傳送(數(shù)據(jù)包被輸出至DVD記錄器等的外 部等情況下,即在寫入至DVD等能進行交換的記錄介質(zhì)等情況下、
需要保證與其它標準和規(guī)格的DVD播放器、記錄器等的互換性等情 況下,還原預定的固定值即可)。另一方面,在某種編碼狀態(tài)下為固 定值這樣的情況時,需要傳送該固定值,但此時根據(jù)僅在最初的第一 數(shù)據(jù)包中多路復用與否來進行傳送即可,因此不需要利用各數(shù)據(jù)包的 標題進行傳送。因此,能夠如上述那樣容易地在固定值部分中對被抽 取出的特征量進行多路復用。另外,也可以嵌入至標題等的未使用區(qū) 域部分中。
(5104)
使用編碼處理部101c,進行保存在工作存儲器101a中的輸入音 頻信號[n]的編碼。編碼前的輸入音頻信號[n]由通過編碼生成的編碼 音頻信號[n]所覆蓋。
(5105)
如上述那樣地生成并被保存在工作存儲器101a中的標題[n]和編 碼音頻信號[n],作為數(shù)據(jù)包而從音頻編碼部101輸出。以下,對于n +1以后的輸入音頻信號也反復進行同樣的處理。
利用碼分多路復用部103,對從音頻編碼部101輸出的編碼音頻 信號和從視頻編碼部102輸出的視頻信號的數(shù)據(jù)包進行多路復用,作 為音頻視頻(AV)多路復用流式數(shù)據(jù)而輸出,進行對記錄介質(zhì)的記 錄等。上述多路復用時的音頻信號與視頻信號的同步,根據(jù)嵌入在 PES標題中的PTS、 DTS等時刻信息來進行。
如上所述,在標題的固定值部分或未使用區(qū)域部分嵌入有表示特 征量的信息的數(shù)據(jù)包,利用碼分多路復用部103及其后級的未圖示的 處理部等,根據(jù)從各數(shù)據(jù)包中分離出的特征量,進行用于能夠使自動 CM檢測、除去以及概要重放的重要場景檢測等處理。此時,如上所 述,在各數(shù)據(jù)包標題中嵌入有表示特征量的信息,因此能容易地進行 使各數(shù)據(jù)包與特征量進行對應的處理。即在額外保存特征量的情況 下,需要用于使該特征量與音頻信號等進行對應的信息或處理,與此 不同,本實施方式僅按每個數(shù)據(jù)包進行處理就能夠保證進行那樣的對 應。另外,如對碼分復用化部103的動作所說明的那樣,根據(jù)時刻信
息等能夠容易地取得音頻信號和視頻信號的同步,因此,結(jié)果也能夠 容易地取得例如對音頻信號抽取出的特征量和視頻信號的同步。
進行處理等情況下,其處理結(jié)果可以嵌入標題的固定值部分、未使用 區(qū)域部分中。
行特征量的嵌入時,在進行了無聲檢測等處理后,根據(jù)需要,覆蓋寫 入原固定值部分的值,原來的數(shù)據(jù)包被還原。此時,為了將嵌入有特 征量的固定值部分還原為原固定值的值,在進行特征量的嵌入時,也
存在需要預先保存原固定值的值的情況,但是,例如圖4所示那樣, 當以虛線表示的固定值[1]~固定值[n]為共用值時,若準備用于保存1 個固定值的少量存儲區(qū)域而進行保存,則能夠削減用于保存n-l個 固定值的存儲容量。
在上述那樣的特征量抽取處理和編碼處理中包含共用處理的情 況下,可以由兼用的處理電路或處理程序進行這些處理。具體而言, 例如在編碼處理部101c中,有時為了進行音頻編碼處理而抽取無聲 檢測、振幅電平、頻率分布等特征量。這些信息即使是原本用于編碼 的信息,也可以作為無聲檢測、CM檢測等的特征量來使用。當這樣 地將用于編碼的特征量作為CM檢測等的特征量來使用的情況下,不 需要設(shè)置用于特征量抽取的軟件代碼或電路,能夠容易地降低電路規(guī) 模等。
在此,當為了無聲檢測等處理而進行參照之前,為了編碼而求得 的特征量被逐次更新時,在將要嵌入的時刻之前,將上述特征量轉(zhuǎn)存 到其它存儲區(qū)域即可。由此的存儲器區(qū)域的容量與要預先轉(zhuǎn)存非壓縮 的視頻音頻信息的存儲器容量相比,確保為小容量即可。
另外,上述那樣的裝置也可以適用于接受數(shù)字廣播而進行記錄的 裝置等。即在數(shù)字廣播中,作為已被視頻編碼、音頻編碼了的視頻音 頻廣播而進行分發(fā),因此不限于像對模擬廣播進行數(shù)字記錄的記錄裝 置那樣地必須在記錄時刻通過編碼部。但是,在對已被編碼了的視頻
音頻數(shù)據(jù)廣播進行解碼、并再次進行編碼這樣的再編碼等情況下,由 于在編碼部中通過,因此能夠使編碼部具有抽取特征量的功能,對于 數(shù)字廣播也能使之進行無聲檢測等。
另外,在上述例子中,示出對音頻信號進行特征抽取的例子,但
代替在音頻編碼部101設(shè)置特征抽取部101b,或與在音頻編碼部101 設(shè)置特征抽取部101b—起,在視頻編碼部102設(shè)置特征抽取部,也 可以對視頻信號進行同樣的特征抽取。另外,在音頻編碼部101和視 頻編碼部102這二者設(shè)置特征抽取部的情況下,可以分別個別地進行 動作,或者這二者進行動作,或者僅一者進行動作。
另外,也可以是,保存在數(shù)據(jù)包的固定值部分覆蓋有特征量的狀 態(tài)不變,對硬盤等記錄介質(zhì)進行記錄等,在重放時等被還原。因此, 能夠?qū)崿F(xiàn)高效的記錄等。即當需要在各數(shù)據(jù)包等中保存所需的特征量 時,若該特征量保存在與編碼音頻信號等不同的區(qū)域中,則需要額外 的存儲容量,或者,為了將該特征量與哪一數(shù)據(jù)包相對應的信息取為 特征量而預先保存而需要額外的存儲容量,但與此不同,本實施方式 通過在標題的固定值部分嵌入特征量而在記錄介質(zhì)中進行記錄等,從 而能夠避免上述那樣的存儲容量的增大等。
產(chǎn)業(yè)上的可利用性
本發(fā)明的記錄裝置具有如下效果,即能夠容易地取得從視頻信 號、音頻信號中抽取出的特征量等與視頻音頻信號等的對應關(guān)系,并 能夠減少或不需要用于進行對應的信息或處理,也能夠容易地謀求電 路規(guī)模的降低等,本發(fā)明的記錄裝置作為對視頻音頻信號進行編碼而 保存在磁盤、光盤等中的硬盤記錄器、DVD記錄器等記錄裝置等是 有用的。
權(quán)利要求
1.一種記錄裝置,其特征在于,具有編碼單元,對視頻信號和音頻信號中的至少一方進行編碼,生成具有標題的編碼信號;記錄單元,用于將上述編碼信號記錄在記錄介質(zhì)中;特征抽取單元,用于抽取上述視頻信號或上述音頻信號中的預定特征狀態(tài)或特征量;以及抽取結(jié)果設(shè)定單元,用于在編碼信號的標題中的、多個編碼信號中被設(shè)定為相同值的固定值區(qū)域內(nèi)設(shè)定上述特征抽取單元的抽取結(jié)果。
8.根據(jù)權(quán)利要求7所述的記錄裝置,其特征在于碼信號記錄在上述記錄介質(zhì)中。
9.根據(jù)權(quán)利要求7所述的記錄裝置,其特征在于 上述記錄單元用于將在上述標題的固定值區(qū)域內(nèi)設(shè)定有抽取結(jié)果的編碼信號記錄在上述記錄介質(zhì)中,而上述固定值還原單元被構(gòu)成為使其對從上述記錄介質(zhì)中再現(xiàn)的編碼信號進行上述還原。
全文摘要
視頻音頻記錄裝置具有分別對通過進行視頻音頻廣播而輸入的音頻信號或視頻信號進行編碼的音頻編碼部(101)和視頻編碼部(102)、以及對被編碼的音頻信號和視頻信號進行多路復用的碼分多路復用部(103)。音頻編碼部(101)根據(jù)編碼前的音頻信號來進行無聲部分、音頻信號的振幅電平、頻率分布等特征量的抽取。抽取結(jié)果被嵌入通過編碼生成的數(shù)據(jù)包的標題中的固定值區(qū)域內(nèi)。因此不需要用于使從視頻音頻信號中抽取出的特征量等與視頻音頻信號進行對應的信息或處理就能容易地取得二者的對應關(guān)系。
文檔編號G10L15/00GK101099197SQ20058004638
公開日2008年1月2日 申請日期2005年12月5日 優(yōu)先權(quán)日2005年1月11日
發(fā)明者森田芳治 申請人:松下電器產(chǎn)業(yè)株式會社