專利名稱:多媒體信號處理方法及應(yīng)用該方法的多媒體信號處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種多媒體信號處理方法,且特別涉及一種干擾多媒體信號的多媒體信號處理方法。
背景技術(shù):
在一些多媒體信號的錄像及錄音過程中,可能會出現(xiàn)一些包含個人隱私的影像, 例如人臉、人的服裝行為、車牌、電話號碼、身分證字號等個人數(shù)據(jù),暴露或血腥等違反公序良俗的畫面,或者一些廣告圖像或畫面。此外,還可能錄音到一些不雅的語句或人身攻擊的話語。對于這些畫面,往往都是先將其錄像錄音并儲存后,事后再以人工加以處理。但在加工過程中可能出現(xiàn)遺漏,而有個人數(shù)據(jù)外泄,置入性營銷或是將不雅的畫面或語句播出而違反電視電影分級制度的情形。而且,要是在現(xiàn)場直播時,發(fā)生意外事件,例如走光及突發(fā)暴力事件等,或是有人用臟話罵人,可能會因人工無法及時反應(yīng),而全數(shù)播出。要是節(jié)目播出時段是普遍級時,還可能會遭到主管機(jī)關(guān)或?qū)X?zé)機(jī)關(guān)的處罰。另外,因為人工處理會牽涉到人的行為,所以可能會發(fā)生一些畫面中的不雅畫面或個人數(shù)據(jù),被存心不良的人士復(fù)制或盜用的可能。
發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種多媒體信號處理方法及系統(tǒng),是在多媒體信號儲存以前,干擾不想被儲存的部分,而能避免泄漏不想外泄的數(shù)據(jù)。根據(jù)本發(fā)明的一方面,提出一種多媒體信號處理方法,包含讀取第一特定音頻片段及第二特定音頻片段,其中第一特定音頻片段屬于第二特定音頻片段的部分;感測一感測音頻信號;辨識感測音頻信號是否包含第一特定音頻片段,若是,則定義感測音頻信號中包含第一特定音頻片段的區(qū)段為目標(biāo)區(qū)段;辨識感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段是否包含第二特定音頻片段,若否,則對目標(biāo)區(qū)段執(zhí)行干擾機(jī)制而得到輸出音頻信號;以及輸出該輸出音頻信號。根據(jù)本發(fā)明另一方面,提出一種多媒體信號處理系統(tǒng),包括儲存單元、音頻感測單元以及音頻處理單元。儲存單元用以儲存第一特定音頻片段及第二特定音頻片段。音頻感測單元用以感測一感測音頻信號。音頻處理單元用以辨識感測音頻信號是否包含第一特定音頻片段,定義感測音頻信號中包含第一特定音頻片段的區(qū)段為目標(biāo)區(qū)段,辨識感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段是否包含第二特定音頻片段,且對目標(biāo)區(qū)段執(zhí)行干擾機(jī)制而得到輸出音頻信號。本發(fā)明的功效在于,由于本實施例的多媒體信號處理方法在多媒體信號播出以前,就將不想被播出的部分畫面模糊化,且將不想被播出的部分聲音片段進(jìn)行干擾處理,而能避免泄漏不想外泄的數(shù)據(jù),也能避免播出法律規(guī)定不得播出的畫面或聲音。以下結(jié)合附圖和具體實施例對本發(fā)明進(jìn)行詳細(xì)描述,但不作為對本發(fā)明的限定。
圖1為本發(fā)明第一實施例的多媒體信號處理系統(tǒng)的方框圖;圖2A及圖2B為第一實施例中多媒體信號處理系統(tǒng)的多媒體信號處理方法的流程圖;圖3為本發(fā)明第二實施例的多媒體信號處理系統(tǒng)的方框圖;圖4A、圖4B及圖4C為第二實施例中多媒體信號處理系統(tǒng)的多媒體信號處理方法的流程圖。其中,附圖標(biāo)記100、300 多媒體信號處理系統(tǒng)101,301 儲存單元102、302 音頻感測單元103、303 音頻處理單元201、202、203、204、205、206、207、401、402、403、404、405、406、407、408、409、410、 411,412 步驟304 視頻感測單元305:視頻處理單元
具體實施例方式下面結(jié)合附圖對本發(fā)明的結(jié)構(gòu)原理和工作原理作具體的描述第一實施例請參照圖1,為本發(fā)明第一實施例的多媒體信號處理系統(tǒng)100的方框圖。此多媒體信號處理系統(tǒng)100包括儲存單元101、音頻感測單元102以及音頻處理單元103。于本實施例中,儲存單元101用以儲存第一特定音頻片段及第二特定音頻片段。 儲存單元101可例如為硬盤、軟盤、光盤、隨身碟或記憶卡等儲存媒體。于本實施例中,第一特定音頻片段屬于第二特定音頻片段的部分。第一特定音頻片段可例如為人身攻擊的語句、臟話或是與情色相關(guān)的語句。于本實施例中,第一特定音頻片段可例如為“白癡”的音頻片段“勺歷'斗”。第二特定音頻片段例如為包含“勺歷'才,, 的音頻片段但并非人身攻擊的語句。舉例而言,第二特定音頻片段例如為“白白吃了去”、 “白吃白喝”等語句。于本實施例中,音頻感測單元102用以感測一感測音頻信號。音頻感測單元102 可例如為麥克風(fēng)。感測影像可例如為路面影像、戲劇影像、節(jié)目影像、物品影像及廣告影像等影像。于本實施例中,音頻處理單元103用以辨識感測音頻信號是否包含第一特定音頻片段,定義感測音頻信號中包含第一特定音頻片段的區(qū)段為目標(biāo)區(qū)段,辨識感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段是否包含第二特定音頻片段,且對目標(biāo)區(qū)段執(zhí)行干擾機(jī)制而得到輸出音頻信號。此外,于本實施例中,音頻處理單元103還用以輸出感測音頻信號或輸出音頻信號。音頻處理單元103還可對所輸出的感測音頻信號或輸出音頻信號進(jìn)行編碼,并輸出至儲存單元101以存盤。音頻處理單元103可例如為由軟件控制的CPU或由固件控制的 CPU等處理單元。干擾機(jī)制可如為將零信號或高頻信號覆蓋于目標(biāo)區(qū)段,或者可例如為將目標(biāo)區(qū)段加入白噪聲。以下更搭配一流程圖詳細(xì)說明使用本實施例中多媒體信號處理系統(tǒng)100的多媒體信號處理方法。請參照圖2A及圖2B,其為第一實施例中多媒體信號處理系統(tǒng)100的多媒體信號處理方法的流程圖。然而本發(fā)明所屬技術(shù)領(lǐng)域中普通技術(shù)人員可了解本實施例的影像處理系統(tǒng)100并不局限于此流程圖的應(yīng)用,且其步驟的執(zhí)行順序也不局限于此流程圖。首先于步驟201中,音頻處理單元103從儲存單元101當(dāng)中讀取第一特定音頻片段及第二特定音頻片段,其中第一特定音頻片段屬于第二特定音頻片段的部分。第一特定音頻片段可例如為人身攻擊的語句、臟話或是與情色相關(guān)的語句。于本實施例中,第一特定音頻片段可例如為“白癡”的音頻片段“勺歷'斗”。第二特定音頻片段例如為包含“勹歷'
才”的音頻片段但并非人身攻擊的語句。舉例而言,第二特定音頻片段例如為“白白吃了去” 的音頻片段”勹歷'勹歷'斗為亡·< U、”或是”白吃白喝”的音頻片段”勹歷'斗勹歷' 廠亡”等語句。于步驟202中,音頻感測單元102感測一感測音頻信號。感測音頻信號可例如廣播錄音、新聞影像中的錄音部分及其它多媒體錄像錄音中的錄音部分的音頻信號。舉例而言,音頻感測單元102為現(xiàn)場廣播節(jié)目的麥克風(fēng),而正在感測廣播節(jié)目中主持人、節(jié)目來賓及打電話參與節(jié)目討論的聽眾等節(jié)目參與人員的話語。于步驟203中,音頻處理單元103辨識感測音頻信號是否包含第一特定音頻片段。 舉例而言,辨識節(jié)目參與人員所發(fā)出的聲音中,是否有”勺歷'斗”的音頻片段。當(dāng)感測音頻信號包含第一特定音頻片段時,進(jìn)行步驟204至步驟206的處理。例如因為有個聽眾打電話來抱怨說”那個白癡竟然跑到我家白吃白喝!真是太可惡了 !”,其中的”那個白癡竟然跑到我家白吃白喝! ”便包含了”勺歷'^ ”的音頻片段,因此進(jìn)行步驟204至步驟206 的處理。當(dāng)感測音頻信號并未包含第一特定音頻片段時,則進(jìn)行步驟207的處理。例如上述聽眾的抱怨中的“真是太可惡了 !”,便未包含“勺歷'斗”的音頻片段,因此進(jìn)行步驟207 的處理。于步驟204中,音頻處理單元103定義感測音頻信號中包含第一特定音頻片段的區(qū)段為目標(biāo)區(qū)段。舉例而言,將“那個白癡竟然跑到我家白吃白喝! ”中的“白癡”及“白吃” 定義為目標(biāo)區(qū)段。于步驟205中,音頻處理單元103辨識感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段是否包含第二特定音頻片段,當(dāng)感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段不包含第二特定音頻片段時,則進(jìn)行步驟206的處理。當(dāng)感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段包含第二特定音頻片段時,則進(jìn)行步驟207的處理。舉例而言,感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段為“那個白癡竟然”以及“我家白吃白喝”中,區(qū)段“那個白癡竟然,,并未包含第二特定音頻片段,而區(qū)段“我家白吃白喝”中則包含了第二特定音頻片段的“白吃白喝”。因此,對于區(qū)段“那個白癡竟然”,進(jìn)行步驟206的處理。而對于區(qū)段“我家白吃白喝”,則進(jìn)行步驟207的處理。于步驟206中,音頻處理單元103對目標(biāo)區(qū)段執(zhí)行干擾機(jī)制而得到輸出音頻信號。 于本實施例中,干擾機(jī)制可例如任何讓人耳聽不出來目標(biāo)區(qū)段的內(nèi)容的機(jī)制。于本實施例中,干擾機(jī)制可例如將零信號或高頻信號覆蓋于目標(biāo)區(qū)段,或者可例如將目標(biāo)區(qū)段加入音量較高的白噪聲。干擾機(jī)制若將零信號覆蓋于目標(biāo)區(qū)段而加以取代,則目標(biāo)區(qū)段的聲音會被消音而變成沒有聲音。干擾機(jī)制若將高頻信號覆蓋于目標(biāo)區(qū)段而加以取代,則目標(biāo)區(qū)段的聲音會變成高音的“嗶_”聲。干擾機(jī)制若將目標(biāo)區(qū)段加入音量較高的白噪聲,即具有所有音頻的噪聲,則目標(biāo)區(qū)段的聲音會變成“吱喳吱喳”的嘈雜聲。舉例而言,于步驟206中,感測音頻信號的“那個白癡竟然跑到我家白吃白喝! ”, 則會被干擾機(jī)制處理為“那個‘——,竟然跑到我家白吃白喝! ”,被處理為“那個‘嗶_’竟然跑到我家白吃白喝! ”,或是被處理為“那個‘吱喳吱喳’竟然跑到我家白吃白喝! ”。于步驟207中,音頻處理單元103輸出由步驟203所辨識的感測音頻信號,或是輸出由步驟206所得到的輸出音頻信號。例如廣播電臺將音頻信號廣播發(fā)送出去。以干擾機(jī)制將高頻信號覆蓋于目標(biāo)區(qū)段而加以取代為例,廣播電臺于此時所發(fā)送出去的音頻信號便為“那個‘嗶-’竟然跑到我家白吃白喝!真是太可惡了 !”。借由本實施例的多媒體信號處理系統(tǒng)使用本實施例的多媒體信號處理方法,即使是現(xiàn)場直播的廣播節(jié)目,也能避免播送出如“白癡”的類的人身攻擊字眼。于步驟207中,音頻處理單元103還可對所輸出的感測音頻信號或輸出音頻信號進(jìn)行編碼,例如mp3的編碼,并輸出至儲存單元101以存盤。由于本實施例的多媒體信號處理方法在音頻輸出或播送以前,就將不想被輸出或播送的部分的音頻進(jìn)行干擾處理,而能避免泄漏不想外泄的數(shù)據(jù)或是字眼。例如廣播電臺的現(xiàn)場直播及callin,本實施例可避免廣播電臺播送出人身攻擊或辱罵的字眼,也不會泄露個人數(shù)據(jù)。第二實施例請參照圖3,為本發(fā)明第二實施例的多媒體信號處理系統(tǒng)300的方框圖。此多媒體信號處理系統(tǒng)300包括儲存單元301、音頻感測單元302、音頻處理單元303、視頻感測單元 304以及視頻處理單元305。其中,音頻感測單元302及音頻處理單元303與于第一實施例的音頻感測單元102及音頻處理單元103相似,在此不再予以贅述。儲存單元301與于第一實施例的儲存單元101相似,但還用以特定視頻信號。特定視頻信號可例如為商標(biāo)、品牌標(biāo)幟、數(shù)字符串、文字符串、人臉圖像、人類下體畫面、人類乳房畫面及血腥畫面等視頻信號。于本實施例中,視頻感測單元304用以感測一感測視頻信號。視頻感測單元304 可例如為攝影設(shè)備的CCD、CMOS或其它可感測視頻信號的視頻感測單元。感測視頻信號可例如為路面影像、戲劇影像、演唱會影像、節(jié)目影像、物品影像及廣告影像等視頻信號。于本實施例中,視頻處理單元305用以辨識感測視頻信號是否包含特定視頻信號,定義感測視頻信號中包含特定視頻信號的區(qū)域為一目標(biāo)區(qū)域而得到一輸出視頻信號, 以及輸出感測視頻信號或輸出視頻信號。此外,于本實施例中,視頻處理單元305還可用以將感測視頻信號或輸出視頻信號進(jìn)行編碼并輸出至儲存單元301以存盤。視頻處理單元 305可例如為由軟件控制的CPU或由固件控制的CPU等處理單元。視頻處理單元305也可例如與音頻處理單元303共享的處理單元。以下搭配一流程圖詳細(xì)說明使用本實施例中多媒體信號處理系統(tǒng)300的多媒體信號處理方法。請參照圖4A、圖4B及圖4C,其為第二實施例中多媒體信號處理系統(tǒng)300的多媒體信號處理方法的流程圖。然而本發(fā)明所屬技術(shù)領(lǐng)域中普通技術(shù)人員均可了解本實施例的多媒體信號處理系統(tǒng)300并不局限于此流程圖的應(yīng)用,且其步驟的執(zhí)行順序也不局限于此流程圖。
于本實施例中,步驟403、404、405、406及407與于第一實施例的步驟203、204、 205,206及207相似,在此不再予以贅述。步驟401及402與于第一實施例的步驟201及202相似。然而,于步驟401中,除了讀取第一特定音頻片段及第二特定音頻片段以外,還讀取特定視頻信號。舉例而言,特定視頻信號可例如為人類乳房畫面。于步驟402中,除了感測一感測音頻信號以外,還感測一感測視頻信號。舉例而言,感測音頻信號及感測視頻信號可例如為藝人現(xiàn)場演唱會的音頻信號及視頻信號。于步驟408中,視頻處理單元305辨識感測視頻信號是否包含特定視頻信號。舉例而言,視頻處理單元305辨識藝人現(xiàn)場演唱會的視頻信號是否包含人類乳房畫面的視頻信號。當(dāng)感測視頻信號包含特定視頻信號時,例如藝人現(xiàn)場演唱會的視頻信號包含人類乳房畫面的視頻信號時,進(jìn)行步驟409的處理。當(dāng)感測視頻信號不包含特定視頻信號時,則進(jìn)行步驟410的處理。于步驟409中,視頻處理單元305定義感測視頻信號中包含特定視頻信號的區(qū)域為目標(biāo)區(qū)域,且對目標(biāo)區(qū)域進(jìn)行模糊化處理而得到輸出視頻信號。其中,模糊化處理可例如將目標(biāo)區(qū)域的多個畫素間的對比降低,可例如以遮蔽影像覆蓋而替代目標(biāo)區(qū)域的影像,以及可例如對目標(biāo)區(qū)域的影像進(jìn)行馬賽克處理。舉例而言,在藝人現(xiàn)場演唱會進(jìn)行時,此藝人不小心因走光而露出乳房的畫面時,視頻處理單元305定義藝人現(xiàn)場演唱會的視頻信號中包含人類乳房畫面的視頻信號的區(qū)域為目標(biāo)區(qū)域,且對目標(biāo)區(qū)域進(jìn)行馬賽克處理而得到輸出視頻信號。于步驟410中,視頻處理單元305輸出由步驟409所得到的輸出視頻信號,或由步驟408所辨識的感測視頻信號。于步驟411中,于視頻處理單元305輸出該輸出音頻信號或感測音頻信號以及輸出視頻信號或感測視頻信號之后,視頻處理單元305結(jié)合所輸出的音頻信號及視頻信號, 而成為多媒體信號。舉例而言,視頻處理單元305將所輸出的輸出音頻信號以及輸出視頻信號予以結(jié)合,或是將所輸出的輸出音頻信號以及感測視頻信號予以結(jié)合,或是將所輸出的感測音頻信號以及輸出視頻信號予以結(jié)合,或是將所輸出的感測音頻信號以及感測視頻信號予以結(jié)合,而成為多媒體信號。于步驟412中,視頻處理單元305將多媒體信號輸出。借此,觀賞此藝人現(xiàn)場直播的演唱會的觀眾,便不會在此藝人走光時,看到此藝人的走光鏡頭。除此之外,于本實施例中,由于也對感測音頻信號進(jìn)行辨識,使此演唱會上不會聽見辱罵聲。如此一來,即使在此藝人現(xiàn)場直播的演唱會上,發(fā)生了走光或是言語辱罵等超出當(dāng)時播出時段的分級制度的規(guī)范行為時,也能在播出影像及聲音的前便加以屏蔽,進(jìn)而符合分級制度的規(guī)范。由于本實施例的多媒體信號處理方法在多媒體信號播出以前,就將不想被播出的部分畫面模糊化,且將不想被播出的部分聲音片段進(jìn)行干擾處理,而能避免泄漏不想外泄的數(shù)據(jù),也能避免播出法律規(guī)定不得播出的畫面或聲音。當(dāng)然,本發(fā)明還可有其它多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1.一種多媒體信號處理方法,其特征在于,包括讀取一第一特定音頻片段及一第二特定音頻片段,其中該第一特定音頻片段屬于該第二特定音頻片段的一部分; 感測一感測音頻信號;辨識該感測音頻信號是否包含該第一特定音頻片段,若是,則定義該感測音頻信號中包含該第一特定音頻片段的區(qū)段為一目標(biāo)區(qū)段;辨識該感測音頻信號中包含該目標(biāo)區(qū)段的區(qū)段是否包含該第二特定音頻片段,若否, 則對該目標(biāo)區(qū)段執(zhí)行一干擾機(jī)制而得到一輸出音頻信號;以及輸出該輸出音頻信號。
2.根據(jù)權(quán)利要求1所述的多媒體信號處理方法,其特征在于,該干擾機(jī)制將零信號覆蓋該目標(biāo)區(qū)段。
3.根據(jù)權(quán)利要求1所述的多媒體信號處理方法,其特征在于,該干擾機(jī)制將高頻信號覆蓋該目標(biāo)區(qū)段。
4.根據(jù)權(quán)利要求1所述的多媒體信號處理方法,其特征在于,該干擾機(jī)制將該目標(biāo)區(qū)段加入白噪聲。
5.根據(jù)權(quán)利要求1所述的多媒體信號處理方法,其特征在于,還包括 讀取一特定視頻信號;感測一感測視頻信號;辨識該感測視頻信號是否包含該特定視頻信號,若是,則定義該感測視頻信號中包含該特定視頻信號的區(qū)域為一目標(biāo)區(qū)域,若否,則輸出該感測視頻信號; 對該目標(biāo)區(qū)域進(jìn)行一模糊化處理而得到一輸出視頻信號; 輸出該輸出視頻信號;以及結(jié)合所輸出的該輸出音頻信號或該感測音頻信號及該輸出視頻信號或該感測視頻信號。
6.一種多媒體信號處理系統(tǒng),其特征在于,包括一儲存單元,用以儲存一第一特定音頻片段及一第二特定音頻片段; 一音頻感測單元,用以感測一感測音頻信號;以及一音頻處理單元,用以辨識該感測音頻信號是否包含該第一特定音頻片段,定義該感測音頻信號中包含該第一特定音頻片段的區(qū)段為一目標(biāo)區(qū)段,辨識該感測音頻信號中包含該目標(biāo)區(qū)段的區(qū)段是否包含該第二特定音頻片段,且對該目標(biāo)區(qū)段執(zhí)行一干擾機(jī)制而得到一輸出音頻信號。
7.根據(jù)權(quán)利要求6所述的多媒體信號處理系統(tǒng),其特征在于,該干擾機(jī)制用以將零信號覆蓋該目標(biāo)區(qū)段。
8.根據(jù)權(quán)利要求6項所述的多媒體信號處理系統(tǒng),其特征在于,該干擾機(jī)制用以將高頻信號覆蓋該目標(biāo)區(qū)段。
9.根據(jù)權(quán)利要求6所述的多媒體信號處理系統(tǒng),其特征在于,該干擾機(jī)制用以將該目標(biāo)區(qū)段加入白噪聲。
10.根據(jù)權(quán)利要求6所述的多媒體信號處理系統(tǒng),其特征在于,該儲存單元還用以儲存一特定視頻信號,該多媒體信號處理系統(tǒng)還包括一視頻感測單元,用以感測一感測視頻信號;以及一視頻處理單元,用以辨識該感測視頻信號是否包含該特定視頻信號,定義該感測視頻信號中包含該特定視頻信號的區(qū)域為一目標(biāo)區(qū)域而得到一輸出視頻信號,以及輸出該輸出視頻信號。
全文摘要
一種多媒體信號處理方法及應(yīng)用該方法的多媒體信號處理系統(tǒng),多媒體信號處理方法,包含讀取第一特定音頻片段及第二特定音頻片段,其中第一特定音頻片段屬于第二特定音頻片段的部分;感測一感測音頻信號;辨識感測音頻信號是否包含第一特定音頻片段,若是,則定義感測音頻信號中包含第一特定音頻片段的區(qū)段為目標(biāo)區(qū)段;辨識感測音頻信號中包含目標(biāo)區(qū)段的區(qū)段是否包含第二特定音頻片段,若否,則對目標(biāo)區(qū)段執(zhí)行干擾機(jī)制而得到輸出音頻信號;以及輸出該輸出音頻信號。本發(fā)明還提供一種應(yīng)用上述方法的多媒體信號處理系統(tǒng)。借由本發(fā)明提供的多媒體信號處理系統(tǒng)及方法,是在多媒體信號儲存以前,干擾不想被儲存的部分,而能避免泄漏不想外泄的數(shù)據(jù)。
文檔編號G11B20/00GK102376323SQ20101025107
公開日2012年3月14日 申請日期2010年8月9日 優(yōu)先權(quán)日2010年8月9日
發(fā)明者袁宏彥 申請人:英業(yè)達(dá)股份有限公司