識別媒體內(nèi)容中的報道的制作方法
【專利說明】
【背景技術(shù)】
[0001]在今日總是互聯(lián)的社會中,形式為現(xiàn)場直播、預錄制或點播節(jié)目的媒體內(nèi)容幾乎是普遍存在的。例如,24 X 7新聞節(jié)目全天提供了連續(xù)的現(xiàn)場直播信息流,并且無數(shù)預錄制媒體源在任何給定時刻例如經(jīng)由互聯(lián)網(wǎng)是可訪問的。
[0002]可以使用大量不同技術(shù)、經(jīng)由大量通信頻道中的任意通信頻道來廣播、流傳送、或另外輸送媒體內(nèi)容。例如,在互聯(lián)網(wǎng)上流傳送的視頻媒體的輸送通常包括將視頻內(nèi)容編碼成一個或多個流傳送視頻格式,并且高效地向終端用戶輸送已編碼的視頻內(nèi)容。
【附圖說明】
[0003]圖1是根據(jù)在此描述的實施方式的示例性報道識別環(huán)境的概念圖。
[0004]圖2是根據(jù)在此描述的實施方式的從媒體內(nèi)容中識別報道的示例性方法的概念圖。
[0005]圖3是根據(jù)在此描述的實施方式的從媒體內(nèi)容中識別報道的示例性方法的流程圖。
[0006]圖4是根據(jù)在此描述的實施方式的用于從媒體內(nèi)容中識別報道的示例性計算機系統(tǒng)的框圖。
【具體實施方式】
[0007]海量可應(yīng)用媒體內(nèi)容可容易地導致信息超負荷,尤其是如果媒體內(nèi)容并未以允許用戶容易地識別感興趣的具體內(nèi)容的方式而良好編組或另外結(jié)構(gòu)化。作為結(jié)果,某些內(nèi)容提供者、內(nèi)容搜集者、或終端用戶可以人工地加標簽或者另外對媒體內(nèi)容分類,例如通過將元數(shù)據(jù)與內(nèi)容相關(guān)聯(lián)。這種人工分類盡管相當精確,但可能是相對低效、昂貴和/或耗時的。
[0008]在此描述了用于識別媒體內(nèi)容中的報道的技術(shù),即便之前尚未如此分類報道。如在此所使用的,術(shù)語“報道”通常指媒體內(nèi)容中與特定主題或一致性概念集相關(guān)的一部分。例如,在晚間新聞節(jié)目播出期間,一個報道可能描述最近犯罪審判的結(jié)果,而另一個報道可能討論本地商務(wù)的成功,以及又一個報道可能涉及天氣。根據(jù)在此描述的技術(shù),媒體內(nèi)容(例如新聞節(jié)目)被分離成概念性報道(例如包括法律報道、商務(wù)報道和天氣報道的三種概念上不同的報道)。一旦已經(jīng)使用所描述的技術(shù)識別了報道,可以執(zhí)行額外的有用處理一例如以概括或分類報道,或者以使報道與媒體內(nèi)容隔離(例如剪輯),以為了更方便的訪問或傳輸??梢栽谝呀?jīng)識別了報道之后,對報道應(yīng)用這些或其它合適的處理技術(shù),以通常使得報道對于終端用戶是更加可訪問和/或可消費的。
[0009]圖1是根據(jù)在此描述的實施方式的示例性報道識別環(huán)境100的概念圖。如所示,環(huán)境100包括被配置為執(zhí)行報道識別引擎112的計算系統(tǒng)110。報道識別引擎112可以通常操作為分析輸入的媒體內(nèi)容102,以及用于識別在媒體內(nèi)容102中所包括的各個報道114a、114b和114c。如以下進一步詳細描述的,報道識別引擎112可以通常通過將媒體內(nèi)容102劃分為片段,分析片段以確定與各個片段相關(guān)聯(lián)的概念,比較不同片段之間的概念以確定不同片段的概念相似性,以及將概念上類似的片段合并為報道,來識別報道。
[0010]環(huán)境100的示例性拓撲結(jié)構(gòu)可以代表各個報道識別環(huán)境。然而,應(yīng)該理解的是,僅為了示意說明而示出了環(huán)境100的示例性拓撲結(jié)構(gòu),可以對配置作出各種修改。例如,環(huán)境100可以包括不同的或額外的部件,或者可以以不同于所示的方式而實施部件。同樣地,盡管計算系統(tǒng)110通常被示為獨立服務(wù)器,但應(yīng)該理解的是,計算系統(tǒng)110實際上可以是任何合適類型的計算裝置,諸如服務(wù)器、大型主機、膝上型計算機、臺式計算機、工作站、或其它裝置。計算系統(tǒng)110也可以代表計算裝置的群組,諸如服務(wù)器農(nóng)場、服務(wù)器集群、或者單獨地或一起操作以執(zhí)行在此描述的功能的計算裝置的其它群組。
[0011]媒體內(nèi)容102可以采用任何合適媒體類型的形式,并且可以從任何合適的媒體源提供??梢匀缭诖怂枋龅倪M行處理的媒體類型的示例包括但不限于,音頻信息(例如無線電廣播、電話通話、音頻流等),視頻信息(例如電視廣播、網(wǎng)絡(luò)廣播、視頻流等),和/或多媒體信息(例如音頻、視頻、圖形、和/或其它合適內(nèi)容的組合)。媒體源的示例包括但不限于廣播媒體源、流媒體源、在線媒體儲存庫、獨立物理媒體(例如藍光盤、DVD、小型盤等)等等。
[0012]計算系統(tǒng)110可以包括處理器122、存儲器124、接口126、分段模塊128、內(nèi)容分析模塊130以及片段合并模塊132。應(yīng)該理解的是,僅為了示意說明目的而示出所示部件,在一些情形中,參照計算系統(tǒng)110的特定模塊或部件所描述的功能可以由例如計算系統(tǒng)110或其它合適的計算系統(tǒng)的一個或多個不同的或額外的模塊或部件來執(zhí)行。類似的,應(yīng)該理解的是,功能的一部分或全部可以組合成比所示更少的模塊或部件。
[0013]處理器122可以被配置為處理由計算系統(tǒng)110執(zhí)行的指令。指令可以存儲在非臨時、有形的計算機可讀存儲介質(zhì)上,諸如在存儲器124中或者在分立的存儲裝置(未示出)上,或者在用于存儲使可編程處理器執(zhí)行在此描述的技術(shù)的指令的任何其它類型易失性或非易失性存儲器上??商娲鼗蝾~外地,計算系統(tǒng)110可以包括專用硬件,諸如一個或多個集成電路、專用集成電路(ASIC)、專用處理器(ASSP)、現(xiàn)場可編程門陣列(FPGA)、或用于執(zhí)行在此描述的技術(shù)的專用硬件的前述示例的任意組合。在一些實施方式中,如合適地,可以將多個處理器與多個存儲器和/或多個類型的存儲器一起使用。
[0014]接口126可以實施在硬件和/或軟件中,并且可以例如被配置為從合適的媒體源(未示出)接收媒體內(nèi)容102。在一些實施方式中,接口 126可以配置為從一個或多個媒體源定位和/或請求媒體內(nèi)容102。例如,接口 126可以配置為循環(huán)地、定期地和/或隨時地從不同的新聞頻道或電臺捕捉新聞提要,以及提供媒體內(nèi)容102以供報道識別引擎112處理。接口126也可以被配置為輸出供終端用戶或其它合適的計算系統(tǒng)(諸如搜索引擎或其它合適的系統(tǒng))所消費的已處理報道,例如報道114a、114b和/或114c。
[0015]在一些實施方式中,接口126也可以包括允許用戶(例如系統(tǒng)管理員)直接地與計算系統(tǒng)110交互、例如人工地限定或修改與報道識別引擎112相關(guān)聯(lián)的設(shè)置或選項的一個或多個用戶接口。這些設(shè)置或選項可以存儲在數(shù)據(jù)庫(未示出)中,并且可以由報道識別引擎112使用,以調(diào)整與如在此描述的報道識別功能相關(guān)聯(lián)的一個或多個處理參數(shù)。示例性的用戶接口可以包括觸摸屏裝置、指示裝置、鍵盤、語音輸入接口、視覺輸入接口等等。
[0016]分段模塊128可以執(zhí)行在一個或多個處理器(例如處理器122)上,并且可以基于媒體內(nèi)容102中所包括的聽覺指示器而將接收到的媒體內(nèi)容102分段為多個媒體片段。例如,分段模塊128可以分析媒體內(nèi)容102的音頻部分,來識別某些聽覺標志(例如給定長度的靜默,或特定類型的聽覺信號,諸如音樂或特定音調(diào)),以識別媒體內(nèi)容102中的邏輯斷裂。在新聞節(jié)目的示例中,基于媒體內(nèi)容102的音頻部分中的靜默或暫停的分段可以導致與句子和/或段落對齊的片段,因為發(fā)言者可能通常在句子和/或段落之間暫停簡短片刻。類似的,新聞節(jié)目可以包括音樂叮當聲、一系列音調(diào)、或者指示了在節(jié)目部分之間邏輯斷裂的其它聽覺信號。這些和/或其它合適的聽覺指示器可以用于允許分段模塊128對媒體內(nèi)容102進行分段。
[0017]在一些實施方式中,分段模塊128也可以或者可替代地使用視覺指示器來對接收到的媒體內(nèi)容102進行分段。例如,分段模塊128可以分析媒體內(nèi)容128的視頻部分,以識別也可以或者可替代地用于識別媒體內(nèi)容102中的邏輯斷裂的某些視覺標志(例如指示了連續(xù)視頻幀之間顯著差異的關(guān)鍵幀,黑色幀,或其它合適的視覺指示器)。當一起采用時,諸如靜默的聽覺指示器與諸如關(guān)鍵幀的視頻指示器組合可以用于精確地且一致性地將媒體內(nèi)容102分段為合適的媒體片段。
[0018]分段模塊128也可以使用其它合適的指示器,以使得或者精細調(diào)整媒體內(nèi)容102的片段為多個媒體片段。例如,媒體內(nèi)容102的音頻部分的語音至文本處理可以提供抄本,其可以例如與如上描述的聽覺和/或視覺指示器結(jié)合一起用于確定對于片段合適的斷裂(例如基于句號或抄本中其它標點符號)。類