專利名稱:用于利用視頻內(nèi)容獲得文本關鍵字或短語以提供至基于網(wǎng)絡資源的內(nèi)容相關鏈接的方法 ...的制作方法
技術領域:
本發(fā)明一般涉及視頻信號處理,并且更具體地涉及用于根據(jù)從視頻內(nèi)容中提取的關鍵字或短語搜索出并獲得至通用資源定位符(URL)的交互式鏈接以便在交互式視頻節(jié)目中展示的方法和設備。
近年來,大家已共同努力集成各種系統(tǒng),以提供增強的信息交付和娛樂系統(tǒng)。例如,研究人員正在引入組合TV與計算機子系統(tǒng)的集成系統(tǒng),因此TV可用作WEB瀏覽器,或PC可用于增強TV觀看。
用于訪問在因特網(wǎng)上可獲得信息的一種方法包括用于顯示因特網(wǎng)信息的基本電視機和用于訪問來自因特網(wǎng)的選擇信息的“機頂盒”。機頂盒向相應的電視機提供訪問的信息,用于顯示。機頂盒一般是相對小的和經(jīng)濟的設備,其位于電視機附近,在消費者家用應用系統(tǒng)中用作與因特網(wǎng)的有效接口。
在這樣的機頂盒系統(tǒng)中,用戶通過使用遙控器來控制對因特網(wǎng)數(shù)據(jù)頁的訪問,并在電視(TV)上觀看數(shù)據(jù)頁。這些數(shù)據(jù)頁是從因特網(wǎng)中檢索的超文本頁(網(wǎng)頁)。機頂盒經(jīng)由通信線路連接到因特網(wǎng)。當系統(tǒng)的用戶操縱遙控器以訪問在特定服務器上的特定因特網(wǎng)頁時,機頂盒把用戶輸入轉(zhuǎn)換成稱作統(tǒng)一資源定位符(URL)的地址。然后,URL使指定的遠程服務器響應,并且經(jīng)由因特網(wǎng)向機頂盒發(fā)送指定的因特網(wǎng)頁(網(wǎng)頁)。然后,機頂盒把此數(shù)字數(shù)據(jù)轉(zhuǎn)換成適于在連接的電視屏幕上顯示的模擬格式。選擇的因特網(wǎng)頁可包含各種適當格式的各種文本和圖形信息。
在訪問選擇的因特網(wǎng)頁之后,機頂盒然后向電視提供被訪問的頁面,以便向系統(tǒng)觀看者顯示。使用遙控器,其中系統(tǒng)用戶可輸入各種類型的信息,以控制機頂盒和電視的操作。然而,遙控器對于這樣的交互式應用一般要求特定的編程或特殊的輸入密鑰。
還有,使用該方法查看和操縱存儲的因特網(wǎng)信息的頁面是相對辛苦和麻煩的過程。在TV廣播期間,如果系統(tǒng)用戶希望檢索一些關于TV廣播的信息(例如,特定導演或演員的背景),該用戶必須記錄特定的主題并且搜索URL地址。此外,用戶必須中斷他的或她的TV廣播的觀看以執(zhí)行因特網(wǎng)搜索,或者系統(tǒng)用戶必須等待,直至TV廣播中適當?shù)闹袛鄟韴?zhí)行因特網(wǎng)搜索。
在觀看電視節(jié)目的同時訪問與視頻顯示中的主題有關的附加信息例如因特網(wǎng)的能力將提供更有效和實際的方法來利用因特網(wǎng)信息。因此,由于上述理由,對于用戶,需要改進的系統(tǒng)和方法,以使用基于網(wǎng)絡的資源例如因特網(wǎng)來獲得與視頻顯示中的主題相關的附加信息,而不必有意中斷電視/視頻節(jié)目的觀看。
本發(fā)明提供一種方法和系統(tǒng),用于利用視頻顯示中的視頻內(nèi)容(例如電影片的片頭字幕或包含例如符號、字母等等的文本的視頻分段)來獲得文本關鍵字或短語,用于從基于網(wǎng)絡的資源(例如因特網(wǎng))中對于與視頻內(nèi)容主題相對應的信息提供內(nèi)容相關鏈接(例如,通用資源定位符,URL)。
根據(jù)本發(fā)明,用于利用視頻內(nèi)容獲得文本關鍵字或短語以便從基于網(wǎng)絡的資源中提供與視頻顯示中的視頻內(nèi)容主題相關的信息的內(nèi)容相關鏈接的系統(tǒng)包括提取器,被配置為從視頻顯示例如電視電影或節(jié)目中提取視頻內(nèi)容,例如片頭字幕或片尾字幕;識別器,被配置為產(chǎn)生視頻內(nèi)容中文本的文本表示;語法分析器,被配置為語法分析用于主題語言的視頻內(nèi)容的文本表示;和使用來自語法分析器的主題語言作為搜索標準的檢索功能,其中檢索功能搜索具有與主題語言匹配的信息的WEB站點,返回找到的WEB站點的URL,并將URL和主題語言相關聯(lián);以及接口,用于給用戶提供查看對于主題語言找到的信息的能力。
在一個實施例中,提供超級鏈接生成器,用于創(chuàng)建至查找到的信息的超級鏈接并在主題語言例如電影的片頭字幕上覆蓋超級鏈接。通過選擇片頭字幕(或覆蓋的超級鏈接),將用戶重新引導到給出有關選擇的“片頭字幕”項的更多信息的網(wǎng)絡站點。
從下列結合附圖考慮的詳細說明中,本發(fā)明的其他特征將變得明顯。
圖1是可在其中實現(xiàn)本發(fā)明的視頻處理系統(tǒng)的方框圖。
圖2是根據(jù)可在圖1的視頻處理系統(tǒng)中實現(xiàn)的本發(fā)明的說明性實施例的一種處理的示意圖,其中該處理用于利用視頻內(nèi)容獲得文本關鍵字或短語,以便從基于網(wǎng)絡的資源中提供用于與視頻顯示中的視頻內(nèi)容主題相關的信息的內(nèi)容相關鏈接。
應當理解,這些附圖僅僅用于說明本發(fā)明的概念而不意圖作為本發(fā)明的限制的定義。將認識到,自始至終使用相同的標號(根據(jù)適當情況,有可能補充參考字符)來標識相應部分。
圖1顯示了其中可以實現(xiàn)本發(fā)明的視頻處理系統(tǒng)10,利用視頻內(nèi)容獲得文本關鍵字或短語,以便從基于網(wǎng)絡的資源中提供與視頻顯示中的視頻內(nèi)容主題相關的信息的內(nèi)容相關鏈接。如在下面更詳細說明的,系統(tǒng)10可表示或包括電視、機頂盒、臺式、膝上型或掌上型計算機、個人數(shù)字助理(PDA)、諸如盒式錄像機(VCR)的視頻存儲設備、數(shù)字視頻記錄設備(DVR)、光盤、磁盤或基于固態(tài)的記錄設備例如TiVO或重放TV設備等等以及這些和其他設備的部分或組合。
系統(tǒng)10包括一個或多個視頻源12、一個或多個輸入/輸出設備14、處理器15、存儲器16和一個或多個基于網(wǎng)絡的資源20。視頻源12可以代表例如電視接收機、VCR或其他的視頻存儲設備或任何其他類型的視頻源。另外,源12還可以表示用于通過例如Internet的全球計算機通信網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、地面廣播系統(tǒng)、電纜網(wǎng)、衛(wèi)星網(wǎng)絡、無線網(wǎng)絡或電話網(wǎng)以及這些及其他類型網(wǎng)絡的部分或組合從電視網(wǎng)、服務器接收視頻的一個或多個服務提供商網(wǎng)絡連接。視頻源提供包含用戶希望觀看的內(nèi)容的免費或商業(yè)視頻信號,例如戲劇演出、節(jié)目、表演、按次計費電影等等。基于網(wǎng)絡的資源20表示用于從例如Internet的全球計算機通信網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、地面廣播系統(tǒng)、電纜網(wǎng)、衛(wèi)星網(wǎng)絡、無線網(wǎng)絡或電話網(wǎng)以及這些與其他類型網(wǎng)絡的部分或組合接收信息例如URL的一個或多個服務提供商網(wǎng)絡連接。
輸入-輸出設備14、處理器15和存儲器16通過通信媒體17通信。通信媒體可表示例如總線、通信網(wǎng)絡、電路的一個或多個內(nèi)部連接、電路卡或其他設備以及這些與其他通信媒體的部分和組合。例如,根據(jù)一個或多個存儲在存儲器16中并且由處理器15執(zhí)行的軟件程序,或使用被配置為以相似方式操作的專用硬件或固件,處理來自源12和基于網(wǎng)絡的資源20的輸入視頻,以生成下面進一步說明的輸出視頻,該輸出視頻被提供給顯示設備18,該顯示設備可以例如是電視顯示器、計算機監(jiān)視器等等。
處理器15有利地被配置為(1)從視頻顯示例如電視電影或節(jié)目中提取視頻內(nèi)容,例如開始或結束片頭字幕,(2)生成視頻內(nèi)容中文本的文本表示,(3)語法分析用于主題語言的視頻內(nèi)容的文本表示,(4)使用來自語法分析的文本表示的主題語言作為搜索標準來執(zhí)行搜索功能,其中檢索功能搜索具有與主題語言相匹配的信息的WEB站點,返回發(fā)現(xiàn)的WEB站點的URL,和(5)將URL與主題語言相關聯(lián)。
如圖1所示,簡檔數(shù)據(jù)庫22可用于存儲用戶特定數(shù)據(jù)。注意,簡檔數(shù)據(jù)庫116可與存儲器16集成。處理器15處理來自基于網(wǎng)絡的資源20的信息的文檔并訪問來自簡檔數(shù)據(jù)庫22的適當簡檔。簡檔表示與系統(tǒng)的特定用戶有關的信息。一個或多個簡檔可與用于不同用戶的特定系統(tǒng)相關。每個簡檔包括與先前的信息請求相關的信息。它們可能也包含由每個用戶提供的用戶偏好,通過處理器15使用表示先前信息請求的歷史信息確定的關于節(jié)目、電影等等的偏愛。
應當理解,如圖1所示的系統(tǒng)10的特定結構僅僅是示例性的。本領域技術人員將認識到,可以使用各種備選系統(tǒng)結構來實現(xiàn)本發(fā)明。
圖2顯示了根據(jù)本發(fā)明的說明性實施例的示例性處理100的示意圖,用于利用視頻顯示中的視頻內(nèi)容例如電影片的片頭字幕來獲得關鍵字或短語,以便為對應于視頻內(nèi)容的主題的信息從基于網(wǎng)絡的資源(例如,Internet)中提供內(nèi)容相關鏈接(例如,通用資源定位符,URL)。
此實施例中的處理100包括輸入信號接收操作102,例如電視電影或節(jié)目;提取操作104,用于從例如視頻/音頻信號的輸入信號中提取例如片頭或片尾字幕的視頻內(nèi)容;識別器操作106,用于生成視頻內(nèi)容中文本的文本表示;語法分析操作108,用于語法分析主題語言的視頻內(nèi)容的文本表示;和搜索操作110,使用來自語法分析器的主題語言作為搜索標準,其中檢索功能搜索基于網(wǎng)絡的資源,例如WEB站點,以查找與主題語言相匹配的信息,并且返回信息,例如找到的Web站點的URL;相關聯(lián)操作112,其將信息與主題語言相關聯(lián);以及再現(xiàn)(rendering)操作114,用于給用戶提供觀看為主題語言找到的信息的能力。
服務提供者將提供此處理以收取費用??梢允褂冒丛掠嗁徎蚋鶕?jù)每個節(jié)目來收取費用,這在系統(tǒng)10中進行說明(account for)。因此,使服務提供者能夠具有附加或選擇的收益來源。
可選擇地,基于網(wǎng)絡的資源擁有者如網(wǎng)站擁有者可以向系統(tǒng)10支付費用來使用其資源,如引導用戶到他們的網(wǎng)站,從而增加到那的通信量。
在提取操作104中,處理在系統(tǒng)10中接收的輸入視頻信號,以提取特定的視頻分段。特別有利的是從視頻顯示的開始或末尾提取視頻字幕信息。輸入視頻信號的部分例如開始和/或結束字幕視頻部分可以緩存或反而保存在適當?shù)拇鎯υO備中,例如,硬盤或與存儲器16相關的其他存儲設備或系統(tǒng)10的其他元件中。例如,使用傳統(tǒng)的硬盤記錄設備。
在識別器操作106中,該操作生成視頻內(nèi)容中文本的文本表示,使用對象字符識別(Object Character Recognition)(OCR)是特別有益的。一般,OCR包括圖像掃描器,用于光捕獲將要識別的文本圖像。以三個步驟處理文本圖像(1)文件分析(提取單個字符圖像),(2)識別這些圖像(根據(jù)形狀),和(3)上下文(contextual)處理(或者校正利用識別算法進行的誤分類或者限制識別選擇)。另外,可使用其他的常規(guī)方法來進行視頻字符識別。
此后,語法分析操作108語法分析用于主題語言的視頻內(nèi)容的文本表示。例如,演員的姓名。搜索操作110使用來自語法分析操作的主題語言作為搜索標準,其中搜索功能搜索基于網(wǎng)絡的資源例如WEB站點,以查找與主題語言匹配的信息,并返回信息,例如找到的用于WEB站點的URL。
用于系統(tǒng)10的通信層/棧的軟件設計可包括物理層和數(shù)據(jù)鏈路層以太網(wǎng),藍牙,1394,或其他的類似協(xié)議;網(wǎng)絡層和傳輸層IP和TCP協(xié)議;HTTP協(xié)議純后期特征(post feature only);簡單對象訪問協(xié)議(SOAP)僅僅讀/寫能力;使用文件對象模型(DOM)的XML語法分析器或用于XML(SAX)接口的簡單API。優(yōu)選地,使用微XML語法分析器(大小小于40KB),如2000年11月29日申請的U.S.專利申請09/725,970中所述的,其引用在這里作為參考;存儲器或至標簽閱讀器的串行接口。
SOAP是用于在分布式分散環(huán)境中交換信息的協(xié)議。SOAP是基于XML的協(xié)議,包括定義用于描述消息包含什么并且它將怎樣被處理的手段的包絡(envelope),用于表示應用限定數(shù)據(jù)類型的編碼規(guī)則,以及用于表示遠程過程調(diào)用和響應的協(xié)定。SOAP消息典型地從發(fā)送器單向傳輸?shù)浇邮掌?,但是它們可以被合并以實現(xiàn)例如請求/應答的模式。
HTTP是具有用于分布式協(xié)作超媒體信息系統(tǒng)所需的輕巧和速度的協(xié)議。它是通用無狀態(tài)的面向?qū)ο蟮膮f(xié)議,可被用于許多類似的任務,例如名稱服務程序,并且通過擴展使用的命令或“方法”,其是分布式面向?qū)ο蟮南到y(tǒng)。HTTP的特征是數(shù)據(jù)表示的協(xié)商,允許獨立于新的先進表示的發(fā)展來建立系統(tǒng)。
一般而言,通常使用傳輸控制協(xié)議/因特網(wǎng)協(xié)議(TCP/IP)通過Internet發(fā)送數(shù)據(jù)。
物理層涉及通過通信媒體信號傳輸?shù)碾?、機械和定時方面。系統(tǒng)10可以包括任何一個或更多各種眾所周知的層,例如調(diào)制解調(diào)器、以太網(wǎng)、蜂窩和藍牙。
現(xiàn)在,返回到圖2,在相關聯(lián)操作110中將接收的信息與主題語言相關聯(lián)。最后,在再現(xiàn)操作112中,給用戶提供觀看為主題語言找到的信息的能力。例如,至顯示單元或監(jiān)視器的接口。
根據(jù)本發(fā)明的另一個方面(未示出),以全自動方式能夠?qū)崿F(xiàn)這些技術,從而系統(tǒng)修改視頻信號。例如,重新格式化視頻信號,以包括與相應的視頻信號的字幕信息的鏈接,以便用戶訪問。這些鏈接對應于通過系統(tǒng)10找到的URL,以及由服務提供者提供的那些URL。
另外,為了在實時應用中增加系統(tǒng)性能,系統(tǒng)10可以使用可利用的電子節(jié)目指南(EPG)數(shù)據(jù)和視頻顯示的片頭字幕,在節(jié)目期間在背景中執(zhí)行搜索,并且高速緩存有關的視頻分段。此外,搜索可以被限制到受限的網(wǎng)站集合,以進一步改善速度。
下列僅僅說明本發(fā)明的原理。因而,將認識到,本領域技術人員將能設計出各種實施本發(fā)明的原理的安排,盡管在這里未明確地加以說明或顯示,但是這些安排包括在其精神和范圍內(nèi)。此外,在這里敘述的所有的例子和條件語言主要用于明確地表示僅用于教導的目的,以幫助讀者理解發(fā)明者所貢獻的本發(fā)明的原理和概念以進一步改進技術,并且將被認為不是對如此具體敘述的范例和條件的限制。
因此,例如,那些本領域技術人員將理解,這里的方框圖表示實施本發(fā)明原理的說明性電路的概念視圖。類似地,將理解,任何流程圖等等表示各種各樣處理,這些處理可以實質(zhì)上表示在計算機可讀媒體中,并由計算機或處理器執(zhí)行,不管是否明確地顯示了這樣的計算機或處理器。
可通過使用專用硬件以及能執(zhí)行軟件的與適當軟件相關聯(lián)的硬件,提供包括被標記為“處理器”的功能塊的顯示在圖1和2中的各種元件的功能。當由處理器提供時,可由單個專用處理器、由單個共享處理器或由其中一些可被共享的多個單個處理器來提供這些功能。此外,明確的使用術語“處理器”或“控制器”不應被認為僅僅指能執(zhí)行軟件的硬件,并且可能含蓄地無限制包括數(shù)字信號處理器(DSP)硬件、用于存儲軟件的只讀存儲器(ROM)、隨機存取存儲器(RAM)和非易失性存儲器。也可包括其他的硬件,傳統(tǒng)的和/或常用的??赏ㄟ^程序邏輯的操作、通過專用的邏輯、通過程序控制和專用邏輯的交互或甚至人工地執(zhí)行其功能,如更具體地從上下文理解的,可由實現(xiàn)者選擇特定的技術。
在其權利要求中,表示為用于執(zhí)行指定功能的裝置的任何元件預定包含執(zhí)行那個功能的任何方式,包括,例如,a)執(zhí)行那個功能的電路元件的組合,或b)任何形式的軟件,因此包括固件、微碼等等,與適當?shù)碾娐方M合,以執(zhí)行軟件,從而執(zhí)行該功能。正如這樣的權利要求所定義的本發(fā)明在于下列事實由各種敘述的裝置提供的功能以權利要求所要求的方式被組合和集合在一起。申請因此涉及能夠提供那些與本文所示等效的功能的任何裝置。
權利要求
1.一種進行事務活動的方法,包括以下步驟從輸入信號中提取預定的視頻分段;產(chǎn)生視頻分段的文本表示;語法分析用于主題語言的視頻分段的文本表示;使用主題語言作為搜索標準來搜索基于網(wǎng)絡的資源,其中搜索步驟搜索與主題語言相匹配的信息;將匹配信息與主題語言相關聯(lián);給用戶提供觀看為主題語言找到的匹配信息的能力;以及向用戶收取顯示匹配信息的費用。
2.一種用于為與視頻顯示中的視頻內(nèi)容主題相關的信息從基于網(wǎng)絡的資源中提供內(nèi)容相關鏈接的方法,該方法包括以下步驟從視頻顯示中提取視頻內(nèi)容;識別視頻內(nèi)容,以產(chǎn)生視頻內(nèi)容的文本表示;語法分析用于主題語言的視頻內(nèi)容的文本表示;使用主題語言搜索基于網(wǎng)絡的資源,其中搜索步驟確定具有與主題語言相匹配的信息的內(nèi)容相關鏈接;以及將內(nèi)容相關連接與主題語言相關聯(lián)。
3.如權利要求2所述的方法,進一步包括允許用戶使用相關聯(lián)的主題語言訪問內(nèi)容相關鏈接的步驟。
4.如權利要求2所述的方法,進一步包括存儲視頻內(nèi)容或內(nèi)容相關鏈接的步驟。
5.如權利要求2所述的方法,其中從由開頭字幕、結尾字幕和包含文本的視頻分段組成的組中選擇視頻顯示的視頻內(nèi)容。
6.如權利要求2所述的方法,其中內(nèi)容相關鏈接是URL。
7.一種用于為與視頻顯示中的視頻內(nèi)容主題有關的信息從基于網(wǎng)絡的資源中提供內(nèi)容相關鏈接的設備,該設備包括處理器,用于(1)從視頻顯示中提取視頻內(nèi)容,(2)識別視頻內(nèi)容,以產(chǎn)生視頻內(nèi)容的文本表示,(3)語法分析用于主題語言的視頻內(nèi)容的文本表示,(4)使用主題語言搜索基于網(wǎng)絡的資源,其中搜索步驟確定具有與主題語言相匹配的信息的內(nèi)容相關鏈接;以及(5)將內(nèi)容相關鏈接與主題語言相關聯(lián);以及存儲器,其能夠存儲內(nèi)容相關鏈接。
8.如權利要求7所述的設備,其中處理器進一步被配置為允許用戶使用相關聯(lián)的主題語言訪問內(nèi)容相關鏈接。
9.如權利要求7所述的設備,其中存儲器能夠存儲視頻內(nèi)容。
10.如權利要求8所述的設備,其中處理器進一步包括為用戶訪問內(nèi)容相關鏈接計算費用。
11.如權利要求6所述的設備,其中從由開始字幕、結尾字幕和包含文本的視頻分段組成的組中選擇視頻顯示的視頻內(nèi)容。
12.如權利要求6所述的設備,其中內(nèi)容相關鏈接是URL。
13.如權利要求8所述的設備,進一步包括顯示器,其允許觀看包含在內(nèi)容相關鏈接中的信息。
全文摘要
提供一種方法和系統(tǒng),用于利用視頻內(nèi)容獲得文本關鍵字或短語,以便對于與視頻顯示中的視頻內(nèi)容主題相關的信息從基于網(wǎng)絡的資源中提供內(nèi)容相關鏈接,包括提取器,被配置為從視頻顯示例如電視電影或節(jié)目中提取例如片頭字幕或片尾字幕的視頻內(nèi)容;識別器,被配置為產(chǎn)生視頻內(nèi)容中文本的文本表示;語法分析器,被配置為語法分析用于主題語言的視頻內(nèi)容的文本表示;和使用來自語法分析器的主題語言作為搜索標準的搜索功能,其中搜索功能搜索具有與主題語言匹配的信息的WEB站點,返回找到的WEB站點的URL,并將URL和主題語言相關聯(lián);以及用于給用戶提供觀看為主題語言找到的信息的能力的接口。
文檔編號H04N7/173GK1723458SQ200380105676
公開日2006年1月18日 申請日期2003年12月4日 優(yōu)先權日2002年12月11日
發(fā)明者P·S·紐頓, D·P·凱利 申請人:皇家飛利浦電子股份有限公司