額外豐富內(nèi)容元數(shù)據(jù)生成器的制造方法
【專利摘要】本公開涉及額外豐富內(nèi)容元數(shù)據(jù)生成器。在一個(gè)實(shí)施方式中,方法包括接收與由內(nèi)容提供者提供的內(nèi)容項(xiàng)相關(guān)的內(nèi)容元數(shù)據(jù);從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),額外元數(shù)據(jù)包括內(nèi)容元數(shù)據(jù)的語言變化版本;將內(nèi)容元數(shù)據(jù)連同額外元數(shù)據(jù)存儲在存儲設(shè)備中,其中內(nèi)容元數(shù)據(jù)被存儲為與額外元數(shù)據(jù)關(guān)聯(lián);接收來自用戶的搜索請求,搜索請求包括以第一語言變化版本表示的一個(gè)或多個(gè)搜索項(xiàng);在內(nèi)容元數(shù)據(jù)或者額外元數(shù)據(jù)中識別匹配一個(gè)或多個(gè)搜索項(xiàng)的相關(guān)元數(shù)據(jù);識別存儲為與相關(guān)元數(shù)據(jù)關(guān)聯(lián)的額外的相關(guān)元數(shù)據(jù),額外的相關(guān)元數(shù)據(jù)包括相關(guān)元數(shù)據(jù)的語言變化版本;以及增加一個(gè)或多個(gè)額外搜索項(xiàng)至搜索請求,一個(gè)或多個(gè)額外搜索項(xiàng)對應(yīng)于額外相關(guān)元數(shù)據(jù)。
【專利說明】額外豐富內(nèi)容元數(shù)據(jù)生成器
【技術(shù)領(lǐng)域】
[0001] 本公開內(nèi)容總體上涉及用于內(nèi)容元數(shù)據(jù)生成的方法和裝置。
【背景技術(shù)】
[0002] 隨著新的混合網(wǎng)絡(luò)(除了具有廣播能力(例如,地面電視(TV)、衛(wèi)星TV、電纜TV), 還具有寬帶因特網(wǎng)能力(例如,數(shù)字用戶線路(DSL)或者電纜))的迅速發(fā)展,流媒體內(nèi)容 變得越來越流行?,F(xiàn)在用戶可利用和可進(jìn)入包括多媒體和視聽覺(AV)內(nèi)容的越來越多的 內(nèi)容。這樣大量的增加可能隨著傳統(tǒng)的廣播產(chǎn)業(yè)通過開發(fā)新一代的機(jī)頂盒(STB)和能夠流 傳送和回放此類內(nèi)容的配套設(shè)備(例如,計(jì)算機(jī)、移動電話、平板電腦、手持設(shè)備等)進(jìn)入互 聯(lián)網(wǎng)電視機(jī)頂盒業(yè)務(wù)(OTT)匯聚世界而進(jìn)一步增加。TV用戶現(xiàn)在期望TV內(nèi)容搜索與它們 在因特網(wǎng)世界中一樣簡單、豐富和高效。
【發(fā)明內(nèi)容】
[0003] 因此,根據(jù)本發(fā)明的一個(gè)方面,提出一種方法,包括:接收與由內(nèi)容提供者提供的 內(nèi)容項(xiàng)有關(guān)的內(nèi)容元數(shù)據(jù);從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),額外元數(shù)據(jù)包括內(nèi)容元 數(shù)據(jù)的語言變化版本;將內(nèi)容元數(shù)據(jù)連同額外元數(shù)據(jù)存儲在存儲設(shè)備中,其中,內(nèi)容元數(shù)據(jù) 被存儲為與額外元數(shù)據(jù)關(guān)聯(lián);接收來自用戶的搜索請求,搜索請求包括以第一語言變化版 本表示的一個(gè)或多個(gè)搜索項(xiàng);在內(nèi)容元數(shù)據(jù)或者額外元數(shù)據(jù)中識別匹配一個(gè)或多個(gè)搜索項(xiàng) 的相關(guān)元數(shù)據(jù);識別存儲為與相關(guān)元數(shù)據(jù)關(guān)聯(lián)的額外的相關(guān)的元數(shù)據(jù),額外的相關(guān)的元數(shù) 據(jù)包括相關(guān)元數(shù)據(jù)的語言變化版本;以及增加一個(gè)或多個(gè)額外的搜索項(xiàng)至搜索請求,一個(gè) 或多個(gè)額外的搜索項(xiàng)對應(yīng)于額外的相關(guān)的元數(shù)據(jù)。
[0004] 根據(jù)本發(fā)明的另一個(gè)方面,提出一種裝置,包括:管理單元,可操作地接收與由內(nèi) 容提供者提供的內(nèi)容項(xiàng)相關(guān)的內(nèi)容元數(shù)據(jù);創(chuàng)建單元,可操作地從一個(gè)或多個(gè)外部源檢索 額外元數(shù)據(jù),額外元數(shù)據(jù)包括內(nèi)容元數(shù)據(jù)的語言變化版本;存儲單元,可操作地存儲內(nèi)容元 數(shù)據(jù)連同額外元數(shù)據(jù),其中,內(nèi)容元數(shù)據(jù)被存儲為與額外元數(shù)據(jù)關(guān)聯(lián);其中,管理單元被另 外可操作為:接收來自用戶的搜索請求,搜索請求包括以第一語言變化版本表示的一個(gè)或 多個(gè)搜索項(xiàng);在內(nèi)容元數(shù)據(jù)或者額外元數(shù)據(jù)中識別匹配一個(gè)或多個(gè)搜索項(xiàng)的相關(guān)元數(shù)據(jù); 識別存儲為與相關(guān)元數(shù)據(jù)關(guān)聯(lián)的額外的相關(guān)的元數(shù)據(jù),額外的相關(guān)的元數(shù)據(jù)包括相關(guān)元數(shù) 據(jù)的語言變化版本;以及增加一個(gè)或多個(gè)額外的搜索項(xiàng)至搜索請求,一個(gè)或多個(gè)額外的搜 索項(xiàng)對應(yīng)于額外的相關(guān)的元數(shù)據(jù)。
[0005] 根據(jù)本發(fā)明的又一方面,提出一種或多種計(jì)算機(jī)可讀有形存儲介質(zhì),利用包括計(jì) 算機(jī)可執(zhí)行指令的軟件編碼并且當(dāng)軟件被執(zhí)行時(shí),可操作為:接收與由內(nèi)容提供者提供的 內(nèi)容項(xiàng)相關(guān)的內(nèi)容元數(shù)據(jù);從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),額外元數(shù)據(jù)包括所接收 的內(nèi)容元數(shù)據(jù)的語言變化版本;將所接收的內(nèi)容元數(shù)據(jù)連同額外元數(shù)據(jù)存儲在存儲設(shè)備 中,其中,所接收的內(nèi)容元數(shù)據(jù)被存儲為與額外元數(shù)據(jù)關(guān)聯(lián);接收來自用戶的搜索請求,搜 索請求包括以第一語言變化版本表示的一個(gè)或多個(gè)搜索項(xiàng);在所接收的內(nèi)容元數(shù)據(jù)或者額 外元數(shù)據(jù)中識別匹配一個(gè)或多個(gè)搜索項(xiàng)的相關(guān)元數(shù)據(jù);識別存儲為與所識別的相關(guān)元數(shù)據(jù) 關(guān)聯(lián)的額外的相關(guān)的元數(shù)據(jù),額外的相關(guān)的元數(shù)據(jù)包括所識別的相關(guān)元數(shù)據(jù)的語言變化版 本;以及增加一個(gè)或多個(gè)額外的搜索項(xiàng)至搜索請求,一個(gè)或多個(gè)額外的搜索項(xiàng)對應(yīng)于額外 的相關(guān)的元數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0006] 結(jié)合附圖,從以下詳細(xì)描述中將更充分地理解并領(lǐng)會本發(fā)明,在附圖中:
[0007] 圖1是根據(jù)本發(fā)明的實(shí)施方式構(gòu)造和操作的系統(tǒng)的簡化框圖示圖;
[0008] 圖2是根據(jù)本發(fā)明的實(shí)施方式構(gòu)造和操作的包括額外豐富(extra-rich,超豐富) 內(nèi)容元數(shù)據(jù)生成器的系統(tǒng)的簡化框圖示圖;
[0009] 圖3是描述根據(jù)本發(fā)明的實(shí)施方式的操作額外豐富內(nèi)容元數(shù)據(jù)生成器的方法的 流程圖;和
[0010] 圖4是根據(jù)本發(fā)明的實(shí)施方式的與具體演員相關(guān)的不同的元數(shù)據(jù)之間的關(guān)系的 方框圖示圖。
【具體實(shí)施方式】
[0011] 概述
[0012] 在一個(gè)實(shí)施方式中,方法包括接收與由內(nèi)容提供者提供的內(nèi)容項(xiàng)相關(guān)的內(nèi)容元數(shù) 據(jù);從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),額外元數(shù)據(jù)包括內(nèi)容元數(shù)據(jù)的語言變化版本; 將內(nèi)容元數(shù)據(jù)與額外元數(shù)據(jù)存儲在存儲設(shè)備中,其中,內(nèi)容元數(shù)據(jù)被存儲為與額外元數(shù)據(jù) 關(guān)聯(lián);接收來自用戶的搜索請求,搜索請求包括以第一語言變化版本表示的一個(gè)或多個(gè)搜 索項(xiàng);在內(nèi)容元數(shù)據(jù)或者額外元數(shù)據(jù)中識別匹配一個(gè)或多個(gè)搜索項(xiàng)的相關(guān)的元數(shù)據(jù);識別 存儲為與相關(guān)的元數(shù)據(jù)關(guān)聯(lián)的額外的相關(guān)的元數(shù)據(jù),額外的相關(guān)的元數(shù)據(jù)包括相關(guān)的元數(shù) 據(jù)的語言變化版本;并且增加一個(gè)或多個(gè)額外的搜索項(xiàng)至搜索請求,一個(gè)或多個(gè)額外的搜 索項(xiàng)對應(yīng)于額外的相關(guān)的元數(shù)據(jù)。
[0013] 示例性實(shí)施方式
[0014] 在以下描述中,闡述大量的具體細(xì)節(jié)以提供對本發(fā)明的各種原理的全面理解。然 而,本領(lǐng)域技術(shù)人員將理解不是所有這些細(xì)節(jié)始終必要地需要用于實(shí)踐本發(fā)明。在此情況 下,為了避免不必要地使一般概念模糊,并未詳細(xì)地示出眾所周知的電路、控制邏輯、和用 于慣用算法和處理的計(jì)算機(jī)程序指令的細(xì)節(jié)。
[0015] 雖然本發(fā)明的原理在此被大量地描述為與電視廣播和OTT環(huán)境以及相關(guān)的電視 應(yīng)用有關(guān),這個(gè)是為方便展現(xiàn)起見選擇的示例,沒有限制性。
[0016] 類似地,雖然本發(fā)明的原理在此被大量地描述為與漢語語言變化版本和格式有 關(guān),這個(gè)是為方便展現(xiàn)起見選擇的示例,沒有限制性。
[0017] 在一些國家中和/或?qū)τ谀承┱Z言,使用傳統(tǒng)的遠(yuǎn)程控制搜索內(nèi)容(諸如TV節(jié) 目、與演員/導(dǎo)演等相關(guān)的額外的信息)不容易、不方便、和甚至有時(shí)不可能。例如,使用通 常僅支持拉丁字的傳統(tǒng)的遠(yuǎn)程控制來輸入漢字是困難的。因此,在傳統(tǒng)的電視廣播世界的 這些區(qū)域中,內(nèi)容搜索不被看做是重要的業(yè)務(wù)范圍。然而,電視廣播產(chǎn)業(yè)正在進(jìn)入具有用作 用于內(nèi)容消耗的新媒體的配套設(shè)備(例如,個(gè)人計(jì)算機(jī)、智能電話、平板電腦等)的提升的 多屏融合世界。這些配套設(shè)備提供包括新的和更加便利的搜索的新的功能和語言輸入能 力。實(shí)際上,用戶現(xiàn)在可以使用不同的輸入類型例如,諸如繪制或者鍵入字(例如,中文簡 體字和繁體字)的人工錄入、聲音錄入等搜索。因此,可靠的跨平臺內(nèi)容搜索支持變?yōu)榇祟?國家和/或語言的重要的發(fā)行物。
[0018] 并且,TV用戶現(xiàn)在期望內(nèi)容搜索與他們在因特網(wǎng)世界中一樣簡單和高效。通常, 提供搜索因特網(wǎng)以發(fā)現(xiàn)包含一個(gè)或多個(gè)指定關(guān)鍵字的內(nèi)容的搜索引擎(軟件程序),并 且返回與含有關(guān)鍵字的內(nèi)容鏈接的搜索結(jié)果條目。諸如Google(www. google, com)或者 Yahoo(www. yahoo, com)的廣泛搜索引擎使用網(wǎng)絡(luò)爬蟲(Web crawler)訪問非常大量的內(nèi) 容項(xiàng)(例如,網(wǎng)頁)。然后,稱為索引器的另一個(gè)程序解析這些內(nèi)容項(xiàng)并且基于每個(gè)內(nèi)容項(xiàng) 的元數(shù)據(jù)創(chuàng)建搜索索引。每個(gè)搜索引擎使用專有算法創(chuàng)建索引以理想地僅返回用于每個(gè)查 詢的有意義的搜索結(jié)果。然而,由于某些語言的復(fù)雜性和多樣性,原始的內(nèi)容元數(shù)據(jù)可能無 法提供足夠的信息以允許搜索引擎返回一致的和/或精確的搜索結(jié)果。再次參考中文語言 示例,不同類型的書面中文格式在不同的區(qū)域中存在。簡體中文通常在中國大陸使用,而繁 體中文在香港和臺灣使用。此外,這些不同的區(qū)域也可以使用不同的方言。事實(shí)上,普通話 是中國大陸的官方語言(也被稱作漢語拼音-在下文中稱為拼音),然而,廣東話廣泛地用 于香港或者甚至在中國大陸的南部(威妥瑪式拼音法(Wade-Giles Romanization)-在下 文中稱作香港拼音)。并且,臺灣有其自己的稍微不同于漢語和香港拼音的語言發(fā)音(臺灣 通用拼音-在下文中稱作臺灣拼音)。這些拼音變化版本被中國用戶廣泛地用作關(guān)鍵字輸 入,因?yàn)樗鼈儽晦D(zhuǎn)錄為拉丁字,并且因此更加便利的進(jìn)行搜索(尤其利用僅支持拉丁字輸 入的遠(yuǎn)程控制)。例如,如果用戶搜索與"Jackie Chan"(眾所周知的演員)相關(guān)的內(nèi)容并 且使用它的簡體中文格式("成龍")作為關(guān)鍵字,然后將僅回復(fù)包含這個(gè)具體書面格式的 搜索結(jié)果。利用以另一個(gè)格式書面的元數(shù)據(jù)的索引的內(nèi)容項(xiàng),諸如:
[0019] 繁體中文:"成龍";
[0020] 拼音:"Cheng Long,';
[0021] 香港拼音:"Sing Lung" ;
[0022] 臺灣拼音:"Cheng Lung" ;或者
[0023] 甚至英語:"Jackie Chan"。
[0024] 可能沒有發(fā)現(xiàn),并且因此沒有作為搜索的結(jié)果返回至用戶。為了返回更加精確的 和一致的搜索結(jié)果,用戶行為也是可以被考慮的標(biāo)準(zhǔn)。利用上文給出的示例進(jìn)一步進(jìn)行,觀 察到繁體中文用戶大量使用拼音簡寫作為關(guān)鍵字搜索。拼音簡寫通常對應(yīng)于全部拼音的首 個(gè)字母/字。以下給出"Jackie Chan"的拼音簡寫:
[0025] "CL" 用于大陸(Cheng Long)和臺灣(Cheng Lung)拼音;和
[0026] "SL" 用于香港拼音(Sing Lung)。
[0027] 因此,需要能夠考慮語言變化版本、用戶的行為和簡檔,從而提供更加準(zhǔn)確的、個(gè) 性化的和相關(guān)搜索結(jié)果的系統(tǒng)。例如,使用"CL"作為關(guān)鍵字搜索的臺灣用戶應(yīng)當(dāng)能夠接收 包括"Jackie Chan"作為演員的電影的繁體中文格式的搜索結(jié)果。
[0028] 另一個(gè)挑戰(zhàn)涉及地理的和版權(quán)限制。對于OTT平臺,地理限制不再是問題。在開 放因特網(wǎng)世界中,用戶(例如,注冊消費(fèi)者)可以自身位于世界各地通過OTT消費(fèi)內(nèi)容。然 而,在某些區(qū)域/范圍中,對一些內(nèi)容項(xiàng)的訪問可能被限制和/或不同版本的相同的內(nèi)容項(xiàng) 可以由于文化差異、版權(quán)或者其他管制法律被廣播。例如,"泰坦尼克3D"電影的定制版本 在中國大陸被特殊準(zhǔn)備和播放-即,一些場景被去除-但是"斷背山"電影沒有被允許播 放。而且,電影片名在電影被播放時(shí)可以被翻譯為國家語言。在中文示例中情形甚至更加 復(fù)雜,因?yàn)殡娪捌梢员环g為多種中文片名。為了闡明這個(gè),考慮詹姆斯邦德的最后的 片名為"Skyfall"的電影的示例。在中國,"Skyfall"可以被翻譯為 :
[0029] 中國大陸的"大破天幕殺機(jī)";
[0030] 香港(繁體中文)的"新鐵金剛:智破天兇城";和
[0031] 臺灣(繁體中文)的"空降危機(jī)"。
[0032] 增加拼音變化版本和簡寫,"Skyfall"還可以被翻譯為:
[0033] 大陸拼音的"Da Po Tian Mu Sha Ji "和"TMSJ"作為相應(yīng)的簡寫,"Da Po"通常 被忽略因?yàn)槠錇樾稳菰~;
[0034] 香港拼音的"Zhi Po Tian Xiong Cheng"和相應(yīng)的簡寫"ZPTXC";以及
[0035] 臺灣拼音的"Kong Jiang Wei Ji "和相應(yīng)的簡寫"KJWJ"。
[0036] 本領(lǐng)域技術(shù)人員將理解存在其他非標(biāo)準(zhǔn)的形式諸如:"詹姆斯邦德2012"、或者 "邦德23"等。因此,需要能夠考慮這些限制的系統(tǒng)。
[0037] 本發(fā)明,在其實(shí)施方式中,提供當(dāng)考慮區(qū)域和/或版權(quán)限制時(shí)使用戶能夠輕易地 進(jìn)行內(nèi)容搜索并且獲得準(zhǔn)確、個(gè)性化和一致的搜索結(jié)果的改善方法和相關(guān)的裝置。
[0038] 現(xiàn)在參考圖1,它是根據(jù)本發(fā)明的實(shí)施方式構(gòu)造和操作系統(tǒng)的簡化的方框圖示圖。
[0039] 頭端110通常通過通信網(wǎng)絡(luò)130與多個(gè)客戶端設(shè)備120通信。附帶地或可選地,多 個(gè)頭端110與單個(gè)的客戶端設(shè)備120或者通過通信網(wǎng)絡(luò)130與多個(gè)客戶端設(shè)備120通信。 為了描繪和描述的簡單性,并且不限制本發(fā)明的一般性,在圖1中示出與僅一個(gè)頭端110通 信的僅一個(gè)客戶端設(shè)備120。
[0040] 通信網(wǎng)絡(luò)130包括以下中至少一個(gè):基于衛(wèi)星的通訊網(wǎng)絡(luò);基于電纜的通訊網(wǎng)絡(luò); 常規(guī)地面廣播電視網(wǎng)絡(luò);基于電話的通訊網(wǎng)絡(luò);基于電話的電視廣播網(wǎng)絡(luò);基于移動電話 的電視廣播網(wǎng)絡(luò);互聯(lián)網(wǎng)協(xié)議(IP)電視廣播網(wǎng)絡(luò);以及基于計(jì)算機(jī)的通訊網(wǎng)絡(luò)。應(yīng)理解,在 替換的實(shí)施方式中,通信網(wǎng)絡(luò)130可以,例如,通過雙向混合通信網(wǎng)絡(luò),諸如組合電纜-電話 網(wǎng)絡(luò),組合衛(wèi)星-電話網(wǎng)絡(luò),基于組合衛(wèi)星-計(jì)算機(jī)通信網(wǎng)絡(luò),或者通過任何其他適當(dāng)?shù)木W(wǎng) 絡(luò)實(shí)現(xiàn)。對于本領(lǐng)域的一些技術(shù)人員,實(shí)現(xiàn)通信網(wǎng)絡(luò)130的其他方式將是明顯的。
[0041] 客戶端設(shè)備120可以是能夠通過通信網(wǎng)絡(luò)130與頭端110通信的任何類型的設(shè) 備。客戶端設(shè)備120可以是例如(但是不限制本發(fā)明的一般性),機(jī)頂盒(STB)、PVR(個(gè)人 的視頻信號記錄器)、DVR (數(shù)字視頻記錄器)、諸如便攜式計(jì)算機(jī)、臺式機(jī)或者個(gè)人計(jì)算機(jī) (PC)的配套設(shè)備、諸如iPadTM的平板電腦、諸如個(gè)人數(shù)字助理(PDA)的可移動計(jì)算裝置、移 動電話、或者任何合適的手持設(shè)備。圖1示出設(shè)置在頭端110和顯示設(shè)備140之間的客戶端 設(shè)備120。在此類情形中,客戶端設(shè)備120通常通過數(shù)字AV接口(例如,HDMI、DVI等)或 者通過模擬AV接口(例如,單元(RGB、YPbPr)、混合式(NTSC、PAL、SECAM)、S-視頻、SCART、 RF同軸、D-端子(D-端子)等)操作連接至顯示設(shè)備140。盡管在圖1中作為分離的實(shí)體 示出,在本發(fā)明的其他實(shí)施例中,客戶端設(shè)備120可以是具有顯示設(shè)備140的整體。
[0042] 顯示設(shè)備140通常由用戶,例如通過遠(yuǎn)程控制單元(RCU) 150操作。本領(lǐng)域技術(shù)人 員將理解可以使用諸如PC、移動電話、平板電腦或者其他合適的手持設(shè)備的其他設(shè)備操作 顯示設(shè)備140。根據(jù)使用的設(shè)備,用戶可以使用包括例如,用于計(jì)算機(jī)的計(jì)算機(jī)鼠標(biāo)、用于移 動電話的鍵盤按鈕、或者甚至用于支持直接操縱的設(shè)備的用戶的手指的各種方法錄入搜索 關(guān)鍵字。通過使用一個(gè)或多個(gè)在上文作為示例給出的各種手段,用戶可以搜索、瀏覽、請求、 和選擇AV內(nèi)容以觀看(諸如實(shí)時(shí)事件廣播、視頻點(diǎn)播(VOD)資產(chǎn)、記錄事件等)或者任何 合適的信息和/或元數(shù)據(jù)。客戶端設(shè)備120內(nèi)的操作系統(tǒng)軟件監(jiān)測與顯示設(shè)備140和/或 客戶端設(shè)備120的用戶交互。
[0043] 此外,通常位于頭端側(cè)110的額外豐富內(nèi)容元數(shù)據(jù)生成器160(ERCMG)可操作地通 過通信網(wǎng)絡(luò)130與搜索引擎170和客戶端設(shè)備120通信。圖1僅示出一個(gè)通信網(wǎng)絡(luò)130。 盡管在圖1中示出為被嵌入頭端110,本領(lǐng)域技術(shù)人員將理解在本發(fā)明的進(jìn)一步實(shí)施方式 中,ERCMG 160可以是可操作與頭端110通信的分離的實(shí)體。
[0044] 最后,提供搜索引擎170(作為頭端110的單元示出)。當(dāng)用戶操作RCU 150和選 擇菜單時(shí),輸入一個(gè)或多個(gè)搜索項(xiàng)諸如字和/或數(shù)量或者通過在顯示設(shè)備140 (嵌入和/或 相關(guān)于客戶端設(shè)備120)上顯示的應(yīng)用進(jìn)行動作,可以通過通信網(wǎng)絡(luò)130將請求發(fā)送至頭端 110并且由搜索引擎170接收。請求可以是對元數(shù)據(jù)、TV節(jié)目或者內(nèi)容、或者任何其他額外 的信息的請求。然后,搜索引擎170可以將請求傳遞/轉(zhuǎn)發(fā)至ERCMG 160。作為響應(yīng),ERCMG 160返回包括原始的搜索請求的不同的語言變化版本的相關(guān)的額外豐富元數(shù)據(jù)至搜索引 擎170,并且通過增加這個(gè)相關(guān)的額外豐富元數(shù)據(jù)至原始的搜索請求來更新請求。然后,搜 索引擎使用更新的搜索請求進(jìn)行搜索并且一組相關(guān)的搜索結(jié)果在顯示在顯示設(shè)備140上 之前被發(fā)送回至客戶端設(shè)備120。ERCMG 160還能夠通過考慮與用戶相關(guān)的有用的情境信 息諸如,例如(但是不限制本發(fā)明的一般性),地理位置、初始語言輸入、簡檔、優(yōu)選、搜索歷 史等適應(yīng)搜索結(jié)果的相關(guān)性/排列。這樣做,定義如何排列和顯示搜索結(jié)果的權(quán)重規(guī)則由 ERCMG 160使用所述情境信息創(chuàng)建并然后應(yīng)用在通過搜索引擎170獲得的搜索結(jié)果上。
[0045] 現(xiàn)在參考圖2,圖2是根據(jù)本發(fā)明的實(shí)施方式的包括額外豐富內(nèi)容元數(shù)據(jù)生成器 (ERCMG)的系統(tǒng)的簡化框圖示圖。以下將詳細(xì)地描述與圖3的方法有關(guān)的圖2的系統(tǒng)的操 作。
[0046] 過程在步驟300開始,并且在步驟301,內(nèi)容提供者202 (例如,TV操作員)發(fā)送 與內(nèi)容項(xiàng)(例如,構(gòu)成TV時(shí)間表或者VOD目錄的部分的程序)相關(guān)的內(nèi)容元數(shù)據(jù)至ERCMG 260。通常,內(nèi)容元數(shù)據(jù)可以被通過資產(chǎn)分配接口(ADI)、使用元數(shù)據(jù)描述(例如,電纜實(shí)驗(yàn) 室ADI規(guī)格描述資源(諸如TV節(jié)目和商業(yè)廣告)如何可以從內(nèi)容源極分配至TV廣播員)定 義資源如何標(biāo)記和分類的產(chǎn)業(yè)方針、或者線性業(yè)務(wù)量信息接口(例如,XML流量接口(XTI), 其為用于輸入XML格式化流量數(shù)據(jù)至流動數(shù)據(jù)庫服務(wù)器和從流動數(shù)據(jù)庫服務(wù)器輸出XML格 式化流量數(shù)據(jù)的基于Java的應(yīng)用)被接收和攝入。本領(lǐng)域技術(shù)人員將理解可以使用任何 其他合適的用于元數(shù)據(jù)攝入的格式。一旦攝入,內(nèi)容元數(shù)據(jù)被存儲和索引在ERCM數(shù)據(jù)庫 266中從而對用戶可用。在攝入期間或者攝入之后,一些或者所有攝入內(nèi)容元數(shù)據(jù)被轉(zhuǎn)發(fā) 至ERCMG 260和由ERCM管理單元261接收。通常,在內(nèi)容制備平臺期間,這個(gè)內(nèi)容元數(shù)據(jù) 攝入操作預(yù)先在內(nèi)容提供者/TV操作者的控制下進(jìn)行。
[0047] 在步驟302, ERCM創(chuàng)建子單元262檢查ERCM管理單元261接收的內(nèi)容元數(shù)據(jù)并且 然后使用一個(gè)或多個(gè)網(wǎng)絡(luò)爬蟲來檢索額外元數(shù)據(jù)從而使內(nèi)容提供者提供的原始的內(nèi)容元 數(shù)據(jù)豐富。通常,網(wǎng)絡(luò)爬蟲被用于訪問、解析和從外源諸如(但是不限制本發(fā)明的一般性), 由內(nèi)容提供者指定的網(wǎng)站入口提取元數(shù)據(jù)。本領(lǐng)域技術(shù)人員將理解,任何其他合適的網(wǎng)絡(luò) 來源可以被訪問,只要網(wǎng)絡(luò)爬蟲能夠解析和提取來自該網(wǎng)絡(luò)源的元數(shù)據(jù)。在本發(fā)明的一個(gè) 實(shí)施方式中,網(wǎng)絡(luò)爬蟲被用于搜索與原始的內(nèi)容元數(shù)據(jù)的子集相關(guān)的額外元數(shù)據(jù)。例如,由 內(nèi)容提供者提供的原始的內(nèi)容元數(shù)據(jù)可以包括用于每個(gè)TV或者VOD節(jié)目的一個(gè)或多個(gè)圖 像、類型和/或次類型、片名、開始和結(jié)束時(shí)間、持續(xù)時(shí)間、一個(gè)或多個(gè)視頻、摘錄、不同演員 的名字、導(dǎo)演的名字等。因此,網(wǎng)絡(luò)爬蟲可以檢索在TV或者VOD節(jié)目中呈現(xiàn)的與片名或者 演員相關(guān)的額外元數(shù)據(jù)。這些額外元數(shù)據(jù)通常包括對應(yīng)于原始的內(nèi)容元數(shù)據(jù)的區(qū)域或者語 言變化版本的演員/導(dǎo)演/標(biāo)題的額外的名字,版權(quán)信息和區(qū)域限制等。
[0048] 在中文語言和區(qū)域變化版本的背景下,網(wǎng)絡(luò)爬蟲可以訪問不同的門戶網(wǎng)絡(luò)諸如例 如(但是不限制本發(fā)明的一般性),時(shí)光網(wǎng)(中國大陸的內(nèi)容元數(shù)據(jù)門戶網(wǎng)絡(luò))、香港雅虎 電影、或者True電影(臺灣)并且提取以書面的漢字表示的額外元數(shù)據(jù)。在包括原始的內(nèi) 容元數(shù)據(jù)的情形中,例如:
[0049] "Jackie Chan"作為演員,網(wǎng)絡(luò)爬蟲可以能夠檢索以下對應(yīng)于其區(qū)域和/或語言變 化版本以及社交共用名字的額外元數(shù)據(jù)中至少一個(gè):
[0050] 簡體中文的"成龍";
[0051] 繁體中文的"成龍";和/或
[0052] Jackie Chan的中文原名"陳港生"。
[0053] "Skyfall"作為電影片名,網(wǎng)絡(luò)爬蟲可以能夠檢索以下對應(yīng)于其區(qū)域和/或語言 變化版本以及社交共用名稱的額外元數(shù)據(jù)中至少一個(gè):
[0054] 中國大陸的"大破天幕殺機(jī)";
[0055] 香港(繁體中文)的"新鐵金剛:智破天兇城";
[0056] 臺灣(繁體中文)的"空降危機(jī)";和/或
[0057] 作為社交共用名字的"詹姆斯邦德2012"或者"邦德23"。
[0058] 對本領(lǐng)域中的技術(shù)人員顯而易見的是原始的內(nèi)容元數(shù)據(jù)可以被以任何合適的格 式設(shè)置并且網(wǎng)絡(luò)爬蟲被配置為檢索缺失的額外元數(shù)據(jù)。
[0059] 在步驟303,確定是否網(wǎng)絡(luò)爬蟲沒有發(fā)現(xiàn)一個(gè)或多個(gè)額外元數(shù)據(jù)。如果成功地檢索 所有的額外元數(shù)據(jù),然后過程直接進(jìn)行至步驟305。相反地,在缺失一個(gè)或多個(gè)額外元數(shù)據(jù) 的情形中,創(chuàng)建子單元262的ERCM可以在移動至步驟305之前在步驟304通過詞典檢查來 檢索缺失的額外元數(shù)據(jù)。
[0060] 一旦被網(wǎng)絡(luò)爬蟲檢索到,額外元數(shù)據(jù)被集中并且可以被存儲為與原始的內(nèi)容元數(shù) 據(jù)在多個(gè)索引中關(guān)聯(lián)或者在ERCM數(shù)據(jù)庫266的表267和268中。通常,原始的內(nèi)容元數(shù)據(jù) 利用它們相應(yīng)的額外元數(shù)據(jù),即,對應(yīng)于原始內(nèi)容元數(shù)據(jù)的語言變化版本的額外元數(shù)據(jù)相 關(guān)聯(lián)和存儲。并且,創(chuàng)建子單元262的ERCM還可以進(jìn)行以漢字書面的原始內(nèi)容元數(shù)據(jù)和以 漢字書面相應(yīng)的額外元數(shù)據(jù)的拼音映射。因此,在包括原始內(nèi)容元數(shù)據(jù)和額外元數(shù)據(jù)的情 形中,例如:簡體中文的"成龍";繁體中文的"成龍";和作為JackieChan的中文原名的"陳 港生",進(jìn)行以下拼音映射:
[0061] 大陸拼音的 "Cheng Long" ;
[0062] 香港拼音的"Sing Lung" ;和/或
[0063] 臺灣拼音的 "Cheng Lung"。
[0064] 并且,可以為Skyfall樣本進(jìn)行以下拼音映射:
[0065] 大陸拼音的 "Da Po Tian Mu Sha Ji " ;
[0066] 香港拼音的 "Zhi Po Tian Xiong Cheng" ;和 / 或
[0067] 臺灣拼音的 "Kong Jiang Wei Ji "。
[0068] 在步驟306, ERCM創(chuàng)建子單元262進(jìn)一步創(chuàng)建拼音簡寫。通常,采用拼音格式的每 個(gè)單詞的首個(gè)字母以創(chuàng)建拼音簡寫。因此,拼音簡寫被表示為以下:
[0069] 對于 "Jackie Chan,':
[0070] "CL"用于大陸和臺灣拼音;和/或
[0071] "SL"用于香港拼音。
[0072] 對于"Skyfall" :
[0073] "TMSJ"用于大陸拼音;
[0074] "ZPTXC"用于香港拼音;和/或
[0075] "KJWJ"用于臺灣拼音。
[0076] -旦被處理,原始內(nèi)容元數(shù)據(jù)和關(guān)聯(lián)的額外元數(shù)據(jù),拼音和拼音簡寫被在ERCM管 理單元261的控制下進(jìn)一步相關(guān)聯(lián)地存儲在存儲單元266 -在下文中稱作ERCM數(shù)據(jù)庫 266 -(步驟307)。雖然僅在圖2中示出一個(gè)ERCM存儲單元266,本領(lǐng)域技術(shù)人員將理解可 以采用單個(gè)或者多個(gè)存儲器單元、數(shù)據(jù)庫等作為存儲手段。原始內(nèi)容元數(shù)據(jù)和關(guān)聯(lián)的額外 元數(shù)據(jù)以及它們的拼音和拼音簡寫可以被存儲在多個(gè)索引或者表中。圖2示出兩個(gè)表267 和268。表267是通常包括大陸中文(S卩,簡體中文)、大陸漢語拼音和TV操作員直接保持 或者更新的相同的元數(shù)據(jù)的英語語言變化版本的元數(shù)據(jù)表。為了說明,以下表1示出包括 用于在上文給出的兩個(gè)示例的元數(shù)據(jù)變化版本的元數(shù)據(jù)表267 :
[0077] 表1 -兀數(shù)據(jù)表267
[0078]
【權(quán)利要求】
1. 一種方法,包括: 接收與由內(nèi)容提供者提供的內(nèi)容項(xiàng)有關(guān)的內(nèi)容元數(shù)據(jù); 從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),所述額外元數(shù)據(jù)包括所述內(nèi)容元數(shù)據(jù)的語言變 化版本; 將所述內(nèi)容元數(shù)據(jù)連同所述額外元數(shù)據(jù)存儲在存儲設(shè)備中,其中,所述內(nèi)容元數(shù)據(jù)被 存儲為與所述額外元數(shù)據(jù)關(guān)聯(lián); 接收來自用戶的搜索請求,所述搜索請求包括以第一語言變化版本表示的一個(gè)或多個(gè) 搜索項(xiàng); 在所述內(nèi)容元數(shù)據(jù)或者所述額外元數(shù)據(jù)中識別匹配所述一個(gè)或多個(gè)搜索項(xiàng)的相關(guān)元 數(shù)據(jù); 識別存儲為與所述相關(guān)元數(shù)據(jù)關(guān)聯(lián)的額外的相關(guān)的元數(shù)據(jù),所述額外的相關(guān)的元數(shù)據(jù) 包括所述相關(guān)元數(shù)據(jù)的語言變化版本;以及 增加一個(gè)或多個(gè)額外的搜索項(xiàng)至所述搜索請求,所述一個(gè)或多個(gè)額外的搜索項(xiàng)對應(yīng)于 所述額外的相關(guān)的元數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù)包括:采集和解析一個(gè)或多個(gè)網(wǎng)絡(luò)源,其中,所述一個(gè)或多個(gè)網(wǎng)絡(luò)源包括以不同的語言變化 版本提供額外元數(shù)據(jù)的一個(gè)或多個(gè)網(wǎng)絡(luò)入口;和 從所采集和所解析的一個(gè)或多個(gè)網(wǎng)絡(luò)源中的每一個(gè)提取所述額外元數(shù)據(jù)。
3. 根據(jù)權(quán)利要求1所述的方法,其中,所述從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù)包括 檢索與所述內(nèi)容元數(shù)據(jù)的子集相關(guān)的額外元數(shù)據(jù)。
4. 根據(jù)權(quán)利要求3所述的方法,其中,所述內(nèi)容元數(shù)據(jù)的所述子集包括以下的至少一 個(gè): 演員名字; 導(dǎo)演名字; 片名;和 版權(quán)和/或區(qū)域信息。
5. 根據(jù)權(quán)利要求1所述的方法,其中,所述額外元數(shù)據(jù)包括以下語言變化版本的至少 一個(gè): 書面格式; 發(fā)音格式;和 社交共用名字。
6. 根據(jù)權(quán)利要求5所述的方法,其中,所述書面格式包括簡體中文和/或繁體中文。
7. 根據(jù)權(quán)利要求5所述的方法,其中,所述發(fā)音格式包括香港、臺灣通用和/或漢語拼 音。
8. 根據(jù)權(quán)利要求5所述的方法,其中,對應(yīng)于所述發(fā)音格式的簡寫創(chuàng)建另外的語言變 化版本。
9. 根據(jù)權(quán)利要求8所述的方法,其中,所述簡寫通過采用發(fā)音格式的每個(gè)所述額外元 數(shù)據(jù)的每個(gè)單詞的首個(gè)字母創(chuàng)建。
10. 根據(jù)權(quán)利要求8所述的方法,其中,包括以第一語言變化版本表示的一個(gè)或多個(gè)搜 索項(xiàng)的所述搜索請求為發(fā)音格式的簡寫。
11. 根據(jù)權(quán)利要求1所述的方法,所述方法進(jìn)一步包括: 創(chuàng)建限定如何排列和顯示搜索結(jié)果的權(quán)重規(guī)則;和 應(yīng)用所述權(quán)重規(guī)則至使用包括所述一個(gè)或多個(gè)搜索項(xiàng)和所述一個(gè)或多個(gè)額外的搜索 項(xiàng)的所述搜索請求獲得的搜索結(jié)果。
12. 根據(jù)權(quán)利要求11所述的方法,其中,限定如何排列和顯示搜索結(jié)果的所述權(quán)重規(guī) 則包括將以對應(yīng)于所述第一語言變化版本的語言變化版本的搜索結(jié)果排列為高于其他搜 索結(jié)果。
13. 根據(jù)權(quán)利要求11所述的方法,其中,限定如何排列和顯示搜索結(jié)果的所述權(quán)重規(guī) 則包括將以之前搜索的所述用戶最頻繁使用的語言變化版本的搜索結(jié)果排列為高于其他 搜索結(jié)果。
14. 根據(jù)權(quán)利要求11所述的方法,其中,限定如何排列和顯示搜索結(jié)果的所述權(quán)重規(guī) 則包括將以定義在所述用戶的簡檔中的語言變化版本的搜索結(jié)果排列為高于其他搜索結(jié) 果。
15. 根據(jù)權(quán)利要求11所述的方法,其中,限定如何排列和顯示搜索結(jié)果的所述權(quán)重規(guī) 則包括將以對應(yīng)于所述用戶的當(dāng)前位置的語言變化版本的搜索結(jié)果排列為高于其他搜索 結(jié)果。
16. 根據(jù)權(quán)利要求11所述的方法,其中,限定如何排列和顯示搜索結(jié)果的所述權(quán)重規(guī) 則包括根據(jù)所述用戶的當(dāng)前地理位置和當(dāng)?shù)匕鏅?quán)限制去除語言變化版本的一些搜索結(jié)果。
17. 根據(jù)權(quán)利要求11所述的方法,其中,限定如何排列和顯示搜索結(jié)果的所述權(quán)重規(guī) 則包括根據(jù)所述用戶的當(dāng)前地理位置和當(dāng)?shù)匕鏅?quán)限制替換語言變化版本的一些搜索結(jié)果。
18. -種裝置,包括: 管理單元,可操作地接收與由內(nèi)容提供者提供的內(nèi)容項(xiàng)相關(guān)的內(nèi)容元數(shù)據(jù); 創(chuàng)建單元,可操作地從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),所述額外元數(shù)據(jù)包括所述 內(nèi)容元數(shù)據(jù)的語言變化版本; 存儲單元,可操作地存儲所述內(nèi)容元數(shù)據(jù)連同所述額外元數(shù)據(jù),其中,所述內(nèi)容元數(shù)據(jù) 被存儲為與所述額外元數(shù)據(jù)關(guān)聯(lián); 其中,所述管理單元被另外可操作為:接收來自用戶的搜索請求,所述搜索請求包括以 第一語言變化版本表示的一個(gè)或多個(gè)搜索項(xiàng);在所述內(nèi)容元數(shù)據(jù)或者所述額外元數(shù)據(jù)中識 別匹配所述一個(gè)或多個(gè)搜索項(xiàng)的相關(guān)元數(shù)據(jù);識別存儲為與所述相關(guān)元數(shù)據(jù)關(guān)聯(lián)的額外的 相關(guān)的元數(shù)據(jù),所述額外的相關(guān)的元數(shù)據(jù)包括所述相關(guān)元數(shù)據(jù)的語言變化版本;以及增加 一個(gè)或多個(gè)額外的搜索項(xiàng)至所述搜索請求,所述一個(gè)或多個(gè)額外的搜索項(xiàng)對應(yīng)于所述額外 的相關(guān)的元數(shù)據(jù)。
19. 一種或多種計(jì)算機(jī)可讀有形存儲介質(zhì),利用包括計(jì)算機(jī)可執(zhí)行指令的軟件編碼并 且當(dāng)所述軟件被執(zhí)行時(shí),可操作為: 接收與由內(nèi)容提供者提供的內(nèi)容項(xiàng)相關(guān)的內(nèi)容元數(shù)據(jù); 從一個(gè)或多個(gè)外部源檢索額外元數(shù)據(jù),所述額外元數(shù)據(jù)包括所接收的內(nèi)容元數(shù)據(jù)的語 言變化版本; 將所接收的內(nèi)容元數(shù)據(jù)連同所述額外元數(shù)據(jù)存儲在存儲設(shè)備中,其中,所接收的內(nèi)容 元數(shù)據(jù)被存儲為與所述額外元數(shù)據(jù)關(guān)聯(lián); 接收來自用戶的搜索請求,所述搜索請求包括以第一語言變化版本表示的一個(gè)或多個(gè) 搜索項(xiàng); 在所接收的內(nèi)容元數(shù)據(jù)或者所述額外元數(shù)據(jù)中識別匹配所述一個(gè)或多個(gè)搜索項(xiàng)的相 關(guān)元數(shù)據(jù); 識別存儲為與所識別的相關(guān)元數(shù)據(jù)關(guān)聯(lián)的額外的相關(guān)的元數(shù)據(jù),所述額外的相關(guān)的元 數(shù)據(jù)包括所識別的相關(guān)元數(shù)據(jù)的語言變化版本;以及 增加一個(gè)或多個(gè)額外的搜索項(xiàng)至所述搜索請求,所述一個(gè)或多個(gè)額外的搜索項(xiàng)對應(yīng)于 所述額外的相關(guān)的元數(shù)據(jù)。
【文檔編號】G06F17/30GK104424362SQ201410444283
【公開日】2015年3月18日 申請日期:2014年9月2日 優(yōu)先權(quán)日:2013年9月3日
【發(fā)明者】李宇亮, 克里斯·米爾斯, 伊恩·R·謝爾頓, 斯圖爾特·P·阿什比, 安德魯·瓦倫廷 申請人:思科技術(shù)公司