專利名稱:創(chuàng)建用于推薦媒體內容的代理的制作方法
技術領域:
本發(fā)明涉及一種創(chuàng)建用在系統(tǒng)中推薦媒體內容的代理的方法。本發(fā)明還涉及用于執(zhí)行所述方法的計算機系統(tǒng)。此外,本發(fā)明還涉及用于執(zhí)行所述方法的計算機程序產品。
背景技術:
專利US 6,005,597公開了用于程序選擇的方法和裝置的一種實施方案。它利用觀眾的收看喜好來創(chuàng)建動態(tài)觀眾簡檔,該簡檔用于自動對可獲得的節(jié)目進行評價??色@得的節(jié)目以屏幕菜單或屏幕上預覽窗口的形式按降序排列的預測興趣呈現(xiàn)給用戶。專利US6,005,597從列出節(jié)目主題和描述信息的網站得到關于可獲得TV節(jié)目標題和主題的數(shù)據(jù)。在US6,005,597中公開的發(fā)明監(jiān)控觀眾的習慣并建立觀眾喜好,如節(jié)目名稱、主題領域、收看時間等,的漸進式模型。為了估計觀眾的喜好,觀眾喜好的漸進式模型還結合反饋記載,如“是”或“否”,來估計用戶對實際收看節(jié)目的“主題興趣”。此外,具有當前觀眾簡檔中缺少的觀眾喜好信息的協(xié)同模擬觀眾簡檔也可以結合進來估計實際的觀眾喜好。當觀眾簡檔周期性地更新時,觀眾簡檔的最佳匹配因素也要考慮。
但是,上述現(xiàn)有技術方法涉及到觀眾簡檔的更新與其使用可能沖突的問題。通常,觀眾簡檔的更新和觀眾簡檔的使用在如何修改觀眾簡檔數(shù)據(jù)的問題上有利益沖突。
為了在觀眾簡檔可以在另一系統(tǒng)上發(fā)布以便給出媒體推薦之前對觀眾簡檔進行精確調整、對觀眾簡檔進行修改和測試,觀眾簡檔的修改需要與推薦媒體的系統(tǒng)分開。
提供一種可以在將用戶簡檔發(fā)布到在線系統(tǒng)之前對新類型媒體內容和用戶簡檔進行試驗、測試、確認等的系統(tǒng)或系統(tǒng)部分是很方便的,其中用戶簡檔在實際中用于向用戶推薦媒體內容。
發(fā)明內容
因此,本發(fā)明的目的就是提供一種系統(tǒng)和方法,其中以代理形式表示用戶喜好的簡檔可以與媒體推薦系統(tǒng)分開進行修改等。
這個目的是通過上述類型的方法來實現(xiàn)的,所述方法包括步驟
確認第二系統(tǒng)中的第二代理,及將關于第二系統(tǒng)中第二代理的信息傳遞到第一系統(tǒng)。
從而,代理的確認是在獨立于第一系統(tǒng)的第二系統(tǒng)中完成的,其中關于代理的信息從第二系統(tǒng)傳遞到可以給出媒體內容推薦的第一系統(tǒng)。
在該方法的一種實施方案中,該方法還包括將關于第一系統(tǒng)中第一代理的信息傳遞到第二系統(tǒng)。
因此第二系統(tǒng)可以利用來自第一系統(tǒng)能很好執(zhí)行的代理。
該方法的另一種優(yōu)選實施方案在權利要求3中描述。
因此代理可以在第二系統(tǒng)中確認,首先構成帶相關性反饋數(shù)據(jù)的媒體內容條目測試集,其次估計一個代理在該媒體內容條目測試集中的得分,然后為代理確定代理得分和測試集中媒體內容條目相關性反饋數(shù)據(jù)之間的差值,第四步是關于所有代理對媒體內容條目測試集確定平均差值,最后,響應平均差值、代理差值及媒體內容條目測試集中媒體內容條目相關性反饋數(shù)據(jù)的可靠性,估計一個代理的性能。
該方法的另一種優(yōu)選實施方案在權利要求4中描述。
因此最佳執(zhí)行的代理可以在第一系統(tǒng)上推薦,第一系統(tǒng)可以從第二系統(tǒng)選擇并拷貝最佳執(zhí)行的代理,代理可以從外部源導入第二系統(tǒng),第二系統(tǒng)可以提高代理,因為代理被產生或訓練,第二系統(tǒng)可以對代理分級并推薦最佳執(zhí)行的代理,代理可以從第二系統(tǒng)選擇并拷貝到第一系統(tǒng),并且第二系統(tǒng)可以刪除最差執(zhí)行或過時的代理。
該方法的另一種優(yōu)選實施方案在權利要求5中描述。
因此代理可以用于推薦用戶優(yōu)選的媒體在媒體系統(tǒng)上呈現(xiàn)、顯示和播放。
本發(fā)明的其它優(yōu)選實施方案在權利要求6和7中描述。
因此,本發(fā)明的一個好處是在線系統(tǒng)可以(根據(jù)代理)推薦媒體,而且在線系統(tǒng)不會與離線系統(tǒng)對與該代理相同、拷貝、創(chuàng)建或類似代理進行的確認等沖突。
因此,本發(fā)明的另一個好處是在線系統(tǒng)上媒體內容的推薦不會受未確認代理的錯誤影響。
本發(fā)明的其它優(yōu)選實施方案在權利要求8和9中描述。
媒體內容的簡檔,進而代理的算法可以用于向用戶提出媒體內容推薦。
在本發(fā)明的另一種優(yōu)選實施方案中,媒體系統(tǒng)選自VCR、TV、機頂盒、DVD播放器、收音機和個人計算機。因此,本發(fā)明的媒體系統(tǒng)可以在這些單元中的任何一種上運行。
以下聯(lián)系優(yōu)選實施方案并參考附圖,將更加完全地對本發(fā)明進行說明,其中圖1示出了一種用于推薦媒體的通用系統(tǒng);圖2示出了具有用戶、媒體提供商、在線系統(tǒng)、離線系統(tǒng)、外部源和反饋系統(tǒng)的媒體系統(tǒng);及圖3示出了創(chuàng)建用在系統(tǒng)中推薦媒體內容的代理的方法。
具體實施例方式
圖1示出了一種用于推薦媒體的通用系統(tǒng)。示出該圖只是為了簡要說明,而且是為了通用性,以避免在這一點上對不同系統(tǒng)硬件設計的討論。它簡要地示出了代理如何流動,例如,可以在標號103,在線系統(tǒng),和標號110,離線系統(tǒng),之間來回傳遞,及代理還可以從標號116和117,外部源,傳遞到標號110。
由于每個系統(tǒng)的代理都可以單獨修改并單獨在各系統(tǒng)中使用,因此具有兩個系統(tǒng)用于推薦媒體的基本思想是為了利用代理。由于一個系統(tǒng)檢索改進的代理或以各種方式獲得其它控制代理的信息來提高代理的總體性能,而另一個系統(tǒng)則可以根據(jù)代理給出媒體推薦,因此在本發(fā)明的優(yōu)選實施方案中,代理簡檔的內容可以修改。如剛剛所提到的,代理可以用于在圖2中標號208示出的媒體系統(tǒng)上推薦媒體內容。媒體內容可以是能夠在相應媒體系統(tǒng)上呈現(xiàn)的媒體。媒體系統(tǒng)可以是智能機頂盒、智能VCR或個人計算機、DVD播放器、收音機或任何其它能夠呈現(xiàn)媒體內容的電子設備。
媒體內容可以指實況轉播的媒體內容格式,如TV節(jié)目、一經請求就可以看到的視頻、互聯(lián)網上的交互式直播TV、互聯(lián)網TV、只有當例如特定事件發(fā)生時才可用的互聯(lián)網站、電影、收音機廣播或任何其它可以在廣播時收看的媒體,或者它也可以是能夠存儲在媒體系統(tǒng)上以后呈現(xiàn)的媒體內容。
回到圖1,標號101可以是媒體提供商。標號103,在線系統(tǒng),及110,離線系統(tǒng),可以理解為是兩個用于對代理進行綜合控制的合作系統(tǒng)。由于離線系統(tǒng)在不對在線系統(tǒng)的代理有任何影響的情況下單獨控制離線系統(tǒng)的代理是很方便的,因此具有在線系統(tǒng)和離線系統(tǒng)的基本思想是當代理被兩個系統(tǒng)以不同方式控制時可以分離工作。由于在線系統(tǒng)的代理可以用于推薦媒體,因此讓用于試驗的代理用于推薦媒體是不合適的。兩個系統(tǒng)中代理的控制等在圖3的方法中描述。
三角形104、108、109、111、117可以顯示系統(tǒng)中代理是如何被控制的。外部代理還可以通過標號118從外部源116傳遞到標號110。外部代理源116可以是通過互聯(lián)網可訪問的外部網站。代理還可以從協(xié)同代理發(fā)生器115傳遞到標號110。協(xié)同代理發(fā)生器可以具有其自己根據(jù)關于媒體內容的信息、反饋的可靠性、來自系統(tǒng)外部用戶,標號113和114,的相關性反饋等創(chuàng)建和產生代理的處理能力。相應地,來自用戶,標號107,的相關性反饋可以通過標號112反饋到在線系統(tǒng)和/或反饋到標號119,在線系統(tǒng)和離線系統(tǒng)的公用數(shù)據(jù)庫。
標號119,在線系統(tǒng)和離線系統(tǒng)的公用數(shù)據(jù)庫,可以用于跟蹤由用戶給出的相關性反饋,即具有關于用戶所選媒體內容的歷史信息的相關性反饋數(shù)據(jù)庫。如將在圖2反饋系統(tǒng)中描述的,它還可以包括關于隱式反饋和/或顯式反饋的信息。
標號106,一個列表,可以是為了通過標號105向用戶107推薦媒體內容而使用并傳遞的代理列表。
標號120,另一個列表,可以是媒體內容推薦列表而且可以用于向用戶107顯示推薦的媒體內容。
圖2示出了具有用戶、媒體提供商、在線系統(tǒng)、離線系統(tǒng)、外部源和反饋系統(tǒng)的媒體系統(tǒng)。
標號201可以是提供可用媒體內容的媒體提供商。標號201可以包括多于一個媒體提供商。標號201還可以包括關于嵌在標號202,來自201的信號,中的媒體內容的信息。
媒體內容可以是實況轉播的媒體內容,如TV節(jié)目、一經請求就可以看到的視頻、互聯(lián)網上的交互式直播TV、互聯(lián)網TV、只有當例如特定事件發(fā)生時才可用的互聯(lián)網站、電影、收音機廣播或任何其它可以在廣播時收看的媒體,或者它也可以是能夠存儲在標號208,媒體系統(tǒng),即PC或VCR,上以后重播和呈現(xiàn)的媒體內容。
關于媒體內容的信息可以嵌在來自媒體提供商的信號202中。關于媒體內容的信息可以從媒體提供商信息中的元數(shù)據(jù)檢索和獲得。媒體提供商通常向媒體系統(tǒng)提供媒體內容。元數(shù)據(jù)可以包括關于媒體內容的文本和編碼信息。在電視界,標準化的DVB-服務信息包含關于電子節(jié)目指南的信息,作為關于媒體內容的信息。關于媒體內容的信息還可以來自在TV節(jié)目廣播期間發(fā)送的文本TV信息。此外,關于媒體內容的信息還可以從網站獲得。關于媒體內容的信息可以包含關于可用媒體內容的類型、種類、持續(xù)時間、主題、標題、開始等信息。
標號203可以是用于推薦媒體的在線系統(tǒng)。
標號204可以是203的CPU或處理能力。標號204,即CPU,可以更新標號205,代理數(shù)據(jù)庫。術語代理的內容和用途將在對該圖描述的末尾更加詳細地描述。
根據(jù)代理,媒體推薦可以直接發(fā)送到208,媒體系統(tǒng)。
可選地,標號216,所產生的列表,可以是媒體內容推薦列表,該列表可以用于在媒體系統(tǒng),標號208,上向用戶207推薦媒體內容。
標號206可以是代理列表。它可以是列表的形式或系統(tǒng),如208,上做進一步處理的其它電子設備,如8,可以理解的形式。
標號202是來自媒體提供商的信號,它可以是用于一經請求就可以看到的可下載視頻、用于互聯(lián)網數(shù)據(jù)發(fā)射、用于TV節(jié)目、用于電影請求、用于收音機廣播或任何其它能夠存儲或呈現(xiàn)在媒體系統(tǒng)208上的信號。標號204,CPU,可以將標號202,來自媒體提供商的信號,發(fā)送到標號208,媒體系統(tǒng)。
標號208是媒體系統(tǒng),它可以是互聯(lián)網PC、機頂盒、TV、錄像機、DVD播放器、收音機等。通常,標號8可以是能夠實況轉播或從媒體內容記錄中呈現(xiàn)來自媒體提供商的媒體內容的系統(tǒng)。由于它可以執(zhí)行相關性反饋,即用戶對媒體內容的評價,檢索和/或為了以后在媒體系統(tǒng)上呈現(xiàn)而記錄媒體內容,因此該媒體系統(tǒng)還可以具有CPU或其它處理能力。用戶對媒體內容的評價可以由輸入裝置來完成。用于評價呈現(xiàn)在媒體系統(tǒng)上的媒體內容的輸入裝置可以集成在媒體系統(tǒng)標號208中。它可以是鍵盤、鼠標、遠程控制、通過在屏幕菜單上點擊的交互式菜單、控制桿、語音輸入、手勢識別或通過任何其它能夠由用戶207給出評價的方式。
用戶可以收看或收聽208上呈現(xiàn)和/或選定的媒體內容。
標號209是反饋系統(tǒng),對它監(jiān)控就可以知道用戶如何以顯式或隱式方式與媒體系統(tǒng)208交互。隱式反饋方式可以是當用戶與媒體系統(tǒng)208以跳過廣告節(jié)目、調節(jié)音量、改變音調及音調平衡、尋找文本TV信息等方式交互的時候。顯式反饋方式可以是當反饋系統(tǒng)檢索到關于所呈現(xiàn)媒體內容條目的直接用戶得分信息的時候,它可以是如“我喜歡這個節(jié)目”、“我討厭它”、“我給它打0.85分”等顯式反饋。
此外,隱式反饋由標號209,反饋系統(tǒng),監(jiān)控用戶何時切換到一個TV頻道或節(jié)目及切換到哪個TV頻道或TV節(jié)目。當媒體系統(tǒng)是可以訪問互聯(lián)網的PC時,它可以監(jiān)控用戶207怎么上網及上哪個互聯(lián)網站。它還可以監(jiān)控用戶如何在不同的互聯(lián)網站或主頁之間切換,相應地網站的URL也被監(jiān)控,而且這些網站的URL通過CPU212存儲到數(shù)據(jù)庫213,從而擁有了用戶實際上如何與互聯(lián)網交互的歷史參考,這些來自互聯(lián)網或來自其它媒體提供商的媒體內容實際上是為顯示而檢索的。數(shù)據(jù)庫213還可以是用戶相關性反饋數(shù)據(jù)庫。
為了綜合管理用戶如何與媒體系統(tǒng)交互,標號209,反饋系統(tǒng),可以集成在媒體系統(tǒng)208中,或者它也可以以電子模塊的形式設計在專用硬件中。
在標號209,反饋系統(tǒng),沒有集成在媒體系統(tǒng)208中的情況下,反饋數(shù)據(jù)可以發(fā)送到標號205,在線系統(tǒng)代理數(shù)據(jù)庫。
標號215是與媒體提供商201的用戶連接點。它可以是用于TV或收音機的天線出口、到互聯(lián)網的調制解調器、ADSL等連接、來自衛(wèi)星接收器的天線出口、到TV和/或VCR的SCART連接等。
標號210可以是離線系統(tǒng)或推薦媒體系統(tǒng)的一部分,相對于標號203,該系統(tǒng)離線工作。術語離線的意思是相對于在線系統(tǒng)203,系統(tǒng)210只在后臺進行處理,其中媒體系統(tǒng)208的用戶只在使用媒體內容時才需要、請求和傳遞數(shù)據(jù)。換句話說,210不必對用戶207實時作出響應,因而相對于203,離線系統(tǒng)210可以說成更多時候是離線的,就其對用戶動作等作出實時響應的方式而言,203必須更多時候是在線的。
210中的標號211可以是代理數(shù)據(jù)庫。術語代理將在對該圖描述的末尾更加詳細地描述。
由于它可以利用處理來執(zhí)行圖3中更加詳細描述的各種代理控制,因此標號212可以是210的CPU或處理能力。標號212控制標號211,代理數(shù)據(jù)庫,中代理的填充、更新、確認、導入、傳遞、學習、分級、刪除等。這將在圖3中更加詳細地描述。標號212還可以控制兩個不同系統(tǒng),如標號210和203,之間代理的來回傳遞。
210中的標號213可以是用戶實際收看媒體內容的用戶相關性反饋數(shù)據(jù)庫。該相關性反饋及其它關于所顯示、收看和評價的媒體內容的信息可以從標號209,反饋系統(tǒng),檢索到標號213中。換句話說,213可以包括關于媒體系統(tǒng)208上顯示、評價過什么的用戶交互歷史信息。
標號214可以是外部代理到標號210,離線系統(tǒng),的輸入。外部代理可以來自外部網站,或者外部代理也可以來自代理協(xié)同發(fā)生器,如圖1的標號115。外部代理可以由標號212接收,用于在離線系統(tǒng)發(fā)布和真正使用它們之前對其進行處理。標號214通??梢园ㄔ趫D1標號115和116中提到的外部代理傳遞。
通常,標號203、208、209和210作為整體還可以看作是用于根據(jù)代理推薦媒體的系統(tǒng)。由于對用戶來說將被用戶當作媒體系統(tǒng)的整個系統(tǒng)看作一個電子盒是很方便的,因此203、208、209和210可以集成在一個包括媒體系統(tǒng)的盒子中。
代理可以包括優(yōu)選的媒體內容簡檔及匹配該媒體內容簡檔的算法。情況還可以是代理只包括媒體內容簡檔。
作為實例,假定關于媒體內容的信息包括下圖中所示的信息
關于媒體內容的信息實例可以是如偽DVB-SI格式中所示的基于屬性的內容描述。
匹配媒體內容簡檔的算法可以存儲在一組邏輯規(guī)則中。這些規(guī)則可以包括以下格式的邏輯結構規(guī)則IF前提子句[AND前提子句]THEN結果子句大多數(shù)子句可以由與上述內容相同的屬性構成,一種實例是子句屬性=屬性值一種基于規(guī)則的簡檔實例看起來如缺省得分=0.3IF類型=體育AND子類型=足球THEN得分=0.65IF優(yōu)選頻道=true THEN得分=得分+0.2IF頻道=bbc* THEN優(yōu)選頻道=truebbc*可以指任何bbc頻道,即bbc1、bbc2等。
在簡檔與關于媒體內容的信息(通過代理匹配算法)匹配的情況下,如以下實例類型=體育,子類型=足球且頻道=bbc1。
則結果是得分=0.85(由于0.65加了0.2)這就是對這個媒體內容的結果推薦得分。在下面這將稱為得分。
上述實例示出了代理如何包括優(yōu)選的媒體內容簡檔(即,體育、足球和bbc1)及用于匹配媒體內容簡檔的算法(if-and-then等)。
“if-and-then”結構是規(guī)則的一部分,而不是算法。為了執(zhí)行真語句的結果,即為了使結果子句為真,算法能夠利用規(guī)則進行推理,即檢查規(guī)則的前提子句是否為真。規(guī)則的任何結果都可以引起對更多規(guī)則的評價。完成這種評價的方式可以包含在算法中,這稱為推理機。
該實例還可以通過將更多成熟的規(guī)則結合進算法及通過更多域名和更多對應域名的屬性值來進一步擴充。
換句話說,當以關于媒體內容的信息形式存在的可用媒體內容匹配關于代理的簡檔,即具有相同或相似類型、子類型、關鍵字、語言、優(yōu)選持續(xù)時間等的可用媒體內容或將在不久的將來在所述媒體系統(tǒng)上發(fā)送的媒體內容時,它可以放在呈現(xiàn)給媒體系統(tǒng)用戶的關于媒體內容信息的推薦列表上,然后由媒體系統(tǒng)的用戶來選擇。
圖3示出了創(chuàng)建用在系統(tǒng)中推薦媒體內容的代理的方法。在圖的左手邊示出了該方法在線系統(tǒng)的步驟。在圖的右手邊示出了該方法離線系統(tǒng)的步驟。
在步驟301中,方法開始。如果是系統(tǒng)第一次上電,則執(zhí)行系統(tǒng)變量、代理等的各種初始化,將它們設置為適當?shù)墓ぷ魅笔顟B(tài)。為了使方法正確工作,可能需要來自系統(tǒng)外部的不同信息(外部代理、用戶相關性反饋得分等)給出方法工作所需要的數(shù)據(jù)。假定這些環(huán)境在以下步驟中是存在的。在開始步驟之后,方法繼續(xù)進行到步驟302。
在步驟302中,代理由在線系統(tǒng)推薦。在線系統(tǒng)可以決定將哪個代理推薦為要傳遞到離線系統(tǒng)的候選。在代理到離線系統(tǒng)的實際傳遞過程中,代理或關于代理的信息可以傳遞到離線系統(tǒng)。關于代理的信息可以是包括媒體內容簡檔和推薦媒體算法的代理的純或原始數(shù)據(jù)表示。在線系統(tǒng)可以具有一個表示每個在線代理成功的測量值該代理關于最近相關性反饋數(shù)據(jù)的平均性能。計算這種性能的過程與離線系統(tǒng)中的過程是完全相同的,這將在步驟307中描述。
在一種簡化形式中,在線系統(tǒng)可以只允許最佳執(zhí)行的代理傳遞到離線系統(tǒng)。最佳執(zhí)行的代理被推薦?;镜募僭O是如果在線系統(tǒng)中開始素材具有良好的行為,則離線系統(tǒng)中代理具有良好性能的概率也比較大。
如果推薦的代理是由離線系統(tǒng)選擇的,則代理的一個拷貝傳遞到離線系統(tǒng)。被拷貝的代理本身仍然可以在在線系統(tǒng)中保持活動,但在線系統(tǒng)數(shù)據(jù)庫的代理管理可以標記該代理是被拷貝的,即標號205,在線系統(tǒng)數(shù)據(jù)庫,可以利用該信息更新。這是為了防止相同的代理一再地傳遞到離線系統(tǒng)。該標記只有在代理在在線系統(tǒng)中顯著變化后才可以除去。
在步驟303中,代理可以由離線系統(tǒng)從在線系統(tǒng)選擇并拷貝到離線系統(tǒng)。從在線系統(tǒng)選擇推薦代理還可以基于其它可以與上述推薦過程中所提到標準不同的成熟標準。在本發(fā)明的一種優(yōu)選實施方案中,具有最高性能的代理可以由離線系統(tǒng)從在線系統(tǒng)中選擇并挑出,而且只有那些沒有標記為先前已經傳遞到離線系統(tǒng)的代理才可以選擇。
要挑選的代理個數(shù)可以如下確定。離線系統(tǒng)可能試圖將其總的代理個數(shù)(即,如圖2標號211數(shù)據(jù)庫中的代理個數(shù))保持在某種限制內一個固定的代理個數(shù),該限制可以是離線系統(tǒng)的一個系統(tǒng)參數(shù)。在每個周期(即,圖中整個方法執(zhí)行一遍)中可以刪除固定比例的代理,即它可以是具有最差性能的代理,可以是具有最高壽命、最舊或內容形式過時等的代理。數(shù)據(jù)庫中代理的打開位置,即由于某個代理被刪除而變得自由的空間,可以由來自外部源(圖2的標號214)的代理、來自從在線系統(tǒng)挑選并傳遞的代理、最新生成的代理(見該方法的步驟305)接管,而且它還可以進一步由根據(jù)舊代理進行過修改的代理接管。數(shù)據(jù)庫中自由空間的接管可以按上述優(yōu)先級次序執(zhí)行。
在步驟304中,代理可以由離線系統(tǒng)從外部源導入。在圖2的標號214,代理可以在通過互聯(lián)網可訪問的網站上并通過其變得可用。在線和/或離線系統(tǒng)或媒體系統(tǒng)的用戶可以選擇他認為在其媒體系統(tǒng)中使用將很有趣的有趣候選代理。他可以在真正決定將代理導入離線系統(tǒng)之前得到顯示在媒體系統(tǒng)上代理的媒體內容簡檔的概率。
在圖1的標號115,代理還可以通過協(xié)同代理發(fā)生器變得可用,如在該方法步驟307中所討論的,通常協(xié)同代理發(fā)生器可以具有其自己根據(jù)來自用戶的相關性反饋、關于媒體內容的信息、可靠性等創(chuàng)建和產生代理的處理能力。
在本發(fā)明的另一種優(yōu)選實施方案中,第三方可以具有強制外部代理導入從而傳遞到離線系統(tǒng)數(shù)據(jù)庫的權力。
由于離線系統(tǒng)可能必須在允許任何代理傳遞到在線系統(tǒng)之前測試并確認代理,因此導入的代理通??梢苑旁陔x線系統(tǒng)的數(shù)據(jù)庫中。
在步驟305中,代理可以由離線系統(tǒng)產生。若干種產生新代理的方法是可能存在的,即有可能從具有空簡檔的代理開始。
代理算法可以設計為從相關性反饋歷史記錄,即相關性反饋數(shù)據(jù)庫,中的特定實例和/或關于媒體內容的信息得到通用的知識。如果相關性反饋歷史記錄顯示用戶欣賞了很多足球節(jié)目,則空代理可以產生一條“我喜歡足球”的算法規(guī)則。在代理準備好被使用、確認、測試、學習等之前,空代理主體及一些初始算法已經可用。
用于推薦媒體的算法規(guī)則可以隨機或偽隨機地產生。媒體內容的簡檔也可以隨機或偽隨機地產生。用于推薦媒體的算法和媒體內容的簡檔合起來構成一個代理。
用于推薦媒體的算法中的規(guī)則可以表示為位串。通過獲得具有按位表示媒體內容簡檔和/或推薦媒體算法中按位表示規(guī)則的兩個能很好執(zhí)行代理的拷貝,交叉運算(如與、或、非等布爾位控制)可以執(zhí)行以交換和修改拷貝之間的位流部分。這可以類似于遺傳算法和遺傳程序來完成。離線系統(tǒng)中代理的漸進或創(chuàng)建還可以利用充當自然界中已知的遺傳控制的確認和刪除過程來執(zhí)行。
由于在該方法以下步驟中可以假定以這些方式通過測試和確認等創(chuàng)建的這種代理可能是真正能很好運行的代理,因此這一步的思想是根據(jù)歷史數(shù)據(jù)以某種方法隨機、遺傳、本地和/或以其它方式來產生代理。
在步驟306中,代理可以通過離線系統(tǒng)進行學習。由于參數(shù),如關于最近歷史相關性反饋的平均性能,和較好執(zhí)行的代理可以是學習的結果,因此學習可以與在線系統(tǒng)中的推薦完全相同。
讓代理進行學習的基本原理如下要求代理根據(jù)關于媒體內容的信息給出媒體內容的得分。
從相關性反饋數(shù)據(jù)庫檢索正確答案,即用戶相關性反饋得分。
讓代理從內部調節(jié)其簡檔與正確答案匹配。
由于學習可以只基于歷史數(shù)據(jù)而不需要任何直接的用戶動作,因此學習可以是機器學習的問題。基于規(guī)則的代理,例如(見該方法下一步),可以向算法的邏輯規(guī)則增加信用或可靠性等級。如果一個規(guī)則經證明是可靠的,則其信用等級提高。算法規(guī)則可以利用新的限制屬性(從“我喜歡足球”到“我喜歡bbc*上的足球”)擴充,或者可以通過從規(guī)則中刪除屬性(從“我喜歡足球”到“我喜歡運動”)使規(guī)則更加通用。
換句話說,表示為該代理性能得分中一個結果(如在該方法下一步中詳細說明的)的經過學習的代理的測試和確認可以通過關于在線系統(tǒng)用戶的歷史數(shù)據(jù)對其進行測試來確定。離線系統(tǒng)使用帶用戶數(shù)據(jù),包括關于媒體內容的最近用戶相關性反饋信息,的相關性反饋數(shù)據(jù)庫。在學習和測試期間,代理可能必須產生數(shù)據(jù)庫中媒體內容條目測試集的得分;相對于已知實際用戶相關性反饋得分的學習,在測試過程中,不需要知道實際的用戶相關性反饋得分就可以產生得分。估計得分和用戶相關性反饋得分之間的平均差值可以作為對代理性能的測量。
離線系統(tǒng)中代理數(shù)據(jù)庫,即圖2的標號213,的管理構成用于學習、測試和確認的相關性反饋數(shù)據(jù)庫的一部分。
在步驟307中,代理可以由離線系統(tǒng)確認。離線系統(tǒng)可以具有多于一種對確認每個代理成功的測量。要進行確認的代理可以是作為該方法任何其它步驟結果的代理。這一步可以確保在執(zhí)行任何到在線系統(tǒng)的傳遞之前代理是經過測試有效的。
在本發(fā)明的一種優(yōu)選實施方案中,與所有其它代理相關的關于最近相關性反饋數(shù)據(jù)的平均性能可以計算。性能是關于一組n個反饋事件對代理j計算的,即相關性反饋實際上是在顯示的特定媒體內容上給出的或在過去用戶的媒體系統(tǒng)上選定的。
性能可以考慮每個反饋事件的可靠性。
反饋或反饋事件的可靠性可以是表示用戶對該媒體內容評價的可靠性的估計得分。分數(shù)形式的可靠性是基于例如先前利用圖2的標號209檢索到的用戶與媒體系統(tǒng)交互的相關性反饋信息,此外還基于例如利用圖2媒體系統(tǒng)的輸入裝置得到的過去用戶對該媒體內容評價的可靠性的相關性反饋信息。
可靠性可以指示反饋系統(tǒng)觀察到的相關性反饋數(shù)據(jù)中用戶評價的可靠性。相對于根據(jù)在表示特定媒體內容條目期間得自任何類型用戶行為的用戶評價的隱式評價,顯式評價可以給出較高的可靠性值或得分。換句話說,通常顯式評價被認為是最好的,因此比隱式評價更可靠。
媒體內容的顯示或媒體內容條目的顯示可以理解為媒體內容在媒體系統(tǒng)上的重播、播放和/或顯示。該顯示還可以理解為媒體系統(tǒng)發(fā)射出的聲音和/或音樂。
在性能公式中,測試集包括n個媒體內容條目,x是該集合中的單個媒體內容條目。
每個代理j的性能,公式中的性能,與在線系統(tǒng)中所有其它代理相關。因此,所有m個代理的平均差值,公式中的平均差值,定義為 在平均差值公式中,平均差值是關于m個代理計算的,j是該測試集中的代理。
差值,公式中的差值,定義為媒體內容x代理的估計得分和媒體內容條目x相關性反饋得分,公式中的相關性,之間的絕對差值。
差值jx=|得分jx-相關性x|如前面所定義的,代理j的估計得分,公式中的得分,可以理解為媒體內容條目x的結果推薦得分。
代理總體的測試過程如下-根據(jù)相關性反饋數(shù)據(jù)庫中的數(shù)據(jù),即根據(jù)圖2中標號213的數(shù)據(jù)庫,構成一個具有其對應相關性反饋得分的媒體內容條目(即,關于媒體內容的信息)測試集。
-獲得關于媒體內容的信息并產生每個代理關于該媒體內容的得分,-從用戶獲得相關性反饋得分并為每個代理計算差值,-對所有媒體內容重復最后兩步,-關于所有代理確定平均差值,及-確定每個代理的性能。
在步驟308中,代理可以由離線系統(tǒng)進行分級和推薦。通常代理可以根據(jù)對在線系統(tǒng)而言其期望的用途來分級。在本發(fā)明的一種優(yōu)選實施方案中,代理可以根據(jù)在前述步驟中估計的性能來分級。代理的性能越高,代理的分級也就越高。
代理的多維分級也是一種可能的分級方式。獨立的推薦方法可以是降低在這種分級類型中要考慮的維數(shù)。推薦方法還可以包括離線系統(tǒng)數(shù)據(jù)庫中分級代理列表的簡單更新。
換句話說,離線系統(tǒng)能很好執(zhí)行,具有高性能,的代理可以被推薦為傳遞到在線系統(tǒng)的候選,而且還可以用于進一步改進。
在步驟309中,代理可以由離線系統(tǒng)刪除。只有最佳代理將繼續(xù)存在,因此最差執(zhí)行的代理將被刪除。許多其它標準(性能、離線系統(tǒng)中的壽命、過時的內容等)也可以設想用于代理的刪除。在每個周期中可以刪除固定數(shù)量的代理。
在步驟310中,代理可以由在線系統(tǒng)從離線系統(tǒng)選擇并拷貝到在線系統(tǒng)。在線系統(tǒng)可以決定有多少代理要導入。來自步驟308的分級列表可以由在線系統(tǒng)讀取,而且它可以由在線系統(tǒng)用于從離線系統(tǒng)選擇并拷貝代理。在線系統(tǒng)可以簡單地從列表中挑選具有最佳性能的代理,但只能挑選沒有標記為之前已經拷貝過的那些代理。代理的導入包括從離線系統(tǒng)數(shù)據(jù)庫的代理產生一個拷貝。當代理由在線系統(tǒng)選定時,該代理就從離線系統(tǒng)傳遞到在線系統(tǒng)。在代理傳遞到在線系統(tǒng)的實際過程中,代理或關于代理的信息可以傳遞到在線系統(tǒng)。代理的拷貝可以仍然留在離線系統(tǒng)中。該拷貝可以標記,并且只有其顯著變化才可以再次推薦。這是為了防止同一個代理一再地被拷貝。
只要該系統(tǒng)開啟并工作,即圖2的標號201、203、208、209和210正確工作,該方法就將繼續(xù)進行并返回步驟302。
計算機可讀介質可以是磁帶、光盤、數(shù)字化視頻光盤(DVD)、壓縮盤(CD或CD-ROM)、小型磁盤、硬盤、軟盤、智能卡、PCMCIA卡等。
權利要求
1.一種創(chuàng)建用在第一系統(tǒng)(103、203)中推薦媒體內容(120、216)的代理的方法,特征在于該方法包括步驟確認(307)第二系統(tǒng)(110、210)中的第二代理(111);及將關于該第二系統(tǒng)(110、210)中第二代理(111)的信息傳遞到所述第一系統(tǒng)(103、203)。
2.如權利要求1所述的方法,特征在于該方法還包括步驟將關于所述第一系統(tǒng)(103、203)中的第一代理(109)的信息傳遞到所述第二系統(tǒng)(110、210)。
3.如權利要求1所述的方法,特征在于所述確認(307)第二代理的步驟包括步驟用相關反饋數(shù)據(jù)構成媒體內容條目測試集;響應該媒體內容條目測試集,估計所述第二代理的得分;為該第二代理確定代理得分和所述測試集中媒體內容條目的相關反饋數(shù)據(jù)之間的差值;確定第二代理得分和測試集中媒體內容條目的相關性反饋數(shù)據(jù)之間的平均差值;及響應該平均差值、代理差值及測試集中媒體內容條目的相關反饋數(shù)據(jù)的可靠性,估計該第二代理的性能。
4.如權利要求1所述的方法,特征在于該方法還包括步驟推薦(302)所述第一系統(tǒng)(103、203)中的第一代理(104),從該第一系統(tǒng)(103、203)選擇并拷貝(303)所述第一代理(104)到所述第二系統(tǒng)(110、210),從外部源(116、214)將第三代理(117)導入(304)所述第二系統(tǒng)(110、210),在該第二系統(tǒng)(110、210)中產生(305)第四代理(111),對該第二系統(tǒng)(110、210)中第一、第二、第三和第四代理(111)中的至少一個進行訓練(306),分級并推薦(308)該第二系統(tǒng)(110、210)中第一、第二、第三和第四代理(111)中的至少一個,從該第二系統(tǒng)(110、210)中選擇并拷貝(310)第一、第二、第三和第四代理(111)中的至少一個到所述第一系統(tǒng)(103、203),及刪除(309)所述第二系統(tǒng)(110、210)中第一、第二、第三和第四代理(111)中的至少一個。
5.如權利要求1所述的方法,特征在于該方法還包括步驟在媒體系統(tǒng)(208)中利用所述第一代理(104)進行推薦。
6.如權利要求1所述的方法,特征在于所述第一系統(tǒng)(103、203)是用于向用戶(107、207)推薦媒體內容的在線系統(tǒng)。
7.如權利要求1所述的方法,特征在于所述第二系統(tǒng)(110、210)是用于確認代理(111)的離線系統(tǒng)。
8.如權利要求1所述的方法,特征在于所述第一、第二、第三和第四代理(104、108、109、111、117)中的至少一個包括媒體內容簡檔。
9.如權利要求4所述的方法,特征在于所述第一、第二、第三和第四代理(104、108、109、111、117)中的至少一個還包括用于推薦媒體的算法。
10.如權利要求5所述的方法,特征在于所述媒體系統(tǒng)(208)選自錄像機、電視、機頂盒、DVD播放器、收音機和個人計算機。
11.用于執(zhí)行根據(jù)權利要求1-10任何一項的方法的計算機系統(tǒng)。
12.一種計算機程序產品,包括存儲在計算機可讀介質上、用于當所述計算機程序在計算機上運行時執(zhí)行根據(jù)權利要求1-10任何一項的方法的程序代碼方法。
全文摘要
一種創(chuàng)建用于向用戶(207)推薦媒體內容的代理的方法和系統(tǒng)。代理包括媒體內容簡檔,還可以包括用于在媒體系統(tǒng)(208)上推薦媒體(201)的算法。媒體系統(tǒng)(208)可以是VCR、TV、機頂盒、DVD播放器、收音機或個人計算機。該方法包括確認離線系統(tǒng)(210)中的代理、在離線系統(tǒng)(210)和在線系統(tǒng)(203)之間來回傳遞代理的步驟。確認步驟包括構成歷史內容測試集、估計測試集中的代理得分、確定代理得分和歷史相關性反饋之間的平均差值、利用測試集上所有代理的平均差值和歷史相關性反饋的可靠性確定代理性能的步驟。該方法還包括推薦在線系統(tǒng)(203)中的代理、在在線系統(tǒng)(203)和離線系統(tǒng)(210)之間來回選擇并拷貝代理;在離線系統(tǒng)(210)中導入、產生、學習、分級、確認和刪除代理的步驟。
文檔編號H04N7/16GK1586080SQ02822634
公開日2005年2月23日 申請日期2002年10月28日 優(yōu)先權日2001年11月16日
發(fā)明者P·G·穆勒曼 申請人:皇家飛利浦電子股份有限公司