專利名稱::用于向用戶提供選定內(nèi)容項的方法
技術(shù)領域:
:本發(fā)明涉及一種用于向用戶提供選定內(nèi)容項的方法。本發(fā)明旨在用于那些通過諸如數(shù)據(jù)網(wǎng)絡(例如因特網(wǎng))或電話網(wǎng)絡(例如UMTS網(wǎng)絡)之類的電信手段而被提供的基于內(nèi)容的先進服務。本發(fā)明與內(nèi)容過濾、信息檢索、服務個性化以及用戶歸檔(userprofiling)領域相聯(lián)系。特別地,在被應用于豐富的多媒體內(nèi)容項、也就是包含不同媒體內(nèi)容組件(文本、圖像、音頻、視頻.......)的內(nèi)容項時,本發(fā)明將是非常有益的。
背景技術(shù):
:每一天,在世界上都會有大量信息發(fā)布,這些信息可以通過印刷品、電視、因特網(wǎng)之類的不同信息媒體而被人們得到。此外,信息量也在快速增長。不幸的是,對個人來說,當前可用信息源提供的龐大信息量通常是不可抗拒的,而個人則有可能無法或者沒有興趣在這些信息中揀選其感興趣的項目。因此,目前需要一種服務或能力來為用戶僅僅提供其感興趣的信息。長期以來,較為普遍的是根據(jù)"關鍵詞"來過濾內(nèi)容項。關鍵詞由用戶提供給軟件應用;該軟件應用既可以處于用戶計算機本地,也可以運行在與用戶計算機相連、例如通過因特網(wǎng)相連的遠端計算機上。該軟件應用會向用戶返回與用戶指定的關鍵詞相關的所有可用內(nèi)容項。關鍵詞是一種普通類型的元數(shù)據(jù)。在過去,"元數(shù)據(jù)"被定義成是"與信息相關的信息";舉個例子,對"文章"的"標題"和"摘要"來說,由于它們提供了關于文章內(nèi)容的信息,因此它們是元數(shù)據(jù),而文章的內(nèi)容則是信息本身。為了過濾內(nèi)容信息,目前還開發(fā)了更復雜的方法。這些方法是以使用元數(shù)據(jù)標引不同內(nèi)容項為基礎的,特別地,所述元數(shù)據(jù)可以是"原創(chuàng)元數(shù)據(jù)(authoredmetadata)",也就是通過內(nèi)容項作者或是他人而與內(nèi)容項關聯(lián)的元數(shù)據(jù)。一般來說,有效過濾內(nèi)容項需要關于用戶的知識,例如,該用戶知識可以是用戶習慣和/或用戶偏好。在ErikaSavia等人發(fā)表于Proc.8thFinnishArtificialIntelligenceConference,HumanandArtificialInformationProcessing,第61-69頁,1998的論文"MetadataBasedMatchingofDocumentsandUserProfiles,,中可以發(fā)現(xiàn)一份關于通過使用元數(shù)據(jù)和用戶簡檔來過濾文檔的有趣評述。從國際專利申請WO02/41579中可以知道一種用于聚集和傳送多媒體數(shù)據(jù)的方法。多媒體數(shù)據(jù)依照其內(nèi)容而被分析,元數(shù)據(jù)提取模塊提取相應元數(shù)據(jù),以及預備用戶簡檔。在從中心單元接收多媒體數(shù)據(jù)之前,用戶借助通信設備來設置用戶簡檔中的至少一部分用戶數(shù)據(jù)和/或修改該數(shù)據(jù)。多媒體數(shù)據(jù)借助元數(shù)據(jù)并且根據(jù)用戶簡檔而被選擇,此外還借助再封裝模塊而從選定的多媒體數(shù)據(jù)中產(chǎn)生以用戶特定方式優(yōu)化的、面向內(nèi)容的多媒體數(shù)據(jù)。所述以用戶特定方式優(yōu)化且面向內(nèi)容的多媒體數(shù)據(jù)將會保存在中心單元的內(nèi)容模塊的數(shù)據(jù)庫中,并被提供給用戶。根據(jù)這份國際專利申請(第8頁第6~14行),元數(shù)據(jù)是根據(jù)基于內(nèi)容標引技術(shù)來檢索的,例如,該標引技術(shù)可以是美國專利5,210,868和5,414,644描述的技術(shù)之一。
發(fā)明內(nèi)容本發(fā)明涉及一種用于向用戶提供內(nèi)容項的方法,尤其涉及的是在考慮用戶偏好的情況下提供選定內(nèi)容項的方法。本發(fā)明的基本思想是自動產(chǎn)生元數(shù)據(jù),以及使用這些所產(chǎn)生的元數(shù)據(jù)來選擇要提供的內(nèi)容項。申請人認識到,手動產(chǎn)生元數(shù)據(jù)、即手動產(chǎn)生一般原創(chuàng)元數(shù)據(jù)的處理是一個極其耗時的活動(我們是無法跟上日益增長的已發(fā)布信息的量),此外,該處理還很容易出錯,并且通常不是面向服務的。因此,在實踐中是很難達到適于過濾數(shù)量龐大的已發(fā)布信息的精度的。申請人認識到,具有精確的用戶簡檔以及具有構(gòu)建和自動更新這些用戶簡檔的能力是非常重要的。此外,申請人還注意到,在提供內(nèi)容時可以很有利地使用交互上下文來構(gòu)建或更新用戶簡檔。根據(jù)本發(fā)明的方法可以由向用戶提供個性化內(nèi)容遞送服務的服務供應商來提供。此外,上述考慮因素在以PULL(拖拉)模式和PUSH(推送)模式提供內(nèi)容項的時候都是適用的。根據(jù)本發(fā)明,內(nèi)容是自動生成的,優(yōu)選地,上下文元數(shù)據(jù)同樣是自動生成的。派生元數(shù)據(jù)(derivedmetadata)是根據(jù)推導規(guī)則(derivationrules)自動生成的,并且該推導規(guī)則與所應用的算法是對應的,其中舉例來說,所述算法是應用于內(nèi)容項的內(nèi)容、原創(chuàng)內(nèi)容元數(shù)據(jù)以及原始上下文元數(shù)據(jù)的算法。上述特征為根據(jù)本發(fā)明的選擇方法提供了靈活性和動力。除了顯性和/或隱性用戶反饋之外,在這里還可以很有利地使用派生元數(shù)據(jù)來構(gòu)建和維護用戶簡檔。以此方式可以精確構(gòu)建用戶簡檔,并且該用戶簡檔可以隨時間精確維護。優(yōu)選地,構(gòu)建和維護(也就是更新)用戶簡檔的處理是通過使用機器學習技術(shù)來執(zhí)行的。本發(fā)明包括與內(nèi)容項處理相關的第一個方面。內(nèi)容處理與內(nèi)容項的恰當選擇基本對應。在優(yōu)選實施例中,本發(fā)明還涉及與用戶簡檔處理相關的第二個方面,其中該方面與恰當構(gòu)建和維護用戶簡檔的處理基本對應。由于精確的內(nèi)容選擇可以依照用戶簡檔匹配來執(zhí)行,換言之,內(nèi)容項是對照用戶筒檔來匹配的,因此,這兩個方面是相互聯(lián)系的。為了構(gòu)建和維護用戶簡檔,較為有利的是使用與選定內(nèi)容有關的用戶反饋(顯性和/或隱性)。根據(jù)本發(fā)明的第一個方面,在接收到來自用戶的內(nèi)容請求時執(zhí)行下列步驟-從上述請求開始產(chǎn)生一個查詢;-根據(jù)該查詢來識別第一集合的內(nèi)容項;-識別那些有可能與該第一集合中的每個內(nèi)容項關聯(lián)的預先指定的內(nèi)容元數(shù)據(jù)(通常是原創(chuàng)的);-優(yōu)選地,識別那些代表與上述請求相關聯(lián)的上下文信息的原始上下文元數(shù)據(jù),以及-根據(jù)推導規(guī)則來為每一個內(nèi)容項自動生成派生元數(shù)據(jù),其中該指導規(guī)則與應用于內(nèi)容項以及優(yōu)選還應用于與所述內(nèi)容項相關聯(lián)的預先指定的內(nèi)容元數(shù)據(jù)(如果存在的話)的算法相對應。更為優(yōu)選的是,這些算法還被應用于原始上下文元數(shù)據(jù)。優(yōu)選地,在生成了派生元數(shù)據(jù)之后,第一內(nèi)容項集合被保存在內(nèi)容項儲存庫中。更為優(yōu)選的是,依照用戶請求產(chǎn)生并且與內(nèi)容項相關聯(lián)的派生元數(shù)據(jù)同樣會保存在內(nèi)容項儲存庫中,以便在以后使用,從而避免重復執(zhí)行元數(shù)據(jù)推導處理。當已經(jīng)產(chǎn)生了與所述第一集合的每一個內(nèi)容項相關聯(lián)的派生元數(shù)據(jù)時,這時會將第二選定內(nèi)容項集合提供給用戶,其中所述第二集合包含在第一內(nèi)容項集合內(nèi)部。根據(jù)本發(fā)明的優(yōu)選實施例,第二內(nèi)容項集合是通過執(zhí)行下列步驟提供的-為每一個內(nèi)容項識別(派生和預先指定的)內(nèi)容元數(shù)據(jù);-優(yōu)選地,為每一個內(nèi)容項識別上下文(派生的和原始的)元數(shù)據(jù);-識別產(chǎn)生該請求的用戶所具有的用戶簡檔,-根據(jù)至少某些派生元數(shù)據(jù)來將所述第一集合的內(nèi)容項與用戶筒檔相匹配,以及為該集合的內(nèi)容項產(chǎn)生一個排序;-根據(jù)所述排序,將第二內(nèi)容項集合提供給用戶,其中所述第二集合與根據(jù)所述排序排列的第一集合相對應,或者(優(yōu)選地)與包含最佳排序內(nèi)容項的內(nèi)容項子集相對應,以及-優(yōu)選地,收集關于所提供的內(nèi)容項的用戶反饋(顯性和/或隱性的)。對屬于與用戶反饋相關聯(lián)的所述第二集合的內(nèi)容項來說,每一個內(nèi)容項都對應于一個交互事件,其中該交互事件優(yōu)選作為一個記錄而被保存在交互歷史儲存庫中。由此,根據(jù)本發(fā)明的優(yōu)選實施例,為了更新用戶簡檔,執(zhí)行下列步驟-檢索與產(chǎn)生請求的用戶相關的多個交互歷史記錄,其中每一個記錄都包括一個內(nèi)容項以及與所述內(nèi)容項相關聯(lián)的至少一個用戶反饋(顯性和/或隱性),并且該用戶反饋通常是以用戶投票表示的。優(yōu)選地,這些記錄還包括用戶請求、原始上下文元數(shù)據(jù)以及與內(nèi)容項相關聯(lián)的內(nèi)容元數(shù)據(jù),其中該內(nèi)容元數(shù)據(jù)是推導得到并且是預先指定的;-選擇用于構(gòu)建該用戶的預測模型的機器學習算法;-將每一個記錄(也就是所存儲的每一個交互事件)編碼成特征矢量,其中該特征矢量是被適配成與選定的機器學習算法結(jié)合使用的形式表示。所述特征矢量包含與關聯(lián)于特定內(nèi)容項的元數(shù)據(jù)相對應的多個元素,其中該元數(shù)據(jù)是推導得到以及(如果存在的話)是預先指定的,此外,該特征矢量還包含用戶反饋。如果在記錄中并未給出推導得到的元數(shù)據(jù),那么可以從內(nèi)容項儲存庫中檢索這些元數(shù)據(jù),其中該內(nèi)容儲存庫包含第一集合的所有內(nèi)容項,并且通常包含依照查詢所選擇的內(nèi)容項;-將選定的機器學習算法應用于所述特征矢量,其中每一個矢量與一個交互事件相對應,由此構(gòu)建預測模型(用戶模型);-(更為優(yōu)選的是)驗證所構(gòu)建的預測模型,以及-通過使用新預測模型取代舊預測模型來更新上述用戶的簡檔。由此,根據(jù)本發(fā)明的優(yōu)選方面,在考慮用戶反饋的情況下,通過將機器學習算法應用于派生元數(shù)據(jù),并且優(yōu)選應用于預先指定的元數(shù)據(jù),可以在第一內(nèi)容項集合內(nèi)部定義一個排序,由此提供第二內(nèi)容項集合。更為優(yōu)選的是,上下文元數(shù)據(jù)(原始的和派生的)是作為應用了機器學習方法的特征矢量中的獨立特征而被考慮的。如果在交互歷史儲存庫的記錄中不存在派生上下文元數(shù)據(jù),那么,由于原始上下文元數(shù)據(jù)的元數(shù)據(jù)推導的計算通常并不繁重,因此,他們可以從原始上下文元數(shù)據(jù)中同時(on-the-fly)被推導得到。通過結(jié)合附圖來考慮下文中的描述,可以更清楚地了解本發(fā)明,其中圖l顯示的是實施根據(jù)本發(fā)明的方法實施例的系統(tǒng)的框圖,圖2顯示的是根據(jù)本發(fā)明來處理內(nèi)容項的主要步驟的流程圖,圖3顯示的是根據(jù)本發(fā)明來處理用戶簡檔的主要步驟的流程圖,以及圖4示意性顯示了一種被適配成存儲內(nèi)容項和相關元數(shù)據(jù)并且可以用于本發(fā)明的數(shù)據(jù)結(jié)構(gòu)。具體實施例方式在詳細描述本發(fā)明之前,在下文中將會提供某些術(shù)語定義和描述。基于內(nèi)容的服務在本說明書中,基于內(nèi)容的服務是任何一種通過利用已有內(nèi)容項集合來構(gòu)建有可能對服務的訂戶有價值的信息內(nèi)容的軟件應用。聚集以及向用戶呈現(xiàn)選定內(nèi)容的方式是由服務應用邏輯來定義的。用戶可以采用PULL或PUSH這兩種模式以及通過服務前端來與基于內(nèi)容的服務進行交互;基于內(nèi)容的服務可以提供一種或兩種模式。在PULL模式中,用戶通過直接訪問服務前端來發(fā)起交互,其中該用戶有可能提供特定輸入,以便即時獲取預期內(nèi)容。在PUSH模式中,當用戶預訂(并且有可能在后續(xù)時間)基于內(nèi)容的服務時,用戶可以提供輸入,并且該輸入可以在以后產(chǎn)生服務內(nèi)容。根據(jù)這些輸入,當產(chǎn)生內(nèi)容時,用戶將被告知訪問服務前端,以便獲取該內(nèi)容。內(nèi)容項(CONTENTITEM)在本
技術(shù)領域:
中,內(nèi)容項是用于基于內(nèi)容的服務的用戶內(nèi)容交互的基本單元。基于內(nèi)容的服務提供了通常充當服務訂戶(即用戶)請求應答的內(nèi)容項。內(nèi)容項是作為服務遞送的單個實體而被用戶察覺的事物。但是,內(nèi)容項也可以包括一個或多個內(nèi)容成分。舉例來說,如果內(nèi)容項是足球比賽視頻,那么該項目可以包括作為內(nèi)容成分的兩個比賽半場。關于內(nèi)容項的示例是-電影或電視節(jié)目,例如來自按需點播媒體遞送環(huán)境的電影或電視節(jié)目;-新聞文章,例如來自在線新聞閱讀器的新聞文章;-單獨的萬維網(wǎng)URL結(jié)果,例如來自萬維網(wǎng)搜索引擎的萬維網(wǎng)URL結(jié)果;-曲目,例如來自內(nèi)容共享網(wǎng)絡環(huán)境的曲目;-圖片,例如來自在線媒體目錄的圖片;-網(wǎng)頁,例如來自因特網(wǎng)導航的網(wǎng)頁;-產(chǎn)品頁面,例如來自電子商務目錄的產(chǎn)品頁面。通常,內(nèi)容項是包含一個或多個內(nèi)容成分的結(jié)構(gòu)化對象。每一個內(nèi)容成分都是多媒體元素,例如文本、圖像、音頻、視頻、三維模型、矢量圖形、圖形布局。關于文本成分的示例是在線報紙文章的文本、新聞文章的文本部分、包含在網(wǎng)頁中的文本、電子商務目錄中的產(chǎn)品文本描述。關于圖像成分的示例是包含在網(wǎng)頁中的圖片和繪圖、包含在新聞頁面中的照片、包含在在線媒體目錄中的圖片。關于音頻成分的示例是包含按需點播媒體遞送環(huán)境中的曲目的音頻文件、包含內(nèi)容共享環(huán)境中的曲目的音頻文件、電影中的音軌、新聞文章中的音軌。關于視頻成分的示例是包含按需點播媒體遞送環(huán)境的電影或電視節(jié)目的文件、包含內(nèi)容共享環(huán)境中的視頻的文件、新聞頁面的視頻部分。關于三維模型成分的示例是代表在線電子商務目錄中的器具的3D模型。關于矢量圖形成分的示例是網(wǎng)頁中的Flash動畫,SVG(可縮放矢量圖形)文檔。關于圖形布局的示例是網(wǎng)頁的圖形布局。舉例來說,關于多成分內(nèi)容項的示例是與某條新聞相關并且包含文本成分(也就是描述該新聞的簡短文本)、音頻-視頻成分(也就是描述和顯示該新聞的音頻-視頻序列)以及音頻成分(也就是描述該新聞的音頻序列)的新聞項目。內(nèi)容元數(shù)據(jù)(CONTENTMETADATA)在過去,"元數(shù)據(jù)"被簡單地定義為"關于信息的信息"。更具體地說(并且根據(jù)W"www"聯(lián)盟),內(nèi)容元數(shù)據(jù)通常包含描述指定內(nèi)容項的數(shù)據(jù)結(jié)構(gòu),并且可以由計算機之類的機器自動處理。內(nèi)容元數(shù)據(jù)可以描述屬于內(nèi)容項的每一個內(nèi)容成分,或者將該內(nèi)容項作為一個整體來進行描述。可供內(nèi)容供應商使用的內(nèi)容項通常具有元數(shù)據(jù),例如標識標引(例如主題、字段.......)。當內(nèi)容項可供基于內(nèi)容的服務使用時,與該內(nèi)容項相關聯(lián)的元數(shù)據(jù)將被稱為預先指定的元數(shù)據(jù)。預先指定的元數(shù)據(jù)通常是"原創(chuàng)元數(shù)據(jù)",它是一種由他人或內(nèi)容項作者而關聯(lián)于內(nèi)容項的內(nèi)容元數(shù)據(jù),所述他人或內(nèi)容項作者通常位于內(nèi)容供應商組織內(nèi)部。原創(chuàng)元數(shù)據(jù)通常是借助注釋處理而被手動指定給每一個內(nèi)容的。元數(shù)據(jù)具有不同的種類,例如文本元數(shù)據(jù)、關鍵詞元數(shù)據(jù)、分類元數(shù)據(jù)(具有處于有限值集合以內(nèi)的值的分類標簽)、數(shù)字元數(shù)據(jù)。元數(shù)據(jù)可以具有更復雜的結(jié)構(gòu),其中舉例來說,該結(jié)構(gòu)可以是從先前類型(結(jié)構(gòu)化元數(shù)據(jù))組合中推導得到的結(jié)構(gòu),或是與根據(jù)RDF(資源描述框架)的語義網(wǎng)絡(語義網(wǎng)絡元數(shù)據(jù))相對應的結(jié)構(gòu)。關于文本元數(shù)據(jù)的示例是與網(wǎng)頁中的圖片相關聯(lián)的文本描述(在這里可以提供與頁面中的每一個圖片的內(nèi)容相關聯(lián)的多個原創(chuàng)元數(shù)據(jù))、網(wǎng)頁內(nèi)容的文本概述(與網(wǎng)頁整體相關聯(lián)的原創(chuàng)元數(shù)據(jù))、與曲目項目相關聯(lián)的曲目歌詞。關于關鍵詞元數(shù)據(jù)的示例是用于描述新聞項目所覆蓋的主題的關鍵詞列表、與電影項目特征(如IMDB互聯(lián)網(wǎng)電影數(shù)據(jù)庫中的電影項目特征)相關聯(lián)的關鍵詞列表、用于描述場景主要特征以及圖片項目中描述的主題的關鍵詞列表。關于分類元數(shù)據(jù)的示例是聲明新聞項目的新聞分類(在預定新聞分類集合內(nèi)部)的"分類"標簽、聲明曲目音樂流派(在預定的音樂流派集合內(nèi)部)的"流派"標簽、聲明電影項目是"黑白"還是"彩色"的"彩色"標簽。關于數(shù)字元數(shù)據(jù)的示例是與電影項目的出品年份相對應的整數(shù)、與電影項目的持續(xù)時間(例如以分鐘為單位)相對應的整數(shù)、與在電子商務目錄中購買的產(chǎn)品項目的價格相對應的貨幣數(shù)量。舉例來說,結(jié)構(gòu)化元數(shù)據(jù)可以應用于電影項目;在實踐中,電影可以具有一個演職員表,并且該演職員表可以被表示成演員姓名以及演員年齡、演員在電影中的角色、演員性別等等的列表。關于結(jié)構(gòu)化元數(shù)據(jù)表示的典型實例是由MPEG-7描述標準提供的。上下文元數(shù)據(jù)(CONTEXTMETADATA)交互上下文(簡稱為"上下文")是用于基于內(nèi)容的服務的用戶內(nèi)容交互的一個重要元素。實際上,每一個用戶內(nèi)容交互都是在上下文內(nèi)部發(fā)生的,并且該上下文通常會影響用戶在某個指定上下文內(nèi)部使項目引起關注以及在別的上下文中不使該項目引起關注的用戶偏好。交互上下文信息還可以關聯(lián)于一個或多個元數(shù)據(jù),這些元數(shù)據(jù)被稱為上下文元數(shù)據(jù)。該交互上下文是由不同的方面形成的。通常,最重要的方面是"日期和時間"(何時發(fā)生交互)、"用戶位置,,(何處發(fā)生交互)、"交互設備"(供用戶用于交互使用的設備)、"內(nèi)容通道"(通過該通道來發(fā)生交互)、"環(huán)境狀態(tài),,(交互期間)、"物理世界狀態(tài)"(交互期間)、"用戶狀態(tài)"(交互期間)。"用戶位置,,可以采用若干種方式以及若干種形式來提供,例如從GPS系統(tǒng)或蜂窩網(wǎng)絡獲取的空間坐標、由短距離無線信標系統(tǒng)提供的邏輯坐標、傳送關于用戶所在位置的元數(shù)據(jù)描述。舉例來說,"交互設備,,的特征可以是設備的移動性(也就是移動或固定設備)、設備的圖形顯示能力(例如大小、分辨率、顯示顏色數(shù)量)、設備的聲音能力(例如音頻通道數(shù)量),它的商標和模型。在諸如按需點播媒體遞送環(huán)境之類的某些環(huán)境中,每一個交互都包括選擇"內(nèi)容通道",例如電視頻道或電影供應商。舉例來說,"環(huán)境狀態(tài)"可以從交互設備中的環(huán)境選項的設置中得到。舉個例子,移動電話設備可以被設置成"會議"、"工作"或"家庭,,模式,或者其狀態(tài)可以被設置成"振鈴"或"靜音"模式。舉例來說,與"物理世界狀態(tài),,相關的信息可以由檢測溫度、照明狀態(tài)、濕度、壓力、風速的傳感器提供。舉例來說,與"用戶狀態(tài),,相關聯(lián)的信息可以由檢測用戶身體加速度或是其某些生理參數(shù)的傳感器來提供,其中舉例來說,這些生理參數(shù)可以是心率、血壓、皮膚導電性(以便確定其緊張/放松狀態(tài))。在下文中,從一個或多個物理設備直接得到的上下文元數(shù)據(jù)將被稱為"原始上下文元數(shù)據(jù)"。舉例來說,該物理設備可以是定時器、傳感器、開關(硬件或軟件)。通常,這些設備是集成在包含用戶接口的終端設備(例如移動電話、個人計算機等等)內(nèi)部的。元數(shù)據(jù)表示(MEADATAREPRESENTATION)為了簡化各種類型元數(shù)據(jù)的存取和處理,較為有利的是使用一種統(tǒng)一和便于擴展的格式。目前業(yè)已發(fā)現(xiàn)的是,MPEG-7描述標準已特別適合本發(fā)明。在本說明書稍后描述的實施例中,該標準已被用作所有元數(shù)據(jù)、即原創(chuàng)和派生元數(shù)據(jù)的格式。特別地,內(nèi)容項元數(shù)據(jù)是作為零個或多個"相關材料,,塊列表來組織的(參見圖4),其中每一個相關材料都描述了一個可以引用實際內(nèi)容或是代表元數(shù)據(jù)的XML可擴展標記語言塊的同種信息塊。引用始終都會指向相關的附件塊,而所述附件塊則轉(zhuǎn)而保持實際內(nèi)容(或元數(shù)據(jù))或是提供可以發(fā)現(xiàn)內(nèi)容(或元數(shù)據(jù))所在的URL統(tǒng)一資源定位符。這種組織可以適合不同的存儲策略,同時向內(nèi)容成分以及元數(shù)據(jù)提供集中接入點。除了包含在每個相關材料中的信息之外,內(nèi)容元數(shù)據(jù)還可以保持每一個已發(fā)布內(nèi)容應該擁有的通用信息群組,例如創(chuàng)建日期,或是服務應用邏輯所需要的其他信息,例如用于指示是否可以認為內(nèi)容可用的有效狀態(tài)標記。以下給出的是依照MPEG-7標準編碼并且報告了成分的某些公共特征的"相關材料"。<RelatedMatcrial><MediaType>Image<yMediaType><NfediaInfoniiatioii><McdiaIdentification><Idcntifiaer>image_1</Idcntifier></MediaIdentification><McdiaProfileMaster="true",lid="image_1_profile"><McdiaFomat><FileFomat>image/pjpeg</FileFonnat><AspectRatioHeight="322"Width="122"/><FileSize>1002<FileSize></MediaFonnat><MediaInstance><Identifier>image_l</Indentifier><InstanceLocator><MediaURLidref="attachment_1"/></InstanceLocator></MediaInstance></MediaProfile></MediaInformation>/RdatedMaterial>上述"相關材料"指的是下文中用于實際媒體原始數(shù)據(jù)、尤其是圖像的"相關附件",其中該"相關附件"是根據(jù)MPEG-7標準編碼的。<RelatedAttachmcntid"attachment_l"><AttachmentDataStorage="internal"Rncoding="Base64Binary><EncodedData>BASE64ENCODINGOFTHEIMAGENOTSHOWN</BacodedDate></AttachmentData></RelatedAttachment>相同的方法還可以用于引入派生元數(shù)據(jù)新的"相關材料"將4皮添加到列表中,如果需要的話,用于標引新的"相關附件"的引用可以適用于不適合這個"相關附件"模式的元數(shù)據(jù)XML塊。雖然所描述的元數(shù)據(jù)表示是優(yōu)選的,但是應該理解,本發(fā)明并不局限于這種元數(shù)據(jù)表示。派生元數(shù)據(jù)(DERIVEDMETADATA)本發(fā)明提供了除預先指定的元數(shù)據(jù)以及原始上下文元數(shù)據(jù)之外的其他元數(shù)據(jù),由于這些元數(shù)據(jù)是從交互事件內(nèi)部的內(nèi)容信息和/或上下文信息或是作為一個或多個交互事件的結(jié)果而被推導得到的,因此,這些元數(shù)據(jù)被稱為"派生元數(shù)據(jù)"。特別地,派生內(nèi)容元數(shù)據(jù)可以直接從內(nèi)容項中得到,也就是說,它可以直接從內(nèi)容項的內(nèi)容中得到,此外,派生內(nèi)容元數(shù)據(jù)也可以間接地從內(nèi)容項中得到,例如從關聯(lián)于內(nèi)容項的原創(chuàng)內(nèi)容元數(shù)據(jù)中得到。當內(nèi)容項被發(fā)布并且隨后被軟件程序生成時,派生內(nèi)容元數(shù)據(jù)并不是直接可用的。類似地,派生內(nèi)容元數(shù)據(jù)可以直接從上下文項中得到,也就是說,它可以從交互事件的上下文中得到,或者從上下文項(即從關聯(lián)于上下文項的上下文元數(shù)據(jù))中間接得到。當檢測到交互事件上下文并且隨后由軟件程序生成該交互事件上下文時,派生內(nèi)容元數(shù)據(jù)并不是直接可用的。派生元數(shù)據(jù)可以提供關于內(nèi)容和上下文的更完整和更有用的信息.派生元數(shù)據(jù)特別適合由軟件程序自動處理。在下文中將會述及關于元數(shù)據(jù)推導(derivation)的若干示例。對從文本項內(nèi)容(也就是文本自身)中推導得到的元數(shù)據(jù)來說,其示例是在文本中出現(xiàn)的單詞連同每一個單詞的出現(xiàn)次數(shù)的列表,并且它被稱為文本的"詞袋(bagofword)"表示;這些元數(shù)據(jù)給出了關于文本的整體詞匯合成的信息。對從文本項內(nèi)容(也就是文本自身)中推導得到的元數(shù)據(jù)來說,它的其他示例包括文本量度,也就是針對文本所計算的數(shù)值參數(shù),例如文本的全局長度、句子的平均長度或是屬于文本的段落,句法結(jié)構(gòu)的平均嵌套深度,Gunning的Fog索引(例如用于英文文本)以及Guplease索引(例如用于意大利語文本)。舉例來說,對從圖像項的內(nèi)容(也就是圖像自身)中推導得到的元數(shù)據(jù)來說,其示例包括-亮度直方圖,它是光強度在數(shù)字圖像像素上的分布——它給出的是關于圖像上的量度和對比度的信息;-顏色直方圖,它是基色分量(紅、綠、藍)在數(shù)字圖像像素上的分布——它給出的是關于圖像顏色組成的信息;-圖像的空間頻率分量,舉例來說,該分量是借助二維傅里葉變換計算的——它給出的是關于圖像中的圖案和紋理的呈現(xiàn)的信息;-幾何分類元數(shù)據(jù),舉例來說,該元數(shù)據(jù)是借助幾何散列技術(shù)產(chǎn)生的——它給出的是關于圖像中諸如線條、弧線、橢圓形、多邊形之類的形狀的呈現(xiàn)的信息;-圖案分類元數(shù)據(jù),舉例來說,該元數(shù)據(jù)是通過圖案識別算法產(chǎn)生的——它給出的是關于圖像中的特定信息,例如人臉、動物、植物、風景、建筑、標記、技術(shù)繪圖、涂色、漫畫的呈現(xiàn)的信息;-文本元數(shù)據(jù),舉例來說,該元數(shù)據(jù)是通過光學字符識別技術(shù)產(chǎn)生的——它給出的是關于在圖像中出現(xiàn)的字母、數(shù)字和單詞的信息;舉例來說,從聲音項的內(nèi)容(也就是從聲音自身)中得到的元數(shù)據(jù)包括-音頻頻鐠成分,舉例來說,該成分是借助快速傅里葉變換計算的——它給出的是關于聲音的特性和組成的信息;-音頻波形一它給出的是關于聲音動態(tài)特性的信息;圖案分類元數(shù)據(jù),舉例來說,該元數(shù)據(jù)是通過圖案識別算法產(chǎn)生的一它給出的是關于特定特征,例如特定音樂、語音、拍擊聲、爆炸聲在音軌中的呈現(xiàn)的信息;-文本元數(shù)據(jù),舉例來說,該元數(shù)據(jù)是通過語音識別技術(shù)產(chǎn)生的——它從音軌中提取發(fā)出聲音的單詞或句子。通過使用特定分析和算法,可以從視頻項內(nèi)容(也就是從視頻自身)中推導得出元數(shù)據(jù)。場景分段分析技術(shù)可以給出關于視頻時間結(jié)構(gòu)的信息。例如,這種分析可以告知電影包括指定數(shù)量的場景,其中該場景的百分比是用強烈的運動行為表征的,而另一個百分比則是用聲音很大的音樂的呈現(xiàn)來表征的。運動對象識別算法可以給出關于特定對象在視頻中的呈現(xiàn)的信息,其中該呈現(xiàn)是用特定的運動行為表征的,例如正在行走的人、交談或唱歌的人、行駛中的汽車、正在掉落的物體、正在打開的門。如果將視頻分解成一系列靜止圖像,那么,倘若存在將圖像序列上的最終得到的元數(shù)據(jù)平均的方式,則可以將某些用于靜止圖像的元數(shù)據(jù)提取技術(shù)應用于視頻。舉例來說,從3D模型中推導得到的元數(shù)據(jù)包括-整體面積、整體體積、凸性、分形維度;-圖案分類元數(shù)據(jù),其中舉例來說,該元數(shù)據(jù)是通過圖案識別算法產(chǎn)生的——它給出的是關于特定3D形狀,例如方框、管道、輪形、線路、人形、物體形狀的呈現(xiàn)的信息。如先前所述,通常,元數(shù)據(jù)是可以從其他任何元數(shù)據(jù)中得到的。舉例來說,從數(shù)值元數(shù)據(jù)開始,符號范圍可以通過使用能夠聚集數(shù)值的離散化技術(shù)來產(chǎn)生;這是一種提供關于數(shù)值的更緊湊和更語義性的表示的方式。元數(shù)據(jù)還可以通過使用本體(ontology)來得到。本體是一種使用了機器可讀表示的概念化形式。本體可以用于組織元數(shù)據(jù)中的分類和關系;這樣則允許將用戶偏好模型構(gòu)建到高階語義分類和概念上。舉例來說,關于本體的信息可以在W3聯(lián)盟網(wǎng)站(當前位于地址"http:〃www.w3.org")以及ChristianeFellbaum編著并由MITPress于1998年5月出版的"WordNet:AnElectronicLexicalDatabase"—書中找到。在下文中提供了與通過本體得到的元數(shù)據(jù)相關的兩個示例。用于時間的簡單本體是依照"日間時間"和"夜間時間"的時間值分類;用于日期的簡單本體是依照"工作日"和"周末日"的日期值分類。在用戶偏好模型的構(gòu)造中,時間值元數(shù)據(jù)和日期值元數(shù)據(jù)是沒有意義的;而"日間時間/夜間時間"和"工作日/周末日"元數(shù)據(jù)則有可能會更為有效。舉個例子,用戶偏好模型可以聲明用戶喜愛在周末日夜間與關聯(lián)于某個分類的內(nèi)容項進行交互,而在同時包含日間和夜間在內(nèi)的工作日中則不喜歡這些內(nèi)容項。本體特別適合產(chǎn)生分類元數(shù)據(jù)。讓我們以三個文本項A、B、C為例,其中每一個文本項都包含了一篇新聞文章。文章A講述的是人類肺部的計算機模型,并且包含(除了別的因素之外)元數(shù)據(jù)單詞"計算機,,和"哮喘"。文章B講述的是機器人輔助手術(shù),并且包含了元數(shù)據(jù)單詞"軟件"和"外科醫(yī)生"。文章C講述的是因特網(wǎng),并且包含了元數(shù)據(jù)單詞"網(wǎng)站"。通過將元數(shù)據(jù)單詞與詞匯本體相聯(lián)系,可以擴充文章A和B,其中舉例來說,所述擴充是通過抽象分類"醫(yī)療"來實施的,并且該抽象范疇可以添加到這兩篇文章的元數(shù)據(jù)中。與之類似的是,所有這三篇文章A、B、C的元數(shù)據(jù)可以通過抽象分類"計算機科學"和"技術(shù)"來擴充。由此,用戶對這些文章的興趣有可能涉及該抽象分類,而不是單個字詞。元數(shù)據(jù)推導(METADATADERIVATION)本發(fā)明的一個重要方面是產(chǎn)生(也就是推導)元數(shù)據(jù)。這一點是根據(jù)推導規(guī)則(derivationrules)來實現(xiàn)的。推導規(guī)則與應用于內(nèi)容項和/或上下文信息和/或元數(shù)據(jù)的算法相對應,對應用了推導算法的數(shù)據(jù)來說,該數(shù)據(jù)通常被稱為源。推導規(guī)則規(guī)定的是所要應用的算法,其中該規(guī)定是通過引用實施該算法的插件模塊來實現(xiàn)的,此外,該推導規(guī)則還規(guī)定了所要處理的源。特別地,在這里可以提供下列類型的源*內(nèi)容成分;*原創(chuàng)內(nèi)容元數(shù)據(jù);*原始上下文元數(shù)據(jù);*派生元數(shù)據(jù)(也就是從其他推導規(guī)則獲取的元數(shù)據(jù));*擴展分析。舉例來說,推導規(guī)則可以借助規(guī)定上述元素(也就是用于實施所要使用的算法的模塊、所需要的參數(shù),以及所要使用的輸入源)的XML可擴展標記語言文檔來描述。在下文中給出了關于推導規(guī)則的某些實例。第一組實例涉及新聞瀏覽器應用。在這個應用中,內(nèi)容項是新聞文章。每一個內(nèi)容項都包含了兩個內(nèi)容成分新聞文章標題和主體,并且這二者全都采用了文本形式。每一個內(nèi)容項的內(nèi)容都與作為原創(chuàng)元數(shù)據(jù)的文章的日期、分類、來源以及作者名稱相關聯(lián);特別地,這個元數(shù)據(jù)包含在內(nèi)容項中。第一元數(shù)據(jù)推導規(guī)則是如下定義的OerivationRuleID^Body一BagOfWords,<Modulenamc-,BagOfWords,<Paramcternamc^anguage">ItaIiaii</Paramcte></Modulc><Sourcctypc"ConteatCoiiq)onenr>ncwB,body</Sourt^>OcstinatioQtypc=MDcrivcdMctadate">bodyBow</Destinatian></DcrivationRuk>通過執(zhí)行插件模塊提供的名為"BagOfWords(詞袋)"的算法,該規(guī)則規(guī)定獲取構(gòu)成新聞文章主體的文本數(shù)據(jù),以此作為輸入(源),以及產(chǎn)生其"詞袋,表示,以此作為輸出(目的地),也就是在主體中出現(xiàn)的單詞連同每一個單詞的出現(xiàn)數(shù)量的列表。第二元數(shù)據(jù)推導規(guī)則是如下定義的<DcrivationRuteBD^Body—WordOntology"><Modulenamc^WordQntology,<Param$tername-"加tology^LcxicalOntologyl<yParameta><Paiameternamc^TanguagCItaHaiK/Paramete^<P^rameternameB=whypcniyins*>2<^Paranieter><Parametername"topseniantiolever>tnic<Paramctcr>^Paramcfername^minoocui^3Warameter》</M6duie><Souioetypcs=MContartCoiiiponent">iiews.body</Source>Oestinationtype^T)eiivcdMetadata,bodyWordOntcK/Dc8tinati加〉</DcrivationRule>通過執(zhí)行名為"WordOntology"的插件模塊所提供的算法,該規(guī)則規(guī)定獲取構(gòu)成新聞文章主體的文本數(shù)據(jù),以此作為輸入,以及產(chǎn)生相關的概念詞集合,以此作為輸出。該規(guī)則執(zhí)行以下步驟從源文本中產(chǎn)生"詞袋",*對照"LexicalOntologyl,,詞匯本體來匹配源自所獲取的"詞袋"的每一個單詞。對每一個匹配單詞來說,它會提取與單詞相關聯(lián)的上位體(hypernyms),兩個等級以上(hypernym=2)。類似LexicalOntologyl的詞匯本體將被組織成樹。如果從樹的葉子朝著根部運動,那么這意味著從特定含義的單詞朝著代表一個或多個抽象概念的單詞移動。如果給出了某個單詞,那么樹中位于該單詞上方的單詞將被稱為"上位體,,(例如"醫(yī)生,,-"個人,,-"活物,,;"醫(yī)生,,-"專業(yè)"-"工作者,,)。實際上,在本體中可以具有一個以上的樹與單詞相關聯(lián)的頂級語義分類(topsemanticlevel-"真",)(例如,單詞"醫(yī)生,,屬于頂級語義分類"醫(yī)學",)。*對所提取的概念(上位體和頂級語義分類)的出現(xiàn)進行計數(shù),由此僅僅保持至少出現(xiàn)了三次的概念(minoccur=3)。通過執(zhí)行這個處理,可以限制最終的概念數(shù)量,由此僅僅保持最接近的概念??偟慕Y(jié)果是一個新聞文章文本主體的語義表示,該表示采用了來自詞匯本體的概念單詞集的形式,并且每一個表示都具有其出現(xiàn)次數(shù)。以下的第三和第四推導規(guī)則分別與上文中的第一和第二推導規(guī)則類似,但是其來源是新聞項標題而不是主體。然而應該指出的是,如在"Destinationtag(目的地標簽),,中聲明的那樣,從標題產(chǎn)生的元數(shù)據(jù)將會形成一個與從主體產(chǎn)生的元數(shù)據(jù)相分離的元數(shù)據(jù)集合。<DerivationRuleID="Title-BagOfWord"><Modulename="BagOfWord"><Parametername=language">Italian</Paramcter></Module><Sourcetype="CotentComponcnt">new8.title</Scurcc><Destinationtype="DcrivedMctadata">titleBow<Destination></DerivaticraRule><DerivationRuleID="Title-wordontology"><Modulename="wordontology"><Parametername=ontology>Lexicalonlogyl</parameter><Parametername=language">Italian</Paramcter><Parametername="hypemyms">2</parameter><Parametername="topscmanticlevel">true</parameter><Parametername=minoccur">3</parameter></Module><Sourcetype="CotentComponcnt">new8.title</Scurcc><Destinationtype="DcrivedMctadata">titlewordonto<Destination></DerivaticraRule>以下規(guī)則將會通過執(zhí)行插件模塊"TextMetrics(文本量度)"提供的算法來產(chǎn)生與新聞主體長度相對應的數(shù)值元數(shù)據(jù),并且這個元數(shù)據(jù)是作為其內(nèi)單詞的計數(shù)來提供的。<DerivationRuleID=Body_length"><modulename="textmetrics><parametername="metrio"textlength</parameter><parametername="unit">word</parameter><module><Sourcetype="CotentComponcnt">news.body</Source><Destinationtype="DcrivedMctadata">bodytextlength<Destination></DerivaticraRule>以下規(guī)則將會產(chǎn)生與新聞文章主體中的平均句子長度相對應的數(shù)值元數(shù)據(jù)。<DerivationRuleID=Body_avgsenlen"><modulename="textmetrics"<parametername="metrics">avgsenlen</parameter></module><Sourcetype="CotentComponcnt">news.body</Source><Destinationtype="DcrivedMctadata">avgsenlen<Destination></DerivaticraRule>以下規(guī)則將會產(chǎn)生用于表述估計得到的閱讀新聞文章主體的易讀性的數(shù)值元數(shù)據(jù)。<DerivationRuleID="Body—Rcadabilityladex、<ParameternamcM,lmdric'*>ReadabilityInde3C8ram^er></Module><Sourcetype^ContentComponcnf>ncws-body</Sourctf>(Destinationtypc^T)erivedMetadata,bodyTcxtLengtlr!VDestination^</DerivationRid6>以下的三個規(guī)則將會產(chǎn)生與新聞主體文本中的日期、圖表(數(shù)字、百分比、價格)以及人名的出現(xiàn)次數(shù)相對應的三個數(shù)值元數(shù)據(jù)。<Modulenamo""TextMetrics,<Parametcrname="metric'*>Dates<yPanimctci></Module><Sourcetype^"ContcntCompon加f^iwws,bod)^Source^ODcstinati加1ypeT>crivedMctadata,>>bodyDates<yDestination></DerivationRub><DerivationRuleID^TBody一Numbers^</Modulc><Sourcetype:"ContentCanipoiiciif,>news.body</Sourcc>destinationiypewDcrivedMctadato">bodyFigures</De8tination></DcrivationRule><DerivationRuleE^^ody-PcopleNames^<Parametcrnamc="metriCPeopW^ames</Paranieter></Module><Destinationtype=^DcrivcdMctadata,*>bodyFNames</Destinatioti><VDerivationRale>第二組實例涉及音樂目錄瀏覽器應用。在這個應用中,項目是音樂片段。每一個項目都包含了單個內(nèi)容成分編碼音樂片段的音頻文件(例如以MP3格式)。每一個項目還包含了音樂的標題、日期、流派、表演者姓名以及作者姓名,以此作為原創(chuàng)元數(shù)據(jù)。在下文中定義了第二集合的四個元數(shù)據(jù)推導規(guī)則<formula>seeoriginaldocumentpage24</formula>上述規(guī)則產(chǎn)生了分別表示"節(jié)拍速度"(也就是音樂片段的節(jié)奏特征的量化量度)、"人聲效果,,(也就是音樂片段中人聲成分相對于器樂成分的加權(quán))、"聲音亮度"(也就是聲音亮度的量化量度)以及"音量動態(tài)特性,,(也就是聲音音量隨時間而發(fā)生的改變的量化量度)。該規(guī)則可以通過執(zhí)行名為"AdvancedSpectralAnalysis"的插件模塊提供的算法,以及通過應用于編碼在音頻文件中的音頻信號的頻語分析技術(shù)來實現(xiàn)。以下規(guī)則產(chǎn)生的是用于表述音樂片段年代的文本標記元數(shù)據(jù),其中該元數(shù)據(jù)是從該片段的年份開始的。該規(guī)則可以通過由名為"NumericalDiscretizer"的插件模塊提供的離散化技術(shù)、也就是語義描述(年代)中的數(shù)值元數(shù)據(jù)的伸縮范圍來實現(xiàn)。<formula>seeoriginaldocumentpage25</formula>以下規(guī)則產(chǎn)生的是用于表述關于音樂主要表演者的流行度的粗略估計的數(shù)值元數(shù)據(jù)。該估計是通過將主要表演者的姓名提交到由名為"SearchEngineQuery,,的插件模塊所提供的萬維網(wǎng)搜索引擎以及獲取估計的點擊(包含該姓名的網(wǎng)站)次數(shù)作為結(jié)果來實現(xiàn)的。<formula>seeoriginaldocumentpage25</formula>使用擴展分析源的推導規(guī)則擴展分析提供了一種可以通過推導規(guī)則來影響的特殊類型的來源。這種來源規(guī)定了分析過程在儲存庫中包含的項目的整個子集(乃至所有項目)上的應用,以便獲取關于域結(jié)構(gòu)的整體分析。換句話說,使用擴展分析的推導規(guī)則并不局限于僅僅使用單個項目中包含的信息來提取元數(shù)據(jù),而是可以為每一個項目產(chǎn)生新的元數(shù)據(jù),并且這個新的元數(shù)據(jù)考慮了項目自身的整體結(jié)構(gòu)。所述域是推導技術(shù)的應用領域,也就是向用戶提供個性化選定內(nèi)容的領域。這些算法實際執(zhí)行的是由擴展分析所規(guī)定的分析,并且這些算法可以由專用軟件模塊或是通用元數(shù)據(jù)生成器模塊來執(zhí)行;如果提供了專用模塊,那么該專用模塊可以是一個在需要時由通用元數(shù)據(jù)生成器模塊調(diào)用的"插件"模塊。以下是基于擴展分析的推導規(guī)則;該規(guī)則作用于如上所述的音樂目錄應用。<formula>seeoriginaldocumentpage26</formula>在上述推導規(guī)則中作為擴展分析而被規(guī)定的分析會采用四個派生數(shù)值元數(shù)據(jù)作為輸入,這些數(shù)值元數(shù)據(jù)是通過應用先前示例中闡述的推導規(guī)則來獲取的。這四個數(shù)值描述了每一個音樂片段的四個相關音頻特征。擴展分析規(guī)定的是對包含在內(nèi)容儲存庫中的所有項目(也就是音樂片段)執(zhí)行"群集分析"。群集分析是一種已知的統(tǒng)計技術(shù),其中如果用相似值表征的項目群組(也就是群集)代表的是項目域中令人感興趣的規(guī)則,那么該統(tǒng)計技術(shù)將被用于識別這些群組。對音樂域來說,最終得到的群集可以將共享相似音頻外部特征、例如緊密性的音樂片段聚集到相同的音樂流派中。實際執(zhí)行該分析的算法是由名為"NumbericalClusterAnalysis"的插件模塊提供的。特別地,本示例中的擴展分析規(guī)定了所要應用的群集分析方法(Ward方法),必須應用分析的項目的范圍(儲存庫中的所有項目),以及所要提取的群集的最大數(shù)量(IO個群集)。該分析允許推導規(guī)則為指定項目(音樂片段)產(chǎn)生用于指示群集與其緊密度的元數(shù)據(jù)。這個新的元數(shù)據(jù)標識的是音樂片段在群集所表示的"音樂風景,,中的位置。機器學習方法機器學習方法允許計算機系統(tǒng)從屬于特定應用領域(也就是域)的實際數(shù)據(jù)集合執(zhí)行自動學習(也就是通過軟件程序)。在給出了這種數(shù)據(jù)集合的情況下,機器學習方法能從數(shù)據(jù)自身當中提取圖案和關系。已被學習的圖案和關系會由機器學習方法以一種形式量化模型來進行編碼,其中該模型根據(jù)所使用的機器學習技術(shù)而采用不同的形式。關于模型形式的示例包括邏輯規(guī)則、數(shù)學等式以及數(shù)學圖表。機器學習方法的目標是更好地理解和量化數(shù)據(jù)內(nèi)部的圖案以及數(shù)據(jù)之間的關系,以便獲取作為數(shù)據(jù)表示的模型。大多數(shù)機器學習方法都使用特征矢量表示。如果將這些方法應用于構(gòu)建與所提供的內(nèi)容相關的用戶偏好的預測模型,那么每一個特征矢量都會與一個內(nèi)容項相關聯(lián),并且包括獨立特征,其中每一個特征都與一個關聯(lián)于該內(nèi)容項以及優(yōu)選關聯(lián)于原始或派生上下文元數(shù)據(jù)的派生或預先指定的元數(shù)據(jù)相對應,以及一個或多個目標特征,這些特征是由用戶作為反饋(顯性或隱性)提供并與所提供的內(nèi)容項相關的分數(shù)表示的。舉例來說,該反饋是由從110的數(shù)值表示的,其中較高的值對應正反饋。然后,數(shù)據(jù)集合的每一個實例被表示為特征矢量。對單個目標特征來說,代表實例的矢量是"n+l,,維的,并且釆用如下形式<特征1,特征2,…"特征n,目標特征>該特征矢量模型是域數(shù)據(jù)的形式表示,并且適合大多數(shù)機器學習方法。在TomMitchell的"MachineLearning",McGraw-H川,1997中可以找到關于機器學習方法及其應用的大量論述。優(yōu)選地,數(shù)據(jù)集(將要由機器學習方法處理,以便構(gòu)建用戶簡檔的預測模型)包含了內(nèi)容元數(shù)據(jù)(原創(chuàng)和派生)以及上下文元數(shù)據(jù)(原始和派生),并且以此作為獨立特征。而用戶反饋則是目標特征。機器學習方法的目標是發(fā)現(xiàn)一個用于預測用戶偏好的模型(被稱為用戶模型或預測模型),也就是用于表述元數(shù)據(jù)與用戶反饋之間的關系的機器學習模型。然后,當新內(nèi)容項可用時,由此獲取的預測模型可以用于估計用戶對這些新內(nèi)容項的評價。對用特征矢量表示的數(shù)據(jù)集來說,該數(shù)據(jù)集的實例對應于單個交互事件,其中用戶將會表述其對一個內(nèi)容項的偏好,并且將會采用如下形式<內(nèi)容元數(shù)據(jù)1,...,內(nèi)容元數(shù)據(jù)m,上下文元數(shù)據(jù)1,…,上下文元數(shù)據(jù)p,用戶投票>其中m+p=n。如果用戶表達了對于多個內(nèi)容項的偏好,那么將會創(chuàng)建多個特征矢量,并且這些特征矢量在形式上可以用矩陣(n+l)xq來表示,其中q是交互事件數(shù)量。舉例來說,如果用戶表達了其對10個內(nèi)容項的偏好,那么將會創(chuàng)建矩陣(n+l)x10。然后,選定的機器學習算法將被應用于該矩陣。目前有若干種公知的機器學習方法可以用于這個目的,這其中包括決策樹,關聯(lián)規(guī)則、神經(jīng)網(wǎng)絡以及貝葉斯方法,以及那些專門設計用于構(gòu)建用戶偏好模型的任務的方法。在下文中參考先前所述的音樂目錄應用而給出了在構(gòu)建用戶簡檔的過程中使用機器學習方法的示例。在本示例中,例示內(nèi)容項(音樂片段)是用兩段元數(shù)據(jù)表示的-MusicGenre,音樂流派(作為原創(chuàng)數(shù)據(jù)提供),-MusicBeatSpeed,每分鐘的音樂片段的節(jié)拍(作為通過應用"MusicBeatSpeed"推導規(guī)則的派生元數(shù)據(jù)提供)。交互上下文是用下列(派生)上下文元數(shù)據(jù)表示的-"Time(時間)",它可以具有"日間",或"夜間"這兩個值中的任何一個,并且該元數(shù)據(jù)論述的是用戶與內(nèi)容項的交互是在日間還是夜間發(fā)生(作為派生元數(shù)據(jù)并且通過應用基于簡單時間本體的推導規(guī)則來提供)。用戶偏好是由以下特征給出的-"UserVote(用戶投票)",它可以具有"喜歡",或"不喜歡",這兩個值中的任何一個,并且這個元數(shù)據(jù)論述的是用戶為音樂片段提供的是肯定還是否定分數(shù)。由此,參考先前了解的關于所述域的常規(guī)機器學習表示,用于用戶表達其對音樂片段偏好的單個事件可以采用如下的矢量形式:〈MusicGenre,MusicBeatSpeed,Time,UserVote〉以下的用戶/項目交互數(shù)據(jù)集合是作為示例給出的<table><row><column>ID</column><column>Genre</column><column>MusicBeatSpeed</column><column>Time</column><column>UserVote</column></row><row><column></column><column>1</column><column>搖滾</column><column>128</column><column>曰間</column><column>喜歡</column></row><row><column></column><column>2</column><column>舞曲</column><column>130</column><column>曰間</column><column>喜歡</column></row><row><column></column><column>3</column><column>舞曲</column><column>125</column><column>夜間</column><column>不喜歡</column></row><row><column></column><column>4</column><column>舞曲</column><column>130</column><column>夜間</column><column>不喜歡</column></row><row><column></column><column>5</column><column>搖滾</column><column>130</column><column>夜間</column><column>不喜歡</column></row><row><column></column><column>6</column><column>古典</column><column>55</column><column>曰間</column><column>不喜歡</column></row><row><column></column><column>7</column><column>古典</column><column>60</column><column>曰間</column><column>不喜歡</column></row><row><column></column><column>8</column><column>舞曲</column><column>70</column><column>夜間</column><column>喜歡</column></row><row><column></column><column>9</column><column>爵士</column><column>65</column><column>夜間</column><column>喜歡</column></row><row><column></column><column>10</column><column>古典</column><column>75</column><column>夜間</column><column>喜歡</column></row><row><column></column><column>11</column><column>爵士</column><column>60</column><column>夜間</column><column>喜歡</column></row><row><column></column><column>12</column><column>搖滾</column><column>125</column><column>曰間</column><column>不喜歡</column></row><row><column></column><column>13</column><column>舞曲</column><column>135</column><column>夜間</column><column>喜歡</column></row><table>通過將決策樹機器學習方法應用于上述數(shù)據(jù)集合,可以產(chǎn)生包含下列規(guī)則的用戶偏好模型。IFTime="日間"ANDMusicBeatSpeed>=125THENUserVote="喜歡"IFTime="夜間"ANDMusicBeatSpeed<=75THENUserVote="喜歡"應該指出的是,用于產(chǎn)生預測分數(shù)的上述用戶偏好規(guī)則并不是用于產(chǎn)生派生元數(shù)據(jù)的推導規(guī)則。上文中依照用戶偏好規(guī)則表述的簡單預測模型論述的是,這個特定用戶在日間喜歡快節(jié)奏音樂(MusciBeatSpeed>=125),而在夜間則更喜歡鎮(zhèn)靜的音樂(MusicBeatSpeed<=75)。應該指出的是,這個模型對上述數(shù)據(jù)集合的大多數(shù)情形都是成立的(12/13),但并不是對所有情形全都成立。實施例詳述在下文中將會特別參考圖l框圖(服務應用)來提供關于本發(fā)明有利實施例的詳細描述;在該圖中使用了兩個符號,即代表軟件模塊的矩形形狀和代表儲存庫的圓柱形形狀。這個實施例參考的是為用戶提供基于內(nèi)容的服務的服務供應商。該服務可以是PULL類型的,也可以是PUSH類型的,還可以同時是這兩種類型的?;趦?nèi)容的服務將選定內(nèi)容項提供給用戶。內(nèi)容項可以由服務供應商直接或間接地遞送給用戶,其中舉例來說,該內(nèi)容項可以通過提供內(nèi)容項所在或是可以訪問內(nèi)容的地址(例如因特網(wǎng)地址)來遞送。內(nèi)容項通常是由內(nèi)容供應商通過分組數(shù)據(jù)網(wǎng)(例如因特網(wǎng))或移動電話網(wǎng)(例如UMTS網(wǎng)絡)之類的通信網(wǎng)絡直接提供的?;趦?nèi)容的服務提供了構(gòu)建和維護用戶簡檔,以便提供更好的內(nèi)容項選擇。這種基于內(nèi)容的服務可以分成兩種活動-處理內(nèi)容項,-處理用戶簡檔。處理內(nèi)容項處理內(nèi)容項的活動包括-接收來自用戶的請求,-根據(jù)用戶請求來選擇內(nèi)容項,-優(yōu)選地,根據(jù)用戶的呈現(xiàn)簡檔來格式化選定內(nèi)容項和將所述內(nèi)容項呈現(xiàn)給用戶(也就是依照服務應用邏輯個性化內(nèi)容呈現(xiàn)),以及-將選定內(nèi)容項提供給用戶。在PULL模式中,一旦接收到用戶請求,那么服務供應商將會根據(jù)該請求來識別一組內(nèi)容項,然后,該服務供應商將會對這組內(nèi)容項執(zhí)行上述步驟;這意味著某些選定內(nèi)容項通常是在用戶請求之后不久作為針對用戶的答復而提供的。在PUSH模式中,服務供應商接收來自用戶的請求,并且在不立即回復以及通常不立即處理的情況下將其存儲,然后存在兩種可能性。根據(jù)第一種可能性,服務供應商周期性識別所有新發(fā)布的內(nèi)容項,然后它會對所有新發(fā)布的內(nèi)容項執(zhí)行上述步驟。根據(jù)第二種可能性,服務供應商在發(fā)布內(nèi)容項的時候就立即識別該內(nèi)容項,然后則會對新發(fā)布的內(nèi)容項執(zhí)行上述步驟。在PUSH模式中,內(nèi)容項的提供可以分兩個步驟來執(zhí)行首先,服務供應商簡單地向用戶告知其感興趣的某些內(nèi)容項可用,然后,一旦用戶表達了其接收這些內(nèi)容項的愿望,那么服務供應商將會發(fā)送(直接或間接)這些內(nèi)容項;此外,用戶還可以表達其只接收這些內(nèi)容項中的一部分的意愿。用戶的每一個輸入都會由服務前端模塊(SFEM)、例如PC或移動終端接收和處理。用戶的請求將會發(fā)送到服務應用邏輯模塊(SALM),該模塊則會嵌入特定于所要提供的基于內(nèi)容的服務的邏輯。此外,模塊SFEM向模塊SALM發(fā)送與用戶請求相關聯(lián)的原始上下文元數(shù)據(jù)(例如日期和時間,用戶位置等等)。當模塊SALM接收到來自模塊SFEM的用戶請求時,它會產(chǎn)生相應的內(nèi)容查詢(圖2中的步驟201)。根據(jù)這個內(nèi)容查詢(從用戶請求中推導)及其服務邏輯,模塊SALM將會依照該內(nèi)容查詢而在內(nèi)容項儲存庫CIR中識別第一內(nèi)容項集合(圖2中的步驟202)。舉例來說,依照該內(nèi)容查詢,服務應用邏輯會在儲存庫CIR中識別與電影和電視連續(xù)劇相關的第一內(nèi)容項集合。儲存庫CIR存儲了內(nèi)容項以及預先指定給所存儲的內(nèi)容項的內(nèi)容元數(shù)據(jù)(通常是原創(chuàng)元數(shù)據(jù))。如以下部分中更詳細說明的那樣,儲存庫CIR還可以存儲與內(nèi)容項相關聯(lián)的派生內(nèi)容元數(shù)據(jù),其中該內(nèi)容元數(shù)據(jù)是從先前的元數(shù)據(jù)生成處理產(chǎn)生、也就是從先前的內(nèi)容查詢中觸發(fā)的。如果將用戶反饋施加到所述第一內(nèi)容項集合,那么,由于服務應用可以向用戶詢問的輸入數(shù)量、例如顯性偏好("我喜歡"或"我不喜歡,,)通常是受到限制的,因此將會出現(xiàn)可用性問題。此外,在很多情況下,關于這種輸入的精確的形式化是不能實行的。為了避免不良過濾,以及為用戶保持精確內(nèi)容的最終目標,模塊SALM將會要求匹配器模塊(MMM)根據(jù)用戶簡檔來產(chǎn)生所述第一集合的內(nèi)容項排序(圖2中的步驟203)。然后,模塊SALM從模塊MMM接收的排序可以由模塊SALM使用,以便濾除低分數(shù)內(nèi)容項,選擇最佳分數(shù)內(nèi)容項,以及重排序所保留的內(nèi)容項。這個處理可以根據(jù)已知的方法來完成。由此,模塊SALM將會借助MMM來過濾這個第一集合的內(nèi)容項(圖2中的步驟204),以便選擇所識別的第一內(nèi)容項集合內(nèi)部的第二內(nèi)容項集合。模塊MMM是過濾活動的關鍵部件,并且它負責考慮用戶的簡檔(或用戶簡檔),這一點將會在下文中進行說明。優(yōu)選地,通過MMM的過濾活動所獲取的第二內(nèi)容項集合是第一內(nèi)容項集合的一個子集,盡管如此,雖然第二內(nèi)容項集合是根據(jù)排序偏好來進行排序的,但是,在這里并不排除第二內(nèi)容項集合包含了第一集合的所有內(nèi)容項,由此用戶可以依照與項目相關的排序來查看這些項目。模塊SALM累積、變換并且格式化子集中的內(nèi)容項,以便將其呈現(xiàn)給用戶(圖2中的步驟205);與呈現(xiàn)選定的內(nèi)容項不同,在這里可以僅僅將其告知用戶。并且呈現(xiàn)和/或通知處理是由模塊SFEM執(zhí)行的。根據(jù)本發(fā)明的優(yōu)選實施例,圖1的架構(gòu)包括-用戶簡檔儲存庫(UPR),-元數(shù)據(jù)生成器模塊(MGM)。模塊MGM提供了一組推導規(guī)則,以便產(chǎn)生派生元數(shù)據(jù)(內(nèi)容和/或上下文)。這些推導規(guī)則是以推導算法為基礎的。在圖l的實施例中,這些算法處于模塊MGM外部,并且是由推導算法模塊(DAM)提供的,而該模塊則是通過"插件"技術(shù)實現(xiàn)的;這樣做允許具有本地和遠端存儲的算法,并且該算法將會由模塊MGM進行調(diào)用。模塊MMM:-從儲存庫UPR中檢索當前用戶的用戶簡檔;以及-從儲存庫CIR中為所述第一內(nèi)容項集合中的每一個內(nèi)容項檢索與之關聯(lián)的內(nèi)容元數(shù)據(jù),其中該內(nèi)容元數(shù)據(jù)是預先指定的(通常是原創(chuàng)的)以及可能是派生的(作為先前交互事件的結(jié)果)。此外,模塊MMM從其他模塊接收與當前上下文相關聯(lián)的上下文元數(shù)據(jù)。特別地,原始上下文元數(shù)據(jù)是通過模塊SALM而從模塊SFEM接收的,以及派生上下文元數(shù)據(jù)是從模塊MGM接收的。模塊MMM將原始上下文元數(shù)據(jù)發(fā)送到模塊MGM,由此請求產(chǎn)生派生元數(shù)據(jù)(至少從原始上下文元數(shù)據(jù)開始),此外它還接收所產(chǎn)生的派生上下文元數(shù)據(jù)。這樣一來,至少某些上下文元數(shù)據(jù)可以是同時(onthefly)推導得到的,也就是在與用戶交互的過程中推導得到的。然后,模塊MMM會將用戶簡檔應用于與所識別的第一內(nèi)容項集合內(nèi)部的每一個內(nèi)容項相關聯(lián)的內(nèi)容元數(shù)據(jù)(預先指定的和派生的),并且優(yōu)選將其應用于與當前上下文相關聯(lián)的上下文元數(shù)據(jù)(原始和派生的)。這樣一來,模塊MMM將會對照用戶簡檔來匹配第一內(nèi)容項集合。在本實施例中,用戶簡檔至少包含了一個預測模型(優(yōu)選是通過機器學習方法產(chǎn)生的)。該預測模型被應用于所述第一集合的每一個內(nèi)容項,并且為每一個內(nèi)容項產(chǎn)生一個預測投票。與第一內(nèi)容項集合相關聯(lián)的預測投票集合將會由模塊MMM使用,以便產(chǎn)生第一集合的內(nèi)容項排序。所述排序?qū)⒈惶峁┙o模塊SALM,該模塊則會定義一個第二內(nèi)容項集合,該第二內(nèi)容項集合是依照內(nèi)容項的有序集合或是依照作為所述排序的結(jié)果而被選擇的第一內(nèi)容項集合的子集(例如只包括第一集合中最佳排序的內(nèi)容項)來形成。優(yōu)選地,本發(fā)明的實施例還提供-用戶交互記錄器模塊IRM,以及-交互歷史儲存庫IHR。交互歷史可以釆取記錄序列的形式,每個記錄包含一些例如與用戶請求(或相應的查詢)、系統(tǒng)回復、上下文、元數(shù)據(jù)、用戶反饋有關的信息。優(yōu)選地,使用合成格式(例如鏈接或索引而不是物理項)。通常,交互歷史的每個記錄對應于不同的交互事件。模塊IRM的任務是更新交互歷史(圖2中的步驟206)。為此,模塊IRM直接將用戶請求(從模塊SFEM接收的)記錄到儲存庫IHR中。此外,模塊SALM還通過模塊IRM將其對用戶請求的答復(以內(nèi)容項形式)記錄到儲存庫IHR中。通過模塊IRM,模塊SALM還可以將預測投票和/或用于答復用戶的所有或部分(內(nèi)容和/或上下文)元數(shù)據(jù)記錄到儲存庫IHR中。非常有利的是,為了節(jié)省儲存庫IHR中的存儲空間,在儲存庫IHR中僅存儲一種類型的元數(shù)據(jù),即原始上下文元數(shù)據(jù)(這是因為在任何時間,其他元數(shù)據(jù)可以從儲存庫CIR中檢索得到,或者由模塊MGM產(chǎn)生);該處理可以由直接從模塊SFEM接收此類元數(shù)據(jù)的模塊IRM來執(zhí)行。服務應用可以要求用戶提供其反饋,其中該反饋與在對請求的答復中提供的內(nèi)容項相關;模塊SALM也可以將模塊SFEM用于這個目的。來自用戶的典型反饋是用投票表示的(它可以直接與預測投票相比較)。在這種情況下,模塊SALM可以通過模塊IRM而將這類顯性反饋存入儲存庫IHR中。非常有利的是,服務應用邏輯被設計成讓用戶自主選擇是否提供顯性反饋。作為替換,當服務應用邏輯沒有提供來自用戶的顯性反饋時,這時可以對用戶行為進行監(jiān)視,以便從中得到隱性反饋(舉例來說,該處理可以由模塊SFEM執(zhí)行);舉個例子,投票可以與用戶在閱讀新聞服務所提供的新聞項目中花費的時間相關聯(lián)。在這種情況下,模塊IRM可以將隱性反饋記錄到儲存庫IHR中。用戶反饋的處理和記錄(圖2的步驟207)既可以是顯性的,也可以是隱性的,該處理可以在每次答復之后執(zhí)行,或者在服務交互會話結(jié)束時執(zhí)行。應該指出的是,如果內(nèi)容項包含了多個內(nèi)容成分,那么反饋還可以涉及整個內(nèi)容項;非常有利的是,作為替換或補充,該反饋可以與內(nèi)容項中的每一個成分有關。舉個例子,用戶可以總體表達與電影相關的投票,或者為其視頻成分和音頻成分表達單獨的投票。在這種情況下,單獨的投票是作為交互歷史而被記錄的。處理用戶簡檔處理用戶簡檔的活動包括創(chuàng)建(構(gòu)建)和維護(例如更新)用戶簡檔。在圖1的架構(gòu)中,用戶簡檔被保存在儲存庫UPR中,并且用戶簡檔構(gòu)建器模塊PBM被提供用于執(zhí)行處理用戶簡檔的活動。非常有利的是,這個活動可以"脫機,,執(zhí)行,例如在用戶交互數(shù)量較少的夜間執(zhí)行。根據(jù)本實施例,模塊PBM執(zhí)行下列步驟-從儲存庫IHR中檢索用戶的交互歷史(圖3中的步驟301)(其中該交互歷史是完整的交互歷史,或是與從最后一次用戶簡檔更新到當前時間的時間范圍相對應的部分交互歷史)。該交互歷史至少包括事件,并且通常包括一組事件。時間通常包括內(nèi)容查詢(對應于用戶請求)、原始上下文元數(shù)據(jù),以及依照該查詢以及優(yōu)選依照用戶反饋提供的選定內(nèi)容項集合;-根據(jù)交互歷史中包含的信息來選擇適合構(gòu)建用戶偏好預測模型的恰當?shù)臋C器學習算法(圖3中的步驟302);畫PBM為交互歷史中的每一個交互事件Ei產(chǎn)生一個"n+1"維的特征矢量,該特征矢量通常是單個矢量Vi圖3中的步驟303,步驟304和步驟305),其中n是與內(nèi)容元數(shù)據(jù)(預先指定和派生的)相關的特征數(shù)量以及與上下文元數(shù)據(jù)(原始和派生的)相關的特征數(shù)量的總和。-將選定的機器學習算法應用于先前步驟中產(chǎn)生的特征矢量(關聯(lián)于事件Ei、Ej、Ek.......的Vi、Vj、Vk......),以便構(gòu)建引入到用戶簡檔中的新的預測模型(步驟306)。機器學習算法一次僅僅能夠處理一個單獨的特征矢量,或者它們也可以設法一次處理一組特征矢量(與前述實例中相同,其中該模型是通過處理與十三個交互事件相對應的十三個矢量來產(chǎn)生的);-(優(yōu)選地)對照預訂接受判據(jù)(通常是"優(yōu)于先前"類型的判據(jù))來驗證新構(gòu)建的預測模型的性能,以此作為用戶簡檔更新條件(步驟307)。舉個例子,一種有效的已知驗證技術(shù)是"十等分交互驗證(ten-foldcross-validation)",該技術(shù)基于事件的十種不同劃分(舉例來說,90%的事件用于構(gòu)建模型,10%的事件用于驗證模型)。根據(jù)特定實施方式,驗證可以集成在機器學習方法內(nèi),以及-通過在儲存庫UPR中用新模型替換先前模型來更新用戶簡檔(步驟308)。與交互事件Ei相關的特征矢量Vi的生成處理可以依照下列步驟來執(zhí)行-檢索原始內(nèi)容元數(shù)據(jù);-將原始上下文元數(shù)據(jù)(記錄在交互歷史中)發(fā)送到模塊MGM,請求從原始上下文元數(shù)據(jù)中產(chǎn)生派生上下文元數(shù)據(jù);將原始上下文元數(shù)據(jù)和派生上下文元數(shù)據(jù)(從模塊MGM中獲取)編碼到維度為p的上下文特征矢量Vh中(在圖3的流程圖中,以上的兩個步驟是用單個步驟303表示的);-從儲存庫CIR中檢索內(nèi)容元數(shù)據(jù)(原創(chuàng)和派生的);-將內(nèi)容元數(shù)據(jù)編碼到維度為m的內(nèi)容特征矢量Vic中,其中m+p=n(在圖3中,上述兩個步驟被表示為單個步驟304);-將內(nèi)容特征矢量Vie加入先前步驟中產(chǎn)生的上下文特征矢量Vix中,并且將作為目標特征的用戶投票t添加到n+l維的單個特征矢量中,<formula>seeoriginaldocumentpage37</formula>(圖3中的步驟305);-識別機器學習方法算法,以及-將所述機器學習方法算法應用于所述特征矢量Vi,以便獲取用戶偏好的預測模型。應該指出的是,即使先前不存在預測模型,上文列舉的步驟也是可以使用的,換言之,這些步驟不但可以用于更新用戶簡檔,而且還可以用于構(gòu)建新的用戶簡檔。在這種情況下,舉例來說,如果為任何內(nèi)容都假設一個正反饋,那么將會使用一個虛構(gòu)的用戶模型。如果用戶表達了關于多成分內(nèi)容項中的每一個成分的反饋,那么模塊PBM應該考慮這類更詳細的反饋。在以上描述中假設用戶只具有一個用戶簡檔。但是,本發(fā)明還可以擴展到用戶具有更多用戶簡檔并且可以在其間切換的情形。舉例來說,當上下文元數(shù)據(jù)不足以精確描述交互上下文時,例如當終端很難自動確定用戶在家還是在辦公室(除非用戶在交互設備中設置了環(huán)境選項)時,這種處理將會是非常有利的。用戶簡檔選擇可以在交互會話開始時進行,并且該選擇通常包括多個請求以及具有隱性或顯性反饋的相應答復。作為替換,用戶簡檔選擇也可以在反饋操作的每一個時刻同時進行。舉例來說,假設用戶在電影瀏覽應用中發(fā)現(xiàn)了他很喜歡的一部恐怖電影。該用戶給出了關于該項目的很高的第一投票,由此規(guī)定該第一投票參考的是"個人,,簡檔。由于恐怖電影對他的孩子并不是很好,因此,它還為這部電影給出了很低的第二投票,由此這一次規(guī)定了第二投票參考的是"家庭,簡檔。作為替換,用戶可以設置其簡檔之一作為當前簡檔;用戶給出的投票將參考所設定的簡檔。當用戶請求關于電影的排序或推薦時,他需要指定給出所述推薦所要依照的簡檔。在提供多個用戶簡檔的實施例中,圖1的模塊需要考慮這種多重性。模塊IRM還需要在儲存庫IHR中記錄關于用戶簡檔的信息。模塊PBM需要選擇所要更新的正確用戶簡檔。模塊MMM需要選擇和使用正確的用戶簡檔來產(chǎn)生內(nèi)容項排序。權(quán)利要求1.一種用于向用戶提供選定內(nèi)容項的方法,包括以下步驟A)根據(jù)用戶請求來識別第一內(nèi)容項集合,其中第一內(nèi)容元數(shù)據(jù)被預先指定給所述第一集合的內(nèi)容項,B)至少根據(jù)第一推導規(guī)則來為所述第一集合的內(nèi)容項自動產(chǎn)生第二內(nèi)容元數(shù)據(jù),所述推導規(guī)則與至少應用于所述第一集合的內(nèi)容項的算法相對應,C)將所述第二內(nèi)容元數(shù)據(jù)與所述第一集合的內(nèi)容項相關聯(lián),以及D)根據(jù)所述第一內(nèi)容元數(shù)據(jù)和所述第二內(nèi)容元數(shù)據(jù)來提供源自所述第一集合的第二選定內(nèi)容項集合。2.根據(jù)權(quán)利要求1所述的方法,其中所述算法還被應用于所述第一內(nèi)容元數(shù)據(jù)的至少一些。3.根據(jù)前述任一權(quán)利要求所述的方法,其中步驟B)還根據(jù)與所述選定內(nèi)容項的交互上下文相關的第一上下文元數(shù)據(jù)來執(zhí)行,以便自動產(chǎn)生第二上下文元數(shù)據(jù)。4.根據(jù)前述任一權(quán)利要求所述的方法,其中所述第二內(nèi)容元數(shù)據(jù)是從應用于多個內(nèi)容項的算法中推導的。5.根據(jù)前述任一權(quán)利要求所述的方法,其中步驟D)還根據(jù)所述用戶的用戶簡檔來執(zhí)行。6.根據(jù)權(quán)利要求5所述的方法,其中所述用戶簡檔包括預測模型。7.根據(jù)權(quán)利要求5或6所述的方法,其中在步驟D)中,針對所述第一集合的每一個內(nèi)容項的排序是根據(jù)所述第二內(nèi)容元數(shù)據(jù)以及所述預測模型提供的,由此根據(jù)所述排序定義所述第二內(nèi)容項集合。8.根據(jù)權(quán)利要求7所述的方法,其中針對所述第一集合的每一個內(nèi)容項的排序是根據(jù)所述第二內(nèi)容元數(shù)據(jù)、所述第二上下文元數(shù)據(jù)、以及所述用戶簡檔來提供的,并且所述方法還包括根據(jù)所述排序來選擇所述第二內(nèi)容項集合。9.根據(jù)前述任一權(quán)利要求所述的方法,其中所述第二內(nèi)容項集合是作為針對所述用戶的相應請求的答復提供的。10.根據(jù)權(quán)利要求6所述的方法,還包括以下步驟將來自所述用戶的反饋與所述第二集合的至少一個內(nèi)容項相關聯(lián)。11.根據(jù)權(quán)利要求10所述的方法,還包括以下步驟記錄所述第二集合的至少一個內(nèi)容項以及來自所述用戶的并與所述至少一個被記錄內(nèi)容項相關聯(lián)的反饋。12.根據(jù)權(quán)利要求11所述的方法,還包括以下步驟記錄用于選擇所述至少一個內(nèi)容項的所述第二元數(shù)據(jù)的至少一部分。13.根據(jù)權(quán)利要求11或12所述的方法,還包括以下步驟記錄所述用戶請求。14.根據(jù)權(quán)利要求11-13中任一權(quán)利要求所述的方法,還包括以下步驟至少根據(jù)所述被記錄內(nèi)容項以及用戶反饋來構(gòu)建或更新所述用戶的預測模型。15.根據(jù)權(quán)利要求14所述的方法,還包括以下步驟記錄所述第二元數(shù)據(jù)的至少一部分,以及至少根據(jù)所記錄的第二元數(shù)據(jù)來構(gòu)建或更新所述用戶的預測模型。16.根據(jù)權(quán)利要求15所述的方法,其中所述預測模型是通過應用于至少所述第二內(nèi)容元數(shù)據(jù)的至少一種機器學習算法來構(gòu)建或更新的。17.根據(jù)權(quán)利要求16所述的方法,其中所述機器學習算法還應用于至少一些上下文元數(shù)據(jù)。18.根據(jù)權(quán)利要求6所述的方法,其中用戶簡檔包括至少兩個預測模型。19.根據(jù)前述任一權(quán)利要求所述的方法,其中所述第二內(nèi)容項集合是由服務供應商提供的。20.根據(jù)前述任一權(quán)利要求所述的方法,其中所述選定內(nèi)容項是通過電信網(wǎng)絡提供的。21.—種計算機程序產(chǎn)品,該產(chǎn)品可以加載到至少一個計算機的存儲器中,并且包括用于執(zhí)行權(quán)利要求1~20中任一權(quán)利要求所述的方法的軟件代碼部分。22.—種基于內(nèi)容的服務,該服務包括以下步驟收集來自用戶的內(nèi)容請求,以及根據(jù)權(quán)利要求1~20中任一權(quán)利要求所述的方法來向用戶提供選定的內(nèi)容項。全文摘要本發(fā)明公開了一種用于向用戶提供選定內(nèi)容項的方法。內(nèi)容項的選擇是以預先指定給內(nèi)容項的元數(shù)據(jù)以及以后產(chǎn)生和關聯(lián)的元數(shù)據(jù)為基礎的,其中預先指定給內(nèi)容項的元數(shù)據(jù)通常是原創(chuàng)內(nèi)容元數(shù)據(jù),而以后產(chǎn)生和關聯(lián)的元數(shù)據(jù)則被稱為派生內(nèi)容元數(shù)據(jù);此外,內(nèi)容項的選擇還可以基于上下文元數(shù)據(jù),尤其是派生上下文元數(shù)據(jù)。派生元數(shù)據(jù)是根據(jù)與所要應用的算法相對應的推導規(guī)則而自動產(chǎn)生的,其中舉例來說,該算法被應用于內(nèi)容項的內(nèi)容、原創(chuàng)內(nèi)容元數(shù)據(jù)以及上下文元數(shù)據(jù)。用戶簡檔可以用于改善選擇質(zhì)量;此外,本發(fā)明還公開了一種根據(jù)機器學習技術(shù)來構(gòu)建和維護用戶簡檔的方法。文檔編號H04L29/08GK101346718SQ200580052407公開日2009年1月14日申請日期2005年10月28日優(yōu)先權(quán)日2005年10月28日發(fā)明者G·洛貝洛,L·伯里阿諾申請人:意大利電信股份公司