專利名稱:對用戶的內(nèi)容訪問進行優(yōu)化的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及內(nèi)容分發(fā)服務(wù),例如視頻點播(VOD)服務(wù)。在本文中,“內(nèi)容分發(fā)服務(wù)”的一種含義是允許客戶端通過通信網(wǎng)絡(luò)下載由服務(wù)提 供商提供的內(nèi)容的服務(wù)。
背景技術(shù):
如本領(lǐng)域技術(shù)人員所知的,向連接至因特網(wǎng)的用戶提供諸如VOD服務(wù)等內(nèi)容分發(fā) 服務(wù)的傳統(tǒng)構(gòu)架是客戶端-服務(wù)器構(gòu)架,其中用戶(客戶端)從由服務(wù)提供商管理并連接 至通信網(wǎng)絡(luò)的服務(wù)器下載所需內(nèi)容。最近,已經(jīng)研發(fā)了基于對等(P2P)方法的解決方案。在第一代對等解決方案中,用 戶只被授權(quán)臨時性地存儲內(nèi)容,這些內(nèi)容是他們下載以供他們自己使用的。因此,用戶只能 從當(dāng)前消費相同內(nèi)容的其他用戶或從內(nèi)容服務(wù)器下載感興趣的內(nèi)容。在最近幾年,已經(jīng)提出了功能更強大的對等架構(gòu)。在該架構(gòu)中,用戶可以積極主動 地下載他們當(dāng)前不感興趣、但是可能在未來服務(wù)于其他感興趣的用戶的內(nèi)容。該架構(gòu)旨在 減少為達到目標服務(wù)質(zhì)量所需的基礎(chǔ)設(shè)施(服務(wù)器)資源的量,并因此降低基礎(chǔ)設(shè)施部署 的總成本。例如,可以在下面兩種特定情況下使用該最近的架構(gòu)。在“開放因特網(wǎng)”情況下(或開放的不受控環(huán)境中),用戶經(jīng)由它們的與因特網(wǎng)連 接的個人計算機(或者更一般的,通信設(shè)備),彼此交互并且與基礎(chǔ)設(shè)施服務(wù)器交互。因此, 可以容易地在用戶個人電腦(或設(shè)備)的硬盤上進行由用戶自己管理的內(nèi)容的主動存儲。在“邊際設(shè)備網(wǎng)絡(luò)”情況下,彼此交互的組件是位于用戶房屋建筑中的家庭網(wǎng)關(guān) (通過DSL或纜線連接)或機頂盒(STB)。在這種情況下,所有邊際設(shè)備可以由用戶所簽訂 的因特網(wǎng)服務(wù)提供商(ISP)來控制。因此,可以在這些邊際設(shè)備的硬盤上進行內(nèi)容的主動 存儲。為獲得提及的最近P2P架構(gòu)的全部益處,關(guān)鍵是對于那些內(nèi)容要主動存儲以及在 哪里存儲,作出充分的決定。K. Suh等人的文章〃 Push-to-Peer Video-on-Demand system design and evaluation “ , IEEE Journal in Selected Areas in Communications, DeCember2007中已經(jīng)明顯地考慮了該問題。在該文章中,提出了兩種策略,即“全條帶化” 和“基于編碼的”放置策略。這些策略達到了優(yōu)異的性能,但是這僅僅在對于每個內(nèi)容存儲 相同量的數(shù)據(jù)的情況下以及在對于用戶偏好無信息可用的情況下?,F(xiàn)有技術(shù)文獻WO 2007/080345 (Thomson Licensing)公開了一種多媒體內(nèi)容傳遞 方法和系統(tǒng)。該現(xiàn)有PCT專利申請中公開的方法包括 第一步驟,包括從內(nèi)容服務(wù)器向第一客戶端設(shè)備,以“推”模式部分地下載多媒體 內(nèi)容,以及 第二步驟,包括從第二客戶端設(shè)備,經(jīng)由“對等”機制,以“拉”模式下載所述多媒 體內(nèi)容的遺失元素。
發(fā)明內(nèi)容
本發(fā)明的目的是改進上述情況。為此目的,本發(fā)明提供了一種針對網(wǎng)絡(luò)設(shè)備的控制設(shè)備,該網(wǎng)絡(luò)設(shè)備與通信網(wǎng)絡(luò) 連接,能夠存儲內(nèi)容的用戶通信設(shè)備耦合至該通信網(wǎng)絡(luò),所述控制設(shè)備包括-第一分析裝置,用于至少根據(jù)用戶信息,確定集合中內(nèi)容的各自流行度,并用于 至少根據(jù)所確定的內(nèi)容流行度,確定該集合的每個內(nèi)容的復(fù)制版本的數(shù)目,-以及/或者第二分析裝置,用于根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好,以及-計算裝置,用于根據(jù)所確定的內(nèi)容復(fù)制版本數(shù)目和/或所確定的用戶的內(nèi)容偏 好,確定用于存儲每個內(nèi)容的復(fù)制版本的位置,以優(yōu)化用戶對這些內(nèi)容的訪問。根據(jù)本發(fā)明的控制設(shè)備可以包括分離地或組合地考慮的附加特征,值得注意的 是-第一分析裝置可以用于根據(jù)在信息組中選擇的用戶信息來確定集合中內(nèi)容的各 自流行度,其中該信息組包括如下至少一個過去用戶對內(nèi)容的使用,預(yù)測的用戶對內(nèi)容的 使用,以及關(guān)于先前訪問的內(nèi)容的用戶評價;第一分析裝置可以配置為接收用戶報告,該用戶報告包括與過去用戶對內(nèi)容的使 用和/或用戶對先前訪問的內(nèi)容的評價有關(guān)的用戶信息;-第一分析裝置也可以用于根據(jù)關(guān)于網(wǎng)絡(luò)拓撲的附加信息,確定集合中內(nèi)容的各 自流行度,網(wǎng)絡(luò)拓撲信息可以至少包括關(guān)于用戶通信設(shè)備的通信容量和存儲容量的信息;-第一分析裝置可以用于根據(jù)所確定的內(nèi)容流行度,針對集合中的每個內(nèi)容,確定 預(yù)期來自用戶的并發(fā)內(nèi)容請求的數(shù)目,并用于根據(jù)所確定的并發(fā)內(nèi)容請求的數(shù)目以及用戶 通信設(shè)備的通信容量和存儲容量,確定將內(nèi)容劃分到選定數(shù)目的組中;第一分析裝置可以用于確定將內(nèi)容劃分到三個組中,第一組包括內(nèi)容的復(fù)制版本 必須存儲到至少一個選定用戶組中每個用戶的通信設(shè)備中的內(nèi)容,第二組包括內(nèi)容的復(fù)制 版本必須存儲到至少一個選定用戶組中一個用戶的通信設(shè)備中的內(nèi)容,并且第三組包括內(nèi) 容的復(fù)制版本必須存儲到至少一個選定網(wǎng)絡(luò)設(shè)備中的內(nèi)容。_在變體中,第一分析裝置可以用于根據(jù)用戶通信設(shè)備的通信容量和存儲容量、以 及針對集合的每個內(nèi)容的預(yù)期來自用戶的并發(fā)內(nèi)容請求的數(shù)目的均值和方差,確定將內(nèi)容 劃分到可變數(shù)目的組中;-第二分析裝置可以用于根據(jù)用戶內(nèi)容評級,確定將用戶劃分成聚類,針對每個聚 類確定用戶偏好模型,根據(jù)所確定的用戶偏好模型,確定每個聚類的每個用可能感興趣的 內(nèi)容;第二分析裝置可以用于通過向用戶內(nèi)容評級應(yīng)用最大似然方法,來確定每個聚類 的用戶偏好模型;第二分析裝置可以用于將每個聚類的每個用戶偏好模型確定到統(tǒng)計模型類中 (例如,所謂的“樹結(jié)構(gòu)馬爾可夫隨機場”);-計算裝置可以用于針對至少一些用戶,產(chǎn)生對要存儲的內(nèi)容進行信號通知的推 薦,并用于向網(wǎng)絡(luò)設(shè)備要求將這些推薦發(fā)送給相應(yīng)用戶的通信設(shè)備;
-計算裝置可以用于向網(wǎng)絡(luò)設(shè)備要求發(fā)送每個內(nèi)容在所確定的相應(yīng)位置處的復(fù)制 版本。本發(fā)明還提供了一種針對通信網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備,能夠存儲內(nèi)容的用戶的通信設(shè)備 耦合至該通信網(wǎng)絡(luò),所述網(wǎng)絡(luò)設(shè)備包括如上所述的控制設(shè)備。本發(fā)明還提供了一種用于優(yōu)化用戶對內(nèi)容的訪問的方法,其中用戶包括耦合至通 信網(wǎng)絡(luò)的通信設(shè)備,所述方法包括步驟-至少根據(jù)用戶信息,確定集合中內(nèi)容的各自流行度,并至少根據(jù)所確定的內(nèi)容流 行度,確定該集合的每個內(nèi)容的復(fù)制版本的數(shù)目,以及/或者-根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好,以及_根據(jù)所確定的內(nèi)容復(fù)制版本數(shù)目和/或所確定的用戶的內(nèi)容偏好,確定用于存 儲每個內(nèi)容的復(fù)制版本的位置。
當(dāng)閱讀詳細的說明書、附錄和附圖時,本發(fā)明的其他特征和優(yōu)點顯而易見,其中該 唯一圖示意地示出了包括根據(jù)本發(fā)明的控制設(shè)備的實施例示例的控制設(shè)備,其與通信網(wǎng)絡(luò) 連接,內(nèi)容服務(wù)器和用戶通信設(shè)備也耦合至該通信網(wǎng)絡(luò)。
具體實施例方式附圖不僅用于完整描述本發(fā)明,還在需要時對本發(fā)明的限定作出貢獻。本發(fā)明旨在提供一種用于優(yōu)化用戶對內(nèi)容的訪問的控制設(shè)備及關(guān)聯(lián)的方法,用戶 配備有耦合至通信網(wǎng)絡(luò)CN的通信設(shè)備CE。在以下描述中,考慮內(nèi)容是可以通過至少一個DSL(或光纖或纜線)通信網(wǎng)絡(luò)CN 傳輸至與因特網(wǎng)連接的用戶通信設(shè)備CE的視頻(或電影)。但是本發(fā)明不限于該應(yīng)用。確 實,本發(fā)明涉及任何類型的數(shù)字內(nèi)容,特別是音頻(或音樂)文件和數(shù)據(jù)文件。此外,用戶通信設(shè)備CE可以是任何類型的,只要一方面它們包括或耦合至用于存 儲內(nèi)容的存儲器裝置MM,并且另一方面它們能夠以對等(P2P)模式彼此之間建立通信。因 此,用戶通信設(shè)備CE可以是固定的個人計算機、膝上計算機、內(nèi)容接收機(例如,位于用戶 房屋建筑中的家庭網(wǎng)關(guān)或機頂盒(STB))、移動或蜂窩電話、或個人數(shù)字助理(PDA),只要其 包括通信調(diào)制解調(diào)器(或任何等同的通信裝置)。因此,用戶通信設(shè)備CE連接至的通信網(wǎng)絡(luò) CN可以是任何類型的(固定或無線),只要其能夠提供內(nèi)容分發(fā)服務(wù),例如視頻點播(VOD) 服務(wù)。在以下描述中,考慮用戶通信設(shè)備CE是作為內(nèi)容提供商的客戶端的用戶家庭網(wǎng) 關(guān),內(nèi)容提供商包括耦合至通信網(wǎng)絡(luò)CN的至少一個內(nèi)容服務(wù)商CTS。如唯一圖中示意性示出的,根據(jù)本發(fā)明的控制設(shè)備D至少包括計算模塊CM、以及 第一分析模塊Al、以及/或者第二分析模塊A2。換言之,控制設(shè)備D包括計算模塊CM、第一 分析模塊Al以及第二分析模塊A2,或者包括計算模塊CM以及第一分析模塊,或者包括計算 模塊CM以及第二分析模塊A2。如非限制性示例中示出的,控制設(shè)備D可以局部化(localized)到連接至(耦合 至)通信網(wǎng)絡(luò)CN的網(wǎng)絡(luò)設(shè)備CS中,例如控制服務(wù)器中。但是,該控制設(shè)備D也可以耦合至網(wǎng)絡(luò)設(shè)備CS。此外,控制設(shè)備D優(yōu)選地至少部分地由軟件模塊構(gòu)成。但是控制設(shè)備D也可以由 電子電路或硬件模塊、或者硬件和軟件模塊的組合(在這種情況下,控制設(shè)備D也包括允許 硬件和軟件模塊之間進行相互作用的軟件接口)構(gòu)成。在控制設(shè)備D排他地由軟件模塊構(gòu) 成的情況下,控制設(shè)備D可以存儲網(wǎng)絡(luò)設(shè)備的存儲器中或者在例如CD-ROM等任何計算機軟 件產(chǎn)品中,該計算機軟件產(chǎn)品可以由網(wǎng)絡(luò)設(shè)備讀取。在以下描述中,考慮控制設(shè)備D專用于對只“屬于”一個內(nèi)容提供商的單個內(nèi)容集 合的訪問進行優(yōu)化。但是控制設(shè)備D可以專用于對屬于若干內(nèi)容提供商的若干內(nèi)容集合的 訪問進行優(yōu)化。(控制設(shè)備D的)第一分析模塊Al特別地用于至少根據(jù)用戶信息,確定集合中內(nèi) 容的各自流行度。這里,“用戶信息”的一種含義是指定義了內(nèi)容與用戶之間的關(guān)系的信息。因此,用 戶信息可以是過去用戶對內(nèi)容的使用、關(guān)于先前訪問的內(nèi)容的用戶評價、或者預(yù)測的用戶 對內(nèi)容的使用。重要的是,要注意用戶自己可以通過報告將用戶信息的至少一些提供給控制設(shè)備 D(或其控制服務(wù)器CS)。例如,用戶報告可以包括與過去的內(nèi)容使用和/或先前訪問的內(nèi)容 的評價有關(guān)的用戶信息。這種用戶報告可以由用戶(通信)設(shè)備CE自發(fā)地(例如周期性 地)或者應(yīng)控制設(shè)備D的請求,傳輸給控制設(shè)備D (或其控制服務(wù)器CS)。但是,用戶信息的 至少一些也可以由服務(wù)提供商提供,可能是在對該服務(wù)提供商在其自己的網(wǎng)絡(luò)設(shè)備附近和 /或在任何其他網(wǎng)絡(luò)訪問提供商附近已收集的關(guān)于其客戶端的內(nèi)容消費的數(shù)據(jù)進行分析之 后提供。該最終的用戶信息可以是預(yù)測的用戶對內(nèi)容的使用,這可以是由內(nèi)容提供商在將 內(nèi)容交與用戶處理之前基于附加信息而確定的。此外,重要的是,要注意第一分析模塊Al可以不僅根據(jù)用戶信息、還根據(jù)附加信 息,來確定內(nèi)容流行度,該附加信息例如是關(guān)于網(wǎng)絡(luò)拓撲的,例如是用戶設(shè)備CE的通信容
量和存儲容量。當(dāng)?shù)谝环治瞿KAl已經(jīng)確定了集合的內(nèi)容流行度時,第一分析模塊Al至少根據(jù) 其自己確定的內(nèi)容流行度,針對集合中每個內(nèi)容確定復(fù)制版本的數(shù)目。為此目的,例如,第一分析模塊Al可以首先通過考慮其自己確定的內(nèi)容流行度, 針對集合中每個內(nèi)容,確定預(yù)期來自用戶的并發(fā)內(nèi)容請求的數(shù)目。然后,第一分析模塊Al 可以根據(jù)所確定的并發(fā)內(nèi)容請求的數(shù)目以及根據(jù)用戶設(shè)備CE的通信容量和存儲容量,確 定將這些內(nèi)容劃分到選定數(shù)目的組中。在該第一種方法中,可以執(zhí)行將內(nèi)容劃分到三個組中。第一組可以專用于“熱”內(nèi) 容。第一組包括如下內(nèi)容這些內(nèi)容的復(fù)制版本必須被存儲到至少一個選定用戶組中每個 用戶的設(shè)備CE中。第二組可以專用于“溫”內(nèi)容。第二組包括如下內(nèi)容這些內(nèi)容的復(fù)制 版本必須被存儲到至少一個選定用戶組中一個用戶的設(shè)備CE中。第三組可以專用于“冷” 內(nèi)容。第三組包括如下內(nèi)容這些內(nèi)容的復(fù)制版本不需要被存儲到用戶區(qū)域中,因此存儲到 例如內(nèi)容服務(wù)器CTS等至少一個選定網(wǎng)絡(luò)設(shè)備中,并且至少對于第一次訪問,這些內(nèi)容只 能在該至少一個選定網(wǎng)絡(luò)設(shè)備附近獲得。當(dāng)對于每個內(nèi)容預(yù)測的并發(fā)請求的數(shù)目精確時,上述第一種方法是優(yōu)化的。當(dāng)并不是這種情況時,第一分析模塊Al必須執(zhí)行第二種方法。例如,第一分析模塊Al可以根據(jù) 用戶設(shè)備CE的通信容量和存儲容量、以及根據(jù)針對每個內(nèi)容的預(yù)期來自用戶的并發(fā)內(nèi)容 請求的數(shù)目的均值和方差,確定將內(nèi)容劃分到可變數(shù)目的組中。附錄1中描述了上述兩種方法實施方式的更加詳細的示例。(控制設(shè)備D的)第二分析模塊A2用于根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好。這 些內(nèi)容評級代表對于每個先前訪問的內(nèi)容的用戶評價,可以由用戶設(shè)備CE(自發(fā)性地(例 如周期性地)或應(yīng)控制設(shè)備D的請求)或者由服務(wù)提供商將這些內(nèi)容評級傳輸給控制設(shè)備 D (或其控制服務(wù)器CS)。為確定用戶內(nèi)容偏好,第二分析模塊A2例如可以首先根據(jù)用戶內(nèi)容評級,確定將 用戶劃分到聚類中。為此目的,例如,第二分析模塊A2可以基于所收集的用戶內(nèi)容評級,創(chuàng)建“沖突 圖”,其中,通過“沖突邊”將給予相同內(nèi)容明顯不同的評級的兩個用戶鏈接起來。然后,對 該圖進行處理,以將用戶劃分到不相交的聚類中,這些聚類用于捕獲不同的用戶簡檔。可以通過基于對沖突圖的譜特征(特征值和關(guān)聯(lián)的特征矢量)的提取,更精確地 是基于對與該沖突圖關(guān)聯(lián)的所謂拉普拉斯矩陣的提取,使用新穎的“譜聚類”算法來進行上 述聚類。當(dāng)已確定了聚類之后,例如,第二分析模塊A2可以針對每個聚類確定用戶偏好的 模型。例如,上述對每個聚類的用戶偏好模型的確定可以基于將最大似然方法應(yīng)用于用 戶內(nèi)容評級。在某種意義上,這是特定的統(tǒng)計模型類的最似然模型。例如,可以將每個用戶 偏好模型選擇到所謂的“樹結(jié)構(gòu)馬爾可夫隨機場類”中。一旦確定了給定聚類的模型,例如,第二分析模塊A2可以使用該模型來確定其每 個用戶最可能感興趣的內(nèi)容。附錄2中給出了上述用于確定用戶內(nèi)容偏好的方法的更多細節(jié)。(控制設(shè)備D的)計算模塊CM用于根據(jù)(由第一分析模塊Al確定的)內(nèi)容復(fù)制 版本數(shù)目和/或(由第二分析模塊A2確定的)用戶內(nèi)容偏好,確定用于存儲每個內(nèi)容的復(fù) 制版本的位置。該確定旨在將把給定內(nèi)容存儲在期望評價該內(nèi)容的用戶的設(shè)備CE中的次 數(shù)最大化,并因此旨在優(yōu)化用戶對內(nèi)容的訪問。重要的是,要注意當(dāng)計算模塊CM已經(jīng)確定了每個內(nèi)容復(fù)制版本的每個存儲位置 時,計算模塊CM優(yōu)選地配置為針對至少一些用戶,產(chǎn)生對要存儲的內(nèi)容進行信號通知的推 薦。在這種情況下,計算模塊CM也配置為通過通信網(wǎng)絡(luò)CN向網(wǎng)絡(luò)設(shè)備CS要求將這些推薦 傳輸給相應(yīng)用戶的設(shè)備CE。然后,用戶設(shè)備CE可以通過從(推薦中指定的)至少另一用戶設(shè)備CE或者從(推 薦中指定的)至少一個內(nèi)容服務(wù)器CTS,下載內(nèi)容,來遵循其專用的內(nèi)容推薦。可能地,該下 載要經(jīng)過用戶的授權(quán)。但是,計算模塊CM也可以配置為向網(wǎng)絡(luò)設(shè)備CS要求在每個內(nèi)容的復(fù)制版本的相 應(yīng)位置處傳輸復(fù)制版本。換言之,可以自動進行內(nèi)容復(fù)制版本傳輸,而不需要通知用戶設(shè)備 CE。但是,令人感興趣的是將(至少一些內(nèi)容的)這種自動傳輸與對于用戶的顯式推薦結(jié)合起來,其中該顯式推薦用于對已“主動”(自動)存儲在設(shè)備CE的存儲器中的內(nèi)容進 行信號通知。本發(fā)明還可以從用于優(yōu)化用戶對內(nèi)容的訪問的方法方面來考慮,其中用戶包括耦 合至通信網(wǎng)絡(luò)CN的通信設(shè)備CE。該方法可以通過諸如上述參照唯一附圖描述的設(shè)備等設(shè)備D來實施。因此,下面 僅給出該方法的主要特征。根據(jù)本發(fā)明的方法包括以下主要步驟-至少根據(jù)用戶信息,確定集合中內(nèi)容的各自流行度,并至少根據(jù)所確定的內(nèi)容流 行度,確定該集合的每個內(nèi)容的復(fù)制版本的數(shù)目,-以及/或者根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好,-以及根據(jù)所確定的內(nèi)容復(fù)制版本數(shù)目和/或所確定的用戶的內(nèi)容偏好,確定用 于存儲每個內(nèi)容的復(fù)制版本的位置。本發(fā)明不限于上述方法和控制設(shè)備的實施例,其僅作為示例,本發(fā)明涵蓋本領(lǐng)域 技術(shù)人員認為在所附權(quán)利要求范圍內(nèi)的任何備選實施例。附錄1I-假設(shè)和灃釋考慮包括一種旨在允許用戶訪問F個不同內(nèi)容(例如電影)(f = 1到F)的系統(tǒng), 該系統(tǒng)包括P個對等節(jié)點(或用戶設(shè)備CE)、以及I個基礎(chǔ)設(shè)施節(jié)點或內(nèi)容分發(fā)節(jié)點(CDN) (或內(nèi)容服務(wù)器CTS)。假設(shè)電影f持續(xù)Tf秒,并以某一固定比率Bf被編碼。假設(shè)持續(xù)時間 和編碼率與電影無關(guān)。因此,分別由T和B指示持續(xù)時間和編碼率。每個對等節(jié)點(CS)向系統(tǒng)提供大小為M的存儲空間以及上行帶寬容量BP。每個 基礎(chǔ)設(shè)施節(jié)點(CTS)提供上行帶寬容量B”此外,假設(shè)每個基礎(chǔ)設(shè)施節(jié)點(CTS)具有足夠 的存儲容量來保持所有F個電影的拷貝。專用于電影f的存儲量由Mf指示。假設(shè)^與對等端(用戶)無關(guān)。這是由如下場 景激發(fā)的對于哪個對等節(jié)點(CS)查看F個內(nèi)容(電影)之一的可能性更大,沒有任何可 用的知識。在這種情況下,考慮如下閃速群擁(flash-crowd)場景對于所有f = 1,...., F,發(fā)起對電影f的Nf個并行查看(或請求)。II-結(jié)果II. 1-在第一種方法中,S卩,當(dāng)Nf個并行內(nèi)容請求是預(yù)先已知的并且按照降序排列 (Nf^Nf+l)時,存儲器的優(yōu)化使用包括將電影劃分到三個組中流行度最高電影(f ^f1), 流行度中等電影(f e {fi+l,...,^}),以及流行度最低電影(f >f2)。將流行度最高電影 完整地高速緩存,即,對于所有f ^ f” Mf = BT0最小化地高速緩沖流行度中等電影,即, Mf = (BT)/P, f e {f1+l,...,f2}。最后,根本不高速緩存流行度最低電影,即,Mf = 0, f > f2。確定數(shù)目4和&,使得每個對等端的存儲器使用精確為M,并且使得可以從其他對等節(jié) 點(CS),使用其專用上行帶寬BP,來提供流行度中等電影。對于并發(fā)查看的總數(shù)Σ fNf= ε P(其對應(yīng)于并發(fā)地使用系統(tǒng)的一小部分ε對等 節(jié)點(CS)),當(dāng)所有Nf個內(nèi)容流行度相等時,對CDN節(jié)點帶寬方面的要求是最大的。在這種 情況下,可以顯示出CDN節(jié)點帶寬的總要求(近似)為 因此,在這種保守場景中,可以顯示出系統(tǒng)自足(即不依賴于⑶N節(jié)點支持)的充 分條件在于 在更加現(xiàn)實的流行度模型下,假設(shè)對于某些正參數(shù)fQ和α,存在ParetO-Zipf分 布 ~ (f+fQr,可以顯示出系統(tǒng)自足的條件是
(nV"a當(dāng)α 較大時 在上述不等式中,值fl確定如下 這定性地捕獲了由于傾斜的流行度分布而得到的儲存。II. 2-在第二種方法中,S卩,當(dāng)Nf個內(nèi)容請求不是預(yù)先已知的,而是每個內(nèi)容請求
是利用已知的期望值和方差,由隨機變量定義的時,可以顯示出優(yōu)化的內(nèi)容劃分不再由固
定地劃分到不同流行度的三個組中來確定。而是,優(yōu)化的存儲器設(shè)置Mf現(xiàn)在是請求的隨機
參數(shù)的函數(shù),可以定義如下 其中,a和b是不依賴于電影f的兩個正參數(shù)。這與第一種方法(Nf個內(nèi)容請求是 完全已知的)顯著不同,在第一種方法中,需要對任何電影進行完整的或最小化的高速緩 存。這里,高速緩存的最優(yōu)量可以隨電影的流行度的平均流行度以及由Q2f反映的流行度 的無常性而持續(xù)改變。附錄2假設(shè)η個用戶的集合U e U以及m個項目(內(nèi)容)的集合i e I。每個用戶u向 一些項目i給出范圍在1到k之間的分數(shù)(或評級)?;谠撛u級信息,希望推測未來的用 戶偏好。更具體地,希望回答如下例如如下問題“在所有用戶的先前評級已知的情況下,用 戶u將向項目i分配哪個評級(或分數(shù))? ”。由Mu(i)指示該評級(或分數(shù))的真實值。I-用于定義可變數(shù)目的不相交聚類的fe術(shù)以下描述了用于將用戶U分離到不相交聚類中的技術(shù)。過去已經(jīng)研發(fā)了依賴 于適合矩陣的譜特性的若干方法。本發(fā)明技術(shù)的最接近技術(shù)是的R. B. Boppana技術(shù),在 "Eigenvalues and Graph Bisection :AnAverage_case Analysis,,,Proc. FOCS 1987,pages 280-285中有所描述。假設(shè)給定了沖突矩陣Α。假設(shè)矩陣A是對稱的,假設(shè)每一個條目非負的,并且 被解譯為在當(dāng)前“協(xié)同濾波”情況下兩個用戶i和j之間對內(nèi)容評級的不一致的度量。對角 線條目Aii全部等于0。例如,如果對于某一閾值T,兩個用戶對至少T個不同項目(電影) 給出不同評級,則可以將Aij設(shè)定為1。備選地,Aij可以是在用戶i和j都進行了評級的電影集合上對用戶i和j給出的不同評級部分進行計數(shù),在這種情況下,可以Aij采用0和1 之間的任何值。目的是要將索引集合劃分成聚類,以使大多數(shù)沖突在來自不同聚類的索引之間。 在這種情況下,考慮沖突矩陣A的拉普拉斯算子L,定義如下
Σλ“=』,Lu =<ο
-Aj “右 j.眾所周知,拉普拉斯矩陣L是非負定的,因為對于任何矢量χ/^-Σ^^' -^)2
Kj
都成立。令P1S P2...彡P(guān)ih指示拉普拉斯矩陣L的K-I個最大特征值,令Z(I),..., z(K-l)指示規(guī)格化正交的關(guān)聯(lián)的特征矢量。為了將索引集合分成K個不同的聚類,提出了 以下稱為“譜聚類”的算法1 向每一個索引 η = 1,···,Ν關(guān)聯(lián)對應(yīng)的(K-I)維矢量 ζη:= (ζη(1)Znft^), 該(K-I)維矢量Zn包括特征矢量Z (1),...,Z (K-I)的相應(yīng)坐標。2 對于某個適合的Μ,從{1,...,Ν}中隨機、均勻地挑選M個索引η(1),...,η(Μ)。3 重復(fù)4:在所有M個索引中,標識出達到最小歐式距離I |ζηω-ζη(」)| I的兩個索引n(i), n(j),5:去除n(j)并將M置為M-l,6:直到M = K為止。7:現(xiàn)在,剩余的K個索引,即n(l),...,n(K),用作聚類代表。向達到{| zn(i)-zn| i = 1. . .,K}中最小值的代表分配任何其他索引η。現(xiàn)在顯示出,在特定統(tǒng)計假設(shè)下,該算法成功地恢復(fù)了某種隱藏的聚類結(jié)構(gòu)。 即,考慮“種植劃分”模型,該模型是上述Boppana的文獻以及A. Condon等人的文獻 "Algorithms for Graph Partitioningon the Planted Partition Model,,,Proc. 3rd Int. Workshop on Approx. Algorithms for Comb. Opt. Prob. iRANDOM-APPROX^ 中考慮的模型 的廣義化。該種植劃分模型如下。將索引劃分到K個不同的聚類(^...,Ck中。假設(shè)沖突值 Au是隨機的,具有W,l]中的值,并且在所有索引對(i,j),i < j上都是獨立的。此外,假 設(shè)對于所有i < j,這些變量驗證了如下
對于某聚類Ct,fJeCt, W~\q, /和/屬于不同聚類 ’ρ指定聚類內(nèi)平均沖突,q指定聚類間平均沖突,典型的是q > P。在這種情況下,存在如下定理考慮根據(jù)上述種植劃分模型分布的沖突 矩陣A。假設(shè)聚類數(shù)目K是固定的,索引的初始數(shù)目N較大,并且對于某些固定的 正參數(shù)α k,聚類大小Ck驗證了 |Ck| α kN,以使mink α k > O。假設(shè)參數(shù)ρ和 令候選聚類代表的初始數(shù)目M是固定的。則利用概率I-K (I-Hiink α k)M-0⑴,上述 算法將索引劃分到原始聚類中,除了最多O(N)個錯誤歸類的索引之外。 采用概率方法,其中假設(shè)存在與項目{X1;...,Xm}關(guān)聯(lián)的m個隨機變量的集合,這 些隨機變量遍布評級空間R*= {1,...,k}并描述了真實的用戶偏好。對于每個用戶u,考慮 評級矢量!^ = (Γιω,... ,rffl(u))形式的評級。該評級矢量可以看作所有項目X = (X1,..., Xm) P( ·)的多變量規(guī)律的采樣。假設(shè)用戶通過對該規(guī)律進行采樣來對項目(電影)評 級。在該階段,重要的是要注意,觀察到的評級矢量不完整。因此,本發(fā)明方法的一個 目的在于,預(yù)測遺失的用戶評價。作為工作區(qū),選擇在評級空間中引入額外狀態(tài)未觀察狀 態(tài)O。評級空間變?yōu)镽 = R*U {0}。由H(u)指示用戶u進行評級的項目的集合H(u)= U e I:ri(u) >0}。因此,H(u)可以看作用戶u的歷史。要解決的問題形式如下對于某個用戶U,在給定不完整評級矢量&的情況下,必 須找出未觀察項目i得到分數(shù)(或評級)1 e R *的概率。該概率表示如下 現(xiàn)在,為Mu⑴給出所提議的預(yù)測仗(O的形式。考慮< ,+是ο ui的估計,隨機變量 I采用 < 作為其概率分布函數(shù)。則,期望值[ξ]可以看作用戶u賦予項目i的分數(shù)(評 級)的預(yù)測。該估計器最小化二次誤差函數(shù)(或RMSE)。使用觀察到的評級矢量,構(gòu)建對PKi = 1]進行估計的經(jīng)驗概率,其中1 e R, 以及構(gòu)建對P[Xi = Ii和Xj = Ij]進行估計的聯(lián)合概率民(Wy),其中L 1. e R0注意,考 慮到尚未被評級的項目i的概率。如果現(xiàn)在執(zhí)行諸如所謂的Chow-Liu算法等算法,評級矢量Ir1,. . . ,rj作為輸入, 則得到最佳樹規(guī)律估計T。接著,必須對于某個用戶U和某個未評級的項目i,找到眾 (/)。使用 =//」來指示
I中A的互補,使用vA來指示(Vi) i e A,設(shè)定 但是,民,.描述了在空間R上的概率分布。因此,需要去除空間R的未觀察 狀態(tài)并找到民,_。這可以通過考慮“避免” O的隨機變量來容易地實現(xiàn)。換言之,找到 這是定義式,的自然方法,因為式,·具有表達式(1)的形式。為給出本發(fā)明方法的完 整描述,以下給出計算表達式(2)的高效方法。
需要在排除感興趣的項目i的情況下,針對用戶U未觀察的項目集合,對樹規(guī)律 進行邊際化。為此,從樹的外圍開始。如果未觀察項目j是T中的葉子,則在T的公式
(V)C^K(V))⑷中,
veV該未觀察項目j僅出現(xiàn)在一個因子^^(νω)=^21^1^中,其中η (ν)指
1Tt(J)^x"(j) ^
示樹T中節(jié)點V的父輩。因此,可以相對于 容易地整合Τ。由于邊際聯(lián)合規(guī)律的一致性
特性?;化)=^^、;^)電,Vv (5),得到的邊際規(guī)律{Χω}具有與公式⑷相同的形式,
區(qū)別僅在于,用對應(yīng)于修剪后的樹T_{j}的依賴性函數(shù)替代了依賴性函數(shù)π (·)。通過重 復(fù)這種修建過程,留下了子樹,子樹包括由屬于H(U)的項目集合“包圍”的項目i。該子樹 雖然顯示了特定情況,但是由于該子樹的“內(nèi)部”(即,非葉子的節(jié)點)包含未觀察的項目, 因此也可以包括經(jīng)評級的項目。一旦得到了該樹,繼續(xù)實際的邊際化變得很難。對以一般 性的公式(4),解析方法看起來不可行。因此,使用新技術(shù)以不同的方式來處理該問題。該新技術(shù)相當(dāng)直接簡明。因為希望找到Ti|H(u) (l|rH(u)(u)),因此基于已評級的項目, 對T中項目的邊際和成對聯(lián)合規(guī)律進行調(diào)節(jié),以迭代過程,每次一個已評級的項目。在每個 步驟,將該“調(diào)節(jié)”傳播通過樹。但是,因為馬爾科夫特性,不需要將該過程應(yīng)用到整個樹。 只需要對包括感興趣的項目i的子樹應(yīng)用該過程,該子樹具有已評級的項目作為葉子,并 且其“內(nèi)部”不包括任何已評級的項目。對該子樹進行特征化的另一方法是,從已評級的項目(必須是葉子)到感興趣的 項目i的任何路徑不包括任何其他的已評級項目。找到該子樹并不困難。必須簡單地進行 樹搜索,從對應(yīng)于i的節(jié)點開始,只要遇到已評級節(jié)點,就停止搜索該樹。令T *表示該子樹。 在該過程的結(jié)尾,精確地找到了所搜索的條件概率??梢詫υ撍惴ㄟM行略微改進,例如消除 從f開始的最長鏈上的所有未觀察節(jié)點,而不是單個節(jié)點。但是,最差情況的復(fù)雜度大體上 保持相同項目數(shù)目中的二次項以及分數(shù)(或評級)數(shù)目中的線性。該相同過程也可以用于計算T *的葉子Xf的邊際規(guī)律。因為在每次迭代中找到相對于再多一個的葉子的條件規(guī)律,所以寫下T(Xf)= Tfi (x fi) Tf 2 I f 1 (Xf2 I Xf 1) · · · Tf φ |fi,· . .,f φ—1 (XfΦ I Xx fl. . ,f φ-1/ 是有意義的,其中φ = |F|。將T(Xf) 初始化為1,并且在主循環(huán)中,通過乘以當(dāng)前葉子的當(dāng)前規(guī)律,保持對T(Xf)進行更新。因此,可以對于每個用戶聚類,確定用戶偏好的概率模型(根據(jù)I中描述的技術(shù)來 確定)。
權(quán)利要求
一種針對網(wǎng)絡(luò)設(shè)備(CS)的控制設(shè)備(D),該網(wǎng)絡(luò)設(shè)備(CS)與通信網(wǎng)絡(luò)連接,能夠存儲內(nèi)容的用戶通信設(shè)備(CE)耦合至該通信網(wǎng)絡(luò),所述控制設(shè)備(D)包括i)第一分析裝置(A1),用于至少根據(jù)用戶信息,確定集合中內(nèi)容的各自流行度,并用于至少根據(jù)所確定的內(nèi)容流行度,確定該集合的每個內(nèi)容的復(fù)制版本的數(shù)目,ii)以及/或者第二分析裝置(A2),用于根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好,以及iii)計算裝置(CM),用于根據(jù)所確定的內(nèi)容復(fù)制版本數(shù)目和/或所確定的用戶的內(nèi)容偏好,確定用于存儲每個內(nèi)容的復(fù)制版本的位置,以優(yōu)化所述用戶對這些內(nèi)容的訪問。
2.根據(jù)權(quán)利要求1所述的控制設(shè)備,其中,所述第一分析裝置(Al)用于根據(jù)在信息組 中選擇的用戶信息來確定集合中內(nèi)容的各自流行度,其中該信息組包括如下信息中的至少 一個過去用戶對內(nèi)容的使用,預(yù)測的用戶對內(nèi)容的使用,以及關(guān)于先前訪問的內(nèi)容的用戶 評價;
3.根據(jù)權(quán)利要求2所述的控制設(shè)備,其中,控制設(shè)備被配置為接收用戶報告,該用戶報 告包括與過去用戶對內(nèi)容的使用和/或用戶對先前訪問的內(nèi)容的評價有關(guān)的用戶信息。
4.根據(jù)權(quán)利要求1到3之一所述的控制設(shè)備,其中,所述第一分析裝置(Al)還用于根 據(jù)關(guān)于網(wǎng)絡(luò)拓撲的附加信息,確定集合中內(nèi)容的各自流行度。
5.根據(jù)權(quán)利要求4所述的控制設(shè)備,其中,所述網(wǎng)絡(luò)拓撲信息至少包括關(guān)于所述用戶 通信設(shè)備(CE)的通信容量和存儲容量的信息。
6.根據(jù)權(quán)利要求1到5之一所述的控制設(shè)備,其中,所述第一分析裝置(Al)用于根據(jù) 所確定的內(nèi)容流行度,針對集合中的每個內(nèi)容,確定預(yù)期來自用戶的并發(fā)內(nèi)容請求的數(shù)目, 并用于根據(jù)所確定的并發(fā)內(nèi)容請求的數(shù)目以及所述用戶通信設(shè)備(CE)的通信容量和存儲 容量,確定將所述內(nèi)容劃分到選定數(shù)目的組中。
7.根據(jù)權(quán)利要求6所述的控制設(shè)備,其中,所述第一分析裝置(Al)用于確定將所述內(nèi) 容劃分到三個組中,第一組包括內(nèi)容的復(fù)制版本必須被存儲到至少一個選定用戶組中每個 用戶的通信設(shè)備(CE)中的內(nèi)容,第二組包括內(nèi)容的復(fù)制版本必須被存儲到至少一個選定 用戶組中一個用戶的通信設(shè)備(CE)中的內(nèi)容,并且第三組包括內(nèi)容的復(fù)制版本必須被存 儲到至少一個選定網(wǎng)絡(luò)設(shè)備(CTS)中的內(nèi)容。
8.根據(jù)權(quán)利要求1到5之一所述的控制設(shè)備,其中,所述第一分析裝置(Al)用于根據(jù) 所述用戶通信設(shè)備(CE)的通信容量和存儲容量、以及針對所述集合的每個所述內(nèi)容的預(yù) 期來自所述用戶的并發(fā)內(nèi)容請求的數(shù)目的均值和方差,確定將所述內(nèi)容劃分到可變數(shù)目的 組中。
9.根據(jù)權(quán)利要求1到8之一所述的控制設(shè)備,其中,所述第二分析裝置(A2)用于根據(jù) 所述用戶內(nèi)容評級,確定將所述用戶劃分成聚類,針對每個聚類確定用戶偏好模型,根據(jù)所 確定的用戶偏好模型,確定每個聚類的每個用戶可能感興趣的內(nèi)容。
10.根據(jù)權(quán)利要求9所述的控制設(shè)備,其中,所述第二分析裝置(A2)用于通過向所述用 戶內(nèi)容評級應(yīng)用最大似然方法,來確定每個聚類的所述用戶偏好模型;
11.根據(jù)權(quán)利要求10所述的控制設(shè)備,其中,所述第二分析裝置(A2)用于將每個聚類 的每個用戶偏好模型確定到統(tǒng)計模型類中。
12.根據(jù)權(quán)利要求11所述的控制設(shè)備,其中,所述統(tǒng)計模型類被稱為“樹結(jié)構(gòu)馬爾可夫 隨機場”。
13.根據(jù)權(quán)利要求1到12之一所述的控制設(shè)備,其中,所述計算裝置(CM)用于針對至 少一些用戶,產(chǎn)生對要存儲的內(nèi)容進行信號通知的推薦,并用于向網(wǎng)絡(luò)設(shè)備(CS)要求將所 述推薦傳輸給相應(yīng)用戶的通信設(shè)備(CE)。
14.根據(jù)權(quán)利要求1到13之一所述的控制設(shè)備,其中,所述計算裝置(CM)用于向網(wǎng)絡(luò) 設(shè)備(CS)要求傳輸每個內(nèi)容在所確定的相應(yīng)位置處的復(fù)制版本。
15.一種針對通信網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備(CS),能夠存儲內(nèi)容的用戶的通信設(shè)備耦合至該通 信網(wǎng)絡(luò),所述網(wǎng)絡(luò)設(shè)備(CS)包括根據(jù)前述權(quán)利要求之一所述的控制設(shè)備(D)。
16.一種用于優(yōu)化用戶對內(nèi)容的訪問的方法,其中用戶包括耦合至通信網(wǎng)絡(luò)的通信設(shè) 備(CE),所述方法包括步驟-至少根據(jù)用戶信息,確定集合中內(nèi)容的各自流行度,并至少根據(jù)所確定的內(nèi)容流行 度,確定該集合的每個內(nèi)容的復(fù)制版本的數(shù)目,-以及/或者根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好,以及_根據(jù)所確定的內(nèi)容復(fù)制版本數(shù)目和/或所確定的用戶的內(nèi)容偏好,確定用于存儲每 個內(nèi)容的復(fù)制版本的位置。
全文摘要
控制設(shè)備(D)屬于網(wǎng)絡(luò)設(shè)備(CS),該網(wǎng)絡(luò)設(shè)備(CS)與通信網(wǎng)絡(luò)連接,能夠存儲內(nèi)容的用戶通信設(shè)備(CE)耦合至該通信網(wǎng)絡(luò)??刂圃O(shè)備(D)包括i)第一分析裝置(A1),用于至少根據(jù)用戶信息,確定集合中內(nèi)容的各自流行度,并用于至少根據(jù)所確定的內(nèi)容流行度,確定該集合的每個內(nèi)容的復(fù)制版本的數(shù)目,以及/或者ii)第二分析裝置(A2),用于根據(jù)內(nèi)容評級,確定用戶的內(nèi)容偏好,以及iii)計算裝置(CM),用于根據(jù)所確定的內(nèi)容復(fù)制版本數(shù)目和/或所確定的用戶的內(nèi)容偏好,確定用于存儲每個內(nèi)容的復(fù)制版本的位置,以優(yōu)化所述用戶對這些內(nèi)容的訪問。
文檔編號H04L12/18GK101897184SQ200880120162
公開日2010年11月24日 申請日期2008年12月9日 優(yōu)先權(quán)日2007年12月11日
發(fā)明者丹-克里斯蒂安·特莫則, 克里斯托弗·迪奧, 勞倫特·馬蘇勒 申請人:湯姆森許可貿(mào)易公司