本發(fā)明涉及網(wǎng)絡(luò)通信領(lǐng)域,并且更具體地,涉及一種對數(shù)據(jù)訪問進(jìn)行重定向的方法和設(shè)備。
背景技術(shù):
重定向是通過各種方法將各種網(wǎng)絡(luò)請求重新定個方向轉(zhuǎn)到其它位置例如:網(wǎng)頁重定向、域名的重定向、路由選擇的變化也是對數(shù)據(jù)報文經(jīng)由路徑的一種重定向。目前,用戶針對內(nèi)容服務(wù)器的數(shù)據(jù)訪問通常是在時間上沒有規(guī)律的,這種情況造成服務(wù)提供商無法對內(nèi)容服務(wù)器進(jìn)行有效地管理。通常,內(nèi)容服務(wù)器在空閑時可以降低處理能力以節(jié)省電源,但是由于用戶對內(nèi)容服務(wù)器的訪問時間是分散且無規(guī)律的,因此內(nèi)容服務(wù)器無法有效地進(jìn)行管理。
此外,內(nèi)容提供商通常會進(jìn)行數(shù)據(jù)遷移,例如將兩個或多個內(nèi)容服務(wù)器中的內(nèi)容遷移到另一單獨的內(nèi)容服務(wù)器中,從而實現(xiàn)對相同或相近內(nèi)容或訪問時間的有效管理。目前的數(shù)據(jù)遷移通常僅根據(jù)內(nèi)容來進(jìn)行遷移。例如,內(nèi)容提供商將提供相同或相似內(nèi)容的內(nèi)容服務(wù)器中的內(nèi)容遷移到另一內(nèi)容服務(wù)器中。然而,在實際應(yīng)用中,還需要考慮用戶針對內(nèi)容服務(wù)器的訪問時間。通常,內(nèi)容提供商可以對在相同或相似時間段內(nèi)對內(nèi)容服務(wù)器進(jìn)行的數(shù)據(jù)訪問進(jìn)行有效管理。
技術(shù)實現(xiàn)要素:
根據(jù)本發(fā)明的第一方面,提供一種對數(shù)據(jù)訪問進(jìn)行重定向的方法,包括:
確定第一內(nèi)容服務(wù)器的第一穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的第二穩(wěn)定用戶集;
計算第一穩(wěn)定用戶集的每個用戶和第二穩(wěn)定用戶集的每個用戶的用戶相似度,獲得第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器的用戶相似度矩陣;
根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度;以及
當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一穩(wěn)定用戶集或第二穩(wěn)定用戶集中的用戶針對第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的數(shù)據(jù)訪問重定向到第三內(nèi)容服務(wù)器。
優(yōu)選地,所述方法還包括:當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器中的內(nèi)容發(fā)送給第三內(nèi)容服務(wù)器。
優(yōu)選地,根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集。
優(yōu)選地,根據(jù)用戶數(shù)據(jù)訪問的時間段列表采用余弦相似度來計算所述用戶相似度,具體為:第一穩(wěn)定用戶集的第一用戶與第二穩(wěn)定用戶集的第二用戶的用戶相似度為一比值,比值的分子為第一用戶和第二用戶的兩個時間段列表的交集所含時間段數(shù)量的個數(shù),分母為第一用戶和第二用戶的兩個時間段列表的并集所含時間段數(shù)量的個數(shù)的根值。
優(yōu)選地,所述根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集包括:確定第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的用戶集中每個用戶平均每天訪問第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的時間達(dá)到閾值時,將所述用戶確定為第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的穩(wěn)定用戶。
優(yōu)選地,所述根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度包括:將第一穩(wěn)定用戶集中每個穩(wěn)定用戶與第二穩(wěn)定用戶集中每個穩(wěn)定用戶的相似度的均值作為第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。
根據(jù)本發(fā)明的另一方面,提供一種對數(shù)據(jù)訪問進(jìn)行重定向的設(shè)備,包括:
第一確定單元,用于確定第一內(nèi)容服務(wù)器的第一穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的第二穩(wěn)定用戶集;
計算單元,用于計算第一穩(wěn)定用戶集的每個用戶和第二穩(wěn)定用戶集的每個用戶的用戶相似度,獲得第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器的用戶相似度矩陣;
第二確定單元,用于根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度;以及
重定向單元,當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一穩(wěn)定用戶集或第二穩(wěn)定用戶集中的用戶針對第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的數(shù)據(jù)訪問重定向到第三內(nèi)容服務(wù)器。
優(yōu)選地,當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,重定向單元將第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器中的內(nèi)容發(fā)送給第三內(nèi)容服務(wù)器。
優(yōu)選地,第一確定單元根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集。
優(yōu)選地,計算單元根據(jù)用戶數(shù)據(jù)訪問的時間段列表采用余弦相似度來計算所述用戶相似度,具體為:第一穩(wěn)定用戶集的第一用戶與第二穩(wěn)定用戶集的第二用戶的用戶相似度為一比值,比值的分子為第一用戶和第二用戶的兩個時間段列表的交集所含時間段數(shù)量的個數(shù),分母為第一用戶和第二用戶的兩個時間段列表的并集所含時間段數(shù)量的個數(shù)的根值。
優(yōu)選地,所述根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集包括:確定第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的用戶集中每個用戶平均每天訪問第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的時間達(dá)到閾值時,將所述用戶確定為第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的穩(wěn)定用戶。
優(yōu)選地,所述第二確定單元根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度包括:將第一穩(wěn)定用戶集中每個穩(wěn)定用戶與第二穩(wěn)定用戶集中每個穩(wěn)定用戶的相似度的均值作為第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。
附圖說明
通過參考下面的附圖,可以更為完整地理解本發(fā)明的示例性實施方式:
圖1為本發(fā)明實施方式的對數(shù)據(jù)訪問進(jìn)行重定向的系統(tǒng)的結(jié)構(gòu)圖;
圖2為本發(fā)明實施方式的網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實施方式的對數(shù)據(jù)訪問進(jìn)行重定向的方法的流程圖;
圖4為本發(fā)明實施方式的重定向設(shè)備的結(jié)構(gòu)示意圖。
具體實施方式
現(xiàn)在參考附圖介紹本發(fā)明的示例性實施方式,然而,本發(fā)明可以用許多不同的形式來實施,并且不局限于此處描述的實施例,提供這些實施例是為了詳盡地且完全地公開本發(fā)明,并且向所屬技術(shù)領(lǐng)域的技術(shù)人員充分傳達(dá)本發(fā)明的范圍。對于表示在附圖中的示例性實施方式中的術(shù)語并不是對本發(fā)明的限定。在附圖中,相同的單元/元件使用相同的附圖標(biāo)記。
除非另有說明,此處使用的術(shù)語(包括科技術(shù)語)對所屬技術(shù)領(lǐng)域的技術(shù)人員具有通常的理解含義。另外,可以理解的是,以通常使用的詞典限定的術(shù)語,應(yīng)當(dāng)被理解為與其相關(guān)領(lǐng)域的語境具有一致的含義,而不應(yīng)該被理解為理想化的或過于正式的意義。
一般來說,用戶通常會習(xí)慣于訪問或網(wǎng)絡(luò)服務(wù)提供商會將用戶的訪問請求給相同的內(nèi)容服務(wù)器。在移動通信的情況下,服務(wù)提供商會將數(shù)據(jù)內(nèi)容存儲在內(nèi)容服務(wù)器中以供用戶訪問。由于每個用戶的數(shù)據(jù)訪問通常在時間上具有習(xí)慣性,即通常會在習(xí)慣的時間進(jìn)行數(shù)據(jù)訪問。但是,由于各個用戶的習(xí)慣不同,因此也會導(dǎo)致多個用戶的訪問時間分布不同。為了提升內(nèi)容服務(wù)器對客戶進(jìn)行數(shù)據(jù)服務(wù)的質(zhì)量并且降低響應(yīng)時間,需要將具有相同訪問時間的數(shù)據(jù)訪問請求進(jìn)行歸類和合并。并且,將歸類和合并的數(shù)據(jù)訪問請求重定向到新的內(nèi)容服務(wù)器,從而更好地為數(shù)據(jù)訪問請求進(jìn)行訪問。通常,由同一內(nèi)容服務(wù)器對歸類和合并的數(shù)據(jù)訪問請求提供服務(wù),能夠更好地降低響應(yīng)時間、節(jié)省處理資源等。
圖1為本發(fā)明實施方式的對數(shù)據(jù)訪問進(jìn)行重定向的系統(tǒng)100的結(jié)構(gòu)圖。系統(tǒng)100。系統(tǒng)100在進(jìn)行數(shù)據(jù)遷移或內(nèi)容合并時,考慮每個用戶的數(shù)據(jù)訪問在時間上的習(xí)慣性并且將其作為數(shù)據(jù)遷移或內(nèi)容合并的基礎(chǔ)。為了提升內(nèi)容服務(wù)器對客戶進(jìn)行數(shù)據(jù)服務(wù)的質(zhì)量并且降低響應(yīng)時間,將具有相同訪問時間的數(shù)據(jù)訪問請求進(jìn)行歸類和合并。
如圖1所示,系統(tǒng)100包括:重定向設(shè)備101和第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103、第三內(nèi)容服務(wù)器104以及網(wǎng)絡(luò)設(shè)備105。重定向設(shè)備101用于確定第一內(nèi)容服務(wù)器的第一穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的第二穩(wěn)定用戶集并且計算第一穩(wěn)定用戶集的每個用戶和第二穩(wěn)定用戶集的每個用戶的用戶相似度,獲得第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器的用戶相似度矩陣。優(yōu)選地,重定向設(shè)備101根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度并且重定向單元,當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一穩(wěn)定用戶集或第二穩(wěn)定用戶集中的用戶針對第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的數(shù)據(jù)訪問重定向到第三內(nèi)容服務(wù)器。
優(yōu)選地,當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,重定向設(shè)備101將第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器中的內(nèi)容發(fā)送給第三內(nèi)容服務(wù)器。重定向設(shè)備101根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集。
優(yōu)選地,重定向設(shè)備101根據(jù)用戶數(shù)據(jù)訪問的時間段列表采用余弦相似度來計算所述用戶相似度,具體為:第一穩(wěn)定用戶集的第一用戶與第二穩(wěn)定用戶集的第二用戶的用戶相似度為一比值,比值的分子為第一用戶和第二用戶的兩個時間段列表的交集所含時間段數(shù)量的個數(shù),分母為第一用戶和第二用戶的兩個時間段列表的并集所含時間段數(shù)量的個數(shù)的根值。其中根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集包括:確定第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的用戶集中每個用戶平均每天訪問第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的時間達(dá)到閾值時,將所述用戶確定為第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的穩(wěn)定用戶。重定向設(shè)備101根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度包括:將第一穩(wěn)定用戶集中每個穩(wěn)定用戶與第二穩(wěn)定用戶集中每個穩(wěn)定用戶的相似度的均值作為第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。
優(yōu)選地,第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104用于存儲數(shù)據(jù)內(nèi)容并且能夠?qū)τ脩舻臄?shù)據(jù)訪問請求進(jìn)行響應(yīng)。通常,第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104可以在地理上臨近或遠(yuǎn)離。例如,第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104位于同一建筑物內(nèi)部,或者第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104位于城市的不同的區(qū)域內(nèi)。通常,第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104中存儲的數(shù)據(jù)內(nèi)容包括各種類型的文件,例如音頻文件、視頻文件、可執(zhí)行文件、文本文件以及各種數(shù)據(jù)文檔等。
優(yōu)選地,網(wǎng)絡(luò)設(shè)備105用于將重定向設(shè)備101與第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104進(jìn)行通信連接。網(wǎng)絡(luò)設(shè)備105可以將重定向設(shè)備101的遷移指令或重定向指令發(fā)送給第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104。另一方面,第一內(nèi)容服務(wù)器102、第二內(nèi)容服務(wù)器103以及第三內(nèi)容服務(wù)器104可以將與數(shù)據(jù)訪問相關(guān)的數(shù)據(jù)發(fā)送給重定向設(shè)備101以供其進(jìn)行計算和處理。
圖1中的重定向設(shè)備可以以圖2中的計算機設(shè)備200(或系統(tǒng))的方式來實現(xiàn)。圖2為本發(fā)明實施方式的重定向設(shè)備的結(jié)構(gòu)示意圖。如圖2所示,將利用計算機設(shè)備200來實現(xiàn)重定向設(shè)備。計算機設(shè)備200包括至少一個處理器201,通信總線202,存儲器203以及至少一個通信接口204。
優(yōu)選地,處理器201可以是一個通用中央處理器(CPU),微處理器,特定應(yīng)用集成電路(application-specific integrated circuit,ASIC),或一個或多個用于控制本發(fā)明方案程序執(zhí)行的集成電路。
優(yōu)選地,通信總線202可包括一通路,在上述組件之間傳送信息。所述通信接口204,使用任何收發(fā)器一類的裝置,用于與其他設(shè)備或通信網(wǎng)絡(luò)通信,如以太網(wǎng),無線接入網(wǎng)(RAN),無線局域網(wǎng)(Wireless Local Area Networks,WLAN)等。
優(yōu)選地,存儲器203可以是只讀存儲器(read-only memory,ROM)或可存儲靜態(tài)信息和指令的其他類型的靜態(tài)存儲設(shè)備,隨機存取存儲器(random access memory,RAM)或者可存儲信息和指令的其他類型的動態(tài)存儲設(shè)備,也可以是電可擦可編程只讀存儲器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只讀光盤(Compact Disc Read-Only Memory,CD-ROM)或其他光盤存儲、光碟存儲(包括壓縮光碟、激光碟、光碟、數(shù)字通用光碟、藍(lán)光光碟等)、磁盤存儲介質(zhì)或者其他磁存儲設(shè)備、或者能夠用于攜帶或存儲具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的程序代碼并能夠由計算機存取的任何其他介質(zhì),但不限于此。存儲器可以是獨立存在,通過總線與處理器相連接。存儲器也可以和處理器集成在一起。
其中,所述存儲器203用于存儲執(zhí)行本發(fā)明方案的應(yīng)用程序代碼,并由處理器201來控制執(zhí)行。所述處理器201用于執(zhí)行所述存儲器203中存儲的應(yīng)用程序代碼。
在具體實現(xiàn)中,處理器201可以包括一個或多個CPU,每個CPU可以是一個單核(single-core)處理器,也可以是一個多核(multi-Core)處理器。這里的處理器可以指一個或多個設(shè)備、電路、和/或用于處理數(shù)據(jù)(例如計算機程序指令)的處理核。
在具體實現(xiàn)中,作為一種實施例,計算機設(shè)備200還可以包括輸入/輸出(I/O)接口205。例如,輸出設(shè)備可以是液晶顯示器(liquid crystal display,LCD),發(fā)光二級管(light emitting diode,LED)顯示設(shè)備,陰極射線管(cathode ray tube,CRT)顯示設(shè)備,或投影儀(projector)等。輸入設(shè)備可以是鼠標(biāo)、鍵盤、觸摸屏設(shè)備或傳感設(shè)備等。
上述的計算機設(shè)備200可以是一個通用計算機設(shè)備或者是一個專用計算機設(shè)備。在具體實現(xiàn)中,計算機設(shè)備200可以是臺式機、便攜式電腦、網(wǎng)絡(luò)服務(wù)器、掌上電腦(Personal Digital Assistant,PDA)、移動手機、平板電腦、無線終端設(shè)備、通信設(shè)備、嵌入式設(shè)備或有圖2中類似結(jié)構(gòu)的設(shè)備。本發(fā)明實施例不限定計算機設(shè)備的類型。
如圖1中的重定向設(shè)備可以為圖2所示的計算機設(shè)備,重定向設(shè)備的存儲器203中存儲了一個或多個軟件模塊(例如:計算模塊和判斷模塊)。重定向設(shè)備可以通過處理器以及存儲器中的程序代碼來實現(xiàn)軟件模塊,數(shù)據(jù)訪問的重定向。
圖3為本發(fā)明實施方式的對數(shù)據(jù)訪問進(jìn)行重定向的方法300的流程圖。方法300在進(jìn)行數(shù)據(jù)遷移或內(nèi)容合并時,考慮每個用戶的數(shù)據(jù)訪問在時間上的習(xí)慣性并且將其作為數(shù)據(jù)遷移或內(nèi)容合并的基礎(chǔ)。為了提升內(nèi)容服務(wù)器對客戶進(jìn)行數(shù)據(jù)服務(wù)的質(zhì)量并且降低響應(yīng)時間,將具有相同訪問時間的數(shù)據(jù)訪問請求進(jìn)行歸類和合并。
如圖3所示,方法300從步驟301處開始。優(yōu)選地,在步驟301,確定第一內(nèi)容服務(wù)器的第一穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的第二穩(wěn)定用戶集。優(yōu)選地,方法300根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集。其中所述根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集包括:確定第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的用戶集中每個用戶平均每天訪問第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的時間達(dá)到閾值時,將所述用戶確定為第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的穩(wěn)定用戶。
優(yōu)選地,重定向設(shè)備記錄用戶HTTP訪問的日志信息。在記錄的日志文件中,每一條記錄可以包含用戶標(biāo)識,業(yè)務(wù)內(nèi)容的地址URL,用戶訪問時所請求的內(nèi)容服務(wù)器標(biāo)識,內(nèi)容類型,業(yè)務(wù)請求時間等信息。這些信息存儲在重定向設(shè)備,用于后續(xù)的計算。重定向設(shè)備記錄用戶訪問內(nèi)容服務(wù)器的時間。通常用戶訪問內(nèi)容服務(wù)器時,會保持與內(nèi)容服務(wù)器的連接。重定向設(shè)備將用戶與內(nèi)容服務(wù)器的連接時間進(jìn)行記錄以用于之后確定用戶相似度。
對于每個內(nèi)容服務(wù)器,都存在穩(wěn)定用戶(經(jīng)常訪問的用戶)和臨時用戶(臨時訪問用戶)。為了減少臨時用戶對計算結(jié)果的干擾,需要確定每個內(nèi)容服務(wù)器的穩(wěn)定用戶,確定穩(wěn)定用戶的方法有多種,例如,許多天都接入內(nèi)容服務(wù)器訪問業(yè)務(wù)內(nèi)容的用戶。可以根據(jù)上述的訪問日志信息確定。具體的天數(shù)可以由預(yù)設(shè)的值確定。例如,對一個內(nèi)容服務(wù)器,該內(nèi)容服務(wù)器下的穩(wěn)定用戶定義為在過去一周之內(nèi)不少于4天都有訪問記錄的用戶。符合條件的用戶可以標(biāo)記為該內(nèi)容服務(wù)器下的穩(wěn)定用戶。本實施例中,假設(shè)第一內(nèi)容服務(wù)器A下的所有穩(wěn)定用戶記為第一穩(wěn)定用戶集,第二內(nèi)容服務(wù)器B下的所有穩(wěn)定用戶記為第二穩(wěn)定用戶集。其中穩(wěn)定用戶的求解可定期進(jìn)行更新,由于實時性要求不高,因此重定向設(shè)備可以在閑時進(jìn)行計算。
優(yōu)選地,在步驟302,計算第一穩(wěn)定用戶集的每個用戶和第二穩(wěn)定用戶集的每個用戶的用戶相似度,獲得第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器的用戶相似度矩陣。其中根據(jù)用戶數(shù)據(jù)訪問的時間段列表采用余弦相似度來計算所述用戶相似度,具體為:第一穩(wěn)定用戶集的第一用戶與第二穩(wěn)定用戶集的第二用戶的用戶相似度為一比值,比值的分子為第一用戶和第二用戶的兩個時間段列表的交集所含時間段數(shù)量的個數(shù),分母為第一用戶和第二用戶的兩個時間段列表的并集所含時間段數(shù)量的個數(shù)的根值。
優(yōu)選地,用戶相似度描述的是兩個用戶對業(yè)務(wù)內(nèi)容的訪問習(xí)慣的相似程度,主要根據(jù)用戶訪問業(yè)務(wù)內(nèi)容的歷史記錄確定。本實施例采用余弦相似度(CosineSimilarity)來進(jìn)行用戶相似度計算。假設(shè)A內(nèi)容服務(wù)器的一個穩(wěn)定用戶為u,B內(nèi)容服務(wù)器的一個穩(wěn)定用戶為v,則從上述日志信息中獲取用戶訪問內(nèi)容的列表,然后通過如下公式計算兩個用戶相似度:
其中S(u,v)表示用戶u和用戶v的相似度,c(u)記錄的是用戶u訪問的內(nèi)容列表,c(v)記錄的是用戶v訪問的內(nèi)容列表。公式的分子部分表示取c(u)和c(v)兩個內(nèi)容列表的交集,然后求出交集所含內(nèi)容數(shù)量的個數(shù),分母表示取c(u)和c(v)的并集,然后求出并集所含內(nèi)容數(shù)量的個數(shù),然后再取根值。
將內(nèi)容服務(wù)器A的每一個穩(wěn)定用戶與內(nèi)容服務(wù)器B的每一個穩(wěn)定用戶按照上述公式(1)計算用戶相似度,可以得到A內(nèi)容服務(wù)器的穩(wěn)定用戶集與B內(nèi)容服務(wù)器的穩(wěn)定用戶集的相似度矩陣,如下:
其中,A內(nèi)容服務(wù)器的穩(wěn)定用戶數(shù)記為U,B內(nèi)容服務(wù)器的穩(wěn)定用戶數(shù)記為V,a11表示A內(nèi)容服務(wù)器的第一個穩(wěn)定用戶與B內(nèi)容服務(wù)器的第一個穩(wěn)定用戶的用戶相似度,同理aUV表示A內(nèi)容服務(wù)器的第U個穩(wěn)定用戶和B內(nèi)容服務(wù)器的第V個穩(wěn)定用戶之間的用戶相似度。
用戶每天訪問內(nèi)容的列表是動態(tài)變化的,因此一般也需要根據(jù)時間的推移定期更新用戶相似度的計算值。
優(yōu)選地,在步驟303,根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。其中所述根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度包括:將第一穩(wěn)定用戶集中每個穩(wěn)定用戶與第二穩(wěn)定用戶集中每個穩(wěn)定用戶的相似度的均值作為第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。
優(yōu)選地,在步驟304,當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一穩(wěn)定用戶集或第二穩(wěn)定用戶集中的用戶針對第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的數(shù)據(jù)訪問重定向到第三內(nèi)容服務(wù)器。方法300還包括:當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器中的內(nèi)容發(fā)送給第三內(nèi)容服務(wù)器。
圖4為本發(fā)明實施方式的重定向設(shè)備400的結(jié)構(gòu)示意圖。重定向設(shè)備400在進(jìn)行數(shù)據(jù)遷移或內(nèi)容合并時,考慮每個用戶的數(shù)據(jù)訪問在時間上的習(xí)慣性并且將其作為數(shù)據(jù)遷移或內(nèi)容合并的基礎(chǔ)。為了提升內(nèi)容服務(wù)器對客戶進(jìn)行數(shù)據(jù)服務(wù)的質(zhì)量并且降低響應(yīng)時間,將具有相同訪問時間的數(shù)據(jù)訪問請求進(jìn)行歸類和合并。
如圖4所示,重定向設(shè)備400包括:第一確定單元401、計算單元402、第二確定單元403和重定向單元404。優(yōu)選地,第一確定單元401,用于確定第一內(nèi)容服務(wù)器的第一穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的第二穩(wěn)定用戶集。第一確定單元401根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集。其中根據(jù)記錄的用戶數(shù)據(jù)訪問日志確定所述第一內(nèi)容服務(wù)器的穩(wěn)定用戶集和第二內(nèi)容服務(wù)器的穩(wěn)定用戶集包括:確定第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的用戶集中每個用戶平均每天訪問第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的時間達(dá)到閾值時,將所述用戶確定為第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的穩(wěn)定用戶。
優(yōu)選地,計算單元402,用于計算第一穩(wěn)定用戶集的每個用戶和第二穩(wěn)定用戶集的每個用戶的用戶相似度,獲得第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器的用戶相似度矩陣。計算單元402根據(jù)用戶數(shù)據(jù)訪問的時間段列表采用余弦相似度來計算所述用戶相似度,具體為:第一穩(wěn)定用戶集的第一用戶與第二穩(wěn)定用戶集的第二用戶的用戶相似度為一比值,比值的分子為第一用戶和第二用戶的兩個時間段列表的交集所含時間段數(shù)量的個數(shù),分母為第一用戶和第二用戶的兩個時間段列表的并集所含時間段數(shù)量的個數(shù)的根值。
優(yōu)選地,第二確定單元403,用于根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。第二確定單元403根據(jù)所述用戶相似度矩陣確定第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度包括:將第一穩(wěn)定用戶集中每個穩(wěn)定用戶與第二穩(wěn)定用戶集中每個穩(wěn)定用戶的相似度的均值作為第一穩(wěn)定用戶集與第二穩(wěn)定用戶集的相似度。
優(yōu)選地,重定向單元404,當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,將第一穩(wěn)定用戶集或第二穩(wěn)定用戶集中的用戶針對第一內(nèi)容服務(wù)器或第二內(nèi)容服務(wù)器的數(shù)據(jù)訪問重定向到第三內(nèi)容服務(wù)器。當(dāng)?shù)谝环€(wěn)定用戶集與第二穩(wěn)定用戶集的相似度大于閾值時,重定向單元將第一內(nèi)容服務(wù)器和第二內(nèi)容服務(wù)器中的內(nèi)容發(fā)送給第三內(nèi)容服務(wù)器。
已經(jīng)通過參考少量實施方式描述了本發(fā)明。然而,本領(lǐng)域技術(shù)人員所公知的,正如附帶的專利權(quán)利要求所限定的,除了本發(fā)明以上公開的其他的實施例等同地落在本發(fā)明的范圍內(nèi)。
通常地,在權(quán)利要求中使用的所有術(shù)語都根據(jù)他們在技術(shù)領(lǐng)域的通常含義被解釋,除非在其中被另外明確地定義。所有的參考“一個/所述/該[裝置、組件等]”都被開放地解釋為所述裝置、組件等中的至少一個實例,除非另外明確地說明。這里公開的任何方法的步驟都沒必要以公開的準(zhǔn)確的順序運行,除非明確地說明。