的預(yù)設(shè)數(shù)量的文件作為第二關(guān)聯(lián)集合;獲取在被訪問(wèn)熱點(diǎn)文件之前最近被訪問(wèn) 的預(yù)設(shè)數(shù)量的文件作為第Η關(guān)聯(lián)集合;獲取與被訪問(wèn)熱點(diǎn)文件在同一目錄下的文件作為第 四關(guān)聯(lián)集合;將第一關(guān)聯(lián)集合、第二關(guān)聯(lián)集合、第Η關(guān)聯(lián)集合和第四關(guān)聯(lián)集合中至少一個(gè)集 合中的文件作為被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文件。
[0076] 在一個(gè)實(shí)施例中,通過(guò)Apriori算法計(jì)算被訪問(wèn)熱點(diǎn)文件與其他文件之間的文件 名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)。
[0077] 在一個(gè)實(shí)施例中,文件關(guān)聯(lián)度確定單元204,具體用于;計(jì)算被訪問(wèn)熱點(diǎn)文件與其 關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù);計(jì)算被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件內(nèi)容關(guān)聯(lián) 系數(shù);根據(jù)各個(gè)關(guān)聯(lián)文件的訪問(wèn)順序計(jì)算每個(gè)關(guān)聯(lián)文件的文件訪問(wèn)順序系數(shù);根據(jù)被訪問(wèn) 熱點(diǎn)文件與關(guān)聯(lián)文件是否在同一目錄下確定關(guān)聯(lián)文件的文件位置系數(shù);根據(jù)被訪問(wèn)熱點(diǎn)文 件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)、W及關(guān)聯(lián)文件的文件訪問(wèn)順 序系數(shù)和文件位置系數(shù),使用歐幾里德距離算法確定被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的 文件關(guān)聯(lián)度。
[0078] 在一個(gè)實(shí)施例中,熱度權(quán)重確定單元206,具體用于;設(shè)置文件關(guān)聯(lián)度和訪問(wèn)熱度 信息在熱度權(quán)重中所占的熱度系數(shù);根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度 及其熱度系數(shù),并且結(jié)合關(guān)聯(lián)文件的訪問(wèn)熱度信息及其熱度系數(shù),綜合確定關(guān)聯(lián)文件的熱 度權(quán)重;其中,訪問(wèn)熱度信息包括訪問(wèn)時(shí)間和/或訪問(wèn)頻率。
[0079] 熱點(diǎn)文件識(shí)別單元208,具體用于選取熱度權(quán)重最大的預(yù)設(shè)數(shù)量的關(guān)聯(lián)文件作為 熱點(diǎn)文件,或者,選取熱度權(quán)重大于預(yù)設(shè)權(quán)重闊值的關(guān)聯(lián)文件作為熱點(diǎn)文件。
[0080] 在一個(gè)實(shí)施例中,熱點(diǎn)數(shù)據(jù)識(shí)別裝置還包括:熱點(diǎn)文件處理單元,用于在識(shí)別出熱 點(diǎn)文件之后,如果本地緩存中沒(méi)有識(shí)別出的熱點(diǎn)文件,從云端下載該熱點(diǎn)文件;和/或,女口 果本地緩存中存留有非熱點(diǎn)文件,從本地緩存中刪除該非熱點(diǎn)文件。
[0081] 上述實(shí)施例在確定文件熱度時(shí)增加對(duì)文件相關(guān)性的參考,從而提升熱點(diǎn)文件的預(yù) 判能力,提高用戶(hù)所需要的熱點(diǎn)數(shù)據(jù)的命中率。并且,將識(shí)別出的熱點(diǎn)文件下載到本地緩 存,可W提高用戶(hù)對(duì)本地文件的訪問(wèn)速度。
[0082] 本領(lǐng)域普通技術(shù)人員可W理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可W通過(guò)硬件 來(lái)完成,也可W通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可W存儲(chǔ)于一種計(jì)算機(jī)可讀 存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可W是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
[0083] W上所述僅為本發(fā)明的較佳實(shí)施例,并不用W限制本發(fā)明,凡在本發(fā)明的精神和 原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種熱點(diǎn)數(shù)據(jù)識(shí)別方法,其特征在于,包括: 根據(jù)文件名、文件內(nèi)容、文件訪問(wèn)順序、文件位置中的至少一項(xiàng)信息確定被訪問(wèn)熱點(diǎn)文 件的關(guān)聯(lián)文件; 確定被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度; 根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度以及關(guān)聯(lián)文件的訪問(wèn)熱度信息 確定關(guān)聯(lián)文件的熱度權(quán)重; 根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識(shí)別出熱點(diǎn)文件。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)文件名、文件內(nèi)容、文件訪問(wèn)順 序、文件位置中的至少一項(xiàng)信息確定被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文件包括: 計(jì)算被訪問(wèn)熱點(diǎn)文件與其他文件之間的文件名關(guān)聯(lián)系數(shù),選取文件名關(guān)聯(lián)系數(shù)最大的 預(yù)設(shè)數(shù)量的文件作為第一關(guān)聯(lián)集合; 計(jì)算被訪問(wèn)熱點(diǎn)文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù),選取文件內(nèi)容關(guān)聯(lián)系數(shù)最 大的預(yù)設(shè)數(shù)量的文件作為第二關(guān)聯(lián)集合; 獲取在被訪問(wèn)熱點(diǎn)文件之前最近被訪問(wèn)的預(yù)設(shè)數(shù)量的文件作為第三關(guān)聯(lián)集合; 獲取與被訪問(wèn)熱點(diǎn)文件在同一目錄下的文件作為第四關(guān)聯(lián)集合; 將第一關(guān)聯(lián)集合、第二關(guān)聯(lián)集合、第三關(guān)聯(lián)集合和第四關(guān)聯(lián)集合中至少一個(gè)集合中的 文件作為被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文件。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,通過(guò)Apriori算法計(jì)算被訪問(wèn)熱點(diǎn)文件與 其他文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件 之間的文件關(guān)聯(lián)度包括: 計(jì)算被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù); 計(jì)算被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù); 根據(jù)各個(gè)關(guān)聯(lián)文件的訪問(wèn)順序計(jì)算每個(gè)關(guān)聯(lián)文件的文件訪問(wèn)順序系數(shù); 根據(jù)被訪問(wèn)熱點(diǎn)文件與關(guān)聯(lián)文件是否在同一目錄下確定關(guān)聯(lián)文件的文件位置系數(shù); 根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)、以及 關(guān)聯(lián)文件的文件訪問(wèn)順序系數(shù)和文件位置系數(shù),使用歐幾里德距離算法確定被訪問(wèn)熱點(diǎn)文 件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件 之間的文件關(guān)聯(lián)度以及關(guān)聯(lián)文件的訪問(wèn)熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重包括: 設(shè)置文件關(guān)聯(lián)度和訪問(wèn)熱度信息在熱度權(quán)重中所占的熱度系數(shù); 根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度及其熱度系數(shù),并且結(jié)合關(guān)聯(lián)文 件的訪問(wèn)熱度信息及其熱度系數(shù),綜合確定關(guān)聯(lián)文件的熱度權(quán)重; 其中,訪問(wèn)熱度信息包括訪問(wèn)時(shí)間和/或訪問(wèn)頻率。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,識(shí)別出熱點(diǎn)文件之后,還包括: 如果本地緩存中沒(méi)有識(shí)別出的熱點(diǎn)文件,從云端下載該熱點(diǎn)文件; 和/或, 如果本地緩存中存留有非熱點(diǎn)文件,從本地緩存中刪除該非熱點(diǎn)文件。7.-種熱點(diǎn)數(shù)據(jù)識(shí)別裝置,其特征在于,包括: 關(guān)聯(lián)文件確定單元,用于根據(jù)文件名、文件內(nèi)容、文件訪問(wèn)順序、文件位置中的至少一 項(xiàng)信息確定被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文件; 文件關(guān)聯(lián)度確定單元,用于確定被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度; 熱度權(quán)重確定單元,用于根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度以及關(guān) 聯(lián)文件的訪問(wèn)熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重; 熱點(diǎn)文件識(shí)別單元,用于根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識(shí)別出熱點(diǎn)文件。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述關(guān)聯(lián)文件確定單元,具體用于根據(jù)文 件名、文件內(nèi)容、文件訪問(wèn)順序、文件位置中的至少一項(xiàng)信息確定被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文 件: 計(jì)算被訪問(wèn)熱點(diǎn)文件與其他文件之間的文件名關(guān)聯(lián)系數(shù),選取文件名關(guān)聯(lián)系數(shù)最大的 預(yù)設(shè)數(shù)量的文件作為第一關(guān)聯(lián)集合; 計(jì)算被訪問(wèn)熱點(diǎn)文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù),選取文件內(nèi)容關(guān)聯(lián)系數(shù)最 大的預(yù)設(shè)數(shù)量的文件作為第二關(guān)聯(lián)集合; 獲取在被訪問(wèn)熱點(diǎn)文件之前最近被訪問(wèn)的預(yù)設(shè)數(shù)量的文件作為第三關(guān)聯(lián)集合; 獲取與被訪問(wèn)熱點(diǎn)文件在同一目錄下的文件作為第四關(guān)聯(lián)集合; 將第一關(guān)聯(lián)集合、第二關(guān)聯(lián)集合、第三關(guān)聯(lián)集合和第四關(guān)聯(lián)集合中至少一個(gè)集合中的 文件作為被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文件。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,通過(guò)Apriori算法計(jì)算被訪問(wèn)熱點(diǎn)文件與 其他文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)。10. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述文件關(guān)聯(lián)度確定單元,具體用于: 計(jì)算被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù); 計(jì)算被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù); 根據(jù)各個(gè)關(guān)聯(lián)文件的訪問(wèn)順序計(jì)算每個(gè)關(guān)聯(lián)文件的文件訪問(wèn)順序系數(shù); 根據(jù)被訪問(wèn)熱點(diǎn)文件與關(guān)聯(lián)文件是否在同一目錄下確定關(guān)聯(lián)文件的文件位置系數(shù); 根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)、以及 關(guān)聯(lián)文件的文件訪問(wèn)順序系數(shù)和文件位置系數(shù),使用歐幾里德距離算法確定被訪問(wèn)熱點(diǎn)文 件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度。11. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述熱度權(quán)重確定單元,具體用于: 設(shè)置文件關(guān)聯(lián)度和訪問(wèn)熱度信息在熱度權(quán)重中所占的熱度系數(shù); 根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度及其熱度系數(shù),并且結(jié)合關(guān)聯(lián)文 件的訪問(wèn)熱度信息及其熱度系數(shù),綜合確定關(guān)聯(lián)文件的熱度權(quán)重; 其中,訪問(wèn)熱度信息包括訪問(wèn)時(shí)間和/或訪問(wèn)頻率。12. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 熱點(diǎn)文件處理單元,用于在識(shí)別出熱點(diǎn)文件之后,如果本地緩存中沒(méi)有識(shí)別出的熱點(diǎn) 文件,從云端下載該熱點(diǎn)文件;和/或,如果本地緩存中存留有非熱點(diǎn)文件,從本地緩存中 刪除該非熱點(diǎn)文件。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種熱點(diǎn)數(shù)據(jù)識(shí)別方法和裝置,涉及云計(jì)算領(lǐng)域。其中方法包括:根據(jù)文件名、文件內(nèi)容、文件訪問(wèn)順序、文件位置中的至少一項(xiàng)信息確定被訪問(wèn)熱點(diǎn)文件的關(guān)聯(lián)文件;確定被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度;根據(jù)被訪問(wèn)熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度以及關(guān)聯(lián)文件的訪問(wèn)熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重;根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識(shí)別出熱點(diǎn)文件。本發(fā)明在確定文件熱度時(shí)增加對(duì)文件相關(guān)性的參考,從而提升熱點(diǎn)文件的預(yù)判能力,提高用戶(hù)所需要的熱點(diǎn)數(shù)據(jù)的命中率。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN105447062
【申請(qǐng)?zhí)枴緾N201410515821
【發(fā)明人】龔靖, 馮明, 秦達(dá), 雷俊智, 段勇
【申請(qǐng)人】中國(guó)電信股份有限公司
【公開(kāi)日】2016年3月30日
【申請(qǐng)日】2014年9月30日