本發(fā)明涉及數(shù)據(jù)存儲技術(shù)領(lǐng)域,更具體的,涉及一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法及系統(tǒng)。
背景技術(shù):
在現(xiàn)代存儲系統(tǒng)中緩存加載和熱點數(shù)據(jù)統(tǒng)計都具有滯后性,一般都是數(shù)據(jù)被訪問一次或者多次之后才會被加載到緩存,才會知道這是數(shù)據(jù)熱點,才會進(jìn)行被加速加載,影響了系統(tǒng)的整體性能和用戶體驗。
另外有一些老熱點數(shù)據(jù)遲遲不釋放緩存,這些老熱點數(shù)據(jù)由于在過去的時間段經(jīng)常被訪問所以被加載到緩存,但在當(dāng)前和未來時間段,這些老熱點數(shù)據(jù)不再經(jīng)常被訪問但是仍然存儲在緩存中,導(dǎo)致緩存擁擠,新的熱點數(shù)據(jù)無法加入到緩存,影響系統(tǒng)性能的提升。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明提供了一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法及裝置,基于多層神經(jīng)網(wǎng)絡(luò)模型預(yù)設(shè)下一時間的熱點數(shù)據(jù),提升了系統(tǒng)性能和用戶的使用體驗。
為了實現(xiàn)上述發(fā)明目的,本發(fā)明提供的具體的技術(shù)方案如下:
一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法,包括:
獲取監(jiān)督數(shù)據(jù)集,所述監(jiān)督數(shù)據(jù)集以預(yù)設(shè)時間單位為單位記錄了預(yù)設(shè)時間段內(nèi)用戶的訪問數(shù)據(jù);
以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;
對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。
優(yōu)選的,在所述依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)之后,所述方法還包括:
根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷每個下一預(yù)設(shè)時間單位的熱點數(shù)據(jù)是否已加載到緩存;
若否,將下一預(yù)設(shè)時間單位未加載到緩存的熱點數(shù)據(jù)加載到緩存。
優(yōu)選的,在所述依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)之后,所述方法還包括:
根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷緩存中的數(shù)據(jù)是否為下一預(yù)設(shè)時間單位的熱點數(shù)據(jù);
若否,對緩存中不是下一預(yù)設(shè)時間單位的數(shù)據(jù)進(jìn)行卸載。
優(yōu)選的,所述獲取監(jiān)督數(shù)據(jù)集,包括:
在所述預(yù)設(shè)時間段內(nèi),分別獲取每個所述預(yù)設(shè)時間單位內(nèi)用戶訪問數(shù)據(jù)在所述存儲系統(tǒng)中的位置和訪問頻次;
根據(jù)每個所述預(yù)設(shè)時間單位內(nèi)的數(shù)據(jù)位置和訪問頻次,生成監(jiān)督數(shù)據(jù)集。
優(yōu)選的,所述對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù),包括:
按照遍歷順序,依次將存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)的時間參數(shù)和位置參數(shù)輸入所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,每個所述數(shù)據(jù)的時間參數(shù)為下一預(yù)設(shè)時間單位,每個所述數(shù)據(jù)的位置參數(shù)為在所述存儲系統(tǒng)中的相應(yīng)位置;
獲取與每個所述數(shù)據(jù)相對應(yīng)的所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果,所述輸出結(jié)果為訪問或未訪問,當(dāng)輸出結(jié)果為訪問時,相應(yīng)的所述數(shù)據(jù)為熱點數(shù)據(jù)。
一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測系統(tǒng),包括:
獲取單元,用于獲取監(jiān)督數(shù)據(jù)集,所述監(jiān)督數(shù)據(jù)集以預(yù)設(shè)時間單位為單位記錄了預(yù)設(shè)時間段內(nèi)用戶的訪問數(shù)據(jù);
訓(xùn)練單元,用于以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;
預(yù)測單元,用于對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。
優(yōu)選的,所述系統(tǒng)還包括:
第一判斷單元,用于根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷每個下一預(yù)設(shè)時間單位的熱點數(shù)據(jù)是否已加載到緩存;若否,將下一預(yù)設(shè)時間單位未加載到緩存的熱點數(shù)據(jù)加載到緩存。
優(yōu)選的,所述系統(tǒng)還包括:
第二判斷單元,用于根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷緩存中的數(shù)據(jù)是否為下一預(yù)設(shè)時間單位的熱點數(shù)據(jù);
若否,對緩存中不是下一預(yù)設(shè)時間單位的數(shù)據(jù)進(jìn)行卸載。
優(yōu)選的,所述獲取單元包括:
第一獲取子單元,用于在所述預(yù)設(shè)時間段內(nèi),分別獲取每個所述預(yù)設(shè)時間單位內(nèi)用戶訪問數(shù)據(jù)在所述存儲系統(tǒng)中的位置和訪問頻次;
生成子單元,用于根據(jù)每個所述預(yù)設(shè)時間單位內(nèi)的數(shù)據(jù)位置和訪問頻次,生成監(jiān)督數(shù)據(jù)集。
優(yōu)選的,所述預(yù)測單元包括:
輸入子單元,用于按照遍歷順序,依次將存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)的時間參數(shù)和位置參數(shù)輸入所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,每個所述數(shù)據(jù)的時間參數(shù)為下一預(yù)設(shè)時間單位,每個所述數(shù)據(jù)的位置參數(shù)為在所述存儲系統(tǒng)中的相應(yīng)位置;
第二獲取子單元,用于獲取與每個所述數(shù)據(jù)相對應(yīng)的所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果,所述輸出結(jié)果為訪問或未訪問,當(dāng)輸出結(jié)果為訪問時,相應(yīng)的所述數(shù)據(jù)為熱點數(shù)據(jù)。
相對于現(xiàn)有技術(shù),本發(fā)明的有益效果如下:
本發(fā)明提供的一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法,首先獲取用戶在預(yù)設(shè)時間段內(nèi)的歷史訪問記錄作為監(jiān)督數(shù)據(jù)集,然后以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;最后對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。本發(fā)明根據(jù)用戶的歷史訪問記錄,有效的預(yù)測將來用戶可能要訪問的數(shù)據(jù),提前加載下一時間單位的熱點數(shù)據(jù),使用戶實際訪問該熱點數(shù)據(jù)時,該熱點數(shù)據(jù)已經(jīng)被加載到緩存,快速向用戶反饋用戶所要訪問的數(shù)據(jù),改善了用戶使用體驗。同時,提前卸載緩存中下一時間單位的非熱點數(shù)據(jù),提高了緩存的利用效率,提升了系統(tǒng)性能。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實施例公開的一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法流程圖;
圖2為本發(fā)明實施例公開的另一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法流程圖;
圖3為本發(fā)明實施例公開的一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測系統(tǒng)結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
請參閱圖1,本實施例公開了一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法,具體包括以下步驟:
s101:獲取監(jiān)督數(shù)據(jù)集;
所述監(jiān)督數(shù)據(jù)集以預(yù)設(shè)時間單位為單位記錄了預(yù)設(shè)時間段內(nèi)用戶的訪問數(shù)據(jù)。
所述預(yù)設(shè)時間段為當(dāng)前時間之前的某段時間,可以為一周、一個月等等。
預(yù)設(shè)時間單位為監(jiān)督數(shù)據(jù)集的數(shù)據(jù)存儲單位,可以為分鐘等時間單位。
優(yōu)選的,s101的具體執(zhí)行過程如下:
在所述預(yù)設(shè)時間段內(nèi),分別獲取每個所述預(yù)設(shè)時間單位內(nèi)用戶訪問數(shù)據(jù)在所述存儲系統(tǒng)中的位置和訪問頻次;
根據(jù)每個所述預(yù)設(shè)時間單位內(nèi)的數(shù)據(jù)位置和訪問頻次,生成監(jiān)督數(shù)據(jù)集。
可以理解的是,所述監(jiān)督數(shù)據(jù)集包含了所述預(yù)設(shè)時間段內(nèi)每個預(yù)設(shè)時間單位的所有被用戶訪問的數(shù)據(jù)。
需要說明的是,所述監(jiān)督數(shù)據(jù)集中數(shù)據(jù)對應(yīng)的時間要素包括:年、月、日、星期、時、分、秒、是否節(jié)假日。若所述預(yù)設(shè)時間段為一周,則年、月日可不必輸入,若所述預(yù)設(shè)時間單位為分鐘,則秒可以不必輸入,這樣可以減少計算量。
所述監(jiān)督數(shù)據(jù)集中數(shù)據(jù)對應(yīng)的位置為該數(shù)據(jù)在某個陣列柜、某塊硬盤、某個lba(logicalblockaddress,邏輯區(qū)塊地址)位置,以及該數(shù)據(jù)屬于的卷信息和host主機信息。
s102:以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;
對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,主要是對多層神經(jīng)網(wǎng)絡(luò)模型權(quán)重的調(diào)整。
訓(xùn)練過程中,多層神經(jīng)網(wǎng)絡(luò)模型的輸入數(shù)據(jù)為監(jiān)督數(shù)據(jù)集中數(shù)據(jù)的時間參數(shù)和位置參數(shù),即,監(jiān)督數(shù)據(jù)集中數(shù)據(jù)對應(yīng)的訪問時間(以預(yù)設(shè)時間單位為單位)和在存儲系統(tǒng)中的位置,多層神經(jīng)網(wǎng)絡(luò)模型的輸出數(shù)據(jù)為訪問和未訪問。
通過判斷多層神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果與監(jiān)督數(shù)據(jù)集中數(shù)據(jù)的實際訪問情況是否一致,可以判定多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測準(zhǔn)確率。即,當(dāng)向多層神經(jīng)網(wǎng)絡(luò)模型輸入監(jiān)督數(shù)據(jù)集中數(shù)據(jù)s的時間參數(shù)和位置參數(shù)時,所述多層神經(jīng)網(wǎng)絡(luò)模型輸出結(jié)果為訪問,若實際情況中數(shù)據(jù)s在時間參數(shù)對應(yīng)的預(yù)設(shè)時間單位內(nèi)被訪問,則所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測準(zhǔn)確,反之,則所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測錯誤。
當(dāng)所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值時,停止對所述多層神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型。所述閾值可以根據(jù)實際需要預(yù)先進(jìn)行設(shè)定。
還需要說明的是,當(dāng)當(dāng)前目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型已不能準(zhǔn)確對未來時間段的熱點數(shù)據(jù)進(jìn)行預(yù)測時,需要重新獲取新的監(jiān)督數(shù)據(jù)集,對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到新的目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型??梢岳斫獾氖牵煌谋O(jiān)督數(shù)據(jù)集對應(yīng)不用的目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型。
s103:對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。
優(yōu)選的,s103的具體執(zhí)行方式為:
按照遍歷順序,依次將存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)的時間參數(shù)和位置參數(shù)輸入所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,每個所述數(shù)據(jù)的時間參數(shù)為下一預(yù)設(shè)時間單位,每個所述數(shù)據(jù)的位置參數(shù)為在所述存儲系統(tǒng)中的相應(yīng)位置;
獲取與每個所述數(shù)據(jù)相對應(yīng)的所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果,所述輸出結(jié)果為訪問或未訪問,當(dāng)輸出結(jié)果為訪問時,相應(yīng)的所述數(shù)據(jù)為熱點數(shù)據(jù)。
需要說明的是,本實施例將所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型輸出結(jié)果為訪問的數(shù)據(jù)定義為熱點數(shù)據(jù)。
所述遍歷順序可以為任意一種遍歷順序,當(dāng)然,出于優(yōu)化角度,可以預(yù)先設(shè)計遍歷順序,以提高遍歷速度。
作為本實施例的一種優(yōu)選的實時方案,請參閱圖2,在s103之后,所述方法還包括:
s104:根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷每個下一預(yù)設(shè)時間單位的熱點數(shù)據(jù)是否已加載到緩存;若否,將下一預(yù)設(shè)時間單位未加載到緩存的熱點數(shù)據(jù)加載到緩存。
需要說明的是,若下一預(yù)設(shè)時間單位的熱點數(shù)據(jù)已經(jīng)加載到緩存則不需要重新加載。
s105:根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷緩存中的數(shù)據(jù)是否為下一預(yù)設(shè)時間單位的熱點數(shù)據(jù);若否,對緩存中不是下一預(yù)設(shè)時間單位的數(shù)據(jù)進(jìn)行卸載。
可以理解的是,當(dāng)緩存中的數(shù)據(jù)為下一預(yù)設(shè)時間單位的熱點數(shù)據(jù),則不需要卸載數(shù)據(jù)。
本實施例提供的一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法,首先獲取用戶在預(yù)設(shè)時間段內(nèi)的歷史訪問記錄作為監(jiān)督數(shù)據(jù)集,然后以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;最后對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。本實施例根據(jù)用戶的歷史訪問記錄,有效的預(yù)測將來用戶可能要訪問的數(shù)據(jù),提前加載下一時間單位的熱點數(shù)據(jù),使用戶實際訪問該熱點數(shù)據(jù)時,該熱點數(shù)據(jù)已經(jīng)被加載到緩存,快速向用戶反饋用戶所要訪問的數(shù)據(jù),改善了用戶使用體驗。同時,提前卸載緩存中下一時間單位的非熱點數(shù)據(jù),提高了緩存的利用效率,提升了系統(tǒng)性能。
基于上述實施例公開的基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測方法,請參閱圖3,本實施例對應(yīng)公開了一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測系統(tǒng),包括:
獲取單元101,用于獲取監(jiān)督數(shù)據(jù)集,所述監(jiān)督數(shù)據(jù)集以預(yù)設(shè)時間單位為單位記錄了預(yù)設(shè)時間段內(nèi)用戶的訪問數(shù)據(jù);
優(yōu)選的,所述獲取單元101包括:
第一獲取子單元,用于在所述預(yù)設(shè)時間段內(nèi),分別獲取每個所述預(yù)設(shè)時間單位內(nèi)用戶訪問數(shù)據(jù)在所述存儲系統(tǒng)中的位置和訪問頻次;
生成子單元,用于根據(jù)每個所述預(yù)設(shè)時間單位內(nèi)的數(shù)據(jù)位置和訪問頻次,生成監(jiān)督數(shù)據(jù)集。
訓(xùn)練單元102,用于以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;
預(yù)測單元103,用于對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。
優(yōu)選的,所述預(yù)測單元103包括:
輸入子單元,用于按照遍歷順序,依次將存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)的時間參數(shù)和位置參數(shù)輸入所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,每個所述數(shù)據(jù)的時間參數(shù)為下一預(yù)設(shè)時間單位,每個所述數(shù)據(jù)的位置參數(shù)為在所述存儲系統(tǒng)中的相應(yīng)位置;
第二獲取子單元,用于獲取與每個所述數(shù)據(jù)相對應(yīng)的所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果,所述輸出結(jié)果為訪問或未訪問,當(dāng)輸出結(jié)果為訪問時,相應(yīng)的所述數(shù)據(jù)為熱點數(shù)據(jù)。
優(yōu)選的,所述系統(tǒng)還包括:
第一判斷單元,用于根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷每個下一預(yù)設(shè)時間單位的熱點數(shù)據(jù)是否已加載到緩存;若否,將下一預(yù)設(shè)時間單位未加載到緩存的熱點數(shù)據(jù)加載到緩存。
第二判斷單元,用于根據(jù)所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果,依次判斷緩存中的數(shù)據(jù)是否為下一預(yù)設(shè)時間單位的熱點數(shù)據(jù);若否,對緩存中不是下一預(yù)設(shè)時間單位的數(shù)據(jù)進(jìn)行卸載。
本實施例提供的一種基于神經(jīng)網(wǎng)絡(luò)的熱點數(shù)據(jù)的預(yù)測系統(tǒng),首先獲取用戶在預(yù)設(shè)時間段內(nèi)的歷史訪問記錄作為監(jiān)督數(shù)據(jù)集,然后以所述監(jiān)督數(shù)據(jù)集為訓(xùn)練數(shù)據(jù),對多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到所述多層神經(jīng)網(wǎng)絡(luò)模型預(yù)測熱點數(shù)據(jù)的準(zhǔn)確率大于閾值,得到目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型;最后對存儲系統(tǒng)當(dāng)前存儲的多個數(shù)據(jù)進(jìn)行遍歷,基于所述目標(biāo)多層神經(jīng)網(wǎng)絡(luò)模型,依次判斷所述存儲系統(tǒng)當(dāng)前存儲的每個數(shù)據(jù)在下一預(yù)設(shè)時間單位是否為熱點數(shù)據(jù)。本實施例根據(jù)用戶的歷史訪問記錄,有效的預(yù)測將來用戶可能要訪問的數(shù)據(jù),提前加載下一時間單位的熱點數(shù)據(jù),使用戶實際訪問該熱點數(shù)據(jù)時,該熱點數(shù)據(jù)已經(jīng)被加載到緩存,快速向用戶反饋用戶所要訪問的數(shù)據(jù),改善了用戶使用體驗。同時,提前卸載緩存中下一時間單位的非熱點數(shù)據(jù),提高了緩存的利用效率,提升了系統(tǒng)性能。
對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。