本發(fā)明涉及智能推薦
技術(shù)領(lǐng)域:
,具體涉及一種基于大數(shù)據(jù)的智能推薦系統(tǒng)。
背景技術(shù):
:現(xiàn)有的針對用戶的智能推薦系統(tǒng),基本都是根據(jù)用戶的歷史記錄,推薦相似的條目給用戶,若用戶的歷史記錄空白,則無法向客戶進(jìn)行有效推薦。大數(shù)據(jù)庫上的用戶觀點數(shù)據(jù)有著非常重要的研究價值以及商業(yè)價值,因此逐漸受到人們的重視。情感分類作為觀點挖掘中的重要任務(wù),對情感分類的研究顯得尤為重要。情感分類的主要任務(wù)是將包含主觀性文字的文本劃分到不同類別中,現(xiàn)有的情感分類方法存在分類準(zhǔn)確率差、分類速度慢等缺陷,無法滿足日益提高的情感分類要求。技術(shù)實現(xiàn)要素:針對上述問題,本發(fā)明旨在提供一種基于大數(shù)據(jù)的智能推薦系統(tǒng)。本發(fā)明的目的采用以下技術(shù)方案來實現(xiàn):提供了一種基于大數(shù)據(jù)的智能推薦系統(tǒng),包括大數(shù)據(jù)庫、用戶消費(fèi)數(shù)據(jù)庫和推薦子系統(tǒng);所述大數(shù)據(jù)庫用于存儲交通數(shù)據(jù)、酒店數(shù)據(jù)、餐飲數(shù)據(jù)及交通數(shù)據(jù)、酒店數(shù)據(jù)、餐飲數(shù)據(jù)的評價數(shù)據(jù);所述用戶消費(fèi)數(shù)據(jù)庫用于記錄用戶歷史消費(fèi)記錄;所述推薦子系統(tǒng)用于向用戶提供推薦項,對于任一領(lǐng)域消費(fèi),當(dāng)用戶有該領(lǐng)域的歷史消費(fèi)記錄時,根據(jù)用戶歷史消費(fèi)記錄和所述大數(shù)據(jù)庫向用戶提供推薦項,當(dāng)用戶無該領(lǐng)域歷史消費(fèi)記錄時,根據(jù)所述大數(shù)據(jù)庫向用戶提供推薦項。本發(fā)明的有益效果為:對于任一領(lǐng)域消費(fèi),能夠向用戶提供該領(lǐng)域推薦項。附圖說明利用附圖對本發(fā)明作進(jìn)一步說明,但附圖中的實施例不構(gòu)成對本發(fā)明的任何限制,對于本領(lǐng)域的普通技術(shù)人員,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)以下附圖獲得其它的附圖。圖1是本發(fā)明的結(jié)構(gòu)示意圖;圖2是本發(fā)明推薦子系統(tǒng)的結(jié)構(gòu)示意圖。附圖標(biāo)記:大數(shù)據(jù)庫1、用戶消費(fèi)數(shù)據(jù)庫2、推薦子系統(tǒng)3、特征提取模塊31、特征篩選模塊32、文本建模模塊33、情感分類模塊34。具體實施方式結(jié)合以下實施例對本發(fā)明作進(jìn)一步描述。參見圖1、圖2,本實施例的一種基于大數(shù)據(jù)的智能推薦系統(tǒng),包括大數(shù)據(jù)庫1、用戶消費(fèi)數(shù)據(jù)庫2和推薦子系統(tǒng)3;所述大數(shù)據(jù)庫1用于存儲交通數(shù)據(jù)、酒店數(shù)據(jù)、餐飲數(shù)據(jù)及交通數(shù)據(jù)、酒店數(shù)據(jù)、餐飲數(shù)據(jù)的評價數(shù)據(jù);所述用戶消費(fèi)數(shù)據(jù)庫2用于記錄用戶歷史消費(fèi)記錄;所述推薦子系統(tǒng)3用于向用戶提供推薦項,對于任一領(lǐng)域消費(fèi),當(dāng)用戶有該領(lǐng)域的歷史消費(fèi)記錄時,根據(jù)用戶歷史消費(fèi)記錄和所述大數(shù)據(jù)庫1向用戶提供推薦項,當(dāng)用戶無該領(lǐng)域歷史消費(fèi)記錄時,根據(jù)所述大數(shù)據(jù)庫1向用戶提供推薦項。本實施例對于任一領(lǐng)域消費(fèi),能夠向用戶提供該領(lǐng)域推薦項。優(yōu)選的,所述交通數(shù)據(jù)是與航班時刻、航班類型、航空公司、鐵路時刻、火車類型、火車座位有關(guān)的數(shù)據(jù),所述酒店數(shù)據(jù)是與酒店名稱、酒店位置、酒店級別、酒店入住率、酒店特色服務(wù)、酒店相關(guān)交通有關(guān)的數(shù)據(jù),所述餐飲數(shù)據(jù)是與餐館位置、餐館類型、餐館評價、餐館菜系、餐館特色有關(guān)的數(shù)據(jù)。本優(yōu)選實施例大數(shù)據(jù)庫提供了豐富的數(shù)據(jù)資源。優(yōu)選的,所述大數(shù)據(jù)庫1向用戶提供推薦項根據(jù)評價數(shù)據(jù)的情感分類進(jìn)行。本優(yōu)選實施例根據(jù)情感分類向用戶提供推薦項,能夠提高用戶滿意度。優(yōu)選的,所述推薦子系統(tǒng)3能夠?qū)Υ髷?shù)據(jù)庫中的評價數(shù)據(jù)進(jìn)行情感分類,包括特征提取模塊31、特征篩選模塊32、文本建模模塊33和情感分類模塊34,所述特征提取模塊31用于對評價數(shù)據(jù)中的文本包含的情感特征進(jìn)行提取,所述征篩選模塊32用于對提取的特征進(jìn)行篩選,所述文本建模模塊33用于根據(jù)篩選后的特征建立評價數(shù)據(jù)的文本模型,所述情感分類模塊34用于根據(jù)文本模型對大數(shù)據(jù)庫中的評價數(shù)據(jù)進(jìn)行分類。所述特征篩選模塊32包括第一篩選單元和第二篩選單元,所述第一篩選單元對提取的特征進(jìn)行初步篩選,得到初步篩選的特征,所述第二篩選單元對初步篩選的特征進(jìn)行進(jìn)一步篩選,得到最終篩選的特征。所述對提取的特征進(jìn)行初步篩選采用以下步驟進(jìn)行:a、令w={w1,w2,…,wn}表示所有文本的集合,wi∈w表示集合中一個文本,n表示文本總數(shù),c={c1,c2,…,ck}表示文本分類集合,ci∈c表示集合中一個分類,k表示分類的總數(shù),f0={f1,f2,…,fm}表示任意文本wi包含的特征集合,fi∈f0表示集合中一個特征,m表示特征總數(shù);b、建立初步篩選函數(shù)dy:式中,表示特征fi初步篩選函數(shù)值,wip(fi)表示特征fi在文本wi中出現(xiàn)的次數(shù),設(shè)定閾值dy1,若則對特征予以保留,否則將特征過濾掉,得到初步篩選的特征。所述對初步篩選的特征進(jìn)行進(jìn)一步篩選采用以下步驟進(jìn)行:a、對于任意ci∈c,建立最終篩選函數(shù)de:式中,de(ci,fi)表示特征fi最終篩選函數(shù)值,z(ci,fi)表示訓(xùn)練樣本中的文本中包含特征fi且被劃分為ci的文本數(shù),表示訓(xùn)練樣本中的文本中不包含特征fi且不被劃分為ci的文本數(shù),表示訓(xùn)練樣本中的文本中包含特征fi且不被劃分為ci的文本數(shù),表示訓(xùn)練樣本中的文本中不包含特征fi且被劃分為ci的文本數(shù);b、設(shè)定閾值de1,若de(ci,fi)>de1,則對特征予以保留,否則將特征過濾掉,得到最終篩選的特征。由于文本包含大量特征,將所有特征用于文本建模既耗時又易造成過度擬合,本優(yōu)選實施例推薦子系統(tǒng)設(shè)置特征篩選模塊對文本特征進(jìn)行提取,抽取合適的特征集合來刻畫文本,能夠提高計算效率,減少工作時間,采用第一篩選單元和第二篩選單元對特征進(jìn)行兩次篩選,對多余的特征進(jìn)行兩次濾除,得到的特征更加符合實際應(yīng)用的需求。優(yōu)選的,所述文本模型采用以下方式建立:設(shè)文本集合為w,w={w1,w2,…,wn},其中,n表示文本數(shù)量,將集合中任意文本wi表示成一系列特征的集合f,計算每個特征對文本的重要程度,完成文本建模,其中,f={f1,f2,…,fm},f表示最終篩選的特征集合,m表示特征數(shù)量;計算每個特征對文本的重要程度,具體采用重要性程度指標(biāo)zc衡量特征對文本的重要性程度:式中,表示特征fi對文本wi的重要性程度指標(biāo)值,wip(fi)表示特征fi在文本wi中出現(xiàn)的次數(shù),表示文本wi中包含的所有特征出現(xiàn)次數(shù)總和,wd(fi)表示特征fi在文本集合w中出現(xiàn)的次數(shù)。本優(yōu)選實施例推薦子系統(tǒng)文本建模模塊的文本模型簡單、算法復(fù)雜度低,采用重要性程度指標(biāo)來衡量特征對文本的重要性程度,有助于后續(xù)評價數(shù)據(jù)分類快速準(zhǔn)確進(jìn)行。優(yōu)選的,所述根據(jù)文本模型對大數(shù)據(jù)庫中的評價數(shù)據(jù)進(jìn)行分類采用以下步驟進(jìn)行:a、確定分類指標(biāo)函數(shù):式中,p(c|wi)表示文本wi被劃分為c類的指標(biāo)值,c表示分類的類標(biāo),ρ(fj,c)表示指示函數(shù),當(dāng)訓(xùn)練樣本中文本的特征fj與類標(biāo)同時出現(xiàn)時值為1,否則為0;b、選取指標(biāo)值最大的類別作為評價數(shù)據(jù)的最終類別。本優(yōu)選實施例推薦子系統(tǒng)情感分類模塊通過分類指標(biāo)函數(shù)實現(xiàn)了對文本的分類,分類過程中引入指示函數(shù),獲取的文本類結(jié)果更為準(zhǔn)確,從而獲取了更為準(zhǔn)確的評價數(shù)據(jù)分類結(jié)果。采用本發(fā)明基于大數(shù)據(jù)的智能推薦系統(tǒng)向用戶提供推薦項,當(dāng)推薦項數(shù)目取不同值時,對推薦準(zhǔn)確性和推薦時間進(jìn)行統(tǒng)計,同未采用本發(fā)明相比,產(chǎn)生的有益效果如下表所示:推薦項數(shù)目推薦準(zhǔn)確性提高推薦時間減少510%18%615%23%720%25%824%28%931%32%最后應(yīng)當(dāng)說明的是,以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對本發(fā)明保護(hù)范圍的限制,盡管參照較佳實施例對本發(fā)明作了詳細(xì)地說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的實質(zhì)和范圍。當(dāng)前第1頁12