基于大數(shù)據(jù)搜索的個性化推薦方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及搜索技術(shù)領(lǐng)域,特別是涉及一種基于大數(shù)據(jù)搜索的個性化推薦方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著推薦技術(shù)的快速發(fā)展,用戶對推薦結(jié)果的要求也越來越高。個性化推薦是推薦技術(shù)的最重要內(nèi)容之一?,F(xiàn)有的個性化推薦是根據(jù)用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。隨著電子商務(wù)規(guī)模的不斷擴大,商品個數(shù)和種類快速增長,顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關(guān)的信息和產(chǎn)品過程無疑會使淹沒在信息過載問題中的消費者不斷流失。為了解決這些問題,個性化推薦系統(tǒng)應(yīng)運而生。個性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級商務(wù)智能平臺,以幫助電子商務(wù)網(wǎng)站為其顧客購物提供完全個性化的決策支持和信息服務(wù)。
[0003]現(xiàn)有個性化推薦是基于某個信息平臺或信息系統(tǒng)內(nèi)部的海量數(shù)據(jù)做出的,譬如淘寶的商品推薦系統(tǒng)是基于淘寶信息平臺里的海量數(shù)據(jù)進(jìn)行推薦的,又譬如當(dāng)當(dāng)網(wǎng)的推薦系統(tǒng)是基于當(dāng)當(dāng)網(wǎng)信息平臺里的海量數(shù)據(jù)進(jìn)行推薦的。各個信息平臺或信息系統(tǒng)里的數(shù)據(jù)量雖然很大,但相互之間沒有融合,所以形成了數(shù)據(jù)孤島,相對于互聯(lián)網(wǎng)上的大數(shù)據(jù)而言,某個信息平臺或信息系統(tǒng)內(nèi)部的海量數(shù)據(jù)只能稱得上是小數(shù)據(jù),導(dǎo)致了現(xiàn)有推薦系統(tǒng)主要有以下問題:
[0004](I)現(xiàn)有推薦技術(shù)在向一個用戶進(jìn)行推薦時需要參考該個用戶的以往購買行為,對新用戶而言,沒有足夠的購買行為的歷史數(shù)據(jù)可以供推薦系統(tǒng)參考;
[0005](2)現(xiàn)有推薦技術(shù)在向一個用戶進(jìn)行推薦時需要參考與該個用戶類似的同類用戶的購買行為,而另類用戶的需求往往與一般用戶不同;
[0006](3)現(xiàn)有推薦系統(tǒng)是根據(jù)用戶的興趣特點和購買行為進(jìn)行推薦的,而用戶的興趣特點和購買行為是從用戶的購買歷史數(shù)據(jù)中挖掘出來的,雖然用戶的興趣特點和購買行為也屬于用戶的屬性,但這些用戶屬性信息是從用戶的購買歷史數(shù)據(jù)中挖掘出來的,屬于用戶在購買時的屬性,而用戶購買屬性之外的用戶屬性信息卻沒有被現(xiàn)有推薦技術(shù)所考慮和利用。
[0007]綜上所述,現(xiàn)有推薦系統(tǒng)推薦,準(zhǔn)確率無法突破現(xiàn)有的瓶頸,準(zhǔn)確率低。
【發(fā)明內(nèi)容】
[0008]基于此,有必要針對現(xiàn)有技術(shù)準(zhǔn)確率低的問題,提供一種基于大數(shù)據(jù)搜索的個性化推薦方法和系統(tǒng)。
[0009 ] 一種個性化推薦方法,包括以下步驟:
[0010]對預(yù)先從推薦系統(tǒng)獲取到的推薦信息進(jìn)行篩選,得到初始推薦信息;
[0011]分別以各個初始推薦信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的NI條第一搜索結(jié)果,分別以各個初始推薦信息與預(yù)先獲取的用戶屬性信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的N2條第二搜索結(jié)果;
[0012]根據(jù)各個初始推薦信息的NI與N2的比值對所述初始推薦信息進(jìn)行篩選,得到推薦結(jié)果。
[0013]一種個性化推薦系統(tǒng),包括:
[0014]第一篩選模塊,用于對預(yù)先從推薦系統(tǒng)獲取到的推薦信息進(jìn)行篩選,得到初始推薦信息;
[0015]搜索模塊,用于分別以各個初始推薦信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的NI條第一搜索結(jié)果,分別以各個初始推薦信息與預(yù)先獲取的用戶屬性信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的N2條第二搜索結(jié)果;
[0016]第二篩選模塊,用于根據(jù)各個初始推薦信息的NI與N2的比值對所述初始推薦信息進(jìn)行篩選,得到推薦結(jié)果。
[0017]上述個性化推薦方法和系統(tǒng),通過對預(yù)先從推薦系統(tǒng)獲取到的推薦信息進(jìn)行篩選,得到初始推薦信息;分別以各個初始推薦信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的NI條第一搜索結(jié)果,分別以各個初始推薦信息與預(yù)先獲取的用戶屬性信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的N2條第二搜索結(jié)果;根據(jù)各個初始推薦信息的NI與N2的比值對所述初始推薦信息進(jìn)行篩選,得到推薦結(jié)果,極大提高了推薦結(jié)果與用戶屬性的契合度,滿足了用戶的個性化推薦的需要,提高推薦的準(zhǔn)確率,提高了用戶對推薦結(jié)果的采納率,提升了推薦系統(tǒng)對用戶的價值。
【附圖說明】
[0018]圖1為一個實施例的個性化推薦方法流程圖;
[0019]圖2為一個實施例的個性化推薦系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0020]下面結(jié)合附圖對本發(fā)明的個性化推薦方法和系統(tǒng)的實施例進(jìn)行描述。
[0021]圖1為一個實施例的個性化推薦方法流程圖。如圖1所示,所述個性化推薦方法可包括以下步驟:
[0022]步驟SI,對預(yù)先從推薦系統(tǒng)獲取到的推薦信息進(jìn)行篩選,得到初始推薦信息;
[0023]其中,所述推薦系統(tǒng)可以是現(xiàn)有的各種推薦系統(tǒng),也可以是新開發(fā)的推薦系統(tǒng);從推薦系統(tǒng)獲取到的推薦信息可以是各種類型的推薦信息,譬如,商品推薦信息、服裝推薦信息、圖書推薦信息、視頻推薦信息、圖片推薦信息、論文推薦信息或好友推薦信息等。
[0024]假設(shè)從推薦系統(tǒng)獲取到的推薦信息的數(shù)量為P,初始推薦信息的數(shù)量為N,則N小于或等于P??捎嬎泐A(yù)先從推薦系統(tǒng)獲取到的推薦信息的數(shù)量;將所述數(shù)量與預(yù)設(shè)的數(shù)量閾值進(jìn)行比較;若所述數(shù)量大于所述數(shù)量閾值,可從預(yù)先從推薦系統(tǒng)獲取到的推薦信息中選擇N條推薦信息,設(shè)為初始推薦信息。通過這種方式,可以避免P的數(shù)值較大時造成后續(xù)處理花費時間過長、處理復(fù)雜度過高的問題,有效提高了后續(xù)對推薦信息的處理效率,節(jié)約了處理時間。
[0025]步驟S2,分別以各個初始推薦信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的NI條第一搜索結(jié)果,分別以各個初始推薦信息與預(yù)先獲取的用戶屬性信息為搜索信息在搜索引擎中進(jìn)行搜索,得到對應(yīng)的N2條第二搜索結(jié)果;
[0026]例如,假設(shè)初始推薦信息的數(shù)量為N=3,分別以3條初始推薦信息為搜索信息在搜索引擎中進(jìn)行搜索,得到的第一搜索結(jié)果的數(shù)量分別為Nl = 30、40和50。假設(shè)分別以3條初始推薦信息與預(yù)先獲取的用戶屬性信息為搜索信息在搜索引擎中進(jìn)行搜索,得到的第二搜索結(jié)果的數(shù)量分別為N2 = 10、15和35 ο可將上述NI和N2代入后續(xù)步驟。
[0027]所述搜索引擎可以是一種大數(shù)據(jù)搜索引擎,還可以是互聯(lián)網(wǎng)搜索引擎(譬如谷歌、百度等),還可以是基于語料庫的搜索引擎,還可以是其他類型的信息搜索引擎。搜索是調(diào)用搜索引擎自動完成的。
[0028]所述用戶屬性信息包括用戶的年齡、性別、職業(yè)、學(xué)歷、專業(yè)、特長、愛好和地理位置等信息。
[0029]獲取用戶屬性信息的方式可以是獲取搜索引擎上登錄的注冊賬戶;提取所述賬戶相關(guān)聯(lián)的用戶屬性信息。獲取用戶屬性信息的方式還可以是彈出信息輸入界面;接收用戶在所述信息輸入界面中輸入的用戶屬性信息。初始推薦信息與所述用戶屬性組合的方式是將用戶屬性組追加到初始推薦信息之后。
[0030]步驟S3,根據(jù)各個初始推薦信息的NI與N2的比值對所述初始推薦信息進(jìn)行篩選,得到推薦結(jié)果。具體講,可以根據(jù)以下方式獲取推薦結(jié)果:
[0031 ]步驟S31,計算各個初始推薦信息的NI與N2的比值N1/N2;
[0032]步驟S32,對所述比值進(jìn)行排序,得到所述比值對應(yīng)的序列;
[0033]步驟S33,選擇所述序列中的排序靠前的M個比值,并將所述M個比值對應(yīng)的初始推薦信息設(shè)為推薦結(jié)果;其中,M小于N小于或等于P,N為初始推薦信息的數(shù)量,P為預(yù)先從推薦系統(tǒng)獲取到的推薦信息的數(shù)量。
[0034]在得到所述推薦結(jié)果之后,可將所述推薦結(jié)果輸出給用戶。
[0035]其中,將最終推薦結(jié)果輸出給用戶的方式可以是現(xiàn)有推薦系統(tǒng)所采用的方式,也可以采用其他的信息輸出方式,譬如,如網(wǎng)頁的方式、文件的方式。
[0036]其中,當(dāng)所述推薦系統(tǒng)向多個用戶推薦所述推薦結(jié)果,則可針對所述多個用戶執(zhí)行多次所述個性化推薦方法;當(dāng)所述推薦系統(tǒng)多次向一個用戶推薦多個推薦結(jié)果,則針對所述多次執(zhí)行多次所述個性化推薦方法;所述推薦結(jié)果的序列是有序的,是按照N2的值從大到小進(jìn)行排序的。N2的值反映了各個初始推薦信息與用戶屬性的契合度。某條初始推薦信息的N2值越大,表明用戶對該推薦信息的認(rèn)同度越高,反之,某條初始推薦信息的N2值越小,表明用戶對該推薦信息的認(rèn)同度越低。
[0037]NI與N2的比值N1/N2反映了用戶屬性引起用戶對初始推薦信息的認(rèn)同度的變化。某條初始推薦信息N1/N2的值越大,表明該初始推薦信息引起用戶對初始推薦信息的認(rèn)同度的變化越大,從而說明初始推薦信息