本發(fā)明涉及計算機應(yīng)用
技術(shù)領(lǐng)域:
,尤其涉及一種基于混合多種模式的廢舊行業(yè)推薦系統(tǒng)以及其方法。
背景技術(shù):
:目前,隨著網(wǎng)絡(luò)信息量爆炸式的遞增,消費者面臨眾多選擇、未知的領(lǐng)域、過載的信息時,往往無所適從;然而與此同時,產(chǎn)品的商家也在苦苦尋覓合適的用戶,尋找最便捷的渠道,而解決這兩類矛盾的最好工具就是推薦系統(tǒng)。數(shù)據(jù)是一切推薦系統(tǒng)的基礎(chǔ)。準(zhǔn)確的數(shù)據(jù)對于良好的推薦效果,如同一片文章的標(biāo)題對于文章內(nèi)容的作用。基于模型的協(xié)同過濾推薦,基于樣本的用戶喜好信息,訓(xùn)練一個推薦模型,然后根據(jù)實時的用戶喜好的信息進行預(yù)測,計算推薦,這種方法對于一些特殊品味的用戶不能給予很好的推薦;基于內(nèi)容的推薦,它的核心思想是根據(jù)推薦物品或內(nèi)容的元數(shù)據(jù),發(fā)現(xiàn)物品或者內(nèi)容的相關(guān)性,然后基于用戶以往的喜好記錄,推薦給用戶相似的物品,這種方法物品相似度的衡量標(biāo)準(zhǔn)只考慮到了物品本身,有一定的片面性。因此,單純使用某一個推薦算法在推薦結(jié)果的精度和多樣性方面存在不足,針對存在的問題,本發(fā)明提出一種基于混合多種模式的廢舊行業(yè)推薦系統(tǒng)以及其方法,能夠使得推薦結(jié)果更準(zhǔn)確,更能滿足用戶的需求。技術(shù)實現(xiàn)要素:有鑒于此,本發(fā)明的主要目的在于提供一種基于混合多種模式的廢舊行業(yè)推薦系統(tǒng)以及其方法,在用戶購買商品時候,給用戶推薦感興趣的商品信息,更能滿足用戶的個性化需求。為達到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:A模塊:關(guān)聯(lián)推薦、熱點推薦、TopN推薦三種混合推薦模式;B模塊:初始化推薦結(jié)果;C模塊:過濾、結(jié)果排序、推薦解釋、最終的推薦結(jié)果。其中所述模塊A中的關(guān)聯(lián)推薦,根據(jù)商品內(nèi)容的相似性進行推薦,其中根據(jù)商品內(nèi)容進行推薦需要將原來保存在索引中的原始數(shù)據(jù)導(dǎo)入到現(xiàn)在的數(shù)據(jù)庫中;所述的TopN推薦,也就是瀏覽歷史推薦,每一個用戶某一段時間內(nèi)點擊數(shù)TopN商品推薦;所述的熱點推薦,將實時熱銷商品推薦給用戶,給每一個用戶推薦可能感興趣的數(shù)據(jù)。對網(wǎng)站常用用戶,關(guān)聯(lián)推薦和TopN推薦設(shè)置較高權(quán)重,熱點推薦次之;對無任何記錄用戶,將熱點推薦設(shè)置較高的權(quán)重,通過分析用戶所屬的適應(yīng)人群,也可進行關(guān)聯(lián)推薦。進一步地,所述的TopN推薦主要包括以下兩個策略:TopN策略:1)最近30天的點擊日志;2)總點擊數(shù)TopN的數(shù)據(jù);3)總點擊數(shù)不少于某個閾值;4)平均每一個人的點擊次數(shù)不少于某個閾值;連續(xù)遞增策略:1)最近30天的點擊日志;2)連續(xù)若干天的點擊呈現(xiàn)遞增趨勢;3)連續(xù)的天數(shù)不少于某個閾值;4)平均每一天的點擊次數(shù)不少于某個閾值。所述模塊B初始化推薦結(jié)果,返回的推薦結(jié)果為推薦解釋:resysExplain,供求編號:M_gqinfo.gqid,產(chǎn)品分類:M_gqinfo.classid,供求分類:M_gqinfo.type,信息靜態(tài)頁面地址:M_gqinfo.htmlurl,圖片:M_gqinfo.photo,標(biāo)題:M_gqinfo.title,新舊程度:M_gqinfo.xjcd,供貨數(shù)量:M_gqinfo.pronum,型號規(guī)格:M_gqinfo.proxh,交易價格:M_gqinfo.proprice產(chǎn)品所在地:M_gqinfo.province,存放方式:M_gqinfo.cffs,權(quán)限:sys_user.rankid,會員編號:sys_user.uid,用戶名:sys_user.uname,企業(yè)名稱:sys_user.comname,聯(lián)系人:sys_user.linkman,性別:sys_user.sex,公司所在地:sys_user.comaddress,德保指數(shù):czizhi_rz.frrz,是否通過德保認(rèn)證:czizhi_rz;所述模塊C主要步驟如下:步驟C1、推薦數(shù)據(jù)的過濾主要包括:過濾掉用戶已經(jīng)訪問過的頁面,過濾掉用戶沒有訪問權(quán)限的頁面,過濾掉重復(fù)數(shù)據(jù);步驟C2、結(jié)果排序主要是對推薦的結(jié)果進行排序,按照網(wǎng)頁的受歡迎程度排序,也就是網(wǎng)頁被點擊過的次數(shù);步驟C3、推薦解釋主要是總的點擊次數(shù):totalClickNum;每一個用戶的點擊數(shù)據(jù):List<Entry<User,Integer>>userClickNumForAll;第一天的點擊時間:DatesDate;步驟C4、最終的推薦結(jié)果主要是經(jīng)過步驟C1、C2、C3處理過的推薦數(shù)據(jù),以更清晰準(zhǔn)確的方式呈現(xiàn)給用戶。進一步地,本發(fā)明對推薦結(jié)果進行評估,主要通過以下三個評估標(biāo)準(zhǔn):1)訓(xùn)練數(shù)據(jù)與評分:在本發(fā)明推薦系統(tǒng)中,提取一小段真實數(shù)據(jù)作為測試數(shù)據(jù)來仿真;2)查準(zhǔn)率:是top推薦中間有“好”結(jié)果的比例;3)查全率:是“好”結(jié)果出現(xiàn)在top推薦中的比例。本發(fā)明所提供的混合多種模式個性化推薦方法,具有以下優(yōu)點:1)混合了關(guān)聯(lián)推薦、熱點推薦、TopN推薦三種模式,提高了推薦結(jié)果的精度;2)更能符合用戶需求,使得推薦的商品購買率增加,從而提高商品的訂單轉(zhuǎn)化率;3)增加推薦的多樣性,使特殊喜好的用戶得到推薦。附圖說明圖1為本發(fā)明混合多種模式的廢舊行業(yè)推薦系統(tǒng)流程示意圖;圖2為本發(fā)明混合多種模式的廢舊行業(yè)推薦系統(tǒng)制作訓(xùn)練集示意圖;圖3為本發(fā)明混合多種模式的推薦行為交互過程示意圖。具體實施方式下面結(jié)合附圖及本發(fā)明的實施例對本發(fā)明的混合多種模式的個性化推薦方法作進一步詳細的說明。該系統(tǒng)A模塊中關(guān)聯(lián)推薦主要采用聚類計算相似商品的方法,主要包含以下幾個流程:1)創(chuàng)建一個實體類SimilarityData,設(shè)定三個字段row(行)、column(列)、similarityValue(相似度),其中所述實體類SimilarityData主要作用是三元組,矩陣中的某一個元素,用來保存稀疏矩陣;其中所述的相似度在進行聚類計算之前,通過訓(xùn)練集測試得出將最小相似度設(shè)定minSimilarity為0.8較為合適;2)創(chuàng)建實例SimilarityData[][]allSimilarityData,用來保存的是所有的相似數(shù)據(jù);3)創(chuàng)建數(shù)組int[]countArray,用來保存每一條數(shù)據(jù)相似的數(shù)據(jù)的總數(shù);4)初始化矩陣;5)計算兩兩之間的相似度,其中所述的相似度,采用Jaccard系數(shù)計算兩個向量的相似度;6)和第row條數(shù)據(jù)相似的數(shù)據(jù)的總數(shù);7)給相似數(shù)據(jù)賦值;其中所述的給相似數(shù)據(jù)賦值的時候,當(dāng)有一條新的數(shù)據(jù)的時候:如果所在行的數(shù)據(jù)還沒有填滿,則直接插入到最后一個元素的后面;如果所在行的數(shù)據(jù)已經(jīng)填滿,則用當(dāng)前數(shù)據(jù)和所在行的最小元素進行比較,如果大于最小的元素則替換,否則不做任何操作。進一步地,計算相似商品所需數(shù)據(jù)來源于訓(xùn)練集,訓(xùn)練集制作流程如圖2所示,主要包含以下過程:1)數(shù)據(jù)庫讀取的數(shù)據(jù)進行分詞,并將分詞之后的數(shù)據(jù)以空格形式存在默認(rèn)文件夾resys,其中在讀取數(shù)據(jù)之前還需要判斷是否需要更新訓(xùn)練集;2)讀取分詞之后的訓(xùn)練數(shù)據(jù);3)使用TF-IDF和LDA混合模型進行特征抽取,用于聚類;其中所述TF-IDF這種語言模型主要是用詞匯的統(tǒng)計特征來作為特征集,每個特征都能夠說得出物理意義,抽取效果不錯,然而,這些特征的一個關(guān)鍵問題,在于并沒有對樣本特征進行很大程度的壓縮,沒有提取出關(guān)鍵的信息。也就是訓(xùn)練好的分類器只在訓(xùn)練它的數(shù)據(jù)集中有效,換一個數(shù)據(jù)集效果就會很差;所述LDA就是文本的稀疏表示,代表的這一類語言模型叫做TopicModel。認(rèn)為單詞量再大的文本,其文章主題就那么幾個。一個K個主題的LDA模型,可以把一個文本壓縮成K維的向量:每一個維度就是該文本屬于該主題的概率,這個向量也叫做TopicProportion。然后得到壓縮后的K維數(shù)據(jù)集后,再使用任何的分類器,甚至最簡單的余弦相似性指標(biāo),都可以得到非常好的分類效果;因此,本發(fā)明將兩者結(jié)合起來進行特征抽取效果更佳。4)使用TF對商品進行向量化,同時初始化LDA主題模型,并輸出每一個主題對應(yīng)的所有詞;其中文本的特征,可能是topic,也可能是word;5)聚類,計算相似商品。本發(fā)明為解決個性化推薦的問題,主要采用了以下技術(shù),下面對這些技術(shù)進行簡單介紹。1)分詞技術(shù)。本發(fā)明中主要采用IK分詞,主要在制作訓(xùn)練集時候使用,其中IK分詞使用了“正向迭代最細粒度切分算法”,簡單說來就是:Segmenter會逐字識別詞元,本發(fā)明對IK進行重寫,將IKAnalyzerSegmenter類中將useSmart設(shè)定true,其中所述的useSmart當(dāng)其值為false為非智能分詞,細粒度輸出所有可能的切分結(jié)果;當(dāng)其值為true為智能分詞,合并數(shù)詞和量詞,對分詞結(jié)果進行歧義判斷。2)聚類技術(shù)。本發(fā)明主要用在計算相似商品時候使用了聚類技術(shù),聚類相識度計算商品的算法首先創(chuàng)建一個實體類SimilarityData,設(shè)定三個字段row(行)、column(列)、similarityValue(相似度),其中所述實體類SimilarityData主要作用是三元組,矩陣中的某一個元素,用來保存稀疏矩陣,其次初始化矩陣,最后計算商品之間的相似度。3)文本特征抽取技術(shù)。本發(fā)明主要使用了兩種特征抽取方式,一種是使用TF-IDF和LDA混合模型進行特征抽取,用于聚類。4)推薦結(jié)果排序技術(shù)。本發(fā)明將推薦結(jié)果按照totalClickNum降序排列,totalClickNum就是按照網(wǎng)頁點擊次數(shù),也就是受歡迎程度。參考圖3,本發(fā)明的個性化推薦方法實施例如下。下面介紹該方法的幾個典型應(yīng)用場景:應(yīng)用場景一:本發(fā)明的推薦行為的交互過程,如下表1所示。表1元數(shù)據(jù)含義舉例API接口中的對應(yīng)詞用戶名執(zhí)行此次推薦的用戶名用戶名是“張三”username推薦時刻系統(tǒng)執(zhí)行推薦的時刻“張三”在時刻“2016-12-2515:55:00”登陸系統(tǒng),“15:55:00”即是系統(tǒng)執(zhí)行推薦的時刻recommendTime被推薦頁面針對該次推薦,系統(tǒng)給出的推薦結(jié)果頁面的ID“張三”在時刻“2016-12-2515:55:00”登陸系統(tǒng),被推薦頁面ID為“1,3,47,556,1007”等recommendPageID被推薦頁面排序序號推薦結(jié)果呈現(xiàn)給用戶時,每個頁面的排序序號ID號為“1,3,47,556,1007”的5篇商品作為推薦結(jié)果呈現(xiàn)出來時的排序是“556,3,47,1,1007”那么它們對應(yīng)的排序號為“1,2,3,4,5”recommendPageRankID頁面被點擊時刻點擊推薦結(jié)果頁面時的時刻用戶點擊ID號為“556”的時刻是“2012-08-0515:56:24”clickedTime頁面駐留時間在每個被點擊頁面上駐留的時間用戶查看ID號為“556”的商品,在時刻“2016-12-2515:57:26”離開,駐留時間為“62”秒用戶每次登陸調(diào)用setRecommendInfo(),點擊推薦頁面時調(diào)用updateRecommendInfo(),例如:張三在時刻“2016-12-2516:00:00”登陸系統(tǒng),系統(tǒng)向他推薦了3個頁面,其頁面序號為“1,3,47”,排序序號為“2,3,1”,此時調(diào)用setRecommendInfo(StringuserName,DaterecommendTime,long[]recommendPageID,long[]recommendPageRankID),recommendPageID存儲3個頁面序號,recommendPageRankID存儲3個頁面的排序序號。應(yīng)用場景二:本發(fā)明的推薦方法應(yīng)用在某廢舊行業(yè)系統(tǒng)詳情頁展示關(guān)聯(lián)推薦,其中,所述詳情頁是在該廢舊網(wǎng)站搜索框輸入關(guān)鍵詞,點擊搜索,進入廢舊網(wǎng)的產(chǎn)品列表頁,然后點擊某一個商品,進入商品詳情頁。輸入:廢鋼鐵回收,相關(guān)推薦結(jié)果展示如下:{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"9cdddb1a9a3146a5984510e7057613e6","pmCode":null,"name":"煉鋼廢鋼斗招標(biāo)公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-11","releaseTime":"2016-11-08","num":0,"address":"河北省-邢臺市","endTime":"2016-11-1100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"d9e18ea7fbb94a19adf5d8b470cc0d43","pmCode":null,"name":"報廢宿營車廢鋼競賣公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-16","releaseTime":"2016-11-08","num":0,"address":"北京市-市轄區(qū)","endTime":"2016-11-1600:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"c74d9959c6f64b71af8e532107ed0714","pmCode":null,"name":"報廢貨車廢鋼競賣公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-15","releaseTime":"2016-11-08","num":0,"address":"北京市-市轄區(qū)","endTime":"2016-11-1500:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"303c762d475d4bb28053ccb270ab00e6","pmCode":null,"name":"煤業(yè)公司320噸廢鋼絲繩芯輸送帶轉(zhuǎn)讓公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-21","releaseTime":"2016-11-08","num":0,"address":"寧夏回族自治區(qū)-銀川市","endTime":"2016-11-2100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"5721a3dad2bb4fac94e6c5359bf5cd44","pmCode":null,"name":"300噸廢鋼絲繩轉(zhuǎn)讓公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-21","releaseTime":"2016-11-08","num":0,"address":"寧夏回族自治區(qū)-銀川市","endTime":"2016-11-2100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"a3dad8ab200c42ff8d734a2f7ed61b10","pmCode":null,"name":"2000噸廢鋼(中型)轉(zhuǎn)讓公告","imgUrl":null,"price":null,"valuation":"50-100萬","status":null,"time":"2016-11-21","releaseTime":"2016-11-08","num":0,"address":"寧夏回族自治區(qū)-銀川市","endTime":"2016-11-2100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"31e00b9286454f35b70b2f4bce1adbd8","pmCode":null,"name":"物流公司雜廢鋼630噸報廢設(shè)備物資一批處置公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-16","releaseTime":"2016-11-08","num":0,"address":"湖北省-武漢市","endTime":"2016-11-1500:00:00","bidCompany":""}以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。所述領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。在本發(fā)明所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述到的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性、機械或其它的形式。所述作為分離部件說明的單元可以是或者也可以是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),可以采用軟件功能單元的形式實現(xiàn)。需要說明的是,本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-OnlyMemory,ROM)或隨機存儲記憶體(RandomAccessMemory,RAM)等。以上對本發(fā)明所提供的基于混合多種模式的廢舊行業(yè)推薦系統(tǒng)以及其方法進行了詳細介紹,本文中應(yīng)用了具體實施例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。當(dāng)前第1頁1 2 3