本發(fā)明涉及數(shù)據(jù)挖掘技術(shù),尤其涉及一種應(yīng)用推薦方法和裝置。
背景技術(shù):
:隨著終端應(yīng)用的快速發(fā)展,尤其針對日常生活中使用最頻繁的手機(jī),用戶需要花費(fèi)大量的時間才能找到自己想要安裝的應(yīng)用。為了便于用戶查找到自己想要安裝的應(yīng)用,應(yīng)用推薦系統(tǒng)應(yīng)運(yùn)而生。其中,推薦應(yīng)用的準(zhǔn)確性是衡量應(yīng)用推薦系統(tǒng)好壞的一個重要指標(biāo)?,F(xiàn)有技術(shù)中,以手機(jī)為例,手機(jī)應(yīng)用推薦模式基本都是基于“產(chǎn)品”(即應(yīng)用)這一個因素,具體的,利用關(guān)聯(lián)分析等數(shù)據(jù)挖掘算法工具,來探索應(yīng)用之間的相似度和關(guān)聯(lián)關(guān)系,并在用戶選擇安裝或使用某一應(yīng)用后,服務(wù)器會利用協(xié)同過濾算法建立用戶-應(yīng)用之間的關(guān)系,并會通過該關(guān)系向用戶推薦與用戶選擇安裝或使用應(yīng)用相關(guān)聯(lián)的應(yīng)用?,F(xiàn)有的模式僅僅考慮到用戶已安裝或者使用應(yīng)用的信息,考慮因素過于單一,僅考慮了“產(chǎn)品”這一個因素,并未考慮到用戶實際需求這個因素,推薦給用戶的應(yīng)用不能滿足用戶的實際需要,使得用戶并不會使用推薦的應(yīng)用,減低用戶體驗,從而使得推薦的準(zhǔn)確性受到負(fù)面影響。技術(shù)實現(xiàn)要素:為解決上述技術(shù)問題,本發(fā)明實施例期望提供一種應(yīng)用推薦方法和裝置,為用戶推薦滿足用戶需求的應(yīng)用,從而提高推薦的準(zhǔn)確性。本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:第一方面,提供一種應(yīng)用推薦方法,所述方法包括:獲取用戶的應(yīng)用偏好得分和用戶信息;根據(jù)所述用戶信息,確定所述用戶間的綜合相似度;根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定推薦的應(yīng)用??蛇x的,所述用戶信息包括交往信息、應(yīng)用偏好信息和終端信息,所述根據(jù)所述用戶信息,確定所述用戶間的綜合相似度包括:根據(jù)所述交往信息,確定所述用戶間交往圈親密相似度;根據(jù)所述應(yīng)用偏好信息,確定所述用戶間應(yīng)用偏好相似度;根據(jù)所述終端信息,確定所述用戶間終端信息相似度;根據(jù)所述用戶間交往圈親密相似度、所述用戶間應(yīng)用偏好相似度和所述用戶間終端信息相似度,確定所述用戶間綜合相似度??蛇x的,對于第一用戶,所述根據(jù)所述應(yīng)用偏好信息,確定所述用戶間應(yīng)用偏好相似度包括:根據(jù)所述偏好信息,獲取所述第一用戶的第一應(yīng)用使用頻率向量和第二用戶的第二應(yīng)用使用頻率向量;根據(jù)所述第一應(yīng)用使用頻率向量和所述第二應(yīng)用使用頻率向量,確定所述第一用戶和所述第二用戶間應(yīng)用偏好相似度。可選的,所述終端信息包括終端品牌等級得分和終端價格等級得分,對于第一用戶,所述根據(jù)所述終端信息,確定所述用戶間終端信息相似度包括:根據(jù)所述終端信息,獲取所述第一用戶的第一終端品牌等級得分與第一終端價格等級得分和第二用戶的第二終端品牌等級得分與第二終端價格等級得分;根據(jù)所述第一終端品牌等級得分、第一終端價格等級得分、第二終端品牌等級得分和第二終端價格等級得分,確定所述第一用戶和所述第二用戶間終端信息相似度。可選的,所述交往信息包括所述用戶之間的第一通話次數(shù)、所述用戶之間的第一通話時長和所述用戶之間的第一短信次數(shù),對于第一用戶,所述根據(jù)所述交往信息,確定所述用戶間交往圈親密相似度包括:根據(jù)所述通話次數(shù)、所述通話時長和所述短信次數(shù),獲取所述第一用戶和第二用戶之間的第二通話次數(shù)、所述第一用戶和所述第二用戶之間的第二通話時長和所述第一用戶和所述第二用戶之間的第二短信次數(shù);根據(jù)所述第一通話次數(shù)、所述第一通話時長、所述第一短信次數(shù)、所述第二通話次數(shù)、所述第二通話時長和所述第二短信次數(shù),確定所述第一用戶和所述第二用戶間交往圈親密相似度??蛇x的,對于第一用戶,所述根據(jù)所述用戶間交往圈親密相似度、所述用戶間應(yīng)用偏好相似度和所述用戶間終端信息相似度,確定所述用戶間綜合相似度包括:確定所述第一用戶和第二用戶間交往圈親密度、所述第一用戶和所述第二用戶間應(yīng)用偏好相似度和所述第一用戶和所述第二用戶間終端信息相似度;確定所述第一用戶和所述第二用戶間交往圈親密相似度、所述第一用戶和所述第二用戶間應(yīng)用偏好相似度和所述第一用戶和所述第二用戶間終端信息相似度的平均值;根據(jù)所述平均值,確定所述第一用戶和所述第二用戶間綜合相似度??蛇x的,所述根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定推薦的應(yīng)用包括:根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定應(yīng)用的推薦預(yù)測得分;將前n個最大的所述推薦預(yù)測得分對應(yīng)的應(yīng)用確定為所述推薦的應(yīng)用,所述n是小于總應(yīng)用個數(shù)的正整數(shù)。第二方面,提供一種應(yīng)用推薦裝置,所述裝置包括:獲取模塊,用于獲取用戶的應(yīng)用偏好得分和用戶信息;確定模塊,用于根據(jù)所述用戶信息,確定所述用戶間的綜合相似度;所述確定模塊還用于根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定推薦的應(yīng)用??蛇x的,所述用戶信息包括交往信息、應(yīng)用偏好信息和終端信息,所述確定模塊具體用于:根據(jù)所述交往信息,確定所述用戶間交往圈親密相似度;根據(jù)所述應(yīng)用偏好信息,確定所述用戶間應(yīng)用偏好相似度;根據(jù)所述終端信息,確定所述用戶間終端信息相似度;根據(jù)所述用戶間交往圈親密相似度、所述用戶間應(yīng)用偏好相似度和所述用戶間終端信息相似度,確定所述用戶間綜合相似度??蛇x的,對于第一用戶,所述確定模塊還具體用于:根據(jù)所述偏好信息,獲取所述第一用戶的第一應(yīng)用使用頻率向量和第二用戶的第二應(yīng)用使用頻率向量;根據(jù)所述第一應(yīng)用使用頻率向量和所述第二應(yīng)用使用頻率向量,確定所述第一用戶和所述第二用戶間應(yīng)用偏好相似度??蛇x的,所述終端信息包括終端品牌等級得分和終端價格等級得分,對于第一用戶,所述確定模塊還具體用于:根據(jù)所述終端信息,獲取所述第一用戶的第一終端品牌等級得分與第一終端價格等級得分和第二用戶的第二終端品牌等級得分與第二終端價格等級得分;根據(jù)所述第一終端品牌等級得分、第一終端價格等級得分、第二終端品牌等級得分和第二終端價格等級得分,確定所述第一用戶和所述第二用戶間終端信息相似度??蛇x的,所述交往信息包括所述用戶之間的第一通話次數(shù)、所述用戶之間的第一通話時長和所述用戶之間的第一短信次數(shù),對于第一用戶,所述確定模塊還具體用于:根據(jù)所述通話次數(shù)、所述通話時長和所述短信次數(shù),獲取所述第一用戶和第二用戶之間的第二通話次數(shù)、所述第一用戶和所述第二用戶之間的第二通話時長和所述第一用戶和所述第二用戶之間的第二短信次數(shù);根據(jù)所述第一通話次數(shù)、所述第一通話時長、所述第一短信次數(shù)、所述第二通話次數(shù)、所述第二通話時長和所述第二短信次數(shù),確定所述第一用戶和所述第二用戶間交往圈親密相似度??蛇x的,對于第一用戶,所述確定模塊還具體用于:確定所述第一用戶和第二用戶間交往圈親密度、所述第一用戶和所述第二用戶間應(yīng)用偏好相似度和所述第一用戶和所述第二用戶間終端信息相似度;確定所述第一用戶和所述第二用戶間交往圈親密相似度、所述第一用戶和所述第二用戶間應(yīng)用偏好相似度和所述第一用戶和所述第二用戶間終端信息相似度的平均值;根據(jù)所述平均值,確定所述第一用戶和所述第二用戶間綜合相似度。可選的,所述確定模塊還用于:根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定應(yīng)用的推薦預(yù)測得分;將前n個最大的所述推薦預(yù)測得分對應(yīng)的應(yīng)用確定為所述推薦的應(yīng)用,所述n是小于總應(yīng)用個數(shù)的正整數(shù)。本發(fā)明實施例提供了一種應(yīng)用推薦方法和裝置,獲取用戶的應(yīng)用偏好得分和用戶信息;再根據(jù)用戶信息,確定用戶間的綜合相似度;之后,根據(jù)應(yīng)用偏好得分和綜合相似度,確定推薦的應(yīng)用。這樣一來,根據(jù)某一確定用戶的應(yīng)用偏好得分和該用戶與其他用戶的綜合相似度,就可以高效、準(zhǔn)確地確定出給該用戶推薦的應(yīng)用,這樣,不僅考慮到該用戶已安裝或者使用的應(yīng)用,還有考慮該用戶與其他用戶的綜合相似度,從而達(dá)到對用戶手機(jī)應(yīng)用的高準(zhǔn)確性推薦,使得應(yīng)用的推薦成功率大大增加。同時,在該用戶不主動下載應(yīng)用的時候,仍可根據(jù)綜合相似度給該用戶進(jìn)行推薦,從而達(dá)到對用戶手機(jī)應(yīng)用的高準(zhǔn)確性推薦,使得應(yīng)用的推薦成功率大大增加。附圖說明圖1為本發(fā)明實施例提供的一種應(yīng)用推薦方法的流程圖;圖2為本發(fā)明實施例提供的一種綜合相似度推理系統(tǒng)示意圖;圖3為本發(fā)明實施例提供的一種構(gòu)建產(chǎn)品偏好相似度示意圖;圖4為本發(fā)明實施例提供的一種構(gòu)建交往圈親密度相似度示意圖;圖5為本發(fā)明實施例提供的一種應(yīng)用推薦裝置結(jié)構(gòu)示意圖。具體實施方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述。實施例一本發(fā)明實施例提供一種應(yīng)用推薦方法,應(yīng)用于應(yīng)用推薦裝置,該裝置可以是服務(wù)器中的一部分,也可以是單獨的設(shè)備,如圖1所示,該方法包括:步驟101、獲取用戶的應(yīng)用偏好得分和用戶信息。這里,獲取用戶的應(yīng)用偏好得分時,采用的是熵值法,該熵值法在實際應(yīng)用中已經(jīng)非常成熟,本實施例就不再詳述。獲取用戶信息的目的是為接下來的步驟做準(zhǔn)備。其中,用戶信息可直接從服務(wù)器中獲得。具體的,獲取用戶的應(yīng)用偏好得分可按以下小步驟進(jìn)行。(1)初始化用戶-應(yīng)用偏好得分矩陣首先,定義用戶-應(yīng)用偏好矩陣:其中g(shù)ij表示第i個用戶對第j個應(yīng)用的偏好得分。用戶在時間、情感、金錢等三方面的投入能最大程度地反映用戶對某類應(yīng)用的偏好程度,因此對指標(biāo)體系都進(jìn)行頻度、粘度和額度的統(tǒng)一標(biāo)準(zhǔn)化處理。其中頻度體現(xiàn)用戶的時間投入,包括使用次數(shù)、天數(shù)等;粘度體現(xiàn)用戶的情感投入,包括流量使用大小、使用時長等;額度體現(xiàn)用戶的金錢投入,包括在應(yīng)用里付費(fèi)次數(shù)、付費(fèi)金額等。(2)指標(biāo)去量綱的標(biāo)準(zhǔn)化處理這里,以用戶i為例,用戶i對應(yīng)用j的指標(biāo)k標(biāo)準(zhǔn)化得分:其中,fijk表示用戶i對應(yīng)用j的指標(biāo)k得分;skmq表示用戶i對應(yīng)用j的指標(biāo)k的標(biāo)準(zhǔn)化得分;表示用戶i對應(yīng)用j的指標(biāo)k得分的最小值;表示用戶i對應(yīng)用j的指標(biāo)k得分的最大值。值得說明的是,i的取值范圍是大于等于1且小于等于m的正整數(shù),代表所有用戶中的一個用戶;j的取值范圍是大于等于1且小于等于n的正整數(shù),代表所有應(yīng)用中的一個應(yīng)用;指標(biāo)k是指上述頻度、粘度和額度。(3)計算偏好得分矩陣這里,計算偏好得分矩陣的方法有很多,本實施例以采用用戶賦權(quán)法-熵值法建立偏好得分模型為例進(jìn)行說明。第一步:定義偏好得分評估體系;其中,定義的偏好得分評估體系如表1所示。表1第二步:計算三級指標(biāo)熵值hjk;具體的,其中,sijk表示分類中第i個用戶對第j個應(yīng)用的第k個指標(biāo)標(biāo)準(zhǔn)化得分,m為用戶總數(shù)量,n為指標(biāo)總數(shù)目。第三步:計算三級指標(biāo)熵權(quán)wjk;這里,三級指標(biāo)熵權(quán)wjk與表1中三級權(quán)重相對應(yīng)。具體的,利用指標(biāo)熵值hjk計算指標(biāo)熵權(quán)wjk,其中,n為指標(biāo)總數(shù)目。第四步:計算二級指標(biāo)矩陣頻度、粘度和額度;具體的,s′ijk=[aijbijcij],其中,頻度粘度額度第五步:計算二級指標(biāo)熵值及熵權(quán);這里,二級指標(biāo)熵值及熵權(quán)的計算方法與第二步和第三步的方法相同。具體的。二級指標(biāo)熵權(quán)二級指標(biāo)熵值其中,表示分類中第i個用戶對第j個應(yīng)的第k個指標(biāo)標(biāo)準(zhǔn)化得分,m為用戶總數(shù)量,n為指標(biāo)總數(shù)目。第六步、計算用戶i對應(yīng)用j的偏好得分。具體的,用戶i對應(yīng)用j的偏好得分為:gij=oj*aj+pj*bj+qj*cj。示例的,以手機(jī)閱讀為例,如表2所示。步驟102、根據(jù)用戶信息,確定用戶間的綜合相似度。具體的,用戶信息包括交往信息、應(yīng)用偏好信息和終端信息;根據(jù)交往信息,確定所述用戶間交往圈親密相似度;根據(jù)應(yīng)用偏好信息,確定用戶間應(yīng)用偏好相似度;根據(jù)終端信息,確定用戶間終端信息相似度;根據(jù)用戶間交往圈親密相似度、用戶間應(yīng)用偏好相似度和用戶間終端信息相似度,確定用戶間綜合相似度。值得說明的是,本實施例中除了獲取到用戶的偏好得分,還會獲取到用戶間綜合相似度,實現(xiàn)從多角度、全方位考慮用戶信息,達(dá)到以高準(zhǔn)確度向用戶推薦應(yīng)用。如圖2所示,本發(fā)明綜合相似度綜合了用戶關(guān)于交際圈、偏好和所使用終端三個維度的相似度,具體的,這三個維度的相似度分別為交往圈親密相似度、產(chǎn)品偏好相似度和終端信息相似度。具體的,如圖3所示,對于第一用戶,根據(jù)應(yīng)用偏好信息,確定用戶間應(yīng)用偏好相似度可以包括:根據(jù)偏好信息,獲取第一用戶的第一應(yīng)用使用頻率向量和第二用戶的第二應(yīng)用使用頻率向量;根據(jù)第一應(yīng)用使用頻率向量和第二應(yīng)用使用頻率向量,確定第一用戶和第二用戶間應(yīng)用偏好相似度。優(yōu)選的,根據(jù)第一應(yīng)用使用頻率向量和第二應(yīng)用使用頻率向量,確定第一用戶和第二用戶間應(yīng)用偏好相似度時,利用余弦相似度來確定出第一用戶和第二用戶間應(yīng)用偏好相似度。這里,余弦相似度又稱為余弦相似性,是通過計算兩個向量的夾角余弦值來評估它們的相似度。余弦值的范圍在[-1,1]之間,值越趨近于1,就代表兩個向量的方向越趨近于0,它們的方向更加一致。示例的,以向量和向量為例,其余弦相似度滿足第一公式:其中θ表示向量和向量之間的夾角。具體到本實施例中,向量和向量可以是第一應(yīng)用使用頻率向量和第二應(yīng)用使用頻率向量;向量和向量還可以是第一用戶終端信息向量和第二用戶終端信息向量。具體到本實施例中的第一用戶和第二用戶間應(yīng)用偏好相似度,該應(yīng)用偏好相似度取值范圍在[0,1]之間,當(dāng)該應(yīng)用偏好相似度越大,即越接近于1時,表明第一用戶的第一應(yīng)用使用頻率向量和第二用戶的第二應(yīng)用使用頻率向量的夾角越小,說明第一用戶和第二用戶的相似度越高。值得說明的是,第一應(yīng)用使用頻率向量中存放的是第一用戶使用應(yīng)用的頻率得分,同樣的,第二應(yīng)用使用頻率向量中存放的是第二用戶使用應(yīng)用的頻率得分。這里,第一應(yīng)用使用頻率向量和第二應(yīng)用使用頻率向量中所指的應(yīng)用是第一用戶和第二用戶共同使用的應(yīng)用。示例的,假設(shè)有a、b和c三個用戶,使用應(yīng)用1,2,3,4的頻率得分如表3所示:表3使用頻率得分應(yīng)用1應(yīng)用2應(yīng)用3應(yīng)用4a0.840.210.540.32b0.120.540.840.21c0.510.950.210.23這里,我們將a和b的應(yīng)用偏好相似度記為sim_cos(a,b);同理,a和c的應(yīng)用偏好相似度記為sim_cos(a,c);b和c的應(yīng)用偏好相似度記為sim_cos(b,c)。根據(jù)上述余弦相似度第一公式可得:其他兩個應(yīng)用偏好相似度的計算方法相類似,此處就不再詳述。具體的,終端信息包括終端品牌等級得分和終端價格等級得分,對于第一用戶,根據(jù)終端信息,確定用戶間終端信息相似度包括:根據(jù)終端信息,獲取第一用戶的第一終端品牌等級得分與第一終端價格等級得分和第二用戶的第二終端品牌等級得分與第二終端價格等級得分;根據(jù)第一終端品牌等級得分、第一終端價格等級得分、第二終端品牌等級得分和第二終端價格等級得分,確定第一用戶和第二用戶間終端信息相似度。終端可以在一定程度上反映用戶的價值和用戶的偏好,在實際中,使用同一類型終端的用戶會存在一定的相似性。因此,可以利用終端品牌、終端價格、是否支持第四代移動通信技術(shù)(the4thgenerationmobilecommunicationtechnology,4g)、是否國產(chǎn)終端、是否為合約機(jī)等構(gòu)建終端信息相似度。由于終端信息都是序數(shù)類似的變量,可以采用斯皮爾曼等級相關(guān)系數(shù)來衡量用戶的相似度。具體的,斯皮爾曼等級相關(guān)系數(shù)可以將終端品牌的文字信息、終端價格的價格區(qū)間等轉(zhuǎn)化成等級得分。這里,斯皮爾曼等級相關(guān)系數(shù)主要用于解決稱名數(shù)據(jù)和順序數(shù)據(jù)相關(guān)的問題,適用范圍廣,推薦系統(tǒng)中的grouplens小組采用相關(guān)系數(shù)來度量用戶的相似度,兩者用戶的相關(guān)程度越高,說明兩者的相似度越高。本實施例中終端信息選取終端品牌和終端價格,終端品牌和終端價格通過斯皮爾曼等級相關(guān)系數(shù)轉(zhuǎn)化成終端品牌等級得分和終端價格等級得分后,同樣采用余弦相似度來刻畫終端信息相似度。第一用戶和第二用戶間終端信息相似度記為p12,該p12滿足第二公式:其中,表示第一用戶終端信息向量,該向量包括第一終端品牌等級得分和第一終端價格等級得分,同樣的,表示第二用戶終端信息向量,該向量包括第二終端品牌等級得分和第二終端價格等級得分。示例的,依據(jù)斯皮爾曼等級相關(guān)系數(shù),終端品牌等級得分轉(zhuǎn)換表如表4所示,終端價格得分轉(zhuǎn)換表如表5所示。假設(shè)先有用戶a、b和c三人,結(jié)合表4和表5分析后,得知用戶a、b和c的終端信息情況如表6所示。表4表5價格區(qū)間等級得分1000以內(nèi)11000-200022000-300033000-400044000以上5表6用戶終端品牌得分終端價格得分a31b22c13結(jié)合表6和第二公式,可得:具體的,交往信息包括用戶之間的第一通話次數(shù)、用戶之間的第一通話時長和用戶之間的第一短信次數(shù),對于第一用戶,根據(jù)交往信息,確定所述用戶間交往圈親密相似度包括:根據(jù)通話次數(shù)、通話時長和短信次數(shù),獲取第一用戶和第二用戶之間的第二通話次數(shù)、第一用戶和第二用戶之間的第二通話時長和第一用戶和第二用戶之間的第二短信次數(shù);根據(jù)第一通話次數(shù)、第一通話時長、第一短信次數(shù)、第二通話次數(shù)、第二通話時長和第二短信次數(shù),確定第一用戶和第二用戶間交往圈親密相似度。如圖4所示,正所謂“物以類聚,人以群分”,用戶使用應(yīng)用的時候很容易受到周圍人的影響。因此,計算第一用戶與交往圈第二用戶的交往親密度,這樣就可以將與第一用戶交往親密度相似度較高的第二用戶正使用的應(yīng)用推薦給第一用戶,便會提高推薦的準(zhǔn)確性。具體的,根據(jù)第一通話次數(shù)、第一通話時長、第一短信次數(shù)、第二通話次數(shù)、第二通話時長和第二短信次數(shù),確定第一用戶和第二用戶間交往圈親密相似度包括:根據(jù)第一通話次數(shù),確定第一通話次數(shù)的第一最大值和第一最小值;根據(jù)第一通話時長,確定第一通話時長的第二最大值和第二最小值;根據(jù)第一通話短信,確定第一通話短信的第三最大值和第三最小值;根據(jù)第一最大值、第一最小值、第二最大值、第二最小值、第三最大值和第三最小值,分別確定第一通話次數(shù)的第一權(quán)值、第一通話時長的第二權(quán)值和第一短信次數(shù)的第三權(quán)值;根據(jù)第二通話次數(shù)、第一最小值、第二通話時長、第二最小值、第二短信次數(shù)、第三最小值、第一權(quán)值、第二權(quán)值和第三權(quán)值,確定第一用戶和第二用戶間交往圈親密相似度。本實施例中,親密度記為q,通話次數(shù)記為ccnt,通話時長記為cdur,短信次數(shù)記為mcnt,最大通話次數(shù)記為max(ccnt),最大通話時長記為max(cdur),最大短信次數(shù)記為max(mcnt),最小通話次數(shù)記為min(ccnt),最小通話時長記為min(cdur),最小短信次數(shù)記為min(mcnt),第一權(quán)值記為x,第二權(quán)值記為y,第三權(quán)值記為z,1和2分別代表第一用戶和第二用戶。優(yōu)選的,q12滿足第三公式:其中,示例的,假設(shè)有a、b和c三個用戶,他們之間的交往信息如表7所示。在表7中,“10次/30分鐘/2條”表示用戶a和b之間的通話次數(shù)為10次,通話時長為30分鐘,短信條數(shù)為2條;“2次/5分鐘/0條”表示用戶a和c之間的通話次數(shù)為2次,通話時長為5分鐘,短信條數(shù)為0條;“25次/60分鐘/0條”表示用戶b和c之間的通話次數(shù)為25次,通話時長為60分鐘,短信條數(shù)為0條。表7ccnt/cdur/mcntabca10次/30分鐘/2條2次/5分鐘/0條b25次/60分鐘/0條c結(jié)合第三公式可知:利用相同的方法可得:qac=0;qbc=0.67。a、b和c用戶間交往圈親密相似度如表8所示。表8q12abca0.60b0.67c采用了3種維度交往圈、產(chǎn)品偏好程度、終端信息去描述用戶間的相似度,這3種相似度結(jié)合起來可以讓用戶間的相似數(shù)據(jù)更加完整。具體的,對于第一用戶,根據(jù)用戶間交往圈親密相似度、用戶間應(yīng)用偏好相似度和用戶間終端信息相似度,確定用戶間綜合相似度包括:確定第一用戶和第二用戶間交往圈親密度、第一用戶和第二用戶間應(yīng)用偏好相似度和第一用戶和第二用戶間終端信息相似度;確定第一用戶和第二用戶間交往圈親密相似度、第一用戶和第二用戶間應(yīng)用偏好相似度和第一用戶和第二用戶間終端信息相似度的平均值;根據(jù)平均值,確定第一用戶和第二用戶間綜合相似度。在本步驟上述中已經(jīng)計算出第一用戶和第二用戶間三個維度上的相似度,接下來就要利用這三個維度上的相似度構(gòu)建第一用戶和第二用戶間綜合相似度。該第一用戶和第二用戶間綜合相似度記為s(1,2),其中s(1,2)與第一用戶和第二用戶間交往圈親密度相似度q12、第一用戶和第二用戶間應(yīng)用偏好相似度sim_cos(1,2)、第一用戶和第二用戶間終端信息相似度p12滿足第三公式:其中n自然數(shù)。該第三公式的內(nèi)在含義是指,先求取三個維度相似度的平均值,然后將該平均值映射到角度內(nèi),最終用該角度的正弦值表示綜合相似度。這個綜合相似度描述了三種維度的相似度,并且引入正弦得到歸一化的結(jié)果,可以支持后面出推薦得分的計算,所有s(1,2)組成第一用戶的相似度向量s1。優(yōu)選的,本實施例中n取2,會把上述平均值映射到直角范圍內(nèi),該直角對應(yīng)的正弦函數(shù)是單調(diào)函數(shù),得到的綜合相似度值域取值為[0,1],沒有重復(fù)值的出現(xiàn),故在保證差異性的同時還很好地確保了穩(wěn)定性。示例的,根據(jù)第一公式和第二公式,用戶a、b和c之間的各個維度相似度如表9所示。表9q12sim_cos(1,2)p12a與b0.60.990.89a與c00.80.6b與c0.670.920.8根據(jù)第三公式和表9可得:s(b,c)=0.95。步驟103、根據(jù)應(yīng)用偏好得分和綜合相似度,確定推薦的應(yīng)用。具體的,根據(jù)應(yīng)用偏好得分和綜合相似度,確定應(yīng)用的推薦預(yù)測得分;將前n個最大的推薦預(yù)測得分對應(yīng)的應(yīng)用確定為推薦的應(yīng)用,n是小于總應(yīng)用個數(shù)的正整數(shù)。和傳統(tǒng)基于用戶的協(xié)同過濾推薦算法處理方式相似,以第一用戶相似度向量s1作為權(quán)值,對用戶范圍內(nèi)所有第二用戶的對應(yīng)用i的偏好得分進(jìn)行加權(quán)評分,就可以得到第一用戶對應(yīng)用i的推薦預(yù)測得分。具體計算滿足第四公式:其中,和分別表示第一用戶和第二用戶使用應(yīng)用的偏好評分的平均值,p1,i表示第一用戶對應(yīng)用i的偏好得分,s(1,2)表示第一用戶第二用戶的綜合相似度,該綜合相似度作為權(quán)重,這里考慮了不同用戶使用深度不同,偏好評分保守和積極的情況導(dǎo)致的偏差,克服了評價尺度不一致的缺點。為第一用戶對所有候選推薦應(yīng)用進(jìn)行預(yù)測評分后,根據(jù)推薦預(yù)測得分值對這些應(yīng)用進(jìn)行排序,選取得分值最高的前n個應(yīng)用作為推薦應(yīng)用,呈現(xiàn)給第一用戶,作為推薦結(jié)果。示例的,假設(shè)用戶a、b和c的用戶-應(yīng)用偏好矩陣如表10所示;同時,用戶a、b和c的綜合相似度為:s(b,c)=0.95。表10應(yīng)用r應(yīng)用s應(yīng)用t應(yīng)用ua4.6002.4b015.46.6c009.20其中,表10中的數(shù)字“0”代表用戶的終端沒有安裝該應(yīng)用。根據(jù)表10和第四公式,可得:用戶a對應(yīng)用t的推薦預(yù)測得分為:采用同樣的方法,可分別求得用戶a對應(yīng)用s的推薦預(yù)測得分、用戶b對應(yīng)用r的推薦預(yù)測得分和用戶c對應(yīng)用r、s、u的推薦預(yù)測得分,對用戶a、b和c的推薦預(yù)測得分矩陣如表11所示。表11應(yīng)用r應(yīng)用s應(yīng)用t應(yīng)用ua0.425.85b4.93c3.251.545.19對于手機(jī)應(yīng)用推薦系統(tǒng),給每個用戶推薦一款最有可能使用的應(yīng)用,那么結(jié)果是對用戶a推薦應(yīng)用t,對用戶b推薦應(yīng)用r,對用戶c推薦應(yīng)用u。值得說明的是,表11中未得分的部分表示所屬用戶已在手機(jī)上安裝相對應(yīng)的應(yīng)用,無需進(jìn)行推薦。這樣一來,根據(jù)某一確定用戶的應(yīng)用偏好得分和該用戶與其他用戶的綜合相似度,就可以高效、準(zhǔn)確地確定出給該用戶推薦的應(yīng)用,這樣,不僅考慮到該用戶已安裝或者使用的應(yīng)用,還有考慮該用戶與其他用戶的綜合相似度,從而達(dá)到對用戶手機(jī)應(yīng)用的高準(zhǔn)確性推薦,使得應(yīng)用的推薦成功率大大增加。同時,在該用戶不主動下載應(yīng)用的時候,仍可根據(jù)綜合相似度給該用戶進(jìn)行推薦,從而達(dá)到對用戶手機(jī)應(yīng)用的高準(zhǔn)確性推薦,使得應(yīng)用的推薦成功率大大增加。實施例二本發(fā)明實施例提供的一種應(yīng)用推薦裝置20,如圖5所示,該裝置20包括:獲取模塊201,用于獲取用戶的應(yīng)用偏好得分和用戶信息;確定模塊202,用于根據(jù)所述用戶信息,確定所述用戶間的綜合相似度;所述確定模塊還用于根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定推薦的應(yīng)用。這樣一來,根據(jù)某一確定用戶的應(yīng)用偏好得分和該用戶與其他用戶的綜合相似度,就可以高效、準(zhǔn)確地確定出給該用戶推薦的應(yīng)用,這樣,不僅考慮到該用戶已安裝或者使用的應(yīng)用,還有考慮該用戶與其他用戶的綜合相似度,從而達(dá)到對用戶手機(jī)應(yīng)用的高準(zhǔn)確性推薦,使得應(yīng)用的推薦成功率大大增加。同時,在該用戶不主動下載應(yīng)用的時候,仍可根據(jù)綜合相似度給該用戶進(jìn)行推薦,從而達(dá)到對用戶手機(jī)應(yīng)用的高準(zhǔn)確性推薦,使得應(yīng)用的推薦成功率大大增加。具體的,所述用戶信息包括交往信息、應(yīng)用偏好信息和終端信息,所述確定模塊202具體用于:根據(jù)所述交往信息,確定所述用戶間交往圈親密相似度;根據(jù)所述應(yīng)用偏好信息,確定所述用戶間應(yīng)用偏好相似度;根據(jù)所述終端信息,確定所述用戶間終端信息相似度;根據(jù)所述用戶間交往圈親密相似度、所述用戶間應(yīng)用偏好相似度和所述用戶間終端信息相似度,確定所述用戶間綜合相似度。具體的,對于第一用戶,所述確定模塊202還具體用于:根據(jù)所述偏好信息,獲取所述第一用戶的第一應(yīng)用使用頻率向量和第二用戶的第二應(yīng)用使用頻率向量;根據(jù)所述第一應(yīng)用使用頻率向量和所述第二應(yīng)用使用頻率向量,確定所述第一用戶和所述第二用戶間應(yīng)用偏好相似度。具體的,所述終端信息包括終端品牌等級得分和終端價格等級得分,對于第一用戶,所述確定模塊202還具體用于:根據(jù)所述終端信息,獲取所述第一用戶的第一終端品牌等級得分與第一終端價格等級得分和第二用戶的第二終端品牌等級得分與第二終端價格等級得分;根據(jù)所述第一終端品牌等級得分、第一終端價格等級得分、第二終端品牌等級得分和第二終端價格等級得分,確定所述第一用戶和所述第二用戶間終端信息相似度。具體的,所述交往信息包括所述用戶之間的第一通話次數(shù)、所述用戶之間的第一通話時長和所述用戶之間的第一短信次數(shù),對于第一用戶,所述確定模塊202還具體用于:根據(jù)所述通話次數(shù)、所述通話時長和所述短信次數(shù),獲取所述第一用戶和第二用戶之間的第二通話次數(shù)、所述第一用戶和所述第二用戶之間的第二通話時長和所述第一用戶和所述第二用戶之間的第二短信次數(shù);根據(jù)所述第一通話次數(shù)、所述第一通話時長、所述第一短信次數(shù)、所述第二通話次數(shù)、所述第二通話時長和所述第二短信次數(shù),確定所述第一用戶和所述第二用戶間交往圈親密相似度。具體的,對于第一用戶,所述確定模塊202還具體用于:確定所述第一用戶和第二用戶間交往圈親密度、所述第一用戶和所述第二用戶間應(yīng)用偏好相似度和所述第一用戶和所述第二用戶間終端信息相似度;確定所述第一用戶和所述第二用戶間交往圈親密相似度、所述第一用戶和所述第二用戶間應(yīng)用偏好相似度和所述第一用戶和所述第二用戶間終端信息相似度的平均值;根據(jù)所述平均值,確定所述第一用戶和所述第二用戶間綜合相似度。進(jìn)一步的,所述確定模塊202還用于:根據(jù)所述應(yīng)用偏好得分和所述綜合相似度,確定應(yīng)用的推薦預(yù)測得分;將前n個最大的所述推薦預(yù)測得分對應(yīng)的應(yīng)用確定為所述推薦的應(yīng)用,所述n是小于總應(yīng)用個數(shù)的正整數(shù)。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用硬件實施例、軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。以上,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護(hù)范圍。當(dāng)前第1頁12