為用戶整合個性化資源的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種為用戶整合個性化資源的方法及裝置。其中的方法包括:確定目標用戶的相似用戶;獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源;將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。本發(fā)明不但獲取到目標用戶對應的資源,而且,將目標用戶的相似用戶對應的全部或者部分資源也一并填補到目標用戶的資源包中,由于相似用戶之間具有相似的行為/需求,因此,目標用戶對相似用戶的資源也具有相對較高的需求概率。通過這種方式,不但保證了向目標用戶整合出特定需求的個性化資源,而且,由于相似用戶資源的補充,可一次性獲取到更為豐富的資源。
【專利說明】為用戶整合個性化資源的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種為用戶整合個性化資源的方法及裝置。
【背景技術(shù)】
[0002]云計算(Cloud Computing),是一種基于互聯(lián)網(wǎng)的計算方式,通過這種方式,共享的軟硬件資源和信息可以按需求提供給計算機和其他設(shè)備,主要是基于互聯(lián)網(wǎng)的相關(guān)服務地增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經(jīng)常是虛擬化的資源。云是網(wǎng)絡(luò)、互聯(lián)網(wǎng)的一種比喻說法。云服務器是云計算服務的重要組成部分,是面向各類互聯(lián)網(wǎng)用戶提供綜合業(yè)務能力的服務平臺,平臺整合了傳統(tǒng)意義上的互聯(lián)網(wǎng)應用三大核心要素:計算、存儲、網(wǎng)絡(luò),面向用戶提供公用化的互聯(lián)網(wǎng)資源。
[0003]基于云計算,發(fā)展出了各種各樣的云服務。所謂云服務,可以理解為提供豐富功能的個性化產(chǎn)品(例如軟件),以滿足市場上日益膨脹的個性化需求。對于每一種云服務系統(tǒng),其云服務器上存儲了眾多用戶的信息(例如,手機號碼、用戶賬號等),如前描述,目前云服務器可以向用戶提供公用化的互聯(lián)網(wǎng)資源,但是,由于用戶身份、興趣、需求的不同,這不能滿足用戶的個性化需求。因此,如何基于眾多的用戶信息為每個用戶提供個性化資源,則是一個值得研究的技術(shù)課題。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供了為用戶整合個性化資源的方法及裝置,能夠為目標用戶整合個性化資源,滿足用戶個性化需求。
[0005]本發(fā)明提供了如下方案:
[0006]一種為用戶整合個性化資源的方法,包括:確定目標用戶的相似用戶;獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源;將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。
[0007]優(yōu)選的,所述確定目標用戶的相似用戶包括:基于多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
[0008]優(yōu)選的,為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
[0009]優(yōu)選的,為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
[0010]優(yōu)選的,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
[0011]優(yōu)選的,在基于所述多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶之后,如果目標用戶及其相似用戶對應的資源低于資源包容量,所述方法還包括:基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;將所述目標用戶的標簽相似用戶對應的全部或者部分資源一并整合進所述目標用戶的資源包。
[0012]優(yōu)選的,在將標簽相似用戶對應的資源整合進所述目標用戶的資源包之后,如果整合后的資源低于資源包容量,則通過目標用戶的歸屬地或當前位置查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包;如果整合后的資源高于資源包容量,則去除標簽相似用戶對應的資源的一部分,以滿足資源包容量限制。
[0013]優(yōu)選的,所述確定目標用戶的相似用戶包括:基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;基于多個標簽相似用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
[0014]優(yōu)選的,為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
[0015]優(yōu)選的,所述云端通信信息標簽包括房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞。
[0016]優(yōu)選的,為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
[0017]優(yōu)選的,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
[0018]優(yōu)選的,還包括:如果通過目標用戶及其相似用戶獲取的資源低于資源包容量,則通過目標用戶的歸屬地或當前位置查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包。
[0019]優(yōu)選的,所述被動通信信息包括接電號碼,所述主動通信信息包括撥電號碼,所述通信特征向量包括號碼特征向量,所述被動通信次數(shù)包括接電次數(shù),所述主動通信次數(shù)包括撥電次數(shù);或者,所述被動通信信息包括所述用戶接收到的短信或所述用戶接收到的即時消息,所述主動通信信息包括所述用戶發(fā)送的短信或所述用戶發(fā)送的即時消息,所述通信特征向量包括短信特征向量或即時消息特征向量,所述被動通信次數(shù)包括用戶接收到的短信的次數(shù)或即時消息的次數(shù),所述主動通信次數(shù)包括用戶發(fā)送短信的次數(shù)或即時消息的次數(shù)。
[0020]優(yōu)選的,在整合目標用戶的資源包之后,還包括:將所述資源包下發(fā)給目標用戶的客戶端和/或相似用戶的客戶端。
[0021]優(yōu)選的,所述確定目標用戶的相似用戶是基于云端記錄的多個用戶賬號信息,確定目標用戶的相似用戶,所述用戶賬戶信息包括電話號碼和/或用戶個人信息;所述資源包包括號碼包、工具軟件包、專業(yè)文檔、會議資訊、音頻資源、視頻資料和/或,新聞資訊。
[0022]優(yōu)選的,根據(jù)用戶客戶端的MEI或/和MSI作為用戶id識別出同一個用戶。
[0023]一種為用戶整合個性化資源的裝置,包括:相似用戶確定單元,用于確定目標用戶的相似用戶;資源獲取單元,用于獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源;資源整合單元,用于將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。
[0024]優(yōu)選的,所述相似用戶確定單元具體用于,基于多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
[0025]優(yōu)選的,所述相似用戶確定單元,用于為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);并通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
[0026]優(yōu)選的,所述相似用戶確定單元,用于為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;并通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
[0027]優(yōu)選的,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
[0028]優(yōu)選的,所述裝置還包括:標簽相似用戶確定單元,用于基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;所述資源獲取單元還用于獲取所述標簽相似用戶對應的資源;所述資源整合單元,還用于將所述目標用戶的標簽相似用戶對應的部分或者全部資源一并整合進所述目標用戶的資源包。
[0029]優(yōu)選的,所述裝置還包括:資源包調(diào)整單元,在整合后的資源低于資源包容量情況下,用于通過目標用戶的歸屬地查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包;在整合后的資源高于資源包容量情況下,用于去除標簽相似用戶對應的資源的一部分,以滿足資源包容量限制。
[0030]優(yōu)選的,所述相似用戶確定單元,用于基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;并且,基于多個標簽相似用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
[0031]優(yōu)選的,所述標簽相似用戶確定單元或者相似用戶確定單元,用于為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);并通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
[0032]優(yōu)選的,所述云端通信信息標簽包括房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞。
[0033]優(yōu)選的,所述標簽相似用戶確定單元或者相似用戶確定單元,用于為每個用戶建立標簽特征向量,其中,每一維特征表不一個云端通信信息標簽;每一維特征值表不:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;并通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
[0034]優(yōu)選的,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
[0035]優(yōu)選的,還包括:資源包調(diào)整單元,用于在通過目標用戶及其相似用戶獲取的資源低于資源包容量時,通過目標用戶的歸屬地或當前位置查找到熱門資源和/或目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包。
[0036]優(yōu)選的,其特征在于,所述被動通信信息包括接電號碼,所述主動通信信息包括撥電號碼,所述通信特征向量包括號碼特征向量,所述被動通信次數(shù)包括接電次數(shù),所述主動通信次數(shù)包括撥電次數(shù);或者,所述被動通信信息包括所述用戶接收到的短信或所述用戶接收到的即時消息,所述主動通信信息包括所述用戶發(fā)送的短信或所述用戶發(fā)送的即時消息,所述通信特征向量包括短信特征向量或即時消息特征向量,所述被動通信次數(shù)包括用戶接收到的短信的次數(shù)或即時消息的次數(shù),所述主動通信次數(shù)包括用戶發(fā)送短信或即時消息的次數(shù)。
[0037]優(yōu)選的,還包括:下發(fā)單元,用于將所述資源包下發(fā)給目標用戶的客戶端和/或相似用戶的客戶端。
[0038]優(yōu)選的,所述相似用戶確定單元是基于云端記錄的多個用戶賬號信息從而確定目標用戶的相似用戶,其中,所述用戶賬戶信息包括電話號碼和/或用戶個人信息;所述資源包包括號碼包、工具軟件包、專業(yè)文檔、會議資訊、音頻資源、視頻資料、和/或,新聞資訊。
[0039]優(yōu)選的,根據(jù)用戶客戶端的MEI或/和MSI作為用戶id識別出同一個用戶。
[0040]根據(jù)本發(fā)明提供的具體實施例,本發(fā)明公開了以下技術(shù)效果:
[0041]本發(fā)明實施例不但獲取到目標用戶對應的資源,而且,通過確定目標用戶的相似用戶,繼而將目標用戶的相似用戶對應的全部或者部分資源也一并填補到目標用戶的資源包中,由于相似用戶之間具有相似的行為或需求,因此,目標用戶對相似用戶的資源也具有相對較高的需求概率。通過這種方式,不但保證了向目標用戶整合出特定需求的個性化資源,而且,由于相似用戶資源的補充,可一次性獲取到更為豐富的資源。
[0042]以攔截騷擾號碼的號碼通為例,本發(fā)明相比于現(xiàn)有技術(shù)能夠顯著地提升內(nèi)置號碼命中率。因為不同用戶的歷史行為一般是有差異的,例如用戶A經(jīng)常接聽“廣告推銷”與“房產(chǎn)中介”的陌電,用戶B則經(jīng)常接聽“獵頭”與“外賣”的陌電,如果對用戶A與用戶B不加區(qū)分地采用相同常用號碼集合作為內(nèi)置號碼包,則會造成內(nèi)置號碼的浪費,沒有針對性。本發(fā)明介紹的技術(shù)根據(jù)用戶的歷史行為為其計算更加相關(guān)的內(nèi)置號碼包,加入了個性化信息,能夠顯著改善現(xiàn)有技術(shù)的缺陷。
[0043]本發(fā)明通過確定相似用戶,達到了為號碼通用戶推薦相關(guān)內(nèi)置號碼的目的。雖然本發(fā)明以號碼通為例進行了說明,但是實際上,本發(fā)明也可以為用戶推薦其相似用戶的其他資源,例如手機輸入法的細胞詞庫等等,以及技術(shù)資料、音頻資源、視頻資源、工具軟件包、專業(yè)文檔、會議資訊、影視資源、新聞資訊等等。
【專利附圖】
【附圖說明】
[0044]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0045]圖1是現(xiàn)有生成內(nèi)置號碼包的數(shù)據(jù)處理示意圖;
[0046]圖2是本發(fā)明實施例提供的為用戶整合個性化資源的方法流程圖;
[0047]圖3是本發(fā)明實施例提供的生成內(nèi)置號碼包的處理示意圖;
[0048]圖4是本發(fā)明實施例提供的為用戶整合個性化資源的裝置結(jié)構(gòu)圖。【具體實施方式】
[0049]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0050]如前所述,所謂云服務,可以理解為提供豐富功能的個性化產(chǎn)品(例如軟件),以滿足市場上日益膨脹的個性化需求。例如,號碼通是一種云服務,它是一款基于搜索引擎海量數(shù)據(jù),實現(xiàn)智能攔截方案的號碼工具類軟件(也稱為應用程序)。通過抓取互聯(lián)網(wǎng)中的公開電話信息,建立海量號碼數(shù)據(jù)庫,讓詐騙、中介、推銷等騷擾號碼無處遁形。面對陌生的騷擾號碼,用戶可以進行分類“標記”,充分利用智慧眾包,讓那些數(shù)據(jù)庫之外的漏網(wǎng)騷擾電話一一得到標記。號碼通的背后是一個龐大的云端號碼庫,其來源包括互聯(lián)網(wǎng)抓取、用戶標記、商家合作等等。號碼通進行陌電識別的原理是,當陌電打來的時候,聯(lián)網(wǎng)到云端查詢,并將查詢得到的陌電信息返回給客戶端,客戶端將陌電信息展示給用戶,從而幫助用戶得知陌電的信息。
[0051]但是對于2G網(wǎng)絡(luò)的手機用戶,號碼通的查詢機制存在一定缺陷,即2G網(wǎng)絡(luò)用戶在接電瞬間會發(fā)生斷網(wǎng),造成無法聯(lián)網(wǎng)到云端查詢陌電信息,使得一些本來可以識別的陌電無法得到識別。另外,一些在接電時沒有打開網(wǎng)絡(luò)的用戶也同樣存在這個問題。對此,可通過向客戶端下發(fā)內(nèi)置號碼包的方式解決。圖1是現(xiàn)有生成內(nèi)置號碼包的數(shù)據(jù)處理示意圖。首先根據(jù)所有用戶的接電撥電歷史數(shù)據(jù)抽取出少量的最常用號碼,然后將這部分常用號碼經(jīng)過加密壓縮打包后,在客戶端網(wǎng)絡(luò)空閑時下發(fā)到客戶端本地。這種方案的缺點主要表現(xiàn)在,所有用戶的內(nèi)置號碼包都是一樣的,沒有體現(xiàn)出不同用戶的個性化信息。例如,用戶A經(jīng)常受到房產(chǎn)中介電話的騷擾,用戶B經(jīng)常受到獵頭的騷擾,在這種情況下,將獵頭的號碼或廣告推銷的號碼放入用戶A的內(nèi)置號碼包就是一種資源浪費,而且對用戶A的陌電識別幫助不大。
[0052]從上述問題出發(fā),本發(fā)明旨在為用戶整合個性化資源。例如,通過為每個用戶計算生成一個內(nèi)置在客戶端本地的個性化內(nèi)置號碼包,當陌電打來時,號碼通可以優(yōu)先在本地內(nèi)置號碼包中進行查詢,如果查詢不到再嘗試進行聯(lián)網(wǎng)查詢,從而在一定程度上解決用戶不聯(lián)網(wǎng)或無法聯(lián)網(wǎng)造成的號碼查詢問題。
[0053]參見圖2,為本發(fā)明實施例的為用戶整合個性化資源的方法流程圖。該方法包括以下步驟:
[0054]S201:確定目標用戶的相似用戶;
[0055]具體可以是基于云端記錄的多個用戶賬號信息,確定目標用戶的相似用戶;
[0056]S202:獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源;
[0057]具體,從云端資源庫中,獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源;
[0058]S203:將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。
[0059]當目標用戶的全部相似用戶對應的資源總量與目標用戶對應的資源之和滿足資源包的容量限制或者滿足用戶客戶端的內(nèi)存要求時,可以將目標用戶的相似用戶對應的全部資源整合為該目標用戶的資源包。
[0060]當目標用戶的全部相似用戶對應的資源總量較多時,即目標用戶的全部形似用戶對應的資源總量與目標用戶對應的資源之和,大于資源包的容量限制或者大于用戶客戶端的內(nèi)存要求時,可以考慮將目標用戶的相似用戶對應的部分資源整合為該目標用戶的資源包,以滿足資源包的容量限制或者滿足用戶客戶端的內(nèi)存要求。
[0061]本發(fā)明實施例不但獲取到目標用戶對應的資源,而且,通過確定目標用戶的相似用戶,繼而將目標用戶的相似用戶對應的全部或者部分資源也一并填補到目標用戶的資源包中,由于相似用戶之間具有相似的行為或需求,因此,目標用戶對于相似用戶對應的資源也具有相對較高的需求概率。通過本發(fā)明實施例所述方式,不但可以保證向目標用戶整合出特定需求的個性化資源,而且,由于有相似用戶對應的資源的補充,可一次性為目標用戶獲取到更為豐富的資源。
[0062]其中,以上是基于云計算技術(shù)為背景對本發(fā)明實施例進行的說明,S卩,在確定目標用戶的相似用戶過程中,是基于云端記錄的多個用戶賬號信息進行的,而用戶的資源也是從云端資源庫中獲取的。但是本領(lǐng)域技術(shù)人員應該理解,本發(fā)明并不限于云計算技術(shù),可以基于其他已有的數(shù)據(jù)庫資源或未來的其他技術(shù)作為實現(xiàn)背景,只要能夠?qū)崿F(xiàn)確定目標用戶的相似用戶并獲取到相似用戶對應的資源即可。
[0063]如前已述,本發(fā)明實施例首先需要確定目標用戶的相似用戶。對于確定相似用戶的方式有多種。以上述號碼通軟件為例,由于關(guān)注的是用戶撥打或接聽的號碼,因此,可以根據(jù)用戶接電號碼或撥電號碼進行相似用戶的確定。即,可以基于多個用戶的接電號碼和/或撥電號碼的相似度,確定目標用戶的相似用戶。下面就各種情況分別以不同實施例對相似用戶的確定進行詳細說明。
[0064]第一實施例
[0065]在本實施例中,基于多個用戶的接電電話號碼的相似度,確定目標用戶的相似用戶。具體的,首先,為每個用戶建立號碼特征向量,其中,每一維特征表示一個電話號碼,可以是云端號碼,也可以是非云端號碼,每一維特征值表示接電次數(shù);然后,通過判斷兩個用戶的號碼特征向量的余弦相似度確定兩個用戶的相似程度。
[0066]例如,要確定用戶A和用戶B的相似程度,分別為用戶A和用戶B建立i維號碼特征向量:
[0067]用戶A 號碼特征向量:al:0, a2:4, a3:3,...,a1:0
[0068]用戶B 號碼特征向量:al:l,a2:6,a3:l,...,a1:0
[0069]其中,&1、32、33,...,ai代表不同的電話號碼,各電話號碼對應的值代表用戶接聽該電話號碼的次數(shù),例如上述用戶A號碼特征向量中“a2:4”表示用戶A接聽a2這個電話號碼的次數(shù)為4次。
[0070]然后,通過判斷用戶A和用戶B的號碼特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大(即余弦夾角越小),那么這兩個用戶就越相似。具體實現(xiàn)中,可以設(shè)置一個相似閾值,在兩個用戶相似度等于或大于該相似閾值情況下,確定兩個用戶為相似用戶。本領(lǐng)域技術(shù)人員可以理解,相似閾值越大,要求的用戶相似程度越高。例如,相似閾值優(yōu)選范圍在0.6至I之間。假設(shè),設(shè)置相似閾值為0.8,那么,兩個用戶相似度等于或大于0.8的情況下,確定這兩個用戶為相似用戶;再假設(shè),設(shè)置相似閾值為0.9,那么,兩個用戶相似度等于或大于0.9的情況下,確定這兩個用戶為相似用戶。相似閾值的設(shè)置可以根據(jù)最終相似用戶對應的資源數(shù)量的多少進行反向調(diào)節(jié)設(shè)定,相似閾值越接近1.0,目標用戶與相似用戶的相似度越高,即相似用戶對應的資源對于目標用戶的利用價值越高。
[0071]通過第一實施例中確定相似用戶的方式,充分考慮了兩個用戶被同一號碼“騷擾”的概率,從而盡可能準確地確定相似用戶。例如,對于經(jīng)常被房產(chǎn)中介騷擾的多個用戶,確定這些用戶為相似用戶,之后,在后續(xù)確定目標用戶的資源時,將相似用戶對應的騷擾號碼也一并包括在號碼包中,進一步可以下發(fā)給目標用戶,當然也可以下發(fā)給相似用戶,目標用戶可以基于號碼包進行相應操作,例如,屏蔽號碼包中的號碼等。
[0072]第二實施例
[0073]在本實施例中,基于多個用戶的撥電電話號碼的相似度,確定目標用戶的相似用戶。具體的,首先,為每個用戶建立號碼特征向量,其中,每一維特征表示一個電話號碼,可以是云端號碼,也可以是非云端號碼,每一維特征值表示撥電次數(shù);然后,通過判斷兩個用戶的號碼特征向量的余弦相似度確定兩個用戶的相似程度。[0074]例如,要確定用戶A和用戶B的相似程度,分別為用戶A和用戶B建立i維號碼特征向量:
[0075]用戶A 號碼特征向量:bl:0,b2:0,b3:l,…,b1:0
[0076]用戶B 號碼特征向量:bl:0,b2:l,b3:3,…,b1:l
[0077]其中,131士2士3,…,bi代表不同電話號碼,各電話號碼對應的值代表撥打該號碼的次數(shù),例如上述用戶A號碼特征向量中“b3:1”表示用戶A撥打b3這個號碼的次數(shù)為I。
[0078]然后,通過判斷用戶A和用戶B的號碼特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大(即余弦夾角越小),這兩個用戶越相似。具體實現(xiàn)中,可以設(shè)置一個相似閾值,在兩個用戶相似度等于或大于該相似閾值情況下,確定兩個用戶為相似用戶。本領(lǐng)域技術(shù)人員可以理解,相似閾值越大,要求的用戶相似程度越高。例如,相似閾值優(yōu)選范圍在0.6至I之間。假設(shè),設(shè)置相似閾值為0.8,那么,兩個用戶相似度等于或大于0.8的情況下,確定這兩個用戶為相似用戶;再假設(shè),設(shè)置相似閾值為0.9,那么,兩個用戶相似度等于或大于0.9的情況下,確定這兩個用戶為相似用戶。相似閾值的設(shè)置可以根據(jù)最終相似用戶的資源數(shù)量的多少進行反向調(diào)節(jié)設(shè)定,相似閾值越接近1.0,目標用戶與相似用戶的相似度越高,即相似用戶對應的資源對于目標用戶的利用價值越高。
[0079]通過第二實施例中確定相似用戶的方式,充分考慮了用戶撥打同一號碼的概率。例如,對于具有向某產(chǎn)品客服撥打記錄的用戶,如向蘋果公司客服撥電歷史的用戶,可以確定這些用戶都使用iPhone或ipad等蘋果公司終端,那么就可以在后續(xù)針對這些相似用戶整合適用于蘋果終端操作系統(tǒng)的軟件或產(chǎn)品。再比如,如果用戶經(jīng)常撥打某類電話(例如房產(chǎn)中介電話),就可以把此類的相似用戶的資源(例如房產(chǎn)信息、相關(guān)百科知識)也推薦給此用戶。
[0080]第三實施例
[0081]在本實施例中,基于多個用戶的接電電話號碼以及撥電電話號碼的相似度,確定目標用戶的相似用戶。具體的,首先,為每個用戶建立號碼特征向量,其中,每一維特征表示一個電話號碼,可以是云端號碼,也可以是非云端號碼,每一維特征值表示“接電次數(shù)*接電權(quán)重+撥電次數(shù)*撥電權(quán)重”,接電權(quán)重和撥電權(quán)重可以是事先預先設(shè)置的常量,由于重點關(guān)注非法號碼對用戶的騷擾,因此優(yōu)選情況下,可以設(shè)定接電權(quán)重大于或等于撥電權(quán)重;繼而,通過判斷兩個用戶的號碼特征向量的余弦相似度確定兩個用戶的相似程度。
[0082]例如,要確定用戶A和用戶B的相似程度,分別為用戶A和用戶B建立i維號碼特征向量:
[0083]用戶A 號碼特征向量:cl: (A-Cjl * A-Rjl + A-Bcl * A-Rbl), c2: (A-Cj2 *A-Rj2 + A-Bc2 * A-Rb2), c3: (A-Cj3 * A-Rj3 + A_Bc3 * A_Rb3),—, c1: (A-Cji *A-Rji + A-Bci * A-Rbi)
[0084]用戶B 號碼特征向量:cl: (B-CjI * B-Rjl + B-Bcl * B-Rbl), c2: (B-Cj2 *B-Rj2 + B-Bc2 * B-Rb2), c3: (B-Cj3 * B-Rj3 + B_Bc3 * B_Rb3),—, c1: (B-Cji *B-Rji + B-Bci * B-Rbi)
[0085]其中,(:1、02、03,...,ci代表不同電話號碼,各電話號碼對應的值代表接聽該號碼以及撥打該號碼的情況。例如,用戶A號碼特征向量中“cl: (A-Cjl * A-Rjl+A-Bcl *A-Rbl)”表示用戶A對于電話號碼Cl的特征值為(A-Cjl * A-Rjl + A-Bcl * A-Rbl),其中,A-CjI表不用戶A接聽電話號碼cl的次數(shù),A-RjI表不對于用戶A而言電話號碼cl的接電權(quán)重,A-BcI表不用戶A撥打電話號碼cl的次數(shù),A-RbI表不對于用戶A而言電話號碼Cl的撥電權(quán)重。
[0086]如前已述,由于重點關(guān)注非法號碼對用戶的騷擾,因此優(yōu)選情況下,接電權(quán)重可以大于撥電權(quán)重,即,A-Rjl大于A-Rbl。但是應該理解,對于不同電話號碼,接電權(quán)重可以相同,也可以不相同。同理,對于不同電話號碼,撥電權(quán)重可以相同,也可以不同,對此不作限制。例如,A-Rjl與A-Rj2相同或不同,等等。例如,如果騷擾電話或者推銷電話用戶接到的很多,遠大于房產(chǎn)中介或教育培培訓的電話等,可以考慮增加騷擾電話或者推銷電話的接電權(quán)重。比如,推銷電話的接電權(quán)重表示為A-Rj I,培訓電話的接電權(quán)重表示為A-Rj2,可以設(shè)置 A-Rjl 大于 A-Rj2,例如,A-Rjl = 80%, A-Rj2 = 30%。
[0087]關(guān)于接電權(quán)重可以根據(jù)接電的標簽類型進行統(tǒng)一設(shè)定,比如標簽為“房產(chǎn)中介”的所有接電電話的接電權(quán)重可以設(shè)定為同一個值。當然對于標簽相同,但對應電話號碼歸宿地或?qū)嶋H位置不同的接電電話,也可以設(shè)置不同的接電權(quán)重。具體設(shè)置標準可以根據(jù)目標用戶的實際需求進行設(shè)定,在此不再詳述。
[0088]然后,通過判斷用戶A和用戶B的號碼特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大(即余弦夾角越小),那么這兩個用戶就越相似。具體實現(xiàn)中,可以設(shè)置一個相似閾值,在兩個用戶相似度等于或大于該相似閾值情況下,確定兩個用戶為相似用戶。本領(lǐng)域技術(shù)人員可以理解,相似閾值越大,要求的用戶相似程度越高。例如,相似閾值優(yōu)選范圍在0.6至I之間。假設(shè),設(shè)置相似閾值為0.8,那么,兩個用戶相似度等于或大于0.8的情況下,確定這兩個用戶為相似用戶;再假設(shè),設(shè)置相似閾值為0.9,那么,兩個用戶相似度等于或大于0.9的情況下,確定這兩個用戶為相似用戶。同上所述相似閾值的設(shè)置可以根據(jù)最終相似用戶的資源數(shù)量的多少進行反向調(diào)節(jié)設(shè)定,相似閾值越接近1.0,目標用戶與相似用戶的相似度越高,即相似用戶對應的資源對于目標用戶的利用價值越高。
[0089]該第三實施例相較于第一實施例和第二實施例更為優(yōu)選,因為充分考慮了用戶撥打以及接聽同一電話號碼的概率,因此可以更為精準地確定目標用戶的相似用戶。當然,第一、二實施例具體分別針對了用戶撥打,用戶接聽同一電話號碼的概率,對于僅對撥電或者接電有需求的目標用戶來講,通過上述方法獲得的號碼包(本發(fā)明實施例所述資源包的一種)就更為準確和適合。
[0090]以上三個實施例是基于用戶接聽或/和撥打的號碼特征向量進行相似用戶判斷,這種基于用戶接聽或/和撥打的號碼來確定相似用戶存在一些缺陷,例如用戶特征向量大部分維度的特征值都為0,造成確定的相似用戶較少。在實際計算相似用戶時可以結(jié)合用戶接聽或撥打云端電話號碼的標簽來進行輔助判斷。也就是,除了號碼特征向量,還可以引入標簽特征向量進行替代或補充,從而更好更廣泛地確定相似用戶。
[0091]第四實施例
[0092]在基于上述第一實施例、第二實施例或第三實施例,確定目標用戶的相似用戶之后,如果通過目標用戶及其相似用戶對應的資源低于資源包容量,優(yōu)選地,可進一步執(zhí)行以下步驟:基于多個用戶的標簽相似度,確定目標用戶的標簽相似用戶;并且,在步驟203中,將目標用戶的標簽相似用戶對應的全部或者部分資源一并整合進目標用戶的資源包。如果整合后的資源仍低于資源包容量,則還可以通過目標用戶的歸屬地或當前位置查找到熱門資源,和/或目標用戶撥電號碼或接電號碼的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進資源包。如果整合后的資源高于資源包容量,則可以去除標簽相似用戶對應的資源的一部分,使得整合后的資源等于資源包容量。
[0093]其中,標簽相似度的確定過程與號碼相似度的確定過程類似,也可以有三種方式。
[0094]第一種方式是,為每個用戶建立標簽特征向量,其中,每一維特征表不一個云端號碼標簽,每一維特征值表示接電次數(shù);繼而,通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。其中,云端號碼標簽包括但不限于:房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞,等等。
[0095]例如,要確定用戶A和用戶B的標簽相似程度,分別為用戶A和用戶B建立i維標簽特征向量:
[0096]用戶A 標簽特征向量:dl:39,d2:19,d3:0,...,d1:8
[0097]用戶B 標簽特征向量:dl:20,d2:4,d3:25,...,d1:5
[0098]其中,dl、d2、d3,…,di代表不同標簽,各標簽對應的值代表用戶接聽屬于該標簽的電話號碼的次數(shù),例如上述用戶A標簽特征向量中“dl: 39”表示用戶A接聽屬于標簽dl的電話號碼的次數(shù)為39次。
[0099]然后,通過判斷用戶A和用戶B的標簽特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大(即余弦夾角越小),那么這兩個用戶就越相似。具體實現(xiàn)中,可以設(shè)置一個標簽相似閾值,在兩個用戶標簽相似度等于或大于該標簽相似閾值情況下,確定兩個用戶為標簽相似用戶。本領(lǐng)域技術(shù)人員可以理解,標簽相似閾值越大,要求的用戶相似程度越高。例如,標簽相似閾值優(yōu)選范圍在0.6至I之間。假設(shè),設(shè)置標簽相似閾值為0.8,那么,兩個用戶相似度等于或大于0.8的情況下,確定這兩個用戶為標簽相似用戶;再假設(shè),設(shè)置標簽相似閾值為0.9,那么,兩個用戶相似度等于或大于0.9的情況下,確定這兩個用戶為標簽相似用戶。同上所述標簽相似閾值的設(shè)置可以根據(jù)最終標簽相似用戶的資源數(shù)量的多少進行反向調(diào)節(jié)設(shè)定,標簽相似閾值越接近1.0,目標用戶與標簽相似用戶的相似度越高,即標簽相似用戶對應的資源對于目標用戶的利用價值越高。
[0100]第二種方式是,為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端號碼標簽,每一維特征值表示撥電次數(shù);繼而,通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。其中,云端號碼標簽包括但不限于:房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞,等等。
[0101]例如,要確定用戶A和用戶B的標簽相似程度,分別為用戶A和用戶B建立i維標簽特征向量:
[0102]用戶A 標簽特征向量:el:5,e2:9,e3:0,...,e1:23
[0103]用戶B 標簽特征向量:el:10,e2:8,e3:3,…,e1:12
[0104]其中,61、62、63,...,ei代表不同標簽,各標簽對應的值代表用戶撥打?qū)儆谠摌撕灥奶柎a的次數(shù),例如上述用戶A標簽特征向量中“el:5”表示用戶A撥打?qū)儆跇撕瀍l的號碼的次數(shù)為5次。[0105]然后,通過判斷用戶A和用戶B的標簽特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大(即余弦夾角越小),那么這兩個用戶就越相似。具體實現(xiàn)中,可以設(shè)置一個標簽相似閾值,在兩個用戶標簽相似度等于或大于該標簽相似閾值情況下,確定兩個用戶為標簽相似用戶。本領(lǐng)域技術(shù)人員可以理解,標簽相似閾值越大,要求的用戶相似程度越高。例如,標簽相似閾值優(yōu)選范圍在0.6至I之間。假設(shè),設(shè)置標簽相似閾值為0.8,那么,兩個用戶相似度等于或大于0.8的情況下,確定這兩個用戶為標簽相似用戶;再假設(shè),設(shè)置標簽相似閾值為0.9,那么,兩個用戶相似度等于或大于0.9的情況下,確定這兩個用戶為標簽相似用戶。同上所述標簽相似閾值的設(shè)置可以根據(jù)最終標簽相似用戶的資源數(shù)量的多少進行反向調(diào)節(jié)設(shè)定,標簽相似閾值越接近1.0,目標用戶與標簽相似用戶的相似度越高,即標簽相似用戶對應的資源對于目標用戶的利用價值越高。
[0106]第三種方式是,為每個用戶建立標簽特征向量,其中,每一維特征表不一個云端號碼標簽,每一維特征值表示“接電次數(shù)*接電權(quán)重+撥電次數(shù)*撥電權(quán)重”,由于重點關(guān)注非法號碼對用戶的騷擾,因此優(yōu)選情況下,接電權(quán)重可以大于或等于撥電權(quán)重;繼而,通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。其中,云端號碼標簽包括但不限于:房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞,等等。
[0107]例如,要確定用戶A和用戶B的標簽相似程度,分別為用戶A和用戶B建立i維標簽特征向量:
[0108]用戶A 標簽特征向量:Π: (A-Cjl * A-Rjl + A-Bcl * A-Rbl), f2: (A-Cj2 *A-Rj2 + A-Bc2 * A-Rb2), f3: (A-Cj3 * A-Rj3 + A_Bc3 * A_Rb3),...,f1: (A-Cji *A-Rji + A-Bci * A-Rbi)
[0109]用戶B 標簽特征向量:Π: (B-CjI * B-Rjl + B-Bcl * B-Rbl), f2: (B-Cj2 *B-Rj2 + B-Bc2 * B-Rb2), f3: (B-Cj3 * B-Rj3 + B_Bc3 * B_Rb3),...,f1: (B-Cji *B-Rji + B-Bci * B-Rbi)
[0110]其中,fl、f2、f3,…,fi代表不同標簽,各標簽對應的值代表用戶接聽和撥打?qū)儆谠摌撕灥奶柎a的次數(shù),例如用戶A標簽特征向量中“fl:(A-Cjl * A-Rjl+A-Bcl * A-Rbl)”表示用戶A對于標簽f I的特征值為(A-Cjl * A-Rjl + A-Bcl * A-Rbl),其中,A-CjI表示用戶A接聽屬于標簽Π的號碼的次數(shù),A-Rjl表示對于用戶A而言屬于標簽Π的號碼的接電權(quán)重,A-Bcl表不用戶A撥打?qū)儆跇撕瀎l的號碼的次數(shù),A-Rbl表不對于用戶A而言屬于標簽fl的號碼的撥電權(quán)重。
[0111]如前已述,由于重點關(guān)注非法號碼對用戶的騷擾,因此優(yōu)選情況下,接電權(quán)重大于或等于撥電權(quán)重,即,A-Rjl大于A-Rbl。但是應該理解,對于不同標簽的號碼,接電權(quán)重可以相同,也可以不相同,同理,對于不同標簽的號碼,撥電權(quán)重可以相同,也可以不同,本發(fā)明對此不作限制。例如,A-Rjl與A-Rj2可以相同或不同,等等。例如,如果騷擾電話或者推銷電話用戶接到的很多,遠大于中介或教育培訓的電話等,可以考慮增加騷擾電話或者推銷電話標簽的電話的接電權(quán)重。比如,推銷電話標簽的電話的接電權(quán)重表示為A-Rjl,教育培訓電話標簽的電話的接電權(quán)重表示為A-Rj2,可以設(shè)置A-Rjl大于A-Rj2,例如,A-Rjl=80%, A-Rj2 = 30%等。
[0112]然后,通過判斷用戶A和用戶B的標簽特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大(即余弦夾角越小),那么這兩個用戶就越相似。具體實現(xiàn)中,可以設(shè)置一個標簽相似閾值,在兩個用戶標簽相似度等于或大于該標簽相似閾值情況下,確定兩個用戶為標簽相似用戶。
[0113]本領(lǐng)域技術(shù)人員可以理解,標簽相似閾值越大,要求的用戶相似程度越高。例如,標簽相似閾值優(yōu)選范圍在0.6至I之間。假設(shè),設(shè)置標簽相似閾值為0.8,那么,兩個用戶相似度等于或大于0.8的情況下,確定這兩個用戶為標簽相似用戶;再假設(shè),設(shè)置標簽相似閾值為0.9,那么,兩個用戶相似度等于或大于0.9的情況下,確定這兩個用戶為標簽相似用戶。同上所述標簽相似閾值的設(shè)置可以根據(jù)最終標簽相似用戶的資源數(shù)量的多少進行反向調(diào)節(jié)設(shè)定,標簽相似閾值越接近1.0,目標用戶與標簽相似用戶的相似度越高,即標簽相似用戶對應的資源對于目標用戶的利用價值越高。
[0114]可以理解,通常通過標簽特征向量的方式確定的標簽相似用戶,比號碼特征向量的方式確定的相似用戶要多。雖然標簽相似度沒有號碼相似度體現(xiàn)的用戶相似程度高,但是,通過標簽相似度進行的標簽相似用戶判定具有節(jié)省資源的優(yōu)點,這是因為,兩個用戶撥打或接聽同一個標簽的號碼的概率要比撥打或接聽同一個號碼的概率高很多,例如,用戶A和用戶B都有可能受到屬于“房產(chǎn)中介”標簽的號碼的騷擾,但是不一定是相同的號碼的騷擾。
[0115]由此,在確定目標用戶的相似用戶的過程中,可以首先確定目標用戶的標簽相似用戶,繼而在標簽相似用戶中繼續(xù)篩選出相似用戶,從而達到節(jié)省資源的目的。下面在第五實施例中對此情況進行介紹。
[0116]第五實施例
[0117]在該實施例中,首先,基于多個用戶的接電電話號碼和/或撥電電話號碼的標簽相似度,確定目標用戶的標簽相似用戶;然后,再基于多個標簽相似用戶的接電電話號碼和/或撥電電話號碼的相似度,確定目標用戶的相似用戶。其中確定標簽相似用戶的方式請參見第四實施例描述的三種方式,確定相似用戶的實現(xiàn)請參見第一實施例、第二實施例、第三實施例描述的三種方式,此處不再贅述??梢?,確定標簽相似用戶至少有三種方式(第四實施例描述的三種方式),確定相似用戶的方式也至少有三種方式(第一實施例、第二實施例、第三實施例),因此,該第五實施例的具體實現(xiàn)方式有多種組合。[0118]第五實施例最優(yōu)的一種方式是,采用第四實施例的第三種方式確定標簽相似用戶,進而采用第三實施例確定相似用戶,這是因為,第四實施例的第三種方式充分考慮了用戶撥打以及接聽同一標簽的電話號碼的概率,因此可以更為精準地確定標簽相似用戶,同理,第三實施例充分考慮了用戶撥打以及接聽同一號碼的概率,因此可以更為精準地確定相似用戶。
[0119]當然除了上述最優(yōu)的方式之外,其余組合方式也是具有實際意義的。比如,采用第四實施例的第一種方式確定標簽相似用戶,采用第一實施例確定相似用戶,這種情況下,第四實施例的第一種方式充分考慮了用戶接聽同一標簽的號碼的概率,同理,第一實施例充分考慮了用戶接聽同一號碼的概率,可見,這種方式適合用戶用于防止非法電話騷擾的情形。
[0120]再比如,采用第四實施例的第二種方式確定標簽相似用戶,采用第二實施例確定相似用戶,這種情況下,第四實施例的第二種方式充分考慮了用戶撥打同一標簽的號碼的概率,同理,第二實施例充分考慮了用戶撥打同一號碼的概率,可見,這種方式適合通過用戶撥打記錄確定用戶行為的情況。
[0121]另外,通過撥打與接聽的交叉組合,也是可行的。比如,采用第四實施例的第一種方式確定標簽相似用戶,進而采用第二實施例確定相似用戶,這種情況下,第四實施例的第一種方式充分考慮了用戶接聽同一標簽的號碼的概率,而第二實施例充分考慮了用戶撥打同一號碼的概率。
[0122]再比如,采用第四實施例的第二種方式確定標簽相似用戶,采用第一實施例確定相似用戶,這種情況下,第四實施例的第二種方式充分考慮了用戶撥打同一標簽的號碼的概率,而第一實施例充分考慮了用戶接聽同一號碼的概率。
[0123]再比如,采用第四實施例的第三種方式確定標簽相似用戶,采用第一實施例確定相似用戶,這種情況下,第四實施例的第三種方式充分考慮了用戶接聽及撥打同一標簽的號碼的概率,而第一實施例充分考慮了用戶接聽同一號碼的概率??傊?,通過排列組合,一共有九種實現(xiàn)方式,此處不一一贅述。
[0124]上述僅以號碼通為例進行說明,但是本領(lǐng)域技術(shù)人員應該理解,本發(fā)明實施例對于其他應用場景/需求同樣適用。實際上,對于通過云技術(shù)為用戶提供資源的方案,本發(fā)明實施例都適用。例如,如果云端針對特定群體的用戶,例如同屬于某一【技術(shù)領(lǐng)域】的人員,可以向他們提供該【技術(shù)領(lǐng)域】的會議咨詢、技術(shù)資料等個性化資源包。因此,本發(fā)明實施例中提到的資源包包括但不限于內(nèi)置號碼包、工具軟件包、專業(yè)文檔、會議資訊、音頻資源、視頻資料、和/或,新聞資訊。本發(fā)明實施例中提到的用戶賬戶信息包括但不限于電話號碼和/或用戶個人信息。
[0125]本發(fā)明適用于各類通信場景。例如,上述號碼通實施例中是以接聽和/或撥打電話為例進行說明的,具體的,是基于用戶接電和/或撥電次數(shù)的統(tǒng)計從而確定相似用戶??梢岳斫?,本發(fā)明是基于多個用戶的被動通信信息和/或主動通信信息的相似度,確定目標用戶的相似用戶。其中,除了上述介紹的接電和撥電通信方式之外,對于短信或即時通信工具(例如,微信、QQ、飛信)等通信方式,本發(fā)明都是適用的。例如,對于短信或即時通信工具方式,被動通信信息是指用戶接收到的短信或用戶接收到的即時消息,主動通信信息是指用戶發(fā)送的短信或用戶發(fā)送的即時消息,那么,通過建立短信或即時消息特征向量,并統(tǒng)計用戶接收到的短信或即時消息的次數(shù)以及用戶發(fā)送短信或即時消息的次數(shù),利用上述介紹的各個實施例方法即可確定目標用戶的相似用戶。
[0126]基于云技術(shù)的云服務為用戶提供豐富的資源,其來源包括互聯(lián)網(wǎng)抓取、用戶標記、商家合作等等。云端服務器可以根據(jù)用戶id識別出唯一的用戶,根據(jù)該用戶id查找到該用戶對應的資源。其中,用戶id是唯一識別用戶客戶端(終端)的唯一標識信息,具體地,可以根據(jù)用戶客戶端的IMEI(International Mobile Equipment Identity,國際移動設(shè)備身份石馬)或 / 和 IMSI (International Mobile Subscriber Identification Number,國際移動用戶識別碼)作為用戶id識別出同一個用戶。本發(fā)明實施例除了獲取目標用戶自身對應的資源之外,還將目標用戶的相似用戶的對應的資源的部分或者全部也一并獲取到,以此填補到目標用戶的資源包中。
[0127]本發(fā)明實施例不但獲取到目標用戶對應的資源,而且,將目標用戶的相似用戶對應的資源的部分或者全部也一并填補到目標用戶的資源包中,由于相似用戶之間具有相似的行為或需求,因此,目標用戶對相似用戶對應的資源也具有相對較高的需求概率。通過這種方式,不但保證了向目標用戶整合出特定需求的個性化資源,而且,由于相似用戶對應的資源的補充,可一次性獲取到更為豐富的資源。
[0128]在上述步驟之后,如果通過目標用戶及其相似用戶獲取的資源低于資源包容量,還可以進一步填補資源包,以避免容量浪費。例如,可以通過目標用戶的歸屬地查找到熱門資源和/或目標用戶撥電號碼或接電號碼的標簽查找到熱門資源,將全部或者部分熱門資源補充進資源包。
[0129]另外,在上述S201-S203步驟之后,優(yōu)選執(zhí)行以下步驟:將資源包下發(fā)給目標用戶的客戶端,其中,該資源包是采用上述介紹的任何一種方法獲得的資源包。當然也可以將資源包下發(fā)給相似用戶的客戶端,或者將資源包下發(fā)給目標用戶和相似用戶的客戶端。將資源包下發(fā)給目標用戶或相似用戶的客戶端的好處是,當目標用戶客戶端無法聯(lián)網(wǎng)時(例如上面提到的2G網(wǎng)絡(luò)的手機用戶、沒有打開網(wǎng)絡(luò)的用戶等情況),就可以直接在本地使用該預先獲取的資源包。
[0130]下面以號碼通為例對本發(fā)明實施例進行說明。
[0131]參見圖3,為基于本發(fā)明的生成內(nèi)置號碼包的處理示意圖。如圖3所示,以用戶A為目標用戶,為該用戶A生成內(nèi)置號碼包的過程包括四個步驟。首先,確定用戶A相似用戶;其次,確定用戶A及其相似用戶的接電或撥電號碼集合;然后,可以對該號碼集合進行必要的操作例如過濾、加密、壓縮等,生成用戶A的內(nèi)置號碼包;最后,在空閑時或其他情形(例如用戶申請時),將該內(nèi)置號碼包下發(fā)給用戶A客戶端。本領(lǐng)域技術(shù)人員可以理解,也可以將內(nèi)置號碼包下發(fā)給相似用戶?;蛘?,在將內(nèi)置號碼包下發(fā)給目標用戶的同時,也可以將內(nèi)置號碼包下發(fā)給相似用戶。
[0132]下面結(jié)合圖3,對實現(xiàn)關(guān)鍵技術(shù)點進行詳細說明。
[0133]首先,明確識別出同一個號碼通用戶。在號碼通用戶的歷史接電、撥電行為日志中,如果兩個用戶的IMEI號(針對手機)一致,則認為是同一用戶;或者,如果兩個用戶的IMSI號(針對手機卡)一致,則認為是同一用戶;或者,優(yōu)選的,如果兩個用戶的MEI號(針對手機)與IMSI號(針對手機卡)都一致(這樣可以更為準確地確定用戶),則認為是同一用戶。將用戶的頂EI和MSI號連起來作為用戶的id(也可以只用MEI或MSI作為用戶id),計算用戶內(nèi)置號碼包以及為用戶下發(fā)內(nèi)置號碼包都可以根據(jù)這個id進行的。
[0134]其次,確定目標用戶的相似用戶。其中,確定目標用戶的相似用戶的方法有兩類方式,介紹如下:
[0135](I)基于“號碼相似”來確定相似用戶
[0136]其中,“號碼相似”是指用戶接聽或撥打的號碼的相似程度。
[0137]如前在第一實施例至第三實施例介紹的,每個用戶可以表示為一個號碼特征向量,特征向量中的每一維特征代表一個電話號碼,該電話號碼可以是云端號碼也可以是非云端號碼,每一維特征值可以是該維特征所對應號碼的接電次數(shù),這樣利于預測用戶的接電行為。特征值也可以是該維特征所對應號碼的撥電次數(shù),這樣利于預測用戶的撥電行為。優(yōu)選地,本發(fā)明實施例中采用的特征值的含義是:該維特征所對應號碼的“接電次數(shù)*接電權(quán)重+撥電次數(shù)*撥電權(quán)重”,接電權(quán)重與撥電權(quán)重是事先設(shè)定好的常量或者可調(diào)變量,考慮到號碼通重點預測接電的信息(防止騷擾電話),所以優(yōu)選地,接電權(quán)重大于或等于撥電權(quán)重。除此優(yōu)選情況之外,當然,特征值的含義還可以僅表示該維特征所對應號碼的接電次數(shù),同理,特征值的含義還可以僅表示該維特征所對應號碼的撥電次數(shù)。通過判斷兩個用戶的號碼特征向量的余弦相似度來確定這兩個用戶的相似程度,兩個用戶特征向量的余弦相似度越大,即余弦夾角越小,那么這兩個用戶就越相似。
[0138](2)基于“號碼相似”與“標簽相似”結(jié)合的方式,確定相似用戶
[0139]其中,“標簽相似”是指用戶接聽或撥打的云端號碼的標簽的相似程度。
[0140]僅基于“號碼相似”來確定相似用戶的方式基于用戶接聽或撥打的號碼來確定相似用戶存在一些缺陷,例如當用戶特征向量大部分維度的特征值都為O時,確定的相似用戶數(shù)量就較少。在實際計算相似用戶時,可進一步需要結(jié)合用戶接打云端號碼的標簽來進行輔助判斷。具體方法是,如前面第四實施例介紹的,為每個用戶維護一個標簽特征向量,每一維代表該用戶接打云端號碼的標簽(例如“房產(chǎn)中介”、“廣告推銷”、“騷擾電話”、“快遞”、“推銷電話”、“貸款”等等),優(yōu)選的,每一維特征的特征值的含義可以是用戶對該維特征所對應標簽的云端號碼的接打次數(shù)加權(quán)和,即“接電次數(shù)*接電權(quán)重+撥電次數(shù)*撥電權(quán)重”。除此優(yōu)選情況之外,當然,特征值的含義還可以僅表示用戶對該維特征所對應標簽的云端號碼的“接電次數(shù)”,同理,特征值的含義還可以僅表示用戶對該維特征所對應標簽的云端號碼的“撥電次數(shù)”。可以理解,標簽特征向量比號碼特征向量的維度小很多,因為成百上千的號碼都可以映射為同一個標簽,這使得計算效率大大提高。
[0141]“號碼相似”與“標簽相似”結(jié)合的方式至少包括以下兩種。
[0142](2.1)首先采用“號碼相似”確定相似用戶,然后采用“標簽相似”對相似用戶進行補充。先判斷相似用戶,如果通過相似用戶確定的號碼已經(jīng)足夠內(nèi)置號碼包的容量,就可以不判斷標簽相似用戶,如果沒達到,就可以進一步進行標簽相似用戶的判斷,即利用標簽相似用戶的接電或撥電號碼填充內(nèi)置號碼包??梢姡@種方式是通過標簽相似用戶對相似用戶進行輔助。
[0143](2.2)首先采用“標簽相似”確定標簽相似用戶,然后采用“號碼相似”從標簽相似用戶中確定相似用戶??梢岳斫猓m然標簽相似用戶所體現(xiàn)的相似度沒有用號碼相似用戶體現(xiàn)出來的相似度質(zhì)量高,但為了節(jié)省計算資源,可以考慮當兩個用戶的標簽相同的情況下,再去判斷他們的號碼是否相似,即先確定出標簽相似用戶,再從標簽相似用戶中確定相似用戶。
[0144]仍以圖3為例,為一個用戶生成個性化內(nèi)置號碼包的基本步驟如下:
[0145](a)確定用戶A接聽或/和撥打過的云端號碼,并將這些云端號碼放進用戶A的內(nèi)置號碼包;
[0146](b)通過上述(I)或(2)的方式,確定與用戶A相似的若干相似用戶;
[0147](C)確定這些相似用戶接聽或撥打過而用戶A沒有接聽或撥打過的云端號碼,全部或者部分并放入用戶A的內(nèi)置號碼包;
[0148](d)如果第c步生成的號碼量不夠多,即,獲取的號碼量低于用戶A的內(nèi)置號碼包最大容量,則優(yōu)選地,可進一步利用用戶A的歸屬地以及用戶A撥電、接電號碼的標簽等信息,為用戶A補充一些熱門號碼。
[0149]需要說明的是,為了節(jié)省下發(fā)資源,如果第c步生成的號碼量不夠多,可進一步利用該用戶的歸屬地、該用戶的當前位置以及該用戶撥電接電號碼的標簽等信息為該用戶補充一些熱門的陌電。這樣做的好處是:現(xiàn)在每個內(nèi)置號碼包的大小例如可以是5000個號碼,如果這個用戶的個性化數(shù)據(jù)不多,則該用戶的個性化號碼有可能湊不到5000個,這時就用一些熱門陌電號碼把他的個性包湊成5000個,避免下發(fā)浪費。
[0150]具體實例
[0151]一個用戶接打電話號碼的集合為{A,B,C,D},該用戶有3個相似用戶,第I個相似用戶接打電話號碼的集合為{A,B,C,E},第2個相似用戶接打號碼的集合為{A,C,E,F(xiàn)},第3個相似用戶接打電話號碼的集合為{B,C,G,H}。那么該用戶的相似用戶接打過而該用戶沒有接打過的號碼集合為{E,F(xiàn),G,H}。例如其中H號碼不是云端號碼,即沒有H號碼的標簽信息。則將{A,B,C,D,E,F(xiàn),G}這些號碼放入該用戶的內(nèi)置號碼包。如果號碼H經(jīng)過相似用戶的標注而成為云端號碼,則也將H放入該用戶的內(nèi)置號碼包。
[0152]本發(fā)明相比于現(xiàn)有技術(shù)能夠顯著地提升內(nèi)置號碼命中率。因為不同用戶的歷史行為一般是有差異的,例如用戶A經(jīng)常接聽“廣告推銷”與“房產(chǎn)中介”的陌電,用戶B則經(jīng)常接聽“獵頭”與“外賣”的陌電,如果對用戶A與用戶B不加區(qū)分地采用相同常用號碼集合作為內(nèi)置號碼包,則會造成內(nèi)置號碼的浪費,沒有針對性。本發(fā)明介紹的技術(shù)根據(jù)用戶的歷史行為為其計算更加相關(guān)的內(nèi)置號碼包,加入了個性化信息,能夠顯著改善現(xiàn)有技術(shù)的缺陷。
[0153]本發(fā)明通過確定相似用戶,達到了為號碼通用戶推薦相關(guān)內(nèi)置號碼的目的。雖然本發(fā)明以號碼通為例進行了說明,但是實際上,也可以為一個用戶推薦其相似用戶的其他資源,例如手機輸入法的細胞詞庫等等,以及前述的技術(shù)資料、視頻資源等等。
[0154]與上述方法相對應,本發(fā)明還提供一種為用戶整合個性化資源的裝置。本領(lǐng)域技術(shù)人員可以理解,該裝置可以是由硬件、軟件或者軟硬件結(jié)合實現(xiàn)。具體的,可以是指云端的設(shè)備(例如云服務器)或者云端的設(shè)備(例如云服務器)內(nèi)的功能實體。
[0155]參見圖4,為本發(fā)明為用戶整合個性化資源的裝置的結(jié)構(gòu)示意圖。該裝置包括相似用戶確定單元401、資源獲取單元402以及資源整合單元403。
[0156]其中:
[0157]相似用戶確定單元401,用于確定目標用戶的相似用戶;
[0158]優(yōu)選地,相似用戶確定單元401是基于云端記錄的多個用戶賬號信息從而確定目標用戶的相似用戶,其中,所述用戶賬戶信息包括電話號碼和/或用戶個人信息;所述資源包包括號碼包、工具軟件包、專業(yè)文檔、會議資訊、音頻資源、視頻資料、和/或,新聞資訊。
[0159]資源獲取單元402,用于獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源;
[0160]資源整合單元403,用于將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。
[0161]優(yōu)選地,根據(jù)用戶客戶端的MEI或/和MSI作為用戶id識別出同一個用戶。
[0162]其中,確定目標用戶的相似用戶有多種實現(xiàn)方式。
[0163]一種實現(xiàn)方式中,相似用戶確定單元401具體用于,基于多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。具體地,相似用戶確定單元401用于為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);并通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶的相似程度,確定是否為相似用戶;
[0164]或者,相似用戶確定單元401,用于為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;并通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶的相似程度,確定是否為相似用戶。其中,所述被動通信權(quán)重可以大于或等于所述主動通信權(quán)重。
[0165]另一種實現(xiàn)方式中,該裝置還包括:標簽相似用戶確定單元404,用于基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;此情況下,資源獲取單元402還用于獲取所述標簽相似用戶對應的資源,以及,資源整合單元403,還用于將所述目標用戶的標簽相似用戶對應的部分或者全部資源一并整合進所述目標用戶的資源包。
[0166]優(yōu)選地,該裝置還包括資源包調(diào)整單元406,在整合后的資源低于資源包容量情況下,用于通過目標用戶的歸屬地、或目標用戶的當前位置,查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包;在整合后的資源高于資源包容量情況下,用于去除標簽相似用戶對應的資源的一部分,以滿足資源包容量限制。
[0167]再有一種實現(xiàn)方式中,相似用戶確定單元401,用于基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;并且,基于多個標簽相似用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
[0168]在確定標簽相似用戶過程中,所述標簽相似用戶確定單元404或者相似用戶確定單元401,用于為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);并通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶;或者,所述標簽相似用戶確定單元404或者相似用戶確定單元401,用于為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;并通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。其中,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。優(yōu)選地,所述云端通信信息標簽包括房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、貸款、外賣、獵頭、快遞等坐寸O
[0169]優(yōu)選地,該裝置還包括:資源包調(diào)整單元406,用于在通過目標用戶及其相似用戶獲取的資源低于資源包容量時,通過目標用戶的歸屬地、或者目標用戶的當前位置查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包。
[0170]優(yōu)選地,所述被動通信信息可以包括接電號碼,所述主動通信信息包括撥電號碼,所述通信特征向量包括號碼特征向量,所述被動通信次數(shù)包括接電次數(shù),所述主動通信次數(shù)包括撥電次數(shù);或者,所述被動通信信息包括所述用戶接收到的短信或所述用戶接收到的即時消息,所述主動通信信息包括所述用戶發(fā)送的短信或所述用戶發(fā)送的即時消息,所述通信特征向量包括短信或即時消息特征向量,所述被動通信次數(shù)包括用戶接收到的短信或即時消息的次數(shù),所述主動通信次數(shù)包括用戶發(fā)送短信或即時消息的次數(shù)。
[0171]優(yōu)選地,該裝置還包括:下發(fā)單元405,用于將所述資源包下發(fā)給目標用戶或相似用戶的客戶端。下發(fā)單元405也可以將所述資源包下發(fā)給目標用戶和相似用戶的客戶端。
[0172]通過以上的實施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。
[0173]本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置或系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。以上所描述的裝置及系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。
[0174]以上對本發(fā)明所提供的為用戶整合個性化資源的方法及裝置進行了詳細介紹,本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實施方式】及應用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應理解為對本發(fā)明的限制。
【權(quán)利要求】
1.一種為用戶整合個性化資源的方法,其特征在于,包括: 確定目標用戶的相似用戶; 獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源; 將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定目標用戶的相似用戶包括: 基于多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于, 為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示被動通信次數(shù)或主動通信次數(shù); 通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于, 為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重; 通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,在基于所述多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶之后,如果目標用戶及其相似用戶對應的資源低于資源包容量,所述方法還包括: 基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶; 將所述目標用戶的標簽相似用戶對應的全部或者部分資源一并整合進所述目標用戶的資源包。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在將標簽相似用戶對應的資源整合進所述目標用戶的資源包之后, 如果整合后的資源低于資源包容量,則通過目標用戶的歸屬地或當前位置查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包; 如果整合后的資源高于資源包容量,則去除標簽相似用戶對應的資源的一部分,以滿足資源包容量限制。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定目標用戶的相似用戶包括: 基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶; 基于多個標簽相似用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于, 為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示被動通信次數(shù)或主動通信次數(shù); 通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述云端通信信息標簽包括房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞。
11.根據(jù)權(quán)利要求8所述的方法,其特征在于, 為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重; 通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
13.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 如果通過目標用戶及其相似用戶獲取的資源低于資源包容量,則通過目標用戶的歸屬地或當前位置查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包。
14.根據(jù)權(quán)利要求2-13任一項所述的方法,其特征在于, 所述被動通信信息包括接電號碼,所述主動通信信息包括撥電號碼,所述通信特征向量包括號碼特征向量,所述被動通信次數(shù)包括接電次數(shù),所述主動通信次數(shù)包括撥電次數(shù);或者, 所述被動通信信息包括所述用戶接收到的短信或所述用戶接收到的即時消息,所述主動通信信息包括所述用戶發(fā)送的短信或所述用戶發(fā)送的即時消息,所述通信特征向量包括短信特征向量或即時消息特征向量,所述被動通信次數(shù)包括用戶接收到的短信的次數(shù)或即時消息的次數(shù),所述主動通信次數(shù)包括用戶發(fā)送短信的次數(shù)或即時消息的次數(shù)。
15.根據(jù)權(quán)利要求1所述的方法,其特征在于,在整合目標用戶的資源包之后,還包括: 將所述資源包下發(fā)給目標用戶的客戶端和/或相似用戶的客戶端。
16.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定目標用戶的相似用戶是基于云端記錄的多個用戶賬號信息,確定目標用戶的相似用戶,所述用戶賬戶信息包括電話號碼和/或用戶個人信息;所述資源包包括號碼包、工具軟件包、專業(yè)文檔、會議資訊、音頻資源、視頻資料和/或,新聞資訊。
17.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)用戶客戶端的IMEI或/和IMSI作為用戶id識別出同一個用戶。
18.一種為用戶整合個性化資源的裝置,其特征在于,包括: 相似用戶確定單元,用于確定目標用戶的相似用戶; 資源獲取單元,用于獲取目標用戶對應的資源,以及,獲取目標用戶的相似用戶對應的資源; 資源整合單元,用于將目標用戶對應的資源以及目標用戶的相似用戶對應的全部或者部分資源整合為該目標用戶的資源包。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述相似用戶確定單元具體用于,基于多個用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
20.根據(jù)權(quán)利要求19所 述的裝置,其特征在于,所述相似用戶確定單元,用于為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);并通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
21.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述相似用戶確定單元,用于為每個用戶建立通信特征向量,其中,每一維特征表示一個通信信息;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;并通過判斷兩個用戶的通信特征向量的余弦相似度確定兩個用戶是否為相似用戶。
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
23.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述裝置還包括: 標簽相似用戶確定單元,用于基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶; 所述資源獲取單元還用于獲取所述標簽相似用戶對應的資源;所述資源整合單元,還用于將所述目標用 戶的標簽相似用戶對應的部分或者全部資源一并整合進所述目標用戶的資源包。
24.根據(jù)權(quán)利要求23所述的裝置,其特征在于,所述裝置還包括: 資源包調(diào)整單元,在整合后的資源低于資源包容量情況下,用于通過目標用戶的歸屬地查找到熱門資源,和/或,目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包;在整合后的資源高于資源包容量情況下,用于去除標簽相似用戶對應的資源的一部分,以滿足資源包容量限制。
25.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述相似用戶確定單元,用于基于多個用戶的被動通信信息和/或主動通信信息的標簽相似度,確定所述目標用戶的標簽相似用戶;并且,基于多個標簽相似用戶的被動通信信息和/或主動通信信息的相似度,確定所述目標用戶的相似用戶。
26.根據(jù)權(quán)利要求23或25所述的裝置,其特征在于,所述標簽相似用戶確定單元或者相似用戶確定單元,用于為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示被動通信次數(shù)或主動通信次數(shù);并通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
27.根據(jù)權(quán)利要求26所述的裝置,其特征在于,所述云端通信信息標簽包括房產(chǎn)中介、廣告推銷、騷擾電話、推銷電話、教育培訓、貸款、外賣、獵頭、快遞。
28.根據(jù)權(quán)利要求23或25所述的裝置,其特征在于,所述標簽相似用戶確定單元或者相似用戶確定單元,用于為每個用戶建立標簽特征向量,其中,每一維特征表示一個云端通信信息標簽;每一維特征值表示:被動通信次數(shù)*被動通信權(quán)重+主動通信次數(shù)*主動通信權(quán)重;并通過判斷兩個用戶的標簽特征向量的余弦相似度確定兩個用戶是否為標簽相似用戶。
29.根據(jù)權(quán)利要求28所述的裝置,其特征在于,所述被動通信權(quán)重大于或等于所述主動通信權(quán)重。
30.根據(jù)權(quán)利要求18所述的裝置,其特征在于,還包括: 資源包調(diào)整單元,用于在通過目標用戶及其相似用戶獲取的資源低于資源包容量時,通過目標用戶的歸屬地或當前位置查找到熱門資源和/或目標用戶主動通信信息或被動通信信息的標簽查找到熱門資源,將全部或者部分所述熱門資源補充進所述資源包。
31.根據(jù)權(quán)利要求19-30任一項所述的裝置,其特征在于, 所述被動通信信息包括接電號碼,所述主動通信信息包括撥電號碼,所述通信特征向量包括號碼特征向量,所述被動通信次數(shù)包括接電次數(shù),所述主動通信次數(shù)包括撥電次數(shù);或者, 所述被動通信信息包括所述用戶接收到的短信或所述用戶接收到的即時消息,所述主動通信信息包括所述用戶發(fā)送的短信或所述用戶發(fā)送的即時消息,所述通信特征向量包括短信特征向量或即時消息特征向量,所述被動通信次數(shù)包括用戶接收到的短信的次數(shù)或即時消息的次數(shù),所述主動通信次數(shù)包括用戶發(fā)送短信或即時消息的次數(shù)。
32.根據(jù)權(quán)利要求18所述的裝置,其特征在于,還包括: 下發(fā)單元,用于將所述資源包下發(fā)給目標用戶的客戶端和/或相似用戶的客戶端。
33.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述相似用戶確定單元是基于云端記錄的多個用戶賬號信息從而確定目標用戶的相似用戶,其中,所述用戶賬戶信息包括電話號碼和/或用戶個人信息;所述資源包包括號碼包、工具軟件包、專業(yè)文檔、會議資訊、音頻資源、視頻資料、和/ 或,新聞資訊。
34.根據(jù)權(quán)利要求18所述的裝置,其特征在于,根據(jù)用戶客戶端的MEI或/和MSI作為用戶id識別出同一個用戶。
【文檔編號】H04L29/08GK103929484SQ201410158029
【公開日】2014年7月16日 申請日期:2014年4月18日 優(yōu)先權(quán)日:2014年4月18日
【發(fā)明者】唐拯, 王志軍, 張揚 申請人:北京搜狗科技發(fā)展有限公司