一種基于簽到特征的用戶位置分類方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于社交網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)領(lǐng)域,更具體地,涉及一種基于簽到特征的用 戶位置分類方法及系統(tǒng)。
【背景技術(shù)】
[0002] 基于位置的社交網(wǎng)絡(luò)是隨著智能手機(jī)的流行而出現(xiàn)的一種新應(yīng)用。在基于位置的 社交網(wǎng)絡(luò)里面,用戶可以通過"簽到"這一操作來讓他的好友知道他具體什么時(shí)候在哪兒。 因此,從用戶的"簽到"軌跡中,不僅可以洞察到用戶的移動行為,還能了解到用戶個(gè)人的偏 好。目前,基于用戶"簽到"軌跡的工作可以分為兩種,即位置預(yù)測與位置推薦。位置預(yù)測 的任務(wù)是在給定用戶歷史"簽到"軌跡以及當(dāng)前"簽到"場所的情況下,對用戶下一個(gè)可能的 "簽到"場所進(jìn)行預(yù)測。這項(xiàng)工作代表了對用戶移動行為規(guī)律的捕獲,可以服務(wù)于城市規(guī)劃, 傳染病的預(yù)防以及移動通信網(wǎng)絡(luò)里面的資源管理等。與位置預(yù)測不同,位置推薦主要致力 于捕獲用戶個(gè)人的位置偏好,然后基于用戶的偏好,推薦用戶去一些流行場所進(jìn)行"簽到"。 位置推薦可以服務(wù)于移動市場,針對性的廣告推薦等領(lǐng)域。與現(xiàn)有的位置預(yù)測和位置推薦 工作不同,本發(fā)明致力于為用戶的"簽到"場所進(jìn)行分類。基于對用戶"簽到"數(shù)據(jù)的觀察與 分析,結(jié)果證明了用戶頻繁"簽到"場所的個(gè)數(shù)一般限定在兩到三個(gè)。這些被用戶頻繁"簽 到"的場所在很大程度上不僅主導(dǎo)了用戶自身的移動行為,而且還反映了用戶個(gè)人的偏好。 比如,某一用戶每周五下班之后都會去體育館。從這一現(xiàn)象就可以推斷出該用戶喜歡運(yùn)動, 并且每周五下班之后不是從公司徑直回家,而是先去體育館健身。因此,通過對用戶的"簽 到"場所分類,及時(shí)地識別這些頻繁"簽到"的場所,可以幫助改善一系列基于用戶位置的服 務(wù)和應(yīng)用。然而,在目前的研宄中,還未出現(xiàn)對用戶的"簽到"場所進(jìn)行分類的工作。
【發(fā)明內(nèi)容】
[0003] 針對現(xiàn)有技術(shù)的缺陷以及基于位置的服務(wù)的改進(jìn)需求,本發(fā)明提供了一種基于用 戶"簽到"特征的位置分類方法,其目的在于及時(shí)地對用戶的"新簽到"場所進(jìn)行分類,以識 別出用戶在將來是否會頻繁在該場所進(jìn)行"簽到",從而用來進(jìn)一步改進(jìn)基于位置的服務(wù)或 應(yīng)用。
[0004] 為了實(shí)現(xiàn)上述目的,按照本發(fā)明的一個(gè)方面,提供了一種基于用戶"簽到"特征的 位置分類方法,該方法包括以下步驟:
[0005] (1)針對用戶u'當(dāng)前的"簽到"場所c',查詢其是否已出現(xiàn)在u'的歷史"簽到" 位置集里面,如果該場所已在歷史"簽到"位置集里面,不需要再進(jìn)行分類處理;如果不在, 則需要對該場所做進(jìn)一步位置分類處理;
[0006] (2)針對用戶U'當(dāng)前的"簽到"結(jié)果,基于社交網(wǎng)絡(luò)全局用戶知識域,進(jìn)行用戶 "簽到"特征的提取。
[0007] (3)針對用戶u'當(dāng)前的"簽到"結(jié)果,基于用戶好友知識域,進(jìn)行用戶"簽到"特 征的提取。
[0008] (4)針對用戶u'當(dāng)前的"簽到"結(jié)果,基于用戶個(gè)人的知識域,進(jìn)行用戶"簽到"特 征的提取。
[0009] (5)應(yīng)用SVM分類模型到所提取的"簽到"特征集,實(shí)現(xiàn)對用戶"簽到"場所c'的 分類,其中一類分類結(jié)果表示該用戶u'將來不會在該位置頻繁地簽到,另一類表示相反的 情況。
[0010] 進(jìn)一步地,所述步驟(2)包括以下子步驟:
[0011] (2-1)根據(jù)所有用戶的歷史"簽到"軌跡,計(jì)算所有用戶在場所c'的歷史"簽到" 頻率HCF,HCF為所有用戶過去在場所c'平均每天的簽到次數(shù);
[0012]
【主權(quán)項(xiàng)】
1. 一種基于"簽到"特征的用戶位置分類方法,其特征在于,所述方法包括以下步驟: (1) 針對用戶U'當(dāng)前的"簽到"場所C',查詢其是否已出現(xiàn)在U'的歷史"簽到"位 置集里面,如果該場所已在歷史"簽到"位置集里面,則不需要再進(jìn)行分類處理;如果不在, 則需要對該場所做進(jìn)一步位置分類處理; (2) 針對用戶u'當(dāng)前的"簽到"結(jié)果,基于社交網(wǎng)絡(luò)全局用戶知識域,進(jìn)行用戶"簽到" 特征的提?。? (3) 針對用戶u'當(dāng)前的"簽到"結(jié)果,基于用戶好友知識域,進(jìn)行用戶"簽到"特征的 提取; (4) 針對用戶u'當(dāng)前的"簽到"結(jié)果,基于用戶個(gè)人的知識域,進(jìn)行用戶"簽到"特征 的提??; (5) 應(yīng)用SVM分類模型到所提取的"簽到"特征集,實(shí)現(xiàn)對用戶"簽到"場所c'的分類; 其中一類表示該用戶u'將來不會在該位置頻繁地簽到,另一類表示相反的情況。
2. 根據(jù)權(quán)利要求1所述的用戶位置分類方法,其特征在于,步驟(2)包括以下子步驟: (2-1)根據(jù)所有用戶的歷史"簽到"軌跡,計(jì)算所有用戶在場所c'的歷史"簽到"頻率 HCF,HCF為所有用戶過去在場所c'平均每天的簽到次數(shù); (2-2)根據(jù)所有用戶的歷史"簽到"軌跡,計(jì)算所有用戶在c'附近設(shè)定地域范圍以內(nèi) 所有場所的歷史"簽到"頻率HCFN,HCFN為所有用戶過去在c'附近設(shè)定地域范圍以內(nèi)所有 場所平均每天的簽到次數(shù); (2-3)根據(jù)所有用戶的歷史"簽到"軌跡,計(jì)算所有用戶在場所c'最近一個(gè)月的歷史 "簽到"頻率RCF,RCF為所有用戶在過去一個(gè)月內(nèi)平均每天在場所c'的簽到次數(shù); (2-4)根據(jù)所有用戶的歷史"簽到"軌跡,計(jì)算所有用戶在c'附近設(shè)定地域范圍以內(nèi) 所有場所的最近一個(gè)月的歷史"簽到"頻率RCFN,RCFN為所有用戶過去一個(gè)月內(nèi)平均每天 在c'附近設(shè)定地域范圍以內(nèi)所有場所的簽到次數(shù)。
3. 根據(jù)權(quán)利要求1或2所述的用戶位置分類方法,其特征在于,步驟(3)包括以下子步 驟: (3-1)根據(jù)好友的歷史"簽到"軌跡,計(jì)算用戶u'的所有好友在場所c'處的歷史"簽 到"頻率HCF',HCF'為該用戶的所有好友過去在場所c'平均每天的簽到次數(shù); (3-2)根據(jù)好友的歷史"簽到"軌跡,計(jì)算用戶u'的所有好友在c'附近設(shè)定地域范圍 以內(nèi)所有場所的歷史"簽到"頻率HCFN',HCFN'為該用戶的所有好友過去在c'附近設(shè)定 地域范圍以內(nèi)所有場所平均每天的簽到次數(shù); (3-3)根據(jù)好友的歷史"簽到"軌跡,計(jì)算用戶u'的所有好友在場所c'處最近一個(gè)月 的歷史"簽到"頻率RCF',RCF'為該用戶的所有好友在過去一個(gè)月內(nèi)平均每天在場所c' 的簽到次數(shù); (3-4)根據(jù)好友的歷史"簽到"軌跡,計(jì)算用戶u'的所有好友在c'附近設(shè)定地域范圍 以內(nèi)所有場所的最近一個(gè)月的歷史"簽到"頻率RCFN',RCFN'為該用戶的所有好友過去一 個(gè)月內(nèi)平均每天在c'附近設(shè)定地域范圍以內(nèi)所有場所的簽到次數(shù)。
4. 根據(jù)權(quán)利要求1或2所述的用戶位置分類方法,其特征在于,步驟4包括以下子步 驟: (4-1)根據(jù)用戶個(gè)人的歷史"簽到"軌跡,計(jì)算用戶u'的總體歷史"簽到"頻率HCF", HCF"為該用戶在過去平均每天的簽到次數(shù); (4-2)根據(jù)用戶個(gè)人的歷史"簽到"軌跡,計(jì)算用戶u'在場所c'附近的歷史"簽到"頻 率HCFN",HCFN"為該用戶過去在場所c'附近設(shè)定地域范圍以內(nèi)平均每天的簽到次數(shù); (4-3)根據(jù)用戶個(gè)人的歷史"簽到"軌跡,計(jì)算用戶u'在最近一個(gè)月內(nèi)的歷史"簽到" 頻率RCF",RCF"為該用戶在過去一個(gè)月內(nèi)平均每天的簽到次數(shù); (4-4)根據(jù)用戶個(gè)人的歷史"簽到"軌跡,計(jì)算用戶u'場所c'附近最近一個(gè)月內(nèi)的歷 史"簽到"頻率RCFN",RCFN"為該用戶在過去一個(gè)月平均每天在場所c'附近設(shè)定地域范 圍以內(nèi)的簽到次數(shù); (4-5)根據(jù)用戶個(gè)人的歷史"