亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于用戶(hù)賬號(hào)的子用戶(hù)識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào):9616333閱讀:199來(lái)源:國(guó)知局
一種基于用戶(hù)賬號(hào)的子用戶(hù)識(shí)別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于互聯(lián)網(wǎng)身份管理技術(shù)領(lǐng)域,尤其涉及一種基于用戶(hù)賬號(hào)的子用戶(hù)識(shí)別 方法及系統(tǒng)。
【背景技術(shù)】
[0002] 身份管理在現(xiàn)在的電子商務(wù)和智能產(chǎn)品中是一個(gè)很重要的問(wèn)題。通常,一個(gè)個(gè)體 身份對(duì)應(yīng)著一個(gè)賬號(hào)。然而,我們并不能保證這種一對(duì)一的關(guān)系。一些用戶(hù)可能在一個(gè)網(wǎng) 站上創(chuàng)建了多個(gè)不同的賬號(hào),也有幾個(gè)用戶(hù)共同分享使用統(tǒng)一賬號(hào)的情況。賬戶(hù)共享問(wèn)題 已經(jīng)遍布在我們的生活周?chē)?。例如,?duì)于智能家居產(chǎn)品如智能電視等產(chǎn)品,屬于家庭共享產(chǎn) 品,家庭中的任何成員都可以去進(jìn)行操作,選擇自己喜歡的電視節(jié)目。而不同年齡段的家庭 成員往往會(huì)有不同的興趣愛(ài)好,喜歡不同的電視節(jié)目。
[0003] 賬號(hào)共享對(duì)于互聯(lián)網(wǎng)商業(yè)來(lái)說(shuō)是一個(gè)很重要的問(wèn)題。由于多用戶(hù)混合使用一個(gè)賬 號(hào),服務(wù)提供商不能很好地評(píng)估用戶(hù)的興趣,也就不能準(zhǔn)確地根據(jù)在線用戶(hù)的行為為其推 薦更好的服務(wù);同時(shí),服務(wù)提供商也會(huì)低估了用戶(hù)數(shù)量,降低了效益。
[0004] 為了解決上述問(wèn)題,一些服務(wù)供應(yīng)商通過(guò)法律或技術(shù)的強(qiáng)制限制,以防止用戶(hù)共 享賬戶(hù)。一個(gè)典型的例子是數(shù)字權(quán)限管理(DRM),它以安全的方式定義和執(zhí)行了使用規(guī)則。 DRM系統(tǒng)禁止用戶(hù)對(duì)未經(jīng)許可的受版權(quán)保護(hù)的材料進(jìn)行使用、復(fù)制或通信。然而,這些對(duì)于 用戶(hù)分享一個(gè)有效的賬戶(hù)并不是十分有效。有些網(wǎng)站通過(guò)限制用戶(hù)只能從預(yù)定的IP地址 或限制提供給每個(gè)賬號(hào)的本地計(jì)算機(jī)的接入數(shù)量來(lái)試圖阻止賬號(hào)的共享。但是,這種方法 不適用于動(dòng)態(tài)IP地址或遠(yuǎn)程控制軟件的使用情形。還有一些網(wǎng)站使用數(shù)字簽名和證書(shū),以 阻止用戶(hù)共享賬戶(hù)信息。上述這些方法可以有效地防止用戶(hù)共享賬號(hào),但是,他們不能確定 用戶(hù)的賬號(hào)信息是否已經(jīng)共享,而且也不能估算多少人共享一個(gè)賬號(hào)。此外,這樣對(duì)用戶(hù)強(qiáng) 加限制也會(huì)給用戶(hù)帶來(lái)不少額外的限制困擾。
[0005] 馬書(shū)才等提出了基于社會(huì)網(wǎng)絡(luò)分析的共享密碼監(jiān)督方法研究,通過(guò)掃描電子郵箱 庫(kù)中系統(tǒng)管理員郵箱與所有外部電子郵箱之間的最短路徑找出密碼共享可能的傳播路徑 以便對(duì)用戶(hù)密碼的共享行為進(jìn)行監(jiān)督。該方法可對(duì)當(dāng)前系統(tǒng)的密碼安全狀態(tài)進(jìn)行評(píng)估,對(duì) 密碼共享行為所造成的保密信息泄露起到一定的預(yù)防作用。然而,并不是所有的賬戶(hù)共享 都是通過(guò)電子郵件來(lái)分享賬號(hào)和密碼的,該研究的范圍比較狹窄。而且,也不能僅僅通過(guò)郵 件中發(fā)送的共享賬戶(hù)信息的數(shù)量來(lái)判定子用戶(hù)的數(shù)量,因?yàn)椴⒉皇鞘盏洁]件的每一位用戶(hù) 都會(huì)去使用該共享信息,成為該賬戶(hù)下的子用戶(hù)的。
[0006] Seong-seobHwang等提出了基于用戶(hù)登錄時(shí)輸入賬號(hào)和密碼的輸入字符和輸入 頻率來(lái)對(duì)共享賬號(hào)的用戶(hù)進(jìn)行聚類(lèi)的方法。其認(rèn)為每一個(gè)用戶(hù)的輸入字符是連續(xù)的,并且 其輸入頻率是不同于其他人的,因此每一個(gè)用戶(hù)的鍵盤(pán)敲擊行為會(huì)形成一個(gè)簇,不同的用 戶(hù)的鍵盤(pán)敲擊行為會(huì)形成不同的簇。因此某一個(gè)賬戶(hù)是否共享以及共享的子用戶(hù)的數(shù)量可 以通過(guò)產(chǎn)生的簇的個(gè)數(shù)來(lái)進(jìn)行大致估計(jì)。如果形成的簇的個(gè)數(shù)大于一個(gè),就可以判定該賬 戶(hù)是共享賬戶(hù)。雖然該方法是對(duì)用戶(hù)透明的,但是其通過(guò)采集用戶(hù)的賬戶(hù)和密碼來(lái)進(jìn)行賬 戶(hù)共享發(fā)現(xiàn),使得用戶(hù)的隱私信息得不到很好的保障。另一方面,鍵盤(pán)信息的采集也需要額 外的設(shè)備和相應(yīng)的軟件設(shè)施,需要一些額外的費(fèi)用。
[0007] 此外,這項(xiàng)研究有一定的局限性。首先,所有試驗(yàn)的受試者都是精通計(jì)算機(jī)的年輕 研究生。他們?cè)诖蜃址矫姹纫话闳巳阂玫枚?。而?duì)于打字不太熟練的打字員,其打字模 式可能會(huì)形成多個(gè)簇,這可能導(dǎo)致更高的誤碼率。因此很難普及到真實(shí)的互聯(lián)網(wǎng)中的更廣 范圍的人群。第二,它隱含地假定用戶(hù)的鍵入模式是在合理的時(shí)間跨度內(nèi)是固定的,而且也 沒(méi)有考慮用戶(hù)在鍵入錯(cuò)誤需刪除幾個(gè)字母重新輸入的情況。第三,所提出的框架只是在單 一設(shè)備上采集數(shù)據(jù)進(jìn)行的實(shí)驗(yàn),并沒(méi)有考慮不同的輸入設(shè)備進(jìn)行測(cè)試,如臺(tái)式計(jì)算機(jī),筆記 本電腦,移動(dòng)設(shè)備,自動(dòng)取款機(jī)等。該項(xiàng)研究目前還處于理論階段,并沒(méi)有在真實(shí)的互聯(lián)網(wǎng) 中得到普及。

【發(fā)明內(nèi)容】

[0008] 本發(fā)明提供了一種基于用戶(hù)賬號(hào)的子用戶(hù)識(shí)別方法及系統(tǒng),旨在至少在一定程度 上解決現(xiàn)有技術(shù)中的上述技術(shù)問(wèn)題之一。
[0009] 本發(fā)明實(shí)現(xiàn)方式如下,一種基于用戶(hù)賬號(hào)的子用戶(hù)識(shí)別方法,包括以下步驟:
[0010] 步驟a:獲取單一賬號(hào)下的用戶(hù)操作行為的日志數(shù)據(jù);
[0011] 步驟b:對(duì)用戶(hù)操作行為數(shù)據(jù)進(jìn)行時(shí)間段劃分;根據(jù)劃分結(jié)果提取每一個(gè)時(shí)間段 中的用戶(hù)操作行為特征,并根據(jù)用戶(hù)操作行為特征對(duì)用戶(hù)進(jìn)行聚類(lèi);
[0012] 步驟c:利用聚類(lèi)結(jié)果確定該用戶(hù)賬號(hào)下的子用戶(hù)數(shù)量。
[0013] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:所述步驟a還包括:對(duì)所述用戶(hù)賬號(hào)下的 用戶(hù)操作行為數(shù)據(jù)進(jìn)行預(yù)處理;所述對(duì)用戶(hù)操作行為數(shù)據(jù)進(jìn)行預(yù)處理的方式具體為:去除 與該用戶(hù)行為不相關(guān)的數(shù)據(jù)列,保留有用信息列,并刪除含有缺失項(xiàng)或含有錯(cuò)誤信息的數(shù) 據(jù)行;所述有用信息列包括賬號(hào)的標(biāo)識(shí)、用戶(hù)的操作特征、用戶(hù)的操作類(lèi)型、用戶(hù)操作次數(shù) 以及用戶(hù)操作時(shí)間。
[0014] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:在所述步驟b中,所述對(duì)用戶(hù)操作行為數(shù) 據(jù)進(jìn)行時(shí)間段劃分具體包括以下步驟:
[0015] 步驟bl:設(shè)定一個(gè)時(shí)間閾值,并判斷用戶(hù)連續(xù)兩次操作的間隔時(shí)間是否大于該時(shí) 間閥值,如果用戶(hù)連續(xù)兩次操作的間隔時(shí)間小于或等于該時(shí)間閾值時(shí),執(zhí)行步驟b2 ;如果 用戶(hù)連續(xù)兩次操作的間隔時(shí)間大于該時(shí)間閾值,執(zhí)行步驟b3 ;
[0016] 步驟b2:將間隔時(shí)間小于或等于時(shí)間閾值的兩次操作行為視為同一用戶(hù)的操作, 將這兩次的操作行為劃分到同一時(shí)間段內(nèi);
[0017] 步驟b3:將間隔時(shí)間大于時(shí)間閾值的兩次操作行為視為不同用戶(hù)的操作,將這兩 次的操作行為劃分到不同的時(shí)間段內(nèi)。
[0018] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:在所述步驟b中,所述根據(jù)劃分結(jié)果提取 每一個(gè)時(shí)間段中的用戶(hù)操作行為特征具體為:將同一時(shí)間段內(nèi)的用戶(hù)操作行為特征以及操 作次數(shù)提取出來(lái),表示成一個(gè)關(guān)鍵詞集合向量,具體公式為:
[0019] t;={(e!,rii), (e2,n2), . . . }
[0020] 在上述公式中,ei表示用戶(hù)的操作特征,ni是用戶(hù)操作該特征的次數(shù)。
[0021] 本發(fā)明實(shí)施例采取的技術(shù)方案還包括:在所述步驟b中,所述根據(jù)用戶(hù)操作行為 特征對(duì)用戶(hù)進(jìn)行聚類(lèi)具體包括以下步驟:
[0022] 步驟b4 :利用詞頻-逆向文檔頻率公式計(jì)算出文檔中每個(gè)操作特征的權(quán)重,生成 特征向量;操作特征權(quán)重公式為:
[0023] (1;={(e!,w^i), (e2iw2ji), . . . }
[0024] 在上述公式中,6;表示用戶(hù)的操作特征,wu是用戶(hù)操作特征e;在文檔d中對(duì)應(yīng) 的權(quán)重;其中:
[0025] wuj=TFj^IDF;
[0026] 在上述公式中,TFu表示特征e;在文檔L中出現(xiàn)的頻率;IDF;是一個(gè)詞語(yǔ)普遍重 要性的度量;其中:
[0027]
[0028] 在上述公式中,nu表示特征e;在文檔d中出現(xiàn)的頻數(shù);
[0029]
[0030] 在上述公式中,|D|表示語(yǔ)料庫(kù)中的文檔總數(shù);n(i)表示包含特征ei的文檔數(shù)目;
[0031] 步驟b5:通過(guò)特征向量之間的余弦相似度計(jì)算不同用戶(hù)之間的操作相似度,計(jì)算 公式為:
[0032]
[0033]在上述公式中,Wy表示特征向量di與特征向量d;之間的余弦相似度;
[0034] 步驟b6:采用基于向量空間模型的文本聚類(lèi)方法對(duì)具有不同操作特征的用戶(hù)進(jìn) 行聚類(lèi),將具有相同或相似操作特征的用戶(hù)劃分為一個(gè)簇,且一個(gè)簇視為一個(gè)用戶(hù)。
[0035] 本發(fā)明實(shí)施例采取的另一技術(shù)方案為:一種基于用戶(hù)賬號(hào)的子用戶(hù)識(shí)別系統(tǒng),包 括數(shù)據(jù)獲取模塊、時(shí)間段劃分模塊、特征提取模塊、用戶(hù)聚類(lèi)模塊和子用戶(hù)識(shí)別模塊;所述 數(shù)據(jù)獲取模塊用于獲取單一賬號(hào)下的用
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1