亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)的制作方法

文檔序號(hào):6514888閱讀:179來源:國知局
應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)。所述方法包括:活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;排名欺詐檢測(cè)步驟,基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。本發(fā)明的方法及系統(tǒng)能夠自動(dòng)地識(shí)別出與應(yīng)用程序有關(guān)的排名欺詐行為,從而使應(yīng)用程序用戶獲得真實(shí)的應(yīng)用程序排名信息。
【專利說明】應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)。
【背景技術(shù)】
[0002]用戶應(yīng)用程序,尤其是安裝并運(yùn)行于移動(dòng)終端的移動(dòng)應(yīng)用程序近年來發(fā)展迅速。為了方便用戶選擇并安裝應(yīng)用程序,很多應(yīng)用程序網(wǎng)站或應(yīng)用程序商店會(huì)集中地提供應(yīng)用程序的查詢、下載、評(píng)論等服務(wù),同時(shí)還會(huì)定期地,例如每日,發(fā)布應(yīng)用程序排行榜(Application Leaderboard)以體現(xiàn)一些當(dāng)前受用戶歡迎的應(yīng)用程序。事實(shí)上,該排行榜是促銷應(yīng)用程序的最重要手段之一,應(yīng)用程序在排行榜上很高的排名通常會(huì)刺激用戶大量下載該應(yīng)用程序,并為應(yīng)用程序開發(fā)者帶來巨大的經(jīng)濟(jì)收益。因此,應(yīng)用程序開發(fā)者非常希望其應(yīng)用程序在排行榜上占據(jù)更高的排名。
[0003]應(yīng)用程序的排名欺詐(Ranking Fraud)是指目的在于提高應(yīng)用程序在應(yīng)用程序排行榜上的排名而進(jìn)行的欺騙行為。事實(shí)上,不同于依賴傳統(tǒng)的市場(chǎng)手段來提高應(yīng)用程序排名,應(yīng)用程序開發(fā)者通過夸大其產(chǎn)品銷量或發(fā)布虛假的產(chǎn)品評(píng)價(jià)來實(shí)施排名欺詐的行為已經(jīng)越來越普遍,例如雇傭“水軍(human water armies)”來在短時(shí)間內(nèi)提升應(yīng)用程序的下載量和評(píng)價(jià)次數(shù)等。
[0004]業(yè)界已經(jīng)意識(shí)到防止排名欺詐以使應(yīng)用程序用戶獲得真實(shí)的應(yīng)用程序排名信息的重要性。為了防止應(yīng)用程序的排名欺詐,現(xiàn)有的辦法是根據(jù)一天內(nèi)應(yīng)用程序排名上升的程度來推斷排名欺詐行為的存在,并在判斷出現(xiàn)排名欺詐的時(shí)候直接鎖定整個(gè)應(yīng)用程序的排名,這種方式過于簡單粗暴,難以準(zhǔn)確判斷排名欺詐行為而且傷害了正常應(yīng)用程序的排名上升。可見,本領(lǐng)域?qū)τ趹?yīng)用程序的排名欺詐檢測(cè)問題的理解和研究還非常有限,至今還不存在有效檢測(cè)應(yīng)用程序的排名欺詐的相關(guān)技術(shù)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的在于提供一種應(yīng)用程序的排名欺詐的檢測(cè)技術(shù),從而自動(dòng)地有效識(shí)別出與應(yīng)用程序有關(guān)的排名欺詐行為,以使應(yīng)用程序用戶獲得真實(shí)的應(yīng)用程序排名信息。
[0006]為解決上述技術(shù)問題,根據(jù)本發(fā)明的一個(gè)方面,提供一種應(yīng)用程序的排名欺詐檢測(cè)方法,所述方法包括:
[0007]活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;
[0008]排名欺詐檢測(cè)步驟,基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
[0009]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),所述系統(tǒng)包括:
[0010]活躍期檢測(cè)單元,用于基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;
[0011]排名欺詐檢測(cè)單元,用于基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
[0012]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種應(yīng)用程序的排名欺詐檢測(cè)方法,所述方法包括:
[0013]基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
[0014]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),所述系統(tǒng)包括:
[0015]排名欺詐檢測(cè)單元,用于基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
[0016]本發(fā)明的方法及設(shè)備能夠自動(dòng)地有效識(shí)別出與應(yīng)用程序有關(guān)的排名欺詐行為,從而使應(yīng)用程序用戶獲得真實(shí)的應(yīng)用程序排名信息。
【專利附圖】

【附圖說明】
[0017]圖1是本發(fā)明【具體實(shí)施方式】中應(yīng)用程序的活躍期檢測(cè)方法的流程圖;
[0018]圖2a是在應(yīng)用程序排行榜中活躍事件的一個(gè)示例;
[0019]圖2b是在應(yīng)用程序排行榜中活躍期的一個(gè)示例;
[0020]圖3是本發(fā)明【具體實(shí)施方式】中應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng)的系統(tǒng)結(jié)構(gòu)圖;
[0021]圖4是本發(fā)明另一實(shí)施例中應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0022]下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)說明。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0023]本發(fā)明針對(duì)與應(yīng)用程序排名相關(guān)的技術(shù)問題進(jìn)行研究,因此本領(lǐng)域技術(shù)人員對(duì)本發(fā)明中的“應(yīng)用程序”應(yīng)做廣義理解,其包括可發(fā)布于互聯(lián)網(wǎng)并可供用戶下載、評(píng)論、執(zhí)行的各種程序或文件,即包括運(yùn)行于個(gè)人電腦中的傳統(tǒng)應(yīng)用程序、運(yùn)行于移動(dòng)終端的移動(dòng)應(yīng)用程序,也包括可下載并播放的圖片、音頻、視頻等多媒體文件等。
[0024]在檢測(cè)應(yīng)用程序的排名欺詐時(shí),有幾個(gè)需要解決的重要問題。首先,在應(yīng)用程序的整個(gè)生命周期中并不會(huì)總出現(xiàn)排名欺詐,因此首先需要檢測(cè)可能出現(xiàn)排名欺詐的時(shí)間;第二,由于應(yīng)用程序數(shù)量巨大,很難手工地為每個(gè)出現(xiàn)排名欺詐的應(yīng)用程序進(jìn)行標(biāo)定,因此需要提供一種自動(dòng)檢測(cè)排名欺詐的技術(shù);第三,現(xiàn)有技術(shù)中并不確定可基于何種依據(jù)來檢測(cè)排名欺詐的存在。
[0025]本發(fā)明的一個(gè)【具體實(shí)施方式】對(duì)應(yīng)用程序的排名欺詐行為進(jìn)行了整體性的分析和研究,提供了一種可檢測(cè)應(yīng)用程序的排名欺詐的技術(shù),其可通過對(duì)應(yīng)用程序的歷史排名信息的分析來檢測(cè)應(yīng)用程序的“活躍期”,針對(duì)活躍期中應(yīng)用程序的用戶評(píng)論特征,基于與用戶評(píng)論相關(guān)的證據(jù)來進(jìn)行排名欺詐的檢測(cè)。
[0026]根據(jù)發(fā)明人的分析發(fā)現(xiàn),存在排名欺詐的應(yīng)用程序并不會(huì)長期在排名榜上占據(jù)很高的排名,排名較高的情況僅是作為一些獨(dú)立事件集中發(fā)生在一段相對(duì)較短的時(shí)期內(nèi),這表明排名欺詐行為正是發(fā)生在這段時(shí)期內(nèi)。在本發(fā)明中,可將應(yīng)用程序持續(xù)排名較高的時(shí)期稱為應(yīng)用程序的“活躍事件(Leading Event)”,可將頻繁發(fā)生活躍事件的時(shí)期稱為應(yīng)用程序的“活躍期(Leading Session)”。因此,對(duì)于排名欺詐的檢測(cè)首先需要檢測(cè)每個(gè)應(yīng)用程序有可能存在排名欺詐的該活躍事件和該活躍期。
[0027]應(yīng)用程序商店運(yùn)營商處擁有應(yīng)用程序的歷史排名信息,從應(yīng)用程序商店運(yùn)營商處直接獲取,或通過對(duì)應(yīng)用程序商店運(yùn)營商在一段較長歷史時(shí)期內(nèi)持續(xù)發(fā)布的應(yīng)用程序排行榜信息進(jìn)行分析和處理,也可以獲得應(yīng)用程序的歷史排名信息。由于應(yīng)用程序的該歷史排名信息記載了有關(guān)應(yīng)用程序排名的歷史信息和相關(guān)的用戶評(píng)論信息,因此在本發(fā)明【具體實(shí)施方式】中,可以基于該歷史排名信息來進(jìn)行每個(gè)應(yīng)用程序的活躍事件和活躍期的檢測(cè),并進(jìn)而實(shí)現(xiàn)對(duì)排名欺詐的檢測(cè)。通過分析應(yīng)用程序的用戶評(píng)論行為發(fā)現(xiàn),相比于正常的應(yīng)用程序而言,存在排名欺詐的應(yīng)用程序在活躍事件和活躍期內(nèi)會(huì)呈現(xiàn)成不同的用戶評(píng)論特征。因此,有可能從應(yīng)用程序的歷史排名信息中抽取出一些與用戶評(píng)論相關(guān)的用于判定排名欺詐的證據(jù),并獲取這些證據(jù),從而實(shí)現(xiàn)對(duì)排名欺詐的檢測(cè)。
[0028]如圖1所示,本發(fā)明的一個(gè)【具體實(shí)施方式】中提供了一種應(yīng)用程序的排名欺詐檢測(cè)方法,所述方法包括:
[0029]活躍期檢測(cè)步驟S10,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;排名欺詐檢測(cè)步驟S20,基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)來對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
[0030]下面,結(jié)合附圖來說明本發(fā)明【具體實(shí)施方式】中上述排名欺詐檢測(cè)方法的各步驟流程和功能。
[0031]由于歷史排名信息是本發(fā)明中檢測(cè)應(yīng)用程序的排名欺詐的數(shù)據(jù)基礎(chǔ),因此作為本發(fā)明的一個(gè)優(yōu)選實(shí)施方式,該排名欺詐檢測(cè)方法還可包括一歷史排名信息獲取步驟,獲取所述應(yīng)用程序在應(yīng)用程序排行榜上的歷史排名信息。
[0032]在一個(gè)應(yīng)用程序被發(fā)布后,任何用戶都可以對(duì)其進(jìn)行文字性的評(píng)論。實(shí)際上,用戶評(píng)論對(duì)于應(yīng)用程序推廣而言是最重要的特征之一。具有越積極評(píng)論的應(yīng)用程序就會(huì)吸引越多的用戶來購買或下載它,并導(dǎo)致該應(yīng)用程序在排行榜上的更高排名。因而在歷史排名信息中,可以包括歷史評(píng)論信息,即歷史各時(shí)間段中應(yīng)用程序的用戶對(duì)該應(yīng)用程序做出的評(píng)論信息。
[0033]應(yīng)用程序排行榜通??娠@示受歡迎的排名前K位的應(yīng)用程序,例如前1000位等。而且,應(yīng)用程序排行榜通常會(huì)定期更新,例如每日進(jìn)行更新。因此,對(duì)于每個(gè)應(yīng)用程序a而言都有其歷史排名信息,該歷史排名信息可以包括表示為一個(gè)與離散時(shí)間序列對(duì)應(yīng)的排名序列Ra = {τΛ..., ι.Λ...,rna},該離散時(shí)間序列中的時(shí)間點(diǎn)之間的間隔固定,即應(yīng)用程序排行榜的更新周期。其中,是該應(yīng)用程序a在時(shí)間\時(shí)的排名,riae {I,...,K..+ 00表示應(yīng)用程序a不在排行榜排名前K位之列;n表示所有歷史排名信息所對(duì)應(yīng)的時(shí)間點(diǎn)總數(shù)。例如,在排行榜每天更新的情況下,\就表示該段歷史中的第i天,η就是歷史排名信息所對(duì)應(yīng)的總天數(shù)??梢钥闯?,< 的值越小,說明應(yīng)用程序a第i天在排行榜上的排名越聞。
[0034]在該歷史排名信息獲取步驟中,可以多種方式來獲取該歷史排名信息。例如,可從應(yīng)用程序商店運(yùn)營商處直接獲取該歷史排名信息,也可以從應(yīng)用程序商店在一段較長歷史時(shí)期內(nèi)持續(xù)發(fā)布的數(shù)據(jù)中抽取該歷史排名信息等。
[0035]S10:活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期。[0036]活躍期表示一應(yīng)用程序在應(yīng)用程序排行榜上排名較高,也就是用戶關(guān)注度比較高的一段時(shí)期,因此對(duì)應(yīng)用程序市場(chǎng)會(huì)造成較大影響的排名欺詐行為只會(huì)出現(xiàn)在這些活躍期內(nèi)。所以在本發(fā)明【具體實(shí)施方式】中,對(duì)于排名欺詐的檢測(cè)首先要從應(yīng)用程序的歷史排名信息中檢測(cè)出應(yīng)用程序的活躍期。
[0037]在本發(fā)明一個(gè)優(yōu)選實(shí)施方式中,在該活躍期檢測(cè)步驟中可進(jìn)一步包括一活躍事件檢測(cè)步驟,基于該歷史排名信息檢測(cè)所述應(yīng)用程序的活躍事件。
[0038]由于應(yīng)用程序開發(fā)者均希望其應(yīng)用程序在排行榜上占據(jù)較高的排名,因此應(yīng)用程序開發(fā)者有可能利用排名欺詐的手段使其應(yīng)用程序躋身排行榜前列。通過分析發(fā)現(xiàn),應(yīng)用程序并不會(huì)總是在排名榜上占據(jù)很高的排名,發(fā)生持續(xù)排名較高的時(shí)期即為“活躍事件”,圖2a中示出了應(yīng)用程序的活躍事件的例子,圖中橫軸表示歷史排名信息對(duì)應(yīng)的時(shí)間序列(Date Index),縱軸表示應(yīng)用程序的排名(Ranking),圖中的事件I (Eventl)和事件2(Event2)表示該應(yīng)用程序排名歷史中所出現(xiàn)的兩個(gè)活躍事件,其輪廓分別由活躍事件期間的排名點(diǎn)連接而成。
[0039]在本發(fā)明【具體實(shí)施方式】中,應(yīng)用程序在應(yīng)用程序排行榜上排名較高的標(biāo)準(zhǔn)是該應(yīng)用程序的排名不大于一排名閾值K*。由于應(yīng)用程序的排名在排行榜前K*位之列被認(rèn)為是排名較高,因而應(yīng)用程序的排名持續(xù)在前K*位之列的時(shí)間段即可被認(rèn)為是一個(gè)活躍事件,該活躍事件應(yīng)從該應(yīng)用程序開始進(jìn)入排行榜前K*位之列開始,持續(xù)到該應(yīng)用程序跌出排行榜前K*位之列結(jié)束。
[0040]優(yōu)選地,本發(fā)明實(shí)施方式中的方法還可包括一設(shè)置該排名閾值K*的步驟,從而確定應(yīng)用程序在應(yīng)用程序排行榜上排名較高的標(biāo)準(zhǔn)。由于排行榜上的應(yīng)用程序總數(shù)量K通常很大,例如為1000等,因此上述排名閾值K*通常小于K值。根據(jù)應(yīng)用程序排行榜中應(yīng)用程序的總數(shù)量K和本領(lǐng)域技術(shù)人員的分析需求等因素,該排名閾值K*可在例如I~500之間的整數(shù)間取值。本領(lǐng)域技術(shù) 人員可以理解,K*的取值越小,應(yīng)用程序被認(rèn)為排名較高的標(biāo)準(zhǔn)就越高。在圖2a中,該K*的取值為300。
[0041]根據(jù)上述對(duì)于活躍事件的文字表述,應(yīng)用程序a的活躍事件e可以如下公式化表述:
[0042]給定一排名閾值K*作為排名較高的標(biāo)準(zhǔn),其中K* e [I, K];應(yīng)用程序a的活躍事件e包括從一開始時(shí)間到一結(jié)束時(shí)間的一時(shí)間范圍7:j ?對(duì)應(yīng)的應(yīng)用程序a的排
名滿足 r:1r, <K*< Crl且 Cf <K*< C,,,而且 % e (/;?.,.Cj )均滿足 rka ( K*。
[0043]根據(jù)上述表述可以看出,對(duì)于活躍事件的檢測(cè)重要的在于檢測(cè)應(yīng)用程序的排名持續(xù)在前K*位之列的一段時(shí)間的開始時(shí)間和結(jié)束時(shí)間,并將一對(duì)開始時(shí)間和結(jié)束時(shí)間之間的時(shí)期確定為活躍事件。因此,在本發(fā)明【具體實(shí)施方式】中,該活躍事件檢測(cè)步驟可進(jìn)一步包括如下步驟:
[0044]開始時(shí)間識(shí)別步驟SlOl:在該步驟中,從歷史排名信息中識(shí)別出活躍事件的開始時(shí)間。具體地,在該開始時(shí)間識(shí)別步驟中,可順序搜索歷史排名信息中每個(gè)時(shí)間點(diǎn)上的應(yīng)用程序排名,當(dāng)當(dāng)前時(shí)間點(diǎn)的排名不大于排名閾值K*且上一時(shí)間點(diǎn)的排名大于排名閾值K*時(shí),識(shí)別當(dāng)前時(shí)間點(diǎn)為活躍事件的開始時(shí)間。本領(lǐng)域技術(shù)人員可以理解,由于在應(yīng)用程序排名歷史中可能包括多個(gè)活躍事件,因此在該開始時(shí)間識(shí)別步驟中可能識(shí)別出多個(gè)開始時(shí)間點(diǎn)。
[0045]結(jié)束時(shí)間識(shí)別步驟S102:在該步驟中,從歷史排名信息中識(shí)別出活躍時(shí)間的結(jié)束時(shí)間。具體地,在該結(jié)束時(shí)間識(shí)別步驟中,可順序搜索歷史排名信息中每個(gè)時(shí)間點(diǎn)上的應(yīng)用程序排名,當(dāng)當(dāng)前時(shí)間點(diǎn)的排名大于排名閾值K*且上一時(shí)間點(diǎn)的排名不大于排名閾值K*時(shí),識(shí)別上一時(shí)間點(diǎn)為活躍事件的結(jié)束時(shí)間。本領(lǐng)域技術(shù)人員可以理解,由于在應(yīng)用程序排名歷史中可能包括多個(gè)活躍事件,因此在該結(jié)束時(shí)間識(shí)別步驟中可能識(shí)別出多個(gè)結(jié)束時(shí)間點(diǎn)。
[0046]活躍事件識(shí)別步驟S103:在該步驟中將每個(gè)開始時(shí)間與其之后相鄰的結(jié)束時(shí)間之間的時(shí)間段識(shí)別為活躍事件,這樣就檢測(cè)出了應(yīng)用程序在排名歷史中的所有活躍事件。
[0047]值得說明的是,作為一種特殊情況,如果在所分析和處理的歷史時(shí)期的第一個(gè)時(shí)間點(diǎn)上,例如在歷史記錄中的第一天,應(yīng)用程序的排名就在排行榜前K*位之列,此時(shí)在所述開始時(shí)間識(shí)別步驟SlOl中,將該第一個(gè)時(shí)間點(diǎn)定義為一個(gè)開始時(shí)間。類似地,如果在所分析和處理的歷史時(shí)期的最后一個(gè)時(shí)間點(diǎn)上,例如今天,應(yīng)用程序的排名仍在排行榜前K*位之列,此時(shí)在所述結(jié)束時(shí)間識(shí)別步驟S102中將該最后一個(gè)時(shí)間點(diǎn)定義為一個(gè)結(jié)束時(shí)間。
[0048]上面介紹了檢測(cè)應(yīng)用程序中活躍事件的方式,在此基礎(chǔ)上,在本發(fā)明一個(gè)優(yōu)選實(shí)施方式中,可在該活躍期檢測(cè)步驟中合并相鄰近的活躍事件以構(gòu)成所述活躍期。
[0049]通過進(jìn)一步研究發(fā)現(xiàn),一些應(yīng)用程序會(huì)在一段時(shí)期內(nèi)連續(xù)出現(xiàn)多次彼此相鄰近的活躍事件,這段時(shí)期就是本發(fā)明中應(yīng)用程序的“活躍期”??梢?,將相鄰近的活躍事件合并起來就構(gòu)成了活躍期。具體地,可將相鄰兩個(gè)活躍事件的時(shí)間間隔小于一間隔閾值Φ作為將兩個(gè)活躍事件合并在同一活躍期內(nèi)的標(biāo)準(zhǔn),而相鄰兩個(gè)活躍事件的時(shí)間間隔則是指相鄰兩個(gè)活躍事件中前一活躍事件的結(jié)束時(shí)間和后一活躍事件的開始時(shí)間之間的間隔。
[0050]優(yōu)選地,本發(fā)明實(shí)施方式中的方法還可包括一設(shè)置該間隔閾值Φ的步驟,從而確定將兩個(gè)活躍事件合并在同一活躍期內(nèi)的標(biāo)準(zhǔn)。根據(jù)本領(lǐng)域技術(shù)人員的分析需求等因素,該間隔閾值Φ的取值可以是應(yīng)用程序排行榜的更新周期的2?10倍中的整數(shù)值。本領(lǐng)域技術(shù)人員可以理解,間隔閾值Φ的取值越小,將兩個(gè)活躍事件合并在同一活躍期內(nèi)的標(biāo)準(zhǔn)就越聞。
[0051]圖2b中示出了應(yīng)用程序的活躍期的例子,圖中橫軸表示歷史排名信息對(duì)應(yīng)的時(shí)間序列(Date Index),縱軸表示應(yīng)用程序的排名(Ranking),圖中的期間I (Sessionl)和期間2 (Session)代表該應(yīng)用程序排名歷史中所出現(xiàn)的兩個(gè)活躍期,每個(gè)活躍期由多個(gè)活躍事件構(gòu)成。
[0052]根據(jù)上述對(duì)于活躍期的文字表述,應(yīng)用程序a的活躍期s可以如下公式化表述:
[0053]應(yīng)用程序a的活躍期s包括一時(shí)間范圍7; = ,C ]和η個(gè)相鄰的活躍事
件Ie1,..., ej ,其滿足=H =C且不存在其它活躍期s*使得7; e Fs, 0此外,
WejlsIi)都有fct.-其中Φ是預(yù)設(shè)的活躍事件間隔閾值,是用于判斷活躍事件之間相鄰程度以將它們納入同一活躍期的判斷標(biāo)準(zhǔn)。
[0054]根據(jù)上述表述可以看出,對(duì)于活躍期的檢測(cè)重要的在于基于間隔閾值Φ將應(yīng)用程序排名歷史中相鄰近的活躍事件合并以形成活躍期。具體地,在本發(fā)明【具體實(shí)施方式】的活躍期檢測(cè)步驟中,從歷史排名信息中的初始時(shí)間點(diǎn)開始順序搜索每個(gè)檢測(cè)出的活躍事件,當(dāng)當(dāng)前活躍事件與上一活躍事件的時(shí)間間隔小于該間隔閾值Φ時(shí),將這兩個(gè)活躍事件合并在同一活躍期內(nèi),直至搜索完所有檢測(cè)出的活躍事件以檢測(cè)出該應(yīng)用程序在排名歷史中的所有活躍期。
[0055]值得說明的是,作為一種特殊情況,如果一個(gè)活躍事件并不與任何其他活躍事件相鄰近,該活躍事件自身也可被認(rèn)為構(gòu)成一活躍期。在這種情況下,在該活躍期檢測(cè)步驟中,當(dāng)一活躍事件與上一活躍事件的時(shí)間間隔不小于所述間隔閾值Φ,且該活躍事件與下一活躍事件的時(shí)間間隔不小于所述間隔閾值Φ時(shí),檢測(cè)該活躍事件自身為一活躍期。
[0056]正如前文所述,所檢測(cè)出的上述活躍期表示一應(yīng)用程序在應(yīng)用程序排行榜上排名較高,也就是受到用戶歡迎的一段時(shí)期,所檢測(cè)出的該活躍期可作為包括檢測(cè)排名欺詐在內(nèi)的各種應(yīng)用程序服務(wù)的數(shù)據(jù)基礎(chǔ)。因此,在檢測(cè)出應(yīng)用程序的活躍期之后,作為本發(fā)明一個(gè)優(yōu)選實(shí)施方式,還可以將所檢測(cè)出的應(yīng)用程序的活躍期信息發(fā)送給應(yīng)用程序開發(fā)者、應(yīng)用程序商店運(yùn)營商或應(yīng)用程序的終端用戶。
[0057]對(duì)于應(yīng)用程序開發(fā)者而言,其可以根據(jù)該活躍期信息分析相關(guān)【技術(shù)領(lǐng)域】的發(fā)展趨勢(shì)或應(yīng)用程序用戶的需求,從而指導(dǎo)應(yīng)用程序的開發(fā)和運(yùn)營;對(duì)于應(yīng)用程序商店運(yùn)營商而言,其可以根據(jù)該活躍期信息進(jìn)一步分析出利用欺詐手段獲取排行榜上虛假高排名的排名欺詐行為等,從而改進(jìn)應(yīng)用程序商店的運(yùn)營;而對(duì)于應(yīng)用程序終端用戶而言,他們可以根據(jù)該活躍期信息來自行判斷應(yīng)用程序存在排名欺詐的可能性或者選擇符合自身需求的應(yīng)用程序等。
[0058]此外,作為檢測(cè)應(yīng)用程序的活躍事件和活躍期的一種具體實(shí)現(xiàn)方式,如下的算法I示出了在給定應(yīng)用程序a的歷史排名信息中檢測(cè)活躍期的一個(gè)程序代碼的實(shí)例。
【權(quán)利要求】
1.一種應(yīng)用程序的排名欺詐檢測(cè)方法,其特征在于,所述方法包括: 活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期; 排名欺詐檢測(cè)步驟,基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述排名欺詐檢測(cè)步驟進(jìn)一步包括: 證據(jù)驗(yàn)證步驟,基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述與用戶評(píng)論相關(guān)的證據(jù)基于所述活躍期內(nèi)用戶評(píng)論間的相似程度構(gòu)成。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)用 戶評(píng)論間的平均相似度。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述證據(jù)驗(yàn)證步驟進(jìn)一步包括: 對(duì)所述活躍期內(nèi)的所有用戶評(píng)論進(jìn)行標(biāo)準(zhǔn)化處理; 為所述活躍期內(nèi)的每一條用戶評(píng)論構(gòu)建標(biāo)準(zhǔn)化詞匯向量; 基于所述標(biāo)準(zhǔn)化詞匯向量計(jì)算所述活躍期內(nèi)用戶評(píng)論間的平均相似度。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述與用戶評(píng)論相關(guān)的證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布構(gòu)成。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布之間的差值。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,通過計(jì)算應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布之間的余弦距離來計(jì)算它們之間的差值。
9.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述證據(jù)驗(yàn)證步驟中,綜合考慮所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù),將基于所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
10.根據(jù)權(quán)利要求2-9中任一項(xiàng)所述的方法,其特征在于,所述排名欺詐檢測(cè)步驟進(jìn)一步包括: 欺詐參數(shù)判斷步驟,將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 歷史排名信息獲取步驟,獲取所述應(yīng)用程序在應(yīng)用程序排行榜上的所述歷史排名信肩、O
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,在所述歷史排名信息獲取步驟中,從應(yīng)用程序商店運(yùn)營商獲取所述歷史排名信息,或從應(yīng)用程序商店發(fā)布的數(shù)據(jù)中抽取所述歷史排名信息。
13.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史排名信息包括歷史各時(shí)間段中所述應(yīng)用程序的用戶對(duì)所述應(yīng)用程序做出的用戶評(píng)論。
14.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:將所檢測(cè)出的所述應(yīng)用程序的所述活躍期發(fā)送給應(yīng)用程序開發(fā)者、應(yīng)用程序商店運(yùn)營商、應(yīng)用程序用戶中的至少一個(gè)。
15.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營商、應(yīng)用程序用戶中的至少一個(gè)。
16.一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),其特征在于,所述系統(tǒng)包括: 活躍期檢測(cè)單元,用于基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期; 排名欺詐檢測(cè)單元,用于基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 證據(jù)驗(yàn)證模塊,用于基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述與用戶評(píng)論相關(guān)的證據(jù)基于所述活躍期內(nèi)用戶評(píng)論間的相似程度構(gòu)成。
19.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述與用戶評(píng)論相關(guān)的證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布構(gòu)成。
20.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述證據(jù)驗(yàn)證模塊,用于綜合考慮所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù),將基于所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
21.根據(jù)權(quán)利要求17-20中任一項(xiàng)所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 欺詐參數(shù)判斷模塊,用于將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
22.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 歷史排名信息獲取單元,用于獲取所述應(yīng)用程序在應(yīng)用程序排行榜上的所述歷史排名信息。
23.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,所述歷史排名信息獲取單元,用于從應(yīng)用程序商店運(yùn)營商獲取所述歷史排名信息,或從應(yīng)用程序商店發(fā)布的數(shù)據(jù)中抽取所述歷史排名信息。
24.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括一活躍期發(fā)送單元,用于將所檢測(cè)出的所述應(yīng)用程序的所述活躍期發(fā)送給應(yīng)用程序開發(fā)者、應(yīng)用程序商店運(yùn)營商、應(yīng)用程序用戶中的至少一個(gè)。
25.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括一排名欺詐檢測(cè)結(jié)果發(fā)送單元,用于將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營商、應(yīng)用程序用戶中的至少一個(gè)。
26.一種應(yīng)用程序的排名欺詐檢測(cè)方法,其特征在于,所述方法包括: 基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
27.根據(jù)權(quán)利要求26所述的方法,其特征在于,所述方法進(jìn)一步包括: 證據(jù)驗(yàn)證步驟,基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
28.根據(jù)權(quán)利要求27所述的方法,其特征在于,所述與用戶評(píng)論相關(guān)的證據(jù)基于所述活躍期內(nèi)用戶評(píng)論間的相似程度構(gòu)成。
29.根據(jù)權(quán)利要求28所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)用戶評(píng)論間的平均相似度。
30.根據(jù)權(quán)利要求29所述的方法,其特征在于, 所述證據(jù)驗(yàn)證步驟進(jìn)一步包括: 對(duì)所述活躍期內(nèi)的所有用戶評(píng)論進(jìn)行標(biāo)準(zhǔn)化處理; 為所述活躍期內(nèi)的每一條用戶評(píng)論構(gòu)建標(biāo)準(zhǔn)化詞匯向量; 基于所述標(biāo)準(zhǔn)化詞匯向量計(jì)算所述活躍期內(nèi)用戶評(píng)論間的平均相似度。
31.根據(jù)權(quán)利要求27所述的方法,其特征在于, 所述與用戶評(píng)論相關(guān)的證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布構(gòu)成。
32.根據(jù)權(quán)利要求31所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布之間的差值。
33.根據(jù)權(quán)利要求32所述的方法,其特征在于,通過計(jì)算應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布之間的余弦距離來計(jì)算它們之間的差值。
34.根據(jù)權(quán)利要求27所述的方法,其特征在于,在所述證據(jù)驗(yàn)證步驟中,綜合考慮所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù),將基于所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
35.根據(jù)權(quán)利要求27-34中任一項(xiàng)所述的方法,其特征在于,所述方法進(jìn)一步包括: 欺詐參數(shù)判斷步驟,將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
36.根據(jù)權(quán)利要求26所述的方法,其特征在于,所述方法還包括:將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營商、應(yīng)用程序用戶中的至少一個(gè)。
37.一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),其特征在于,所述系統(tǒng)包括: 排名欺詐檢測(cè)單元,用于基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行驗(yàn)證,得到排名欺詐驗(yàn)證結(jié)果。
38.根據(jù)權(quán)利要求37所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 證據(jù)驗(yàn)證模塊,用于基于至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
39.根據(jù)權(quán)利要求38所述的系統(tǒng),其特征在于,所述與用戶評(píng)論相關(guān)的證據(jù)基于所述活躍期內(nèi)用戶評(píng)論間的相似程度構(gòu)成。
40.根據(jù)權(quán)利要求38所述的系統(tǒng),其特征在于,所述與用戶評(píng)論相關(guān)的證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶評(píng)論的主題分布和歷史評(píng)論信息中用戶評(píng)論的主題分布構(gòu)成。
41.根據(jù)權(quán)利要求38所述的系統(tǒng),其特征在于,所述證據(jù)驗(yàn)證模塊,用于綜合考慮所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù),將基于所述至少一個(gè)與用戶評(píng)論相關(guān)的證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
42.根據(jù)權(quán)利要求38-41中任一項(xiàng)所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 欺詐參數(shù)判斷模塊,用于將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
43.根據(jù)權(quán)利要求27所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括一排名欺詐檢測(cè)結(jié)果發(fā)送單元,用于將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營商、應(yīng)用程序用戶中的至少一個(gè)。
【文檔編號(hào)】G06F17/30GK103577542SQ201310469931
【公開日】2014年2月12日 申請(qǐng)日期:2013年10月10日 優(yōu)先權(quán)日:2013年10月10日
【發(fā)明者】祝恒書, 于魁飛 申請(qǐng)人:北京智谷睿拓技術(shù)服務(wù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1