本發(fā)明屬于App應(yīng)用商店搜索和大數(shù)據(jù)處理的技術(shù)領(lǐng)域,具體地涉及一種APP應(yīng)用商店搜索關(guān)鍵字的分析方法。
背景技術(shù):
隨著智能移動(dòng)終端的迅速普及和迅猛發(fā)展,App應(yīng)用商店也越來越被大眾接受并使用。為App選擇正確的關(guān)鍵字,在產(chǎn)品的成功上會(huì)起到至關(guān)重要的作用,根據(jù)相關(guān)數(shù)據(jù)顯示,63%的下載量源于應(yīng)用商店的搜索行為,所以App開發(fā)商一定要確保在關(guān)鍵字上下足功夫,否則這會(huì)直接導(dǎo)致App開發(fā)商損失大量潛在App下載量。而且,APP應(yīng)用商店搜索關(guān)鍵字的分析結(jié)果可以作為潛力App風(fēng)險(xiǎn)投資的參考資料。
但是,當(dāng)前缺少以第三方的視角分析各大App應(yīng)用商店的搜索關(guān)鍵字?jǐn)?shù)據(jù)的技術(shù),尚無官方渠道來獲取各大App應(yīng)用商店的搜索關(guān)鍵字?jǐn)?shù)據(jù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的技術(shù)解決問題是:克服現(xiàn)有技術(shù)的不足,提供一種APP應(yīng)用商店搜索關(guān)鍵字的分析方法,其以第三方的視角分析各大App應(yīng)用商店的搜索關(guān)鍵字?jǐn)?shù)據(jù),從而可進(jìn)行進(jìn)一步數(shù)據(jù)分析,為潛力App風(fēng)險(xiǎn)投資提供參考。
本發(fā)明的技術(shù)解決方案是:這種APP應(yīng)用商店搜索關(guān)鍵字的分析方法,其包括以下步驟:
(1)從運(yùn)營(yíng)商移動(dòng)核心網(wǎng)中鏡像出2G/3G/4G流量數(shù)據(jù);
(2)實(shí)時(shí)采集、清洗步驟(1)的數(shù)據(jù),將清洗出的App應(yīng)用商店搜索關(guān)鍵字?jǐn)?shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中;
(3)搜索關(guān)鍵字原始數(shù)據(jù)庫(kù):將實(shí)時(shí)清洗App應(yīng)用商店搜索關(guān)鍵字?jǐn)?shù)據(jù)系統(tǒng)輸出的日期時(shí)間、App應(yīng)用商店名稱、搜索關(guān)鍵字、移動(dòng)終端用戶ID數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中;
(4)每日統(tǒng)計(jì)搜索關(guān)鍵字任務(wù):本任務(wù)每日?qǐng)?zhí)行一次,統(tǒng)計(jì)前一天的各大App應(yīng)用商店中的每個(gè)搜索關(guān)鍵字的使用人數(shù),并且按照搜索關(guān)鍵字的使用人數(shù)進(jìn)行降序排序,將輸出結(jié)果保存到搜索關(guān)鍵字日統(tǒng)計(jì)數(shù)據(jù)庫(kù)中;
(5)每月統(tǒng)計(jì)搜索關(guān)鍵字任務(wù):本任務(wù)每月執(zhí)行一次,統(tǒng)計(jì)上個(gè)月的各大App應(yīng)用商店中的每個(gè)搜索關(guān)鍵字的使用人數(shù),并且按照搜索關(guān)鍵字的使用人數(shù)進(jìn)行降序排序,將輸出結(jié)果保存到搜索關(guān)鍵字月統(tǒng)計(jì)數(shù)據(jù)庫(kù)中。
由于使用運(yùn)營(yíng)商的移動(dòng)互聯(lián)網(wǎng)原始數(shù)據(jù)作為數(shù)據(jù)來源,進(jìn)行各大App應(yīng)用商店搜索關(guān)鍵字分析,因此以第三方的視角分析各大App應(yīng)用商店的搜索關(guān)鍵字?jǐn)?shù)據(jù),從而可進(jìn)行進(jìn)一步數(shù)據(jù)分析,為潛力App風(fēng)險(xiǎn)投資提供參考。
附圖說明
圖1是根據(jù)本發(fā)明的APP應(yīng)用商店搜索關(guān)鍵字的分析方法的流程圖。
圖2是根據(jù)本發(fā)明的HTTP數(shù)據(jù)報(bào)文解析示意圖。
圖3是根據(jù)本發(fā)明的提取搜索關(guān)鍵字示意圖。
具體實(shí)施方式
如圖1所示,這種APP應(yīng)用商店搜索關(guān)鍵字的分析方法,其包括以下步驟:
(1)從運(yùn)營(yíng)商移動(dòng)核心網(wǎng)中鏡像出2G/3G/4G流量數(shù)據(jù);
(2)實(shí)時(shí)采集、清洗步驟(1)的數(shù)據(jù),將清洗出的App應(yīng)用商店搜索關(guān)鍵字?jǐn)?shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中;
(3)搜索關(guān)鍵字原始數(shù)據(jù)庫(kù):將實(shí)時(shí)清洗App應(yīng)用商店搜索關(guān)鍵字?jǐn)?shù)據(jù)系統(tǒng)輸出的日期時(shí)間、App應(yīng)用商店名稱、搜索關(guān)鍵字、移動(dòng)終端用戶ID數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中;
(4)每日統(tǒng)計(jì)搜索關(guān)鍵字任務(wù):本任務(wù)每日?qǐng)?zhí)行一次,統(tǒng)計(jì)前一天的各大App應(yīng)用商店中的每個(gè)搜索關(guān)鍵字的使用人數(shù),并且按照搜索關(guān)鍵字的使用人數(shù)進(jìn)行降序排序,將輸出結(jié)果保存到搜索關(guān)鍵字日統(tǒng)計(jì)數(shù)據(jù)庫(kù)中;
(5)每月統(tǒng)計(jì)搜索關(guān)鍵字任務(wù):本任務(wù)每月執(zhí)行一次,統(tǒng)計(jì)上個(gè)月的各大App應(yīng)用商店中的每個(gè)搜索關(guān)鍵字的使用人數(shù),并且按照搜索關(guān)鍵字的使用人數(shù)進(jìn)行降序排序,將輸出結(jié)果保存到搜索關(guān)鍵字月統(tǒng)計(jì)數(shù)據(jù)庫(kù)中。
由于使用運(yùn)營(yíng)商的移動(dòng)互聯(lián)網(wǎng)原始數(shù)據(jù)作為數(shù)據(jù)來源,進(jìn)行各大App應(yīng)用商店搜索關(guān)鍵字分析,因此以第三方的視角分析各大App應(yīng)用商店的搜索關(guān)鍵字?jǐn)?shù)據(jù),從而可進(jìn)行進(jìn)一步數(shù)據(jù)分析,為潛力App風(fēng)險(xiǎn)投資提供參考。
另外,所述步驟(1)的數(shù)據(jù)包括:移動(dòng)設(shè)備的附著、去附著、路由區(qū)域更新的管理數(shù)據(jù)報(bào)文,以及移動(dòng)設(shè)備訪問互聯(lián)網(wǎng)的業(yè)務(wù)數(shù)據(jù)報(bào)文。
另外,所述步驟(2)中數(shù)據(jù)格式為:
日期時(shí)間:生成數(shù)據(jù)的時(shí)間,包括年月日時(shí)分;
App應(yīng)用商店名稱:搜索關(guān)鍵字?jǐn)?shù)據(jù)的來源App應(yīng)用商店;
搜索關(guān)鍵字:App應(yīng)用商店中搜索的關(guān)鍵字;
移動(dòng)終端用戶ID:在移動(dòng)終端設(shè)備的某App應(yīng)用商店中搜索關(guān)鍵字的
移動(dòng)終端用戶的標(biāo)識(shí),其原文來源是IMSI、IMEI或MSISDN。
另外,所述步驟(2)包括以下分步驟:
(2.1)HTTP數(shù)據(jù)報(bào)文解析;
(2.2)HTTP數(shù)據(jù)報(bào)文溯源;
(2.3)App應(yīng)用商店流量識(shí)別;
(2.4)提取搜索關(guān)鍵字。
另外,如圖2所示,所述步驟(2.1)中,按照TCP/IP協(xié)議自底層向上層解析相關(guān)數(shù)據(jù)報(bào)文。
另外,所述步驟(2.1)中,當(dāng)移動(dòng)核心網(wǎng)中的HTTP請(qǐng)求報(bào)文時(shí),依次解析承載隧道協(xié)議部分的網(wǎng)絡(luò)接口層、網(wǎng)絡(luò)層IP協(xié)議、傳輸層UDP協(xié)議和應(yīng)用層GTP協(xié)議和隧道協(xié)議業(yè)務(wù)本身的網(wǎng)絡(luò)層IP協(xié)議、傳輸層TCP協(xié)議和應(yīng)用層HTTP協(xié)議。
另外,所述步驟(2.2)中,根據(jù)HTTP數(shù)據(jù)報(bào)文GTP協(xié)議的TEID查詢移動(dòng)終端附著/區(qū)域更新時(shí)記錄的TEID與IMSI的映射關(guān)系。
另外,所述步驟(2.3)中,根據(jù)輸入HTTP報(bào)文HOST屬性,匹配各大App應(yīng)用商店流量的HOST特征,匹配算法使用KMP模式匹配算法;如果匹配上App應(yīng)用商店,輸入HTTP數(shù)據(jù)和App應(yīng)用商店名稱,否則不處理該報(bào)文。
另外,App應(yīng)用商店查詢關(guān)鍵字的HTTP報(bào)文格式通過搭建實(shí)驗(yàn)環(huán)境抓取,包括以下分步驟:
(2.3.1)準(zhǔn)備一臺(tái)可以正常上網(wǎng)的筆記本電腦,將其搭建成無線wifi服務(wù)器;
(2.3.2)將手機(jī)連接上邊的無線wifi服務(wù)器;
(2.3.3)筆記本電腦上運(yùn)行抓包程序Wireshark,過濾顯示HTTP報(bào)文;
(2.3.4)手機(jī)上打開App應(yīng)用商店,查詢樣例App;
(2.3.5)Wireshark上過濾框中查詢樣例App,如果App名稱中包含中文,使用UTF-8或GB2312編碼代替中文,查看查詢結(jié)果,以確定App應(yīng)用商店搜索請(qǐng)求使用的編碼方式;
(2.3.6)根據(jù)步驟(2.3.5)中顯示的報(bào)文,總結(jié)出App應(yīng)用商店查詢關(guān)鍵字的HTTP報(bào)文。
另外,如圖3所示,所述步驟(2.4)包括以下分步驟:
(2.4.1)根據(jù)App應(yīng)用商店名稱獲取關(guān)鍵字模式配置;
(2.4.2)判斷輸入報(bào)文的URL是否滿足關(guān)鍵字模式中對(duì)URL的要求,如果不滿足要求,退出當(dāng)前處理;
(2.4.3)將輸入報(bào)文的URL參數(shù)分解成鍵值對(duì)集合,URL參數(shù)間使用&分隔,參數(shù)鍵值間使用=分隔,根據(jù)分隔符號(hào)分解參數(shù);
(2.4.4)判斷參數(shù)鍵值對(duì)集合是否包含關(guān)鍵字模式中的鍵名稱,如果不滿足要求,退出當(dāng)前處理;
另外,獲取鍵名稱對(duì)應(yīng)的參數(shù)值,根據(jù)編碼方式解碼,輸出日期時(shí)間、App應(yīng)用商店名稱、搜索關(guān)鍵字、移動(dòng)終端用戶ID。
本發(fā)明的有益效果如下:
1.本案中的原始數(shù)據(jù)直接來源于運(yùn)營(yíng)商的移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù),中間無人工干預(yù),確保分析數(shù)據(jù)結(jié)果是真實(shí)場(chǎng)景的如實(shí)反映。
2.本案中可以拉通各大App應(yīng)用商店的搜索關(guān)鍵字?jǐn)?shù)據(jù),進(jìn)行橫向?qū)Ρ?,也可以以時(shí)間維度縱向分析每個(gè)搜索關(guān)鍵字的熱度變化趨勢(shì),進(jìn)行多維度、多角度數(shù)據(jù)分析。
以上所述,僅是本發(fā)明的較佳實(shí)施例,并非對(duì)本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬本發(fā)明技術(shù)方案的保護(hù)范圍。