一種搜索引擎 seo 網(wǎng)站數(shù)據(jù)的優(yōu)化抓取方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)大數(shù)據(jù)分析、通訊技術(shù)及計算機技術(shù)領(lǐng)域,尤其涉及一種搜索引擎SEO網(wǎng)站數(shù)據(jù)的優(yōu)化抓取方法及系統(tǒng)。
【背景技術(shù)】
[0002]搜索引擎是針對“用戶使用網(wǎng)站的便利性”所提供的必要功能,同時也是“研宄網(wǎng)站數(shù)據(jù)分析的一個有效工具”。高效的Spider檢索與延伸可以讓用戶快速精準地找到實用信息,從而更有效地提高用戶的分析能力,而且通過對網(wǎng)站訪問者搜索行為的深度分析,對分辨事物本質(zhì)具有著重要的價值。鑒于搜索引擎營銷的環(huán)境發(fā)展為網(wǎng)絡(luò)營銷的推動起到舉足輕重的作用從效果營銷看,很多公司之所以可以應(yīng)用網(wǎng)絡(luò)營銷是利用了搜索引擎營銷就完整型電子商務(wù)概念組成部分來看,網(wǎng)絡(luò)營銷是其中最重要的組成部分,是向終端客戶傳遞信息的重要環(huán)節(jié)。
[0003]但是,目前的數(shù)據(jù)抓取過程存在數(shù)據(jù)缺失現(xiàn)象,尤其當有些數(shù)據(jù)不存在網(wǎng)頁上,而是在微信或微博上,則不能被抓取,進而不能為用戶提供精準的數(shù)據(jù)搜索附圖,且現(xiàn)有技術(shù)不能精準的根據(jù)用戶的搜索習慣給出用戶需要的網(wǎng)絡(luò)數(shù)據(jù),并且搜索結(jié)果的展現(xiàn)比較單一,且不直觀。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提供一種搜索引擎SEO網(wǎng)站數(shù)據(jù)的優(yōu)化抓取方法及系統(tǒng)。
[0005]本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種搜索引擎SEO網(wǎng)站數(shù)據(jù)的優(yōu)化抓取方法,包括如下步驟:
[0006]步驟1,接收用戶輸入的關(guān)鍵詞,對關(guān)鍵詞進行拓展,獲得多個長尾關(guān)鍵詞;
[0007]步驟2,根據(jù)長尾關(guān)鍵詞進行精準搜索,抓取相關(guān)大數(shù)據(jù);
[0008]步驟3,將獲得的相關(guān)大數(shù)據(jù)進行SEO自然排名,將排名數(shù)據(jù)及相關(guān)大數(shù)據(jù)內(nèi)容發(fā)送至引擎服務(wù)器;
[0009]步驟4,所述引擎服務(wù)器對所述相關(guān)大數(shù)據(jù)內(nèi)容進行大數(shù)據(jù)過濾,將過濾后的數(shù)據(jù)分類存儲;
[0010]步驟5,根據(jù)所述分類存儲的數(shù)據(jù)形成可視化圖表進行展示。
[0011]本發(fā)明的有益效果是:本申請中根據(jù)用戶的搜索習慣對輸入的關(guān)鍵詞進行拓展,為用戶提供最需要的搜索數(shù)據(jù),根據(jù)拓展的長尾關(guān)鍵詞抓取大數(shù)據(jù),不僅包括網(wǎng)站數(shù)據(jù),還包括微信微博等數(shù)據(jù),克服數(shù)據(jù)缺失現(xiàn)象,并對抓取的數(shù)據(jù)進行分類存儲,生成可視化圖表進行展示,為用戶提供精準搜索體驗的同時,為用戶提供直觀明了的結(jié)果展現(xiàn)。
[0012]在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進。
[0013]進一步,上述技術(shù)方案還包括提供蜂巢搜索,具體實現(xiàn)如下:
[0014]當用戶點擊蜂巢搜索鏈接,進入蜂巢搜索界面,進行JS蜂巢分析,根據(jù)關(guān)鍵詞生成分析報告。
[0015]進一步,進行JS蜂巢分析,根據(jù)關(guān)鍵詞生成分析報告的具體實現(xiàn)為:將可視化圖表按照分析報告的框架轉(zhuǎn)換成文字數(shù)據(jù),生成分析報告。
[0016]采用上述進一步方案的有益效果:在蜂巢中形成可視化對比與分析,根據(jù)可視化的對比與分析形成數(shù)據(jù)報告,為用戶提供多樣的展示形式,滿足用戶的各種需求。
[0017]進一步,步驟I的具體實現(xiàn)為:接收用戶輸入的關(guān)鍵詞,查詢用戶的訪問記錄cookie,根據(jù)用戶的訪問記錄cookie分析用戶的搜索習慣,根據(jù)用戶的搜素習慣對用戶輸入的關(guān)鍵詞進行拓展,獲得相應(yīng)的多個長尾關(guān)鍵詞。
[0018]進一步,步驟2中所述大數(shù)據(jù)包括新聞、問問、百科、微信、微博、論壇、貼吧和文庫中的一種或幾種數(shù)據(jù)。
[0019]本發(fā)明解決上述技術(shù)問題的另一技術(shù)方案如下:一種搜索引擎SEO網(wǎng)站數(shù)據(jù)的優(yōu)化抓取系統(tǒng),包括關(guān)鍵詞拓展模塊、網(wǎng)站抓取模塊、第一數(shù)據(jù)處理模塊、第二數(shù)據(jù)處理模塊、數(shù)據(jù)存儲模塊和可視化模塊;
[0020]所述關(guān)鍵詞拓展模塊,其用于接收用戶輸入的關(guān)鍵詞,對關(guān)鍵詞進行拓展,獲得多個長尾關(guān)鍵詞;
[0021]所述網(wǎng)站抓取模塊,其用于根據(jù)長尾關(guān)鍵詞進行精準搜索,抓取相關(guān)大數(shù)據(jù);
[0022]所述第一數(shù)據(jù)處理模塊,將獲得的相關(guān)大數(shù)據(jù)進行SEO自然排名,將排名數(shù)據(jù)及相關(guān)大數(shù)據(jù)內(nèi)容發(fā)送至第二數(shù)據(jù)處理模塊;
[0023]第二數(shù)據(jù)處理模塊,其用于對所述相關(guān)大數(shù)據(jù)內(nèi)容進行大數(shù)據(jù)過濾;
[0024]所述數(shù)據(jù)存儲模塊,請用于將過濾后的數(shù)據(jù)分類存儲;
[0025]所述可視化模塊,其用于根據(jù)所述分類存儲的數(shù)據(jù)形成可視化圖表進行展示。
[0026]在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進。
[0027]進一步,上述技術(shù)方案還包括蜂巢搜索模塊,其用于當用戶點擊蜂巢搜索鏈接,進入蜂巢搜索界面,進行JS蜂巢分析,根據(jù)關(guān)鍵詞生成分析報告。
[0028]進一步,所述蜂巢搜索模塊將可視化圖表按照分析報告的框架轉(zhuǎn)換成文字數(shù)據(jù),生成分析報告。
[0029]進一步,所述關(guān)鍵詞拓展模塊包括接收單元、查詢單元、分析單元和拓展單元;
[0030]所述接收單元,其用于接收用戶輸入的關(guān)鍵詞;
[0031]所述查詢單元,其用于查詢用戶的訪問記錄cookie ;
[0032]所述分析單元,其用于根據(jù)用戶的訪問記錄cookie分析用戶的搜索習慣;
[0033]所述拓展單元,其用于根據(jù)用戶的搜素習慣對用戶輸入的關(guān)鍵詞進行拓展,獲得相應(yīng)的多個長尾關(guān)鍵詞。
[0034]進一步,所述大數(shù)據(jù)包括新聞、問問、百科、微信、微博、論壇、貼吧和文庫中的一種或幾種數(shù)據(jù)。
【附圖說明】
[0035]圖1為本發(fā)明所述一種搜索引擎SEO網(wǎng)站數(shù)據(jù)的優(yōu)化抓取方法流程圖;
[0036]圖2為本發(fā)明實施例1所述框圖;
[0037]圖3為本發(fā)明實施例2所示框圖。
[0038]附圖中,各標號所代表的部件列表如下:
[0039]1、關(guān)鍵詞拓展模塊,2、網(wǎng)站抓取模塊,3、第一數(shù)據(jù)處理模塊,4、第二數(shù)據(jù)處理模塊,5、數(shù)據(jù)存儲模塊,6、可視化模塊,7、蜂巢搜索模塊。
【具體實施方式】
[0040]以下結(jié)合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
[0041]如圖1所示,一種搜索引擎SEO網(wǎng)站數(shù)據(jù)的優(yōu)化抓取方法,包括如下步驟:
[0042]步驟1,接收用戶輸入的關(guān)鍵詞,對關(guān)鍵詞進行拓展,獲得多個長尾關(guān)鍵詞;
[0043]步驟2,根據(jù)長尾關(guān)鍵詞進行精準搜索,抓取相關(guān)大數(shù)據(jù);
[0044]步驟3,將獲得的相關(guān)大數(shù)據(jù)進行SEO自然排名,將排名數(shù)據(jù)及相關(guān)大數(shù)據(jù)內(nèi)容發(fā)送至引擎服務(wù)器;
[0045]步驟4,所述引擎服務(wù)器對所述相關(guān)大數(shù)據(jù)內(nèi)容進行大數(shù)據(jù)過濾,將過濾后的數(shù)據(jù)分類存儲;
[0046]步驟5,根據(jù)所述分類存儲的數(shù)據(jù)形成可視化圖表進行展示。
[0047]上述技術(shù)方案還包括提供蜂巢搜索,具體實現(xiàn)如下:
[0048]當用戶點擊蜂巢搜索鏈接,進入蜂巢搜索界面,進行JS蜂巢分析,根據(jù)