本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)方法及系統(tǒng)。
背景技術(shù):
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘。但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)和云存儲(chǔ)、虛擬化技術(shù)。隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注?!吨婆_(tái)》的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
現(xiàn)有的大數(shù)據(jù)不對(duì)大數(shù)據(jù)進(jìn)行統(tǒng)計(jì),導(dǎo)致重復(fù)搜索的次數(shù)多。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)?zhí)峁┮环N應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)方法。其解決現(xiàn)有技術(shù)的技術(shù)方案重復(fù)搜索的次數(shù)多的缺點(diǎn)。
一方面,提供一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)方法,所述方法包括如下步驟:應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)方法,所述方法包括如下步驟:
服務(wù)器獲取大數(shù)據(jù)的搜索次數(shù)以及提取次數(shù);
服務(wù)器記錄大數(shù)據(jù)的搜索次數(shù)以及提取該大數(shù)據(jù)的服務(wù)器的類(lèi)型;
服務(wù)器建立統(tǒng)計(jì)列表,該統(tǒng)計(jì)列表包括:搜索次數(shù)、提取次數(shù)以及大數(shù)據(jù)的標(biāo)識(shí)。
可選的,所述方法還包括:
服務(wù)器在統(tǒng)計(jì)列表中增加被搜索到的關(guān)鍵詞。
可選的,所述方法還包括:
服務(wù)器如接收到搜索關(guān)鍵詞,則將該搜索關(guān)鍵詞的大數(shù)據(jù)標(biāo)識(shí)發(fā)送給搜索設(shè)備。
第二方面,提供一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)系統(tǒng),所述系統(tǒng)包括:
獲取單元,用于獲取大數(shù)據(jù)的搜索次數(shù)以及提取次數(shù);
處理單元,用于記錄大數(shù)據(jù)的搜索次數(shù)以及提取該大數(shù)據(jù)的服務(wù)器的類(lèi)型,建立統(tǒng)計(jì)列表,該統(tǒng)計(jì)列表包括:搜索次數(shù)、提取次數(shù)以及大數(shù)據(jù)的標(biāo)識(shí)。
可選的,所述系統(tǒng)還包括:
處理單元,用于服務(wù)器在統(tǒng)計(jì)列表中增加被搜索到的關(guān)鍵詞。
可選的,所述系統(tǒng)還包括:
處理單元,用于如接收到搜索關(guān)鍵詞,則將該搜索關(guān)鍵詞的大數(shù)據(jù)標(biāo)識(shí)發(fā)送給搜索設(shè)備。
第三方面,提供一種服務(wù)器,包括:處理器、無(wú)線(xiàn)收發(fā)器、存儲(chǔ)器和總線(xiàn),所述處理器、無(wú)線(xiàn)收發(fā)器、存儲(chǔ)器通過(guò)總線(xiàn)連接,所述無(wú)線(xiàn)收發(fā)器,用于獲取大數(shù)據(jù)的搜索次數(shù)以及提取次數(shù);
所述處理器,用于記錄大數(shù)據(jù)的搜索次數(shù)以及提取該大數(shù)據(jù)的服務(wù)器的類(lèi)型,建立統(tǒng)計(jì)列表,該統(tǒng)計(jì)列表包括:搜索次數(shù)、提取次數(shù)以及大數(shù)據(jù)的標(biāo)識(shí)。
可選的,所述處理器,用于服務(wù)器在統(tǒng)計(jì)列表中增加被搜索到的關(guān)鍵詞。
可選的,所述處理器,用于如接收到搜索關(guān)鍵詞,則將該搜索關(guān)鍵詞的大數(shù)據(jù)標(biāo)識(shí)發(fā)送給搜索設(shè)備。
本發(fā)明提供的技術(shù)方案建立大數(shù)據(jù)的統(tǒng)計(jì)列表,所以其具有減少大數(shù)據(jù)搜索次數(shù)的優(yōu)點(diǎn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明第一較佳實(shí)施方式提供的一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)方法的流程圖;
圖2為本發(fā)明第二較佳實(shí)施方式提供的一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)系統(tǒng)的結(jié)構(gòu)圖。
圖3為本發(fā)明第二較佳實(shí)施方式提供的一種服務(wù)器的硬件結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參考圖1,圖1是本發(fā)明第一較佳實(shí)施方式提出的一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)方法,該方法如圖1所示,包括如下步驟:
步驟S101、服務(wù)器獲取大數(shù)據(jù)的搜索次數(shù)以及提取次數(shù)。
步驟S102、服務(wù)器記錄大數(shù)據(jù)的搜索次數(shù)以及提取該大數(shù)據(jù)的服務(wù)器的類(lèi)型。
步驟S103、服務(wù)器建立統(tǒng)計(jì)列表,該統(tǒng)計(jì)列表包括:搜索次數(shù)、提取次數(shù)以及大數(shù)據(jù)的標(biāo)識(shí)。
本發(fā)明提供的技術(shù)方案建立大數(shù)據(jù)的統(tǒng)計(jì)列表,所以其具有減少大數(shù)據(jù)搜索次數(shù)的優(yōu)點(diǎn)。
可選的,服務(wù)器在統(tǒng)計(jì)列表中增加被搜索到的關(guān)鍵詞。
可選的,服務(wù)器如接收到搜索關(guān)鍵詞,則將該搜索關(guān)鍵詞的大數(shù)據(jù)標(biāo)識(shí)發(fā)送給搜索設(shè)備。
請(qǐng)參考圖2,圖2是本發(fā)明第二較佳實(shí)施方式提出的一種應(yīng)用于大數(shù)據(jù)的統(tǒng)計(jì)系統(tǒng),該系統(tǒng)如圖2所示,包括:
獲取單元201,用于獲取大數(shù)據(jù)的搜索次數(shù)以及提取次數(shù);
處理單元202,用于記錄大數(shù)據(jù)的搜索次數(shù)以及提取該大數(shù)據(jù)的服務(wù)器的類(lèi)型,建立統(tǒng)計(jì)列表,該統(tǒng)計(jì)列表包括:搜索次數(shù)、提取次數(shù)以及大數(shù)據(jù)的標(biāo)識(shí)。
本發(fā)明提供的技術(shù)方案建立大數(shù)據(jù)的統(tǒng)計(jì)列表,所以其具有減少大數(shù)據(jù)搜索次數(shù)的優(yōu)點(diǎn)。
可選的,處理單元202,用于服務(wù)器在統(tǒng)計(jì)列表中增加被搜索到的關(guān)鍵詞。
可選的,處理單元202,用于如接收到搜索關(guān)鍵詞,則將該搜索關(guān)鍵詞的大數(shù)據(jù)標(biāo)識(shí)發(fā)送給搜索設(shè)備。
參閱圖3,圖3為一種服務(wù)器30,包括:處理器301、無(wú)線(xiàn)收發(fā)器302、存儲(chǔ)器303和總線(xiàn)304,無(wú)線(xiàn)收發(fā)器302用于與外部設(shè)備之間收發(fā)數(shù)據(jù)。處理器301的數(shù)量可以是一個(gè)或多個(gè)。本申請(qǐng)的一些實(shí)施例中,處理器301、存儲(chǔ)器302和收發(fā)器303可通過(guò)總線(xiàn)304或其他方式連接。服務(wù)器30可以用于執(zhí)行圖1的步驟。關(guān)于本實(shí)施例涉及的術(shù)語(yǔ)的含義以及舉例,可以參考圖1對(duì)應(yīng)的實(shí)施例。此處不再贅述。
無(wú)線(xiàn)收發(fā)器302,用于獲取大數(shù)據(jù)的搜索次數(shù)以及提取次數(shù)。
其中,存儲(chǔ)器303中存儲(chǔ)程序代碼。處理器901用于調(diào)用存儲(chǔ)器903中存儲(chǔ)的程序代碼,用于執(zhí)行以下操作:
處理器301,用于記錄大數(shù)據(jù)的搜索次數(shù)以及提取該大數(shù)據(jù)的服務(wù)器的類(lèi)型,建立統(tǒng)計(jì)列表,該統(tǒng)計(jì)列表包括:搜索次數(shù)、提取次數(shù)以及大數(shù)據(jù)的標(biāo)識(shí)。
需要說(shuō)明的是,這里的處理器301可以是一個(gè)處理元件,也可以是多個(gè)處理元件的統(tǒng)稱(chēng)。例如,該處理元件可以是中央處理器(Central Processing Unit,CPU),也可以是特定集成電路(Application Specific Integrated Circuit,ASIC),或者是被配置成實(shí)施本申請(qǐng)實(shí)施例的一個(gè)或多個(gè)集成電路,例如:一個(gè)或多個(gè)微處理器(digital singnal processor,DSP),或,一個(gè)或者多個(gè)現(xiàn)場(chǎng)可編程門(mén)陣列(Field Programmable Gate Array,F(xiàn)PGA)。
存儲(chǔ)器303可以是一個(gè)存儲(chǔ)裝置,也可以是多個(gè)存儲(chǔ)元件的統(tǒng)稱(chēng),且用于存儲(chǔ)可執(zhí)行程序代碼或應(yīng)用程序運(yùn)行裝置運(yùn)行所需要參數(shù)、數(shù)據(jù)等。且存儲(chǔ)器303可以包括隨機(jī)存儲(chǔ)器(RAM),也可以包括非易失性存儲(chǔ)器(non-volatile memory),例如磁盤(pán)存儲(chǔ)器,閃存(Flash)等。
總線(xiàn)304可以是工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(Industry Standard Architecture,ISA)總線(xiàn)、外部設(shè)備互連(Peripheral Component,PCI)總線(xiàn)或擴(kuò)展工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(Extended Industry Standard Architecture,EISA)總線(xiàn)等。該總線(xiàn)可以分為地址總線(xiàn)、數(shù)據(jù)總線(xiàn)、控制總線(xiàn)等。為便于表示,圖3中僅用一條粗線(xiàn)表示,但并不表示僅有一根總線(xiàn)或一種類(lèi)型的總線(xiàn)。
該終端還可以包括輸入輸出裝置,連接于總線(xiàn)304,以通過(guò)總線(xiàn)與處理器301等其它部分連接。該輸入輸出裝置可以為操作人員提供一輸入界面,以便操作人員通過(guò)該輸入界面選擇布控項(xiàng),還可以是其它接口,可通過(guò)該接口外接其它設(shè)備。
需要說(shuō)明的是,對(duì)于前述的各個(gè)方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某一些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳細(xì)描述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:閃存盤(pán)、只讀存儲(chǔ)器(英文:Read-Only Memory,簡(jiǎn)稱(chēng):ROM)、隨機(jī)存取器(英文:Random Access Memory,簡(jiǎn)稱(chēng):RAM)、磁盤(pán)或光盤(pán)等。
以上對(duì)本發(fā)明實(shí)施例所提供的內(nèi)容下載方法及相關(guān)設(shè)備、系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。