一種基于云平臺的大數(shù)據(jù)分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,尤其涉及一種基于云平臺的大數(shù)據(jù)分析方法。
【背景技術(shù)】
[0002]隨著人類社會的不斷發(fā)展,生命科技相關(guān)各行業(yè)越來越受到人們的關(guān)注,它包括一系列的重要動植物、人類健康、微生物、海洋生物、生物能源等基因組的研究,基因科技可以造福人類,促進生物經(jīng)濟產(chǎn)業(yè)的蓬勃發(fā)展。這些主要涉及基因、蛋白質(zhì)測序等工作,目前的基因、蛋白質(zhì)測序等工作中,在測序、數(shù)據(jù)整理等工作完成后,需要對大量的生物數(shù)據(jù)進行分析,并將分析結(jié)果提交給用戶,但現(xiàn)有的數(shù)據(jù)分析方法效率不高,不能看到分析流程框架,得到的分析結(jié)果單一,且便于分享。
【發(fā)明內(nèi)容】
[0003]本發(fā)明實施例提出一種基于云平臺的大數(shù)據(jù)分析方法,通過該方法將獲取的生物數(shù)據(jù)進行分析歸類,并將分析結(jié)果和分析流程框架上傳至云中心服務(wù)器,分析方法效率高,分析結(jié)果清晰,易讀性好,且便于用戶分享。
[0004]本發(fā)明實施例提供一種基于云平臺的大數(shù)據(jù)分析方法,包括:
[0005]S1、從基因測序裝置中獲取生物數(shù)據(jù),將獲取的生物數(shù)據(jù)存儲到云中心服務(wù)器中;
[0006]S2、動態(tài)設(shè)定關(guān)鍵詞,通過網(wǎng)絡(luò)從所述云中心服務(wù)器中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù);
[0007]S3、對采集的生物數(shù)據(jù)進行分類,并存儲到相應(yīng)的數(shù)據(jù)庫中;
[0008]S4、將所述數(shù)據(jù)庫中存儲的生物數(shù)據(jù)依次進行信息分析、領(lǐng)域分析、關(guān)系挖掘分析,得到分析結(jié)果和分析流程框架,并依據(jù)所述分析結(jié)果建立數(shù)據(jù)索引表;
[0009]S5、調(diào)用得到的所述分析結(jié)果和所述分析流程框架,顯示所述分析結(jié)果和所述分析流程框架,并將所述分析結(jié)果和所述分析流程框架上傳至所述云中心服務(wù)器。
[0010]進一步的,當用戶輸入關(guān)鍵詞時,首先檢索輸入的關(guān)鍵詞是否存在于所述數(shù)據(jù)索引表中;若存在,則從所述云中心服務(wù)器中直接調(diào)用與所述輸入的關(guān)鍵詞相關(guān)聯(lián)的所述分析結(jié)果和所述分析流程框架,并顯示所述分析結(jié)果和所述分析流程框架;若不存在,則重復(fù)步驟S2-S5。
[0011]又進一步的,所述分析結(jié)果的顯示類型為餅狀圖、柱狀圖、表格。
[0012]更進一步的,所述分析結(jié)果和所述分析流程框架還通過所述云中心服務(wù)器導出或定時發(fā)送到用戶的手機或郵箱中。
[0013]本發(fā)明實施例提供的基于云平臺的大數(shù)據(jù)分析方法,通過將獲取的生物數(shù)據(jù)存儲到云中心服務(wù)器中,從云中心服務(wù)器中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù),對其進行分類后存儲到相應(yīng)的數(shù)據(jù)庫中,然后對其依次進行信息分析、領(lǐng)域分析、關(guān)系挖掘分析,并依據(jù)分析結(jié)果建立數(shù)據(jù)索引表,顯示分析結(jié)果和分析流程框架,并將分析結(jié)果和分析流程框架上傳至云中心服務(wù)器。所述的數(shù)據(jù)分析方法能夠有效地對生物數(shù)據(jù)進行分析歸類,分析方法效率高;在給出分析結(jié)果的同時給出相關(guān)的分析流程框架,使分析結(jié)果清晰,易讀性好;最終將分析結(jié)果和分析流程框架上傳到云中心服務(wù)器,便于用戶在其科研團隊內(nèi)分享,提高協(xié)作分析的效率。
【附圖說明】
[0014]圖1是本發(fā)明提供的基于云平臺的大數(shù)據(jù)分析方法的實施例的流程示意圖。
【具體實施方式】
[0015]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0016]參見圖1,是本發(fā)明提供的基于云平臺的大數(shù)據(jù)分析方法的實施例的流程示意圖。
[0017]本發(fā)明實施例提供一種基于云平臺的大數(shù)據(jù)分析方法,包括:
[0018]S101、從基因測序裝置中獲取生物數(shù)據(jù),將獲取的生物數(shù)據(jù)存儲到云中心服務(wù)器中;
[0019]有一個或多個生物數(shù)據(jù)獲取設(shè)備且每個生物數(shù)據(jù)獲取設(shè)備可負責從一個或多個基因測序裝置中獲取生物數(shù)據(jù)。
[0020]在具體實施當中,可以直接從基因測序裝置中獲取生物數(shù)據(jù),也可以通過常規(guī)的計算機顯示器和鍵盤輸入試驗樣品的數(shù)據(jù)結(jié)果,即獲取了生物數(shù)據(jù)。
[0021]S102、動態(tài)設(shè)定關(guān)鍵詞,通過網(wǎng)絡(luò)從所述云中心服務(wù)器中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù);
[0022]根據(jù)初始設(shè)定的關(guān)鍵字,從獲取的生物數(shù)據(jù)中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù),從大量的原始生物數(shù)據(jù)中提取出有用的數(shù)據(jù),拋棄無用的數(shù)據(jù),減少后續(xù)分析操作所需處理的數(shù)據(jù)量,提高數(shù)據(jù)處理的效率。
[0023]S103、對采集的生物數(shù)據(jù)進行分類,并存儲到相應(yīng)的數(shù)據(jù)庫中;
[0024]采集相匹配的數(shù)據(jù)后,對相匹配的數(shù)據(jù)根據(jù)生物數(shù)據(jù)的分類方法進行分類,并按類別將分類后的生物數(shù)據(jù)存儲到相應(yīng)的數(shù)據(jù)庫中。
[0025]需要說明的是,數(shù)據(jù)庫需提供某種形式的冗余以在故障的情況下確保數(shù)據(jù)整體性和系統(tǒng)可靠性。且數(shù)據(jù)庫應(yīng)確??焖俚拇鎯λ俾?,因為當大量數(shù)據(jù)被傳輸?shù)綌?shù)據(jù)庫中時,數(shù)據(jù)庫需要應(yīng)對大量的數(shù)據(jù)存儲,數(shù)據(jù)庫的存儲速率應(yīng)大于數(shù)據(jù)被采集的速率,故數(shù)據(jù)庫應(yīng)運用高速緩存存儲器和閃存系統(tǒng)。
[0026]S104、將所述數(shù)據(jù)庫中存儲的生物數(shù)據(jù)依次進行信息分析、領(lǐng)域分析、關(guān)系挖掘分析,得到分析結(jié)果和分析流程框架,并依據(jù)所述分析結(jié)果建立數(shù)據(jù)索引表;
[0027]針對不同類別數(shù)據(jù)庫中的生物數(shù)據(jù),分別進行有針對性的信息分析、領(lǐng)域分析、關(guān)系挖掘分析,得到對應(yīng)的分析結(jié)果和分析流程框架,并針對相應(yīng)的分析過程建立數(shù)據(jù)索引表,以便于用戶對分析結(jié)果和分析流程框架進行查找,提高查找的效率。
[0028]S105、調(diào)用得到的所述分析結(jié)果和所述分析流程框架,顯示所述分析結(jié)果和所述分析流程框架,并將所述分析結(jié)果和所述分析流程框架上傳至所述云中心服務(wù)器。
[0029]優(yōu)選的,所述分析結(jié)果的顯示類型為餅狀圖、柱狀圖、表格。
[0030]需要說明的是,本實施例僅以所述分析結(jié)果的顯示類型是餅狀圖、柱狀圖、表格為例進行說明,所述分析結(jié)果的顯示類型還可以是文字、數(shù)字、符號或其他形式。
[0031]優(yōu)選的,所述分析結(jié)果和所述分析流程框架還通過所述云中心服務(wù)器導出或定時發(fā)送到用戶的手機或郵箱中。
[0032]分析過程結(jié)束后,需要將分析結(jié)果和分析流程框架提交給用戶,可以通過在顯示器上顯示的方式或打印的方式將分析結(jié)果和分析流程框架顯示出來,并將分析結(jié)果和分析流程框架上傳至云中心服務(wù)器。
[0033]本方法還提供了數(shù)據(jù)、項目共享的功能,可以通過開通權(quán)限的方式,訪問云中心服務(wù)器用戶科研團隊的的其他成員獲得分析結(jié)果和分析流程框架,并控制共享的程度(可讀、可寫、可執(zhí)行等),這樣更有利于科研團隊的協(xié)作分析。
[0034]進一步的,當用戶輸入關(guān)鍵詞時,首先檢索輸入的關(guān)鍵詞是否存在于所述數(shù)據(jù)索引表中;
[0035]若存在,則從所述云中心服務(wù)器中直接調(diào)用與所述輸入的關(guān)鍵詞相關(guān)聯(lián)的所述分析結(jié)果和所述分析流程框架,并顯示所述分析結(jié)果和所述分析流程框架;
[0036]若不存在,則重復(fù)步驟S102-S105。
[0037]當用戶輸入關(guān)鍵詞對分析結(jié)果進行檢索,首先在分析過程完成后得到的數(shù)據(jù)索引表中查找輸入的關(guān)鍵字,如果輸入的關(guān)鍵字存在于現(xiàn)有的數(shù)據(jù)索引表中,則從云中心服務(wù)器中直接調(diào)用與所述關(guān)鍵詞相關(guān)聯(lián)的分析結(jié)果和分析流程框架,并將相關(guān)聯(lián)的分析結(jié)果和分析流程框架顯示給用戶,還可通過云中心服務(wù)器導出或定時發(fā)送到用戶的手機或郵箱中;如果在現(xiàn)有的數(shù)據(jù)索引表中找不到輸入的關(guān)鍵詞,則會重新執(zhí)行數(shù)據(jù)分析方法步驟S102-S105,對與輸入的關(guān)鍵詞相關(guān)聯(lián)的生物數(shù)據(jù)執(zhí)行分析過程。
[0038]本發(fā)明實施例提供的基于云平臺的大數(shù)據(jù)分析方法,通過將獲取的生物數(shù)據(jù)存儲到云中心服務(wù)器中,從云中心服務(wù)器中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù),對其進行分類后存儲到相應(yīng)的數(shù)據(jù)庫中,然后對其依次進行信息分析、領(lǐng)域分析、關(guān)系挖掘分析,并依據(jù)分析結(jié)果建立數(shù)據(jù)索引表,顯示分析結(jié)果和分析流程框架,并將分析結(jié)果和分析流程框架上傳至云中心服務(wù)器。所述的數(shù)據(jù)分析方法能夠有效地對生物數(shù)據(jù)進行分析歸類,分析方法效率高;在給出分析結(jié)果的同時給出相關(guān)的分析流程框架,使分析結(jié)果清晰,易讀性好;最終將分析結(jié)果和分析流程框架上傳到云中心服務(wù)器,便于用戶在其科研團隊內(nèi)分享,提高協(xié)作分析的效率。
[0039]以上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也視為本發(fā)明的保護范圍。
【主權(quán)項】
1.一種基于云平臺的大數(shù)據(jù)分析方法,其特征在于: 51、從基因測序裝置中獲取生物數(shù)據(jù),將獲取的生物數(shù)據(jù)存儲到云中心服務(wù)器中; 52、動態(tài)設(shè)定關(guān)鍵詞,通過網(wǎng)絡(luò)從所述云中心服務(wù)器中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù); 53、對采集的生物數(shù)據(jù)進行分類,并存儲到相應(yīng)的數(shù)據(jù)庫中; 54、將所述數(shù)據(jù)庫中存儲的生物數(shù)據(jù)依次進行信息分析、領(lǐng)域分析、關(guān)系挖掘分析,得到分析結(jié)果和分析流程框架,并依據(jù)所述分析結(jié)果建立數(shù)據(jù)索引表; 55、調(diào)用得到的所述分析結(jié)果和所述分析流程框架,顯示所述分析結(jié)果和所述分析流程框架,并將所述分析結(jié)果和所述分析流程框架上傳至所述云中心服務(wù)器。2.如權(quán)利要求1所述的基于云平臺的大數(shù)據(jù)分析方法,其特征在于,當用戶輸入關(guān)鍵詞時,首先檢索輸入的關(guān)鍵詞是否存在于所述數(shù)據(jù)索引表中; 若存在,則從所述云中心服務(wù)器中直接調(diào)用與所述輸入的關(guān)鍵詞相關(guān)聯(lián)的所述分析結(jié)果和所述分析流程框架,并顯示所述分析結(jié)果和所述分析流程框架; 若不存在,則重復(fù)步驟S2-S5。3.如權(quán)利要求1所述的基于云平臺的大數(shù)據(jù)分析方法,其特征在于,所述分析結(jié)果的顯示類型為餅狀圖、柱狀圖、表格。4.如權(quán)利要求1所述的基于云平臺的大數(shù)據(jù)分析方法,其特征在于,所述分析結(jié)果和所述分析流程框架還通過所述云中心服務(wù)器導出或定時發(fā)送到用戶的手機或郵箱中。
【專利摘要】本發(fā)明公開了一種基于云平臺的大數(shù)據(jù)分析方法,包括:S1、從基因測序裝置中獲取生物數(shù)據(jù),將獲取的生物數(shù)據(jù)存儲到云中心服務(wù)器中;S2、動態(tài)設(shè)定關(guān)鍵詞,通過網(wǎng)絡(luò)從所述云中心服務(wù)器中采集與設(shè)定的關(guān)鍵詞相匹配的生物數(shù)據(jù);S3、對采集的生物數(shù)據(jù)進行分類,并存儲到相應(yīng)的數(shù)據(jù)庫中;S4、將所述數(shù)據(jù)庫中存儲的生物數(shù)據(jù)依次進行信息分析、領(lǐng)域分析、關(guān)系挖掘分析,得到分析結(jié)果和分析流程框架,并依據(jù)所述分析結(jié)果建立數(shù)據(jù)索引表;S5、調(diào)用得到的所述分析結(jié)果和所述分析流程框架,顯示所述分析結(jié)果和所述分析流程框架,并將所述分析結(jié)果和所述分析流程框架上傳至所述云中心服務(wù)器。采用本發(fā)明實施例,分析方法效率高,分析結(jié)果清晰,易讀性好,且便于用戶分享。
【IPC分類】G06F19/18, G06F19/24
【公開號】CN105389482
【申請?zhí)枴緾N201510627232
【發(fā)明人】李國慶, 陳剛, 蘆長欣
【申請人】深圳華大基因科技服務(wù)有限公司
【公開日】2016年3月9日
【申請日】2015年9月28日