本發(fā)明涉及大數(shù)據(jù)管理技術(shù)領(lǐng)域,具體涉及一種生命健康數(shù)據(jù)管理方法及系統(tǒng)。
背景技術(shù):
隨著測序技術(shù)的不斷更新?lián)Q代,高通量測序成本大大下降,生物分子原始數(shù)據(jù)量急劇膨脹,現(xiàn)代生物信息學(xué)研究的重心已經(jīng)從最初的獲取數(shù)據(jù),轉(zhuǎn)移到了從海量的生物數(shù)據(jù)中挖掘有用的信息,并研究其包含的生物學(xué)意義。
近幾年來,隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,在基于網(wǎng)絡(luò)范圍內(nèi)有效管理、共享、分析、利用海量信息學(xué)數(shù)據(jù)變的越來越方便。同樣,數(shù)據(jù)庫技術(shù)在因特網(wǎng)中的廣泛應(yīng)用,給信息的共享和存儲提供了很好的服務(wù)。但是,目前,還沒有一個能夠查詢生命健康相關(guān)信息的系統(tǒng),因此,本申請?zhí)峁┝艘环N生命健康數(shù)據(jù)管理方法及系統(tǒng)。
技術(shù)實(shí)現(xiàn)要素:
針對現(xiàn)有技術(shù)中的上述缺陷,本發(fā)明提供了一種生命健康數(shù)據(jù)管理方法及系統(tǒng),可以使用戶更加容易、有效地查詢與生命健康相關(guān)的信息,可以提高用戶體驗(yàn)。
第一方面,本發(fā)明提供的一種生命健康數(shù)據(jù)管理方法,包括:
獲取用戶輸入的查詢指令;
根據(jù)所述查詢指令從預(yù)先建立的數(shù)據(jù)庫中查找與所述查詢指令相應(yīng)的生命健康數(shù)據(jù);
將所述生命健康數(shù)據(jù)輸出給用戶。
可選的,在所述根據(jù)所述查詢指令從預(yù)先建立的數(shù)據(jù)庫中查找與所述查詢指令相應(yīng)的生命健康數(shù)據(jù)的步驟之前,還包括:
獲取生命健康樣本信息;
對所述生命健康樣本信息進(jìn)行上機(jī)測序,獲得生命健康樣本數(shù)據(jù);
根據(jù)所述生命健康樣本數(shù)據(jù)搭建數(shù)據(jù)庫。
可選的,所述根據(jù)所述生命健康樣本數(shù)據(jù)搭建數(shù)據(jù)庫,包括:
搭建數(shù)據(jù)庫模型,并確定所述數(shù)據(jù)庫模型中表和字段;
對所述字段進(jìn)行關(guān)聯(lián)設(shè)置;
將所述樣本數(shù)據(jù)導(dǎo)入所述數(shù)據(jù)庫模型中;
將所述樣本數(shù)據(jù)按照所述數(shù)據(jù)庫模型中的所述字段進(jìn)行整理和分類;
將所述整理和分類的樣本數(shù)據(jù)填入所述表中,生成關(guān)系表;
將所述關(guān)系表分類存儲到所述數(shù)據(jù)庫模型中,生成數(shù)據(jù)庫。
可選的,所述將所述關(guān)系表分類存儲到所述數(shù)據(jù)庫模型中,生成數(shù)據(jù)庫,包括:
將所述關(guān)系表按時間軸分類存儲到所述數(shù)據(jù)庫模型中,生成數(shù)據(jù)庫。
可選的,所述字段,包括:捐贈者;
所述將所述樣本數(shù)據(jù)按照所述數(shù)據(jù)庫模型中的所述字段進(jìn)行整理和分類,包括:
將所述樣本數(shù)據(jù)按照所述捐贈者進(jìn)行整理和分類。
可選的,所述生命健康樣本數(shù)據(jù),包括:表型樣本數(shù)據(jù)、疾病類型樣本數(shù)據(jù)、基因樣本數(shù)據(jù)中的至少一種。
第二方面,本發(fā)明提供的一種生命健康數(shù)據(jù)管理系統(tǒng),包括:客戶端、服務(wù)器;
所述服務(wù)器接收所述客戶端發(fā)送的生命健康數(shù)據(jù)查詢指令;
所述服務(wù)器根據(jù)所述查詢指令在預(yù)先建立的數(shù)據(jù)庫中查找相應(yīng)的數(shù)據(jù);
所述服務(wù)器將所述數(shù)據(jù)發(fā)送給所述客戶端;
所述客戶端在指定頁面顯示所述數(shù)據(jù)。
可選的,所述服務(wù)器將所述數(shù)據(jù)發(fā)送給所述客戶端,包括:
所述服務(wù)器將所述數(shù)據(jù)發(fā)送給所述客戶端的分層樹形插件、時間軸插件、基因突變信息展示插件中的一種或多種;
所述客戶端在指定頁面顯示所述數(shù)據(jù),包括:
所述客戶端的所述分層樹形插件和/或時間軸插件在指定頁面顯示所述數(shù)據(jù)。
可選的,所述數(shù)據(jù)庫采用開源的關(guān)系型postgresql數(shù)據(jù)庫。
可選的,所述服務(wù)器是基于python的djangomtv架構(gòu)實(shí)現(xiàn)的。
本發(fā)明通過獲取用戶輸入的查詢指令,然后根據(jù)所述查詢指令從預(yù)先建立的數(shù)據(jù)庫中查找與所述查找指令相應(yīng)的生命健康數(shù)據(jù),最后將所述生命健康數(shù)據(jù)輸出給用戶??梢允褂脩舾鶕?jù)自己的需要查找相應(yīng)的生命健康信息,可以使用戶更加容易地得到查詢的結(jié)果,可以提高用戶體驗(yàn)。同時,加快了生命信息的共享和生命科學(xué)的發(fā)展。
本發(fā)明提供的一種生命健康數(shù)據(jù)管理系統(tǒng),與上述生命健康數(shù)據(jù)管理方法出于相同的發(fā)明構(gòu)思,具有相同的有益效果。
附圖說明
為了更清楚地說明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標(biāo)記標(biāo)識。附圖中,各元件或部分并不一定按照實(shí)際的比例繪制。
圖1示出了本發(fā)明第一實(shí)施例提供一種生命健康數(shù)據(jù)管理方法的流程圖。
具體實(shí)施方式
下面將結(jié)合附圖對本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
需要注意的是,除非另有說明,本申請使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
本發(fā)明提供了一種生命健康數(shù)據(jù)管理方法及系統(tǒng)。下面結(jié)合附圖對本發(fā)明的實(shí)施例進(jìn)行說明。
圖1示出了本發(fā)明第一實(shí)施例所提供的一種生命健康數(shù)據(jù)管理方法及系統(tǒng)的流程圖。如圖1所示,本發(fā)明第一實(shí)施例提供的一種生命健康數(shù)據(jù)管理方法,包括以下步驟:
步驟s101:獲取用戶輸入的查詢指令。
在本發(fā)明實(shí)施例中,所述獲取用戶輸入的查詢指令的主體可以是服務(wù)器,所述用戶可以通過智能終端的web頁面輸入所述查詢指令。
所述用戶輸入的查詢指令可以是針對疾病類型、基因、捐贈者、數(shù)據(jù)等中一種或多種的查詢指令。
步驟s102:根據(jù)所述查詢指令從預(yù)先建立的數(shù)據(jù)庫中查找與所述查詢指令相應(yīng)的生命健康數(shù)據(jù)。
在本步驟之前,還可以包括:獲取生命健康樣本信息;對所述生命健康樣本信息進(jìn)行上機(jī)測序,獲得生命健康樣本數(shù)據(jù);根據(jù)所述生命健康樣本數(shù)據(jù)搭建數(shù)據(jù)庫。
在本發(fā)明提供的一個具體實(shí)施例中,所述生命健康樣本信息通過上機(jī)測序,可以得到基因位點(diǎn)層面的突變信息,解讀并關(guān)聯(lián)相關(guān)表型和疾病信息,可以得到有用的、有價值的生命健康樣本數(shù)據(jù),所述上機(jī)測序過程能夠起到篩選數(shù)據(jù)的功能。利用篩選后的所述生命健康樣本數(shù)據(jù)搭建數(shù)據(jù)庫,可以提高所述數(shù)據(jù)庫的可靠性,可以使用戶獲得更加準(zhǔn)確的信息。
在本發(fā)明提供的一個具體實(shí)施例中,所述根據(jù)所述生命健康樣本數(shù)據(jù)搭建數(shù)據(jù)庫,可以包括:搭建數(shù)據(jù)庫模型,并確定所述數(shù)據(jù)庫模型中表和字段;對所述字段進(jìn)行關(guān)聯(lián)設(shè)置;將所述樣本數(shù)據(jù)導(dǎo)入所述數(shù)據(jù)庫模型中;將所述樣本數(shù)據(jù)按照所述數(shù)據(jù)庫模型中的所述字段進(jìn)行整理和分類;將所述整理和分類的樣本數(shù)據(jù)填入所述表中,生成關(guān)系表;將所述關(guān)系表分類存儲到所述數(shù)據(jù)庫模型中,生成數(shù)據(jù)庫。
所述數(shù)據(jù)庫模型中的所述字段設(shè)置在所述表中,通過對所述字段進(jìn)行關(guān)聯(lián)設(shè)置,可以得到各個字段相關(guān)聯(lián)的一張表,將所述樣本數(shù)據(jù)導(dǎo)入所述數(shù)據(jù)庫模型中后,就可以生成各個字段具有相關(guān)聯(lián)系的關(guān)系表。所述字段包含某一專題的信息,例如,所述字段可以是:捐贈者姓名、疾病類型、基因類型、基因突變頻率等。將所述字段進(jìn)行關(guān)聯(lián),也就是將所述具有某一專題的信息進(jìn)行關(guān)聯(lián),這樣,可以使用戶獲得具有關(guān)聯(lián)信息的各個專題的數(shù)據(jù),可以使用戶獲得更加全面的信息。
在本發(fā)明提供的一個具體實(shí)施例中,所述將所述關(guān)系表分類存儲到所述數(shù)據(jù)庫模型中,生成數(shù)據(jù)庫,包括:將所述關(guān)系表按時間軸分類存儲到所述數(shù)據(jù)庫模型中,生成數(shù)據(jù)庫。
相較于現(xiàn)有技術(shù)中數(shù)據(jù)庫采用零散的樣本管理,使得各個時間段的樣本沒有關(guān)聯(lián)性,樣本間的變化趨勢無法展示的缺點(diǎn),本發(fā)明提供的這種采用時間軸方法存儲管理所述關(guān)系表,有利于對大樣本數(shù)據(jù)的邏輯性管理,而且,還可以為用戶提供按時間段分類的數(shù)據(jù),使用戶可以看到同一指標(biāo)在一段時間內(nèi)的變化趨勢,同時,這種存儲管理方法也有利于對所述樣本數(shù)據(jù)的挖掘和分析。
在本發(fā)明提供的一個具體實(shí)施例中,所述字段,包括:捐贈者;所述將所述樣本數(shù)據(jù)按照所述數(shù)據(jù)庫模型中的所述字段進(jìn)行整理和分類,包括:將所述樣本數(shù)據(jù)按照所述捐贈者進(jìn)行整理和分類。
在數(shù)據(jù)庫模型中對樣本數(shù)據(jù)進(jìn)行整理和分類時,可以按照捐贈者進(jìn)行整理和分類,這樣,可以將所述捐贈者的所有數(shù)據(jù)都集中進(jìn)行管理,更加有條理地對所述樣本數(shù)據(jù)進(jìn)行管理,可以使用戶看到一個捐贈者整個疾病的發(fā)展過程,可以為用戶提供更加準(zhǔn)確的疾病信息。
在本發(fā)明提供的一個具體實(shí)施例中,所述生命健康樣本數(shù)據(jù),包括:表型樣本數(shù)據(jù)、疾病類型樣本數(shù)據(jù)、基因樣本數(shù)據(jù)中的至少一種。
所述生命健康樣本數(shù)據(jù)可以有多種方面的樣本數(shù)據(jù),可以包括:表型樣本數(shù)據(jù)、疾病類型樣本數(shù)據(jù)、基因樣本數(shù)據(jù)等多種樣本數(shù)據(jù)??梢跃C合管理這些樣本數(shù)據(jù),可以為用戶提供更加全面的信息,使用戶了解到捐贈者或者疾病類型的所有癥狀和信息,可以提高用戶體驗(yàn)。
步驟s103:將所述生命健康數(shù)據(jù)輸出給用戶。
將所述生命健康數(shù)據(jù)輸出給用戶,可以是以時間軸的方式輸出給用戶;可以給用戶輸出與用戶輸入的疾病最相關(guān)的10個基因;可以以圖形的方式輸出給用戶,可以以表格的方式輸出給用戶,可以以鏈接的方式輸出給用戶。
本發(fā)明第二實(shí)施例提供一種生命健康數(shù)據(jù)管理系統(tǒng),包括客戶端、服務(wù)器;所述服務(wù)器接收所述客戶端發(fā)送的生命健康數(shù)據(jù)查詢指令;所述服務(wù)器根據(jù)所述查詢指令在預(yù)先建立的數(shù)據(jù)庫中查找相應(yīng)的數(shù)據(jù);所述服務(wù)器將所述數(shù)據(jù)發(fā)送給所述客戶端;所述客戶端在指定頁面顯示所述數(shù)據(jù)。
所述客戶端可以根據(jù)用戶需求進(jìn)行設(shè)計,可以根據(jù)用戶分析、系統(tǒng)功能需求、性能需求、系統(tǒng)接口及集成進(jìn)行設(shè)計,這樣,可以保證需求和系統(tǒng)使用與用戶的目標(biāo)相聯(lián)系。所述客戶端可以根據(jù)用戶語言和需求模型進(jìn)行設(shè)計,正確表達(dá)用戶需求。
其中,所述系統(tǒng)可根據(jù)需求設(shè)計系統(tǒng)測試目標(biāo)和測試進(jìn)度,這樣,可以跟蹤需求缺陷,及時維護(hù)系統(tǒng)。
在本發(fā)明提供的一個具體實(shí)施例中,所述服務(wù)器將所述數(shù)據(jù)發(fā)送給所述客戶端,包括:所述服務(wù)器將所述數(shù)據(jù)發(fā)送給所述客戶端的分層樹形插件、時間軸插件、基因突變信息展示插件中的一種或多種;
所述客戶端在指定頁面顯示所述數(shù)據(jù),包括:
所述客戶端的所述分層樹形插件和/或時間軸插件在指定頁面顯示所述數(shù)據(jù)。
所述客戶端利用不同的插件可以顯示不同的頁面效果,例如,利用分層樹形插件可以顯示樹狀結(jié)構(gòu)的數(shù)據(jù)文件夾,利用時間軸插件可以顯示按時間分類的不同時間段的數(shù)據(jù),利用基因突變信息管理展示插件,可以展示基因突變的過程。這樣,可以滿足用戶不同的瀏覽需求,可以提高用戶體驗(yàn)。
在本發(fā)明提供的一個具體實(shí)施例中,所述數(shù)據(jù)庫采用開源的關(guān)系型postgresql數(shù)據(jù)庫。
利用所述開源性數(shù)據(jù)庫軟件和技術(shù),可以降低開發(fā)成本,簡化搭建部署、易于維護(hù)。
在本發(fā)明提供的一個具體實(shí)施例中,所述服務(wù)器是基于python的djangomtv架構(gòu)實(shí)現(xiàn)的。
采用了較為成熟穩(wěn)定的服務(wù)器架構(gòu)nginx+uwsgi+django。uwsgi是uwsgi項(xiàng)目自有的協(xié)議,把nginx作為反向代理的請求進(jìn)行處理,并發(fā)給wsgi,wsgi根據(jù)請求逐層調(diào)用函數(shù)或程序把處理結(jié)果進(jìn)行打包逐一返回,最終呈現(xiàn)到瀏覽器。
所述客戶端的請求數(shù)據(jù)與服務(wù)器任務(wù)處理之間的交互是通過django的mvc(modelviewcontroller)框架,即模型(model)-視圖(view)-控制器(controller)進(jìn)行處理。
所述客戶端是基于bootstrap-v3.3.2的web框架,采用html5+css3+javascript編碼實(shí)現(xiàn)的。
本發(fā)明是以生命健康樣本大數(shù)據(jù)為出發(fā)點(diǎn),在已有互聯(lián)網(wǎng)技術(shù)的基礎(chǔ)上,通過django的開放源碼web應(yīng)用框架,把生命健康樣本大數(shù)據(jù)、用戶查詢需求、數(shù)據(jù)處理結(jié)果利用mvc的模式有機(jī)整合成為一個易于操作的可視化應(yīng)用系統(tǒng),在最大程度上為用戶提供了生命健康領(lǐng)域邏輯的可視化數(shù)據(jù)結(jié)果,也為生物醫(yī)學(xué)研究的各方面人員進(jìn)行數(shù)據(jù)解讀提供了更簡便的條件,有利于數(shù)據(jù)價值的最大化利用。
在所述系統(tǒng)中,可以對生命健康樣本表型數(shù)據(jù)搜集以及處理的結(jié)果數(shù)據(jù),通過簡單的二次處理即可進(jìn)行數(shù)據(jù)管理系統(tǒng)更新,這樣,有利于所述系統(tǒng)及時快速迭代更新。
本發(fā)明第三實(shí)施例提供一種關(guān)于癌癥的生命健康數(shù)據(jù)管理系統(tǒng)。
在所述系統(tǒng)的客戶端,可以有四個入口,可以包括:疾病類型、基因、捐贈者、數(shù)據(jù)。用戶可通過各個入口獲得數(shù)據(jù),比如疾病類型入口,可以獲得該疾病捐贈者統(tǒng)計數(shù)量,該病相關(guān)重要基因的頻率(相關(guān)性越大,圓的面積越大);比如基因入口,可以迅速獲得與各類型疾病突變最多的前五個基因,拷貝數(shù)變異和插入缺失突變。此外,還可直觀看到與該疾病系統(tǒng)相關(guān)的人的24條染色體上的不同基因突變信息;比如捐贈者入口,可獲取捐贈者相關(guān)表型數(shù)據(jù)的統(tǒng)計圖,并可通過設(shè)定表型參數(shù)檢索匹配樣本,并開發(fā)時間軸插件展示各階段樣本臨床表型數(shù)據(jù),時間軸左邊通過選擇時間,下方展示該時間段樣本的突變信息變化趨勢,右邊展示樣本的表型信息;數(shù)據(jù)入口,通過分層樹形插件展示各層級數(shù)據(jù)文件。
所述客戶端,還可以包括:搜索窗口。
用戶從所述搜索窗口輸入特定癌癥名稱能夠獲取與本疾病最相關(guān)的top10基因以及這些基因的具體信息、與該基因相關(guān)的突變、捐贈者的表型信息,突變信息,隨時間而變化的臨床信息及其他統(tǒng)計信息。
所述搜索窗口和所述四個入口可以同時使用,例如,在查詢界面選擇癌癥類型“tumourtype”,輸入“bladdercancer”關(guān)鍵字,可以獲取膀胱癌的相關(guān)鏈接,進(jìn)入鏈接,可得到所選膀胱癌相關(guān)性最高的top10基因,以及所述系統(tǒng)所有癌癥數(shù)據(jù)中與這些基因相關(guān)的突變、捐贈者等統(tǒng)計信息,所述客戶端還可以顯示出所述相關(guān)性最高的top10基因的連接,可以直接獲得到該基因的具體信息,可以包括:相關(guān)名稱、位置、轉(zhuǎn)錄本、序列,以及其他各大數(shù)據(jù)庫的外鏈入口等。
所述系統(tǒng)不僅可以通過疾病名稱實(shí)現(xiàn)關(guān)聯(lián)基因信息查詢與統(tǒng)計,還可以通過基因名進(jìn)行基因詳情、關(guān)聯(lián)疾病搜索;可以通過捐贈者id查詢捐贈者關(guān)聯(lián)疾病、樣本處理、突變等信息。
以上,為本發(fā)明提供的一種生命健康數(shù)據(jù)管理方法及系統(tǒng)的實(shí)施例說明。
在本說明書的描述中,參考術(shù)語“一個實(shí)施例”、“一些實(shí)施例”、“示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不是必須針對的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個或多個實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。