本發(fā)明涉及基因數(shù)據(jù)庫管理,具體為一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng)。
背景技術:
1、基因數(shù)據(jù)庫的建立,在醫(yī)學、科學研究上有著非常重要的作用,針對基因檢測數(shù)據(jù)的管理,通常是由病人主動或者被動情況下進行基因檢測后,對病人的基因檢測數(shù)據(jù)進行集中的存儲,建立集中的管理數(shù)據(jù)庫。
2、根據(jù)公開專利202410249228.8可知,一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),包括數(shù)據(jù)庫模塊、管理模塊、申請模塊和傳輸模塊;數(shù)據(jù)庫模塊用于存儲基因檢測數(shù)據(jù),其中基因檢測數(shù)據(jù)包括基因序列數(shù)據(jù)和基因特征信息;管理模塊用于根據(jù)基因特征信息對數(shù)據(jù)庫模塊種的基因檢測數(shù)據(jù)進行歸類管理;申請模塊用于接收機構終端發(fā)出的基因檢測數(shù)據(jù)申請信息進行審批驗證,得到審批驗證結果;其中基因檢測數(shù)據(jù)申請信息包括所需基因數(shù)據(jù)的特征信息和申請表信息;傳輸模塊用于根據(jù)審批驗證結果,從數(shù)據(jù)庫模塊中提取相應的基因檢測數(shù)據(jù)并進行隱私處理,將隱私處理后的基因檢測數(shù)據(jù)傳輸?shù)街付ǖ臋C構終端,在實現(xiàn)發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術中至少存在以下問題沒有得到解決,使用過程中,傳統(tǒng)的基因檢測數(shù)據(jù)庫管理不能夠高效、準確地處理和分析基因數(shù)據(jù),從而不能為精準醫(yī)療和個性化健康管理提供有力支持。為此,需要設計新的技術方案給予解決。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提供一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),以解決當前基因檢測數(shù)據(jù)庫管理不能夠高效、準確地處理和分析基因數(shù)據(jù),從而不能為精準醫(yī)療和個性化健康管理提供有力支持的技術問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),包括基因組數(shù)據(jù)儲存單元、基因信息數(shù)據(jù)管理單元、基因檢測分析單元和基因庫大數(shù)據(jù)系統(tǒng);
3、基因組數(shù)據(jù)儲存單元:用于保存和處理基因組圖譜數(shù)據(jù);
4、基因信息數(shù)據(jù)管理單元:用于對生物體的基因信息進行收集、存儲、維護、分析和共享;
5、基因檢測分析單元:用于預防醫(yī)學、公共衛(wèi)生、信息科學、系統(tǒng)科學、臨床醫(yī)學的基因檢測和分析;
6、基因庫大數(shù)據(jù)系統(tǒng):用于數(shù)據(jù)歸檔、計算分析、知識搜索、管理授權和可視化服務。
7、作為本發(fā)明的一種優(yōu)選實施方式,所述保存和處理基因組圖譜數(shù)據(jù)主要包括數(shù)據(jù)收集模塊、數(shù)據(jù)處理模塊、數(shù)據(jù)存儲模塊和數(shù)據(jù)質(zhì)量控制模塊。
8、作為本發(fā)明的一種優(yōu)選實施方式,所述數(shù)據(jù)收集模塊和數(shù)據(jù)處理模塊的收集處理步驟包括:首先對商業(yè)化試劑盒進行文庫構建,通過agilent2100和qpcr分別進行文庫大小和濃度檢測;
9、再對于質(zhì)譜和色譜分析,通過核酸酶和磷酸酶將樣品dna酶解為單核苷,經(jīng)超濾除去酶解步驟加入的工具酶;
10、然后通過高效液相色譜串聯(lián)三重四級桿質(zhì)譜(hplc-ms)對酶解得到的單核苷進行定性和定量分析。
11、作為本發(fā)明的一種優(yōu)選實施方式,所述數(shù)據(jù)存儲模塊是對基因組數(shù)據(jù)保存,形成基因數(shù)據(jù)庫,供所有人隨時查詢個人基因信息或進行基因配型;
12、保存方法包括液氮保存法、電制冷保存、dna納米分子包覆后置于-80℃保存、采用特殊介質(zhì)常溫儲存等,具體保存期限取決于使用的方法。
13、作為本發(fā)明的一種優(yōu)選實施方式,所述數(shù)據(jù)質(zhì)量控制模塊用于測序數(shù)據(jù)質(zhì)量,并通過q30質(zhì)量控制來確定是否滿足分析要求;對于質(zhì)譜和色譜分析,通過對各種分析物色譜圖的峰面積進行積分,建立標準曲線,以確定目標分析物的摩爾濃度。
14、作為本發(fā)明的一種優(yōu)選實施方式,所述對生物體的基因信息進行收集、存儲、維護、分析和共享;
15、基因信息收集和存儲是使用高通量測序技術產(chǎn)生的海量基因數(shù)據(jù),并且對數(shù)據(jù)分類、命名、存儲、備份和檢索;
16、基因信息分析包括基因組學、轉錄組學和蛋白質(zhì)組學,基因信息分析的主要技術包括數(shù)據(jù)庫管理、數(shù)據(jù)挖掘、統(tǒng)計分析和機器學習。
17、作為本發(fā)明的一種優(yōu)選實施方式,所述基因庫大數(shù)據(jù)系統(tǒng)的基因數(shù)據(jù)計算分析包括基因表達量的衡量、測序數(shù)據(jù)的大小估算以及測序深度。
18、作為本發(fā)明的一種優(yōu)選實施方式,所述基因表達量的衡量計算公式如下:rpkm:用于衡量基因表達量的一個指標,計算公式為rpkm=109×c/nl,其中c是比對到該基因的reads數(shù),n是比對到參考基因組的總reads數(shù),l是基因長度。
19、作為本發(fā)明的一種優(yōu)選實施方式,所述測序數(shù)據(jù)的大小估算:測序數(shù)據(jù)的大小通過公式數(shù)據(jù)量≈基因組大小×測序深度。
20、作為本發(fā)明的一種優(yōu)選實施方式,所述測序深度包括覆蓋比率和覆蓋深度,覆蓋比率是指被測序到的堿基占全基因組大小的比率,覆蓋深度則指每個堿基被測序的平均次數(shù)。
21、與現(xiàn)有技術相比,本發(fā)明的有益效果如下:
22、本發(fā)明通過整合先進的數(shù)據(jù)存儲技術、高效的數(shù)據(jù)分析算法、自動化的報告管理流程以及嚴格的數(shù)據(jù)安全措施,從而實現(xiàn)對數(shù)據(jù)的智能分析和預測,提高實驗結果的準確性和可靠性,并且能夠高效、準確地處理和分析基因數(shù)據(jù),為精準醫(yī)療和個性化健康管理提供有力支持。
1.一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:包括基因組數(shù)據(jù)儲存單元、基因信息數(shù)據(jù)管理單元、基因檢測分析單元和基因庫大數(shù)據(jù)系統(tǒng);
2.根據(jù)權利要求1所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述保存和處理基因組圖譜數(shù)據(jù)主要包括數(shù)據(jù)收集模塊、數(shù)據(jù)處理模塊、數(shù)據(jù)存儲模塊和數(shù)據(jù)質(zhì)量控制模塊。
3.根據(jù)權利要求2所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述數(shù)據(jù)收集模塊和數(shù)據(jù)處理模塊的收集處理步驟包括:首先對商業(yè)化試劑盒進行文庫構建,通過agilent2100和qpcr分別進行文庫大小和濃度檢測;
4.根據(jù)權利要求2所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述數(shù)據(jù)存儲模塊是對基因組數(shù)據(jù)保存,形成基因數(shù)據(jù)庫,供所有人隨時查詢個人基因信息或進行基因配型;
5.根據(jù)權利要求2所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述數(shù)據(jù)質(zhì)量控制模塊用于測序數(shù)據(jù)質(zhì)量,并通過q30質(zhì)量控制來確定是否滿足分析要求;對于質(zhì)譜和色譜分析,通過對各種分析物色譜圖的峰面積進行積分,建立標準曲線,以確定目標分析物的摩爾濃度。
6.根據(jù)權利要求1所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述對生物體的基因信息進行收集、存儲、維護、分析和共享;
7.根據(jù)權利要求1所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述基因庫大數(shù)據(jù)系統(tǒng)的基因數(shù)據(jù)計算分析包括基因表達量的衡量、測序數(shù)據(jù)的大小估算以及測序深度。
8.根據(jù)權利要求7所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述基因表達量的衡量計算公式如下:rpkm:用于衡量基因表達量的一個指標,計算公式為rpkm=109×c/nl,其中c是比對到該基因的reads數(shù),n是比對到參考基因組的總reads數(shù),l是基因長度。
9.根據(jù)權利要求7所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述測序數(shù)據(jù)的大小估算:測序數(shù)據(jù)的大小通過公式數(shù)據(jù)量≈基因組大小×測序深度。
10.根據(jù)權利要求7所述的一種智能化基因檢測數(shù)據(jù)庫管理系統(tǒng),其特征在于:所述測序深度包括覆蓋比率和覆蓋深度,覆蓋比率是指被測序到的堿基占全基因組大小的比率,覆蓋深度則指每個堿基被測序的平均次數(shù)。