本發(fā)明屬于生物學(xué)研究中細(xì)胞系鑒定的領(lǐng)域,具體的,本發(fā)明涉及構(gòu)建細(xì)胞系21位點STR特征數(shù)的數(shù)據(jù)庫的方法、21位點STR數(shù)據(jù)的數(shù)據(jù)庫在細(xì)胞系鑒定中的用途、細(xì)胞系來源鑒定的方法及系統(tǒng)。
技術(shù)背景
近年來,對于細(xì)胞的研究成果斐然,有關(guān)細(xì)胞周期、細(xì)胞凋亡等研究成果也都獲得了諾貝爾獎,而隨著細(xì)胞應(yīng)用的廣泛,帶來的問題也逐漸顯現(xiàn),細(xì)胞交叉污染、身份錯誤識別等問題十分嚴(yán)重,這對于生物學(xué)科研、臨床醫(yī)學(xué)研究、藥物開發(fā)、疫苗生產(chǎn)等方面造成了重大的影響并且產(chǎn)生了巨大的經(jīng)濟損失。因此,排查細(xì)胞污染、鑒定細(xì)胞系身份,盡可能地減少錯誤細(xì)胞使用頻率,對于提高科研效率、減少時間和經(jīng)濟的損失、具有重大意義。
人源細(xì)胞作為一種重要的生物資源,已廣泛地應(yīng)用于生命科學(xué)、臨床醫(yī)學(xué)基礎(chǔ)性研究及產(chǎn)品開發(fā)。但是,由于不規(guī)范操作等原因,人源細(xì)胞系的交叉污染現(xiàn)象日趨嚴(yán)重。細(xì)胞的錯誤鑒定或交叉污染可能引起很多不良后果,如得出錯誤的檢測數(shù)據(jù)、違反自然規(guī)律的研究結(jié)論、毫無價值的產(chǎn)品、甚至導(dǎo)致多年的研究成果付諸東流。從細(xì)胞培養(yǎng)技術(shù)誕生之日起,特別是多種細(xì)胞系同時持續(xù)培養(yǎng),細(xì)胞交叉污染就更加難免。
STR(短串聯(lián)重復(fù)序列)基因位點由長度為3~7個堿基對的短串聯(lián)重復(fù)序列組成,這些重復(fù)序列廣泛存在于人類基因組中,可作為高度多態(tài)性標(biāo)記,被稱為細(xì)胞的DNA指紋,其可通過一定的計算方法,即可根據(jù)所得的STR分型結(jié)果與專業(yè)的細(xì)胞STR數(shù)據(jù)庫比對從而推算出樣品所屬的細(xì)胞系或可能的交叉污染的細(xì)胞系名稱。目前ATCC和DSMZ都采用了D5S818、D13S317、D7S820、D16S539、VWA、TH01、AMEL(性別位點)、TPOX、CSF1PO九個STR位點進(jìn)行對比分析鑒定細(xì)胞系。
技術(shù)實現(xiàn)要素:
本發(fā)明的上述技術(shù)問題主要是通過下述技術(shù)方案得以解決的:
一種用于細(xì)胞系鑒定的21位點STR數(shù)據(jù)庫的建立方法,其特征在于,21個STR位點包括ATCC與DSMZ中的9個位點,以及D19S433、D21S11、D18S51、D6S1043、D3S1358、Penta D、D2S441、D8S1179、Penta E、D12S391、D2S1338、FGA的12個位點,具體包括:
步驟1,通過檢測得到若干個細(xì)胞系的21個位點數(shù)據(jù);若干個是指有100多株數(shù)據(jù),可以不斷增加
步驟2,建立數(shù)據(jù)表,以獲得所述21位點STR數(shù)據(jù)庫,所述數(shù)據(jù)表包含21組STR位點數(shù)據(jù)記錄,一組記錄對應(yīng)一個STR位點,每組記錄包含至少兩條STR位點記錄;所述數(shù)據(jù)表包含多個字段,所述字段包含:
字段一:STR位點名稱,
字段二:STR位點特征數(shù)
字段三:是/否能為空。
在上述的一種用于細(xì)胞系鑒定的21位點STR數(shù)據(jù)庫的建立方法,其特征在于,所述步驟2中,每組記錄中,AMEL性別位點包含兩條記錄,其他位點均包含三條記錄。其中AMEL性別位點,就是X染色體和Y染色體,兩條記錄就是X,X;或者X,Y;不可能會有三條記錄的情況出現(xiàn)。
采用21位點STR數(shù)據(jù)庫的細(xì)胞鑒定的方法,其特征在于,根據(jù)21位點STR數(shù)據(jù)庫中計算與已知細(xì)胞系的STR特征數(shù)的匹配率,以實現(xiàn)所述鑒定,具體計算包括:
計算方式一:STR數(shù)據(jù)庫匹配率(%)=送檢樣品細(xì)胞與數(shù)據(jù)庫比對細(xì)胞等位基因中相同等位基因的總數(shù)目/(樣品細(xì)胞等位基因總數(shù)目+數(shù)據(jù)庫比對細(xì)胞等位基因總數(shù)目)*100%
計算方式二:ATCC數(shù)據(jù)庫匹配率(%)=(送檢樣品細(xì)胞與數(shù)據(jù)庫比對細(xì)胞共有等位基因數(shù)目/數(shù)據(jù)庫比對細(xì)胞等位基因總數(shù)目)*100%
計算方式三:DSMZ數(shù)據(jù)庫匹配率(%)=送檢樣品細(xì)胞與數(shù)據(jù)庫比對細(xì)胞共有等位基因數(shù)目*2/(送檢樣品細(xì)胞等位基因總數(shù)目+數(shù)據(jù)庫比對細(xì)胞等位基因總數(shù)目)*100%。
在上述的采用21位點STR數(shù)據(jù)庫的細(xì)胞鑒定的方法,21位點STR數(shù)據(jù)庫計算方法中純合等位基因只記一個;ATCC數(shù)據(jù)庫計算方法中純合等位基因只記一個;DSMZ數(shù)據(jù)庫計算方法中純合等位基因記兩個。
在上述的采用21位點STR數(shù)據(jù)庫的細(xì)胞鑒定的方法,根據(jù)計算方式一、二、三中任意一種方法計算待測細(xì)胞中至少9個至多21個STR位點的匹配率。
一種采用細(xì)胞鑒定的方法計算兩個細(xì)胞系間的STR匹配率,其特征在于,定義兩個細(xì)胞系,分別是細(xì)胞系A(chǔ)和細(xì)胞系B,計算細(xì)胞系A(chǔ)和細(xì)胞系B間的STR匹配率采用計算方式一、二、三中任意一種方法計算兩個細(xì)胞系間的STR匹配率;具體包括:
計算方式一:STR數(shù)據(jù)庫匹配率(%)=A細(xì)胞與B細(xì)胞等位基因中相同等位基因的總數(shù)目/(A細(xì)胞等位基因總數(shù)目+B細(xì)胞等位基因總數(shù)目)*100%
計算方式二:ATCC數(shù)據(jù)庫匹配率(%)=(A細(xì)胞與B細(xì)胞共有等位基因數(shù)目/B細(xì)胞等位基因總數(shù)目)*100%
計算方式三:DSMZ數(shù)據(jù)庫匹配率(%)=A細(xì)胞與B細(xì)胞共有等位基因數(shù)目*2/(A細(xì)胞等位基因總數(shù)目+B細(xì)胞等位基因總數(shù)目)*100%。
一種細(xì)胞鑒定的系統(tǒng),其特征在于,包括:
輸入裝置,用以輸入所測細(xì)胞的STR特征數(shù);
輸出裝置,用以輸出所測細(xì)胞的細(xì)胞系匹配率;
21位點STR數(shù)據(jù)庫存儲裝置:與輸入裝置和輸出裝置相連,用以根據(jù)數(shù)據(jù)庫中細(xì)胞系數(shù)據(jù)和計算方式一、二、三匹配率計算方法進(jìn)行匹配率的計算。
因此,本發(fā)明具有如下優(yōu)點:1、本發(fā)明數(shù)據(jù)庫可以根據(jù)不同的需要選擇不同的算法來鑒定細(xì)胞,也可以三種計算方法均使用來鑒定同一細(xì)胞系來增強鑒定結(jié)果的準(zhǔn)確性。此外,本發(fā)明還提供了一種計算兩株未知細(xì)胞親緣性的方法,即可輸入兩株細(xì)胞的STR特征數(shù),任選以上三種算法之一,便可得到這兩株細(xì)胞STR的匹配率,從而預(yù)測兩株細(xì)胞間的親緣關(guān)系。2、在使用三種計算方法計算匹配率時,可以根據(jù)待測細(xì)胞任選的,至少9個至多21個STR位點的來計算其與數(shù)據(jù)庫中已知細(xì)胞系間的匹配率,從而來鑒定其細(xì)胞系種類。同時,兩株未知細(xì)胞的親緣鑒定也可任選至少9個至多21個STR位點的來計算兩者之間的匹配率。3、本發(fā)明的系統(tǒng)能夠用于實施上述本發(fā)明的細(xì)胞鑒定方法的全部或部分步驟,該系統(tǒng)包括:輸入裝置,用以輸入所測細(xì)胞的STR特征數(shù);輸出裝置,用以輸出所測細(xì)胞的細(xì)胞系匹配率;以及上述本發(fā)明提供的21位點STR數(shù)據(jù)庫,與所述輸入裝置和輸出裝置相連,用以依據(jù)每個細(xì)胞系的STR特征數(shù)與所測細(xì)胞相應(yīng)的STR位點的特征數(shù)進(jìn)行以上所述算法的匹配率計算,實現(xiàn)所述的細(xì)胞鑒定。
附圖說明
圖1為本發(fā)明的數(shù)據(jù)庫系統(tǒng)的總體框架示意圖。
圖2為本發(fā)明數(shù)據(jù)庫系統(tǒng)兩未知細(xì)胞系間親緣鑒定方法的示意圖。
圖3為本發(fā)明數(shù)據(jù)庫中存儲一個細(xì)胞系STR數(shù)據(jù)的數(shù)據(jù)表的具體結(jié)構(gòu)。
圖4為本發(fā)明實例1中輸入ATCC與DSMZ所使用9個STR位點的示意圖。
圖5為本發(fā)明實例1中輸入16個STR位點的示意圖;。
圖6為本發(fā)明實例1中輸入全部21個STR位點的示意圖。
圖7為本發(fā)明實例1中輸入9個STR位點使用CCTCC算法,細(xì)胞Hep-2的匹配結(jié)果。
圖8為本發(fā)明實例1中輸入16個STR位點使用ATCC算法,細(xì)胞Hep-2的匹配結(jié)果。
圖9為本發(fā)明實例1中輸入21個STR位點使用DSMZ算法,細(xì)胞Hep-2的匹配結(jié)果。
圖10為本發(fā)明實例2中輸入9個STR位點使用CCTCC算法,細(xì)胞A549的匹配結(jié)果。
圖11為本發(fā)明實例2中輸入16個STR位點使用ATCC算法,細(xì)胞A549的匹配結(jié)果。
圖12為本發(fā)明實例3中輸入21個STR位點使用CCTCC算法,計算細(xì)胞Hep-2與細(xì)胞A549的匹配率結(jié)果。
圖13為本發(fā)明實例3中輸入21個STR位點使用ATCC算法,計算細(xì)胞Hep-2與細(xì)胞A549的匹配率結(jié)果。
圖14為本發(fā)明實例3中輸入21個STR位點使用DSMZ算法,計算細(xì)胞Hep-2與細(xì)胞A549的匹配率結(jié)果。
具體實施方式
下面結(jié)合具體的實施例對本發(fā)明做進(jìn)一步的詳細(xì)說明,所述是對本發(fā)明的解釋而非限定。
本發(fā)明的目的在于構(gòu)建一個在生物學(xué)研究中廣泛使用的細(xì)胞系的21位點STR特征數(shù)據(jù)庫,用以對未知的細(xì)胞進(jìn)行身份鑒定,采用了21個STR位點(除ATCC與DSMZ中現(xiàn)有的9個位點外,還增加了12個位點D19S433、D21S11、D18S51、D6S1043、D3S1358、Penta D、D2S441、D8S1179、Penta E、D12S391、D2S1338、FGA),與ATCC、DSMZ的9位點結(jié)果相比,其涵括信息更全面,鑒定結(jié)果更準(zhǔn)確詳細(xì)。
一,首先介紹一下本發(fā)明的方法原理。
本發(fā)明提供了一種構(gòu)建細(xì)胞系21位點STR數(shù)據(jù)庫的方法,該方法包括以下步驟:通過檢測得到多個細(xì)胞系的21個位點數(shù)據(jù);建立數(shù)據(jù)表,以獲得所述21位點STR數(shù)據(jù)庫,所述數(shù)據(jù)表包含21組STR位點數(shù)據(jù)記錄,一組記錄對應(yīng)一個STR位點,每組記錄包含三條STR位點記錄(AMEL性別位點僅有兩條記錄)。所述數(shù)據(jù)表包含多個字段,所述字段包含:STR位點名稱,STR位點特征數(shù)和是/否能為空。利用該方法構(gòu)建21位點STR數(shù)據(jù)庫時,限制了所測得的細(xì)胞系的一個STR位點特征數(shù)的數(shù)目,即一般情況下一個STR位點有2個特征數(shù),有些細(xì)胞系一個STR位點有3個特征數(shù),從而保證了數(shù)據(jù)庫的包容性和精確度。當(dāng)所測細(xì)胞系的某一STR位點僅出現(xiàn)一個值時,我們可以認(rèn)為該STR在兩個等位基因中出現(xiàn)的次數(shù)是一樣的,因此我們將該STR特征數(shù)記錄兩遍,分別填入STR_1和STR_2,而STR_3留空。
本發(fā)明提供一種細(xì)胞系21位點STR特征數(shù)數(shù)據(jù)庫,其依據(jù)上述構(gòu)建細(xì)胞系21位點STR數(shù)據(jù)庫的方法構(gòu)建所得。該數(shù)據(jù)庫中一個細(xì)胞系對應(yīng)著一個數(shù)據(jù)表,數(shù)據(jù)表中記錄著此細(xì)胞系21個STR位點的所有特征數(shù),而且每個細(xì)胞系的特征數(shù)都是具有特異性的,不同細(xì)胞系間STR的特征數(shù)是不同的。若是兩個細(xì)胞的STR特征數(shù)完全相同,那么這兩個細(xì)胞必定屬于同一細(xì)胞系。因此,每個數(shù)據(jù)表中STR的數(shù)據(jù)必定是不同的。本發(fā)明的21位點STR數(shù)據(jù)庫中就存儲著多種不同細(xì)胞系的21位點STR的全部特征數(shù)。
在21位點STR數(shù)據(jù)庫的基礎(chǔ)上,本發(fā)明提供了三種鑒定未知細(xì)胞的方法:
本發(fā)明數(shù)據(jù)庫提供的CCTCC匹配率計算公式::STR數(shù)據(jù)庫匹配率(%)=送檢樣品細(xì)胞與數(shù)據(jù)庫比對細(xì)胞等位基因中相同等位基因的總數(shù)目/(樣品細(xì)胞等位基因總數(shù)目+數(shù)據(jù)庫比對細(xì)胞等位基因總數(shù)目)*100%;
ATCC數(shù)據(jù)庫匹配率計算公式:ATCC數(shù)據(jù)庫匹配率(%)=(送檢樣品細(xì)胞與數(shù)據(jù)庫比對細(xì)胞共有等位基因數(shù)目/數(shù)據(jù)庫比對細(xì)胞等位基因總數(shù)目)*100%;
DSMZ數(shù)據(jù)庫匹配率計算公式:DSMZ數(shù)據(jù)庫匹配率(%)=送檢樣品細(xì)胞與數(shù)據(jù)庫比對細(xì)胞共有等位基因數(shù)目*2/(送檢樣品細(xì)胞等位基因總數(shù)目+數(shù)據(jù)庫比對細(xì)胞等位基因總數(shù)目)*100%。
本發(fā)明中計算方法提供的CCTCC計算方法與DSMZ數(shù)據(jù)庫計算方法的區(qū)別在于,CCTCC計算方法和ATCC數(shù)據(jù)庫計算方法中所測細(xì)胞純合等位基因只記一個,而DSMZ數(shù)據(jù)庫計算方法中所測細(xì)胞純合等位基因記兩個。
本發(fā)明數(shù)據(jù)庫可以根據(jù)不同的需要選擇不同的算法來鑒定細(xì)胞,也可以三種計算方法均使用來鑒定同一細(xì)胞系來增強鑒定結(jié)果的準(zhǔn)確性。此外,本發(fā)明還提供了一種計算兩株未知細(xì)胞親緣性的方法,即可輸入兩株細(xì)胞的STR特征數(shù),任選以上三種算法之一,便可得到這兩株細(xì)胞STR的匹配率,從而預(yù)測兩株細(xì)胞間的親緣關(guān)系。
本發(fā)明數(shù)據(jù)庫的另一優(yōu)點在于,在使用上述三種計算方法計算匹配率時,可以根據(jù)待測細(xì)胞任選的,至少9個至多21個STR位點的來計算其與數(shù)據(jù)庫中已知細(xì)胞系間的匹配率,從而來鑒定其細(xì)胞系種類。同時,兩株未知細(xì)胞的親緣鑒定也可任選至少9個至多21個STR位點的來計算兩者之間的匹配率。
本發(fā)明提供一種對細(xì)胞進(jìn)行鑒定的系統(tǒng),其能夠用于實施上述本發(fā)明的細(xì)胞鑒定方法的全部或部分步驟,該系統(tǒng)包括:輸入裝置,用以輸入所測細(xì)胞的STR特征數(shù);輸出裝置,用以輸出所測細(xì)胞的細(xì)胞系匹配率;以及上述本發(fā)明提供的21位點STR數(shù)據(jù)庫,與所述輸入裝置和輸出裝置相連,用以依據(jù)每個細(xì)胞系的STR特征數(shù)與所測細(xì)胞相應(yīng)的STR位點的特征數(shù)進(jìn)行以上所述算法的匹配率計算,實現(xiàn)所述的細(xì)胞鑒定。
二、本發(fā)明所使用的判定標(biāo)準(zhǔn)為ATCC數(shù)據(jù)庫判定標(biāo)準(zhǔn):當(dāng)待檢細(xì)胞STR圖譜出現(xiàn)3個以上位點同時有≥3峰出現(xiàn),判定該待檢細(xì)胞是至少有2株細(xì)胞混合,峰越多,說明混合細(xì)胞種類越多;將待檢細(xì)胞9位點等位基因與數(shù)據(jù)庫細(xì)胞比對,當(dāng)匹配率≥80%時,認(rèn)為這2株細(xì)胞同一來源;當(dāng)匹配率在56%-80%之間,該待檢細(xì)胞需進(jìn)一步驗證其來源,無法準(zhǔn)確判斷;當(dāng)匹配率<55%,認(rèn)定這2株細(xì)胞沒有關(guān)系。
實施例1
細(xì)胞Hep-2的鑒定
根據(jù)檢測該細(xì)胞的21個STR位點的值如表1:
表1細(xì)胞Hep-2的STR位點和Amelogenin位點的基因分型結(jié)果
將ATCC與DSMZ所使用的D5S818、D13S317、D7S820、D16S539、VWA、TH01、AMEL(性別位點)、TPOX、CSF1PO九個STR位點的特征值如圖4輸入到相對應(yīng)的STR位點后,任選上述三種計算算法其一,選擇CCTCC算法,匹配結(jié)果如圖7。從表1中,可以看出該細(xì)胞不存在有位點有≥3個值出現(xiàn),可以認(rèn)為該細(xì)胞中只有一株細(xì)胞,沒有混合其他種類的細(xì)胞;而且與HeLa的STR數(shù)據(jù)100%匹配,因此可以認(rèn)為該細(xì)胞為HeLa細(xì)胞。
使用ATCC算法檢測其結(jié)果如圖8,該細(xì)胞與HeLa的1,3,7,10,P3型細(xì)胞有著100%的匹配率,還與其他數(shù)種HeLa亞型細(xì)胞有著80%以上的匹配率。因此,該細(xì)胞是HeLa細(xì)胞的可能性比較大。
使用DMSZ算法檢測其結(jié)果如圖9中,該細(xì)胞與數(shù)種HeLa細(xì)胞的匹配率都高于100%,隨后與MG-63-1細(xì)胞的匹配率僅有58%。因此,可以得到該細(xì)胞是HeLa細(xì)胞。
綜合上述三種方法的結(jié)果來看,該細(xì)胞是HeLa細(xì)胞而不是送檢所稱的Hep-2細(xì)胞,從此實施例的檢測結(jié)果可以看出本發(fā)明的實用性與準(zhǔn)確性。
實施例2
細(xì)胞A549的鑒定
根據(jù)檢測該細(xì)胞的21個STR位點的值如表2:
表2細(xì)胞A549的STR位點和Amelogenin位點的基因分型結(jié)果
如實例1中進(jìn)行輸入與匹配查找,可獲得匹配結(jié)果,如圖10(CCTCC算法),圖11(ATCC算法)。從表2中可以看出該細(xì)胞不存在有位點有≥3個值出現(xiàn),因此該細(xì)胞中不存在交叉污染;而且與A549-1、A549-2細(xì)胞有著94%的匹配率,因此可以認(rèn)為該細(xì)胞為A549細(xì)胞,且沒有被污染。
從圖11中,該細(xì)胞與A549-2細(xì)胞有著92%的匹配率,而與A549-1細(xì)胞的匹配率要略低,為86%。因此,該細(xì)胞是A549-2細(xì)胞的可能性最大,且沒有被污染。
綜合上述兩種方法的結(jié)果來看,該細(xì)胞是A549細(xì)胞,且沒有交叉污染。
實施例3
細(xì)胞Hep-2與細(xì)胞A549細(xì)胞系間的STR比對
首先,由上述驗證可以得知細(xì)胞Hep-2與細(xì)胞A549均為純細(xì)胞系,沒有被其他細(xì)胞污染。在對兩株細(xì)胞以三種不同的算法進(jìn)行比對后,其比對方式如圖12、13、14,可以得出兩株細(xì)胞STR的匹配率分別為:CCTCC算法為29%,ATCC算法為34%,DMSZ算法為38%。三種算法計算得出的兩株細(xì)胞21位點STR匹配率均低于55%,所以可以判定這兩株細(xì)胞屬于不同的細(xì)胞系,而且存在比較大的差別。
本文中所描述的具體實施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。