細胞識別裝置以及程序的制作方法
【專利摘要】在基于對被檢細胞進行質量分析而得到的結果來識別該被檢細胞的種類的裝置中,設為以下結構:設置上位DB(21)和下位DB(22),其中,該上位DB(21)收錄了記載有已知細胞的構成成分的離子質量的質量列表,該下位DB(22)收錄了僅記載有上述離子質量中的各菌株特有的質量的部分質量列表,首先,使用根據被檢細胞的質量分析結果制作出的被檢質量列表來檢索上位DB(21),在基于該檢索確定了在之后的檢索中作為對象的生物種后,從上述被檢細胞的質量列表刪除上述生物種共有的質量,使用刪除后的質量列表對下位DB(22)進行檢索。由此,能夠從遺傳上親緣相近的多個已知細胞中高精度地提取更加接近被檢細胞的細胞。
【專利說明】細胞識別裝置以及程序
【技術領域】
[0001]本發(fā)明涉及一種用于基于對源自細胞的成分進行質量分析而得到的結果來識別該細胞的種類的裝置以及程序。
【背景技術】
[0002]以往,作為識別細胞的種類的方法之一,已知一種基于DNA堿基序列的相同性解析,該方法被廣泛應用于微生物的分類和鑒定等(例如,參照專利文獻I)。在該方法中,首先,從被檢細胞提取DNA并確定rRNA基因等在整個生物中以高保存性存在的區(qū)域的DNA堿基序列。接著,使用該DNA堿基序列來檢索收錄有多個已知細胞的DNA堿基序列數據的數據庫,選出表示與上述被檢細胞的DNA堿基序列相似性高的堿基序列。然后,將該堿基序列所源自的生物種判斷為與上述被檢細胞是同一菌種或者親緣相近菌種。
[0003]然而,在利用了這種DNA堿基序列的方法中,存在以下問題:從被檢細胞提取DNA、確定DNA堿基序列等需要比較長的時間,因此難以迅速地進行細胞識別。
[0004]因此,近年來正在使用一種基于對被檢細胞進行質量分析而得到的質譜圖來進行細胞識別的方法(例如,參照專利文獻2)。在該方法中,首先,通過使用了 MALD1-MS (基質輔助激光解吸電離質量分析)等溫和的離子化法的質量分析裝置對包含從被檢細胞提取出的蛋白質的溶液、被檢細胞的懸浮液等進 行分析。然后,將得到的質譜圖與數據庫中收錄的已知細胞的質譜圖進行對照,由此進行被檢細胞的鑒定。在質量分析中,能夠使用極為微量的細胞樣品短時間內獲得分析結果,并且也易于進行多個檢體的連續(xù)分析。因此,根據這種使用了質量分析的細胞識別方法,能夠簡便且迅速地進行細胞識別。
[0005]專利文獻1:日本特開2006-191922號公報
[0006]專利文獻2:日本特開2007-316063號公報
【發(fā)明內容】
[0007] 發(fā)明要解決的問題
[0008]在上述利用了質量分析的細胞識別方法中,一般著眼于核糖體蛋白質群的質量信息來進行細胞的識別。然而,核糖體蛋白質群的氨基酸序列的保存性高,因此在屬于同一生物種的細胞之間,質譜上出現的峰值大部分為同一質量。因此,在這種利用了質量分析的細胞識別方法中,即使能夠識別細胞的菌種(species)級的差異,有時也難以識別作為其下位的分類的菌株(strain)級的差異。
[0009]本發(fā)明是為了解決上述問題而完成的,其目的在于提供一種能夠高精度且迅速地進行菌株級的細胞識別的細胞識別裝置。
[0010]用于解決問題的方案
[0011]為了解決上述問題而完成的本發(fā)明的第一方式所涉及的細胞識別裝置具有存儲裝置和運算裝置,基于對被檢細胞進行質量分析而得到的結果來識別該被檢細胞的種類,
[0012]上述存儲裝置存儲有第一數據庫和第二數據庫,其中,該第一數據庫針對多個已知細胞收錄了記載有已知細胞的構成成分的離子質量或者分子量的質量列表,該第二數據庫針對多個已知細胞收錄了部分質量列表,該部分質量列表中記載有已知細胞的構成成分的離子質量或者分子量中的、除該已知細胞所屬的預定等級的分類群共有的離子質量或者分子量以外的尚子質量或者分子量,
[0013]上述運算裝置具備:
[0014]a)第一檢索單元,其使用基于上述質量分析的結果制作出的記載有上述被檢細胞的構成成分的離子質量或者分子量的被檢質量列表,來檢索上述第一數據庫;
[0015]b)分類群確定單元,其基于由上述第一檢索單元得到的檢索結果,將位于上述等級的分類群中的某一個確定為在之后的檢索中作為對象的分類群;
[0016]c)被檢部分質量列表制作單元,其制作從上述被檢質量列表刪除由上述分類群確定單元確定的分類群共有的離子質量或者分子量所得的被檢部分質量列表;以及
[0017]d)第二檢索單元,其使用由上述被檢部分質量列表制作單元制作出的被檢部分質量列表來檢索上述第二數據庫。
[0018]此外,上述分類群確定單元例如既可以將由第一檢索單元得到的檢索結果、與被檢質量列表一致度高的分類群自動確定為在之后的檢索中作為對象的分類群,或者也可以使由第一檢索單元得到的檢索結果顯示于監(jiān)視器等顯示裝置,并且接受來自用戶的分類群的指定,基于上述檢索結果將用戶用鍵盤等輸入裝置指定的分類群確定為在之后的檢索中作為對象的分類群。
[0019]使用圖6、7來說明由本申請發(fā)明所涉及的細胞識別裝置進行的細胞識別的原理。本發(fā)明的細胞識別裝置具備第一數據庫(第一DB)和第二數據庫(第二DB),例如分別登記有如圖6所示的與多個已知細胞有關的質量列表和如圖7所示的與多個已知細胞有關的部分質量列表。在此,所謂質量 列表,是記載有某個細胞的構成成分的離子質量或者分子量的列表,例如,能夠通過對某個細胞進行質量分析并將得到的質譜上的各峰值的質量(嚴格地說是m/z)列表化來進行制作。另一方面,所謂部分質量列表,記載有某個細胞的構成成分的離子質量或者分子量中的、除該細胞所屬的規(guī)定的分類等級(生物分類的層級)的分類群共有的離子質量或者分子量以外的離子質量或者分子量,例如能夠通過從針對某個細胞制作出的上述質量列表刪除在該細胞所屬的菌種中共同包含的離子質量或者分子量來進行制作。此外,在圖6、7中,將各質量列表和部分質量列表設為包含質譜上出現的峰值的質量和高度的信息,但本發(fā)明的質量列表中未必包含峰值的高度(即,各構成成分的存在量比)的信息。
[0020]在本發(fā)明的細胞識別裝置中,首先,使用根據對被檢細胞進行質量分析而得到的結果制作出的質量列表(被檢質量列表)來檢索第一數據庫。此時,如圖6所示,在上述被檢質量列表和第一數據庫中的各質量列表中,均列舉出多個質量,但在遺傳上親緣相近的細胞(例如,屬于同一菌種的生物的細胞)之間,其大部分一致。例如,在圖6的例子的情況下,在已知細胞A的質量列表中包含被檢質量列表中列舉的20個質量中的19個,在已知細胞B的質量列表中包含上述20個中的18個,在已知細胞C的質量列表中包含17個。因此,在被檢質量列表中列舉出的質量中,各已知細胞的質量列表中包含的質量的比例是如在已知細胞A中為19/20=0.95、在已知細胞B中為18/20=0.9、在已知細胞C中為17/20=0.85那樣互相接近的值(此外,在圖6中為了簡化,減少各質量列表中包含的質量的數量,但在實際的質量列表中會列舉更多的質量,因此遺傳上親緣相近的細胞間的上述比例的差異進
一步變小)。
[0021]這樣,在第一數據庫的檢索中,在遺傳上親緣相近的已知細胞之間,與被檢細胞的對照結果的差變小。但是,在以往的細胞識別裝置中,僅進行了相當于這種第一數據庫的檢索的檢索,因此,即使能夠進行菌種級的細胞識別,但一般難以進行菌株級的高精度的細胞識別。
[0022]與此相對地,在本發(fā)明的細胞識別裝置中,在基于檢索第一數據庫的結果確定被檢細胞所屬的分類群(例如菌種)之后,從上述被檢質量列表刪除該分類群共同存在的質量。由此,例如制作如圖7的上部所示的被檢細胞的部分質量列表(被檢部分質量列表)。然后,使用該被檢部分質量列表來進行將第二數據庫作為對象的檢索。如上所述,在收錄于第二數據庫的部分質量列表中,去除了各已知細胞的構成成分的離子質量(或者分子量)中的、該已知細胞所屬的規(guī)定等級的分類群共有的離子質量(或者分子量)。因此,在第二數據庫中的各部分質量列表中,僅記載了該細胞所屬的分類群(由分類群確定單元確定的分類群的下一個等級的分類群,例如菌株)特有的質量,與上述質量列表相比,所記載的質量的總數也大幅減少。因此,在將第二數據庫作為對象的檢索中,即使在遺傳上親緣相近的細胞之間,與被檢細胞的對照結果的差異也變大。例如,在圖7的例子中,在被檢部分質量列表所記載的質量中,各已知細胞的部分質量列表中包含的質量的比例是在已知細胞A中為2/2=1,在已知細胞B中為1/2=0.5,在已知細胞C中為0/2=0,與圖6的例子相比,已知細胞間的結果的差異變大。因此,在將第二數據庫作為對象的檢索中,能夠從遺傳上親緣相近的多個已知細胞中高精度地提取與被檢細胞更接近的細胞,其結果,能夠進行原本困難的菌株級的高精度的細胞識別。
[0023]此外,本發(fā)明所涉及的細胞識別裝置除了如上述那樣構成為將第一數據庫和第二數據庫作為對象進行兩個階段的檢索之外,還能夠構成為將一個數據庫作為對象進行兩個階段的檢索。
[0024]即,為了解決上述問題而完成的本發(fā)明的第二方式所涉及的細胞識別裝置,具有存儲裝置和運算裝置,基于對被檢細胞進行質量分析而得到的結果來識別該被檢細胞的種類,其特征在于,
[0025]上述存儲裝置存儲有數據庫,該數據庫針對多個已知細胞收錄了記載有已知細胞的構成成分的尚子質量或者分子量的質量列表,
[0026]上述運算裝置具備:
[0027]a)第一檢索單元,其使用基于上述質量分析的結果制作出的記載有上述被檢細胞的構成成分的離子質量或者分子量的被檢質量列表,來檢索上述數據庫;
[0028]b)分類群確定單元,其基于由上述第一檢索單元得到的檢索結果來確定在之后的檢索中作為對象的分類群;
[0029]c)被檢部分質量列表制作單元,其制作從上述被檢質量列表刪除由上述分類群確定單元確定的分類群共有的離子質量或者分子量所得的被檢部分質量列表;以及
[0030]d)第二檢索單元,其將收錄于上述數據庫的質量列表中的、屬于由上述分類群確定單元確定的分類群的已知細胞的 質量列表作為檢索對象,來進行使用了上述被檢部分質量列表的檢索,[0031]其中,上述第二檢索單元從作為檢索對象的質量列表刪除由上述分類群確定單元確定的分類群共有的離子質量或者分子量,對該刪除后的質量列表進行使用了上述被檢部分質量列表的檢索。
[0032]發(fā)明的效果
[0033]如以上說明那樣,根據本發(fā)明所涉及的細胞識別裝置,能夠從遺傳上親緣相近的多個已知細胞中高精度地提取更加接近被檢細胞的細胞。因此,根據本發(fā)明所涉及的細胞識別裝置,能夠簡便且迅速地進行原本困難的菌株級的高精度的細胞識別。
【專利附圖】
【附圖說明】
[0034]圖1是表示本發(fā)明的實施例1所涉及的細胞識別系統(tǒng)的主要部分的結構圖。
[0035]圖2是表示該系統(tǒng)的動作的流程圖。
[0036]圖3是表示本發(fā)明的實施例2所涉及的細胞識別系統(tǒng)的主要部分的結構圖。
[0037]圖4是表示該系統(tǒng)的動作的流程圖。
[0038]圖5是表示本發(fā)明的實施例3所涉及的細胞識別系統(tǒng)的主要部分的結構圖。
[0039]圖6是用于說明針對第一數據庫的檢索的概念圖。
[0040]圖7是用于說明針對第二數據庫的檢索的概念圖。
【具體實施方式】
[0041]下面,列舉實施例來說明用于實施本發(fā)明所涉及的細胞識別裝置的方式。
[0042]實施例1
[0043]圖1是具備本實施例所涉及的細胞識別裝置的細胞識別系統(tǒng)的整體圖,圖2是表示使用了本系統(tǒng)的細胞識別的過程的流程圖。
[0044]本實施例的細胞識別裝置大致包括質量分析部I和細胞識別部2。質量分析部I具備:離子化部11,其通過基質輔助激光解吸電離法(MALDI)將樣品中的分子、原子離子化;以及飛行時間型質量分離器(TOF) 12,其使從離子化部11射出的各種離子與質量相應地分離。
[0045]T0F12具備:引出電極13,其用于將離子從離子化部11引出并導入T0F12內的離子飛行空間;以及檢測器14,其檢測在離子飛行空間中進行質量分離后的離子。
[0046]細胞識別部2具備:存儲部20,其存儲有檢索用的數據庫;接口部30,其經由通信線與上述質量分析部I進行信息的交換;運算部40,其基于從質量分析部I的檢測器14輸出的檢測信號來進行上述數據庫的檢索;以及分析控制部50,其控制質量分析部I的動作。
[0047]存儲部20由 硬盤裝置等大容量存儲裝置構成,存儲有上位數據庫21和下位數據庫22這兩種數據庫。這些上位數據庫21和下位數據庫22分別相當于本發(fā)明中的第一數據庫和第二數據庫。
[0048]在上位數據庫21中登記了多個與已知微生物有關的質量列表。本實施例的質量列表列舉了對某個微生物細胞進行質量分析時所檢測出的離子的質量,除了包含該離子質量的信息以外,還至少包含上述微生物細胞所屬的分類群(菌屬、菌種以及菌株)的信息(分類信息)。期望基于預先利用與上述質量分析部I所使用的方法相同的電離法和質量分離法對各種微生物細胞實際進行質量分析而得到的數據(實測數據),來制作這種質量列表。
[0049]當根據上述實測數據來制作質量列表時,首先,從作為上述實測數據而獲取到的質譜提取規(guī)定的質量范圍內出現的峰值。此時,通過將上述質量范圍設為4,000~15,000左右,能夠提取主要源自蛋白質的峰值。另外,通過僅提取峰值的高度(相對強度)為規(guī)定的閾值以上的峰值,能夠排除不期望的峰值(噪聲)。此外,在細胞內發(fā)現了大量核糖體蛋白質群,因此通過恰當地設定上述閾值,能夠將質量列表中記載的質量的大部分設為源自核糖體蛋白質的質量。而且,按每個細胞將通過以上動作提取出的峰值的質量(m/z)列表化,在附加了上述分類信息等之后登記到上位數據庫21。此外,為了抑制由培養(yǎng)條件不同導致的基因發(fā)現的偏差,期望預先將用于獲取實測數據的各微生物細胞的培養(yǎng)環(huán)境標準化。
[0050]此外,難以針對龐大的已知微生物全部獲取上述那樣的實測數據。因此,可以至少針對一部分微生物,將基于通過計算求出的分子量(計算分子量)的質量列表代替基于上述那樣的實測數據的質量列表來登記到上位數據庫21。在該情況下,期望事先在各質量列表中附加表示該列表是基于實測數據和計算分子量中的哪一個制作出的列表的信息。
[0051]例如如下那樣制作基于上述計算分子量的質量列表。
[0052](I)從現有的數據庫(例如DDBJ、EMBUGenBank等公共數據庫)獲得已知微生物的基因(例如,核糖體蛋白質群的基因)的DNA堿基序列,通過將其翻譯為氨基酸序列來導出該微生物的細胞中含有的各種蛋白質的計算分子量。此時,還可以對上述計算分子量實施加入了 N-末端開始甲硫氨酸殘基的切斷、翻譯后修飾或者基于生物信息工程學的相同性解析進行的氨基酸序列的修正的校正,在校正前的計算分子量中添加該校正后的計算分子量或者將該校正后的計算分子量取代校正前的計算分子量來用于制作質量列表。此外,上述“基于生物信息工程學的相同性解析進行的氨基酸序列的修正”如下。首先,利用BLAST等的相同性解析在現有的數據庫等中檢索與對象微生物的基因排列相同性聞的基因序列。接著,參照在它們中被注釋的基因序列來推測正確的翻譯區(qū)域。接著,基于該翻譯區(qū)域來修正氨基酸序列,根據校正后的氨基酸序列`來計算出計算分子量。
[0053]另外,也可以在上述現有的數據庫中收錄有各種微生物細胞中含有的蛋白質的計算分子量的情況下,獲取該計算分子量來用于制作質量列表。在該情況下,也進行根據需要加入了如下操作的計算分子量的校正:N-末端開始甲硫氨酸殘基的切斷、翻譯后修飾或者基于生物信息工程學的相同性解析進行的氨基酸序列的修正。
[0054]此外,如上所述,期望在基于實測數據制作了質量列表的情況下,也利用上述相同的方法計算出計算分子量,在將質量列表上的各質量與上述計算分子量進行比較從而驗證了其妥當性之后登記到上位數據庫。由此,能夠提高上位數據庫21中的數據的可靠性。此外,對于被判斷為與計算分子量的比較結果為不妥當的質量列表,期望基于計算分子量來修正質量,或者重新進行質量分析并再次制作質量列表。
[0055](2)將在上述(I)的步驟中求出的計算分子量變換為離子質量,將該離子質量列表化,由此制作質量列表。此外,已知在用MALD1-T0FMS分析了生物體樣品時,主要檢測出[M+H] + (M是分子,H是氫原子)、[M-H]-或者[M+Na] + (Na是鈉原子)等與分子量有關的離子。因而,如果質量分析條件明確,則能夠容易地進行從上述計算分子量向離子質量的變換。例如,當用MALD1-T0FMS對將芥子酸作為結合劑進行調制而得到的生物體樣品進行分析時,主要觀測質子化分子([M+H]+)的峰值。因而,在該情況下,通過將在上述(I)的步驟中求出的計算分子量與質子的質量相加,能夠變換為尚子質量。
[0056]下位數據庫22包含按微生物的每個菌種(species)劃分出的多個子數據庫22a、22b、22c...。子數據庫22a、22b、22c…中分別收錄有與屬于一個菌種的一個或者多個微生物細胞有關的部分質量列表。所謂本實施例中的部分質量列表,是從列舉了對某個微生物細胞進行質量分析時檢測出的離子的質量的列表去除在該微生物所屬的菌種中共同檢測出的質量而得到的列表。能夠通過從用上述方法制作出的與已知微生物有關的多個質量列表提取屬于同一菌種的微生物的質量列表,并從各質量列表刪除這些質量列表中共同包含的質量,來制作這種部分質量列表。因而,假如在上位數據庫中僅登記了一個屬于某一菌種的微生物的質量列表的情況下,對于該微生物,上位數據庫21中登記的質量列表與下位數據庫22中登記的部分質量列表為同一內容。
[0057]運算部40基于用質量分析部I對含有被檢細胞的構成成分的樣品進行分析而得到的結果來執(zhí)行將上述上位數據庫21和下位數據庫22作為對象的檢索,包括被檢質量列表制作部41、上位DB檢索部42、分類群確定部43、被檢部分質量列表制作部44以及下位DB檢索部45來作為功能模塊(各部的功能后述)。此外,上述上位DB檢索部42相當于本發(fā)明中的第一檢索單元,下位DB檢索部45相當于本發(fā)明中的第二檢索單元。本實施例中的細胞識別部2的實體是包括CPU、存儲器等的計算機,CPU通過執(zhí)行安裝于該計算機的規(guī)定的控制和處理程序,來以軟件形式實現上述各功能模塊的功能。運算部40經由接口部30與質量分析部I相連接,并且,還與操作部62和液晶顯示器等顯示部61相連接,該操作部62是鍵盤、鼠標等指設備等。
[0058]接著,利用圖2對使用本實施例的細胞識別系統(tǒng)識別微生物的菌種和菌株時的過程進行說明。
[0059]首先,用戶調制含有被檢細胞的構成成分的樣品,放置于質量分析部I來執(zhí)行質量分析。此時,作為上述樣品,除了 能夠使用細胞提取物、或者根據細胞提取物精制核糖體蛋白質等細胞構成成分而得到的物質以外,還能夠直接使用菌體、細胞懸浮液,但期望與基于上位數據庫21中的實測數據制作質量列表時的條件相同。
[0060]被檢質量列表制作部41經由接口部30獲取從質量分析部I的檢測器14得到的檢測信號(步驟Sll)。然后,基于該檢測信號制作質譜,提取在該質譜中出現的峰值來制作包含各峰值的質量(嚴格地說是m/z)的信息的質量列表(以下將其稱為“被檢質量列表”)(步驟S12)。此外,關于此時的峰值提取條件(要提取的質量范圍以及峰值強度的閾值等),期望與基于上位數據庫21中的實測數據制作質量列表時的條件相同。
[0061]接著,上位DB檢索部42使用上述被檢質量列表來檢索上位數據庫21,提取具有與該被檢質量列表相似的質量圖案的已知微生物的質量列表,例如提取包含大量在規(guī)定的誤差范圍內與被檢質量列表中的各質量一致的質量的質量列表(步驟S13)。
[0062]接著,分類群確定部43通 過參照在步驟S13中提取出的質量列表所記載的分類群的信息來確定與該質量列表對應的已知微生物所屬的生物種。然后,將該生物種估計為上述被檢細胞所屬的生物種,并將其確定為之后作為檢索對象的分類群(步驟S14)。
[0063]當基于以上方法確定被檢細胞所屬的生物種時,被檢部分質量列表制作部44從上述被檢質量列表刪除在上述生物種中共同檢測出的質量(菌種共有質量)(步驟S15)。將由此獲得的質量列表稱為“被檢部分質量列表”。此外,期望預先按每個生物種導出上述菌種共有質量并存儲到存儲部20。或者,也可以在確定了被檢細胞所屬的生物種的時間點,被檢部分質量列表制作部44從上位數據庫獲取屬于該生物種的已知微生物的質量列表,并將它們進行比較,由此確定菌種共有質量并用于制作上述被檢部分質量列表。
[0064]之后,下位DB檢索部45選擇與由上述分類群確定部43確定的生物種對應的子數據庫(例如子數據庫22a)來作為檢索對象。然后,以該子數據庫22a為對象來執(zhí)行使用了上述被檢部分質量列表的檢索(步驟S16),從該子數據庫提取與上述被檢部分質量列表一致度高的部分質量列表。此時,可以僅提取一個上述一致度最高的部分質量列表,但也可以提取一致度超過預定的閾值的部分質量列表、或者按上述一致度從高到低的順序提取預定數量的部分質量列表。
[0065]接著,下位DB檢索部45將通過上述檢索提取出的部分質量列表的信息作為檢索結果而顯示于顯示部61 (步驟S17)。在此所顯示的信息中至少包含上述部分質量列表中記載的已知微生物的菌株名以及與被檢部分質量列表的一致度。由此,用戶能夠獲知產生與被檢細胞相似的質量圖案的已知微生物的菌株名,能夠將被檢細胞估計為與該已知微生物的菌株相同或者遺傳上親緣相近的菌株。
[0066]此外,期望在步驟S17中顯示的部分質量列表的信息中還包含表示該部分質量列表是基于實測數據制作出的還是基于計算分子量制作出的信息。一般地,基于實測數據制作出的質量列表更加準確,因此在作為檢索結果顯示了多個部分質量列表的情況下,用戶通過參照上述信息,能夠判斷哪個部分質量列表作為檢索結果更加恰當。
[0067]實施例2
[0068]在上述實施例1中示出了具備上位數據庫21和下位數據庫22兩個數據庫的細胞識別裝置,但本發(fā)明所涉及的細胞識別裝置也能夠構成為僅具備一個數據庫。下面,參照圖
3、圖4對具備這種結構的細胞識別裝置的實施例進行說明。圖3是具備本實施例所涉及的細胞識別裝置的細胞識別系統(tǒng)的整體圖,圖4是表示使用了本系統(tǒng)的細胞識別的過程的流程圖。`
[0069]本實施例所涉及的細胞識別系統(tǒng)除了以下兩點以外其余具有與實施例1相同的結構:具有一個數據庫23來代替上位數據庫21和下位數據庫22 ;具有第一檢索部46和第二檢索部47來代替上位DB檢索部42和下位DB檢索部45。
[0070]本實施例的數據庫23相當于實施例1的上位數據庫21,與上述上位數據庫21同樣地收錄有多個與已知微生物有關的質量列表。
[0071]第一檢索部46發(fā)揮與實施例1的上位DB檢索部42相同的作用,使用由被檢質量列表制作部41制作出的被檢質量列表來檢索數據庫23。第二檢索部47使用由被檢部分質量列表制作部44制作出的被檢部分質量列表來檢索數據庫23,此時,僅將與屬于由分類群確定部43確定的分類群的微生物有關的質量列表作為檢索對象。并且,將數據庫23內的各質量列表所記載的質量中的、除上述分類群共有的質量以外的質量用于與被檢部分質量列表進行對照。
[0072]利用圖4對使用本實施例的細胞識別系統(tǒng)識別微生物的菌種和菌株時的過程進行說明。
[0073]首先,用戶在將含有被檢細胞的構成成分的樣品放置于質量分析部I來進行質量分析之后,被檢質量列表制作部41獲取該質量分析的結果(步驟S21),進行被檢質量列表的制作(步驟S22)。此外,這些步驟與圖2的步驟Sll和S12相同,因此省略詳細的說明。
[0074]接著,第一檢索部46使用上述被檢質量列表檢索數據庫23,提取具有與該被檢質量列表相似的質量圖案的已知微生物的質量列表(步驟S23)。
[0075]接著,分類群確定部43通過參照在步驟S23中提取出的質量列表中記載的分類信息,來確定與該質量列表對應的已知微生物所屬的生物種。然后,將該生物種估計為上述被檢細胞所屬的生物種,并將該生物種確定為在之后的檢索中作為對象的分類群(步驟
524)。
[0076]當根據上述方法確定了被檢細胞所屬的生物種時,被檢部分質量列表制作部44從上述被檢質量列表刪除上述生物種共有的質量,由此制作被檢部分質量列表(步驟
525)。該步驟與圖2的步驟S15相同,因此省略詳細的說明。
[0077]之后,第二檢索部47使用在步驟S25中制作出的被檢部分質量列表來檢索數據庫23 (步驟S26)。此時,第二檢索部47選擇收錄于數據庫23的多個質量列表中的、與屬于在步驟S24中確定的生物種的微生物有關的質量列表來作為檢索對象。并且,僅將所選擇出的各質量列表中記載的質量中的、各菌株特有的質量用于與被檢部分質量列表進行對照。具體地說,首先,第二檢索部47確定作為檢索對象而選擇出的各質量列表中共同包含的質量(菌種共有質量),將從各質量列表去除菌種共有質量而得到的質量與上述被檢部分質量列表中的各質量進行對照,來計算一致度。其結果,從數據庫23提取與被檢部分質量列表的一致度高的質量列表。此外,也可以預先按每個微生物種確定菌種共有質量并存儲到存儲部20,來代替第二檢索部47如上所述那樣確定菌種共有質量。
[0078]接著,第二檢索部47將通過上述檢索提取出的部分質量列表的信息作為檢索結果而顯示于顯示部61 (步驟S27)。在此時顯示的信息中至少包含該質量列表中記載的已知微生物的菌株名以及與該被檢部分質量列表的一致度。根據以上內容,用戶能夠獲知產生與被檢細胞相似的質量圖案的已知微生物的菌株名,能夠將被檢細胞估計為與上述菌株相同或者遺傳上親緣相近的菌株。
[0079]實施例3
[0080]使用圖5對本發(fā)明所涉及的細胞識別裝置的第三實施例進行說明。本實施例的系統(tǒng)構成為還具備變異數據庫24,在下位DB檢索部45中進行考慮了上述變異的檢索,該變異數據庫24收錄有與在堿基序列或者氨基酸序列中可能產生的變異有關的信息(以下,稱為“變異信息”)。
[0081]在變異數據庫24中預先登記有上述變異信息,即變異的名稱、變化的氨基酸或者堿基的種類、變化的部位、由該變異導致的離子質量的變化量(m/z)等。
[0082]在本系統(tǒng)中,在登記于下位數據庫22的部分質量列表中除了包含上述質量信息和分類信息以外,還包含與該列表中的各質量對應的蛋白質的氨基酸序列和/或對上述蛋白質進行編號而得到的基因的堿基序列的相關信息(以下,稱為“序列信息”)。
[0083]使用了本實施例的細胞識別系統(tǒng)的細胞識別的過程與在圖2的流程圖中示出的過程大致相同。但是,在步驟S16中,在下位DB檢索部45中除了執(zhí)行與上述實施例1相同的檢索(不考慮變異的檢索)以外,還執(zhí)行考慮了在氣基酸序列或者喊基序列中可能發(fā)生的變異的檢索。
[0084]在考慮了上述變異的檢索中,首先,下位DB檢索部45從上述變異數據庫24獲取變異信息。此外,在變異數據庫24中登記了與各種變異有關的信息,但在此,首先獲取與一種變異有關的信息。然后,基于上述變異信息來改變作為檢索對象的子數據庫(例如子數據庫22a)中的部分質量列表,由此制作應用了該變異的部分質量列表(以下,將其稱為“改變質量列表”)。具體地說,通過參照各部分質量列表中的上述序列信息來判斷在與該部分質量列表中列舉出的各質量對應的蛋白質的氨基酸序列(或者對該蛋白質進行編號而得到的基因的堿基序列)中是否包含可能發(fā)生上述變異的區(qū)域,在包含可能發(fā)生上述變異的區(qū)域的情況下,將該質量變更為發(fā)生了上述變異的情況下的質量。
[0085]接著,將通過以上方法得到的改變質量列表與上述被檢部分質量列表進行對照,來計算出質量圖案的一致度并暫時存儲到存儲部20。然后,針對變異數據庫24中登記的所有變異,反復進行如上所述的改變質量列表的制作以及一致度的計算。當考慮了所有變異的檢索結束后,下位DB檢索部45從存儲部20讀出所有檢索結果,參考一致度等評價結果的妥當性。例如提取具有固定以上的一致度的結果,或者按一致度從高到低的順序提取規(guī)定數量的結果。然后,將提取出的結果顯示在顯示部61的畫面上(步驟S17)。
[0086]這樣,通過進行考慮了變異的檢索,即使在被檢細胞是由于基于已知的微生物菌株的變異而產生的情況下,也能夠獲得高精度的檢索結果。
[0087]此外,在上述實施例中,設為進行考慮了變異數據庫24中登記的所有變異的檢索,但在登記于變異數據庫24的變異中實際還包含大量只會以非常低的概率發(fā)生的變異。因此,針對各變異,事先將基于發(fā)生的可能性的高低的優(yōu)先級、重要度等登記到變異數據庫24,例如,也可以按該優(yōu)先級從高到低的順序選擇用戶預先指定的規(guī)定個數的變異并應用于檢索。或者,還可以在下位數據庫22的檢索之前,在顯示部61中顯示變異數據庫24所登記的變異的一覽,使用戶從該一覽中選擇應用于檢索的變異。另外,如果在下位數據庫22的檢索中選中了一致度相當高的質量列表,則也可以在該時間點結束檢索。在該情況下,設為下位DB檢索部45在檢索出與被檢部分質量列表的一致度為預定的閾值以上的部分質量列表或者改變質量列表的時間點,停止數據庫的反復檢索。由此估計會大幅縮短檢索時間。
[0088]并且,在本實施例中,說明了在如實施例1那樣的進行針對上位數據庫21的檢索和針對下位數據庫22的檢索的裝置 中進行考慮了變異的檢索的情況,但在如實施例2的裝置那樣對一個數據庫23進行兩個階段的檢索的裝置中也能夠通過在存儲部20中設置與上述相同的變異數據庫來進行考慮了變異的檢索。在該情況下,事先與上述數據庫23中的質量列表所記載的質量中的至少菌株特有的質量相關地記載如上所述的序列信息。而且,在利用第二檢索部47執(zhí)行檢索時,進行考慮了上述變異數據庫中登記的變異的檢索。
[0089]以上,列舉實施例對用于實施本發(fā)明的方式進行了說明,但本發(fā)明并不限定于上述實施例,允許在本發(fā)明的宗旨的范圍內進行適當變更。例如,在上述實施例中,例示了具備質量分析部的細胞識別系統(tǒng),該質量分析部是由使用基質輔助激光解吸電離法(MALDI)的離子化部與飛行時間型的質量分離器(TOF)組合而成的,質量分析部只要是能夠將1,000~25,000左右的質量范圍的分子進行離子化并檢測的部件,則并不限定于上述構成。例如,作為離子化部,還能夠利用使用了電噴霧電離法(ESI)、激光解吸電噴霧電離(LDESI)、基質輔助激光解吸電噴霧電離(MALDESI)、短針噴霧電離(PSI)、大氣壓化學電離(APCI)或者電碰撞電離(EI)的部件等。
[0090]另外,在上述實施例中, 設為在由上位DB檢索部42或者第一檢索部46進行的第一次檢索中進行菌種級的細胞識別,在由下位DB檢索部45或者第二檢索部47進行的第二次檢索中進行菌株級的細胞識別,但并不限于此,例如,也可以設為在第一次檢索中進行菌屬級的細胞識別,在第二次檢索中進行菌種級的識別。
[0091]另外,在上述實施例中,設為在登記于各數據庫的質量列表或者部分質量列表中記載細胞構成成分的離子質量,但并不限于此,也可以記載細胞構成成分的分子量。在該情況下,設為以下結構:當在被檢質量列表制作部41中制作被檢質量列表時,將在質量分析中檢測出的各離子的質量換算為分子量,或者在利用上位DB檢索部42、下位DB檢索部45、第一檢索部46以及第二檢索部47進行數據庫檢索時,將數據庫中的各質量列表(或者部分質量列表)中記載的分子量換算為離子質量,之后與被檢質量列表(或者被檢部分質量列表)進行對照。
[0092]附圖標記說明
[0093]1:質量分析部;11:離子化部;12 =TOF ;2:細胞識別部;20:存儲部;21:上位數據庫;22:下位數據庫;22a、22b、22c:子數據庫;23:數據庫;24:變異數據庫;30:接口部;40:運算部;41:被檢質量列表制作部;42:上位DB檢索部;43:分類群確定部;44:被檢部分質量列表制作部;45:下位DB檢索部;46:第一檢索部;47:第二檢索部;50:分析控制部;61:顯示部;62:操作部。`
【權利要求】
1.一種細胞識別裝置,具有存儲裝置和運算裝置,該細胞識別裝置基于對被檢細胞進行質量分析而得到的結果來識別該被檢細胞的種類,該細胞識別裝置的特征在于, 上述存儲裝置存儲有第一數據庫和第二數據庫,其中,該第一數據庫針對多個已知細胞收錄了記載有已知細胞的構成成分的離子質量或者分子量的質量列表,該第二數據庫針對多個已知細胞收錄了部分質量列表,該部分質量列表中記載有已知細胞的構成成分的離子質量或者分子量中的、除該已知細胞所屬的預定等級的分類群共有的離子質量或者分子量以外的尚子質量或者分子量, 上述運算裝置具備: a)第一檢索單元,其使用基于上述質量分析的結果制作出的記載有上述被檢細胞的構成成分的離子質量或者分子量的被檢質量列表,來檢索上述第一數據庫; b)分類群確定單元,其基于由上述第一檢索單元得到的檢索結果,將位于上述等級的分類群中的某一個確定為在之后的檢索中作為對象的分類群; c)被檢部分質量列表制作單元,其制作從上述被檢質量列表刪除由上述分類群確定單元確定的分類群共有的離子質量或者分子量所得的被檢部分質量列表;以及 d)第二檢索單元,其使用由上述被檢部分質量列表制作單元制作出的被檢部分質量列表來檢索上述第二數據庫。
2.一種細胞識別裝置,具有存儲裝置和運算裝置,該細胞識別裝置基于對被檢細胞進行質量分析而得到的結果來識別該被檢細胞的種類,該細胞識別裝置的特征在于, 上述存儲裝置存儲有數據庫,該數據庫針對多個已知細胞收錄了記載有已知細胞的構成成分的尚子質量或者分子量的質量列表, 上述運算裝置具備: a)第一檢索單元,其使用基于上述質量分析的結果制作出的記載有上述被檢細胞的構成成分的離子質量或者分子量的被檢質量列表,來檢索上述數據庫; b)分類群確定單元,其基于由上述第一檢索單元得到的檢索結果來確定在之后的檢索中作為對象的分類群; c)被檢部分質量列表制作單元,其制作從上述被檢質量列表刪除由上述分類群確定單元確定的分類群共有的離子質量或者分子量所得的被檢部分質量列表;以及 d)第二檢索單元,其將收錄于上述數據庫的質量列表中的、屬于由上述分類群確定單元確定的分類群的已知細胞的質量列表作為檢索對象,來進行使用了上述被檢部分質量列表的檢索, 其中,上述第二檢索單元從作為檢索對象的質量列表刪除由上述分類群確定單元確定的分類群共有的離子質量或者分子量,針對該刪除后的質量列表進行使用了上述被檢部分質量列表的檢索。
3.根據權利要求1所述的細胞識別裝置,其特征在于, 還具備變異數據庫,該變異數據庫收錄了與在堿基序列或者氨基酸序列中可能發(fā)生的變異有關的信息, 上述第二檢索單元從上述變異數據庫獲取與變異有關的信息,基于該信息將上述第二數據庫中的部分質量列表中包含的離子質量或者分子量變更為發(fā)生上述變異時的離子質量或者分子量,以該變更后的部分質量列表為對象來進行使用了上述被檢部分質量列表的檢索。
4.根據權利要求2所述的細胞識別裝置,其特征在于, 還具備變異數據庫,該變異數據庫收錄了與在堿基序列或者氨基酸序列中可能發(fā)生的變異有關的信息, 上述第二檢索單元從上述變異數據庫獲取與變異有關的信息,基于該信息將上述刪除后的質量列表中包含的離子質量或者分子量變更為發(fā)生上述變異時的離子質量或者分子量,以該變更后的質量列表為對象來進行使用了上述被檢部分質量列表的檢索。
5.—種程序, 用于使計算機作為權利要求1所述的第一檢索單元、分類群確定單元、被檢部分質量列表制作單元以及第二檢索單元而發(fā)揮功能。
6.一種程序, 用于使計算機作為權利要求2所述的第一檢索單元、分類群確定單元、被檢部分質量列表制作單元以及第二檢索單元而 發(fā)揮功能。
【文檔編號】G01N33/48GK103890164SQ201280051541
【公開日】2014年6月25日 申請日期:2012年10月17日 優(yōu)先權日:2011年10月18日
【發(fā)明者】尾島典行, 緒方是嗣, 島圭介, 田村廣人, 細田晃文, 堀田雄大 申請人:株式會社島津制作所