質(zhì)譜微生物鑒定過程中對混合物的檢測的制作方法
【專利摘要】本發(fā)明涉及通過計算樣本質(zhì)譜和質(zhì)譜庫中參考質(zhì)譜的相似度來鑒定樣本中的微生物;特別涉及微生物混合物的檢測。如果不存在近緣關(guān)系的多個微生物物種位于包含最相似參考質(zhì)譜的分值列表中,則很有可能存在微生物混合物。提出的方法可(1)通過關(guān)系列表來操作,(2)確定分值列表中不同微生物物種參考質(zhì)譜間的相似度,或(3)始終按照文件DE 10 2009 007 266 A1,通過生成組合質(zhì)譜,借助分值列表進行混合物分析,并僅向后檢查組合質(zhì)譜的相似度從而檢查相關(guān)微生物株系間的關(guān)系。
【專利說明】質(zhì)譜微生物鑒定過程中對混合物的檢測
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通過計算樣本質(zhì)譜和質(zhì)譜庫中參考質(zhì)譜的相似度來鑒定樣本中的微 生物;特別涉及微生物混合物的檢測。
【背景技術(shù)】
[0002] 日??焖贌o誤的多微生物樣本鑒定在臨床和臨床外感染診斷、在醫(yī)院或用于游泳 的河流或湖泊的衛(wèi)生監(jiān)測、食品分析、生物技術(shù)工藝監(jiān)測和控制以及微生物研宄中發(fā)揮重 要作用。這里的"微生物種"可簡稱為"微生物",通常是用顯微鏡看見的小生物體,例如單 細胞真菌(例如酵母)、藻類或原生動物(例如引起瘧疾的瘧原蟲)。但是,此處的鑒定主 要針對細菌。
[0003] 微生物鑒定主要是指確定其種類從而將微生物分入分類體系,其中包括最高級 另IJ、域(細菌、古細菌和真核生物),一直到目、科、屬和種。
[0004] 最初將微生物種分類為種的方式是采用主要通過生物化學(xué)反應(yīng)的生物分類方法。 這在許多情況下都不夠準(zhǔn)確,并且經(jīng)常不能按照統(tǒng)一基因關(guān)系進行分類。將各個種區(qū)分開 的傳統(tǒng)生物學(xué)定義對于相同種的成員間的有性繁殖能力是沒有限制的,而在不同種的成員 間是有限制的。這一定義自然不適用于微生物,因此對物種的分類通常比較武斷。分子生物 學(xué)的現(xiàn)代方法將許多物種糾正劃分為屬、科甚至目,將許多物種組合,并定義了新的物種。 對于細菌,則在物種之下進一步引入了分類學(xué)中的綱或亞種。而且,醫(yī)學(xué)和細胞生物學(xué)領(lǐng)域 的研宄又納入了血清變型或血清型,可按照細胞膜附著行為的不同類型加以區(qū)分,但并不 構(gòu)成一個單獨物種或亞種。
[0005] 眾多新定義以及將物種重新劃分為屬和科,產(chǎn)生了同樣多的新微生物名稱,但這 在日常實踐中尚未被人們普遍接受。因此,微生物之間的關(guān)系程度并非始終都能夠通過常 用(有時比較陳舊)的名稱來辨別。關(guān)于重新劃分的某些發(fā)現(xiàn)物和更正確的關(guān)系結(jié)構(gòu)還未 被普遍接受。確定這些關(guān)系需要知識淵博的專家。
[0006] 與傳統(tǒng)的微生物鑒定相比,新的分子生物學(xué)鑒定法多年來已經(jīng)為人們所熟知。例 如,這些方法可基于通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或微生物特定分子細胞成分的質(zhì)譜檢測來 放大特定基因片段,之后再進行DNA或RNA序列分析。在針對性(真陰性率)、靈敏度(真 陽性率)、其他錯誤率和分析速度方面,這些新方法遠遠優(yōu)于傳統(tǒng)方法。
[0007] 按照本文中的定義,通過質(zhì)譜測量鑒定微生物樣本通常需要確定物種,實際上由 此物種的名稱來表示,這在微生物實驗室或臨床應(yīng)用中是較為常見的方法。在某些情況下, 僅能確定屬,由常用的屬名稱來表示。僅在少數(shù)情況能確定亞種,或在比較順利的情況下, 能確定血清型或株系。在廣義上,鑒定還可能表示對其他特征的確定,例如一種微生物種的 病原性(能夠?qū)е录膊。┗蛞环N微生物種對抗生素的耐藥性,但這些類型的鑒定并不是本 文要討論的問題。
[0008] Van Baar在評論中詳細說明了如何借由質(zhì)譜測量進行細菌鑒定,例如(FEMS Mi crobiolgy Reviews(FEMS 微生物學(xué)評論),24,2000,193-219 :"Characteri zation of bacteria by matrix-assisted laser desorption/ioni zati on and electrospray mass spectrometry"(《借由基質(zhì)輔助激光解吸/電離和電噴霧質(zhì)譜的細菌定性》))。通過分析 待鑒定細菌的質(zhì)譜和已知細菌的參考質(zhì)譜(以下簡稱參考質(zhì)譜)之間的相似度來完成鑒 定。在相似度分析期間,為各參考質(zhì)譜分配一個相似度指標(biāo),以確定參考質(zhì)譜和樣本質(zhì)譜之 間的一致程度。例如,如果相似度指標(biāo)明顯高于所有其他參考質(zhì)譜的相似度指標(biāo),或高于指 定的最小分值,則可視為該細菌已鑒定。在以下內(nèi)容中,相似度指標(biāo)也稱為"相似度分值"或 簡稱為"相似度"。
[0009] 通常會在一個或多個集合(以下稱為"庫")中比較參考質(zhì)譜。因而庫中包含一個 或多個參考質(zhì)譜集合。在醫(yī)學(xué)診斷應(yīng)用中,必須按照法律規(guī)定來驗證這些參考質(zhì)譜庫。驗 證參考質(zhì)譜庫要求各條目均可追蹤,并且進行十分準(zhǔn)確地歸檔。參考質(zhì)譜可通過已經(jīng)精確 確定特征的株系獲得。
[0010] 全世界眾多研宄所采用冷凍或凍干株系的形式來收集活性微生物。"株系"一詞是 指從單一生物體繁殖而來、并在專門實驗室中得到公認(rèn)準(zhǔn)確鑒定的群體。由于人們在全世 界的不同地點收集和儲存微生物,因此世界范圍內(nèi)也會存在屬于相同物種或亞種的許多株 系。盡管這些株系被分類為相同物種或亞種,但有時表現(xiàn)出的質(zhì)譜會略有不同,這說明存在 個體差異(同一物種的動物或植物就是這類情況)。繼物種或亞種之后,株系成為國際上同 意的又一名稱。
[0011] 通常,因為各株系的質(zhì)譜略有不同,所以參考質(zhì)譜庫不僅包含某一微生物物種 (或亞種)的一個參考質(zhì)譜,還包含不同株系的多個參考質(zhì)譜。在向庫中輸入新的參考質(zhì)譜 時,它應(yīng)當(dāng)與該物種的現(xiàn)有參考質(zhì)譜有所不同,這一點至關(guān)重要,以便能夠清晰地反映出該 物種或亞種質(zhì)譜變化的幅度。某物種的微生物如果參考質(zhì)譜相同,即使來源于不同株系,也 無法提供更好的鑒定結(jié)果。一個微生物物種應(yīng)具有至少五種參考質(zhì)譜,甚至十種、十五種或 更多才更好,尤其是在各株系質(zhì)譜彼此存在明顯差異時。但是在有些情況下,由于缺乏經(jīng)過 明確鑒定的株系,庫中可能僅包含一種或兩種參考質(zhì)譜。
[0012] 生成微生物質(zhì)譜通常需要通過清晰地分離菌落("分離物"),在固態(tài)(通常為凝 膠)培養(yǎng)基上開始。在日常操作中,通常使用小棉棒(例如衛(wèi)生清潔的木制牙簽)將微量 微生物從選定菌落轉(zhuǎn)移到質(zhì)譜樣本載板上。在載板上,采用已知方法對樣本進行細胞破碎 并添加基質(zhì),并使用飛行時間質(zhì)譜儀通過基質(zhì)輔助激光解析來分析樣本。每個激光脈沖產(chǎn) 生的離子將生成獨立的質(zhì)譜,但這在統(tǒng)計學(xué)上并不可靠,而且攜帶有相關(guān)大量噪聲。為了獲 得可靠且無噪聲的質(zhì)譜,將添加數(shù)百個此類單獨質(zhì)譜以形成總質(zhì)譜。"微生物質(zhì)譜" 一詞或 簡稱"微生物質(zhì)譜"應(yīng)始終表示該總質(zhì)譜。
[0013] 微生物分離物的質(zhì)譜是可溶性微生物材料離子質(zhì)量值的豐度分布曲線。在微生物 細胞內(nèi)部的數(shù)萬種物質(zhì)中,僅測量出大約50至200種含量最多(或最易于電離)的成分大 于測量閾值。這些離子絕大部分是蛋白離子,特別是核糖體中所含不同類型蛋白質(zhì)的離子。 核糖體始終含有相同數(shù)量的約40至60種物種特有的同種蛋白質(zhì)。每個微生物細胞包含遠 遠超過10, 〇〇〇個的完全相同核糖體,即在每個細胞中,有10, 〇〇〇個以上物種特有的蛋白質(zhì) 分子。通常這些核糖體蛋白質(zhì)屬于質(zhì)譜最突出的峰值。這種微生物質(zhì)譜再現(xiàn)的蛋白質(zhì)分布 曲線具有所討論的微生物物種的顯著特征,因為每個物種都將產(chǎn)生由基因預(yù)先決定的蛋白 質(zhì),這些蛋白質(zhì)具有各自的質(zhì)量特征。同樣,該微生物內(nèi)各個蛋白質(zhì)的豐度在能夠由質(zhì)譜 測量的最大范圍內(nèi),同樣由基因或細胞結(jié)構(gòu)(與核糖體相同)預(yù)先決定。這幾乎與培養(yǎng)基 或菌落成熟度完全不相關(guān)。因此鑒定極為穩(wěn)定,并且與培養(yǎng)的類型或持續(xù)時間或樣本預(yù)制 幾乎無關(guān)。蛋白質(zhì)分布曲線是微生物的特征,正如指紋是人的特征一樣。在質(zhì)譜中,可在約 3, OOO道爾頓至15, OOO道爾頓的質(zhì)量范圍內(nèi)找到對鑒定最具幫助的信息。
[0014] 除了穩(wěn)定性,它還證明有利于將培養(yǎng)和樣本預(yù)制盡可能的標(biāo)準(zhǔn)化。通過制備特定 微生物菌落、準(zhǔn)確歸檔同族并從中獲得質(zhì)譜來生成質(zhì)譜庫的參考質(zhì)譜。出于統(tǒng)計原因,始終 需要獲得大量總質(zhì)譜并進行評估以獲得一種參考質(zhì)譜。雖然由于對質(zhì)譜信號的搜索被設(shè)置 較高的敏感度而導(dǎo)致微生物的總質(zhì)譜中有一些是純噪聲,但是微生物的總質(zhì)譜通常包含約 50至200個被質(zhì)譜中的分隔空間明顯分隔的質(zhì)譜信號。因此參考質(zhì)譜通常被減少為最多70 或I 00個質(zhì)量信號,例如通過移除噪聲信號和強度過低的信號。專家們甚至考慮將質(zhì)量信 號限制為50個就已經(jīng)足夠。對于一個具有50個質(zhì)量信號,其質(zhì)譜范圍介于3, 000至15, 000 道爾頓的質(zhì)譜,即使降低質(zhì)量分辨能力,并且不考慮強度差異(理論上,存在20005°~ IO165 個互不相同的模式),其信息內(nèi)容仍遠遠多于2, 000個可辨別的質(zhì)譜信號。
[0015] 將以相似方式從重復(fù)質(zhì)譜中生成待鑒定的微生物質(zhì)譜(以下簡稱為"樣本質(zhì) 譜"),其質(zhì)譜信號將被限制為預(yù)先確定的數(shù)量,以便盡可能排除噪聲信號。在這些樣本質(zhì)譜 中選擇質(zhì)量信號時,其數(shù)量通常略高于參考質(zhì)譜中的質(zhì)量信號數(shù)量。
[0016] 根據(jù)樣本質(zhì)譜和庫中參考質(zhì)譜的相似度分析鑒定微生物。存在不同類型的相似度 分析,它們通?;诓煌问降膮⒖假|(zhì)譜。文獻中多種類型的鑒定算法和參考庫已經(jīng)為人 們所知,這里不再進一步闡述。通常使用"相似度指標(biāo)"(以下也稱為"相似度分值"或簡稱 "相似度")來表示兩種質(zhì)譜之間的相似度。本 申請人:的公司開發(fā)出一種十分簡單快速的質(zhì) 譜鑒定方法,具有極高的成功率,并且已經(jīng)過獨立研宄小組的無數(shù)次研宄予以驗證。由于質(zhì) 量信號強度差異較大,所以相似度指標(biāo)主要基于質(zhì)量信號的質(zhì)量;對強度僅稍加考慮。
[0017] 上述鑒定方法基于相似度指標(biāo)的特殊計算方法。由于相似度指標(biāo)在下文中十分重 要,因而在此簡要解釋我們在公司對其執(zhí)行的計算。這種計算方法基于三個單因素度量。相 似度指標(biāo)的第一個單因素度量,由微生物質(zhì)譜和參考質(zhì)譜(符合質(zhì)量容差范圍)中的質(zhì)量 信號數(shù)量("命中數(shù)")除以參考質(zhì)譜中的質(zhì)量信號數(shù)量來表示,但所有質(zhì)量信號均按其存 在率的比例加權(quán)。存在率是重復(fù)測量時這一質(zhì)量在參考質(zhì)譜中出現(xiàn)的百分比。質(zhì)量容差范 圍可以為給定的絕對值(單位為道爾頓)或是相對值(ppm,百萬分率)。第二個單因素度 量由命中數(shù)除以微生物質(zhì)譜中的質(zhì)量信號數(shù),還是按參考質(zhì)譜中的存在率比例加權(quán)。第一 個和第二個單因素度量的最大值均為1. 00。第三個單因素度量通過符合的質(zhì)量信號各自強 度間的相似度計算得出,還是以相乘的方式考慮存在率。第三個單因素度量將針對所有質(zhì) 量信號進行標(biāo)準(zhǔn)化,從而在所有強度相等時,使該單因素度量值為1. 00。
[0018] 現(xiàn)在只需將這三個單因素度量相乘,即可獲得參考質(zhì)譜和微生物質(zhì)譜間的相似度 指標(biāo)。由于每個單因素度量的最大值均為1.00,因而相似度指標(biāo)的最大值同樣為1.00。通 過這種相似度計算得出了數(shù)十萬次經(jīng)過驗證的鑒定,這些鑒定表明,實際上,可靠鑒定的相 似度分值始終大于〇. 10。為推導(dǎo)出更易于處理的數(shù)值,可通過乘以1000進行轉(zhuǎn)換,然后使 用對數(shù)值,可獲得相同質(zhì)譜的最大相似度指標(biāo)S = 3. 00,物種鑒定所需的最小相似度指標(biāo)S =2. 00。這種轉(zhuǎn)換并非必不可少,但可獲得較高的心理值;如果證明任何其他轉(zhuǎn)換更加可 行,也可應(yīng)用其他轉(zhuǎn)換。
[0019] 這些相似度指標(biāo)的計算可采用非??焖俚乃惴▉韴?zhí)行。如今,將質(zhì)譜儀和計算機 結(jié)合使用,僅需幾毫秒即可完成比例調(diào)整和相似度指標(biāo)的計算。
[0020] 結(jié)果通常用"分值列表"來表示,至少可作為中間結(jié)果,其中,給出最相似的參考質(zhì) 譜,按照相似度指標(biāo)排序,并列出相應(yīng)微生物物種、亞種和株系的名稱。成千上萬次經(jīng)過驗 證的鑒定表明,確定性通常遠遠超過95%,介于S f= 1. 70和S g= 2. 00之間的相似度指標(biāo) 可至少確定科,有可能確定屬,而介于Sg= 2. 00和S s= 2. 30之間的相似度指標(biāo)則可準(zhǔn)確 確定屬,有可能確定物種。高于Ss= 2. 30的相似度指標(biāo)可確定單獨物種,并且確定性水平 較高。上述范圍值在細菌分類中的準(zhǔn)確度驚人;不同研宄小組開展的很多大規(guī)模研宄已經(jīng) 對上述范圍值予以確認(rèn)。這些相似度分值可用于最常用的質(zhì)譜鑒定系統(tǒng)Bruker Daltonics 的"MALDI Biotyper?"中。對于其他系統(tǒng),必要時還需進行轉(zhuǎn)換。
[0021] 正如以上所做的簡要說明,在這種質(zhì)譜鑒定方法的發(fā)展歷史中,它已經(jīng)成為一種 慣例,用來創(chuàng)建微生物株系名稱的分值表,通過該微生物株系的參考質(zhì)譜可獲得最佳的相 似度分值,以此作為鑒定的中間結(jié)果。該列表按照樣本質(zhì)譜的相似度排序。相似度分值高于 S = 1. 50的所有參考質(zhì)譜將以表格形式顯示,例如,如果存在30種以上最為相似的參考質(zhì) 譜,則該表格將被縮減。若不使用任何相似度閾值,則該分值列表通常只是包含20至30種 最為相似的參考質(zhì)譜。如果相似度分值大幅跳躍,例如AS = 0.60的跳躍幅度,則該表格 還可再縮減。隨后應(yīng)由專家來評估該分值列表,通過他/她的經(jīng)驗來做出最后的鑒定。當(dāng) 分值列表中列出多個微生物物種時,專家必須特別評估樣本是否為不同微生物物種的混合 物。
[0022] 由于質(zhì)譜鑒定方法如今普遍用于數(shù)百個常規(guī)實驗室內(nèi),因而讓專家評估的要求已 經(jīng)不再適用。人們對于這樣一種方法的需求愈發(fā)迫切,該方法能夠盡可能自動運行,并且當(dāng) 存在微生物混合物時,仍具有較高鑒定確定性。因此分值列表評估在很大程度上必須轉(zhuǎn)移 給計算機程序執(zhí)行;僅在少數(shù)情況下,結(jié)果可能無法確定。
[0023] 在大多數(shù)情況下,可明確鑒定瓊脂表面上干凈分離菌落中的微生物。但無法保證 在瓊脂上清晰分離的菌落中不存在微生物混合物。在培養(yǎng)期內(nèi),存在微生物,它們通常在瓊 脂表面上不可見的薄層中移動并擴散。如果外來菌落分泌的代謝廢物對其不具有吸引力, 則可避開其他菌落;但是,如果代謝廢物具有吸引力,則迀移的微生物也可能在此聚集,從 而形成含原有菌落微生物的混合物。迀移的微生物數(shù)量增長甚至可能超過原有菌落的微生 物。
[0024] 但微生物樣本也可來源于液體培養(yǎng)菌;例如血液培養(yǎng)菌。通過離心來凈化和分離 之后,微生物樣本將通常以顆粒形式存在。在70 %以上的這種情況中,同樣不存在微生物混 合物,因為僅存在一個物種,或一個物種的增長遠遠超過所有其他微生物物種。如果兩個物 種能夠彼此相容或者甚至共生,也會存在例外情況。因此,樣本包含兩種或者甚至多種微生 物物種的可能性可達百分之十以上。
[0025] 如果分值列表中前20或30個最佳匹配項中的參考質(zhì)譜至少有兩種不同的微生物 物種,則可懷疑存在混合物。如果懷疑存在混合物,則可按照文件DE 102009007266 Al (M. Kostrzewa等著,對應(yīng)于GB 2467636 A或US-2010-0248298-A1)中所述,使用在混合物中鑒 定微生物的方法。本文已包含這些文件以供參考。文件描述了在混合物中鑒定微生物物種 的方法,以下稱為"通過組合質(zhì)譜進行混合物分析"。對于這種確定混合物中微生物物種的 方法,將生成所有可能的組合質(zhì)譜,每個組合質(zhì)譜均包含分值列表中不屬于相同微生物物 種的兩種質(zhì)譜。如果與樣本質(zhì)譜相關(guān)的一個組合質(zhì)譜的相似度分值大于所使用單獨質(zhì)譜的 相似度分值,則很有可能,但無法確定,該樣本是包含最相似組合質(zhì)譜中微生物物種的混合 物。如果在一定程度上可確定樣本為混合物,則其質(zhì)譜產(chǎn)生最佳組合的這兩種(或多種) 微生物物種可以被視作混合物的成分。
[0026] 然而,這種方法具有自我確認(rèn)的特點,這也可能更讓人認(rèn)為,較相似的組合質(zhì)譜始 終就是混合物。但也可能發(fā)生這種情況,即分值列表包含兩種微生物物種的參考質(zhì)譜,但 樣本并非混合物。近緣微生物物種有時具有十分相似的質(zhì)譜,從而使第二種微生物物種的 參考質(zhì)譜不可避免地出現(xiàn)最佳相似度的匹配。如果此時生成組合質(zhì)譜,并與樣本質(zhì)譜相比 較,則幾乎能夠肯定至少一種組合質(zhì)譜可提供更好的相似度分值,從而造成存在混合物的 假象。
[0027] 因此,以上為確定混合物成分而引用的文件DE 102009007266A1建議,應(yīng)該確定 不同類型微生物之間的關(guān)系程度。如果關(guān)系密切,則可認(rèn)為樣本不是混合物。出于上述原 因,名稱通常并不能反映關(guān)系程度,因而此時又需要經(jīng)驗豐富的專家來執(zhí)行這一任務(wù)。常規(guī) 實驗室中很難找到這種專家。在對中間結(jié)果進行目視評估時,缺乏經(jīng)驗的實驗室人員很容 易錯誤地認(rèn)為樣本為混合物。
[0028] 對于微生物的質(zhì)譜鑒定,具有,盡可能可靠地自動辨別樣本是否為微生物物種的 混合物的需求。
[0029] 在下文中使用"分值列表" 一詞時,表示參考質(zhì)譜與樣本質(zhì)譜以及相關(guān)微生物株系 和微生物物種的名稱最為相似,即使它們不是列表形式,例如只是計算機內(nèi)存中數(shù)據(jù)集合 的形式。可按照指定的相似度閾值,或按照最相似參考質(zhì)譜的指定數(shù)量,或按照相似度分值 與下個最相似參考質(zhì)譜超過指定值的差異來區(qū)分最相似參考質(zhì)譜和庫中的所有其他參考 質(zhì)譜。在分值列表中,可僅使用單一參考質(zhì)譜(例如,如果僅存在一個此微生物物種的參考 質(zhì)譜)表示微生物物種,或如果庫中確實存在10或15個此微生物物種株系的參考質(zhì)譜、并 且它們均與樣本質(zhì)譜相似,也可以用這10或15個參考質(zhì)譜來表示微生物物種。
【發(fā)明內(nèi)容】
[0030] 本發(fā)明的目的是,在微生物樣本質(zhì)譜鑒定時提供用來辨別兩個或更多個微生物物 種的混合物以及鑒定相關(guān)微生物物種的方法。
[0031] 這種鑒定混合物中微生物物種的方法被稱為"通過組合質(zhì)譜進行混合物分析",如 果分值列表包含幾個微生物物種的參考質(zhì)譜,則該方法建議首先研宄分值列表中的不同微 生物物種是否存在近緣關(guān)系。本文建議,如果分值列表中的不同微生物物種為近緣關(guān)系,則 應(yīng)認(rèn)為不存在混合物。
[0032] 這種關(guān)系通常無法從微生物的名稱推斷出。因此,該研宄需要經(jīng)驗豐富的專家,且 通常無法在常規(guī)實驗室中經(jīng)常執(zhí)行。出于這個原因,本發(fā)明的第一個實施例提出讓經(jīng)驗豐 富的專家一次性確定質(zhì)譜庫中所有參考質(zhì)譜的微生物之間的關(guān)系,并向質(zhì)譜庫中添加一個 類母體關(guān)系列表,列表含有參考質(zhì)譜的微生物物種名稱。此處,該列表被稱為"排除列表", 因為它表明不含混合物??捎脭?shù)字r描述這種關(guān)系,r = I. 0表示相同物種的近緣株系,r =0. 0表明沒有任何關(guān)系。借助該列表,用于評估質(zhì)譜的計算機程序可確定是否存在這種 近緣關(guān)系,如果存在近緣關(guān)系,則否定存在混合物。目前已發(fā)現(xiàn),該排除列表不僅能表示微 生物物種之間的關(guān)系,還能以復(fù)雜方式表示一種微生物物種的株系和其他微生物物種的株 系之間的關(guān)系。
[0033] 但是,這種方法存在一個主要缺點,即在擴展參考庫時,必須總要更新和擴展關(guān)系 列表。雖然在原則上,可以在常規(guī)實驗室中向質(zhì)譜庫添加更多參考質(zhì)譜,但是需要專家來確 保該關(guān)系列表完整。
[0034] 本發(fā)明的第二個實施例基于一項發(fā)現(xiàn),即重要因素并非分類學(xué)確定的微生物之間 的關(guān)系,而僅是其參考質(zhì)譜之間的相似程度。如果不同微生物物種的兩個株系的參考質(zhì)譜 非常相似(無論其是否存在近緣關(guān)系),假設(shè)相似度足夠高,當(dāng)存在其中一個微生物株系 時,兩個微生物株系的參考質(zhì)譜不可避免地出現(xiàn)在分值列表中。如果其中一個微生物株系 參考質(zhì)譜與樣本質(zhì)譜的相似度分值較高,則第二個微生物株系一定也有相似度相對較高的 參考質(zhì)譜。
[0035] 在分值列表中存在兩個或更多個微生物物種時,為了回答樣本是否為混合物的問 題,本發(fā)明的第二個實施例提出,研宄分值列表中的不同微生物物種參考質(zhì)譜的互相相似 度,例如利用評估程序評估分值列表本身。可使用多種數(shù)學(xué)方法完成這一步驟,但是最簡單 的方法是使用與鑒定相同的相似度計算。如果它們非常相似,相似度分值高于通過實驗確 定的相似度閾值,則不存在混合物。另一方面,如果不同微生物物種的參考質(zhì)譜互相并不相 似,則向用戶指出該樣本一定是混合物。然后可執(zhí)行上述通過組合質(zhì)譜進行混合物分析的 方法,以確定組成混合物的微生物。
[0036] 在第三個實施例中,如果分值列表中包含幾個微生物物種,則根據(jù)DE 102009007266 AUGB 2467636 A 或 US-2010-0248298-A1,總是執(zhí)行"通過組合質(zhì)譜進行混 合物分析"方法,但不斷定存在混合物。計算機程序從最相似的參考質(zhì)譜開始檢查分值列 表。當(dāng)庫中存在微生物物種幾個株系的參考質(zhì)譜時,最相似的參考質(zhì)譜通常全部屬于一個 微生物物種。如果程序發(fā)現(xiàn)第二種微生物物種,則組合質(zhì)譜由第一種微生物物種的所有參 考質(zhì)譜組成。然后研宄這些組合質(zhì)譜與樣本質(zhì)譜的相似度。相同方法可應(yīng)用于第二種微生 物物種的更多參考質(zhì)譜,還可應(yīng)用于第三種微生物物種的參考質(zhì)譜(若存在)。如果獲得 的組合質(zhì)譜與樣本質(zhì)譜的相似度高于分值列表中所有參考質(zhì)譜的相似度,則可能存在混合 物。為明確確定是否存在微生物混合物,應(yīng)檢查在所有情況下生成最相似組合的成對參考 質(zhì)譜彼此之間的相似度。如果相似度足夠低,低于通過實驗確定的閾值,則向用戶表明很有 可能存在混合物。產(chǎn)生最佳組合質(zhì)譜的參考質(zhì)譜微生物被認(rèn)為是混合物的成分。一個組合 的兩個參考質(zhì)譜的相似度甚至可以用來說明混合物存在的概率。
【專利附圖】
【附圖說明】
[0037] 圖1是第二個混合物檢測實施例的過程示意圖。
[0038] 圖2是第三個混合物檢測實施例的過程示意圖。
【具體實施方式】
[0039] 本發(fā)明提出了辯別微生物混合物的方法,該方法通過計算微生物樣本質(zhì)譜("樣本 質(zhì)譜")和參考質(zhì)譜之間的相似度指標(biāo)實現(xiàn),可用于微生物樣本的質(zhì)譜鑒定程序。這種鑒定 方法總是需要首先確定最相似的參考質(zhì)譜并將其輸入分值列表中。分值列表可能包含兩種 或多種微生物物種,它們或者構(gòu)成混合物,或者源自近緣微生物。
[0040] 本發(fā)明方法的第一個實施例,通過編制分值列表,在微生物樣本質(zhì)譜鑒定過程中 檢測微生物混合物,其特點是,如果分值列表中存在兩個或多種微生物物種,可借助排除列 表來確定微生物株系之間的關(guān)系程度??捎脭?shù)字r描述關(guān)系程度,例如,r= 1.0表示同物 種的近緣株系,:r = 0. 8表示同屬的近緣物種,r = 0. 6表示同科的近緣屬,r = 0. 0表明沒 有任何關(guān)系。如果關(guān)系程度足夠低,關(guān)系程度r低于指定值,則表明微生物樣本是微生物混 合物??蓤?zhí)行上述通過組合質(zhì)譜進行混合物分析的方法,以確定組成混合物的微生物。
[0041] 排除列表必須由專家制定。專家可將關(guān)系程度研宄范圍限制在,不同微生物物種 的不同微生物株系具有非常相似的質(zhì)譜??赏ㄟ^適當(dāng)?shù)挠嬎銠C程序?qū)Ρ人袇⒖假|(zhì)譜和所 有其他參考質(zhì)譜,自動選出這些微生物株系。然后專家僅檢查其質(zhì)譜彼此非常相似的所有 成對微生物株系的列表。
[0042] 現(xiàn)已發(fā)現(xiàn),必須考慮到一個微生物物種的各個株系與另一個微生物物種的所有株 系之間的關(guān)系,而不僅僅是各個微生物物種本身之間的關(guān)系,這會使排除列表非常復(fù)雜。例 如,大腸桿菌的一些株系與志賀氏桿菌屬的株系存在近緣關(guān)系,與大腸桿菌其他株系的相 關(guān)度卻較低。二者都屬于腸桿菌科。志賀氏桿菌可導(dǎo)致桿菌性痢疾或志賀氏菌病,但是大腸 桿菌的大多數(shù)亞種卻是腸道菌叢的有益成分;因此正確的鑒定對診斷至關(guān)重要。在這里,我 們應(yīng)該注意,當(dāng)今一些微生物學(xué)學(xué)者認(rèn)為志賀氏桿菌本身一定不是具有四個微生物物種的 屬,也不是獨立的物種,實際上只是大腸桿菌的亞種。這種觀點也得到了一項發(fā)現(xiàn)的支持, 該發(fā)現(xiàn)表明存在大腸桿菌的更多亞種,它們產(chǎn)生的毒素與志賀氏桿菌屬的四個微生物物種 相同。這個例子表明的確需要專家來確定關(guān)系和編制排除列表。這進一步表明微生物分類 學(xué)仍然處于持續(xù)變化的狀態(tài),需要進一步重新劃分。
[0043] 即使無法通過所比較的微生物物種的名稱辨別,或相對另一微生物物種株系,甚 至同一微生物物種的不同株系之間也不同,但排除列表仍可讓計算機程序確定關(guān)系程度。 但是,添加更多參考質(zhì)譜到庫中時,必須不斷更新該列表。如果參考庫的此類擴展并非由制 造商執(zhí)行,而是由沒有合適專家可用的常規(guī)實驗室執(zhí)行,則這是一個小缺點。即使巨大的參 考質(zhì)譜庫也無法涵蓋各種各樣的微生物。在常規(guī)實驗室中就能夠向庫中加入?yún)⒖假|(zhì)譜是該 質(zhì)譜鑒定方法最大優(yōu)點之一,一定要保留。
[0044] 本發(fā)明方法的第二個實施例,通過編制分值列表,在微生物樣本質(zhì)譜鑒定過程中 檢測微生物混合物,其特點是,如果分值列表中存在兩種或多種相同微生物物種,將研宄不 同微生物物種參考質(zhì)譜之間的相似度,如果相似度足夠低,低于指定的相似度閾值,則表明 微生物樣本是微生物混合物。在這里也可以利用上述組合質(zhì)譜執(zhí)行混合物分析的方法,以 確定組成混合物的微生物。
[0045] 在第二個實施例中,確定分值列表中兩種或多種微生物物種的參考質(zhì)譜之間的相 似度,而非關(guān)系程度。本發(fā)明的第二個實施例基于一項發(fā)現(xiàn),即重要因素并非分類學(xué)確定的 微生物之間的關(guān)系,而僅僅是其參考質(zhì)譜之間的相似程度。這還解決了微生物株系和其關(guān) 系的復(fù)雜問題。為了排除混合物,可指定相似度閾值,并設(shè)置參考質(zhì)譜之間的相似度。本閾 值最好通過實驗確定,例如在人工制造混合物的試驗中。通常,僅在不同微生物物種參考質(zhì) 譜之間的相似度全部低于該指定相似度閾值時才存在混合物。通過這些相似度,甚至可能 推斷出混合物存在的概率:相似度越低,混合物存在的概率越高。如果根據(jù)本發(fā)明的方法 檢測混合物,則必須利用上述"通過組合質(zhì)譜進行混合物分析"方法確定所包含的微生物物 種。
[0046] 本發(fā)明方法的第三個實施例,不僅可檢測微生物混合物,而且能夠立刻鑒定混合 物中包含的微生物。與上述示例實施例一樣,通過比較樣本質(zhì)譜和庫中所有參考質(zhì)譜之間 的相似度,在質(zhì)譜鑒定過程中編制分值列表。另一種方法包括下列步驟:
[0047] a)通過分值列表中不同微生物物種的參考質(zhì)譜形成組合質(zhì)譜;b)確定這些組合 質(zhì)譜和樣本質(zhì)譜之間的相似度;c)選擇其與樣本質(zhì)譜之間的相似度高于樣本質(zhì)譜和純參 考質(zhì)譜之間的所有相似度的組合質(zhì)譜;d)計算構(gòu)成所選最相似組合質(zhì)譜的經(jīng)組合參考質(zhì) 譜之間的相似度;e)如果經(jīng)組合的參考質(zhì)譜的相似度低于指定的相似度閾值,則表明存在 混合物;并且根據(jù)需要,f)在參考質(zhì)譜組合的相似度高于樣本質(zhì)譜的相似度時,確定混合 物的微生物。
[0048] 在這里,最好也通過實驗方法確定第三個實施例中步驟e)中指定的相似度閾值 的最佳值。
[0049] 如果在相似度最高的參考質(zhì)譜中存在幾個微生物物種,則本方法的第三個實施例 首先使用上述"通過組合質(zhì)譜進行混合物分析"的程序來辨別混合物,但不斷定存在混合 物。這聽起來可能很復(fù)雜、耗時,但并非如此。大約100個組合質(zhì)譜(通常會少很多)的組 成和相似度計算僅需幾分之一秒,與計算樣本質(zhì)譜和庫中成千上萬參考質(zhì)譜之間的相似度 相比,這個時間幾乎可以忽略不計。
[0050] 第三個混合物辨別的實施例具體執(zhí)行步驟如下:首先,通過計算樣本質(zhì)譜和參考 質(zhì)譜之間的所有相似度分值來進行鑒別,根據(jù)微生物物種和微生物株系制定最相似參考質(zhì) 譜的分值列表。分值列表不必一定在屏幕上顯示;將其儲存在計算機儲存器中足以。然后 計算機程序從相似度最高的參考質(zhì)譜開始檢查分值列表。通常,如果庫中存在微生物物種 幾個株系的參考質(zhì)譜,則列表頂部最相似的幾個參考質(zhì)譜通常全部屬于該微生物物種。如 果程序發(fā)現(xiàn)第二種微生物物種,則組合質(zhì)譜由第二種微生物物種的第一個參考質(zhì)譜和第一 個微生物物種的所有參考質(zhì)譜組成,分別研宄它們與樣本質(zhì)譜的相似度。相同方法可應(yīng)用 于第二種微生物物種的更多參考質(zhì)譜,還可應(yīng)用于第三種微生物物種的參考質(zhì)譜(若存 在)。將第三種微生物物種的參考質(zhì)譜與第一種和第二種微生物物種的所有參考質(zhì)譜相結(jié) 合。如果得到的組合質(zhì)譜與樣本質(zhì)譜的相似度高于分值列表中的最高相似度,則可能存在 混合物,但這并不是結(jié)論。若要確定是否存在混合物,需檢查組成每個最佳組合的兩個參考 質(zhì)譜之間的相似度。只有在它們低于指定的相似度閾值時,計算機程序才會向用戶表明這 很可能是混合物。根據(jù)組合的參考質(zhì)譜之間的相似度,甚至可以說明混合物存在的概率。
[0051] 因此本發(fā)明提出了讓分值列表的自動評估程序來辨別微生物混合物存在與否,該 方法確定性相對較高。
[0052] 當(dāng)然,所提出的方法能夠以多種方式改變和改進。例如,如果分值列表始終限制為 20到30個最相似的參考質(zhì)譜(通常如此),我們會非常頻繁地觀察到,前5到15個最相似 的參考質(zhì)譜全都屬于相同微生物物種的不同株系,并且(幾乎)全部都具有很高的相似度 分值,同時與下一個最相似參考質(zhì)譜的相似度分值差距很大。很明顯,在如此明確的情況 下,適合的計算機程序就能夠明確鑒定出物種,而不必一定要檢查混合物是否存在。因此, 可通過分值列表中參考質(zhì)譜的相似度分值結(jié)構(gòu)來辨別混合物是否存在。通常情況下,如果 根據(jù)相似度對參考質(zhì)譜排序,有時連續(xù)的參考質(zhì)譜之間存在較大跳躍的差異,那么便可以 忽略后續(xù)參考質(zhì)譜。另一方面,如果分值列表包含兩個或更多個不同微生物物種的參考質(zhì) 譜,并且它們與樣本質(zhì)譜的相似度都不高,則這不一定表明存在微生物物種混合物。如果不 同物種的參考質(zhì)譜彼此相似,兩種微生物物種可能與樣本的微生物物種有關(guān)系,但是庫中 不存在這種微生物物種的參考質(zhì)譜。通過確定適當(dāng)?shù)南嗨贫乳撝?,可將所有這些情況整合 到評估程序中。
【權(quán)利要求】
1. 一種通過編制庫中與樣本質(zhì)譜最相似的參考質(zhì)譜的分值列表而在微生物樣本質(zhì)譜 鑒定過程中辨別微生物混合物的方法,其中,如果分值列表中存在兩個或更多個微生物物 種,則可借助排除列表來確定微生物株系之間的關(guān)系,如果這種關(guān)系低于指定程度,則表明 該微生物樣本是微生物混合物。
2. -種通過編制庫中與樣本質(zhì)譜相似的參考質(zhì)譜的分值列表而在微生物樣本質(zhì)譜鑒 定過程中辨別微生物混合物的方法,其中,如果分值列表中存在兩個或更多個相同的微生 物物種,將研宄不同微生物物種參考質(zhì)譜之間的相似度,如果相似度低于指定相似度閾值, 則表明微生物樣本是微生物混合物。
3. 根據(jù)權(quán)利要求1或2所述的方法,其中,如果已經(jīng)確定是微生物混合物,則將使用組 合質(zhì)譜執(zhí)行混合物分析。
4. 一種通過編制庫中與樣本質(zhì)譜相似的參考質(zhì)譜的分值列表而在微生物樣本質(zhì)譜鑒 定過程中檢測并鑒定微生物混合物的方法,包括以下步驟 a) 通過分值列表中不同微生物物種的參考質(zhì)譜形成組合質(zhì)譜; b) 計算這些組合質(zhì)譜和樣本質(zhì)譜間的相似度; c) 選擇與樣本質(zhì)譜之間相似度高于樣本質(zhì)譜和純參考質(zhì)譜之間相似度的組合質(zhì)譜; d) 計算組成這些所選組合質(zhì)譜的參考質(zhì)譜間的相似度; e) 如果經(jīng)組合的參考質(zhì)譜的相似度低于指定的相似度閾值,則表明存在混合物; f) 在物種的參考質(zhì)譜組合表明與樣本質(zhì)譜的最佳相似度時,指明混合物的微生物物 種。
5. 根據(jù)權(quán)利要求2或4所述的方法,其中,將通過實驗來確定指定的相似度閾值。
6. 根據(jù)權(quán)利要求1至5任一所述的方法,其中,通過指定相似度閾值來區(qū)分分值列表的 參考質(zhì)譜和庫中其他參考質(zhì)譜。
7. 根據(jù)權(quán)利要求1至5任一所述的方法,其中,分值列表包含特定數(shù)量的最相似參考質(zhì) 譜。
8. 根據(jù)權(quán)利要求1至5任一所述的方法,其中,分值列表包含所有參考質(zhì)譜,直到參考 質(zhì)譜與下個最相似參考質(zhì)譜的相似度分值發(fā)生所指定的大幅跳躍。
【文檔編號】G01N33/68GK104520715SQ201380041038
【公開日】2015年4月15日 申請日期:2013年7月25日 優(yōu)先權(quán)日:2012年8月3日
【發(fā)明者】約亨·弗蘭岑, 斯特凡·克萊佩爾, 馬庫斯·科斯切娃, 托馬斯·邁爾 申請人:布魯克道爾頓有限公司