本發(fā)明涉及生物技術(shù)領(lǐng)域中通過(guò)高通量測(cè)序?qū)ξ⑸锶郝涠康姆椒?,尤其是菌群含量眾多的?fù)雜微生物群落,通過(guò)高通量測(cè)序手段快速處理數(shù)據(jù)得到窖泥微生物群落中乳酸桿菌(lactobacillus)的相對(duì)含量,并把該相對(duì)含量數(shù)值作為判斷窖泥質(zhì)量好壞的依據(jù)的方法。
背景技術(shù):
中國(guó)傳統(tǒng)的白酒釀造歷史淵源留長(zhǎng),操作工藝復(fù)雜,最終產(chǎn)出的白酒質(zhì)量受到發(fā)酵工藝、釀酒微生物群落的共同影響。在釀酒原材料和發(fā)酵工藝操作條件一樣的情況下,作為釀酒核心動(dòng)力的釀酒微生物群落顯得尤為重要。與釀酒相關(guān)的微生物來(lái)源,包括大曲、窖泥、酒醅和釀酒過(guò)程中來(lái)自于水、空氣中的微生物。在釀酒工藝中,整個(gè)廠區(qū)的大曲統(tǒng)一生產(chǎn),統(tǒng)一隨著釀酒原材料糧食統(tǒng)一混勻進(jìn)行生產(chǎn),然后統(tǒng)一分運(yùn)到不同窖池進(jìn)行發(fā)酵,因而客觀來(lái)說(shuō),大曲的質(zhì)量不會(huì)對(duì)不同窖池之間的發(fā)酵質(zhì)量差異產(chǎn)生很大影響。其次,在同一廠區(qū)的小范圍內(nèi),水質(zhì)和環(huán)境變化不大,即使有所差異也不是人為可以調(diào)控的。而酒醅微生物群落實(shí)際上是由大曲和經(jīng)過(guò)蒸餾前處理后的原材料混合后得到,在發(fā)酵過(guò)程中酒醅微生物群落與窖泥微生物群落之間存在互動(dòng),經(jīng)過(guò)2-3個(gè)月的發(fā)酵形成最終發(fā)酵成熟的酒醅,最終對(duì)成熟酒醅經(jīng)過(guò)蒸餾才產(chǎn)生了不同質(zhì)量的酒。因此,酒醅微生物群落在發(fā)酵過(guò)程中不斷變化,而且受到窖泥微生物群落的影響。
申請(qǐng)人通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),排除發(fā)酵過(guò)程中人為操作的失誤,濃香型白酒[gb/t10781.1-2006]優(yōu)質(zhì)窖池與普通窖池的發(fā)酵完成后的酒醅微生物群落差異很小,而優(yōu)質(zhì)窖池和普通窖池的窖泥微生物群落卻相差很大,尤其是其中的乳酸桿菌(lactobacillus)的含量差異尤其大,因而窖泥中的單獨(dú)乳酸桿菌這個(gè)屬的含量就可以作為鑒定窖泥質(zhì)量的依據(jù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種用于判斷濃香型白酒窖泥質(zhì)量的方法,本發(fā)明通過(guò)高通量測(cè)序測(cè)定窖泥中微生物群落組成并根據(jù)測(cè)序結(jié)果計(jì)算菌群中的乳酸桿菌的含量相對(duì)于原核菌群總數(shù)的比例,進(jìn)而判斷濃香型白酒窖泥質(zhì)量。
本發(fā)明實(shí)現(xiàn)目的的技術(shù)方案如下:
一種通過(guò)窖泥微生物群落中乳酸桿菌的含量判斷窖泥質(zhì)量的方法,該方法包括以下幾步:
⑴濃香型白酒窖泥樣本宏基因組的提??;
⑵窖泥樣本宏基因組16srdna高通量測(cè)序;通過(guò)一系列程序?qū)颖局械?6srdna序列進(jìn)行高通量測(cè)序:利用通用引物pcr擴(kuò)增16srdna序列;pcr產(chǎn)物上高通量測(cè)序平臺(tái)進(jìn)行測(cè)序;
⑶測(cè)序序列的優(yōu)化,去除兼并堿基多的序列,偏短序列以及嵌合體序列;
⑷序列信息的注釋:對(duì)優(yōu)化所得的序列使用97%的相似度進(jìn)行劃分otu,選取各otu中含量最多的序列為該otu的代表序列,然后對(duì)各otu使用數(shù)據(jù)庫(kù)進(jìn)行序列信息的注釋;
序列信息的注釋是指首先對(duì)所有16srdna序列進(jìn)行聚類,根據(jù)各序列之間的相似度劃分otu,隨機(jī)抽取一個(gè)序列默認(rèn)為第一個(gè)otu,下一個(gè)序列如果與該序列相似度≥97%,即表示該序列同屬于第一個(gè)otu,如果相似度<97%則作為下一個(gè)otu的序列,依次類推;選取出現(xiàn)次數(shù)最多的那條序列作為該otu的代表序列;然后使用優(yōu)化的數(shù)據(jù)庫(kù)對(duì)各otu代表序列進(jìn)行注釋,根據(jù)注釋的信息,就可以知道該16srdna序列的來(lái)源菌的門,綱,目,科,屬,甚至到種的信息;
⑸在屬的層級(jí)上統(tǒng)計(jì)出各otu中注釋到乳酸桿菌lactobacillus的序列總數(shù)占樣本總菌群測(cè)序數(shù)量的比例;
根據(jù)步驟⑸的注釋信息,就知道樣本中有哪些otu的注釋信息為乳酸桿菌,又知道每個(gè)otu含有多少條序列,就可以統(tǒng)計(jì)出總共多少條序列注釋到乳酸桿菌,然后用注釋到乳酸桿菌的總數(shù)除以該樣本測(cè)序所得優(yōu)化后的16srdna序列總數(shù),即得到乳酸桿菌的比例;
⑹根據(jù)⑸中所得到的乳酸桿菌的比例大小判斷樣本來(lái)源的窖泥質(zhì)量為優(yōu)質(zhì)窖泥還是普通窖泥;其中,乳酸桿菌的含量百分比<10%即為優(yōu)質(zhì)窖泥;如果含量百分比>20%,即為普通窖泥。
而且,所述16srdna序列為某個(gè)可變區(qū)區(qū),或者全長(zhǎng)。
而且,所述高通量測(cè)序序列優(yōu)化處理,去掉序列長(zhǎng)度明顯低于目標(biāo)序列長(zhǎng)度的序列,去掉兼并堿基數(shù)量太多的序列,去掉嵌合體序列。
而且,優(yōu)化的數(shù)據(jù)庫(kù)包括rdp,silva,greengenes。
本發(fā)明的優(yōu)點(diǎn)和有益效果是:
1、窖泥樣本中微生物種類繁多復(fù)雜,研究功能微生物群落的功能需要首先了解其基本的微生物組成,以及重點(diǎn)的探究其中幾種核心功能微生物的含量。本發(fā)明正是對(duì)窖泥微生物群落分析中的質(zhì)量判斷問(wèn)題提出一套解決方案,得以實(shí)現(xiàn)對(duì)窖泥質(zhì)量的判斷。
2、本發(fā)明的實(shí)施需要進(jìn)行16srdna可變區(qū)高通量測(cè)序,現(xiàn)在測(cè)序成本已經(jīng)很低,而且將來(lái)會(huì)越來(lái)越低,本發(fā)明的實(shí)用性隨著測(cè)序的容易程度提高會(huì)越來(lái)越廣泛。
附圖說(shuō)明
圖1為實(shí)施例1中窖泥取樣的“九點(diǎn)取樣法”。
圖2為實(shí)施例中計(jì)算的各樣本中乳酸桿菌的含量百分比。
具體實(shí)施方式
以下為在某濃香型白酒生產(chǎn)廠區(qū)內(nèi)采取12個(gè)窖泥樣本,并通過(guò)高通量測(cè)序的方法判斷其中乳酸桿菌(lactobacillus)含量百分比,并根據(jù)該百分比判定窖泥樣本質(zhì)量的優(yōu)劣。本專利以此為例對(duì)本發(fā)明做詳述,但不限于實(shí)施例。
一種用于判斷濃香型白酒發(fā)酵窖泥質(zhì)量的方法,包括以下步驟:
⑴窖泥樣本中的全基因組提取及其16srdna高通量測(cè)序;
首先使用合適的土壤基因組提取試劑盒提取待測(cè)窖泥樣本中的宏基因組(天然微生物群落中往往含有成百上千種不同的微生物,它們的基因組混合在一起的基因組樣本稱之為宏基因組)。以宏基因組為模板,使用16srdna通用引物(本專利要求測(cè)序任何一個(gè)16srdna的可變區(qū)的通用引物都可以,擴(kuò)增目標(biāo)序列越長(zhǎng)越好)進(jìn)行擴(kuò)增(退火58℃,35個(gè)循環(huán)以內(nèi)),然后將pcr產(chǎn)物加接頭(接頭與選擇的高通量測(cè)序的方式有關(guān)),進(jìn)行高通量測(cè)序。
將通過(guò)高通量測(cè)序得到并進(jìn)行比對(duì)優(yōu)化,刪掉太短的序列(小于目標(biāo)測(cè)定序列長(zhǎng)度的80%)(可能來(lái)自于斷裂的pcr產(chǎn)物片段),刪掉兼并堿基太多的序列,查詢其中的嵌合體序列(比如使用decipher網(wǎng)站http://decipher.cee.wisc.edu/findchimeras.html查詢),刪掉嵌合體序列。
⑵高通量測(cè)序序列的分析及注釋;
將⑴中優(yōu)化得到的所有的核糖體rrna基因序列進(jìn)行聚類,根據(jù)各序列之間的97%的相似度劃分otu,隨機(jī)抽取一個(gè)序列默認(rèn)為第一個(gè)otu,下一個(gè)序列如果與該序列相似度≥97%,即表示該序列同屬于第一個(gè)otu,如果相似度<97%則作為下一個(gè)otu的序列,依次類推;每個(gè)otu中選擇出現(xiàn)次數(shù)最多的那條序列作為該otu的代表序列。使用數(shù)據(jù)庫(kù)(rdp,silva,greengenes等.各個(gè)數(shù)據(jù)庫(kù)網(wǎng)站如下:rdp[rdp.cme.msu.edu],greengenes[greengenes.secondgenome.com],silva[http://www.arb-silva.de])對(duì)每個(gè)otu進(jìn)行注釋,對(duì)序列注釋到門,綱,目,科,屬,甚至到種。不過(guò)受16srdna序列的保守性影響,很可能絕大多數(shù)序列只能注釋到屬及以下分類等級(jí)。上述幾個(gè)數(shù)據(jù)庫(kù)因?yàn)闅v史的原因,所收集的核糖體rrna基因序列在數(shù)量上和質(zhì)量上都有所不同,一般在遇到注釋困難或有歧義的序列時(shí)需要同時(shí)使用幾個(gè)數(shù)據(jù)庫(kù)以便得到最佳結(jié)果。
⑶16srdna高通量測(cè)序中乳酸桿菌(lactobacillus)的代表性序列(使用第四個(gè)可變區(qū)的通用引物520f和802r擴(kuò)增得到):
agcgcaggcggaaagataagtcagatgtgaaagccctcggcttaaccgaggaatagcatcggaaactgtctttcttgagtgcagaagaggagagtggaactccatgtgtagcggtggaatgcgtagatatatggaagaacaccagtggcgaaggcggctctctggtctgtaactgacgctgaggctcgaaagcatgggtagcgaacaggattagataccctagta
⑷窖泥樣本中乳酸桿菌(lactobacillus)的含量百分比計(jì)算;
根據(jù)⑵注釋信息,就可以知道樣本中有哪些otu的注釋信息為乳酸桿菌,又根據(jù)每個(gè)otu中的序列數(shù),統(tǒng)計(jì)出樣本中注釋到乳酸桿菌的序列總數(shù),然后用注釋到乳酸桿菌的總數(shù)除以該樣本測(cè)序所得優(yōu)化后的16srdna序列總數(shù),即得到乳酸桿菌的比例。
⑸窖泥質(zhì)量的判斷;
根據(jù)⑶中得到的比例判斷窖泥質(zhì)量的優(yōu)劣。如果樣本中乳酸桿菌的含量百分比<10%即為優(yōu)質(zhì)窖泥;如果含量百分比>20%,即為普通窖泥;如果含量百分比居于兩者中間則表示窖泥為中間狀態(tài)。
實(shí)施例1
窖泥樣本中的全基因組提取及其16srdna高通量測(cè)序:
⑴取樣。在某釀酒公司廠區(qū)范圍內(nèi)選取12個(gè)窖池按照?qǐng)D1的九點(diǎn)取樣法進(jìn)行取樣。每個(gè)位點(diǎn)取大小為2cm×2cm×2cm的窖泥,然后將9塊窖泥混合均勻后的窖泥塊作為該窖泥的一個(gè)樣本。
⑵基因組提取。根據(jù)試劑盒要求,稱取窖泥樣本樣品200毫克,采用solarbio土壤基因組試劑盒或上海生工ezup柱式土壤基因組抽提試劑盒方法提取基因組,最后洗脫體積為100μl?;蚪M模板樣品(10-50ng/ul)-80℃冷藏備用。剩余窖泥樣本可以塑料袋密封在-80℃冰箱保存1-2年。
⑶高通量測(cè)序。以⑵中所提取的基因組為模板進(jìn)行16srdna擴(kuò)增,其擴(kuò)增引物為16srdna通用引物(16srdna可變區(qū)的通用引物都可以,比如:16srdna全長(zhǎng)序列的引物為27f5’-agagtttgatcctggctcag-3’和1492r5’-ggttaccttgttacgactt-3’;第四可變區(qū)v4區(qū)的引物為:520f5’-gcacctaaytgggydtaaagng-3’和802r5’-tacnvgggtatctaatcc-3’),然后對(duì)16srdna的pcr擴(kuò)增產(chǎn)物進(jìn)行純化,然后上高通量測(cè)序平臺(tái)完成測(cè)序。(此步一般委托擁有大型高通量測(cè)序平臺(tái)的生物技術(shù)公司完成)
實(shí)施例2
高通量測(cè)序序列的分析及注釋
⑴高通量測(cè)序序列的優(yōu)化。經(jīng)過(guò)高通量測(cè)序得到的序列不能直接進(jìn)行數(shù)據(jù)分析,需要去接頭,刪掉長(zhǎng)度太長(zhǎng)(大于目標(biāo)測(cè)定序列長(zhǎng)度的110%)(可能是非目標(biāo)擴(kuò)增產(chǎn)物)或者太短(小于目標(biāo)測(cè)定序列長(zhǎng)度的80%)(可能來(lái)自于斷裂的pcr產(chǎn)物片段)的序列,刪掉兼并堿基數(shù)量超過(guò)2%的序列(測(cè)序質(zhì)量不高的序列),刪掉嵌合體序列(以斷裂的pcr產(chǎn)物為引物擴(kuò)增形成的嵌合體序列,可以使用查詢工具確定哪些序列是嵌合體,比如可以使用mothur軟件中的uchime,或者通過(guò)decipher網(wǎng)站http://decipher.cee.wisc.edu/findchimeras.html查詢)。
⑵優(yōu)化后的序列進(jìn)行注釋。將⑴中優(yōu)化得到的所有的核糖體rrna基因序列進(jìn)行97%相似度(uclust)聚類劃分otu,其原則為隨機(jī)抽取一個(gè)序列默認(rèn)為第一個(gè)otu,下一個(gè)序列如果與該序列相似度≥97%,即表示該序列同屬于第一個(gè)otu,如果相似度<97%則作為下一個(gè)otu的序列,依次類推;每個(gè)otu中選擇出現(xiàn)次數(shù)最多的那條序列作為該otu的代表序列。使用數(shù)據(jù)庫(kù)(rdp,silva,greengenes等)對(duì)每個(gè)otu進(jìn)行注釋,對(duì)序列注釋到門,綱,目,科,屬,甚至到種。
實(shí)施例3
窖泥樣本中乳酸桿菌(lactobacillus)的含量百分比計(jì)算
根據(jù)高通量測(cè)序中得到的注釋信息,統(tǒng)計(jì)出樣本所有注釋為乳酸桿菌(lactobacillus)的otu,把所有這些otu的序列累加,統(tǒng)計(jì)出樣本中注釋到乳酸桿菌的序列總數(shù),然后用注釋到乳酸桿菌的總數(shù)除以該樣本測(cè)序所得優(yōu)化后的16srdna序列總數(shù),即得到乳酸桿菌的比例。如圖2所示為各樣本中乳酸桿菌的含量百分比。從圖來(lái)看,乳酸桿菌含量大的超過(guò)60%,低的接近2%,差異非常大。
實(shí)施例4
窖泥樣本中乳酸桿菌(lactobacillus)的含量百分比計(jì)算
通過(guò)實(shí)際大量窖池的質(zhì)量數(shù)據(jù)建立本專利判定優(yōu)劣窖泥的標(biāo)準(zhǔn):乳酸桿菌的含量百分比<10%即為優(yōu)質(zhì)窖泥;如果含量百分比>20%,即為普通窖泥;如果含量百分比居于兩者中間則表示窖泥為中間狀態(tài)。結(jié)合圖2的示例窖池信息可以判斷:na2~nb2五個(gè)窖泥樣本為優(yōu)質(zhì)窖泥;除去nc3之外的五個(gè)nc窖泥樣本為普通窖泥;窖泥樣本na1和nc3的質(zhì)量介于好與差之間。
sequencelisting
<110>哈爾濱工業(yè)大學(xué)(威海)
安徽瑞思威爾科技有限公司
<120>一種判斷濃香型白酒窖泥質(zhì)量的方法
<130>2017-04-07
<160>3
<170>patentinversion3.3
<210>1
<211>225
<212>dna
<213>16srdna高通量測(cè)序中乳酸桿菌(lactobacillus)的代表性序列
<400>1
agcgcaggcggaaagataagtcagatgtgaaagccctcggcttaaccgaggaatagcatc60
ggaaactgtctttcttgagtgcagaagaggagagtggaactccatgtgtagcggtggaat120
gcgtagatatatggaagaacaccagtggcgaaggcggctctctggtctgtaactgacgct180
gaggctcgaaagcatgggtagcgaacaggattagataccctagta225
<210>2
<211>20
<212>dna
<213>引物為27f
<400>2
agagtttgatcctggctcag20
<210>3
<211>19
<212>dna
<213>1492r
<400>3
ggttaccttgttacgactt19