本發(fā)明涉及巖石領(lǐng)域,具體是一種基于先驗(yàn)貝葉斯級(jí)聯(lián)森林的頁巖巖性識(shí)別方法。
背景技術(shù):
1、陸相頁巖儲(chǔ)層具有巖性種類多樣、縱向巖性變化頻繁、儲(chǔ)層非均質(zhì)性強(qiáng)的特點(diǎn),準(zhǔn)確識(shí)別頁巖巖性對(duì)于頁巖儲(chǔ)層評(píng)價(jià)和開發(fā)具有重要意義。實(shí)驗(yàn)室?guī)r心分析是最準(zhǔn)確的巖性識(shí)別方法,掃描電鏡、x射線衍射全巖礦物分析(xrd)都是實(shí)驗(yàn)室識(shí)別巖性的手段,巖性鑒定等實(shí)驗(yàn)室?guī)r性識(shí)別方法雖然準(zhǔn)確性高,但是成本高昂且獲取困難,難以全地層應(yīng)用,因此測(cè)井巖性識(shí)別開始嶄露頭角。在測(cè)井巖性識(shí)別領(lǐng)域,交會(huì)圖法是用于識(shí)別巖性的經(jīng)典方法,但是識(shí)別效果不理想;引入機(jī)器學(xué)習(xí)算法之后,人們提出了基于人工神經(jīng)網(wǎng)絡(luò)的識(shí)別模型,bp神經(jīng)網(wǎng)絡(luò)模型等不同方法來識(shí)別頁巖巖性或巖性,但是由于井?dāng)?shù)據(jù)分類時(shí)的類不平衡問題,準(zhǔn)確性較低,最終的識(shí)別效果還有待提高。
2、綜上,現(xiàn)有的頁巖巖性識(shí)別方法中,鮮有存在成本較低、準(zhǔn)確性高的方法,需要改進(jìn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于先驗(yàn)貝葉斯級(jí)聯(lián)森林的頁巖巖性識(shí)別方法,以解決上述背景技術(shù)中提出的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于先驗(yàn)貝葉斯級(jí)聯(lián)森林的頁巖巖性識(shí)別方法,包括以下步驟:
4、步驟1,首先建立陸相頁巖的礦物預(yù)訓(xùn)練模型數(shù)據(jù)集,然后將數(shù)據(jù)集中的測(cè)井?dāng)?shù)據(jù)作為特征,礦物數(shù)據(jù)作為標(biāo)簽,使用貝葉斯極端梯度提升回歸器進(jìn)行訓(xùn)練,并保存礦物預(yù)訓(xùn)練模型;
5、步驟2,建立陸相頁巖的巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集,并使用自適應(yīng)多目標(biāo)群體融合方法對(duì)巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集進(jìn)行重采樣;
6、步驟3,以重采樣后的巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集為基礎(chǔ),使用貝葉斯極端梯度提升分類器進(jìn)行訓(xùn)練生成巖性預(yù)測(cè)模型,之后將待識(shí)別的數(shù)據(jù)輸入礦物預(yù)訓(xùn)練模型生成礦物特征,隨后輸入預(yù)測(cè)模型得到最終的巖性預(yù)測(cè)結(jié)果。
7、作為本發(fā)明再進(jìn)一步的方案:步驟1包括:
8、步驟11,建立包含測(cè)井?dāng)?shù)據(jù)和礦物數(shù)據(jù)的陸相頁巖礦物預(yù)訓(xùn)練模型數(shù)據(jù)集;其中測(cè)井?dāng)?shù)據(jù)為不同陸相頁巖巖石樣本的測(cè)井?dāng)?shù)據(jù),礦物數(shù)據(jù)為xrd礦物數(shù)據(jù);
9、步驟12,將不同陸相頁巖巖石樣本的測(cè)井?dāng)?shù)據(jù)作為特征,xrd礦物數(shù)據(jù)作為標(biāo)簽,使用貝葉斯極端梯度提升回歸器進(jìn)行訓(xùn)練得到礦物預(yù)訓(xùn)練模型并保存。
10、作為本發(fā)明再進(jìn)一步的方案:步驟11中,xrd礦物數(shù)據(jù)包括礦物的質(zhì)量含量,礦物包括石英、鉀長石、斜長石、方解石、鐵白云石、白云石、菱鐵礦、黃鐵礦、粘土,不同陸相頁巖巖石樣本的測(cè)井?dāng)?shù)據(jù)包括聲波時(shí)差(ac)、中子測(cè)井(cnl)、密度測(cè)井(den)、自然伽馬測(cè)井(gr)、體積光電截面吸收指數(shù)(pe)、深側(cè)向電阻率(rlld)。
11、作為本發(fā)明再進(jìn)一步的方案:步驟12中,通過貝葉斯極端梯度提升回歸器,使用貝葉斯優(yōu)化尋參過程后的極端梯度提升方法,來應(yīng)對(duì)陸相頁巖的復(fù)雜性;
12、極端梯度提升(xgboost)的目標(biāo)函數(shù)為:
13、(1);
14、其中,為損失函數(shù),為總節(jié)點(diǎn)值,為當(dāng)前節(jié)點(diǎn)值,為樣本數(shù),為迭代次數(shù),為第次迭代預(yù)測(cè)值的一階導(dǎo),為第次迭代預(yù)測(cè)值的二階導(dǎo),表示決策樹中第個(gè)節(jié)點(diǎn)值,為葉子節(jié)點(diǎn)處的樣本集,為葉節(jié)點(diǎn)個(gè)數(shù),和為用于控制樹復(fù)雜度的剪枝參數(shù);
15、由于極端梯度提升(xgboost)存在目標(biāo)評(píng)價(jià)指標(biāo)的最大化過程,因此需要用貝葉斯優(yōu)化極端梯度提升(xgboost)尋找最優(yōu)學(xué)習(xí)器參數(shù)的過程,
16、(2);
17、其中表示參數(shù)向量,pa表示參數(shù)向量的集合;
18、在確定優(yōu)化方向時(shí),使用預(yù)期改進(jìn)方法(expected?improvement)作為采集方程(acquisition?function),即:
19、(3);
20、其中表示模型指標(biāo),表示模型指標(biāo)閾值,表示在參數(shù)向量下,模型指標(biāo)提升的程度,代表根據(jù)已有調(diào)參歷史的概率分布模型;
21、在這時(shí),下一個(gè)搜索的參數(shù)向量為
22、
23、在這過程中,指標(biāo)閾值通過高斯過程回歸實(shí)現(xiàn);至此,將礦物預(yù)訓(xùn)練數(shù)據(jù)集投入貝葉斯極端梯度提升回歸器進(jìn)行訓(xùn)練即可得到礦物預(yù)訓(xùn)練模型。
24、作為本發(fā)明再進(jìn)一步的方案:步驟2包括:
25、步驟21,建立包含巖性信息和測(cè)井?dāng)?shù)據(jù)的陸相頁巖的巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集;
26、步驟22,使用自適應(yīng)多目標(biāo)群體融合方法對(duì)訓(xùn)練集進(jìn)行重采樣,自適應(yīng)多目標(biāo)群體融合方法(amsco)構(gòu)建兩個(gè)子組,其中一個(gè)子組通過群實(shí)例選擇(sis)來優(yōu)化多數(shù)類,另一個(gè)通過合成少數(shù)類實(shí)例的過采樣技術(shù)(osmote)來優(yōu)化少數(shù)類;過采樣技術(shù)(osmote)通過將生成的樣本插入數(shù)據(jù)空間中的任何或k個(gè)少數(shù)類最近鄰的線段(k也稱為kappa值),并通過粒子群優(yōu)化(pso)進(jìn)行優(yōu)化,在粒子的優(yōu)化過程中,需要滿足三個(gè)更新標(biāo)準(zhǔn):新粒子的準(zhǔn)確性和kappa值都要優(yōu)于現(xiàn)有粒子;新粒子的當(dāng)前kappa閾值必須優(yōu)于舊粒子的kappa值。
27、作為本發(fā)明再進(jìn)一步的方案:步驟21中,陸相頁巖的巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集包含不同陸相頁巖巖石樣本的巖性信息和測(cè)井?dāng)?shù)據(jù),不同陸相頁巖巖石樣本的巖性信息來源于巖石樣本的薄片鑒定結(jié)果;不同陸相頁巖巖石樣本的測(cè)井?dāng)?shù)據(jù)包括聲波時(shí)差(ac)、中子測(cè)井(cnl)、密度測(cè)井(den)、自然伽馬測(cè)井(gr)、體積光電截面吸收指數(shù)(pe)、深側(cè)向電阻率(rlld)。
28、作為本發(fā)明再進(jìn)一步的方案:步驟22中,新粒子的準(zhǔn)確性和kappa值都要優(yōu)于現(xiàn)有粒子可替換為新粒子的準(zhǔn)確性和kappa值中的一個(gè)優(yōu)于現(xiàn)有粒子。
29、作為本發(fā)明再進(jìn)一步的方案:步驟3包括:
30、步驟31,將重采樣后的巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集投入步驟1所得的礦物預(yù)訓(xùn)練模型中,生成新的陸相頁巖礦物結(jié)果;之后,將重采樣后的巖性預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)集中的測(cè)井?dāng)?shù)據(jù)和新生成的礦物結(jié)果作為特征,巖性作為標(biāo)簽,再次使用貝葉斯極端梯度提升分類器進(jìn)行訓(xùn)練,生成巖性預(yù)測(cè)模型;
31、步驟32,將待識(shí)別的數(shù)據(jù)輸入步驟1所得的陸相頁巖礦物預(yù)訓(xùn)練模型生成新的礦物結(jié)果,隨后將新的礦物結(jié)果和待識(shí)別的測(cè)井?dāng)?shù)據(jù)輸入巖性預(yù)測(cè)模型,即可得到最終的巖性預(yù)測(cè)結(jié)果。
32、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明考慮了測(cè)井?dāng)?shù)據(jù)的類不平衡問題,使用自適應(yīng)多目標(biāo)群體融合(amsco)對(duì)數(shù)據(jù)集進(jìn)行重采樣,使用x射線衍射全巖礦物分析(xrd)數(shù)據(jù),借助貝葉斯梯度提升回歸器進(jìn)行了特征生成,然后使用貝葉斯梯度提升分類器進(jìn)行頁巖巖性識(shí)別,在準(zhǔn)確性高的情況下成本低,為頁巖巖性識(shí)別提供了可靠方案;
33、本發(fā)明中礦物預(yù)訓(xùn)練模型將離散的實(shí)驗(yàn)室礦物含量測(cè)量數(shù)據(jù)與連續(xù)的井中數(shù)據(jù)通過貝葉斯極端梯度提升方法建立映射,這種關(guān)聯(lián)為井中數(shù)據(jù)增添了新的維度,形成了連續(xù)的井中礦物含量數(shù)據(jù),增加了數(shù)據(jù)集的信息;
34、本發(fā)明使用的貝葉斯極端梯度提升是基于梯度提升框架的樹集成算法,其使用決策樹作為弱學(xué)習(xí)器,與神經(jīng)網(wǎng)絡(luò)等其他機(jī)器學(xué)習(xí)方法相比,結(jié)構(gòu)更加簡單,模型的可解釋性更強(qiáng);
35、本發(fā)明使用的貝葉斯極端梯度提升方法,用基于殘差學(xué)習(xí)思想的梯度提升框架搭配先驗(yàn)約束后驗(yàn)的貝葉斯優(yōu)化理論,具有自適應(yīng)調(diào)整超參數(shù)的特點(diǎn),更加易于應(yīng)用,可在固定時(shí)間成本內(nèi)達(dá)到最優(yōu)化效果;
36、本發(fā)明使用自適應(yīng)多目標(biāo)群體融合可以自適應(yīng)的改善陸相頁巖井中數(shù)據(jù)的不平衡問題,提高頁巖巖性識(shí)別的精度。