本發(fā)明屬于計(jì)算機(jī)視覺(jué),尤其涉及一種基于改進(jìn)swin-unet的ct圖像分割方法及系統(tǒng)。
背景技術(shù):
1、腹部器官ct圖像分割主要是為了提升疾病的診斷準(zhǔn)確性和治療的精確性。在傳統(tǒng)方法中,腹部器官ct圖像的分割通常依賴于人工標(biāo)注和經(jīng)典的圖像處理技術(shù),這些方法雖然能夠提供一定的準(zhǔn)確性,但往往存在勞動(dòng)強(qiáng)度大、時(shí)間消耗長(zhǎng)以及對(duì)醫(yī)生經(jīng)驗(yàn)依賴強(qiáng)的問(wèn)題。隨著計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)技術(shù)的發(fā)展,自動(dòng)化的圖像分割方法逐漸成為研究的熱點(diǎn)。
2、基于卷積神經(jīng)網(wǎng)絡(luò)(cnn)的方法,如u-net和其變體,已被廣泛應(yīng)用于醫(yī)療圖像分割領(lǐng)域。例如swin-unet通過(guò)自注意力機(jī)制在全局范圍內(nèi)提取特征,增強(qiáng)了模型對(duì)圖像全局信息的感知。
3、然而,swin-unet在捕捉局部細(xì)節(jié)方面不夠精細(xì),特別是在器官與周圍組織的過(guò)渡區(qū)域,邊界可能不夠明顯;此外,病變或腫瘤等異常狀態(tài)可能導(dǎo)致器官形態(tài)和密度的變化,這對(duì)分割算法提出了更高的要求。因此,swin-unet在應(yīng)對(duì)復(fù)雜局部細(xì)節(jié)和形態(tài)變化方面仍需進(jìn)一步優(yōu)化和完善。
技術(shù)實(shí)現(xiàn)思路
1、為克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供了基于改進(jìn)swin-unet的ct圖像分割方法及系統(tǒng),利用多頭自注意力機(jī)制取代傳統(tǒng)跳躍連接,通過(guò)多尺度信息融合和動(dòng)態(tài)權(quán)重分配,增強(qiáng)了網(wǎng)絡(luò)在特征傳遞過(guò)程中的表達(dá)能力,使得模型在面對(duì)邊界模型或形態(tài)不均的腹部器官時(shí)具有更好的適應(yīng)性。
2、為實(shí)現(xiàn)上述目的,本發(fā)明的一個(gè)或多個(gè)實(shí)施例提供了如下技術(shù)方案:
3、本發(fā)明第一方面提供了一種基于改進(jìn)swin-unet的ct圖像分割方法。
4、基于改進(jìn)swin-unet的ct圖像分割方法,包括:
5、獲取ct圖像數(shù)據(jù)并進(jìn)行預(yù)處理;
6、將預(yù)處理后的ct圖像數(shù)據(jù)輸入至改進(jìn)swin-unet模型中,在編碼器和解碼器每階段的下/上采樣中,使用兩個(gè)連續(xù)的移位窗口分層變壓器模塊進(jìn)行特征提取,并將編碼器和解碼器對(duì)應(yīng)層的移位窗口分層變壓器模塊的輸出采用多頭自注意力連接模塊進(jìn)行特征拼接,最終得到解碼器的輸出卷積;
7、將解碼器的輸出卷積輸入至卷積注意力模塊中,基于通道和空間注意力機(jī)制得到最終的輸出特征圖;
8、基于最終的輸出特征圖,實(shí)現(xiàn)對(duì)ct圖像的分割。
9、本發(fā)明第二方面提供了一種基于改進(jìn)swin-unet的ct圖像分割系統(tǒng)。
10、基于改進(jìn)swin-unet的ct圖像分割系統(tǒng),包括:
11、數(shù)據(jù)獲取模塊,被配置為:獲取ct圖像數(shù)據(jù)并進(jìn)行預(yù)處理;
12、編碼器和解碼器數(shù)據(jù)處理模塊,被配置為:將預(yù)處理后的ct圖像數(shù)據(jù)輸入至改進(jìn)swin-unet模型中,在編碼器和解碼器每階段的下/上采樣中,使用兩個(gè)連續(xù)的移位窗口分層變壓器模塊進(jìn)行特征提取,并將編碼器和解碼器對(duì)應(yīng)層的移位窗口分層變壓器模塊的輸出采用多頭自注意力連接模塊進(jìn)行特征拼接,最終得到解碼器的輸出卷積;
13、卷積注意力數(shù)據(jù)處理模塊,被配置為:將解碼器的輸出卷積輸入至卷積注意力模塊中,基于通道和空間注意力機(jī)制得到最終的輸出特征圖;
14、分割模塊,被配置為:基于最終的輸出特征圖,實(shí)現(xiàn)對(duì)ct圖像的分割。
15、以上一個(gè)或多個(gè)技術(shù)方案存在以下有益效果:
16、(1)傳統(tǒng)的跳躍連接通常是將編碼器中的特征圖直接復(fù)制到解碼器中,與解碼器的特征圖進(jìn)行相加。本發(fā)明利用多頭自注意力機(jī)制emsa取代傳統(tǒng)跳躍連接,emsa機(jī)制通過(guò)多尺度信息融合和動(dòng)態(tài)權(quán)重分配,增強(qiáng)了網(wǎng)絡(luò)在特征傳遞過(guò)程中的表達(dá)能力,使得模型在面對(duì)邊界模型或形態(tài)不均的腹部器官時(shí)具有更好的適應(yīng)性,從而提高了模型的分割精度和魯棒性。
17、(2)本發(fā)明集成組合注意力模塊cbam在解碼器最終輸出卷積之后,cbam模塊通過(guò)通道注意力和空間注意力機(jī)制,強(qiáng)化重要特征的表示,顯著提高了模型在腹部器官ct圖像分割任務(wù)中的精度,尤其是在邊界和細(xì)節(jié)識(shí)別方面。
18、(3)本發(fā)明腹部器官ct圖像分割模型采用對(duì)稱的雙分支編解碼結(jié)構(gòu),雙分支結(jié)構(gòu)允許模型從不同角度和深度提取腹部器官ct圖像的特征,增加了特征的多樣性和豐富性。
19、本發(fā)明附加方面的優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
1.基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,所述預(yù)處理包括隨機(jī)旋轉(zhuǎn)和翻轉(zhuǎn)操作、隨機(jī)顏色空間轉(zhuǎn)換操作、添加隨機(jī)噪聲以及圖像濾波和變換操作。
3.如權(quán)利要求1所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,使用兩個(gè)連續(xù)的移位窗口分層變壓器模塊進(jìn)行特征提取,具體包括:
4.如權(quán)利要求3所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,將編碼器和解碼器對(duì)應(yīng)層的移位窗口分層變壓器模塊的輸出采用多頭自注意力連接模塊進(jìn)行特征拼接,具體包括:
5.如權(quán)利要求4所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,所述關(guān)注函數(shù)公式具體為:
6.如權(quán)利要求1所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,將解碼器的輸出卷積輸入至卷積注意力模塊中,基于通道和空間注意力機(jī)制得到最終的輸出特征圖,具體包括:
7.如權(quán)利要求1所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,所述編碼器包括多個(gè)依次交替連接的移位窗口分層變壓器模塊和特征合并層;所述解碼器包括多個(gè)依次交替連接的分塊擴(kuò)展層和移位窗口分層變壓器模塊。
8.如權(quán)利要求7所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,所述編碼器中最后一層特征合并層與解碼器中的第一層分塊擴(kuò)展層之間通過(guò)瓶頸模塊連接,所述瓶頸模塊包括兩個(gè)依次連接的移位窗口分層變壓器模塊。
9.如權(quán)利要求1所述的基于改進(jìn)swin-unet的ct圖像分割方法,其特征在于,所述改進(jìn)swin-unet模型的總損失函數(shù)為交叉熵?fù)p失函數(shù)和戴斯損失函數(shù)之和;
10.基于改進(jìn)swin-unet的ct圖像分割系統(tǒng),其特征在于,包括: