本發(fā)明涉及細(xì)胞圖像處理技術(shù)領(lǐng)域,具體是一種基于卷積神經(jīng)網(wǎng)絡(luò)的宮頸細(xì)胞圖像識(shí)別方法。
背景技術(shù):
在我國,目前傳統(tǒng)的宮頸細(xì)胞圖像識(shí)別方法主要還是巴氏人工閱片技術(shù),巴氏人工閱片技術(shù)要靠人在鏡下觀察大量細(xì)胞圖像,工作強(qiáng)度大,而且極易使人感到疲勞,識(shí)別的準(zhǔn)確率和識(shí)別效率低下。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的不足,而提供一種基于卷積神經(jīng)網(wǎng)絡(luò)的宮頸細(xì)胞圖像識(shí)別方法。
這種方法自動(dòng)化程度高、自適應(yīng)能力強(qiáng),不但能提高宮頸細(xì)胞圖像識(shí)別的效率,而且也能提高宮頸細(xì)胞圖像識(shí)別的準(zhǔn)確率。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案是:
一種基于卷積神經(jīng)網(wǎng)絡(luò)的宮頸細(xì)胞圖像識(shí)別方法,包括如下步驟:
1)準(zhǔn)備訓(xùn)練樣本:
(1-1)讀入現(xiàn)有圖庫中的宮頸細(xì)胞圖像作為訓(xùn)練樣本并分類:將讀入的所有的宮頸細(xì)胞圖像分為正常宮頸細(xì)胞訓(xùn)練樣本和病變宮頸細(xì)胞訓(xùn)練樣本;
(1-2)灰度化:將宮頸細(xì)胞圖像預(yù)處理為灰度圖像塊,并將宮頸細(xì)胞圖像中的彩色圖片轉(zhuǎn)化為灰度圖像,然后把得到的灰度圖像尺寸歸一化為32*32的灰度圖像塊;
2)構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)層:構(gòu)建一個(gè)具有自適應(yīng)識(shí)別分類功能的包括加入BN算法的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)為一個(gè)多層的神經(jīng)網(wǎng)絡(luò),通過可訓(xùn)練的卷積核作為濾波器,對(duì)圖像進(jìn)行逐層濾波,并將每一層濾波結(jié)果進(jìn)行自動(dòng)組合,最終自動(dòng)提取出對(duì)分類最有利的特征,提取完特征之后,從所有特征參數(shù)中根據(jù)分類類別不同,進(jìn)行參數(shù)分類,之后對(duì)不同類別之間的特征參數(shù)進(jìn)行組和合訓(xùn)練和識(shí)別,并根據(jù)識(shí)別結(jié)果的不同,調(diào)整訓(xùn)練特征向量,當(dāng)根據(jù)本次特征參數(shù)組合獲得的識(shí)別結(jié)果小于之前的識(shí)別結(jié)果時(shí),則根據(jù)現(xiàn)有的特征向量,添加或刪除相應(yīng)的特征參數(shù),以期再次識(shí)別時(shí)獲得更高的識(shí)別率;
提取宮頸細(xì)胞的特征包括形態(tài)、色度、光密度、紋理特征等,其中形態(tài)特征包括細(xì)胞(核)面積、周長(zhǎng)、高度、寬度、圓形度、矩形度、伸長(zhǎng)度等,色度特征包括細(xì)胞核(質(zhì))在RGB顏色分量上的均值、方差和色度變化系數(shù)等,光密度特征包括細(xì)胞核(質(zhì))的積分光密度、平均光密度、光密度系數(shù)等,紋理特征使用Haralick兩特征和Tamura的兩種特征,共四種紋理特征;
改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)可以將圖像數(shù)據(jù)直接作為網(wǎng)絡(luò)輸入變量,經(jīng)網(wǎng)絡(luò)處理之后產(chǎn)生作為結(jié)果的分類號(hào),實(shí)現(xiàn)端到端的處理,減少或避免圖像預(yù)處理和人工特征抽取等復(fù)雜過程;
(3)構(gòu)建二分類器:將步驟1)得到的正常宮頸細(xì)胞訓(xùn)練樣本和病變宮頸細(xì)胞訓(xùn)練樣本輸入改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)被訓(xùn)練為能夠識(shí)別正常宮頸細(xì)胞和病變宮頸細(xì)胞的二分類器;
(4)得到識(shí)別結(jié)果:將待測(cè)試的宮頸細(xì)胞圖片輸入改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)進(jìn)行識(shí)別、歸類。
所述加入BN算法的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)為在經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中加入了批歸一化算法,即在每一個(gè)卷積層與下采樣層之后都連接一個(gè)BN層,在下采樣S2之后連接3個(gè)全連接層,全連接層后同樣各自接入相應(yīng)BN層,最后一層全連接層使用sigmoid激活函數(shù),直接輸出圖像。
所述批歸一化算法,即BN算法為:
BN層和卷積層,下采樣層和全連接層一樣,也是網(wǎng)絡(luò)中的一層結(jié)構(gòu),是一個(gè)歸一化的過程,進(jìn)行標(biāo)準(zhǔn)化維度:
式(1)把上一層的輸出轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)正態(tài)分布,訓(xùn)練過程中采用mini-batch隨機(jī)梯度下降,E[x(k)]指每一批訓(xùn)練數(shù)據(jù)神經(jīng)元x(k)的期望值,為x(k)激活值的標(biāo)準(zhǔn)差,同時(shí)為防止影響每一層學(xué)習(xí)到的特征,引入變換重構(gòu),加入可學(xué)習(xí)參數(shù)γ和β:
式(2)把轉(zhuǎn)變?yōu)檎龖B(tài)分布的特征在一定程度上還原回去,讓它保持它的初始分布趨勢(shì),還原程度則是由卷積神經(jīng)網(wǎng)絡(luò)自己學(xué)習(xí)得來,設(shè)置可以恢復(fù)原始激活值,即恢復(fù)出原始某層學(xué)到的特征,γ和β的引入可以讓卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)恢復(fù)出原始網(wǎng)絡(luò)要學(xué)習(xí)的特征分布,Batch Normalization前向傳導(dǎo)公式為:
式(3)是一批mini-batch中所有樣本里的每個(gè)樣本在同一神經(jīng)元上的輸入均值,式(4)為一批mini-batch中所有樣本里的每個(gè)樣本在同一神經(jīng)元上的輸入方差,式(5)是把這批mini-batch中所有樣本里的每個(gè)樣本在同一神經(jīng)元上的輸入進(jìn)行標(biāo)準(zhǔn)化后得到的結(jié)果,式(6)為同構(gòu)變換。
這種方法自動(dòng)化程度高、自適應(yīng)能力強(qiáng),不但能提高宮頸細(xì)胞圖像識(shí)別的效率,而且也能提高宮頸細(xì)胞圖像識(shí)別的準(zhǔn)確率。
附圖說明
圖1是C3層特征圖組合;
圖2為實(shí)施例改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖;
圖3為實(shí)施例的方法流程示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明內(nèi)容做進(jìn)一步的闡述,但不是對(duì)本發(fā)明的限定。
實(shí)施例:
參照?qǐng)D3,一種基于卷積神經(jīng)網(wǎng)絡(luò)的宮頸細(xì)胞圖像識(shí)別方法,包括如下步驟:
1)準(zhǔn)備訓(xùn)練樣本:
(1-1)讀入現(xiàn)有圖庫中的宮頸細(xì)胞圖像作為訓(xùn)練樣本并分類:將讀入的所有的宮頸細(xì)胞圖像分為正常宮頸細(xì)胞訓(xùn)練樣本和病變宮頸細(xì)胞訓(xùn)練樣本;
(1-2)灰度化:將宮頸細(xì)胞圖像預(yù)處理為灰度圖像塊,并將宮頸細(xì)胞圖像中的彩色圖片轉(zhuǎn)化為灰度圖像,然后把得到的灰度圖像尺寸歸一化為32*32的灰度圖像塊;
2)構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)層:構(gòu)建一個(gè)具有自適應(yīng)識(shí)別分類功能的包括加入BN算法的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)為一個(gè)多層的神經(jīng)網(wǎng)絡(luò),通過可訓(xùn)練的卷積核作為濾波器,對(duì)圖像進(jìn)行逐層濾波,并將每一層濾波結(jié)果進(jìn)行自動(dòng)組合,最終自動(dòng)提取出對(duì)分類最有利的特征,提取完特征之后,從所有特征參數(shù)中根據(jù)分類類別不同,進(jìn)行參數(shù)分類,之后對(duì)不同類別之間的特征參數(shù)進(jìn)行組和合訓(xùn)練和識(shí)別,并根據(jù)識(shí)別結(jié)果的不同,調(diào)整訓(xùn)練特征向量,當(dāng)根據(jù)本次特征參數(shù)組合獲得的識(shí)別結(jié)果小于之前的識(shí)別結(jié)果時(shí),則根據(jù)現(xiàn)有的特征向量,添加或刪除相應(yīng)的特征參數(shù),以期再次識(shí)別時(shí)獲得更高的識(shí)別率;
如圖2所示,本實(shí)施例中采用的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)多層的神經(jīng)網(wǎng)絡(luò),改進(jìn)加入BN層,在每一個(gè)卷積層與下采樣層之后都連接一個(gè)BN層,在下采樣S2之后連接3個(gè)全連接層,全連接層后同樣各接入相應(yīng)BN層。卷積神經(jīng)網(wǎng)絡(luò)是專為二維圖像而設(shè)計(jì)的拓?fù)浣Y(jié)構(gòu),最重要的特點(diǎn)是特征提取與模式分類同時(shí)進(jìn)行,優(yōu)于淺層機(jī)器學(xué)習(xí)算法的模式分類要額外提取圖像特征。此外,卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值共享減少了網(wǎng)絡(luò)的訓(xùn)練參數(shù),再加上其多次特征提取,使其具有很強(qiáng)的魯棒性;
如圖2所示的11層卷積神經(jīng)網(wǎng)絡(luò),包括兩個(gè)卷積層,即特征提取層,兩個(gè)下采樣層,即特征映射層,四個(gè)BN層和三個(gè)全連層,前兩次卷積層即C層后都緊跟著一個(gè)BN層,然后接一層用來求局部加權(quán)平均的下采樣層即S層作為二次特征提取,這種特有的兩次特征提取相結(jié)合的結(jié)構(gòu)使網(wǎng)絡(luò)在模式分類時(shí)對(duì)輸入圖片具有一定的容忍噪聲的能力,即表現(xiàn)為網(wǎng)絡(luò)的魯棒性;
卷積神經(jīng)網(wǎng)絡(luò)的輸入層是32*32的灰度圖,卷積層C1有6張?zhí)卣鲌D,下采樣層S2有6張?zhí)卣鲌D,卷積層C3由S2層的6張?zhí)卣鲌D經(jīng)卷積后組合得到16張?zhí)卣鲌D,組合方式如圖1所示,下采樣層S4有16張?zhí)卣鲌D,全連接層C5設(shè)置84個(gè)節(jié)點(diǎn),全連接層F6設(shè)置120個(gè)節(jié)點(diǎn),輸出層設(shè)置兩個(gè)節(jié)點(diǎn);
C1層經(jīng)過5*5的卷積模板卷積后,6個(gè)特征圖的大小均為28*28,特征圖中每個(gè)神經(jīng)元與輸入中5*5的卷積模板相連,每個(gè)濾波器5*5共25個(gè)元參數(shù)和一個(gè)偏置參數(shù),共6個(gè)濾波器,一共(5*5+1)*6=156個(gè)可訓(xùn)練參數(shù),總共156*(28*28)=122304個(gè)連接;S2層經(jīng)下采樣后得到6個(gè)14*14的特征圖,特征圖中的每個(gè)單元與C1中對(duì)應(yīng)特征圖的2*2領(lǐng)域連接,S2層每個(gè)單元的4個(gè)輸入相加,乘以一個(gè)可訓(xùn)練參數(shù),再加一個(gè)可訓(xùn)練偏置,下采樣的作用為模糊圖像,使用2*2次采樣模板時(shí)不重疊,因?yàn)镾2中每個(gè)特征圖的大小是14*14,一共(2*2+1)*(14*14)=5880個(gè)連接;C3層有5*5*60+16=1516個(gè)可訓(xùn)練參數(shù);
提取宮頸細(xì)胞的特征包括形態(tài)、色度、光密度、紋理特征等,其中形態(tài)特征包括細(xì)胞(核)面積、周長(zhǎng)、高度、寬度、圓形度、矩形度、伸長(zhǎng)度等,色度特征包括細(xì)胞核(質(zhì))在RGB顏色分量上的均值、方差和色度變化系數(shù)等,光密度特征包括細(xì)胞核(質(zhì))的積分光密度、平均光密度、光密度系數(shù)等,紋理特征使用Haralick兩特征和Tamura的兩種特征,共四種紋理特征;
改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)可以將圖像數(shù)據(jù)直接作為網(wǎng)絡(luò)輸入變量,經(jīng)網(wǎng)絡(luò)處理之后產(chǎn)生作為結(jié)果的分類號(hào),實(shí)現(xiàn)端到端的處理,減少或避免圖像預(yù)處理和人工特征抽取等復(fù)雜過程;
(3)構(gòu)建二分類器:將步驟1)得到的正常宮頸細(xì)胞訓(xùn)練樣本和病變宮頸細(xì)胞訓(xùn)練樣本輸入改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)被訓(xùn)練為能夠識(shí)別正常宮頸細(xì)胞和病變宮頸細(xì)胞的二分類器,具體為:用一些不同的小隨機(jī)數(shù)初始化網(wǎng)絡(luò)中待訓(xùn)練參數(shù),向如圖2的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)輸入N1個(gè)訓(xùn)練樣本來訓(xùn)練改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),每個(gè)樣本包括輸入向量,理想輸出向量,輸入向量經(jīng)過層層變換,傳送到輸出層,得到實(shí)際輸出向量;
使用交叉熵?fù)p失函數(shù),結(jié)合反向傳播BP算法調(diào)整改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)參數(shù),利用均方誤差的反向傳播,完成訓(xùn)練;
(4)得到識(shí)別結(jié)果:將待測(cè)試的宮頸細(xì)胞圖片輸入改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)進(jìn)行識(shí)別、歸類。
所述加入BN算法的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)為在經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中加入了批歸一化算法,即在每一個(gè)卷積層與下采樣層之后都連接一個(gè)BN層,在下采樣S2之后連接3個(gè)全連接層,全連接層后同樣各自接入相應(yīng)BN層,最后一層全連接層使用sigmoid激活函數(shù),直接輸出圖像。
所述批歸一化算法,即BN算法為:
BN層和卷積層,下采樣層和全連接層一樣,也是網(wǎng)絡(luò)中的一層結(jié)構(gòu),是一個(gè)歸一化的過程,進(jìn)行標(biāo)準(zhǔn)化維度:
式(1)把上一層的輸出轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)正態(tài)分布,訓(xùn)練過程中采用mini-batch隨機(jī)梯度下降,E[x(k)]指每一批訓(xùn)練數(shù)據(jù)神經(jīng)元x(k)的期望值為x(k)激活值的標(biāo)準(zhǔn)差,同時(shí)為防止影響每一層學(xué)習(xí)到的特征,引入變換重構(gòu),加入可學(xué)習(xí)參數(shù)γ和β:
式(2)把轉(zhuǎn)變?yōu)檎龖B(tài)分布的特征在一定程度上還原回去,讓它保持它的初始分布趨勢(shì),還原程度則是由卷積神經(jīng)網(wǎng)絡(luò)自己學(xué)習(xí)得來,設(shè)置可以恢復(fù)原始激活值,即恢復(fù)出原始某層學(xué)到的特征,γ和β的引入可以讓卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)恢復(fù)出原始網(wǎng)絡(luò)要學(xué)習(xí)的特征分布,Batch Normalization前向傳導(dǎo)公式為:
式(3)是一批mini-batch中所有樣本里的每個(gè)樣本在同一神經(jīng)元上的輸入均值,式(4)為一批mini-batch中所有樣本里的每個(gè)樣本在同一神經(jīng)元上的輸入方差,式(5)是把這批mini-batch中所有樣本里的每個(gè)樣本在同一神經(jīng)元上的輸入進(jìn)行標(biāo)準(zhǔn)化后得到的結(jié)果,式(6)為同構(gòu)變換。