專利名稱:基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法
技術領域:
本發(fā)明涉及的是一種分析方法,具體地說是一種基于人體舌相對衛(wèi)氣營血證候進行計算機分析的方法。
背景技術:
衛(wèi)氣營血辨證,是外感溫熱病的辨證綱領,也是外感溫熱病證候分類的一種方法。是清代葉桂在《內經》的理論指導下,總結前人及自己的經驗而創(chuàng)立的一種辨證方法,他把溫病的產生、發(fā)展、演變過程,劃分為衛(wèi)分、氣分、營分和血分四個階段,用來說明溫病證候淺深輕重和傳變規(guī)律。一般來說,衛(wèi)氣營血辨證中,邪在衛(wèi)分、氣分者病情輕淺;邪入營分、血分者,病情深重。溫病的傳變有順傳和逆?zhèn)鲀煞N,由衛(wèi)分到氣分,進而發(fā)展到營分、血分者,為順傳。衛(wèi)分證直接陷入營分證者,為逆?zhèn)鳌S捎跍夭〔∏閺碗s多變,衛(wèi)、氣、營、血四個階段并非截然分開。因此,在臨床上往往有不同階段的證候相互交織錯雜的表現(xiàn),如衛(wèi)氣同病、氣血兩燔等等。臟腑經絡是衛(wèi)氣營血辨證的物質基礎。衛(wèi)分證病變多涉及肺衛(wèi)皮毛,氣分證病變多影響胸膈、肺腸、脾胃、膽等臟腑組織,營分證候多關系到心與心包絡,血分證病變多耗損肝腎陰血。
但是目前對衛(wèi)氣營血證候的分析判別還是靠中醫(yī)醫(yī)師的經驗進行的,具有一定的隨意性,難以達到準確、可靠的目的。特別是這種人工分析判別的方式,不可能作為一種通用的檢測方法被廣泛推廣應用。
Boosting由Freund和Schapire于1990年提出,是提高預測學習系統(tǒng)預測能力的有效工具之一,也是組合學習中最具代表性的方法,它試圖提供一種提升任意學習算法精度的普遍方法。
在Valiant的PAC模型中,若存在一個多項式級的學習算法以識別一組概念,且識別的正確率很高,那么這組概念是強學習的;如果學習算法識別一組概念的正確率僅比隨機猜測略好,那么這組概念是弱學習的。
Kearns和Valiant提出了弱學習算法與強學習算法的等價問題在PAC模型中一個“弱”學習器是否能被“提升”為一個具有任意精度的“強”學習算法如果兩者等價,那么在學習概念時,只要找到一個比隨機猜測略好的學習算法,就可以將其提升為強學習算法,而不必直接去找通常情況下很難獲得的強學習算法。
Boosting方法的主要思想是給定一弱學習算法和一訓練集(X1,Y1),(X2,Y2),…,(Xn,Yn,這里Xi為第i個訓練樣本的輸入,Yi為分類問題的類別標志。算法開始先給每一個訓練樣本賦以相等的權值1/n,然后用該學習算法對訓練集訓練T輪,每次訓練后,對訓練失敗的訓練樣本賦以較大的權值,也就是讓學習算法在后續(xù)的學習中集中對比較難的訓練樣本進行學習,從而得到一個預測函數(shù)序列h1,h2,…,hn,其中hi也有一定的權值,預測效果好的預測函數(shù)的權值較大,反之較小。最終的預測函數(shù)H采用有權值的投票方式對新樣本進行判別。Boosting算法的偽代碼如下所示(1)輸入(X1,Y1),(X2,Y2),…,(Xn,Yn)
初始化D1( )=1/n(2)For t=1,…,T①在Dt下訓練,得到預測函數(shù)ht②計算該預測函數(shù)的錯誤率Et=∑Dt( )[(ht,Xt≠Yt]選擇αt=1/2 ln((1-Ft)/Ft)③根據(jù)錯誤率更新樣本的權重當ht(Xt)≠Yt時Dt+1( )=Dt( )*exp(αt)當ht(Xt)=Yt時Dt+1( )=Dt( )*exp(-αt)并調整飾的權重和為1(3)輸出H(X)=sign(∑αht(X))。
發(fā)明內容本發(fā)明的目的在于提供一種自動化程度高、快速準確、具有廣泛的應用價值的基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法。
本發(fā)明的目的是這樣實現(xiàn)的從舌象庫中提取子圖像,將各子圖像進行預處理后進行特征提取,將提取的特征送入分類器進行分類,經融合后輸出。
本發(fā)明還可以包括1、所述的分類器是Boosting投票表決分類器,判別厚苔還是薄苔,其分類為If舌苔厚紋理塊數(shù)量>舌苔薄紋理塊數(shù)量then厚苔If舌苔厚紋理塊數(shù)量<舌苔薄紋理塊數(shù)量then薄苔Else無法判斷。
2、所述的分類器還包括樹狀分類器,判斷出黑苔、黃苔、白苔或灰苔,其分類為輸入舌圖像Img的4維苔色特征向量為black、gray、white、yellow,分別代表黑、灰、白和黃,則苔色判斷算法如下(1)若black>gray & black>white & black>yellow,則判斷為黑苔;否則,(2)若yellow>gray & yellow>white & yellow>black,則判斷為黃苔;否則,(3)若white>gray & white>yellow & white>black,則判斷為白苔;否則,(4)判斷為灰苔。
3、所述的分類器還包括樹狀分類器,首先使用樹狀分類器將舌色分成青;藍、淡白、紫、淡紫、淡紅;紅、絳3個大類;然后,將8維舌色特征向量作為輸入,使用線性分類器對每個大類進行最終的分析,判斷出紅、淡紅、絳、紫、淡紫、藍、青和淡白,輸入舌圖像Img的8維舌色特征向量為red、lightred、darkred、purple、lightpurple、blue、green、lightwhite,分別代表紅、淡紅、絳、紫、淡紫、藍、青和淡白,則舌色判斷如下
(1)使用樹狀分類器,將舌圖像Img分類為青;紅、絳;淡紅、淡紫、紫、藍、淡白3個大類,其中,輸入向量是由8維舌色特征向量進行對應維合并后的3維特征向量;(2)對于“紅、絳”類,將8維舌色特征向量作為輸入,使用事先訓練好的2類線性分類器進行分類,判斷為紅或絳;(3)對于“淡紅、淡紫、紫、藍、淡白”類,若blue>(lightpurple*150%)且通過線性分類器判斷為藍,則作為藍,否則,計算舌圖像Img的RGB平均值向量(r,g,b)和舌圖像Img亮度值L>150的像素比例值ratio,若ratio>0.7627& g>=148.5且通過線性分類器判斷為淡白,則作為淡白,否則,將8維舌色特征向量作為輸入,使用事先訓練好的3類線性分類器進行分類,判斷為淡紅、淡紫或紫。
本發(fā)明的優(yōu)點在于根據(jù)不同的衛(wèi)氣營血證候的特點,運用不同的診斷模型,對所處理的證候和疾病進行分析,實驗在較大的樣本集上進行,診斷結果也較令人滿意。采用本發(fā)明的方法,可以實現(xiàn)各種衛(wèi)氣營血證候分析的計算機化,消除人為分析對結果的影響,達到快速準確的目的。具有廣泛的實用價值。
圖1是系統(tǒng)結構圖;圖2是舌圖像顏色分類算法的總體框架圖;圖3是淡白舌G分量分布;圖4是淡白舌中亮度大于150的像素比例分布。
具體實施方式
下面舉例對本發(fā)明做更詳細地描述1、基于boosting的證候診斷建模以中醫(yī)八綱辯證為例,圖1給出由基于Boosting投票表決分類器所導出辯證模型的部分表述。
If舌苔厚紋理塊數(shù)量>舌苔薄紋理塊數(shù)量then厚苔If舌苔厚紋理塊數(shù)量<舌苔薄紋理塊數(shù)量then薄苔Else無法判斷。
2、基于樹狀分類器的證候診斷模型我們將舌圖像顏色分類為4種苔色(黑、灰、白、黃)和8種舌色(紅、淡紅、紫、淡紫、絳、藍、青、淡白)。根據(jù)前面的分類結果,我們已經可以得到每一張舌圖像在這些顏色下的像素面積百分比。下面,將利用這12個值組成的12維顏色比例特征向量來設計舌圖像顏色的分類算法。
將這12維特征向量分成一個4維的苔色特征向量和8維的舌色特征向量,分別設計苔色和舌色的分類算法。大概的思路如下所述(1)由于舌圖像上苔色情況簡單,使用樹狀分類器可以實現(xiàn)對苔色的分類。
(2)針對舌圖像上舌色情況的復雜性,我們的想法是首先,使用樹狀分類器進行粗分類,將舌色分成3個大類(青;藍、淡白、紫、淡紫、淡紅;紅、絳);然后,針對某些顏色(如淡白、藍)的特殊性質,加入有益的限制條件,以提高分類的準確性;最后,將8維舌色特征向量作為輸入,使用線性分類器對每個大類進行最終的細分類。圖2給出了舌圖像顏色分類算法的框架圖。選擇舌色提取次序的原則易分離的顏色先進行提取,以免影響后面的顏色類別。
苔色判斷算法設輸入舌圖像Img的4維苔色特征向量為(black,gray,white,yellow)(分別代表黑、灰、白和黃),則苔色判斷算法如下所述(樹狀分類器)(1)若black>gray & black>white & black>yellow,則判斷為黑苔;否則,(2)若yellow>gray & yellow>white & yellow>black,則判斷為黃苔;否則,(3)若white>gray & white>yellow & white>black,則判斷為白苔;否則,(4)判斷為灰苔。
舌色判斷算法設輸入舌圖像Img的8維舌色特征向量為(red,lightred,darkred,purple,lightpurple,blue,green,lightwhite)(分別代表紅、淡紅、絳、紫、淡紫、藍、青和淡白),則舌色判斷算法如下所述(1)使用樹狀分類器,將舌圖像Img分類為3個大類(青;紅、絳;淡紅、淡紫、紫、藍、淡白)中的一類。其中,輸入向量是由8維舌色特征向量進行對應維合并后的3維特征向量;(2)對于“紅、絳”類。將8維舌色特征向量作為輸入,使用事先訓練好的2類線性分類器進行分類,判斷為紅或絳;(3)對于“淡紅、淡紫、紫、藍、淡白”類。若blue>(lightpurple*150%)且通過線性分類器判斷為藍,則作為藍(分析見后文);否則,計算舌圖像Img的RGB平均值向量(r,g,b)和舌圖像Img亮度值L>150的像素比例值ratio,若ratio>0.7627 & g>=148.5且通過線性分類器判斷為淡白,則作為淡白(分析見后文);否則,將8維舌色特征向量作為輸入,使用事先訓練好的3類線性分類器進行分類,判斷為淡紅、淡紫或紫。
上述算法中使用了一些經驗值以及經驗公式,下面將進行必要的分析與解釋。這些經驗值與經驗公式均來自對日常實驗結果的分析。
對于藍舌色的判斷依據(jù)圖5-3是5張較典型藍舌圖像在舌色苔色上的比例分布圖。如圖所示,在第5,6(分別是淡紫和藍分量)處具有較明顯的分布規(guī)律,可以得到如下的經驗公式藍>淡紫*150%。實驗表明,該經驗公式取得了不錯的效果。
對于淡白舌色的判斷依據(jù)經過仔細觀察,可以發(fā)現(xiàn),淡白舌圖像在亮度上較其他舌圖像更高,且亮度大的像素相對較多。根據(jù)這些分析,我們作出了RGB下G分量均值以及亮度值>150的像素比例Ratio的分布圖,如圖3、4所示。由圖可以得到經驗閾值及其限制公式Ratio>0.7627 & G>=148.5。實驗結果也證明了該方法的有效性。
衛(wèi)氣營血根據(jù)分析與判斷,該舌象樣本舌苔薄,苔色薄白(或薄黃),舌質淡紅(或淡紫),為衛(wèi)分證。
根據(jù)分析與判斷,該舌象樣本舌苔厚,苔色黃,舌質紅,為氣分證。
根據(jù)分析與判斷,該舌象樣本舌質絳,為營分證。
根據(jù)分析與判斷,該舌象樣本舌質絳紫,為血分證。
權利要求
1.一種基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法,其特征是從舌象庫中提取子圖像,將各子圖像進行預處理后進行特征提取,將提取的特征送入分類器進行分類,經融合后輸出。
2.根據(jù)權利要求1所述的基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法,其特征是所述的分類器是Boosting投票表決分類器,判別厚苔還是薄苔,其分類為If舌苔厚紋理塊數(shù)量>舌苔薄紋理塊數(shù)量then厚苔If舌苔厚紋理塊數(shù)量<舌苔薄紋理塊數(shù)量then薄苔Else無法判斷。
3.根據(jù)權利要求1所述的基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法,其特征是所述的分類器還包括樹狀分類器,判斷出黑苔、黃苔、白苔或灰苔,其分類為輸入舌圖像Img的4維苔色特征向量為black、gray、white、yellow,分別代表黑、灰、白和黃,則苔色判斷算法如下(1)若black>gray & black>white & black>yellow,則判斷為黑苔;否則,(2)若yellow>gray & yellow>white & yellow>black,則判斷為黃苔;否則,(3)若white>gray & white>yellow & white>black,則判斷為白苔;否則,(4)判斷為灰苔。
4.根據(jù)權利要求3所述的基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法,其特征是所述的分類器還包括樹狀分類器,首先使用樹狀分類器將舌色分成青;藍、淡白、紫、淡紫、淡紅;紅、絳3個大類;然后,將8維舌色特征向量作為輸入,使用線性分類器對每個大類進行最終的分析,判斷出紅、淡紅、絳、紫、淡紫、藍、青和淡白,輸入舌圖像Img的8維舌色特征向量為red、lightred、darkred、purple、lightpurple、blue、green、lightwhite,分別代表紅、淡紅、絳、紫、淡紫、藍、青和淡白,則舌色判斷如下(1)使用樹狀分類器,將舌圖像Img分類為青;紅、絳;淡紅、淡紫、紫、藍、淡白3個大類,其中,輸入向量是由8維舌色特征向量進行對應維合并后的3維特征向量;(2)對于“紅、絳”類,將8維舌色特征向量作為輸入,使用事先訓練好的2類線性分類器進行分類,判斷為紅或絳;(3)對于“淡紅、淡紫、紫、藍、淡白”類,若blue>(lightpurple*150%)且通過線性分類器判斷為藍,則作為藍,否則,計算舌圖像Img的RGB平均值向量(r,g,b)和舌圖像Img亮度值L>150的像素比例值ratio,若ratio>0.7627& g>=148.5且通過線性分類器判斷為淡白,則作為淡白,否則,將8維舌色特征向量作為輸入,使用事先訓練好的3類線性分類器進行分類,判斷為淡紅、淡紫或紫。
全文摘要
本發(fā)明提供的是一種基于舌象的中醫(yī)衛(wèi)氣營血證候計算機分類方法。從舌象庫中提取子圖像,將各子圖像進行預處理后進行特征提取,將提取的特征送入分類器進行分類,經融合后輸出。本發(fā)明的優(yōu)點在于根據(jù)不同的衛(wèi)氣營血證候的特點,運用不同的診斷模型,對所處理的證候和疾病進行分析,實驗在較大的樣本集上進行,診斷結果也較令人滿意。采用本發(fā)明的方法,可以實現(xiàn)各種衛(wèi)氣營血證候分析的計算機化,消除人為分析對結果的影響,達到快速準確的目的。具有廣泛的實用價值。
文檔編號G06Q50/00GK1973759SQ20061015087
公開日2007年6月6日 申請日期2006年10月11日 優(yōu)先權日2006年10月11日
發(fā)明者張大鵬, 李乃民, 王寬全, 黃勃, 張宏志 申請人:哈爾濱工業(yè)大學