本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,特別涉及基于毫米波雷達決策樹分類的電力線檢測方法及系統(tǒng)。
背景技術(shù):
超高壓輸電線路一直擔(dān)負著我國電力傳輸?shù)闹厝?,針對輸電線路巡檢管理是有效保證輸配電線路及其設(shè)備安全的一項基礎(chǔ)工作。為了滿足日常巡檢的需求,無人機巡檢作為一種常規(guī)巡檢模式被引入到巡檢任務(wù)中。但是受到地形、天氣情況的諸多因素影響,無人機可能出現(xiàn)圖像數(shù)據(jù)無法傳回至地面站的情況,使地面操控人員失去對無人機的有效控制,從而造成無人機撞線的危險,進而造成安全事故。為了保證巡檢安全,提高巡檢效率需要無人機可以實時的識別出電力線的位置并判斷出與無人機的距離,從而避免撞線事故的發(fā)生。
電力線檢測技術(shù)在國內(nèi)外進行了許多研究,通過使用可見光、激光和紅外傳感器等設(shè)備采集電力線數(shù)據(jù),然后進行后期處理實現(xiàn)電力線的識別。
中國發(fā)明專利CN103761521A基于高清分辨率遙感圖像,通過圖像預(yù)處理、邊緣提取和聚類分析等操作實現(xiàn)了電力線的識別。但是此方法是基于衛(wèi)星拍攝的遙感圖像進行分析處理,不適用于無人機巡檢任務(wù)。
中國發(fā)明專利CN104866840A利用LiDAR設(shè)備獲取輸電線路的三維點云信息,通過點云數(shù)據(jù)建模等一些列操作提取出輸電線路電力線部件。但是LiDAR設(shè)備通常體積、重量較大而無人機通常載荷有限,無法將LiDAR裝配到普通無人機上進行數(shù)據(jù)采集,而且采集到的LiDAR要通過專門的軟件進行數(shù)據(jù)解析,處理耗時較長,無法滿足巡檢過程中實時識別、檢測電力線的要求。
中國發(fā)明專利CN 101625723A實現(xiàn)了基于可見光圖像的電力線實時提取技術(shù),但由于輸電線路處于野外環(huán)境背景復(fù)雜,而且受光照、拍攝角度等因素的影響造成電力線在圖像中不顯著,從而造成檢測效率的下降。
技術(shù)實現(xiàn)要素:
為了克服上述缺點,本發(fā)明提供了一種基于毫米波雷達決策樹分類的電力線檢測方法及系統(tǒng),它具有可以實時、有效的檢測出電力線目標(biāo),而且具有很低的虛警概率的優(yōu)點。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
基于毫米波雷達決策樹分類的電力線檢測方法,包括如下步驟:
步驟(1):獲取電力線的雷達圖像;
步驟(2):坐標(biāo)變換:利用坐標(biāo)轉(zhuǎn)換方法將電力線的雷達圖像由極坐標(biāo)系轉(zhuǎn)化到平面直角坐標(biāo)系中;
步驟(3):圖像分塊處理:以圖像中距離為標(biāo)準(zhǔn),設(shè)定閾值,按設(shè)定閾值對圖像進行分塊;
步驟(4):利用Hough變換檢測圖像分塊中存在的直線段;得到形成候選直線段集合;
步驟(5):利用決策樹分類模型對候選直線段集合中的直線段進行分類,從而檢測出電力線的位置。
所述電力線的雷達圖像是利用無人機搭載的毫米波雷達掃描輸電線路區(qū)域獲取的。
所述步驟(1)的步驟包括:
獲取到場景中各物體的方位角;
雷達圖像經(jīng)過傅里葉變換(FFT)后,從頻譜中獲取場景中物體與雷達之間的距離,距離與方位角組合形成方位-距離二維圖像。
所述步驟(2)的步驟包括:利用坐標(biāo)轉(zhuǎn)換的方法對方位-距離二維圖像進行坐標(biāo)轉(zhuǎn)換,由極坐標(biāo)系轉(zhuǎn)化到平面直角坐標(biāo)系,將方位-距離二維圖像中每個方位的斜距變?yōu)榇怪本嚯x,使電力線和類似電力線的線性目標(biāo)在圖像中表現(xiàn)為直線段。
所述步驟(3)的步驟包括:
步驟(3-1):獲取距離直方圖:將采集到的雷達圖像上所有點與發(fā)射源之間的距離整數(shù)化,獲取雷達圖像上所有點的距離直方圖;
步驟(3-2):計算分塊閾值:將距離直方圖等分成若干個分塊,并求每塊的距離均值,將距離均值作為雷達圖像分塊的分割閾值;按分割閾值對雷達圖像進行分塊;
步驟(3-3):如果圖像塊無法完整地顯示電力線,把相鄰的圖像塊進行疊加。
所述步驟(3-3)的疊加,是以分塊大小為基礎(chǔ),把相鄰的圖像塊按照重疊圖像塊的設(shè)定比例進行疊加。設(shè)定比例可以是十分之一。
所述步驟(5)的步驟包括:
步驟(5-1):對候選直線段集合中的直線段進行特征提取得到測試集;
步驟(5-2):構(gòu)造決策樹分類模型,利用訓(xùn)練集對決策樹分類模型進行訓(xùn)練,得到訓(xùn)練好的決策樹分類模型;
步驟(5-3):利用訓(xùn)練好的決策樹分類模型對測試集的特征進行分類處理,確定電力線的位置。
所述步驟(5-2)在訓(xùn)練過程中矯正節(jié)點屬性,引入交叉驗證策略,最終得到?jīng)Q策樹分類模型。
所述步驟(5-2)的訓(xùn)練集包含的特征的屬性和類別與測試集中的是一樣的。
所述步驟(5-2)的步驟包括:
步驟(5-2-1):尋找初始分裂,整個訓(xùn)練集作為產(chǎn)生決策樹的集合,訓(xùn)練集每個記錄必須是已經(jīng)分好類的,依據(jù)信息增益決定作為目前分類指標(biāo)的屬性域(Field)。信息增益越小表示該信息增益所對應(yīng)的屬性域作為分類指標(biāo)越好。
步驟(5-2-2):窮舉所有的屬性域,通過計算每個屬性域分裂的多樣性(Diversity)指標(biāo)來對每個屬性域分裂的好壞做出量化,依據(jù)決策樹分類訓(xùn)練集合的信息增益值來計算出最好的一個分裂屬性,信息增益越大說明該屬性的分類效果越好;
步驟(5-2-3):返回步驟(5-2-1),直至每個葉節(jié)點內(nèi)的記錄都屬于同一類且增長到一棵完整的樹。
所述信息熵的計算方法為:
其中,pi是S中屬于類別i的比例,Entropy(S)表示對于類別個數(shù)為C的情況,樣本集S相對于C分類的信息熵。
信息增益是屬性分類訓(xùn)練數(shù)據(jù)的能力的度量標(biāo)準(zhǔn),一個屬性的信息增益就是由于使用這個屬性分割樣例而導(dǎo)致的期望熵降低。由于不同的分支節(jié)點所包含的樣本數(shù)不同,給分支節(jié)點賦予權(quán)重即樣本數(shù)越多的分支節(jié)點的影響越大。
所述信息增益被定義為:
其中,Value(A)是屬性A的所有可能值的集合,Sv是樣本S中屬性A的值為v的子集(即,Sv={s∈S|A(s)=v})。計算每個屬性的信息增益,并選取具有最高信息增益的屬性作為給定集合S的測試屬性,創(chuàng)建一個節(jié)點。
以該屬性為分類標(biāo)準(zhǔn),劃分樣本集合。
在分類過程中每一步劃分都是局部最優(yōu)的,從而建立一棵分類樹。
所述步驟(5-1)的步驟包括:
為了在雷達圖像中檢出電力線路,提取具備10維度屬性的特征向量來表征電力線。
記候選直線段上的數(shù)據(jù)為v=(v(1),v(2),...,v(n)),n為候選直線段上的點數(shù),v(i)為候選直線段上第i個數(shù)據(jù)點的強度;
設(shè)x為10維的特征向量,其分量分別為x=(x(1),x(2),...,x(10));
分量分別取自時域、頻域和自相關(guān)曲線;
第一組時域特征分量由數(shù)據(jù)點的基本統(tǒng)計特征值確定,依次表示數(shù)據(jù)v的均值mean(v),最大值max(v),方差var(v),標(biāo)準(zhǔn)差std(v)。
x(1)=mean(v);
x(2)=max(v);
x(3)=var(v);
x(4)=std(v);
接下來的一組頻域特征分量由數(shù)據(jù)點頻譜的特點確定,V表示對v做2048點的離散傅里葉變換(DFT);x(5)是直流分量,x(6)是低頻分量,x(7)是高頻分量,x(8)是平均功率。
x(5)=V(1);
最后一組自相關(guān)特征分量取自時域信號的自相關(guān)序列,x(9)為序列v的自相關(guān)函數(shù)的中位數(shù),x(10)為序列v的自相關(guān)函數(shù)的均值。
基于毫米波雷達決策樹分類的電力線檢測系統(tǒng),包括:
圖像獲取模塊:獲取電力線的雷達圖像;
坐標(biāo)變換模塊:利用坐標(biāo)轉(zhuǎn)換方法將電力線的雷達圖像由極坐標(biāo)系轉(zhuǎn)化到平面直角坐標(biāo)系中;
圖像分塊處理模塊:以圖像中距離為標(biāo)準(zhǔn),設(shè)定閾值,按設(shè)定閾值對圖像進行分塊;
直線段檢測模塊:利用Hough變換檢測圖像分塊中存在的直線段;得到形成候選直線段集合;
分類模塊:利用決策樹分類模型對候選直線段集合中的直線段進行分類,從而檢測出電力線的位置。
所述電力線的雷達圖像是利用無人機搭載的毫米波雷達掃描輸電線路區(qū)域獲取的。
所述圖像獲取模塊包括:
方位角獲取單元:獲取到場景中各物體的方位角;
傅里葉變換單元:雷達圖像經(jīng)過傅里葉變換(FFT)后,從頻譜中獲取場景中物體與雷達之間的距離,距離與方位角組合形成方位-距離二維圖像。
所述坐標(biāo)變換模塊:利用坐標(biāo)轉(zhuǎn)換的方法對方位-距離二維圖像進行坐標(biāo)轉(zhuǎn)換,由極坐標(biāo)系轉(zhuǎn)化到平面直角坐標(biāo)系,將方位-距離二維圖像中每個方位的斜距變?yōu)榇怪本嚯x,使電力線和類似電力線的線性目標(biāo)在圖像中表現(xiàn)為直線段。
所述圖像分塊處理模塊包括:
距離直方圖獲取單元:獲取距離直方圖:將采集到的雷達圖像上所有點與發(fā)射源之間的距離整數(shù)化,獲取雷達圖像上所有點的距離直方圖;
分塊閾值計算單元:計算分塊閾值:將距離直方圖等分成若干個分塊,并求每塊的距離均值,將距離均值作為雷達圖像分塊的分割閾值;按分割閾值對雷達圖像進行分塊;
圖像塊疊加單元:如果圖像塊無法完整地顯示電力線,把相鄰的圖像塊進行疊加。
所述圖像塊疊加單元的疊加,是以分塊大小為基礎(chǔ),把相鄰的圖像塊按照重疊圖像塊的設(shè)定比例進行疊加。設(shè)定比例可以是十分之一。
所述分類模塊包括:
特征提取單元:對候選直線段集合中的直線段進行特征提取得到測試集;
決策樹分類模型訓(xùn)練單元:構(gòu)造決策樹分類模型,利用訓(xùn)練集對決策樹分類模型進行訓(xùn)練,得到訓(xùn)練好的決策樹分類模型;
分類處理單元:利用訓(xùn)練好的決策樹分類模型對測試集的特征進行分類處理,確定電力線的位置。
所述決策樹分類模型訓(xùn)練單元在訓(xùn)練過程中矯正節(jié)點屬性,引入交叉驗證策略,最終得到?jīng)Q策樹分類模型。
所述決策樹分類模型訓(xùn)練單元的訓(xùn)練集包含的特征的屬性和類別與測試集中的是一樣的。
所述決策樹分類模型訓(xùn)練單元包括:
分類指標(biāo)的屬性域確定子單元:尋找初始分裂,整個訓(xùn)練集作為產(chǎn)生決策樹的集合,訓(xùn)練集每個記錄必須是已經(jīng)分好類的,依據(jù)信息增益決定作為目前分類指標(biāo)的屬性域(Field);信息增益越小表示該信息增益所對應(yīng)的屬性域作為分類指標(biāo)越好。
屬性域分裂好壞量化子單元:窮舉所有的屬性域,通過計算每個屬性域分裂的多樣性(Diversity)指標(biāo)來對每個屬性域分裂的好壞做出量化,依據(jù)決策樹分類訓(xùn)練集合的信息增益值來計算出最好的一個分裂屬性,信息增益越大說明該屬性的分類效果越好;
決策樹形成子單元:返回分類指標(biāo)的屬性域確定子單元,直至每個葉節(jié)點內(nèi)的記錄都屬于同一類且增長到一棵完整的樹。
本發(fā)明的有益效果:
通過坐標(biāo)轉(zhuǎn)換后,可以應(yīng)用通用的直線檢測手段完成電力線的檢測,降低了直線檢測難度;將變換后的圖像進行有重疊的分塊處理操作,在保證直線連續(xù)的情況下可以實現(xiàn)數(shù)據(jù)的并行處理運算,提高方法的計算速度;針對電力線提取描述特征,并利用決策分類樹分類方法對檢測到的直線進行分類,計算簡單而且更加符合電力線檢測的應(yīng)用。本發(fā)明可以實時、有效的檢測出電力線目標(biāo),而且具有很低的虛警概率。將基于毫米波雷達波決策樹分類的電力線檢測方法引入到無人機在輸電領(lǐng)域巡檢時的應(yīng)用中,從而判斷無人機距離電力線的距離,為無人機的巡檢提供一種有效的安全預(yù)警手段,保證了無人機巡檢輸電線路的工作安全。
附圖說明
圖1(a)為關(guān)于電力線的原始雷達圖像;
圖1(b)為經(jīng)過坐標(biāo)變換后的關(guān)于電力線的雷達圖像;
圖2(a)為根據(jù)閾值分塊后的雷達圖像;
圖2(b)為添加區(qū)域重疊的雷達分塊圖像;
圖3(a)為未處理過的雷達圖像實例一;
圖3(b)為手動提取電力線位置的圖像實例一;
圖3(c)為經(jīng)過Hough變換后的電力線圖像實例一;
圖3(d)為經(jīng)過決策樹分類檢測后的電力線圖像實例一;
圖3(e)為未處理過的雷達圖像實例二;
圖3(f)為手動提取電力線位置的圖像實例二;
圖3(g)為經(jīng)過Hough變換后的電力線圖像實例二;
圖3(h)為經(jīng)過決策樹分類檢測后的電力線圖像實例二;
圖4為電力線檢測框圖;
圖5為基于毫米波雷達決策樹分類的無人機實時檢測電力線系統(tǒng)框圖;
圖6為圖像獲取模塊內(nèi)部功能架構(gòu)圖;
圖7為圖像分塊處理模塊內(nèi)部功能架構(gòu)圖;
圖8為分類模塊內(nèi)部功能架構(gòu)圖;
圖9為決策樹分類模型訓(xùn)練單元內(nèi)部功能架構(gòu)圖。
具體實施方式
下面結(jié)合附圖與實施例對本發(fā)明作進一步說明。
基于毫米波雷達決策樹分類的電力線檢測方法,包括如下步驟:
步驟(1):利用毫米波雷達獲取電力線雷達圖像并進行坐標(biāo)轉(zhuǎn)換,作為后續(xù)處理的基礎(chǔ)信息;
步驟(2):圖像分塊處理。以圖像中距離信息為標(biāo)準(zhǔn),確定閾值將圖像按距離進行分塊;
步驟(3):利用Hough變換檢測圖像分塊中存在的直線;
步驟(4):決策樹分類:對提取到的候選直線進行分類處理,確定最終的電力線位置。
所述步驟(1)的步驟包括:
步驟(1-1):利用機械掃描方式獲取掃描圖,電力線在毫米波雷達波照射下有布拉格散射曲線,在極坐標(biāo)系下呈現(xiàn)彎曲特性;
步驟(1-2):坐標(biāo)變換。電力線在雷達圖中呈現(xiàn)彎曲特性,不利于后期的處理。這里利用坐標(biāo)系轉(zhuǎn)換,將每個方位的斜距變?yōu)榇怪本嚯x,這樣像電力線這樣的線性目標(biāo)就在圖像中表現(xiàn)為直線段了,便于后續(xù)處理。變換前的圖像如圖1(a)所示,變換后的圖像如圖1(b)所示。
由雷達方程可知,距離遠的目標(biāo)對電磁波反射后的回波功率小于近距離目標(biāo),由于在后面直線檢測中需要對圖像取峰值點,減少參與直線檢測的像素點,可以減少計算量。取峰值點就要對圖像設(shè)定閾值,超過閾值的點保留,低于閾值的點去掉。如果對整幀圖像取定一個統(tǒng)一的閾值,那么對于遠距離目標(biāo)就可能因其回波功率小而低于閾值,這不利于整幅圖像峰值選取的公平性,所以對不同距離的目標(biāo)就要有不同的閾值。但是距離是漸變的,要顧全每個距離點的話,將設(shè)置很多的閾值,處理起來很麻煩。
步驟(2)所示圖像分塊處理,主要包括:
步驟(2-1):統(tǒng)計直方圖信息。將圖像中所有點的距離信息整數(shù)化,統(tǒng)計距離直方圖信息;
步驟(2-2):計算分塊閾值。根據(jù)直方圖信息,將直方圖10等分并求每個分塊的距離均值,作為分塊的閾值。
步驟(2-3):如圖2(a)所示分塊結(jié)果,當(dāng)電力線處理圖像塊的邊緣時無法完整的檢出電力線,造成電力線信息的丟失,為此把圖像分成互相疊加的塊。如圖2(b)所示。
雷達圖像經(jīng)過坐標(biāo)轉(zhuǎn)換、分塊處理等預(yù)處理后,對得到的圖像進行Hough變換以提取圖像中的直線。由于背景、噪聲的影響這些也會被檢測呈直線,形成候選直線集合。為了精確的檢測出直線位置,利用決策樹分類器對候選直線集合進行分類處理。
決策樹是利用信息論中的信息增益尋找數(shù)據(jù)庫中具有最大信息量的屬性字段,建立決策樹的一個結(jié)點,再根據(jù)該屬性字段的不同取值建立樹的分支,在每個子分支子集中重復(fù)建立樹的下層結(jié)點和分支的一個過程。構(gòu)造決策樹的具體過程為:
首先,尋找初始分裂,整個訓(xùn)練集作為產(chǎn)生決策樹的集合,訓(xùn)練集每個記錄必須是已經(jīng)分好類的,以決定哪個屬性域(Field)作為目前最好的分類指標(biāo)。
其次,窮舉所有的屬性域,對每個屬性域分裂的好壞做出量化,計算出最好的一個分裂。量化的標(biāo)準(zhǔn)是計算每個分裂的多樣性(Diversity)指標(biāo)。
最后,重復(fù)第一步,直至每個葉節(jié)點內(nèi)的記錄都屬于同一類且增長到一棵完整的樹。
對于類別個數(shù)為C的情況,樣本集S相對于C分類的熵定義為:
其中,pi是S中屬于類別i的比例。
信息增益是屬性分類訓(xùn)練數(shù)據(jù)的能力的度量標(biāo)準(zhǔn),一個屬性的信息增益就是由于使用這個屬性分割樣例而導(dǎo)致的期望熵降低。它被定義為:
其中,Value(A)是屬性A的所有可能值的集合,Sv是S中屬性A的值為v的子集(即,Sv={s∈S|A(s)=v})。計算每個屬性的信息增益,并選取具有最高信息增益的屬性作為給定集合S的測試屬性,創(chuàng)建一個節(jié)點,并以該屬性標(biāo)記,對該屬性的每個值創(chuàng)建一個分支,并據(jù)此劃分樣本,每一步劃分都是局部最優(yōu)的,從而建立一棵分類樹。
在建立決策樹對候選直線段分類之前需要對候選直線段進行特征提取,本方法根據(jù)電力線檢測的需求,提取具備10維度屬性的特向量來表征電力線。記候選直線上的數(shù)據(jù)為v=(v(1),v(2),...,v(n)),n為候選直線上的點數(shù),v(i)為候選直線上第i個數(shù)據(jù)點的強度。設(shè)x為10維的特征向量,其分量分別為x=(x(1),x(2),...,x(10))。這些分量分別取自時域、頻域和自相關(guān)曲線。第一組特征分量由數(shù)據(jù)點的基本統(tǒng)計特征值確定,依次表示v的均值,最大值,方差,標(biāo)準(zhǔn)差。
x(1)=mean(v)
x(2)=max(v)
x(3)=var(v)
x(4)=std(v)
接下來的一組特征向量分量由數(shù)據(jù)點頻譜的特點確定,V表示對v做2048點的DFT。x(5)是直流分量,x(6)是低頻分量,x(7)是高頻分量,x(8)是平均功率。
x(5)=V(1)
最后一組特征分量取自時域信號的自相關(guān)序列,x(9),x(10)分別為序列v的自相關(guān)函數(shù)的中位數(shù)和均值。
為了使用決策樹算法對輸入數(shù)據(jù)進行準(zhǔn)確的預(yù)測分類,就必須獲取包含這些屬性和相應(yīng)類別的訓(xùn)練集,用這些訓(xùn)練集構(gòu)造一棵決策樹。為了在訓(xùn)練過程中矯正節(jié)點屬性,引入交叉驗證策略,最終得到?jīng)Q策樹分類模型。最終測試結(jié)果如圖3(a)-圖3(h)所示。
方法的整體流程如圖4所示。
如圖5所示,基于毫米波雷達決策樹分類的無人機實時檢測電力線系統(tǒng),包括:
圖像獲取模塊:獲取電力線的雷達圖像;
坐標(biāo)變換模塊:利用坐標(biāo)轉(zhuǎn)換方法將電力線的雷達圖像由極坐標(biāo)系轉(zhuǎn)化到平面直角坐標(biāo)系中;
圖像分塊處理模塊:以圖像中距離為標(biāo)準(zhǔn),設(shè)定閾值,按設(shè)定閾值對圖像進行分塊;
直線段檢測模塊:利用Hough變換檢測圖像分塊中存在的直線段;得到形成候選直線段集合;
分類模塊:利用決策樹分類模型對候選直線段集合中的直線段進行分類,從而檢測出電力線的位置。
所述電力線的雷達圖像是利用無人機搭載的毫米波雷達掃描輸電線路區(qū)域獲取的。
如圖6所示,所述圖像獲取模塊包括:
方位角獲取單元:獲取到場景中各物體的方位角;
傅里葉變換單元:雷達圖像經(jīng)過傅里葉變換(FFT)后,從頻譜中獲取場景中物體與雷達之間的距離,距離與方位角組合形成方位-距離二維圖像。
所述坐標(biāo)變換模塊:利用坐標(biāo)轉(zhuǎn)換的方法對方位-距離二維圖像進行坐標(biāo)轉(zhuǎn)換,由極坐標(biāo)系轉(zhuǎn)化到平面直角坐標(biāo)系,將方位-距離二維圖像中每個方位的斜距變?yōu)榇怪本嚯x,使電力線和類似電力線的線性目標(biāo)在圖像中表現(xiàn)為直線段。
如圖7所示,所述圖像分塊處理模塊包括:
距離直方圖獲取單元:獲取距離直方圖:將采集到的雷達圖像上所有點與發(fā)射源之間的距離整數(shù)化,獲取雷達圖像上所有點的距離直方圖;
分塊閾值計算單元:計算分塊閾值:將距離直方圖等分成若干個分塊,并求每塊的距離均值,將距離均值作為雷達圖像分塊的分割閾值;按分割閾值對雷達圖像進行分塊;
圖像塊疊加單元:如果圖像塊無法完整地顯示電力線,把相鄰的圖像塊進行疊加。
所述圖像塊疊加單元的疊加,是以分塊大小為基礎(chǔ),把相鄰的圖像塊按照重疊圖像塊的設(shè)定比例進行疊加。設(shè)定比例可以是十分之一。
如圖8所示,所述分類模塊包括:
特征提取單元:對候選直線段集合中的直線段進行特征提取得到測試集;
決策樹分類模型訓(xùn)練單元:構(gòu)造決策樹分類模型,利用訓(xùn)練集對決策樹分類模型進行訓(xùn)練,得到訓(xùn)練好的決策樹分類模型;
分類處理單元:利用訓(xùn)練好的決策樹分類模型對測試集的特征進行分類處理,確定電力線的位置。
所述決策樹分類模型訓(xùn)練單元在訓(xùn)練過程中矯正節(jié)點屬性,引入交叉驗證策略,最終得到?jīng)Q策樹分類模型。
所述決策樹分類模型訓(xùn)練單元的訓(xùn)練集包含的特征的屬性和類別與測試集中的是一樣的。
如圖9所示,所述決策樹分類模型訓(xùn)練單元包括:
分類指標(biāo)的屬性域確定子單元:尋找初始分裂,整個訓(xùn)練集作為產(chǎn)生決策樹的集合,訓(xùn)練集每個記錄必須是已經(jīng)分好類的,依據(jù)信息增益決定作為目前分類指標(biāo)的屬性域(Field);信息增益越小表示該信息增益所對應(yīng)的屬性域作為分類指標(biāo)越好。
屬性域分裂好壞量化子單元:窮舉所有的屬性域,通過計算每個屬性域分裂的多樣性(Diversity)指標(biāo)來對每個屬性域分裂的好壞做出量化,依據(jù)決策樹分類訓(xùn)練集合的信息增益值來計算出最好的一個分裂屬性,信息增益越大說明該屬性的分類效果越好;
決策樹形成子單元:返回分類指標(biāo)的屬性域確定子單元,直至每個葉節(jié)點內(nèi)的記錄都屬于同一類且增長到一棵完整的樹。
上述雖然結(jié)合附圖對本發(fā)明的具體實施方式進行了描述,但并非對本發(fā)明保護范圍的限制,所屬領(lǐng)域技術(shù)人員應(yīng)該明白,在本發(fā)明的技術(shù)方案的基礎(chǔ)上,本領(lǐng)域技術(shù)人員不需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護范圍以內(nèi)。