本發(fā)明涉及社會管理和大數(shù)據(jù)處理的研究領(lǐng)域,更具體地說,涉及一種基于隱馬爾可夫模型的網(wǎng)格化社會治理信息方法。
背景技術(shù):
管理網(wǎng)格化依托統(tǒng)一的數(shù)字化的平臺,將管理單元按照一定的標(biāo)準(zhǔn)劃分成為單元網(wǎng)格。通過加強對單元網(wǎng)格的部件和事件巡查,建立一種監(jiān)督和處置互相分離的形式。主要優(yōu)勢是能夠主動發(fā)現(xiàn),及時處理各類問題,加強管理能力和處理速度,將問題解決在事故發(fā)生之前。
首先,它將過去被動應(yīng)對問題的管理模式轉(zhuǎn)變?yōu)橹鲃影l(fā)現(xiàn)問題和解決問題;第二,它是管理手段數(shù)字化,這主要體現(xiàn)在管理對象、過程和評價的數(shù)字化上,保證管理的敏捷、精確和高效;第三,它是科學(xué)封閉的管理機制,不僅具有一整套規(guī)范統(tǒng)一的管理標(biāo)準(zhǔn)和流程,而且發(fā)現(xiàn)、立案、派遣、結(jié)案四個步驟形成一個閉環(huán),從而提升管理的能力和水平。
正是因為這些功能,可以將過去傳統(tǒng)、被動、定性和分散的管理,轉(zhuǎn)變?yōu)榻裉飕F(xiàn)代、主動、定量和系統(tǒng)的管理。簡單的講:網(wǎng)格化管理是運用數(shù)字化、信息化手段,以組織結(jié)構(gòu)單元為管理范圍,以事件為管理內(nèi)容,以處置單位為責(zé)任人,通過網(wǎng)格化管理信息平臺,實現(xiàn)聯(lián)動、資源共享的一種組織管理新模式。
隱馬爾可夫模型(hiddenmarkovmodel,hmm)是統(tǒng)計模型,它用來描述一個含有隱含未知參數(shù)的馬爾可夫過程。其難點是從可觀察的參數(shù)中確定該過程的隱含參數(shù)。然后利用這些參數(shù)來作進(jìn)一步的分析,例如模式識別。
技術(shù)實現(xiàn)要素:
本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的網(wǎng)格化管理區(qū)域的數(shù)據(jù)輸入量過大,人工決策效率較低以及無法動態(tài)實時調(diào)整的問題,提供一種基于隱馬爾可夫模型的網(wǎng)格化社會治理信息方法。
為了達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案:
本發(fā)明公開了一種基于隱馬爾可夫模型的網(wǎng)格化社會治理信息方法,包括下述步驟:
s1、根據(jù)社會區(qū)域大小與人口分布信息均等初始化網(wǎng)格,具體初始化網(wǎng)格的方法及初始化參數(shù)根據(jù)實際情況利用最大熵模型進(jìn)行訓(xùn)練;
s2、根據(jù)不同網(wǎng)格的硬件配置采集并上傳信息,并構(gòu)造樣本網(wǎng)格化特征向量;
s3、根據(jù)不同網(wǎng)格的事件發(fā)生情況進(jìn)行標(biāo)簽的標(biāo)記;
s4、根據(jù)采集的先驗信息訓(xùn)練隱馬爾可夫模型;
s5、利用訓(xùn)練完成的隱馬爾可夫模型根據(jù)后續(xù)數(shù)據(jù)預(yù)測不同標(biāo)簽的狀態(tài)轉(zhuǎn)移情況;
s6、根據(jù)標(biāo)簽的狀態(tài)轉(zhuǎn)移預(yù)測情況實時調(diào)整網(wǎng)格的密度;
s7、根據(jù)網(wǎng)格的密度動態(tài)調(diào)整各個區(qū)域的人員部署,密度越高,部署的人員越多。
作為優(yōu)選的技術(shù)方案,步驟s1中,利用最大熵模型進(jìn)行訓(xùn)練的方法為:
s11、假定第零次迭代的初始模型為等概率的均勻分布;
s12、用第n次迭代的模型來估算每種信息特征在訓(xùn)練數(shù)據(jù)中的分布,如果超過了實際的,就把相應(yīng)的模型參數(shù)變??;否則,將它們變大;
s13、重復(fù)步驟s12直到收斂。
作為優(yōu)選的技術(shù)方案,步驟s2中,采集并上傳的信息包括交管數(shù)據(jù)、治安數(shù)據(jù)、管理員上報數(shù)據(jù)和大事件提前安排數(shù)據(jù)。
作為優(yōu)選的技術(shù)方案,步驟s2中,采用采用k-svd算法,通過樣本信息對字典進(jìn)行訓(xùn)練,并通過omp算法構(gòu)造樣本網(wǎng)格化特征向量,具體如下:
s21、采用k-svd算法對字典d進(jìn)行訓(xùn)練,首先初始化字典d,可以隨機得到,然后進(jìn)行迭代,具體迭代步驟如下:
第一階段:固定字典d,采用omp算法求解以下方程式,找到最好的稀疏矩陣x,
第二階段:更新字典d;
s22、通過以下方式將字典d逐列更新,以下假設(shè)要更新字典d的第k列dk,將目標(biāo)函數(shù)重寫成以下形式:
參量說明:
y表示數(shù)據(jù)集,y的每一列表示一個樣本;
d、x分別表示字典學(xué)習(xí)過程中將y分解成的兩個矩陣,d稱之為字典,d的每一列稱之為原子;x稱之為編碼矢量、特征、系數(shù)矩陣;
t0為設(shè)定的學(xué)習(xí)系數(shù);
s23、用svd將ek分解,得到的最大特征值對應(yīng)的那個特征向量就作為dk;
s24、反復(fù)執(zhí)行上述第一、二階段的步驟,得到收斂的字典d′;
s25、使用字典d′,構(gòu)造出樣本網(wǎng)格化特征向量,采用omp算法求解以下方程式,找到最好的稀疏矩陣x′,x′就是樣本y的網(wǎng)格化特征向量;
作為優(yōu)選的技術(shù)方案,步驟s3中,標(biāo)簽包括密度過大標(biāo)簽、密度過小標(biāo)簽以及正常標(biāo)簽,這些標(biāo)簽根據(jù)網(wǎng)格的實時密度進(jìn)行判斷,標(biāo)準(zhǔn)值由人工進(jìn)行初始化。
作為優(yōu)選的技術(shù)方案,步驟s3中,采用樣本網(wǎng)格化特征向量訓(xùn)練隨機森林分類器,具體步驟如下:
s31、將樣本網(wǎng)格化特征向量x′分為訓(xùn)練集x1′,測試集x2′;
s32、從x1′中有放回的抽取大小和x1′一樣的訓(xùn)練集x1′(i),作為根節(jié)點的樣本,從根節(jié)點開始訓(xùn)練;
s33、如果當(dāng)前節(jié)點上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點為葉子節(jié)點,該葉子節(jié)點的預(yù)測輸出為當(dāng)前節(jié)點樣本集合中數(shù)量最多的那一類c(j),概率p為c(j)占當(dāng)前樣本集的比例,然后繼續(xù)訓(xùn)練其他節(jié)點;如果當(dāng)前節(jié)點沒有達(dá)到終止條件,則從f維特征中無放回的隨機選取f維特征,利用這f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點上樣本第k維特征小于th的樣本被劃分到左節(jié)點,其余的被劃分到右節(jié)點,繼續(xù)訓(xùn)練其他節(jié)點;
s34、重復(fù)s32-s33直到所有節(jié)點都訓(xùn)練過了或者被標(biāo)記為葉子節(jié)點;
s35、重復(fù)s32-s34直到所有cart都被訓(xùn)練過。
作為優(yōu)選的技術(shù)方案,步驟s4具體為:
s41、采集每個傳感器的信息:
在實際應(yīng)用中被采集的傳感器包括三軸加速度傳感器,陀螺儀、心率傳感器,假設(shè)采集到的信息為y″;
s42、調(diào)用已訓(xùn)練的字典,通過omp算法構(gòu)造網(wǎng)格化特征向量:
步驟s42調(diào)用已訓(xùn)練的字典d′,通過omp算法構(gòu)造網(wǎng)格化特征向量;
運用omp算法求解以下方程,得到網(wǎng)格化特征向量x″
作為優(yōu)選的技術(shù)方案,步驟s5中,根據(jù)網(wǎng)格化特征向量x″,采用已訓(xùn)練的隨機森林分類器預(yù)測網(wǎng)格化,輸出預(yù)測結(jié)果,利用隨機森林的預(yù)測過程如下:
對于第1-t棵樹,i=1-t:
s51、從當(dāng)前樹的根節(jié)點開始,根據(jù)當(dāng)前節(jié)點的閾值th,判斷是進(jìn)入左節(jié)點(<th)還是進(jìn)入右節(jié)點(>=th),直到到達(dá),某個葉子節(jié)點,并輸出預(yù)測值;
s52、重復(fù)執(zhí)行s51直到所有t棵樹都輸出了預(yù)測值,因為是分類問題,所以輸出為所有樹中預(yù)測概率總和最大的那一個類,即對每個c(j)的p進(jìn)行累計。
作為優(yōu)選的技術(shù)方案,步驟s6中,針對標(biāo)簽狀態(tài)轉(zhuǎn)移的預(yù)測情況,對于狀態(tài)轉(zhuǎn)移較多的區(qū)域,將網(wǎng)格的密度調(diào)整得更大;對于狀態(tài)轉(zhuǎn)移較少的區(qū)域,將網(wǎng)格的密度調(diào)整得更小。
作為優(yōu)選的技術(shù)方案,步驟s7中,網(wǎng)格密度實時調(diào)整是根據(jù)在線隱馬爾可夫模型實時計算得到的結(jié)果。
本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點和有益效果:
1.主動適應(yīng)性:本發(fā)明所采用的隱馬爾可夫模型,是通過加強對單元網(wǎng)格的部件和事件巡查,建立一種監(jiān)督和處置互相分離的形式。它能夠主動地發(fā)現(xiàn)問題,并主動地進(jìn)行解決,從而提高了整個模型動作的效率及準(zhǔn)確性;
2.管理數(shù)字化:本發(fā)明采用的模型,通過對管理對象、過程和評
價實現(xiàn)數(shù)字化,避免了其他技術(shù)方案中對于這些領(lǐng)域的評判標(biāo)準(zhǔn)模糊的缺點,從而使得管理的過程更加快速、精確。
3.封閉性:本發(fā)明中,采用了科學(xué)封閉的管理機制,使得以往技術(shù)方案中管理標(biāo)準(zhǔn)和流程不統(tǒng)一的問題得到了解決。此外,還將發(fā)現(xiàn)、立案、派遣、結(jié)案四個步驟形成一個閉環(huán),從而提升了管理的能力和水平。
附圖說明
圖1為本發(fā)明基于隱馬爾可夫模型的網(wǎng)格化社會治理信息方法訓(xùn)練流程圖;
圖2為本發(fā)明基于隱馬爾可夫模型的網(wǎng)格化社會治理信息方法執(zhí)行流程圖。
具體實施方式
下面結(jié)合實施例及附圖對本發(fā)明作進(jìn)一步詳細(xì)的描述,但本發(fā)明的實施方式不限于此。
實施例
如圖1、圖2所示,本發(fā)明的一種基于隱馬爾可夫模型的網(wǎng)格化社會治理信息方法,包括以下步驟:
(1)根據(jù)社會區(qū)域大小與人口分布均等初始化網(wǎng)格,具體的初始化方法和參數(shù)根據(jù)不同的情況利用最大熵模型進(jìn)行訓(xùn)練:
(1-1)假定第零次迭代的初始模型為等概率的均勻分布。
(1-2)用第n次迭代的模型來估算每種信息特征在訓(xùn)練數(shù)據(jù)中的分布,如果超過了實際的,就把相應(yīng)的模型參數(shù)變?。环駝t,將它們便大。
(1-3)重復(fù)步驟(1-2)直到收斂。
(2)根據(jù)不同網(wǎng)格的硬件配置采集并上傳信息,采集的數(shù)據(jù)包括,交管數(shù)據(jù)、治安數(shù)據(jù)、管理員上報數(shù)據(jù)、大事件提前安排數(shù)據(jù)
步驟(2)采用k-svd算法,通過樣本信息對字典進(jìn)行訓(xùn)練,并通過omp算法構(gòu)造樣本網(wǎng)格化特征向量;
(2-1)采用k-svd算法對字典進(jìn)行訓(xùn)練,假設(shè)字典d為一個7*21的矩陣。首先初始化字典d,可以隨機得到,然后進(jìn)行迭代,具體迭代步驟如下:
第一階段:固定字典d,采用omp算法求解以下方程式,找到最好的稀疏矩陣x。
第二階段:更新字典d。
(2-2)通過以下方式將字典d逐列更新,以下假設(shè)要更新字典d的第k列dk。
(2-3)將目標(biāo)函數(shù)重寫成以下形式:
(2-4)用svd將ek分解,得到的最大特征值對應(yīng)的那個特征向量就作為dk。
(2-5)反復(fù)執(zhí)行上述第一、二階段的步驟,得到收斂的字典d′。
(2-6)使用字典d′,構(gòu)造出樣本網(wǎng)格化特征向量,采用omp算法求解以下方程式,找到最好的稀疏矩陣x′。x′就是樣本y的網(wǎng)格化特征向量。
(3)根據(jù)不同網(wǎng)格的事件發(fā)生情況進(jìn)行標(biāo)簽的標(biāo)記,狀態(tài)標(biāo)簽包括:密度過大、密度過小、正常,這些標(biāo)簽根據(jù)網(wǎng)格的實時密度去進(jìn)行判斷,標(biāo)準(zhǔn)值由人工進(jìn)行初始化;
步驟(3)采用樣本網(wǎng)格化特征向量訓(xùn)練隨機森林分類器,具體如下:
(3-1)將樣本網(wǎng)格化特征向量x′分為訓(xùn)練集x1′,測試集x2′,特征維數(shù)f=21。確定參數(shù):使用到的cart的數(shù)量t=50,每棵樹的深度d=7,每個節(jié)點使用到的特征數(shù)量f=3,終止條件:節(jié)點上最少樣本數(shù)s=3。
對于第1-t棵樹,i=1-t:
(3-2)從x1′中有放回的抽取大小和x1′一樣的訓(xùn)練集x1′(i),作為根節(jié)點的樣本,從根節(jié)點開始訓(xùn)練
(3-3)如果當(dāng)前節(jié)點上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點為葉子節(jié)點,該葉子節(jié)點的預(yù)測輸出為當(dāng)前節(jié)點樣本集合中數(shù)量最多的那一類c(j),概率p為c(j)占當(dāng)前樣本集的比例。然后繼續(xù)訓(xùn)練其他節(jié)點。如果當(dāng)前節(jié)點沒有達(dá)到終止條件,則從f維特征中無放回的隨機選取f維特征。利用這f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點上樣本第k維特征小于th的樣本被劃分到左節(jié)點,其余的被劃分到右節(jié)點。繼續(xù)訓(xùn)練其他節(jié)點。有關(guān)分類效果的評判標(biāo)準(zhǔn)在后面會講。
(3-4)重復(fù)(3-2)-(3-3)直到所有節(jié)點都訓(xùn)練過了或者被標(biāo)記為葉子節(jié)點。
(3-5)重復(fù)(3-2)-(3-4)直到所有cart都被訓(xùn)練過。
(4)根據(jù)采集的先驗信息訓(xùn)練隱馬爾可夫模型;該方法包括以下步驟:
(4-1)采集每個傳感器的信息:
在實際應(yīng)用中被采集的傳感器包括三軸加速度傳感器,陀螺儀、心率傳感器。假設(shè)采集到的信息為y″。
(4-2)調(diào)用已訓(xùn)練的字典,通過omp算法構(gòu)造網(wǎng)格化特征向量:
步驟(4-2)調(diào)用已訓(xùn)練的字典d′,通過omp算法構(gòu)造網(wǎng)格化特征向量運用omp算法求解以下方程,得到網(wǎng)格化特征向量x″
(5)利用訓(xùn)練完成的隱馬爾可夫模型根據(jù)后續(xù)數(shù)據(jù)預(yù)測不同標(biāo)簽的狀態(tài)轉(zhuǎn)移情況,具體操作如下所示;
根據(jù)網(wǎng)格化特征向量x″,采用已訓(xùn)練的隨機森林分類器預(yù)測網(wǎng)格化,輸出預(yù)測結(jié)果。
利用隨機森林的預(yù)測過程如下:
對于第1-t棵樹,i=1-t:
(5-1)從當(dāng)前樹的根節(jié)點開始,根據(jù)當(dāng)前節(jié)點的閾值th,判斷是進(jìn)入左節(jié)點(<th)還是進(jìn)入右節(jié)點(>=th),直到到達(dá),某個葉子節(jié)點,并輸出預(yù)測值。
(5-2)重復(fù)執(zhí)行(1)直到所有t棵樹都輸出了預(yù)測值。因為是分類問題,所以輸出為所有樹中預(yù)測概率總和最大的那一個類,即對每個c(j)的p進(jìn)行累計。
(6)根據(jù)標(biāo)簽的狀態(tài)轉(zhuǎn)移預(yù)測情況實時調(diào)整網(wǎng)格的密度。針對標(biāo)簽狀態(tài)轉(zhuǎn)移的預(yù)測情況,對于狀態(tài)轉(zhuǎn)移較多的區(qū)域,將網(wǎng)格的密度調(diào)整得更大;對于狀態(tài)轉(zhuǎn)移較少的區(qū)域,將網(wǎng)格的密度調(diào)整得更小。
(7)根據(jù)網(wǎng)格的密度動態(tài)調(diào)整各個區(qū)域的人員部署,根據(jù)前一步驟中對于網(wǎng)格密度的調(diào)整結(jié)果,若網(wǎng)格的密度越高,部署的人員越多;若網(wǎng)格的密度較小,部署的人員越少。
上述實施例為本發(fā)明較佳的實施方式,但本發(fā)明的實施方式并不受上述實施例的限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所作的改變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。