本發(fā)明涉及一種通過人員行為軌跡識別重點人員的方法及系統(tǒng)。
背景技術:
::在日益飛速發(fā)展的信息技術支撐下,利用信息化手段管控犯罪前科、在逃人員等重點人員已經(jīng)成為了公安機關研究的重要方向。重點人員日?;顒訒r,產(chǎn)生的各項行為記錄的數(shù)據(jù)信息,記載了重點人員的行動軌跡和方向。因此利用人員動態(tài)軌跡,來分析重點人員的類型,提高公安情報人員的研判效率,顯得尤為重要。而目前人員分類方法,要么是具有局限性,只能應用到單一場景,如只能識別上班族或者販毒人員等單一類型,要么具有時效性,當時代發(fā)展,改變了人們的生活方式后,固定的識別算法便不再適用。技術實現(xiàn)要素:本發(fā)明的目的就是為了解決上述問題,提供一種通過人員行為軌跡識別重點人員的方法及系統(tǒng),它具有通過人員行為軌跡迅速準確識別重點人員的優(yōu)點。為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:一種通過人員行為軌跡識別重點人員的方法,包括如下步驟:步驟(1):收集重點人員和非重點人員的行為軌跡數(shù)據(jù),建立重點人員軌跡信息集和非重點人員軌跡信息集;步驟(2):對重點人員軌跡信息集和非重點人員軌跡信息集的信息進行特征提??;從重點人員軌跡信息集和非重點人員軌跡信息集中提取每個人行為軌跡信息中的位置特征和時間特征,將位置特征和時間特征作為token串,并統(tǒng)計提取出的token串出現(xiàn)的次數(shù)和字頻;步驟(3):建立動態(tài)模型;每個人員行為軌跡信息對應一個哈希表,hashtable_true哈希表對應重點人員行為軌跡信息集,而hashtable_false哈希表對應非重點人員行為軌跡集合;每個哈希表中存儲token串到字頻的映射關系;步驟(4):計算hashtable_true哈希表和hashtable_false哈希表token串ti出現(xiàn)的概率;步驟(5):從建立重點人員軌跡信息集和非重點人員軌跡信息集中選擇樣本人員,利用樣本人員的軌跡特征進行學習訓練,計算樣本人員為重點人員的概率;步驟(6):建立新的hashtable_probability哈希表,存儲token串ti到p(a|ti)的映射;p(a|ti)表示在事件a中,樣本人員軌跡信息中出現(xiàn)token串ti時,該人員為重點人員的概率;步驟(7):重復步驟(5)-(6),直至每個重點人員和非重點人員軌跡均學習訓練結(jié)束;根據(jù)建立的hashtable_probability哈希表估計新人員為重點人員的可能性。所述步驟(4)為:p1(ti)表示token串ti在hashtable_true哈希表中出現(xiàn)的頻率;p2(ti)表示token串ti在hashtable_false哈希表中出現(xiàn)的頻率。所述步驟(5):利用hashtable_true哈希表和hashtable_false哈希表,推斷出當樣本人員軌跡信息中出現(xiàn)某個token串時,計算樣本人員為重點人員的概率:假設樣本人員的token串包括t1、t2……tn;則p(a|ti)表示在事件a中,樣本人員軌跡信息中出現(xiàn)token串ti時,該人員為重點人員的概率;i的取值范圍是1到n;則當收到一條新人員行為軌跡時,提取新人員行為軌跡信息中的位置特征和時間特征,將位置特征和時間特征作為token串;利用新人員的token串查詢hashtable_probability哈希表,得到token串的鍵值;假設由該新人員行為軌跡共得到m個token串t1、t2……tm,hashtable_probability哈希表中對應的值為p1、p2……pm;p(a|t1,t2,t3......tm)表示在人員軌跡信息中同時出現(xiàn)多個token串t1、t2……tm時,該新人員為重點人員的概率;當p(a|t1,t2,t3......tm)超過預定閾值時,就判斷人員為重點人員。其中,一種通過人員行為軌跡識別重點人員的系統(tǒng),包括:收集模塊:收集重點人員和非重點人員的行為軌跡數(shù)據(jù),建立重點人員軌跡信息集和非重點人員軌跡信息集;特征提取模塊:對重點人員軌跡信息集和非重點人員軌跡信息集的信息進行特征提??;從重點人員軌跡信息集和非重點人員軌跡信息集中提取每個人行為軌跡信息中的位置特征和時間特征,將位置特征和時間特征作為token串,并統(tǒng)計提取出的token串出現(xiàn)的次數(shù)和字頻;動態(tài)模型建立模塊:每個人員行為軌跡信息對應一個哈希表,hashtable_true哈希表對應重點人員行為軌跡信息集,而hashtable_false哈希表對應非重點人員行為軌跡集合;每個哈希表中存儲token串到字頻的映射關系;第一計算模塊:計算hashtable_true哈希表和hashtable_false哈希表token串ti出現(xiàn)的概率;第二計算模塊:從建立重點人員軌跡信息集和非重點人員軌跡信息集中選擇樣本人員,利用樣本人員的軌跡特征進行學習訓練,計算樣本人員為重點人員的概率;新哈希表建立模塊:建立新的hashtable_probability哈希表,存儲token串ti到p(a|ti)的映射;p(a|ti)表示在事件a中,樣本人員軌跡信息中出現(xiàn)token串ti時,該人員為重點人員的概率;估計模塊:直至每個重點人員和非重點人員軌跡均學習訓練結(jié)束;根據(jù)建立的hashtable_probability哈希表能夠估計新人員為重點人員的可能性。本發(fā)明的有益效果:1從建立重點人員軌跡信息集和非重點人員軌跡信息集中選擇樣本人員,利用樣本人員的軌跡特征進行學習訓練,計算樣本人員為重點人員的概率;建立新的hashtable_probability哈希表,利用新的哈希表來識別重點人員,具有識別范圍廣的優(yōu)點。2通過設定閾值來判斷是否為重點人員,具有識別精度高的優(yōu)點。附圖說明圖1為本發(fā)明的方法流程圖。具體實施方式下面結(jié)合附圖與實施例對本發(fā)明作進一步說明。如圖1所示,一種通過人員行為軌跡識別人員類型的方法,包括如下步驟:1.收集大量人員行為軌跡數(shù)據(jù),建立重點人員軌跡信息集和非重點人員軌跡信息集。2.重點人員特征提取以送餐員為例,送餐員具有明顯的行為特征,在吃飯時間奔波在餐館與小區(qū)、餐館與辦公區(qū)等之間,其軌跡一天內(nèi)此刻最為密集,而且由于送餐員都有自己特定的送餐區(qū)域,其軌跡長時間內(nèi)趨于一致性。提取這些行為軌跡信息中的場所、時間等特征信息作為token串,并統(tǒng)計提取出的token串出現(xiàn)的次數(shù)和字頻。按照上述的方法分別處理重點人員軌跡信息集合非重點人員信息集的所有人員軌跡信息。3.建立動態(tài)模型每一個人員行為軌跡信息對應一個哈希表,hashtable_true對應重點人員行為軌跡信息集,而hashtable_false對應非重點人員行為軌跡集合。表中存儲token串到字頻的映射關系。4.計算token出現(xiàn)的概率計算每個哈希表中token串出現(xiàn)的概率p=(某token串的字頻)/(對應哈希表的長度)。5.計算新人員為重點人員的概率。綜合考慮hashtable_true和hashtable_false,推斷出當新來的人員軌跡信息中出現(xiàn)某個token串時,該新人員為重點人員的概率。數(shù)學表達式為:a事件----人員為重點人員;t1,t2…….tn代表token串則p(a|ti)表示在人員軌跡信息中出現(xiàn)token串ti時,該人員為重點人員的概率。設則6.建立新的哈希表hashtable_probability存儲token串ti到p(a|ti)的映射7.至此,重點人員和非重點人員的學習過程結(jié)束。根據(jù)建立的哈希表hashtable_probability可以估計一封新到人員為重點人員的可能性。當新到一條人員行為軌跡時,按照步驟2,生成token串。查詢hashtable_probability得到該token串的鍵值。假設由該新人員行為軌跡共得到m個token串t1、t2……tm,hashtable_probability哈希表中對應的值為p1、p2……pm;p(a|t1,t2,t3......tm)表示在人員軌跡信息中同時出現(xiàn)多個token串t1、t2……tm時,該人員為重點人員的概率。由復合概率公式可得當p(a|t1,t2,t3......tm)超過預定閾值時,就可以判斷人員為重點人員。重點人員:一類具有明顯特征的人員,如常駐人員、外賣人員、販毒人員等。上述雖然結(jié)合附圖對本發(fā)明的具體實施方式進行了描述,但并非對本發(fā)明保護范圍的限制,所屬領域技術人員應該明白,在本發(fā)明的技術方案的基礎上,本領域技術人員不需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護范圍以內(nèi)。當前第1頁12當前第1頁12