本發(fā)明屬于智能終端數(shù)據(jù)的數(shù)據(jù)挖掘與分析應(yīng)用技術(shù)領(lǐng)域,具體涉及一種面向智能終端的深度分析與用戶畫(huà)像系統(tǒng)及方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),以及電子產(chǎn)品迅速的更新?lián)Q代,如今智能手機(jī)已經(jīng)成為人們生活中不可或缺的一部分,在以往需要在pc端才能提供的服務(wù),如今智能手機(jī)已基本能夠滿足用戶需求,手機(jī)支付、wifi、新聞等等智能手機(jī)提供的服務(wù)已經(jīng)滲入人們生活,為人們的生活提供了極大便利。根據(jù)智研咨詢集團(tuán)的《2015-2020年中國(guó)智能手機(jī)行業(yè)競(jìng)爭(zhēng)格局分析與未來(lái)投資風(fēng)險(xiǎn)預(yù)測(cè)報(bào)告》,2014年全年中國(guó)手機(jī)市場(chǎng)累計(jì)出貨量為4.52億部,智能手機(jī)出貨量為3.89億部,同比下降8.2%,市場(chǎng)占有率達(dá)86%。在2014年全球智能手機(jī)出貨量實(shí)現(xiàn)27%的同比增長(zhǎng)后,預(yù)計(jì)2015年全球智能手機(jī)出貨量同比增長(zhǎng)將放緩至20%,2016年將放緩至14%。售價(jià)超過(guò)500美元的高端智能手機(jī)市場(chǎng)已“基本飽和”,但預(yù)計(jì)蘋(píng)果在該市場(chǎng)的份額將繼續(xù)增長(zhǎng)。未來(lái)幾年,全球智能手機(jī)出貨量約80%流向新興市場(chǎng),而目前約為70%,對(duì)售價(jià)低于100美元的低端智能手機(jī)的需求將達(dá)到最高峰。小米、聯(lián)想與華為等中國(guó)廠商將引領(lǐng)中國(guó)智能手機(jī)市場(chǎng)的增長(zhǎng)。總體而言,未來(lái)幾年全球智能手機(jī)的普及率將上升至90%,而目前為50%,2017年全球智能手機(jī)目標(biāo)用戶將達(dá)到49.5億。
2013年施行的修正后的《中華人民共和國(guó)刑事訴訟法》(以下簡(jiǎn)稱(chēng)《刑訴法》)確立“電子數(shù)據(jù)”作為一個(gè)獨(dú)立證據(jù)種類(lèi)的地位。隨著計(jì)算機(jī)與手機(jī)技術(shù)的發(fā)展,電子數(shù)據(jù)作為一種新的證據(jù)種類(lèi),將成為證據(jù)種類(lèi)中越來(lái)越常見(jiàn)的一種證據(jù)類(lèi)型。但是對(duì)于電子證據(jù)來(lái)說(shuō),又不僅僅局限于電子數(shù)據(jù)一個(gè)方面,還包括視聽(tīng)資料、數(shù)碼照片、電子郵件、手機(jī)短信等,這些證據(jù)在法庭上往往是以其文字表述的內(nèi)容或者音像資料等形式作為證據(jù)使用的,而真正算作電子證據(jù)的,應(yīng)該是電子數(shù)據(jù)。
隨著越來(lái)越多的用戶使用智能手機(jī),并且利用android手機(jī)處理很多日常應(yīng)用,大量的用戶信息存儲(chǔ)在手機(jī)上,會(huì)在手機(jī)內(nèi)留下許多無(wú)法消除的數(shù)據(jù)信息,比如手機(jī)內(nèi)保存的聯(lián)系人信息、短信、qq聊天記錄、微信聊天記錄等等,以及利用智能手機(jī)侵犯受害者生命財(cái)產(chǎn)安全的過(guò)程。因此手機(jī)取證在這類(lèi)犯罪中所起的作用是決定性的,如何有效的進(jìn)行智能手機(jī)取證成為維護(hù)人民生命財(cái)產(chǎn)安全的重要環(huán)節(jié)。對(duì)于待取證手機(jī)持有者的智能手機(jī),我們可以取出其數(shù)據(jù)進(jìn)行分析,挖掘出有用信息,進(jìn)行人物數(shù)字畫(huà)像,幫助偵查。公安機(jī)關(guān)面對(duì)迅速增長(zhǎng)的高科技犯罪,要認(rèn)真分析研究當(dāng)前狀況,找出有效對(duì)策方針,尤其是解決手機(jī)電子數(shù)據(jù)等關(guān)鍵問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述問(wèn)題,本發(fā)明提出了一種面向智能終端的深度分析與用戶畫(huà)像系統(tǒng)及方法。
本發(fā)明的系統(tǒng)所采用的技術(shù)方案是:一種面向智能終端的深度分析與用戶畫(huà)像系統(tǒng),其特征在于:包括個(gè)人計(jì)算機(jī)和服務(wù)器;所述個(gè)人計(jì)算機(jī)用于對(duì)已經(jīng)獲取到的數(shù)據(jù)進(jìn)行存儲(chǔ)分類(lèi)以及數(shù)據(jù)挖掘與分析、數(shù)字畫(huà)像操作;所述服務(wù)器用于保存用戶信息、保存案件信息以及提取案件信息,便于相關(guān)警務(wù)人員以及司法人員對(duì)相關(guān)案件進(jìn)行即時(shí)查詢,提高工作效率,減輕工作復(fù)雜度。
本發(fā)明的方法所采用的技術(shù)方案是:一種面向智能終端的深度分析與用戶畫(huà)像方法,其特征在于,包括以下步驟:
步驟1:提取數(shù)據(jù);
步驟2:數(shù)據(jù)預(yù)處理;
步驟3:數(shù)據(jù)畫(huà)像;
步驟4:數(shù)據(jù)融合;
步驟5:人物畫(huà)像。
本發(fā)明相比現(xiàn)有技術(shù),其優(yōu)點(diǎn)和積極效果主要體現(xiàn)在以下幾個(gè)方面:
(1)本發(fā)明在聯(lián)系人、通話記錄以及短信等方面實(shí)現(xiàn)了頻率、時(shí)長(zhǎng)等方面的靈活查詢,實(shí)現(xiàn)精準(zhǔn)的信息篩選,解決人工分析的效率問(wèn)題;
(2)實(shí)現(xiàn)了手機(jī)持有人的社交網(wǎng)絡(luò)畫(huà)像,不僅僅能分析單部手機(jī)的社交信息,而且能夠?qū)Χ嗖渴謾C(jī)進(jìn)行關(guān)聯(lián)分析,對(duì)手機(jī)持有者的生活交際圈進(jìn)行了全方面掌控以及分析,便于分析人員更好的掌握手機(jī)持有人的社交網(wǎng)絡(luò)和動(dòng)向;
(3)實(shí)現(xiàn)了手機(jī)持有人的移動(dòng)軌跡畫(huà)像,通過(guò)對(duì)手機(jī)各種應(yīng)用及位置信息的分析與挖掘,設(shè)計(jì)手機(jī)用戶的移動(dòng)軌跡畫(huà)像功能,重現(xiàn)手機(jī)用戶的行蹤,便于辦案人員掌握手機(jī)持有人的蹤跡;
(4)實(shí)現(xiàn)了手機(jī)持有人的用戶偏好畫(huà)像。通過(guò)手機(jī)用戶的應(yīng)用程序和網(wǎng)頁(yè)的訪問(wèn)記錄,實(shí)現(xiàn)手機(jī)用戶偏好畫(huà)像功能,推斷用戶的性格、喜好、職業(yè)等。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例中方法流程圖。
圖2為本發(fā)明實(shí)施例中方法的社交網(wǎng)絡(luò)畫(huà)像示意圖。
圖3為本發(fā)明實(shí)施例中方法的多部手機(jī)的社交網(wǎng)絡(luò)結(jié)果可視化效果圖。(通過(guò)點(diǎn)的大小判斷手機(jī)持有人與其他對(duì)象的聯(lián)系頻率,每一個(gè)點(diǎn)即為手機(jī)持有人的一個(gè)聯(lián)系對(duì)象。)
圖4為本發(fā)明實(shí)施例中方法的移動(dòng)軌跡畫(huà)像流程圖。
圖5為本發(fā)明實(shí)施例中方法的gps信息提取流程圖。
具體實(shí)施方式
為了便于本領(lǐng)域普通技術(shù)人員理解和實(shí)施本發(fā)明,下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實(shí)施示例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明提供的一種面向智能終端的深度分析與用戶畫(huà)像系統(tǒng),包括個(gè)人計(jì)算機(jī)和服務(wù)器;個(gè)人計(jì)算機(jī)用于對(duì)已經(jīng)獲取到的數(shù)據(jù)(包括通過(guò)已有算法恢復(fù)的數(shù)據(jù))進(jìn)行存儲(chǔ)分類(lèi)以及數(shù)據(jù)挖掘與分析、數(shù)字畫(huà)像等一系列操作。服務(wù)器用于保存用戶信息、保存案件信息以及提取案件信息,便于相關(guān)警務(wù)人員以及司法人員對(duì)相關(guān)案件進(jìn)行即時(shí)查詢,提高工作效率,減輕工作復(fù)雜度。
本實(shí)施例的服務(wù)器包括保存用戶信息的服務(wù)器、保存案件信息的服務(wù)器、提取案件信息的服務(wù)器;保存用戶信息的服務(wù)器用于保護(hù)合法用戶的個(gè)人賬號(hào)信息,包括用戶的用戶名、口令和以及用于數(shù)字簽名的特征信息;保存案件信息的服務(wù)器將保存全國(guó)違法犯罪人員信息、全國(guó)人口信息、全國(guó)被盜搶汽車(chē)信息、全國(guó)公安人事管理信息等等;提取案件信息的服務(wù)器系統(tǒng)將通過(guò)權(quán)限機(jī)制判定用戶是否有權(quán)限閱覽案件信息以及提取相關(guān)案件信息,將案件信息傳輸?shù)絺€(gè)人計(jì)算機(jī),供警務(wù)人員以及司法人員得到更多可用信息。
請(qǐng)見(jiàn)圖1,本發(fā)明提供的一種面向智能終端的深度分析與用戶畫(huà)像方法,其特征在于,包括以下步驟:
步驟1:提取數(shù)據(jù);包括從智能手機(jī)端獲取數(shù)據(jù)以及在個(gè)人計(jì)算機(jī)上對(duì)數(shù)據(jù)進(jìn)行提取、分類(lèi)、存儲(chǔ);具體實(shí)現(xiàn)包括以下子步驟:
步驟1.1:手機(jī)短信提??;
步驟1.2:手機(jī)聯(lián)系人提??;
步驟1.3:手機(jī)通話記錄提??;
步驟1.4:手機(jī)應(yīng)用程序提??;
步驟1.5:即時(shí)通訊信息提??;
步驟1.6:郵箱信息提??;
步驟1.7:瀏覽器信息提取:
步驟1.8:手機(jī)瀏覽器信息提取。
步驟2:數(shù)據(jù)預(yù)處理;對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,一般情況下收集到的數(shù)據(jù)都不適合直接運(yùn)用數(shù)據(jù)挖掘算法進(jìn)行計(jì)算,還有些數(shù)據(jù)雖然適合計(jì)算,但是需要進(jìn)行歸一化操作,這些都是數(shù)據(jù)預(yù)處理部分。通過(guò)對(duì)提取的手機(jī)數(shù)據(jù)進(jìn)行恢復(fù)、篩選以及剔除部分無(wú)用信息,形成一個(gè)有效信息的集合,提高工作效率,降低復(fù)雜度。
步驟3:數(shù)據(jù)畫(huà)像;包括對(duì)手機(jī)持有人的社交網(wǎng)絡(luò)畫(huà)像、移動(dòng)軌跡畫(huà)像和用戶偏好畫(huà)像。
請(qǐng)見(jiàn)圖2和圖3,社交網(wǎng)絡(luò)畫(huà)像主要通過(guò)對(duì)手機(jī)持有者的聯(lián)系人、通話記錄、短信、qq、微信等社交信息進(jìn)行關(guān)聯(lián)分析,其中包括對(duì)單部手機(jī)的分析和多部手機(jī)的分析。通過(guò)對(duì)單部手機(jī)的的社交網(wǎng)絡(luò)畫(huà)像,構(gòu)建出手機(jī)持有者的社交網(wǎng)絡(luò)圈,例如社交對(duì)象、聯(lián)系頻率、通信時(shí)間、通信內(nèi)容等,通過(guò)簡(jiǎn)單的關(guān)鍵字查詢,篩選出司法機(jī)關(guān)以及警務(wù)人員所需的手機(jī)持有者的可靠、有效的通信內(nèi)容;通過(guò)對(duì)多部手機(jī)的社交網(wǎng)絡(luò)畫(huà)像,找到手機(jī)持有者與手機(jī)持有者之間的關(guān)系,并且利用e-charts技術(shù)形象化的展示出效果,通過(guò)機(jī)器學(xué)習(xí)算法得到一張深度關(guān)聯(lián)分析表,綜合所有的社交信息,找到與該手機(jī)持有者最親密的手機(jī)持有者。
請(qǐng)見(jiàn)圖4,移動(dòng)軌跡畫(huà)像技術(shù)主要通過(guò)包括照相機(jī)、snote、剪切庫(kù)和錄音機(jī)等應(yīng)用程序以及基站、wifi等信息的提取,構(gòu)造出手機(jī)持有者的移動(dòng)路線,可以了解到手機(jī)持有者曾經(jīng)去過(guò)的地方,從而加大了找到線索和證據(jù)的機(jī)會(huì)。
用戶偏好畫(huà)像技術(shù)主要通過(guò)手機(jī)用戶的應(yīng)用程序和網(wǎng)頁(yè)的訪問(wèn)記錄,實(shí)現(xiàn)手機(jī)用戶偏好畫(huà)像功能,推斷出用戶的性格、喜好、職業(yè)等,幫助司法人員以及警務(wù)人員進(jìn)行人物畫(huà)像。
步驟4:數(shù)據(jù)融合(如果需要,包括從服務(wù)器端提取到的數(shù)據(jù));
由于挖掘到的信息來(lái)自多個(gè)部分,有來(lái)自通話記錄和短信信息的,有來(lái)自百度地圖、攜程等,有的甚至來(lái)自于全國(guó)人口信息管理系統(tǒng)、全國(guó)被盜汽車(chē)信息系統(tǒng),這些信息信息源不同,如果只是對(duì)它們分別進(jìn)行處理,可能會(huì)漏掉我們想要得到的犯罪證據(jù)。運(yùn)用數(shù)據(jù)融合技術(shù)可以將所有這些異源信息進(jìn)行統(tǒng)一處理,綜合分析,從而能夠更好地得到我們想要的證據(jù)。
步驟5:人物畫(huà)像;對(duì)手機(jī)持有人的社交網(wǎng)絡(luò)畫(huà)像、移動(dòng)軌跡畫(huà)像和用戶偏好畫(huà)像進(jìn)行綜合分析,運(yùn)用數(shù)據(jù)融合技術(shù)可以將所有這些異源信息進(jìn)行統(tǒng)一處理,綜合分析,從而能夠更好地得到更加高效率的證據(jù),形成時(shí)間、空間以及手機(jī)持有人行為習(xí)慣的畫(huà)像,最終實(shí)現(xiàn)現(xiàn)實(shí)模擬。
本實(shí)施例在應(yīng)用中包括注冊(cè)過(guò)程、認(rèn)證過(guò)程、數(shù)據(jù)提取過(guò)程、社交網(wǎng)絡(luò)畫(huà)像過(guò)程、移動(dòng)軌跡畫(huà)像過(guò)程、用戶偏好畫(huà)像等過(guò)程。
個(gè)人計(jì)算機(jī)的合法用戶注冊(cè),具體過(guò)程包括以下步驟:
步驟a1:待注冊(cè)用戶通過(guò)個(gè)人計(jì)算機(jī)輸入用戶信息,并提交,其中用戶信息包括用戶賬號(hào)、密碼、基本個(gè)人信息;如果用戶信息填寫(xiě)正確,則保存,否則返回用戶信息錯(cuò)誤信息;
步驟a2:管理員通過(guò)個(gè)人計(jì)算機(jī)對(duì)提交的待注冊(cè)的用戶信息進(jìn)行審核,若審核通過(guò)則返回注冊(cè)成功信息,計(jì)算用戶信息哈希值,并將用戶信息哈希值發(fā)送給服務(wù)器,否則返回注冊(cè)失敗信息;
步驟a3:服務(wù)器接收來(lái)自個(gè)人計(jì)算機(jī)發(fā)送的用戶信息哈希值,將其存儲(chǔ)在數(shù)據(jù)庫(kù)中;
認(rèn)證過(guò)程用于注冊(cè)用戶登錄,具體過(guò)程包括以下步驟:
步驟b1:用戶通過(guò)個(gè)人計(jì)算機(jī)在登陸頁(yè)面中輸入賬戶名、口令后提交;
步驟b2:個(gè)人計(jì)算機(jī)計(jì)算驗(yàn)證信息的哈希值,發(fā)送給服務(wù)器;驗(yàn)證信息包括賬戶名、口令;
步驟b3:服務(wù)器驗(yàn)證來(lái)自個(gè)人計(jì)算機(jī)的驗(yàn)證信息哈希值,若能夠與數(shù)據(jù)庫(kù)中的驗(yàn)證信息相匹配,則給個(gè)人計(jì)算機(jī)返回驗(yàn)證成功信息,否則返回驗(yàn)證失敗信息;
步驟b4:若個(gè)人計(jì)算機(jī)收到驗(yàn)證成功信息,則顯示登陸成功;否則登陸失敗;
數(shù)據(jù)提取過(guò)程,主要包括從智能手機(jī)端獲取數(shù)據(jù)以及在個(gè)人計(jì)算機(jī)上對(duì)數(shù)據(jù)進(jìn)行提取、分類(lèi)、存儲(chǔ),從而便于后續(xù)的數(shù)字畫(huà)像過(guò)程。前者目前已知的方法主要包括三個(gè)方面,一是通過(guò)sim卡或者sd卡進(jìn)行讀取信息,二是直接提取芯片中的內(nèi)容,三是通過(guò)usb提取。前者并非本系統(tǒng)的工作重點(diǎn),所述數(shù)據(jù)的提取、分類(lèi)、存儲(chǔ)具體步驟如下:
步驟c1:手機(jī)短信:通過(guò)基于adb機(jī)制的adbpull命令對(duì)android手機(jī)的文件系統(tǒng)進(jìn)行邏輯取證,快速抽取一個(gè)邏輯復(fù)本到本地目錄下,對(duì)此目錄下的文件進(jìn)行分析可以看到短信信息的文件路徑為“/data/data/com.android.prov-iders.telephony/”。在取證過(guò)程中,已發(fā)信息、已收信息、草稿箱和發(fā)送失敗的信息都應(yīng)該是取證重點(diǎn)關(guān)注的對(duì)象,在提取解析過(guò)程中應(yīng)該重點(diǎn)關(guān)注短信發(fā)送的時(shí)間、內(nèi)容、接收方、發(fā)送方、消息狀態(tài)等等。
通過(guò)人工分析可以發(fā)現(xiàn),短信中的字段信息比較雜亂無(wú)序,但字段之間存在著某種關(guān)聯(lián)性,因此需要通過(guò)調(diào)用sqlite的應(yīng)用接口對(duì)短信數(shù)據(jù)庫(kù)信息進(jìn)行有選擇性地提取,對(duì)短信的時(shí)間、發(fā)送者、接收者、短信內(nèi)容等與取證相關(guān)的重要信息進(jìn)行可視化展現(xiàn),讓取證人員能夠快速找到案件相關(guān)證據(jù)。
步驟c2:手機(jī)聯(lián)系人:對(duì)提取到本地目錄下的邏輯復(fù)本進(jìn)行分析,可以發(fā)現(xiàn)聯(lián)系人信息的文件路徑為“/data/data/com.android.providers.contacts/”。對(duì)表格字段進(jìn)行分析,可以看出一個(gè)聯(lián)系人信息可以會(huì)產(chǎn)生多行記錄,可以通過(guò)聯(lián)系人索引號(hào)將某個(gè)聯(lián)系人的詳細(xì)信息進(jìn)行關(guān)聯(lián),形成完整的聯(lián)系人信息,通過(guò)調(diào)用sqlite的應(yīng)用接口進(jìn)行可視化展現(xiàn),有助于案件信息的采集和處理。
步驟c3:手機(jī)通話記錄:通話記錄的數(shù)據(jù)存儲(chǔ)在“/data/data/com.android.pr-oviders.contacts/databases”路徑下的contacts2.db的calls表中。從calls表中的字段信息分析可以看出,number、date、duration、type、raw_contact_id這五個(gè)字段信息可以完全表示通話記錄的所有信息,因此將這些數(shù)據(jù)進(jìn)行關(guān)聯(lián),以可視化的方式進(jìn)行展現(xiàn),同時(shí)導(dǎo)出成excel格式的表格形式進(jìn)行保存,通過(guò)excel表格對(duì)數(shù)據(jù)進(jìn)行更加直觀和有側(cè)重點(diǎn)的篩選,比如將這些信息按照通話長(zhǎng)短進(jìn)行排序等,提高破案的速度。
步驟c4:手機(jī)應(yīng)用程序:根據(jù)android系統(tǒng)架構(gòu)和數(shù)據(jù)存儲(chǔ)機(jī)制可以了解,android應(yīng)用程序主要將數(shù)據(jù)存儲(chǔ)在內(nèi)部存儲(chǔ)器上,內(nèi)部存儲(chǔ)器通過(guò)android應(yīng)用編輯接口(api)進(jìn)行控制。當(dāng)安裝一個(gè)應(yīng)用程序時(shí),系統(tǒng)會(huì)在/data/data子目錄下使用這個(gè)應(yīng)用程序包的名字為此應(yīng)用程序建立一個(gè)內(nèi)部存儲(chǔ)器。例如,android瀏覽器程序包的默認(rèn)名字為com.android.browser,因此,數(shù)據(jù)文件將會(huì)被存儲(chǔ)在子目錄“/data/data/com.android.browser”下。
步驟c5:即時(shí)通訊類(lèi):即時(shí)通訊(instantmessaging,簡(jiǎn)稱(chēng)im)是一個(gè)終端服務(wù),允許兩人或多人使用網(wǎng)路即時(shí)的傳遞文字訊息、檔案、語(yǔ)音與視頻交流,例如:米聊、qq、微信、飛信、skype、msn等應(yīng)用形式。
國(guó)內(nèi)主流的即時(shí)通訊類(lèi)應(yīng)用程序有qq等。本發(fā)明主要對(duì)qq2011的應(yīng)用程序進(jìn)行詳細(xì)解析。2011版本的qq信息存儲(chǔ)在“/data/data/com.tencent.qq/dat-abases/”路徑下的qq_database數(shù)據(jù)庫(kù)文件中。
步驟c6:郵箱類(lèi)信息:根據(jù)應(yīng)用程序標(biāo)準(zhǔn)目錄可知,一般情況下與用戶相關(guān)的信息都存儲(chǔ)在以應(yīng)用程序包命名的文件夾下的數(shù)據(jù)庫(kù)文件中,然而gmail是個(gè)特例,他的用戶登陸信息存儲(chǔ)在/data/system/路徑下的accounts.db數(shù)據(jù)庫(kù)中。賬號(hào)信息包括用戶名、密碼、郵箱類(lèi)型。name為用戶登錄的賬號(hào),type為郵箱類(lèi)型,password為登陸時(shí)的密碼。gmail的郵箱信息存儲(chǔ)在“/data/data/com.google.android.gm/databases”文件下的數(shù)據(jù)庫(kù)文件中,數(shù)據(jù)庫(kù)文件的命名方式為mailstore.+賬號(hào)信息。gmail數(shù)據(jù)結(jié)構(gòu)中包含很多表和索引,對(duì)這些表進(jìn)行分析可以發(fā)現(xiàn)郵箱的主要信息存儲(chǔ)在messagges、conversations、attachments這三張表中。
步驟c7:瀏覽器信息:
步驟c8:手機(jī)瀏覽器是用戶利用無(wú)線互聯(lián)網(wǎng)進(jìn)行信息瀏覽的主要工具,瀏覽器中存儲(chǔ)著大量的用戶個(gè)人數(shù)據(jù),例如qq密碼、社交網(wǎng)站的密碼、瀏覽的信息等等。目前主流的瀏覽器有qq瀏覽器、uc瀏覽器等。本發(fā)明主要對(duì)qq瀏覽器進(jìn)行提取和解析。
qq瀏覽器2.9版本的數(shù)據(jù)存儲(chǔ)在“/data/data/com.tencent.mtt/databases/”路徑下的database.db、default.db和webview.db數(shù)據(jù)庫(kù)中。對(duì)這三個(gè)數(shù)據(jù)庫(kù)文件進(jìn)行分析可以發(fā)現(xiàn)瀏覽器的信息主要存儲(chǔ)在database.db的history表、default.db的mtt_bookmarks表和webview.db的password表中。
社交網(wǎng)絡(luò)畫(huà)像過(guò)程,主要分為單部手機(jī)的社交網(wǎng)絡(luò)畫(huà)像過(guò)程和多部手機(jī)的社交網(wǎng)絡(luò)畫(huà)像過(guò)程;具體步驟如下:
步驟d1:錄入數(shù)據(jù)庫(kù):將取證的所有手機(jī)進(jìn)行編號(hào),并錄入手機(jī)相關(guān)信息到數(shù)據(jù)庫(kù)phones表;將手機(jī)中的通話記錄、聯(lián)系人和短信信息提取出來(lái),錄入數(shù)據(jù)庫(kù);去除冗余信息,去除無(wú)效信息,將沒(méi)有接通的電話記錄刪除;將預(yù)處理結(jié)果交給echart進(jìn)行展示,在echart上可以進(jìn)行關(guān)系網(wǎng)的直觀分析。
步驟d2:數(shù)據(jù)分析處理:使用聚類(lèi)分析算法,得到某一手機(jī)擁有者通話較頻繁的時(shí)間段、通話次數(shù)多的聯(lián)系人、通話總時(shí)間長(zhǎng)的聯(lián)系人。在手機(jī)擁有者的通話頻繁時(shí)間段內(nèi),對(duì)其他手機(jī)進(jìn)行搜索,得到該時(shí)間段內(nèi)通信的網(wǎng)絡(luò),并得出在該時(shí)間段內(nèi)相互聯(lián)系頻繁的團(tuán)伙。
步驟d3:得到關(guān)系網(wǎng):獲得通話次數(shù)多的聯(lián)系人后,以該聯(lián)系人為關(guān)注點(diǎn),遞歸使用聚類(lèi)分析,得到一個(gè)以通話次數(shù)為主要標(biāo)準(zhǔn)的關(guān)系網(wǎng)。在傳銷(xiāo)等案件中,可以通過(guò)這種方式繪制出傳銷(xiāo)的大致關(guān)系網(wǎng)絡(luò),輔助以短信、微信、qq信息提取,為找到傳銷(xiāo)頭目和傳銷(xiāo)窩點(diǎn)提供便利。
步驟d4:結(jié)果可視化:通過(guò)數(shù)據(jù)關(guān)聯(lián)分析技術(shù),得到手機(jī)持有人的聯(lián)系網(wǎng)后,將該聯(lián)系網(wǎng)添加到新建成sqlite數(shù)據(jù)庫(kù)中,本系統(tǒng)便提取該數(shù)據(jù)庫(kù)內(nèi)容,將其以關(guān)系圖的形式呈現(xiàn)出來(lái)。結(jié)果可視化,具體實(shí)現(xiàn)步驟如下:
步驟d4.1:本發(fā)明將多部手機(jī)的各種數(shù)據(jù)表(包括通訊錄表,通話記錄表,短信記錄表等)整合在自己新建的sqlite數(shù)據(jù)庫(kù)中。鏈接sqlite數(shù)據(jù)庫(kù),從sqlite數(shù)據(jù)庫(kù)中取出這些數(shù)據(jù)。通過(guò)jdbc橋鏈接sqlite數(shù)據(jù)庫(kù)。
步驟d4.2:通過(guò)java輸出一種gexf文件。讀寫(xiě)xml文件需要工具,本項(xiàng)目使用的是dom4j。dom4j是一個(gè)java的xmlapi,用來(lái)讀寫(xiě)xml文件的,它的主要接口都在org.dom4j這個(gè)包中定義。下面稍微列出幾種:
attribute定義了xml的屬性。
document定義了xml文檔。
element定義了xml元素。
node為所有的dom4j中xml節(jié)點(diǎn)定義了多態(tài)行為。
本發(fā)明以輸出通訊錄和通話記錄的gexf文件為例。從sqlite數(shù)據(jù)庫(kù)中通訊錄和通話記錄的表取出其中的每列數(shù)據(jù),依次按列輸出。然后建一個(gè)node類(lèi)和edge類(lèi),這兩個(gè)類(lèi)分別從通訊錄列和通話記錄列得到數(shù)據(jù),然后將數(shù)據(jù)通過(guò)方法接口傳到主類(lèi)中。主類(lèi)中使用dom4j中的的方法將這些數(shù)據(jù)利用循環(huán)依次填到node元素和edge元素中去,填入的數(shù)據(jù)可以根據(jù)數(shù)據(jù)表中的列來(lái)決定。而xml文件并非是最終需要的文件格式,還需要將生成的xml文件,只需要在xml文件加上header。如下:
<gexfxmlns=http://www.gexf.net/1.2draftxmlns:viz="http://www.gexf.net/1.2draft/viz"xmlns:xsi="http://www.w3.org/2001/xmlschema-instance"version="1.2"xsi:schemalocation="http://www.gexf.net/1.2drafthttp://www.gexf.net/1.2draft/gexf.xsd">
步驟d4.3:解析本地gexf文件傳到html文件中去。本發(fā)明將通話頻率的數(shù)據(jù)傳到新加的一個(gè)名為”call_fre”屬性中去,編寫(xiě)解析腳本,便于解析gexf文件,將其中的”call_fre“屬性輸出到html文件中,使得關(guān)系圖中的通話頻率數(shù)據(jù)呈現(xiàn)出來(lái)。
步驟d4.4:簡(jiǎn)化關(guān)系圖,使界面更加直觀簡(jiǎn)明。本發(fā)明在echarts的基礎(chǔ)上添css語(yǔ)句,讓它的界面變得更加美觀和直觀增加界面呈現(xiàn)的動(dòng)態(tài)效果,讓關(guān)系圖更加的人性化,可觀化。具體效果可詳見(jiàn)源代碼和成果圖。
步驟d4.5:針對(duì)于用戶的社交網(wǎng)絡(luò)關(guān)系圖,本發(fā)明添加了點(diǎn)擊事件,將通話頻率和關(guān)系最緊密的聯(lián)系人通過(guò)鼠標(biāo)點(diǎn)擊直觀的呈現(xiàn)出來(lái)。將這些數(shù)據(jù)放在一個(gè)表格中,然后將表格以一種最美觀的形式呈現(xiàn)出來(lái)。
移動(dòng)軌跡畫(huà)像過(guò)程,主要可以通過(guò)包括照相機(jī)、snote、剪切庫(kù)和錄音機(jī)等應(yīng)用程序以及基站、wifi等信息的提取,構(gòu)造出手機(jī)持有者的移動(dòng)路線,從而進(jìn)行移動(dòng)軌跡畫(huà)像過(guò)程。請(qǐng)見(jiàn)圖5,本發(fā)明以照相機(jī)為例,具體畫(huà)像過(guò)程如下:
步驟e1:用java實(shí)現(xiàn)照片exif信息提取模塊,對(duì)所有圖片進(jìn)行信息的提取,并將照片的路徑、拍攝時(shí)間和位置信息打包成自定義的photoinfo對(duì)象放入list中。接收exif信息提取模塊的list后,把數(shù)據(jù)轉(zhuǎn)換成json字符串的形式,在開(kāi)頭添加varphotoinfolist=,將處理后的字符串寫(xiě)入photoinfo.js文件中用于讀取。通過(guò)處理photoinfo.js內(nèi)的json數(shù)據(jù),動(dòng)態(tài)向已初始化的地圖內(nèi)加入標(biāo)注點(diǎn)、標(biāo)注點(diǎn)相關(guān)信息和軌跡線,并提供聚類(lèi)和篩選選項(xiàng)以供更有針對(duì)性的顯示。
步驟e2:通過(guò)得到的exif信息,根據(jù)字節(jié)內(nèi)容,判斷是大端存儲(chǔ),還是小端存儲(chǔ),如果是0x4949(“ii”),表示采用intel方式的小端存儲(chǔ),如果是0x4d4d(“mm”),表示采用motorola方式的大端存儲(chǔ)。最后根據(jù)ifd2(imagefiledirectory,描述下一個(gè)字符)獲得gps信息。
步驟e3:準(zhǔn)備地圖初始化。
步驟e4:以json為載體進(jìn)行數(shù)據(jù)轉(zhuǎn)換,對(duì)獲取的坐標(biāo)進(jìn)行轉(zhuǎn)換,描繪gps信息點(diǎn)。
步驟e5:通過(guò)百度地圖api的bmap.polyline可以繪制從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的線條。本發(fā)明將照片信息按照時(shí)間的先后順序進(jìn)行了排列,調(diào)用newbmap.polyline(pointarray)就可以生成一系列能夠反映行蹤的折線,幫助取證人員了解手機(jī)持有人最近的動(dòng)向。
本發(fā)明加入坐標(biāo)點(diǎn)的篩選功能,更準(zhǔn)確地了解某一段時(shí)間內(nèi)待取證手機(jī)持有者的動(dòng)向。對(duì)于在某一段時(shí)間內(nèi)活動(dòng)特別頻繁的地方,本作品采用k-means聚類(lèi)算法對(duì)這一類(lèi)坐標(biāo)點(diǎn)進(jìn)行了聚類(lèi),在地圖范圍大的情況下將一系列坐標(biāo)點(diǎn)匯聚成一個(gè)大的點(diǎn)標(biāo)記。
地圖初始化,具體步驟如下:
步驟e3.1:要使用百度地圖api,先要申請(qǐng)密鑰ak,由于恩發(fā)明使用的是javascriptapi,因此申請(qǐng)瀏覽器類(lèi)型的ak。
步驟e3.2:在頁(yè)面中設(shè)定一個(gè)div,設(shè)置id,作為百度地圖顯示的容器。
步驟e3.3:創(chuàng)建地圖實(shí)例,通過(guò)new操作符創(chuàng)建map類(lèi)完成;確立一個(gè)初始點(diǎn)。創(chuàng)建點(diǎn)的方式為newbmap.point(lng,lat),lng代表經(jīng)度,正數(shù)為東經(jīng)。lat代表緯度,正數(shù)為北緯。在創(chuàng)建好地圖實(shí)例和點(diǎn)之后,將地圖初始化。
用戶偏好畫(huà)像過(guò)程,具體原理如下:
通過(guò)機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理,主要包括訓(xùn)練數(shù)據(jù)采集,特征提取,預(yù)測(cè)模型訓(xùn)練和鏈接預(yù)測(cè)四個(gè)步驟,通過(guò)使用能夠有效度量數(shù)據(jù)之間的多維度特征集合,并使用多項(xiàng)式核函數(shù)支持向量機(jī)快速算法進(jìn)行模型訓(xùn)練和鏈接預(yù)測(cè),達(dá)到很高的預(yù)測(cè)精度和預(yù)測(cè)速度。
鏈接預(yù)測(cè)問(wèn)題是根據(jù)網(wǎng)絡(luò)的歷史狀態(tài)信息對(duì)網(wǎng)絡(luò)中任意一對(duì)節(jié)點(diǎn)之間在當(dāng)前時(shí)刻是否存在鏈接,或在未來(lái)一段時(shí)間內(nèi)是否會(huì)產(chǎn)生鏈接進(jìn)行判斷。實(shí)際上鏈接預(yù)測(cè)問(wèn)題是對(duì)網(wǎng)絡(luò)演化問(wèn)題的極端簡(jiǎn)化,將對(duì)全網(wǎng)所有節(jié)點(diǎn)同時(shí)進(jìn)行鏈接預(yù)測(cè),簡(jiǎn)化為只對(duì)特定的某一對(duì)節(jié)點(diǎn)進(jìn)行鏈接預(yù)測(cè)。
在采集到數(shù)據(jù)信息后,需要對(duì)其中的一些數(shù)據(jù)對(duì)提取反映我們研究關(guān)注關(guān)系鏈接的特征,構(gòu)成每個(gè)鏈接的特征矢量,并對(duì)這些特征矢量進(jìn)行類(lèi)別標(biāo)注,生成機(jī)器學(xué)習(xí)算法的訓(xùn)練集以及用于驗(yàn)證鏈接預(yù)測(cè)性能的預(yù)測(cè)集。特征提取是機(jī)器學(xué)習(xí)方法中最終要的一環(huán),特征對(duì)樣本類(lèi)別區(qū)分的反映程度直接決定了使用機(jī)器學(xué)習(xí)算法求解分類(lèi)問(wèn)題的性能。
本發(fā)明的用戶偏好畫(huà)像過(guò)程主要通過(guò)瀏覽器信息以及京東、淘寶等軟件瀏覽信息,通過(guò)機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理,分析出手機(jī)持有者的從事相關(guān)職業(yè)、喜好、年齡、生活習(xí)慣等等。
本發(fā)明能夠?yàn)槭褂谜咛峁?/p>
(1)對(duì)設(shè)備使用者的身份進(jìn)行準(zhǔn)確、有效的認(rèn)證保證用戶的合法性,防止案件信息的泄露以及篡改;
(2)本發(fā)明在聯(lián)系人、通話記錄以及短信等方面實(shí)現(xiàn)了頻率、時(shí)長(zhǎng)等方面的靈活查詢,實(shí)現(xiàn)精準(zhǔn)的信息篩選,解決人工分析的效率問(wèn)題;
(3)本發(fā)明不僅僅能分析單部手機(jī)的社交信息,而且能夠?qū)Χ嗖渴謾C(jī)進(jìn)行關(guān)聯(lián)分析,對(duì)手機(jī)持有者的生活交際圈進(jìn)行了全方面掌控以及分析,便于分析人員更好的掌握手機(jī)持有人的社交網(wǎng)絡(luò)和動(dòng)向;
(4)本發(fā)明通過(guò)對(duì)手機(jī)各種應(yīng)用及位置信息的分析與挖掘,設(shè)計(jì)手機(jī)用戶的移動(dòng)軌跡畫(huà)像功能,重現(xiàn)手機(jī)用戶的行蹤,便于辦案人員掌握手機(jī)持有人的蹤跡;
(5)本發(fā)明通過(guò)手機(jī)用戶的應(yīng)用程序和網(wǎng)頁(yè)的訪問(wèn)記錄,實(shí)現(xiàn)手機(jī)用戶偏好畫(huà)像功能,推斷用戶的性格、喜好、職業(yè)等。
(6)本發(fā)明通過(guò)個(gè)人計(jì)算機(jī)與服務(wù)器的交互式設(shè)計(jì),司法機(jī)關(guān)及辦案人員獲得和提取的信息源更加廣泛,有利于提高相關(guān)人員的破案效率。
(7)本發(fā)明能夠在司法調(diào)查中很好的提供幫助,高效的幫助司法人員以及警務(wù)人員進(jìn)行案件以及信息查詢。
應(yīng)當(dāng)理解的是,本說(shuō)明書(shū)未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。
應(yīng)當(dāng)理解的是,上述針對(duì)較佳實(shí)施例的描述較為詳細(xì),并不能因此而認(rèn)為是對(duì)本發(fā)明專(zhuān)利保護(hù)范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán)利要求所保護(hù)的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護(hù)范圍之內(nèi),本發(fā)明的請(qǐng)求保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。