亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種終端設(shè)備的特征信息的提取方法及裝置與流程

文檔序號:12622495閱讀:649來源:國知局
一種終端設(shè)備的特征信息的提取方法及裝置與流程

本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種終端設(shè)備的特征信息的提取方法及裝置。



背景技術(shù):

隨著移動通信技術(shù)和各種業(yè)務(wù)應(yīng)用的快速發(fā)展,國內(nèi)外涌現(xiàn)出大批移動設(shè)備制造商,且移動終端和移動操作系統(tǒng)的發(fā)展變化也極為迅速。

對于運(yùn)營商而言,能夠掌握移動網(wǎng)絡(luò)中的這些設(shè)備信息和系統(tǒng)信息,一方面,可以更好的了解客戶信息,優(yōu)化網(wǎng)絡(luò)服務(wù);另一方面,可以通過收集各設(shè)備和系統(tǒng)的市場份額來更好的推廣產(chǎn)品。但是技術(shù)中提取移動設(shè)備信息的方法及手段不夠完善,無法準(zhǔn)確提取移動設(shè)備信息及系統(tǒng)信息。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的在于提供一種終端設(shè)備的特征信息的提取方法及裝置,使得運(yùn)營商能夠準(zhǔn)確的提取移動設(shè)備的特征信息,更好的優(yōu)化網(wǎng)絡(luò)服務(wù)。

為了達(dá)到上述目的,本發(fā)明實施例提供一種終端設(shè)備的特征信息的提取方法,包括:

根據(jù)終端設(shè)備的特征信息以及每個特征信息對應(yīng)的用戶代理User-Agent字符串,構(gòu)建標(biāo)識所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫文件;

采集第一終端設(shè)備發(fā)送的請求報文,從所述請求報文中獲取所述第一終端設(shè)備的第一User-Agent字符串;

根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

其中,所述終端設(shè)備的特征信息包括分別從多個維度獲取的特征信息;其中,

所述多個維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號中的至少一種。

其中,采集第一終端設(shè)備發(fā)送的請求報文,從所述請求報文中獲取所述第一終端設(shè)備的第一User-Agent字符串,具體包括:

采集第一終端設(shè)備發(fā)送的HTTP報文,從所述HTTP報文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

其中,根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息,具體包括:

根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息。

其中,所述提取方法還包括:

若所述第一User-Agent字符串對應(yīng)多個第一特征信息且所述多個第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長度;

選取所述長度最長的第一特征信息,作為所述第一終端設(shè)備的特征信息。

本發(fā)明實施例還提供一種終端設(shè)備的特征信息的提取裝置,包括:

構(gòu)建模塊,用于根據(jù)終端設(shè)備的特征信息以及每個特征信息對應(yīng)的用戶代理User-Agent字符串,構(gòu)建標(biāo)識所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫文件;

采集模塊,用于采集第一終端設(shè)備發(fā)送的請求報文,從所述請求報文中獲取所第一述終端設(shè)備的第一User-Agent字符串;

確定模塊,用于根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

其中,所述終端設(shè)備的特征信息包括分別從多個維度獲取的特征信息;其中,

所述多個維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號中的至少一種。

其中,所述采集模塊包括:

采集子模塊,用于采集第一終端設(shè)備發(fā)送的HTTP報文,從所述HTTP報文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

其中,所述確定模塊具體包括:

確定子模塊,用于根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息。

其中,所述提取裝置還包括:

獲取模塊,用于若所述第一User-Agent字符串對應(yīng)多個第一特征信息且所述多個第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長度;

信息確定模塊,用于選取所述長度最長的第一特征信息,作為所述第一終端設(shè)備的特征信息。

本發(fā)明的上述技術(shù)方案至少具有如下有益效果:

本發(fā)明實施例的終端設(shè)備的特征信息的提取方法及裝置中,首先構(gòu)建標(biāo)識終端設(shè)備的特征信息與User-Agent字符串之間的映射關(guān)系的User-Agent特征庫文件,進(jìn)而根據(jù)第一終端設(shè)備的待分析的User-Agent字符串從所述User-Agent特征庫文件中查找相匹配的第一特征信息,得到第一終端設(shè)備的特征信息;該提取方法通過解析User-Agent字符串,獲得相關(guān)終端設(shè)備信息的識別結(jié)果,有效的解決了運(yùn)營商對終端設(shè)備信息獲取的需求。

附圖說明

圖1表示本發(fā)明實施例的終端設(shè)備的特征信息的提取方法的基本步驟流程圖;

圖2表示AC算法的goto表結(jié)構(gòu)示意圖;

圖3表示AC算法的output表結(jié)構(gòu)示意圖;

圖4表示本發(fā)明實施例的終端設(shè)備的特征信息的提取方法中構(gòu)建AC特征庫文件的步驟流程圖;

圖5表示本發(fā)明實施例的終端設(shè)備的特征信息的提取方法中提取特征信息的具體步驟流程圖;

圖6表示本發(fā)明實施例的終端設(shè)備的特征信息的提取裝置的組成結(jié)構(gòu)示意圖。

具體實施方式

為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實施例進(jìn)行詳細(xì)描述。

本發(fā)明針對現(xiàn)有技術(shù)中運(yùn)營商無法準(zhǔn)確獲取終端設(shè)備信息的問題,提供一種終端設(shè)備的特征信息的提取方法及裝置,首先構(gòu)建標(biāo)識終端設(shè)備的特征信息與User-Agent字符串之間的映射關(guān)系的User-Agent特征庫文件,進(jìn)而根據(jù)第一終端設(shè)備的待分析的User-Agent字符串從所述User-Agent特征庫文件中查找相匹配的第一特征信息,得到第一終端設(shè)備的特征信息;該提取方法通過解析User-Agent字符串,獲得相關(guān)終端設(shè)備信息的識別結(jié)果,有效的解決了運(yùn)營商對終端設(shè)備信息獲取的需求。

如圖1所示,本發(fā)明實施例提供一種終端設(shè)備的特征信息的提取方法,包括:

步驟11,根據(jù)終端設(shè)備的特征信息以及每個特征信息對應(yīng)的用戶代理User-Agent字符串,構(gòu)建標(biāo)識所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫文件;

步驟12,采集第一終端設(shè)備發(fā)送的請求報文,從所述請求報文中獲取所述第一終端設(shè)備的第一User-Agent字符串;

步驟13,根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

用戶代理User Agent(以下簡稱UA),是HTTP協(xié)議中的一部分,屬于頭域的組成之一,它的信息包括了硬件平臺、系統(tǒng)軟件、應(yīng)用軟件和用戶個人偏好等。如:

User-Agent:AppStore/2.0iOS/7.1.2model/iPhone3,1build/11D257(4;dt:27)

通過UA,能夠準(zhǔn)確的提取移動設(shè)備信息。

本發(fā)明的上述實施例中,終端設(shè)備的特征信息為能夠標(biāo)識該終端設(shè)備的信 息,例如特征信息的序列號、名稱等。且每個特征信息都存在有與之相對應(yīng)的User-Agent字符串,該User-Agent字符串即表明其特征信息的特征字串。上述User-Agent特征庫文件中將User-Agent字符串和與其對應(yīng)的特征信息一一對應(yīng)的保存,方便后續(xù)步驟的調(diào)用識別。

進(jìn)一步的,步驟12中對采集到的第一終端設(shè)備的數(shù)據(jù)域報文,獲取該數(shù)據(jù)域報文中包含的第一UA字符串,從而根據(jù)第一UA字符串,從所述UA特征庫文件中查找得到第一特征信息,該第一特征信息即為上述第一終端設(shè)備的特征信息。

具體的,為了全面的表示終端設(shè)備的特征信息,所述終端設(shè)備的特征信息包括分別從多個維度獲取的特征信息;其中,

所述多個維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號中的至少一種。其中,終端設(shè)備系統(tǒng)的特征信息一般為終端系統(tǒng)的版本號,終端設(shè)備廠商的特征信息一般為終端設(shè)備廠商的名字,終端設(shè)備型號的特征信息一般為終端設(shè)備的型號。

進(jìn)一步的,本發(fā)明上述實施例中,步驟12具體包括:

步驟121,采集第一終端設(shè)備發(fā)送的HTTP報文,從所述HTTP報文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

本發(fā)明實施例中,由于UA是HTTP協(xié)議中的一部分,故本發(fā)明實施例僅采集第一終端設(shè)備發(fā)送的HTTP報文,從HTTP.REQ中獲取UA字符串,該UA字符串即為第一UA字符串,該UA字符串中包括了第一終端設(shè)備的系統(tǒng)軟件、硬件平臺、系統(tǒng)軟件、應(yīng)用軟件或者用戶個人偏好等。

進(jìn)一步的,本發(fā)明上述實施例中,步驟13具體包括:

步驟131,根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息。

本發(fā)明的具體實施例中,具體為基于AC算法的輕量級多模匹配引擎,對UA字符串進(jìn)行識別,獲得相關(guān)設(shè)備信息的識別結(jié)果(即特征信息)。具體的,AC算法是一個經(jīng)典的多模式匹配算法,由三部分構(gòu)成,goto表,fail表和output表??梢员WC對于給定的長度為n的文本和模式集合P{p1,p2,...pm},在O(n)時 間復(fù)雜度內(nèi),找到文本中的所有目標(biāo)模式,而與模式集合的規(guī)模m無關(guān)。

假如有模式集合P{he,she,his,hers},如圖2所示為該模式的goto表、如圖3所示為該模式的output表。

AC算法對文本進(jìn)行匹配的具體步驟是。一開始,將i指向文本text[1...j]的起始位置,然后用text[i]從goto表的狀態(tài)D[0]開始執(zhí)行狀態(tài)跳轉(zhuǎn)。如果存在可行的跳轉(zhuǎn)方案D[0][text[i]]=p,p?。?,則將i增加1,同時轉(zhuǎn)移到狀態(tài)D[p]。如果不存在可行的轉(zhuǎn)移方案,則考察狀態(tài)D[p]的fail值,如果fail[p]不等于0,則轉(zhuǎn)移到D[fail[p]],再次查看D[fail[p]][text[i]]是否等于0,直到發(fā)現(xiàn)不為0的狀態(tài)轉(zhuǎn)移方案或者對于所有經(jīng)歷過的fail狀態(tài),對于當(dāng)前輸入text[i]都沒有非0的轉(zhuǎn)移方案為止,如果確實不存在非0的轉(zhuǎn)移方案,則將i增加1,同時轉(zhuǎn)移到D[0]繼續(xù)執(zhí)行跳轉(zhuǎn)。在每次跳轉(zhuǎn)到一個狀態(tài)D[p]時(fail跳轉(zhuǎn)不算),都需要查看一下output[p]是否指向可輸出的模式串,如果有,說明當(dāng)前位置匹配了某些模式串,將這些模式串輸出。

承續(xù)上例,本發(fā)明的上述實施例中,所述提取方法還包括:

步驟14,若所述第一User-Agent字符串對應(yīng)多個第一特征信息且所述多個第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長度;

步驟15,選取所述長度最長的第一特征信息,作為所述第一終端設(shè)備的特征信息。

需要說明的是,步驟14及步驟15是為了防止同一UA字符串對應(yīng)多個第一特征信息的情況,本發(fā)明實施例是選取其中信息長度最長的特征信息作為第一終端的特征信息。例如,根據(jù)第一UA字符串得到的匹配特征信息分別為iphone3和iphone3,1build;則此時選取iphone3,1build作為第一終端設(shè)備的特征信息。具體的,選取長度最長的第一特征信息作為第一終端設(shè)備的特征信息是基于長度越長精度越高的原理考慮的,僅為本發(fā)明的一較佳實施例;其他的如選擇長度最短的第一特征信息作為所述第一終端設(shè)備的特征信息在某種應(yīng)用場景下同樣適用,即其也應(yīng)屬于本發(fā)明實施例的保護(hù)范圍,其他一些預(yù)先設(shè)定的方式也同樣適用,在此不一一枚舉。

下面結(jié)合圖4及圖5對本發(fā)明實施例提供的特征信息的提取方法做詳細(xì)描述:

如圖4所示為本發(fā)明實施例中構(gòu)建UA特征庫文件的具體過程:

假設(shè)該文件從三個維度,設(shè)備系統(tǒng)system、終端設(shè)備廠商vendor以及終端設(shè)備型號brand來覆蓋終端設(shè)備的特征信息,具體步驟如下:

步驟401,事先以表格的形式分別記錄system、vendor、brand等設(shè)備信息的特征,表格中主要包括TOKEN_ID(序列號)、NAME(識別結(jié)果)、PATTERN數(shù)據(jù)(UA字符串)等信息;

步驟402,構(gòu)造system表,獲取并填充表中每條記錄的TOKEN_ID、NAME和PATTERN的數(shù)據(jù);

步驟403,構(gòu)造vendor表,獲取并填充表中每條記錄的TOKEN_ID、NAME、PATTERN的數(shù)據(jù);

步驟404,構(gòu)造brand表,獲取并填充表中每條記錄的TOKEN_ID、NAME、PATTERN的數(shù)據(jù);

步驟405,根據(jù)上述三個表生成總的UA特征庫文件,流程結(jié)束。

如圖5所示為本發(fā)明實施例中提取終端設(shè)備的特征信息的具體執(zhí)行過程:

假設(shè)該文件從三個維度,設(shè)備系統(tǒng)system、終端設(shè)備廠商vendor以及終端設(shè)備型號brand來覆蓋終端設(shè)備的特征信息,當(dāng)設(shè)備特征庫中覆蓋了UA字符串中的終端設(shè)備信息時具體步驟如下:

步驟501,加載上述UA特征庫文件;

步驟502,采集HTTP報文,從HTTP.REQ中獲取第一UA字符串;

步驟503,根據(jù)第一UA字符串運(yùn)用AC算法查找上述UA特征庫文件,獲取匹配結(jié)果;

步驟504,遍歷每個匹配結(jié)果。對每個匹配結(jié)果,計算匹配部分的長度;對每種類型的識別結(jié)果,記錄本組內(nèi)匹配的特征長度最長的ID和長度。

步驟,505,返回終端系統(tǒng)版本號。

步驟506,返回終端品牌。

步驟507,返回終端廠家,結(jié)束流程。

為了更好的實現(xiàn)上述目的,如圖6所示,本發(fā)明實施例還提供一種終端設(shè)備的特征信息的提取裝置,包括:

構(gòu)建模塊61,用于根據(jù)終端設(shè)備的特征信息以及每個特征信息對應(yīng)的用戶 代理User-Agent字符串,構(gòu)建標(biāo)識所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫文件;

采集模塊62,用于采集第一終端設(shè)備發(fā)送的請求報文,從所述請求報文中獲取所第一述終端設(shè)備的第一User-Agent字符串;

確定模塊63,用于根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

具體的,本發(fā)明的上述實施例中,所述終端設(shè)備的特征信息包括分別從多個維度獲取的特征信息;其中,

所述多個維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號中的至少一種。

具體的,本發(fā)明的上述實施例中,所述采集模塊62包括:

采集子模塊,用于采集第一終端設(shè)備發(fā)送的HTTP報文,從所述HTTP報文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

具體的,本發(fā)明的上述實施例中,所述確定模塊63具體包括:

確定子模塊,用于根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫文件中查找與所述第一User-Agent字符串對應(yīng)的第一特征信息。

具體的,本發(fā)明的上述實施例中,所述提取裝置還包括:

獲取模塊,用于若所述第一User-Agent字符串對應(yīng)多個第一特征信息且所述多個第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長度;

信息確定模塊,用于選取所述長度最長的第一特征信息,作為所述第一終端設(shè)備的特征信息。

需要說明的是,本發(fā)明的上述實施例提供的終端設(shè)備的特征信息的提取裝置是應(yīng)用上述終端設(shè)備的特征信息的提取方法的裝置,則上述提取方法的所有實施例均適用于該提取裝置,且均能達(dá)到相同或相似的有益效果。

以上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1