本發(fā)明涉及機械測試領(lǐng)域,特別地,涉及一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法與裝置。
背景技術(shù):
現(xiàn)有基于語義分析的特征提取方法能有效地識別出單個目標協(xié)議中的協(xié)議特征,其中,利用語義消息將LDA模型應(yīng)用在協(xié)議簽名識別中,無須協(xié)議先驗知識的情況下即可將單個目標協(xié)議從混雜原始數(shù)據(jù)流中識別出來,準確性較高。
在進行LDA提取協(xié)議特征之前,需要對原始數(shù)據(jù)包進行分割,現(xiàn)有N-Gram模型對原始網(wǎng)絡(luò)數(shù)據(jù)包有效載荷進行預(yù)處理既適用于文本協(xié)議,也適用于二進制協(xié)議,具有較好的系統(tǒng)的通用性。
現(xiàn)有基于語義分析的協(xié)議識別方法是一種二類分類方法,而現(xiàn)實場景往往是多種協(xié)議判決問題,若將現(xiàn)有方法應(yīng)用到多類問題中,存在如下問題:
第一,若要對R種目標協(xié)議進行識別,需要建立對應(yīng)R個特征提取模型和R個分類器,在線上識別時需要經(jīng)過R次判決,效率低下。
第二,在實際場景中,往往存在未經(jīng)過訓(xùn)練的非目標協(xié)議,而現(xiàn)有分類器只考慮了R種目標協(xié)議的判決策略,若未對網(wǎng)絡(luò)中的非目標協(xié)議進行過濾,非目標協(xié)議將會被當成目標協(xié)議劃分到某類目標協(xié)議中,進而降低了該類協(xié)議的識別準確性。
針對現(xiàn)有技術(shù)中的上述問題,目前尚未有有效的解決方案。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明的目的在于提出一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法與裝置,能夠使用一個特征提取模型和一個分類器,一次性判決出多種目標協(xié)議與非目標協(xié)議的數(shù)據(jù)包,提高了協(xié)議判決的效率與精確性。
基于上述目的,本發(fā)明提供的技術(shù)方案如下:
本發(fā)明實施例提供了一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法,包括:
從訓(xùn)練數(shù)據(jù)包中提取分類特征;
將訓(xùn)練數(shù)據(jù)包的分類特征訓(xùn)練分類器;
從待識別數(shù)據(jù)包中提取分類特征;
根據(jù)待識別數(shù)據(jù)包的分類特征,使用分類器判斷待識別數(shù)據(jù)包使用的通信協(xié)議是否為目標協(xié)議,若是目標協(xié)議則進一步判斷是何種目標協(xié)議。
在一些實施方式中,所述從訓(xùn)練數(shù)據(jù)包與待識別數(shù)據(jù)包中提取分類特征包括:
對數(shù)據(jù)包進行預(yù)處理,生成N-gram序列,一個數(shù)據(jù)包對應(yīng)一個N-gram序列;
使用潛在狄利克雷主題模型為每個N-gram序列生成“N-gram序列-特征字”的多項概率分布,其中特征字空間為R種目標協(xié)議的特征字集合;
將所有N-gram序列的多項概率分布作為對應(yīng)數(shù)據(jù)包的分類特征。
在一些實施方式中,所述對數(shù)據(jù)包進行預(yù)處理,生成N-gram序列為:將每個數(shù)據(jù)包中的字符以N個字符為長度連續(xù)分割,每個數(shù)據(jù)包作為一個獨立的N-gram序列。
在一些實施方式中,所述使用潛在狄利克雷主題模型為每個N-gram序列生成“N-gram序列-特征字”的多項概率分布包括:
確定每個N-gram序列中的特征字與N-gram詞;
根據(jù)某一特征字中每個N-gram詞出現(xiàn)的個數(shù)與每個N-gram詞對應(yīng)狄利克雷分布的超參數(shù)確定該特征字中每個N-gram詞出現(xiàn)的概率;
根據(jù)該數(shù)據(jù)包中每個特征字出現(xiàn)的個數(shù)與每個特征字對應(yīng)狄利克雷分布的超參數(shù)確定該數(shù)據(jù)包中每個特征字出現(xiàn)的概率;
根據(jù)該特征字中每個N-gram詞出現(xiàn)的概率與該數(shù)據(jù)包中每個特征字出現(xiàn)的概率生成生成“N-gram序列-特征字”的多項概率分布。
在一些實施方式中,所述將訓(xùn)練數(shù)據(jù)包的分類特征訓(xùn)練分類器包括:
預(yù)先指定聚類個數(shù),并隨機指定聚類中心的位置;
計算每個分類特征到聚類中心的距離,并選擇最近的聚類中心作為簇,更新聚類中心的位置;
重復(fù)上一步驟直到聚類中心的位置不再隨更新而發(fā)生改變;
計算所有訓(xùn)練數(shù)據(jù)包的分類特征的方差,選擇最小值作為分類器的判別依據(jù)。
在一些實施方式中,所述根據(jù)待識別數(shù)據(jù)包的分類特征,使用分類器判斷待識別數(shù)據(jù)包使用的通信協(xié)議是否為目標協(xié)議包括:
計算待識別數(shù)據(jù)包的分類特征的方差;
比較待識別數(shù)據(jù)包的分類特征的方差與訓(xùn)練數(shù)據(jù)包的分類特征的方差的最小值的大小,若待識別數(shù)據(jù)包的分類特征的方差較大則判定待識別數(shù)據(jù)包使用的通信協(xié)議是目標協(xié)議,若待識別數(shù)據(jù)包的分類特征的方差較小則判定待識別數(shù)據(jù)包使用的通信協(xié)議是非目標協(xié)議。
在一些實施方式中,所述若是目標協(xié)議則進一步判斷是何種目標協(xié)議包括:
計算待識別數(shù)據(jù)包的分類特征到每個聚類中心的距離;
指定待識別數(shù)據(jù)包的分類特征到聚類中心距離取到最小值的聚類中心所在的簇為新樣本;
在新樣本中選取預(yù)先指定數(shù)目的近鄰分類特征進行K-近鄰法判決;
根據(jù)K-近鄰法判決結(jié)果確定該待識別數(shù)據(jù)包使用的目標協(xié)議。
在一些實施方式中,所述K-近鄰法使用多數(shù)表決法對分類特征進行判決。
本發(fā)明實施例還提供了一種電子設(shè)備,包括至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行上述方法。
從上面所述可以看出,本發(fā)明提供的技術(shù)方案通過線下訓(xùn)練時從訓(xùn)練數(shù)據(jù)包中提取分類特征、將訓(xùn)練數(shù)據(jù)包的分類特征訓(xùn)練分類器、線上識別時提取待識別數(shù)據(jù)包的分類特征,根據(jù)訓(xùn)練數(shù)據(jù)包的分類特征,使用分類器判斷待識別數(shù)據(jù)包使用的通信協(xié)議是否為目標協(xié)議,若是目標協(xié)議則進一步判斷是何種目標協(xié)議的技術(shù)手段,能夠使用一個特征提取模型和一個分類器,一次性判決出多種目標協(xié)議與非目標協(xié)議的數(shù)據(jù)包,提高了協(xié)議判決的效率與精確性。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為根據(jù)本發(fā)明的一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的流程圖;
圖2為根據(jù)本發(fā)明的一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的一個實施例中,LDA模型的結(jié)構(gòu)圖;
圖3為根據(jù)本發(fā)明的一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的一個實施例中,R+1_Kmeans_KNN分類器的線下聚類分布圖;
圖4為本發(fā)明的執(zhí)行一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的電子設(shè)備的一個實施例的硬件結(jié)構(gòu)示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進一步進行清楚、完整、詳細地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明使用的術(shù)語及其縮寫:
服務(wù)質(zhì)量==QoS(Quality of Service)
深度包檢測==DPI(Deep Packet Inspection)
Internet標準==RFC(Request For Comments)
潛在狄利克雷主題模型==LDA(Latent Dirichlet Allocation)
支持向量機==SVM(Support Vector Machine)
K-NN近鄰法==K-NN(K-Nearest Neighbor)
基于上述目的,本發(fā)明實施例的第一個方面,提出了一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的一個實施例。
如圖1所示,根據(jù)本發(fā)明實施例提供的基于語義分析的R+1類應(yīng)用層協(xié)議識別方法包括:
步驟S101,從訓(xùn)練數(shù)據(jù)包中提取分類特征;
步驟S103,將訓(xùn)練數(shù)據(jù)包的分類特征訓(xùn)練分類器;
步驟S105,從待識別數(shù)據(jù)包中提取分類特征;
步驟S107,根據(jù)待識別數(shù)據(jù)包的分類特征,使用分類器判斷待識別數(shù)據(jù)包使用的通信協(xié)議是否為目標協(xié)議,若是目標協(xié)議則進一步判斷是何種目標協(xié)議。
在一些實施方式中,所述從訓(xùn)練數(shù)據(jù)包與待識別數(shù)據(jù)包中提取分類特征包括:
對數(shù)據(jù)包進行預(yù)處理,生成N-gram序列,一個數(shù)據(jù)包對應(yīng)一個N-gram序列;
使用潛在狄利克雷主題模型為每個N-gram序列生成“N-gram序列-特征字”的多項概率分布,其中特征字空間為R種目標協(xié)議的特征字集合;
將所有N-gram序列的多項概率分布作為對應(yīng)數(shù)據(jù)包的分類特征。
在一些實施方式中,所述對數(shù)據(jù)包進行預(yù)處理,生成N-gram序列為:將每個數(shù)據(jù)包中的字符以N個字符為長度連續(xù)分割,每個數(shù)據(jù)包作為一個獨立的N-gram序列。
在一些實施方式中,所述使用潛在狄利克雷主題模型為每個N-gram序列生成“N-gram序列-特征字”的多項概率分布包括:
確定每個N-gram序列中的特征字與N-gram詞;
根據(jù)某一特征字中每個N-gram詞出現(xiàn)的個數(shù)與每個N-gram詞對應(yīng)狄利克雷分布的超參數(shù)確定該特征字中每個N-gram詞出現(xiàn)的概率;
根據(jù)該數(shù)據(jù)包中每個特征字出現(xiàn)的個數(shù)與每個特征字對應(yīng)狄利克雷分布的超參數(shù)確定該數(shù)據(jù)包中每個特征字出現(xiàn)的概率;
根據(jù)該特征字中每個N-gram詞出現(xiàn)的概率與該數(shù)據(jù)包中每個特征字出現(xiàn)的概率生成生成“N-gram序列-特征字”的多項概率分布。
在一些實施方式中,所述將訓(xùn)練數(shù)據(jù)包的分類特征訓(xùn)練分類器包括:
預(yù)先指定聚類個數(shù),并隨機指定聚類中心的位置;
計算每個分類特征到聚類中心的距離,并選擇最近的聚類中心作為簇,更新聚類中心的位置;
重復(fù)上一步驟直到聚類中心的位置不再隨更新而發(fā)生改變;
計算所有訓(xùn)練數(shù)據(jù)包的分類特征的方差,選擇最小值作為分類器的判別依據(jù)。
在一些實施方式中,所述根據(jù)待識別數(shù)據(jù)包的分類特征,使用分類器判斷待識別數(shù)據(jù)包使用的通信協(xié)議是否為目標協(xié)議包括:
計算待識別數(shù)據(jù)包的分類特征的方差;
比較待識別數(shù)據(jù)包的分類特征的方差與訓(xùn)練數(shù)據(jù)包的分類特征的方差的最小值的大小,若待識別數(shù)據(jù)包的分類特征的方差較大則判定待識別數(shù)據(jù)包使用的通信協(xié)議是目標協(xié)議,若待識別數(shù)據(jù)包的分類特征的方差較小則判定待識別數(shù)據(jù)包使用的通信協(xié)議是非目標協(xié)議。
在一些實施方式中,所述若是目標協(xié)議則進一步判斷是何種目標協(xié)議包括:
計算待識別數(shù)據(jù)包的分類特征到每個聚類中心的距離;
指定待識別數(shù)據(jù)包的分類特征到聚類中心距離取到最小值的聚類中心所在的簇為新樣本;
在新樣本中選取預(yù)先指定數(shù)目的近鄰分類特征進行K-近鄰法判決;
根據(jù)K-近鄰法判決結(jié)果確定該待識別數(shù)據(jù)包使用的目標協(xié)議。
在一些實施方式中,所述K-近鄰法使用多數(shù)表決法對分類特征進行判決。
綜上所述,借助于本發(fā)明上述的技術(shù)方案,通過線下訓(xùn)練時從訓(xùn)練數(shù)據(jù)包中提取分類特征、將訓(xùn)練數(shù)據(jù)包的分類特征訓(xùn)練分類器、線上識別時從待識別數(shù)據(jù)包中提取分類特征,根據(jù)待識別數(shù)據(jù)包的分類特征,使用分類器判斷待識別數(shù)據(jù)包使用的通信協(xié)議是否為目標協(xié)議,若是目標協(xié)議則進一步判斷是何種目標協(xié)議的技術(shù)手段,能夠使用一個特征提取模型和一個分類器,一次性判決出多種目標協(xié)議與非目標協(xié)議的數(shù)據(jù)包,提高了協(xié)議判決的效率與精確性。
基于上述目的,本發(fā)明實施例的第二個方面,提出了一種基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的一個實施例。
現(xiàn)有基于語義分析的特征提取方法能有效地識別出單個目標協(xié)議中的協(xié)議特征,其中,利用語義消息將LDA模型應(yīng)用在協(xié)議簽名識別中,無須協(xié)議先驗知識的情況下即可將單個目標協(xié)議從混雜原始數(shù)據(jù)流中識別出來,準確性較高。
在進行LDA提取協(xié)議特征之前,需要對原始數(shù)據(jù)包進行分割,現(xiàn)有N-Gram模型對原始網(wǎng)絡(luò)數(shù)據(jù)包有效載荷進行預(yù)處理既適用于文本協(xié)議,也適用于二進制協(xié)議,具有較好的系統(tǒng)的通用性。
LDA是自然語言處理中常用的主題模型方法,其模型結(jié)構(gòu)如圖2所示。LDA由詞、主題和文本組成,映射到協(xié)議分析中分別為N-gram詞、特征字和N-gram序列,是一個三層貝葉斯概率模型。該模型假設(shè)每個N-gram序列包含K個隱含特征字,而每個特征字包含特定的N-gram詞,N-gram序列和N-gram詞間的關(guān)系通過隱含特征字z體現(xiàn)。隱含特征字之間是相互獨立的,這些特征字被N-gram序列集合中的所有N-gram序列所共享,而每個N-gram序列dm有一個特定的特征字分布
給定包含R種目標協(xié)議集的訓(xùn)練數(shù)據(jù)包,表示經(jīng)過分割后的N-gram序列集合,包含M個N-gram序列和V個不同的N-gram詞,Nm表示第m個N-gram序列中N-gram詞的個數(shù),其中特征字空間為R種目標協(xié)議的特征字集合。我們的目標是得到和即各特征字在N-gram詞上的概率分布和各N-gram序列在特征字上的概率分布,需要根據(jù)給定D進行參數(shù)估計。根據(jù)Gibbs抽樣方法可以實現(xiàn)LDA的參數(shù)估計。用L表示Gibbs抽樣中的迭代次數(shù),經(jīng)過L次迭代,模型將收斂,概率分布如式(1)和(2):
其中,表示第k個特征字中第v個N‐gram詞出現(xiàn)的概率,表示第k個特征字出現(xiàn)詞v的個數(shù),βv為詞v對應(yīng)的Dirichlet分布的超參數(shù)。θm,k表示第m個包中第k個特征字出現(xiàn)的概率,表示第m個包中出現(xiàn)第k個特征字的個數(shù),αk為第k個特征字對應(yīng)的Dirichlet分布的超參數(shù)。
最后,得到所有目標協(xié)議的K個特征字集合及各目標協(xié)議在這K個特征字上的概率分布即為分類特征。
基于LDA的R+1類應(yīng)用層協(xié)議識別系統(tǒng)由兩階段組成:線下訓(xùn)練和線上識別。
在本發(fā)明實施例中,線下訓(xùn)練時輸入為R種已標記的目標協(xié)議的訓(xùn)練數(shù)據(jù)包集合,特征提取得到的是訓(xùn)練數(shù)據(jù)包在這R種目標協(xié)議特征字集合上的概率分布。分類器采用的是改進的R+1類分類器,即圖3示出的R+1_Kmeans_KNN,不僅能對已標記的R種目標協(xié)議的數(shù)據(jù)包進行識別,還能過濾出使用未標記的非目標協(xié)議的數(shù)據(jù)包。
線下訓(xùn)練階段首先對訓(xùn)練數(shù)據(jù)包進行預(yù)處理,預(yù)處理的目的是將數(shù)據(jù)進行分割。N‐gram模型將原始數(shù)據(jù)包以N為長度分割成N‐gram序列,如原始數(shù)據(jù)為MAIL FROM:<jack@google.com>,N=3,分割出的N‐gram序列為{MAI、AIL、IL、LF、FR、FRO、ROM、OM:...}等等。接著采用LDA模型按照式(1)和(2)建立關(guān)于“特征字-N‐gram詞”和“N‐gram序列-特征字”的多項概率分布模型。最后以“N‐gram序列-特征字”多項概率分布作為分類特征,用于分類器建模。
線上進行協(xié)議識別時,根據(jù)已建立好的特征庫,計算待識別數(shù)據(jù)包在R種目標協(xié)議特征字集合上的概率分布,得到分類特征,分類器根據(jù)判決規(guī)則
輸出待識別數(shù)據(jù)包使用的通信協(xié)議類型或標記為非目標協(xié)議。
KNN分類器雖然模型簡單、準確率高,但由于其是基于實例的惰性學(xué)習(xí)方法,在尋找最鄰近訓(xùn)練樣本中,需要逐個計算與訓(xùn)練樣本的距離,算法復(fù)雜度呈線性增長,因而在大數(shù)據(jù)集下的判決速度較慢。而Kmeans_KNN分類器是對KNN分類器的改進,通過線下Kmeans聚類方式將所有訓(xùn)練樣本分為相似度較高的km簇,在線上分類時,只需通過計算待預(yù)測樣本與每簇聚類中心的距離,找到最近的一簇,并將該簇樣本作為新的樣本對待測樣本進行KNN分類。由于線下聚類已經(jīng)將所有訓(xùn)練樣本劃分到相似度較大的簇中,同一簇的訓(xùn)練樣本相似度較大,因而只對該簇進行KNN分類可充分保證分類的準確性。
由于LDA通過Gibbs抽樣計算出待識別數(shù)據(jù)包在K個特征字下分布,在線上識別時,屬于非目標協(xié)議的待測數(shù)據(jù)包在LDA模型中找不到相關(guān)特征字,會將該待識別數(shù)據(jù)包在特征字集合上進行強行分布,抽樣結(jié)果將是一個近似均勻分布。針對這個特點,本發(fā)明以待識別數(shù)據(jù)包的分類特征的方差作為過濾非目標協(xié)議數(shù)據(jù)包的判決策略。當待識別數(shù)據(jù)包的分類特征的方差小于所有訓(xùn)練數(shù)據(jù)包的最小方差時,可以認為該待識別數(shù)據(jù)包使用的通信協(xié)議為非目標協(xié)議,直接歸類到非目標類別中。
假定由R種協(xié)議組成的M個訓(xùn)練數(shù)據(jù)包,經(jīng)過LDA后生成M個分類特征用σ2min表示這M個樣本特征字分布的最小方差,σ2target表示待測協(xié)議特征字分布的方差,用1表示目標協(xié)議,0表示非目標協(xié)議,則判決結(jié)果g如式(3):
下面說明面向R+1類的快速分類器R+1_Kmeans_KNN的線下訓(xùn)練與線上分類過程。
線下訓(xùn)練:
輸入:M個訓(xùn)練數(shù)據(jù)包的分類特征簇個數(shù)km
輸出:km個子簇,對應(yīng)km個聚類中心及方差σ2min
step1:隨機選擇km個聚類中心,重復(fù)step2。
step2:計算每個點到聚類中心的距離,選擇最近的聚類中心作為簇,重新計算每個簇的聚類中心,直到簇不發(fā)生變化。
step3:計算每個訓(xùn)練數(shù)據(jù)包分類特征空間的方差,取最小方差σ2min,結(jié)束。
線上分類:
輸入:待識別數(shù)據(jù)包的特征字分布最鄰近樣本個數(shù)kn
輸出:待識別數(shù)據(jù)包使用的協(xié)議類型
step1:計算待識別數(shù)據(jù)包的特征字分布的方差,根據(jù)式(3)判斷該數(shù)據(jù)包的協(xié)議類型是否為非目標協(xié)議,若是,輸出類型為非目標協(xié)議,若否,到step2。
step2:計算特征字分布與km個聚類中心的距離,選擇最近的一簇作為新樣本,進行最近鄰個數(shù)為kn的KNN判決,輸出對應(yīng)協(xié)議類型。
綜上所述,本發(fā)明設(shè)計了一種基于LDA的R+1類應(yīng)用層協(xié)議識別系統(tǒng),該系統(tǒng)無需任何先驗知識,能對采用私有協(xié)議的數(shù)據(jù)包進行識別分類,具有較高的識別準確率。本發(fā)明在分類器的設(shè)計中,綜合考慮了識別準確性和識別速度,通過引入非目標協(xié)議的判決策略,改進現(xiàn)有Kmeans_KNN分類器,實現(xiàn)了非目標協(xié)議的判決功能。該分類器能以大于90%的準確率對非目標協(xié)議進行過濾,降低非目標協(xié)議對R種目標協(xié)議的判決干擾,進而提高目標協(xié)議的識別準確性,是一種R+1類協(xié)議識別方法,在網(wǎng)絡(luò)入侵檢測和網(wǎng)絡(luò)流量管理中具有更好的適用性。本發(fā)明實施例將LDA主題模型引入到多協(xié)議的特征提取中,建立了待識別數(shù)據(jù)包在R種目標協(xié)議的特征字集合上的概率分布,該方法提取的協(xié)議特征具有較高的準確性;從分類準確性上看,本專利通過分析LDA對未經(jīng)過標記訓(xùn)練的非目標協(xié)議存在強行分布的特性,改進現(xiàn)有分類器,提出一種非目標協(xié)議判決策略能對非目標協(xié)議進行過濾,降低非目標協(xié)議對目標R種協(xié)議的干擾,是一種R+1類分類器;從線上識別速度上看,本發(fā)明與現(xiàn)有Kmeans_KNN只相差一個判決時間,即改進的R+1_Kmeans_KNN分類器在線上識別能保證較快的識別速率。
基于上述目的,本發(fā)明實施例的第三個方面,提出了一種執(zhí)行所述基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的電子設(shè)備的一個實施例。
所述執(zhí)行所述基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的電子設(shè)備包括:
至少一個處理器;以及,
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行如上所述任意一種方法。
如圖4所示,為本發(fā)明提供的執(zhí)行所述實時通話中的語音處理方法的電子設(shè)備的一個實施例的硬件結(jié)構(gòu)示意圖。
以如圖4所示的電子設(shè)備為例,在該電子設(shè)備中包括一個處理器401以及一個存儲器402,并還可以包括:輸入裝置403和輸出裝置404。
處理器401、存儲器402、輸入裝置403和輸出裝置404可以通過總線或者其他方式連接,圖4中以通過總線連接為例。
存儲器402作為一種非易失性計算機可讀存儲介質(zhì),可用于存儲非易失性軟件程序、非易失性計算機可執(zhí)行程序以及模塊,如本申請實施例中的所述基于語義分析的R+1類應(yīng)用層協(xié)議識別方法對應(yīng)的程序指令/模塊。處理器401通過運行存儲在存儲器402中的非易失性軟件程序、指令以及模塊,從而執(zhí)行服務(wù)器的各種功能應(yīng)用以及數(shù)據(jù)處理,即實現(xiàn)上述方法實施例的基于語義分析的R+1類應(yīng)用層協(xié)議識別方法。
存儲器402可以包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需要的應(yīng)用程序;存儲數(shù)據(jù)區(qū)可存儲根據(jù)基于語義分析的R+1類應(yīng)用層協(xié)議識別裝置的使用所創(chuàng)建的數(shù)據(jù)等。此外,存儲器402可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他非易失性固態(tài)存儲器件。在一些實施例中,存儲器402可選包括相對于處理器401遠程設(shè)置的存儲器。上述網(wǎng)絡(luò)的實例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。
輸入裝置403可接收輸入的數(shù)字或字符信息,以及產(chǎn)生與基于語義分析的R+1類應(yīng)用層協(xié)議識別裝置的用戶設(shè)置以及功能控制有關(guān)的鍵信號輸入。輸出裝置404可包括顯示屏等顯示設(shè)備。
所述一個或者多個模塊存儲在所述存儲器402中,當被所述處理器401執(zhí)行時,執(zhí)行上述任意方法實施例中的基于語義分析的R+1類應(yīng)用層協(xié)議識別方法。
所述執(zhí)行所述基于語義分析的R+1類應(yīng)用層協(xié)議識別方法的電子設(shè)備的任何一個實施例,可以達到與之對應(yīng)的前述任意方法實施例相同或者相類似的效果。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM)或隨機存儲記憶體(Random Access Memory,RAM)等。所述計算機程序的實施例,可以達到與之對應(yīng)的前述任意方法實施例相同或者相類似的效果。
此外,典型地,本公開所述的裝置、設(shè)備等可為各種電子終端設(shè)備,例如手機、個人數(shù)字助理(PDA)、平板電腦(PAD)、智能電視等,也可以是大型終端設(shè)備,如服務(wù)器等,因此本公開的保護范圍不應(yīng)限定為某種特定類型的裝置、設(shè)備。本公開所述的客戶端可以是以電子硬件、計算機軟件或兩者的組合形式應(yīng)用于上述任意一種電子終端設(shè)備中。
此外,根據(jù)本公開的方法還可以被實現(xiàn)為由CPU執(zhí)行的計算機程序,該計算機程序可以存儲在計算機可讀存儲介質(zhì)中。在該計算機程序被CPU執(zhí)行時,執(zhí)行本公開的方法中限定的上述功能。
此外,上述方法步驟以及系統(tǒng)單元也可以利用控制器以及用于存儲使得控制器實現(xiàn)上述步驟或單元功能的計算機程序的計算機可讀存儲介質(zhì)實現(xiàn)。
此外,應(yīng)該明白的是,本文所述的計算機可讀存儲介質(zhì)(例如,存儲器)可以是易失性存儲器或非易失性存儲器,或者可以包括易失性存儲器和非易失性存儲器兩者。作為例子而非限制性的,非易失性存儲器可以包括只讀存儲器(ROM)、可編程ROM(PROM)、電可編程ROM(EPROM)、電可擦寫可編程ROM(EEPROM)或快閃存儲器。易失性存儲器可以包括隨機存取存儲器(RAM),該RAM可以充當外部高速緩存存儲器。作為例子而非限制性的,RAM可以以多種形式獲得,比如同步RAM(DRAM)、動態(tài)RAM(DRAM)、同步DRAM(SDRAM)、雙數(shù)據(jù)速率SDRAM(DDR SDRAM)、增強SDRAM(ESDRAM)、同步鏈路DRAM(SLDRAM)以及直接RambusRAM(DRRAM)。所公開的方面的存儲設(shè)備意在包括但不限于這些和其它合適類型的存儲器。
本領(lǐng)域技術(shù)人員還將明白的是,結(jié)合這里的公開所描述的各種示例性邏輯塊、模塊、電路和算法步驟可以被實現(xiàn)為電子硬件、計算機軟件或兩者的組合。為了清楚地說明硬件和軟件的這種可互換性,已經(jīng)就各種示意性組件、方塊、模塊、電路和步驟的功能對其進行了一般性的描述。這種功能是被實現(xiàn)為軟件還是被實現(xiàn)為硬件取決于具體應(yīng)用以及施加給整個系統(tǒng)的設(shè)計約束。本領(lǐng)域技術(shù)人員可以針對每種具體應(yīng)用以各種方式來實現(xiàn)所述的功能,但是這種實現(xiàn)決定不應(yīng)被解釋為導(dǎo)致脫離本公開的范圍。
結(jié)合這里的公開所描述的各種示例性邏輯塊、模塊和電路可以利用被設(shè)計成用于執(zhí)行這里所述功能的下列部件來實現(xiàn)或執(zhí)行:通用處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或其它可編程邏輯器件、分立門或晶體管邏輯、分立的硬件組件或者這些部件的任何組合。通用處理器可以是微處理器,但是可替換地,處理器可以是任何傳統(tǒng)處理器、控制器、微控制器或狀態(tài)機。處理器也可以被實現(xiàn)為計算設(shè)備的組合,例如,DSP和微處理器的組合、多個微處理器、一個或多個微處理器結(jié)合DSP核、或任何其它這種配置。
結(jié)合這里的公開所描述的方法或算法的步驟可以直接包含在硬件中、由處理器執(zhí)行的軟件模塊中或這兩者的組合中。軟件模塊可以駐留在RAM存儲器、快閃存儲器、ROM存儲器、EPROM存儲器、EEPROM存儲器、寄存器、硬盤、可移動盤、CD-ROM、或本領(lǐng)域已知的任何其它形式的存儲介質(zhì)中。示例性的存儲介質(zhì)被耦合到處理器,使得處理器能夠從該存儲介質(zhì)中讀取信息或向該存儲介質(zhì)寫入信息。在一個替換方案中,所述存儲介質(zhì)可以與處理器集成在一起。處理器和存儲介質(zhì)可以駐留在ASIC中。ASIC可以駐留在用戶終端中。在一個替換方案中,處理器和存儲介質(zhì)可以作為分立組件駐留在用戶終端中。
在一個或多個示例性設(shè)計中,所述功能可以在硬件、軟件、固件或其任意組合中實現(xiàn)。如果在軟件中實現(xiàn),則可以將所述功能作為一個或多個指令或代碼存儲在計算機可讀介質(zhì)上或通過計算機可讀介質(zhì)來傳送。計算機可讀介質(zhì)包括計算機存儲介質(zhì)和通信介質(zhì),該通信介質(zhì)包括有助于將計算機程序從一個位置傳送到另一個位置的任何介質(zhì)。存儲介質(zhì)可以是能夠被通用或?qū)S糜嬎銠C訪問的任何可用介質(zhì)。作為例子而非限制性的,該計算機可讀介質(zhì)可以包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲設(shè)備、磁盤存儲設(shè)備或其它磁性存儲設(shè)備,或者是可以用于攜帶或存儲形式為指令或數(shù)據(jù)結(jié)構(gòu)的所需程序代碼并且能夠被通用或?qū)S糜嬎銠C或者通用或?qū)S锰幚砥髟L問的任何其它介質(zhì)。此外,任何連接都可以適當?shù)胤Q為計算機可讀介質(zhì)。例如,如果使用同軸線纜、光纖線纜、雙絞線、數(shù)字用戶線路(DSL)或諸如紅外線、無線電和微波的無線技術(shù)來從網(wǎng)站、服務(wù)器或其它遠程源發(fā)送軟件,則上述同軸線纜、光纖線纜、雙絞線、DSL或諸如紅外先、無線電和微波的無線技術(shù)均包括在介質(zhì)的定義。如這里所使用的,磁盤和光盤包括壓縮盤(CD)、激光盤、光盤、數(shù)字多功能盤(DVD)、軟盤、藍光盤,其中磁盤通常磁性地再現(xiàn)數(shù)據(jù),而光盤利用激光光學(xué)地再現(xiàn)數(shù)據(jù)。上述內(nèi)容的組合也應(yīng)當包括在計算機可讀介質(zhì)的范圍內(nèi)。
公開的示例性實施例,但是應(yīng)當注公開的示例性實施例,但是應(yīng)當注意,在不背離權(quán)利要求限定的本公開的范圍的前提下,可以進行多種改變和修改。根據(jù)這里描述的公開實施例的方法權(quán)利要求的功能、步驟和/或動作不需以任何特定順序執(zhí)行。此外,盡管本公開的元素可以以個體形式描述或要求,但是也可以設(shè)想多個,除非明確限制為單數(shù)。
應(yīng)當理解的是,在本文中使用的,除非上下文清楚地支持例外情況,單數(shù)形式“一個”(“a”、“an”、“the”)旨在也包括復(fù)數(shù)形式。還應(yīng)當理解的是,在本文中使用的“和/或”是指包括一個或者一個以上相關(guān)聯(lián)地列出的項目的任意和所有可能組合。
上述本公開實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
所屬領(lǐng)域的普通技術(shù)人員應(yīng)當理解:以上任何實施例的討論僅為示例性的,并非旨在暗示本公開的范圍(包括權(quán)利要求)被限于這些例子;在本發(fā)明實施例的思路下,以上實施例或者不同實施例中的技術(shù)特征之間也可以進行組合,并存在如上所述的本發(fā)明實施例的不同方面的許多其它變化,為了簡明它們沒有在細節(jié)中提供。因此,凡在本發(fā)明實施例的精神和原則之內(nèi),所做的任何省略、修改、等同替換、改進等,均應(yīng)包含在本發(fā)明實施例的保護范圍之內(nèi)。