亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

音頻數(shù)據(jù)的檢測方法及裝置的制造方法

文檔序號:9633806閱讀:290來源:國知局
音頻數(shù)據(jù)的檢測方法及裝置的制造方法
【技術領域】
[0001] 本發(fā)明實施例設及數(shù)據(jù)分析技術,尤其設及一種音頻數(shù)據(jù)的檢測方法及裝置。
【背景技術】
[0002] 隨著第四代移動通信技術4G網絡時代的到來和智能終端的普及,越來越多的用 戶使用智能終端的即時通信應用的語音功能進行交流。
[0003] 用戶A通過終端a中的即時聊天應用輸入一段語音,終端a通過無線網絡將該語 音發(fā)送至終端b,用戶B通過終端b獲取到該語音。
[0004] 然而,一些不法分子利用智能終端的語音功能從事設恐、設暴等違法活動?,F(xiàn)有技 術中提供了對文本數(shù)據(jù)進行分析,確定文本信息中是否包含敏感詞匯的技術方案。但現(xiàn)有 技術無法對互聯(lián)網數(shù)據(jù)包中的音頻數(shù)據(jù)含有的敏感詞匯進行檢測,造成網絡安全隱患。

【發(fā)明內容】
陽〇化]本發(fā)明提供一種音頻數(shù)據(jù)的檢測方法及裝置,W實現(xiàn)對音頻數(shù)據(jù)中的敏感詞匯進 行檢測,提高網絡安全。
[0006] 第一方面,本發(fā)明實施例提供了一種音頻數(shù)據(jù)的檢測方法,包括:
[0007] 根據(jù)至少一個即時聊天軟件的網絡數(shù)據(jù)包獲取目標音頻數(shù)據(jù);
[0008] 查找所述目標音頻數(shù)據(jù)中包含的至少一個預設關鍵字信息,并統(tǒng)計每個預設關鍵 字信息的出現(xiàn)次數(shù);
[0009] 根據(jù)所述每個預設關鍵字信息的出現(xiàn)次數(shù)W及所述每個預設關鍵字信息對應的 預設權重確定所述目標音頻數(shù)據(jù)對應的目標評分;
[0010] 如果所述目標評分大于預設評分,則確定所述音頻數(shù)據(jù)為敏感數(shù)據(jù)。 W11] 第二方面,本發(fā)明實施例還提供了一種音頻數(shù)據(jù)的檢測裝置,包括:
[0012] 目標音頻數(shù)據(jù)獲取單元,用于根據(jù)至少一個即時聊天軟件的網絡數(shù)據(jù)包獲取目標 音頻數(shù)據(jù);
[0013] 預設關鍵字信息查找單元,用于查找所述目標音頻數(shù)據(jù)獲取單元獲取的所述目標 音頻數(shù)據(jù)中包含的至少一個預設關鍵字信息;
[0014] 出現(xiàn)次數(shù)統(tǒng)計單元,用于統(tǒng)計所述預設關鍵字信息查找單元查找到的每個預設關 鍵字信息的出現(xiàn)次數(shù);
[0015] 目標評分計算單元,用于根據(jù)所述出現(xiàn)次數(shù)統(tǒng)計單元得到的所述每個預設關鍵字 信息的出現(xiàn)次數(shù)W及所述每個預設關鍵字信息對應的預設權重確定所述目標音頻數(shù)據(jù)對 應的目標評分;
[0016] 敏感數(shù)據(jù)確定單元,用于如果所述目標評分計算單元得到的所述目標評分大于預 設評分,則確定所述音頻數(shù)據(jù)為敏感數(shù)據(jù)。
[0017] 本發(fā)明根據(jù)至少一個即時聊天軟件的網絡數(shù)據(jù)包獲取目標音頻數(shù)據(jù),然后統(tǒng)計目 標音頻數(shù)據(jù)中的預設關鍵字信息的出現(xiàn)次數(shù),根據(jù)預設關鍵字信息的出現(xiàn)次數(shù)對目標音頻 數(shù)據(jù)進行評分,并根據(jù)評分結果確定音頻數(shù)據(jù)是否為敏感數(shù)據(jù)。與現(xiàn)有技術中無法對互聯(lián) 網中音頻數(shù)據(jù)包進行機器檢測相比,本發(fā)明能夠獲取即時聊天過程中的音頻數(shù)據(jù)包,并根 據(jù)解析后的音頻數(shù)據(jù)中包含的預設關鍵字信息對音頻數(shù)據(jù)進行評分,進而確定音頻數(shù)據(jù)是 否為敏感數(shù)據(jù),實現(xiàn)由機器對即時聊天過程中音頻數(shù)據(jù)包含的敏感詞匯進行檢測,提高網 絡安全。
【附圖說明】
[0018] 圖1為本發(fā)明實施例一中的一個音頻數(shù)據(jù)的檢測方法的流程圖;
[0019] 圖2是本發(fā)明實施例二中的第一個音頻數(shù)據(jù)的檢測方法的流程圖;
[0020] 圖3是本發(fā)明實施例二中的第二個音頻數(shù)據(jù)的檢測方法的流程圖;
[0021] 圖4是本發(fā)明實施例二中的第=個音頻數(shù)據(jù)的檢測方法的流程圖;
[0022] 圖5是本發(fā)明實施例二中的第四個音頻數(shù)據(jù)的檢測方法的流程圖;
[0023] 圖6是本發(fā)明實施例二中的第五個音頻數(shù)據(jù)的檢測方法的流程圖;
[0024] 圖7是本發(fā)明實施例=中的第一個音頻數(shù)據(jù)的檢測裝置的結構示意圖;
[00巧]圖8是本發(fā)明實施例=中的第二個音頻數(shù)據(jù)的檢測裝置的結構示意圖;
[00%] 圖9是本發(fā)明實施例=中的第=個音頻數(shù)據(jù)的檢測裝置的結構示意圖;
[0027] 圖10是本發(fā)明實施例S中的第四個音頻數(shù)據(jù)的檢測裝置的結構示意圖;
[0028] 圖11是本發(fā)明實施例=中的第五個音頻數(shù)據(jù)的檢測裝置的結構示意圖。
【具體實施方式】
[0029] 下面結合附圖和實施例對本發(fā)明作進一步的詳細說明??蒞理解的是,此處所描 述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便 于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部結構。 I;0030] 實施例一
[0031] 圖1為本發(fā)明實施例一提供的一種音頻數(shù)據(jù)的檢測方法的流程圖,本實施例可適 用于對網絡中的音頻數(shù)據(jù)進行安全檢測的情況,該方法可W由具有報文轉發(fā)功能的網絡設 備(如服務器)來執(zhí)行,該方法具體包括如下步驟:
[0032] 步驟110、根據(jù)至少一個即時聊天軟件的網絡數(shù)據(jù)包獲取目標音頻數(shù)據(jù)。
[0033] 用戶在使用即時聊天軟件時,可輸入文本信息、語音信息、視頻信息W及圖片信 息。在傳輸用戶輸入的上述信息時,發(fā)送端通常將用戶輸入的信息劃分為多個較小的子信 息,然后通過網絡將子信息發(fā)送至接收端,由接收端進行組合后得到用戶在發(fā)送端輸入的 信息。即時聊天軟件的網絡數(shù)據(jù)包為用于承載上述子信息的數(shù)據(jù)包。網絡數(shù)據(jù)包W報文形 式進行發(fā)送,接收端根據(jù)網絡數(shù)據(jù)包報文頭中的信息可確定網絡數(shù)據(jù)包所攜帶的信息的類 型。例如,如果報文頭中攜帶有"session(會話)"創(chuàng)建音頻會話的特征碼則可確定網絡數(shù) 據(jù)包用于攜帶音頻數(shù)據(jù)。
[0034] 接收端在接收到網絡數(shù)據(jù)包后通過對網絡數(shù)據(jù)包進行解析,得到網絡數(shù)據(jù)包中攜 帶的音頻子數(shù)據(jù)包。通過對解析得到的音頻子數(shù)據(jù)包進行排序組合和解碼,得到發(fā)送端用 戶輸入的目標音頻數(shù)據(jù)。目標音頻數(shù)據(jù)可W為脈沖編碼調制(Pulse Code Mo^lation, PCM)文件。
[0035] 步驟120、查找目標音頻數(shù)據(jù)中包含的至少一個預設關鍵字信息,并統(tǒng)計每個預設 關鍵字信息的出現(xiàn)次數(shù)。
[0036] 預設關鍵字可W為設恐設暴等用語,例如,爆炸、炸彈、槍支型號等。預設關鍵字信 息為預設關鍵字對應的一段聲波信號。預先收錄不同用戶或測試人員閱讀某一預設關鍵字 的聲波信號,收錄到的聲波信號即為預設關鍵字信息。對于每個預設關鍵字均通過上述方 式得到預設關鍵字對應的多個預設關鍵字信息。
[0037] 由于步驟110中得到的目標音頻數(shù)據(jù)可W為PCM,因此當目標音頻數(shù)據(jù)中是否包 含有與預設關鍵字相同的聲波信號時,可確定目標音頻數(shù)據(jù)中含有預設關鍵字信息。從目 標音頻數(shù)據(jù)的第一個數(shù)據(jù)位開始,依次將目標音頻數(shù)據(jù)中的子數(shù)據(jù)與預設關鍵字信息進行 比較,該子數(shù)據(jù)與預設關鍵字信息具有相同的數(shù)據(jù)位。
[0038] 步驟130、根據(jù)每個預設關鍵字信息的出現(xiàn)次數(shù)W及每個預設關鍵字信息對應的 預設權重確定目標音頻數(shù)據(jù)對應的目標評分。
[0039] 通過對每個預設關鍵字信息的出現(xiàn)次數(shù)進行統(tǒng)計,能夠得到每個預設關鍵字信息 與其在目標音頻數(shù)據(jù)中出現(xiàn)次數(shù)的關系組成,Nx),其中,Kx表示第X個預設關鍵字信息,N、 為第X個預設關鍵字在目標音頻數(shù)據(jù)中的出現(xiàn)次數(shù)。 W40] 假設有M個預設關鍵字信息,則可得到M個關系組:{化1,Ni)、化2,Ns)、化3,Ns)… 化m,Nm)}。每個預設關鍵字信息分別對應一個預設權重{Wl,W2、W3,W4…Wm}。目標評分S= 〇(l*Wi+K2*W2+K3*W3+'"+Km*Wm)*C,其中,C可W為1或或小于1大于0的分數(shù)或大于1的自 然數(shù),預設權重IWi,W2、W3,W4…Wm}均大于零小于一。優(yōu)選的,C= 10。預設權重可根據(jù)預 設關鍵字信息的內容進行設置。
[0041] 步驟140、如果目標評分大于預設評分,則確定音頻數(shù)據(jù)為敏感數(shù)據(jù)。
[0042] 預設評分大于零。優(yōu)選的,預設評分大于等于50。當確定音頻數(shù)據(jù)為敏感數(shù)據(jù)時, 該數(shù)據(jù)發(fā)送至有關部口(如網絡安全部口)的服務器,W便有關部口對發(fā)起該目標音頻數(shù) 據(jù)的用
當前第1頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1