本申請(qǐng)實(shí)施例涉及計(jì)算機(jī),具體涉及垃圾消息攔截方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
1、隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,垃圾消息問題日益嚴(yán)重,給用戶帶來了諸多困擾。因此,需要對(duì)垃圾消息進(jìn)行及時(shí)的檢測(cè)和攔截。
2、現(xiàn)有技術(shù)中,垃圾消息檢測(cè)技術(shù)主要分為基于規(guī)則的檢測(cè)和基于機(jī)器學(xué)習(xí)的檢測(cè)兩種方法。然而,由于垃圾消息形式的多樣化、垃圾消息的樣本量不足等問題,傳統(tǒng)的檢測(cè)方法難以平衡誤報(bào)和漏報(bào),需要人工進(jìn)行進(jìn)一步分析判斷,導(dǎo)致對(duì)垃圾消息檢測(cè)的準(zhǔn)確率和效率較低。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提出了垃圾消息攔截方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì),以解決現(xiàn)有技術(shù)中垃圾消息檢測(cè)的準(zhǔn)確率和效率較低的技術(shù)問題。
2、第一方面,本申請(qǐng)實(shí)施例提供了一種垃圾消息攔截方法,該方法包括:在接收到消息發(fā)送請(qǐng)求時(shí),獲取所述消息發(fā)送請(qǐng)求中的待測(cè)消息;提取所述待測(cè)消息中的文字內(nèi)容;基于歷史垃圾消息的關(guān)鍵詞、歷史垃圾消息的哈希值以及大語言模型,對(duì)所述文字內(nèi)容進(jìn)行檢測(cè),以確定所述待測(cè)消息是否為垃圾消息;響應(yīng)于所述待測(cè)消息為垃圾消息,則對(duì)所述待測(cè)消息進(jìn)行攔截。
3、第二方面,本申請(qǐng)實(shí)施例提供了一種垃圾消息攔截裝置,該裝置包括:獲取單元,用于在接收到消息發(fā)送請(qǐng)求時(shí),獲取所述消息發(fā)送請(qǐng)求中的待測(cè)消息;提取單元,用于提取所述待測(cè)消息中的文字內(nèi)容;檢測(cè)單元,用于基于歷史垃圾消息的關(guān)鍵詞、歷史垃圾消息的哈希值以及大語言模型,對(duì)所述文字內(nèi)容進(jìn)行檢測(cè),以確定所述待測(cè)消息是否為垃圾消息;攔截單元,用于響應(yīng)于所述待測(cè)消息為垃圾消息,則對(duì)所述待測(cè)消息進(jìn)行攔截。
4、第三方面,本申請(qǐng)實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如第一方面中任一實(shí)施例所描述的方法。
5、第四方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面中任一實(shí)施例所描述的方法。
6、本申請(qǐng)實(shí)施例提供的垃圾消息攔截方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì),在接收到消息發(fā)送請(qǐng)求時(shí),首先提取消息發(fā)送請(qǐng)求中的待測(cè)消息中的文字內(nèi)容,而后基于歷史垃圾消息的關(guān)鍵詞、歷史垃圾消息的哈希值以及大語言模型,對(duì)該文字內(nèi)容進(jìn)行檢測(cè),以確定待測(cè)消息是否為垃圾消息,從而在待測(cè)消息為垃圾消息對(duì)其進(jìn)行攔截。由于基于歷史垃圾消息的關(guān)鍵詞及哈希值,能夠準(zhǔn)確判斷待測(cè)消息是否為歷史出現(xiàn)過的歷史垃圾消息,基于大語言模型能夠更準(zhǔn)確地捕捉到垃圾短信的語義特征,使得能夠準(zhǔn)確判斷出歷史未曾出現(xiàn)過的垃圾消息,因此上述方式能夠應(yīng)對(duì)垃圾消息形式多樣化的問題,降低了垃圾消息的誤報(bào)率和漏報(bào)率,提高了垃圾消息檢測(cè)的準(zhǔn)確性。此外,上述方式能夠根據(jù)檢測(cè)結(jié)果進(jìn)行樣本更新和補(bǔ)充,從而應(yīng)對(duì)樣本不足的問題,進(jìn)一步提高了垃圾消息檢測(cè)的準(zhǔn)確性。同時(shí),無需人工輔助分析,提高了垃圾消息檢測(cè)的效率。
1.一種垃圾消息攔截方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述待測(cè)消息中的文字內(nèi)容,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于歷史垃圾消息的關(guān)鍵詞、歷史垃圾消息的哈希值以及大語言模型,對(duì)所述文字內(nèi)容進(jìn)行檢測(cè),以確定所述待測(cè)消息是否為垃圾消息,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述正則匹配結(jié)果、所述最大相似度和所述第一得分,確定所述待測(cè)消息是否為垃圾消息,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,在對(duì)所述待測(cè)消息進(jìn)行攔截之后,所述方法還包括:
6.根據(jù)權(quán)利要求1-5之一所述的方法,其特征在于,所述方法應(yīng)用于第一短信中心;所述待測(cè)消息為短信;所述消息發(fā)送請(qǐng)求由發(fā)送終端經(jīng)由發(fā)送端基站發(fā)送至第一移動(dòng)設(shè)備交換中心,并由所述第一移動(dòng)設(shè)備交換中心發(fā)送至所述第一短信中心;
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
8.一種垃圾消息攔截裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一所述的方法。