亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種生成關(guān)鍵字組合策略的方法及裝置的制造方法_4

文檔序號(hào):9200351閱讀:來(lái)源:國(guó)知局
成的優(yōu)選策略集包含的策略為 CL001、CL003、CL005。結(jié)果如下:
[0169]
[0170] 經(jīng)過(guò)策略精簡(jiǎn)策略集中的策略數(shù)量從6條變?yōu)榱?3條,有效的降低了冗余,提高了 策略的有效利用率。
[0171] 本發(fā)明的上述實(shí)施例中,考慮到上述優(yōu)選策略集中可能還存在相似策略的問(wèn)題, 為了進(jìn)一步降低策略的數(shù)量,得到所述優(yōu)選策略集后還包括:
[0172] 步驟7,將所述優(yōu)選策略集中的相似策略進(jìn)行邏輯合并,得到目標(biāo)策略集。
[0173] 如圖7所示,本發(fā)明的具體實(shí)施例中,步驟7具體包括:
[0174] 步驟701,從所述優(yōu)選策略集中任選一個(gè)第N元素關(guān)鍵詞組合,將該第N元素關(guān)鍵 詞組合的任意N-I個(gè)關(guān)鍵詞重新組合,形成N個(gè)第N-I元素關(guān)鍵詞組合;
[0175] 步驟702,將每個(gè)第N-I元素關(guān)鍵詞組合與所述優(yōu)選策略集中的第N元素關(guān)鍵詞組 合進(jìn)行求交集處理,確定與N個(gè)第N-I元素關(guān)鍵詞組合對(duì)應(yīng)的N個(gè)策略聚類;
[0176] 步驟703,若成員最多的策略聚類的成員數(shù)小于或者等于第二預(yù)設(shè)門限值,則從所 述優(yōu)選策略集刪除該策略,形成新的優(yōu)選策略集;否則,將該成員數(shù)最多的策略聚類確定為 相似策略聚類,并從優(yōu)選策略集中刪除該相似策略聚類中的所有策略,形成新的優(yōu)選策略 集,并繼續(xù)確定相似策略聚類,直到所述新的優(yōu)選策略集中的剩余策略數(shù)小于或者等于1 ;
[0177] 步驟704,將已確定的相似策略聚類組成相似策略聚類集,并對(duì)所述相似策略聚類 集中的所有相似策略聚類分別進(jìn)行邏輯合并處理,生成包含"與" "或"組合的策略;
[0178] 步驟705,將所述包含"與" "或"組合的策略和與策略聚類的成員數(shù)小于或者等于 第二預(yù)設(shè)門限值相對(duì)應(yīng)的所述優(yōu)選策略組成目標(biāo)策略集。
[0179] 具體示例如下:
[0180] 如一個(gè)策略集為:(假定用戶設(shè)定的第二預(yù)設(shè)門限為1。)
[0181]
[0182] 任選一條策略a&b&c&d,可以形成a&b&c、b&c&d、a&c&d、a&b&d四個(gè)母詞組合,經(jīng) 匹配發(fā)現(xiàn)a&b&c能夠匹配的策略條數(shù)最多,形成相似策略聚類1 :
[0183]
[0184] 從原策略集中刪除該相似策略聚類1中的這3條策略,形成新的策略集:
[0185]
[0186] 任選一條策略b&c&d&e,可以形成b&c&d、b&c&e、b&d&e、c&d&e四個(gè)母詞,經(jīng)匹配發(fā) 現(xiàn)c&d&e能夠匹配的策略條數(shù)最多,形成相似策略聚類2 :
[0187]
[0188] 從該新的策略集中刪除該相似策略聚類2中的這2條策略,形成新的策略集:
[0189]

[0190] 任選一條策略c&d&f&g,通過(guò)匹配形成相似策略聚類3 :
[0191]
[0192] 從該新的策略集中刪除該相似策略衆(zhòng)芙3中的這2條策略,此時(shí)新的策略集中條 數(shù)為0,終止匹配,對(duì)相似聚類進(jìn)行邏輯合并處理,結(jié)果如下:
[0193]
[0194] 經(jīng)過(guò)邏輯合并后,7條策略合并成3條包含"與" "或"組合的策略;則該目標(biāo)策略 則為上述3條包含"與" "或"組合的策略。
[0195] 本發(fā)明實(shí)施例創(chuàng)造性的提出針對(duì)一組短彩信同時(shí)生成一組策略的機(jī)制,解決了現(xiàn) 有技術(shù)針對(duì)一條短彩信生成一條策略的低效以及高容量需求問(wèn)題;大大提高了生產(chǎn)效率; 且基于海量數(shù)據(jù),為關(guān)鍵字建立了標(biāo)識(shí)度管理機(jī)制;同時(shí)策略生成過(guò)程中綜合考慮關(guān)鍵字 的查準(zhǔn)和誤攔表現(xiàn),優(yōu)先選用查準(zhǔn)高、誤攔低的優(yōu)質(zhì)關(guān)鍵字,解決了目前簡(jiǎn)單從短彩信樣本 中提取關(guān)鍵字導(dǎo)致查準(zhǔn)低、誤攔高的問(wèn)題,有效提高了關(guān)鍵字組合策略的攔截效果。
[0196] 進(jìn)一步的,本發(fā)明實(shí)施例的提案創(chuàng)新性的提出的策略精簡(jiǎn)機(jī)制,不僅解決了相同 短彩信能夠被多條策略攔截導(dǎo)致的策略冗余問(wèn)題,同時(shí)解決了相似策略的問(wèn)題,生成了具 有"與""或"關(guān)系的關(guān)鍵字組合策略。篩選出效果最優(yōu)、條數(shù)最少的關(guān)鍵字組合策略集,也 有效降低了策略的數(shù)量,提高策略容量利用率,延長(zhǎng)擴(kuò)容升級(jí)的周期,大大降低了投資。
[0197] 如圖8所示,為了更好的實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例還提供一種生成關(guān)鍵字組 合策略的裝置,包括:
[0198] 切詞模塊801,用于對(duì)包含多個(gè)語(yǔ)句的信息進(jìn)行切詞處理,得到多個(gè)第一元素詞組 合;
[0199] 獲取模塊802,用于獲得所述第一元素詞組合的垃圾屬性值和正常屬性值;
[0200] 第一確定模塊8033,用于當(dāng)所述第一元素詞組合的垃圾屬性值大于第一預(yù)設(shè)值且 所述正常屬性值小于第二預(yù)設(shè)值時(shí),確定該第一元素詞組合為第一元素關(guān)鍵詞組合,多個(gè) 所述第一元素關(guān)鍵詞組合形成第一元素關(guān)鍵詞組合集;
[0201] 生成模塊804,用于將所述第一元素關(guān)鍵詞組合集中至少兩個(gè)不同的第一元素關(guān) 鍵詞組合進(jìn)行組合,得到第N元素詞組合,形成第N元素詞組合集,其中,N為組成所述第N 元素詞組合的第一元素組合的個(gè)數(shù);
[0202] 第二確定模塊805,用于當(dāng)所述第N元素詞組合的垃圾屬性值大于第三預(yù)設(shè)值且 所述正常屬性值小于第四預(yù)設(shè)值時(shí),確定該第N元素詞組合為第N元素關(guān)鍵詞組合,確定的 多個(gè)第N元素關(guān)鍵詞組合形成第N元素關(guān)鍵詞組合集,當(dāng)N值大于或者等于一閾值時(shí),確定 所述N元素關(guān)鍵詞組合集為策略集。
[0203] 進(jìn)一步的,所述獲取模塊802包括:
[0204] 獲取單元,用于從詞性庫(kù)中獲取所述多個(gè)第一元素詞組合的垃圾屬性值和正常屬 性值。
[0205] 優(yōu)選的,形成第N元素詞組合集時(shí)按照N值由小到大的順序依次形成,若所述第N 元素詞組合集中不存在垃圾屬性值大于所述第三預(yù)設(shè)值且正常屬性值小于所述第四預(yù)設(shè) 值的第N元素詞組合,停止形成第N元素詞組合集;否則,直到N值大于或者等于一閾值,停 止形成第N元素詞組合集。優(yōu)選的,所述第N元素詞組合集的形成由已確定的第L元素關(guān) 鍵詞組合和已確定的第M元素關(guān)鍵詞組合兩兩組合形成,其中,L+M=N。
[0206] 進(jìn)一步的,上述生成關(guān)鍵字組合策略的裝置,還包括:
[0207] 去冗余模塊806,用于對(duì)所述策略集進(jìn)行去冗余處理,得到優(yōu)選策略集。
[0208] 優(yōu)選的,所述去冗余模塊806包括:
[0209] 合并單元,用于將所述策略集中所有第N元素關(guān)鍵詞組合攔截的信息去重合并, 形成一個(gè)信息集;
[0210] 第三確定單元,用于將攔截信息數(shù)最多的第N元素關(guān)鍵詞組合確定為優(yōu)選策略, 同時(shí)刪除所述優(yōu)選策略,形成新的策略集,刪除所述優(yōu)選策略攔截的所有信息,形成新的信 息集,并繼續(xù)確定優(yōu)選策略,直到新的信息集中的信息條數(shù)小于第一預(yù)設(shè)門限值;
[0211] 第四確定單元,用于將已確定的優(yōu)選策略組成優(yōu)選策略集。
[0212] 進(jìn)一步的,上述生成關(guān)鍵字組合策略的裝置,還包括:
[0213] 合并模塊807,用于將所述優(yōu)選策略集中的相似策略進(jìn)行邏輯合并,得到目標(biāo)策略 集。
[0214] 優(yōu)選的,所述合并模塊807包括:
[0215] 第一生成單元,用于從所述優(yōu)選策略集中任選一個(gè)第N元素關(guān)鍵詞組合,將該第N 元素關(guān)鍵詞組合的任意N-I個(gè)關(guān)鍵詞重新組合,形成N個(gè)第N-I元素關(guān)鍵詞組合;
[0216] 第二生成單元,用于將每個(gè)第N-I元素關(guān)鍵詞組合與所述優(yōu)選策略集中的第N元 素關(guān)鍵詞組合進(jìn)行求交集處理,確定與N個(gè)第N-I元素關(guān)鍵詞組合對(duì)應(yīng)的N個(gè)策略聚類;
[0217] 第五確定單元,用于若成員最多的策略聚類的成員數(shù)小于或者等于第二預(yù)設(shè)門限 值,則從所述優(yōu)選策略集刪除該策略,形成新的優(yōu)選策略集;否則,將該成員數(shù)最多的策略 聚類確定為相似策略聚類,并從優(yōu)選策略集中刪除該相似策略聚類中的所有策略,形成新 的優(yōu)選策略集,并繼續(xù)確定相似策略聚類,直到所述新的優(yōu)選策略集中的剩余策略數(shù)小于 或者等于1 ;
[0218] 第六確定單元,用于將已確定的相似策略聚類組成相似策略聚類集,并對(duì)所述相 似策略聚類集中的所有相似策略聚類分別進(jìn)行邏輯合并處理,生成包含"與" "或"組合的 策略;
[0219] 第七確定單元,用于將所述包含"與""或"組合的策略和與策略聚類的成員數(shù)小 于或者等于第二預(yù)設(shè)門限值相對(duì)應(yīng)的所述優(yōu)選策略組成目標(biāo)策略集。
[0220] 本發(fā)明實(shí)施例的生成關(guān)鍵字組合策略的方法中,針對(duì)一組短彩信同時(shí)生成一組策 略的機(jī)制,解決了現(xiàn)有技術(shù)針對(duì)一條短彩信生成一條策略的低效以及高容量需求問(wèn)題;大 大提高了生產(chǎn)效率;且基于海量數(shù)據(jù),為關(guān)鍵字建立了標(biāo)識(shí)度管理機(jī)制;同時(shí)策略生成過(guò) 程中綜合考慮關(guān)鍵字的查準(zhǔn)和誤攔表現(xiàn),優(yōu)先選用查準(zhǔn)高、誤攔低的優(yōu)質(zhì)關(guān)鍵字,解決了目 前簡(jiǎn)單從短彩信樣本中提取關(guān)鍵字導(dǎo)致查準(zhǔn)低、誤攔高的問(wèn)題,有效提高了關(guān)鍵字組合策 略的攔截效果。本發(fā)明提供的裝置是應(yīng)用上述生成關(guān)鍵字組合策略的方法的裝置,則上述 方法的所有實(shí)施例在本發(fā)明提供的裝置中均適用,且均能達(dá)到相同或相似的有益效果。
[0221] 以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員 來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾
當(dāng)前第4頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1