1.一種通知信息的過(guò)濾方法,其特征在于,包括:
根據(jù)預(yù)設(shè)的劃分標(biāo)識(shí)符,將待處理通知信息劃分為至少一個(gè)語(yǔ)義段;
針對(duì)所述至少一個(gè)語(yǔ)義段中的任意一個(gè)語(yǔ)義段,若確定所述任意一個(gè)語(yǔ)義段是廣告語(yǔ)義段,則從所述待處理通知信息中刪除所述任意一個(gè)語(yǔ)義段;
其中,通過(guò)下述過(guò)程確定所述任意一個(gè)語(yǔ)義段是否為廣告語(yǔ)義段:
將所述任意一個(gè)語(yǔ)義段與非廣告模板庫(kù)進(jìn)行比較,確定所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度,所述非廣告模板庫(kù)用于存儲(chǔ)非廣告類語(yǔ)義段;
若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度為高匹配度,則確定所述任意一個(gè)語(yǔ)義段為非廣告語(yǔ)義段;
若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度為低匹配度,則將所述任意一個(gè)語(yǔ)義段與廣告模板庫(kù)進(jìn)行比較,確定所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度,所述廣告模板庫(kù)用于存儲(chǔ)廣告類語(yǔ)義段;
若所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度為高匹配度,則確定所述任意一個(gè)語(yǔ)義段為廣告語(yǔ)義段,否則,確定所述任意一個(gè)語(yǔ)義段為非廣告語(yǔ)義段。
2.如權(quán)利要求1所述的通知信息的過(guò)濾方法,其特征在于,根據(jù)下列方式確定所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度:
若所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)滿足下列條件中的至少一個(gè),則將所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度確定為高匹配度,否則,將所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度確定為低匹配度:
條件一:所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)中的至少一個(gè)語(yǔ)義段的相似度大于或等于第一相似閾值;
條件二:所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)中的M個(gè)語(yǔ)義段的相似度小于所述第一相似閾值且大于第二相似閾值,且M與所述廣告模板庫(kù)中語(yǔ)義段的總數(shù)量的比值大于或等于預(yù)設(shè)的第一比例,M為正整數(shù)。
3.如權(quán)利要求1所述的通知信息的過(guò)濾方法,其特征在于,根據(jù)下列方式確定所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度:
若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)滿足下列條件中的至少一個(gè),則將所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度確定為高匹配度,否則,將所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度確定為低匹配度:
條件一:所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)中的任意一個(gè)語(yǔ)義段的相似度大于或等于第三相似閾值;
條件二:所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)中的N個(gè)語(yǔ)義段的相似度小于所述第三相似閾值且大于第四相似閾值,且N與所述非廣告模板庫(kù)中語(yǔ)義段的總數(shù)量的比值大于或等于預(yù)設(shè)的第二比例,N為正整數(shù)。
4.如權(quán)利要求1-3中任一項(xiàng)所述的通知信息的過(guò)濾方法,其特征在于,所述方法還包括:
若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度為高匹配度,且所述非廣告模板庫(kù)中不包含與所述任意一個(gè)語(yǔ)義段完全相同的語(yǔ)義段,則根據(jù)所述任意一個(gè)語(yǔ)義段更新所述非廣告模板庫(kù);
若所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度為高匹配度,且所述廣告模板庫(kù)中不包含與所述任意一個(gè)語(yǔ)義段完全相同的語(yǔ)義段,則根據(jù)所述任意一個(gè)語(yǔ)義段更新所述廣告模板庫(kù)。
5.如權(quán)利要求1-3中任一項(xiàng)所述的通知信息的過(guò)濾方法,其特征在于,所述預(yù)設(shè)的劃分標(biāo)識(shí)符為句號(hào)、問(wèn)號(hào)以及感嘆號(hào)。
6.一種通知信息過(guò)濾裝置,其特征在于,包括:
語(yǔ)義段劃分單元,用于根據(jù)預(yù)設(shè)的劃分標(biāo)識(shí)符,將待處理通知信息劃分為至少一個(gè)語(yǔ)義段;
過(guò)濾單元,用于針對(duì)所述至少一個(gè)語(yǔ)義段中的任意一個(gè)語(yǔ)義段,若確定所述任意一個(gè)語(yǔ)義段是廣告語(yǔ)義段,則從所述待處理通知信息中刪除所述任意一個(gè)語(yǔ)義段;
廣告語(yǔ)義段確定單元,用于通過(guò)下述過(guò)程確定所述任意一個(gè)語(yǔ)義段是否為廣告語(yǔ)義段:將所述任意一個(gè)語(yǔ)義段與非廣告模板庫(kù)進(jìn)行比較,確定所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度,所述非廣告模板庫(kù)用于存儲(chǔ)非廣告類語(yǔ)義段;若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度為高匹配度,則確定所述任意一個(gè)語(yǔ)義段為非廣告語(yǔ)義段;若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度為低匹配度,則將所述任意一個(gè)語(yǔ)義段與廣告模板庫(kù)進(jìn)行比較,確定所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度,所述廣告模板庫(kù)用于存儲(chǔ)廣告類語(yǔ)義段;若所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度為高匹配度,則確定所述任意一個(gè)語(yǔ)義段為廣告語(yǔ)義段,否則,確定所述任意一個(gè)語(yǔ)義段為非廣告語(yǔ)義段。
7.如權(quán)利要求6所述的通知信息的過(guò)濾裝置,其特征在于,所述廣告語(yǔ)義段確定單元,具體用于:
若所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)滿足下列條件中的至少一個(gè),則將所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度確定為高匹配度,否則,將所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度確定為低匹配度:
條件一:所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)中的至少一個(gè)語(yǔ)義段的相似度大于或等于第一相似閾值;
條件二:所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)中的M個(gè)語(yǔ)義段的相似度小于所述第一相似閾值且大于第二相似閾值,且M與所述廣告模板庫(kù)中語(yǔ)義段的總數(shù)量的比值大于或等于預(yù)設(shè)的第一比例,M為正整數(shù)。
8.如權(quán)利要求6所述的通知信息的過(guò)濾裝置,其特征在于,所述廣告語(yǔ)義段確定單元,具體用于:
若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)滿足下列條件中的至少一個(gè),則將所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度確定為高匹配度,否則,將所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度確定為低匹配度:
條件一:所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)中的任意一個(gè)語(yǔ)義段的相似度大于或等于第三相似閾值;
條件二:所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)中的N個(gè)語(yǔ)義段的相似度小于所述第三相似閾值且大于第四相似閾值,且N與所述非廣告模板庫(kù)中語(yǔ)義段的總數(shù)量的比值大于或等于預(yù)設(shè)的第二比例,N為正整數(shù)。
9.如權(quán)利要求6-8中任一項(xiàng)所述的通知信息的過(guò)濾裝置,其特征在于,所述裝置還包括更新單元,用于:
若所述任意一個(gè)語(yǔ)義段與所述非廣告模板庫(kù)的匹配度為高匹配度,且所述非廣告模板庫(kù)中不包含與所述任意一個(gè)語(yǔ)義段完全相同的語(yǔ)義段,則根據(jù)所述任意一個(gè)語(yǔ)義段更新所述非廣告模板庫(kù);
若所述任意一個(gè)語(yǔ)義段與所述廣告模板庫(kù)的匹配度為高匹配度,且所述廣告模板庫(kù)中不包含與所述任意一個(gè)語(yǔ)義段完全相同的語(yǔ)義段,則根據(jù)所述任意一個(gè)語(yǔ)義段更新所述廣告模板庫(kù)。
10.如權(quán)利要求6-8中任一項(xiàng)所述的通知信息的過(guò)濾裝置,其特征在于,所述預(yù)設(shè)的劃分標(biāo)識(shí)符為句號(hào)、問(wèn)號(hào)以及感嘆號(hào)。