而形成的技術(shù)方案。
【主權(quán)項】
1.一種信息推送方法,其特征在于,所述方法包括: 采集終端的信息搜索數(shù)據(jù),所述信息搜索數(shù)據(jù)包括終端上設(shè)定時間內(nèi)、與搜索應(yīng)用相關(guān)的數(shù)據(jù); 對所述信息搜索數(shù)據(jù)進(jìn)行信息提取得到搜索特征詞集合和搜索目標(biāo)詞集合,所述搜索特征詞為輸入到所述搜索應(yīng)用中的搜索詞,所述搜索目標(biāo)詞為從所述搜索特征詞通過所述搜索應(yīng)用得到的搜索數(shù)據(jù)中提取出的關(guān)鍵詞; 通過對所述搜索特征詞集合內(nèi)的搜索特征詞與搜索目標(biāo)詞集合內(nèi)的搜索目標(biāo)詞進(jìn)行匹配來確定匹配關(guān)系; 根據(jù)所述匹配關(guān)系將與所述搜索特征詞對應(yīng)的所述搜索目標(biāo)詞的推送信息推送給所述終端,所述推送信息用于對所述搜索目標(biāo)詞進(jìn)行解釋說明。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過對所述搜索特征詞集合內(nèi)的搜索特征詞與搜索目標(biāo)詞集合內(nèi)的搜索目標(biāo)詞進(jìn)行匹配來確定匹配關(guān)系包括: 從所述搜索特征詞集合內(nèi)提取搜索特征詞; 通過所述搜索目標(biāo)詞集合內(nèi)、與所述搜索特征詞具有對應(yīng)關(guān)系的搜索目標(biāo)詞構(gòu)成初始目標(biāo)詞集合; 根據(jù)所述搜索特征詞和搜索目標(biāo)詞在所述信息搜索數(shù)據(jù)中的數(shù)量和先后順序確定所述搜索特征詞和搜索目標(biāo)詞之間的正向條件概率和反向條件概率,其中,所述正向條件概率為通過搜索特征詞得到搜索目標(biāo)詞的條件概率,所述反向條件概率為通過搜索目標(biāo)詞得到搜索特征詞的條件概率; 根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述正向條件概率通過如下步驟確定: 統(tǒng)計所述信息搜索數(shù)據(jù)中,在所述搜索特征詞后出現(xiàn)的所述搜索目標(biāo)詞及所述搜索目標(biāo)詞的數(shù)量;將所述搜索特征詞的數(shù)量占全部所述搜索特征詞的數(shù)量的比值作為第一正向比值;將所述搜索目標(biāo)詞的數(shù)量占全部所述搜索目標(biāo)詞的數(shù)量的比值作為第二正向比值;根據(jù)所述第一正向比值和第二正向比值得到每個所述搜索目標(biāo)詞相對于所述搜索特征詞的正向條件概率,所述正向條件概率為第一正向比值和第二正向比值的乘積,與第一正向比值的比值。4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述反向條件概率通過如下步驟確定: 統(tǒng)計所述信息搜索數(shù)據(jù)中,在所述搜索目標(biāo)詞后出現(xiàn)的所述搜索特征詞及所述搜索特征詞的數(shù)量;將所述搜索目標(biāo)詞的數(shù)量占全部所述搜索目標(biāo)詞的數(shù)量的比值作為第一反向比值;將所述搜索特征詞的數(shù)量占全部所述搜索特征詞的數(shù)量的比值作為第二反向比值;根據(jù)所述第一反向比值和第二反向比值得到每個所述搜索特征詞相對于所述搜索目標(biāo)詞的反向條件概率,所述反向條件概率為第一反向比值和第二反向比值的乘積,與第一反向比值的比值。5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系包括: 通過所述搜索特征集合和搜索目標(biāo)集合構(gòu)建二部圖; 根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重; 根據(jù)所述權(quán)重對所述二部圖進(jìn)行圖聚類得到頻繁子圖; 根據(jù)頻繁子圖確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重包括: 若所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率和反向條件概率,并且所述搜索目標(biāo)詞在所述初始目標(biāo)詞集合內(nèi),則將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第一權(quán)重; 若所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率或反向條件概率,并且所述搜索目標(biāo)詞在所述初始目標(biāo)詞集合內(nèi),則將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第二權(quán)重; 若所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率或反向條件概率,并且所述搜索目標(biāo)詞不在所述初始目標(biāo)詞集合內(nèi),則將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第三權(quán)重; 若所述搜索特征詞和搜索目標(biāo)詞之間不包括正向條件概率和反向條件概率,并且所述搜索目標(biāo)詞不在所述初始目標(biāo)詞集合內(nèi),則將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為零。7.一種信息推送裝置,其特征在于,所述裝置包括: 數(shù)據(jù)采集單元,用于采集終端的信息搜索數(shù)據(jù),所述信息搜索數(shù)據(jù)包括終端上設(shè)定時間內(nèi)、與搜索應(yīng)用相關(guān)的數(shù)據(jù); 信息提取單元,用于對所述信息搜索數(shù)據(jù)進(jìn)行信息提取得到搜索特征詞集合和搜索目標(biāo)詞集合,所述搜索特征詞為輸入到所述搜索應(yīng)用中的搜索詞,所述搜索目標(biāo)詞為從所述搜索特征詞通過所述搜索應(yīng)用得到的搜索數(shù)據(jù)中提取出的關(guān)鍵詞; 匹配關(guān)系獲取單元,用于通過對所述搜索特征詞集合內(nèi)的搜索特征詞與搜索目標(biāo)詞集合內(nèi)的搜索目標(biāo)詞進(jìn)行匹配來確定匹配關(guān)系; 推送單元,用于根據(jù)所述匹配關(guān)系將與所述搜索特征詞對應(yīng)的所述搜索目標(biāo)詞的推送信息推送給所述終端,所述推送信息用于對所述搜索目標(biāo)詞進(jìn)行解釋說明。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述匹配關(guān)系獲取單元包括: 搜索特征詞提取子單元,用于從所述搜索特征詞集合內(nèi)提取搜索特征詞; 初始目標(biāo)詞集合獲取子單元,用于通過所述搜索目標(biāo)詞集合內(nèi)全部與所述搜索特征詞具有對應(yīng)關(guān)系的搜索目標(biāo)詞構(gòu)成初始目標(biāo)詞集合; 條件概率計算子單元,用于根據(jù)所述搜索特征詞和搜索目標(biāo)詞在所述信息搜索數(shù)據(jù)中的數(shù)量和先后順序確定所述搜索特征詞和搜索目標(biāo)詞之間的正向條件概率和反向條件概率,其中,所述正向條件概率為通過搜索特征詞得到搜索目標(biāo)詞的條件概率,所述反向條件概率為通過搜索目標(biāo)詞得到搜索特征詞的條件概率; 匹配關(guān)系獲取子單元,用于根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述條件概率計算子單元包括正向條件概率計算模塊,用于計算正向條件概率,包括: 搜索目標(biāo)詞統(tǒng)計子模塊,用于統(tǒng)計所述信息搜索數(shù)據(jù)中,在所述搜索特征詞后出現(xiàn)的所述搜索目標(biāo)詞及所述搜索目標(biāo)詞的數(shù)量; 第一正向比值計算子模塊,用于將所述搜索特征詞的數(shù)量占全部所述搜索特征詞的數(shù)量的比值作為第一正向比值; 第二正向比值計算子模塊,用于將所述搜索目標(biāo)詞的數(shù)量占全部所述搜索目標(biāo)詞的數(shù)量的比值作為第二正向比值; 正向條件概率計算子模塊,用于根據(jù)所述第一正向比值和第二正向比值得到每個所述搜索目標(biāo)詞相對于所述搜索特征詞的正向條件概率,所述正向條件概率為第一正向比值和第二正向比值的乘積,與第一正向比值的比值。10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述條件概率計算子單元包括反向條件概率計算模塊,用于計算反向條件概率,包括: 搜索特征詞統(tǒng)計子模塊,用于統(tǒng)計所述信息搜索數(shù)據(jù)中,在所述搜索目標(biāo)詞后出現(xiàn)的所述搜索特征詞及所述搜索特征詞的數(shù)量; 第一反向比值計算子模塊,用于將所述搜索目標(biāo)詞的數(shù)量占全部所述搜索目標(biāo)詞的數(shù)量的比值作為第一反向比值; 第二反向比值計算子模塊,用于將所述搜索特征詞的數(shù)量占全部所述搜索特征詞的數(shù)量的比值作為第二反向比值; 反向條件概率計算子模塊,用于根據(jù)所述第一反向比值和第二反向比值得到每個所述搜索特征詞相對于所述搜索目標(biāo)詞的反向條件概率,所述反向條件概率為第一反向比值和第二反向比值的乘積,與第一反向比值的比值。11.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述匹配關(guān)系獲取子單元包括: 二部圖構(gòu)建模塊,用于通過所述搜索特征集合和搜索目標(biāo)集合構(gòu)建二部圖; 權(quán)重獲取模塊,用于根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重; 頻繁子圖獲取模塊,用于根據(jù)所述權(quán)重對所述二部圖進(jìn)行圖聚類得到頻繁子圖; 匹配關(guān)系獲取模塊,用于根據(jù)頻繁子圖確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述權(quán)重獲取模塊包括: 權(quán)重獲取子模塊,用于在所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率和反向條件概率,并且所述搜索目標(biāo)詞在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第一權(quán)重,在所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率或反向條件概率,并且所述搜索目標(biāo)詞在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第二權(quán)重,在所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率或反向條件概率,并且所述搜索目標(biāo)詞不在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第三權(quán)重,在所述搜索特征詞和搜索目標(biāo)詞之間不包括正向條件概率和反向條件概率,并且所述搜索目標(biāo)詞不在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為零。
【專利摘要】本申請公開了信息推送方法及裝置。所述方法的一【具體實施方式】包括:采集終端的信息搜索數(shù)據(jù),所述信息搜索數(shù)據(jù)包括終端上設(shè)定時間內(nèi)、與搜索應(yīng)用相關(guān)的數(shù)據(jù);對所述信息搜索數(shù)據(jù)進(jìn)行信息提取得到搜索特征詞集合和搜索目標(biāo)詞集合,所述搜索特征詞為輸入到所述搜索應(yīng)用中的搜索詞,所述搜索目標(biāo)詞為從所述搜索特征詞通過所述搜索應(yīng)用得到的搜索數(shù)據(jù)中提取出的關(guān)鍵詞;通過對所述搜索特征詞集合內(nèi)的搜索特征詞與搜索目標(biāo)詞集合內(nèi)的搜索目標(biāo)詞進(jìn)行匹配來確定匹配關(guān)系;根據(jù)所述匹配關(guān)系將與所述搜索特征詞對應(yīng)的所述搜索目標(biāo)詞的推送信息推送給所述終端,所述推送信息用于對所述搜索目標(biāo)詞進(jìn)行解釋說明。該實施方式提高了推送信息的準(zhǔn)確性和實時性。
【IPC分類】G06F17/30
【公開號】CN105574091
【申請?zhí)枴緾N201510917972
【發(fā)明人】趙釹森, 劉水, 張立邦
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2016年5月11日
【申請日】2015年12月10日