0包括數(shù)據(jù)采集單元401、信息提取單元402、匹配關(guān)系獲取單元403和推送單元404。其中,數(shù)據(jù)采集單元401用于采集終端的信息搜索數(shù)據(jù),所述信息搜索數(shù)據(jù)包括終端上設(shè)定時間內(nèi)、與搜索應(yīng)用相關(guān)的數(shù)據(jù);信息提取單元402用于對所述信息搜索數(shù)據(jù)進(jìn)行信息提取得到搜索特征詞集合和搜索目標(biāo)詞集合,所述搜索特征詞為輸入到所述搜索應(yīng)用中的搜索詞,所述搜索目標(biāo)詞為從所述搜索特征詞通過所述搜索應(yīng)用得到的搜索數(shù)據(jù)中提取出的關(guān)鍵詞;匹配關(guān)系獲取單元403用于通過對所述搜索特征詞集合內(nèi)的搜索特征詞與搜索目標(biāo)詞集合內(nèi)的搜索目標(biāo)詞進(jìn)行匹配來確定匹配關(guān)系;推送單元404用于根據(jù)所述匹配關(guān)系將與所述搜索特征詞對應(yīng)的所述搜索目標(biāo)詞的推送信息推送給所述終端,所述推送信息用于對所述搜索目標(biāo)詞進(jìn)行解釋說明。
[0072]在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,所述匹配關(guān)系獲取單元403包括:搜索特征詞提取子單元(圖中未示出)、初始目標(biāo)詞集合獲取子單元(圖中未示出)、條件概率計算子單元(圖中未示出)、和匹配關(guān)系獲取子單元(圖中未示出)。其中,特征詞提取子單元用于從所述搜索特征詞集合內(nèi)提取搜索特征詞;初始目標(biāo)詞集合獲取子單元用于通過所述搜索目標(biāo)詞集合內(nèi)全部與所述搜索特征詞具有對應(yīng)關(guān)系的搜索目標(biāo)詞構(gòu)成初始目標(biāo)詞集合;條件概率計算子單元用于根據(jù)所述搜索特征詞和搜索目標(biāo)詞在所述信息搜索數(shù)據(jù)中的數(shù)量和先后順序確定所述搜索特征詞和搜索目標(biāo)詞之間的正向條件概率和反向條件概率,其中,所述先后順序通過搜索特征詞或搜索目標(biāo)詞分別作為所述搜索應(yīng)用的搜索詞或關(guān)鍵詞來確定,所述正向條件概率為通過搜索特征詞得到搜索目標(biāo)詞的條件概率,所述反向條件概率為通過搜索目標(biāo)詞得到搜索特征詞的條件概率;匹配關(guān)系獲取子單元用于根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系。
[0073]在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,所述條件概率計算子單元包括正向條件概率計算模塊,用于計算正向條件概率,包括:搜索目標(biāo)詞統(tǒng)計子模塊(圖中未示出)、第一正向比值計算子模塊(圖中未示出)、第二正向比值計算子模塊(圖中未示出)和正向條件概率計算子模塊(圖中未示出)。其中,搜索目標(biāo)詞統(tǒng)計子模塊用于統(tǒng)計所述信息搜索數(shù)據(jù)中,在所述搜索特征詞后出現(xiàn)的所述搜索目標(biāo)詞及所述搜索目標(biāo)詞的數(shù)量;第一正向比值計算子模塊用于將所述搜索特征詞的數(shù)量占全部所述搜索特征詞的數(shù)量的比值作為第一正向比值;第二正向比值計算子模塊用于將所述搜索目標(biāo)詞的數(shù)量占全部所述搜索目標(biāo)詞的數(shù)量的比值作為第二正向比值;正向條件概率計算子模塊用于根據(jù)所述第一正向比值和第二正向比值得到每個所述搜索目標(biāo)詞相對于所述搜索特征詞的正向條件概率,所述正向條件概率為第一正向比值和第二正向比值的乘積,與第一正向比值的比值。
[0074]在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,所述條件概率計算子單元包括反向條件概率計算模塊,用于計算反向條件概率,包括:
[0075]搜索特征詞統(tǒng)計子模塊(圖中未示出)、第一反向比值計算子模塊(圖中未示出)、第二反向比值計算子模塊(圖中未示出)和反向條件概率計算子模塊(圖中未示出)。其中,搜索特征詞統(tǒng)計子模塊用于統(tǒng)計所述信息搜索數(shù)據(jù)中,在所述搜索目標(biāo)詞后出現(xiàn)的所述搜索特征詞及所述搜索特征詞的數(shù)量;第一反向比值計算子模塊用于將所述搜索目標(biāo)詞的數(shù)量占全部所述搜索目標(biāo)詞的數(shù)量的比值作為第一反向比值;第二反向比值計算子模塊用于將所述搜索特征詞的數(shù)量占全部所述搜索特征詞的數(shù)量的比值作為第二反向比值;反向條件概率計算子模塊用于根據(jù)所述第一反向比值和第二反向比值得到每個所述搜索特征詞相對于所述搜索目標(biāo)詞的反向條件概率,所述反向條件概率為第一反向比值和第二反向比值的乘積,與第一反向比值的比值。。
[0076]在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,所述匹配關(guān)系獲取子單元包括:二部圖構(gòu)建模塊(圖中未示出)、權(quán)重獲取模塊(圖中未示出)、頻繁子圖獲取模塊(圖中未示出)和匹配關(guān)系獲取模塊(圖中未示出)。其中,二部圖構(gòu)建模塊用于通過所述搜索特征集合和搜索目標(biāo)集合構(gòu)建二部圖;權(quán)重獲取模塊用于根據(jù)所述正向條件概率、反向條件概率和初始目標(biāo)詞集合確定所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重;頻繁子圖獲取模塊用于根據(jù)所述權(quán)重對所述二部圖進(jìn)行圖聚類得到頻繁子圖;匹配關(guān)系獲取模塊用于根據(jù)頻繁子圖確定所述搜索特征詞和搜索目標(biāo)詞之間的匹配關(guān)系。
[0077]在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,所述權(quán)重獲取模塊包括權(quán)重獲取子模塊,用于在所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率和反向條件概率,并且所述搜索目標(biāo)詞在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第一權(quán)重,在所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率或反向條件概率,并且所述搜索目標(biāo)詞在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第二權(quán)重,在所述搜索特征詞和搜索目標(biāo)詞之間包括正向條件概率或反向條件概率,并且所述搜索目標(biāo)詞不在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為第三權(quán)重,在所述搜索特征詞和搜索目標(biāo)詞之間不包括正向條件概率和反向條件概率,并且所述搜索目標(biāo)詞不在所述初始目標(biāo)詞集合內(nèi)時,將所述搜索特征詞和搜索目標(biāo)詞之間的權(quán)重設(shè)置為零。
[0078]下面參考圖5,其示出了適于用來實(shí)現(xiàn)本申請實(shí)施例的服務(wù)器的計算機(jī)系統(tǒng)500的結(jié)構(gòu)示意圖。
[0079]如圖5所示,計算機(jī)系統(tǒng)500包括中央處理單元(CPU)501,其可以根據(jù)存儲在只讀存儲器(R0M)502中的程序或者從存儲部分508加載到隨機(jī)訪問存儲器(RAM)503中的程序而執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚怼T赗AM 503中,還存儲有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。CPU 50KROM 502以及RAM 503通過總線504彼此相連。輸入/輸出(I/O)接口505也連接至總線 504。
[0080]以下部件連接至I/O接口505:包括鍵盤、鼠標(biāo)等的輸入部分506 ;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分507;包括硬盤等的存儲部分508;以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分509。通信部分509經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器510也根據(jù)需要連接至I/O接口 505??刹鹦督橘|(zhì)511,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等,根據(jù)需要安裝在驅(qū)動器510上,以便于從其上讀出的計算機(jī)程序根據(jù)需要被安裝入存儲部分508。
[0081]特別地,根據(jù)本公開的實(shí)施例,上文參考流程圖描述的過程可以被實(shí)現(xiàn)為計算機(jī)軟件程序。例如,本公開的實(shí)施例包括一種計算機(jī)程序產(chǎn)品,其包括有形地包含在機(jī)器可讀介質(zhì)上的計算機(jī)程序,所述計算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計算機(jī)程序可以通過通信部分509從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)511被安裝。
[0082]附圖中的流程圖和框圖,圖示了按照本申請各種實(shí)施例的系統(tǒng)、方法和計算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計算機(jī)指令的組合來實(shí)現(xiàn)。
[0083]描述于本申請實(shí)施例中所涉及到的單元可以通過軟件的方式實(shí)現(xiàn),也可以通過硬件的方式來實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括數(shù)據(jù)采集單元、信息提取單元、匹配關(guān)系獲取單元和推送單元。其中,這些單元的名稱在某種情況下并不構(gòu)成對該單元本身的限定,例如,推送單元還可以被描述為“向終端推送信息的單元”。
[0084]作為另一方面,本申請還提供了一種非易失性計算機(jī)存儲介質(zhì),該非易失性計算機(jī)存儲介質(zhì)可以是上述實(shí)施例中所述裝置中所包含的非易失性計算機(jī)存儲介質(zhì);也可以是單獨(dú)存在,未裝配入終端中的非易失性計算機(jī)存儲介質(zhì)。上述非易失性計算機(jī)存儲介質(zhì)存儲有一個或者多個程序,當(dāng)所述一個或者多個程序被一個設(shè)備執(zhí)行時,使得所述設(shè)備:采集終端的信息搜索數(shù)據(jù),所述信息搜索數(shù)據(jù)包括終端上設(shè)定時間內(nèi)、與搜索應(yīng)用相關(guān)的數(shù)據(jù);對所述信息搜索數(shù)據(jù)進(jìn)行信息提取得到搜索特征詞集合和搜索目標(biāo)詞集合,所述搜索特征詞為輸入到所述搜索應(yīng)用中的搜索詞,所述搜索目標(biāo)詞為從所述搜索特征詞通過所述搜索應(yīng)用得到的搜索數(shù)據(jù)中提取出的關(guān)鍵詞;通過對所述搜索特征詞集合內(nèi)的搜索特征詞與搜索目標(biāo)詞集合內(nèi)的搜索目標(biāo)詞進(jìn)行匹配來確定匹配關(guān)系;根據(jù)所述匹配關(guān)系將與所述搜索特征詞對應(yīng)的所述搜索目標(biāo)詞的推送信息推送給所述終端,所述推送信息用于對所述搜索目標(biāo)詞進(jìn)行解釋說明。
[0085]以上描述僅為本申請的較佳實(shí)施例以及對所運(yùn)用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換