本申請(qǐng)涉及互聯(lián)領(lǐng)域,具體涉及搜索領(lǐng)域,尤其涉及搜索方法和裝置。
背景技術(shù):
搜索引擎可以通過(guò)諸如搜索引擎營(yíng)銷(SEM,Search Engine Marketing)的手段為與其合作電商的站點(diǎn)帶來(lái)更多的點(diǎn)擊和關(guān)注。電商通過(guò)有針對(duì)性地在搜索引擎上購(gòu)買(mǎi)關(guān)鍵詞,將搜索引擎上的用戶導(dǎo)入電商的站點(diǎn)。電商的站點(diǎn)可以提供中間頁(yè)作為搜索引擎導(dǎo)入流量的入口,激發(fā)用戶的購(gòu)買(mǎi)興趣。目前,通常是直接將搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞在電商的站點(diǎn)的商品檢索系統(tǒng)中進(jìn)行搜索,并在中間頁(yè)將搜索結(jié)果呈現(xiàn)給用戶。
然而,由于搜索引擎與電商的站點(diǎn)的商品檢索系統(tǒng)的知識(shí)體系存在明顯差異,搜索引擎傾向于更普適性的應(yīng)用場(chǎng)景,在搜索時(shí)傾向于諸如信息的熱度等無(wú)偏向性的屬性,而電商的站點(diǎn)的商品檢索系統(tǒng)是基于商品集合深度優(yōu)化的,傾向于將檢索的目標(biāo)局限在已知商品的范圍內(nèi)。從而,導(dǎo)致在直接將搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞在電商的站點(diǎn)的商品檢索系統(tǒng)中搜索,難以返回用戶感興趣的商品,進(jìn)而導(dǎo)致無(wú)法在中間頁(yè)向用戶呈現(xiàn)用戶感興趣的商品,影響用戶體驗(yàn)以及最終轉(zhuǎn)化。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)?zhí)峁┝怂阉鞣椒ê脱b置,用于解決上述背景技術(shù)部分存在的技術(shù)問(wèn)題。
第一方面,本申請(qǐng)?zhí)峁┝怂阉鞣椒?,該方法包括:?duì)用戶在搜索引擎中輸入的用戶搜索關(guān)鍵詞進(jìn)行文本切分,以及對(duì)文本切分后得到的切分詞語(yǔ)進(jìn)行組合,得到多個(gè)用戶搜索關(guān)鍵詞元組;從多個(gè)站內(nèi)搜索關(guān)鍵詞元組中分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,其中,站內(nèi)搜索關(guān)鍵詞元組基于預(yù)先對(duì)用戶在站點(diǎn)內(nèi)輸入的站內(nèi)搜索關(guān)鍵詞進(jìn)行文本切分得到的切分詞語(yǔ)進(jìn)行組合而生成;從查找出的站內(nèi)搜索關(guān)鍵詞元組中選取出滿足預(yù)設(shè)條件的站內(nèi)搜索關(guān)鍵詞元組,以及從選取出的站內(nèi)搜索關(guān)鍵詞元組中選取出核心詞語(yǔ),預(yù)設(shè)條件包括:對(duì)應(yīng)的站點(diǎn)內(nèi)的至少一個(gè)類目的搜索意圖的強(qiáng)度大于閾值;將核心詞語(yǔ)對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果呈現(xiàn)給用戶。
第二方面,本申請(qǐng)?zhí)峁┝怂阉餮b置,該裝置包括:處理單元,配置用于對(duì)用戶在搜索引擎中輸入的用戶搜索關(guān)鍵詞進(jìn)行文本切分,以及對(duì)文本切分后得到的切分詞語(yǔ)進(jìn)行組合,得到多個(gè)用戶搜索關(guān)鍵詞元組;查找單元,配置用于從多個(gè)站內(nèi)搜索關(guān)鍵詞元組中分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,其中,站內(nèi)搜索關(guān)鍵詞元組基于預(yù)先對(duì)用戶在站點(diǎn)內(nèi)輸入的站內(nèi)搜索關(guān)鍵詞進(jìn)行文本切分得到的切分詞語(yǔ)進(jìn)行組合而生成;核心詞語(yǔ)篩選單元,配置用于從查找出的站內(nèi)搜索關(guān)鍵詞元組中選取出滿足預(yù)設(shè)條件的站內(nèi)搜索關(guān)鍵詞元組,以及從選取出的站內(nèi)搜索關(guān)鍵詞元組中選取出核心詞語(yǔ),預(yù)設(shè)條件包括:對(duì)應(yīng)的站點(diǎn)內(nèi)的至少一個(gè)類目的搜索意圖的強(qiáng)度大于閾值;站點(diǎn)內(nèi)搜索單元,配置用于將核心詞語(yǔ)對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果呈現(xiàn)給用戶。
本申請(qǐng)?zhí)峁┑乃阉鞣椒ê脱b置,通過(guò)對(duì)用戶在搜索引擎中輸入的用戶搜索關(guān)鍵詞進(jìn)行文本切分,以及對(duì)文本切分后得到的切分詞語(yǔ)進(jìn)行組合,得到多個(gè)用戶搜索關(guān)鍵詞元組;從多個(gè)站內(nèi)搜索關(guān)鍵詞元組中分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組;從查找出的站內(nèi)搜索關(guān)鍵詞元組中選取出滿足預(yù)設(shè)條件的站內(nèi)搜索關(guān)鍵詞元組,以及從選取出的站內(nèi)搜索關(guān)鍵詞元組中選取出核心詞語(yǔ);將核心詞語(yǔ)對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果呈現(xiàn)給用戶。實(shí)現(xiàn)了從諸如搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞挖掘出更好表現(xiàn)用戶的興趣和意圖的核心詞語(yǔ),利用核心詞語(yǔ)在諸如電商的站點(diǎn)內(nèi)進(jìn)行搜索,向用戶呈現(xiàn)用戶感興趣的諸如電商的站點(diǎn)的商品的搜索結(jié)果。
附圖說(shuō)明
通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
圖1是可以應(yīng)用于本申請(qǐng)的搜索方法的示例性系統(tǒng)架構(gòu)圖;
圖2示出了本申請(qǐng)的搜索方法的一個(gè)流程圖;
圖3示出了本申請(qǐng)的搜索方法的一個(gè)示例性流程圖;
圖4示出了本申請(qǐng)的搜索裝置的一個(gè)結(jié)構(gòu)示意圖。
具體實(shí)施例
下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說(shuō)明。可以理解的是,此處所描述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對(duì)該發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本申請(qǐng)。
圖1示出了可以應(yīng)用于本申請(qǐng)的搜索方法的示例性系統(tǒng)架構(gòu)圖。
如圖1所示,系統(tǒng)架構(gòu)可以包括搜索引擎101、網(wǎng)絡(luò)102和站點(diǎn)103。網(wǎng)絡(luò)102用以在搜索引擎101和站點(diǎn)103之間提供傳輸鏈路的介質(zhì)。網(wǎng)絡(luò)102可以包括各種連接類型,例如有線、無(wú)線傳輸鏈路或者光纖電纜等等。
搜索引擎101可以為站點(diǎn)103導(dǎo)入流量。例如,站點(diǎn)103可以為電商的站點(diǎn),搜索引擎101可以通過(guò)搜索引擎營(yíng)銷手段為站點(diǎn)103導(dǎo)入流量。站點(diǎn)103上的服務(wù)器可以將搜索引擎101導(dǎo)入的用戶搜索關(guān)鍵詞挖掘出更好地表現(xiàn)用戶的興趣和意圖的核心詞語(yǔ),利用核心詞語(yǔ)在站點(diǎn)103的檢索系統(tǒng)中進(jìn)行搜索,得到用戶感興趣的搜索結(jié)果,從而,將用戶感興趣的搜索結(jié)果在搜索中間頁(yè)呈現(xiàn)給用戶。
請(qǐng)參考圖2,其示出了本申請(qǐng)的搜索方法的一個(gè)流程圖。該方法可以由服務(wù)器例如圖1中的站點(diǎn)103上的服務(wù)器執(zhí)行,相應(yīng)地,搜索裝置可以設(shè)置于服務(wù)器例如站點(diǎn)103上的服務(wù)器中。該方法包括以下步驟:
步驟201,對(duì)用戶在搜索引擎中輸入的搜索關(guān)鍵詞進(jìn)行處理。
以站點(diǎn)為電商的站點(diǎn),搜索引擎可以為電商的站點(diǎn)導(dǎo)入流量的搜索引擎為例,為了將搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞改寫(xiě)為更好地表現(xiàn)用戶的興趣和意圖的核心詞語(yǔ),并利用核心詞語(yǔ)在電商的站點(diǎn)內(nèi)的商品檢索系統(tǒng)中搜索,返回用戶感興趣的商品,可以首先獲取搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞。在獲取用戶搜索關(guān)鍵詞之后,可以首先對(duì)用戶搜索關(guān)鍵詞進(jìn)行文本切分,得到多個(gè)切分詞語(yǔ)。然后,可以對(duì)切分詞語(yǔ)進(jìn)行組合,得到用戶搜索關(guān)鍵詞元組。
在一些實(shí)施例中,在對(duì)用戶搜索關(guān)鍵詞進(jìn)行文本切分時(shí),考慮了未登錄詞(Unregistered Word)對(duì)文本切分的質(zhì)量的影響,可以預(yù)先設(shè)置包含站點(diǎn)內(nèi)的未登陸詞的預(yù)設(shè)詞表。在進(jìn)行文本切分時(shí),除了依靠常用詞語(yǔ)構(gòu)成的字典,可以根據(jù)預(yù)設(shè)詞表,準(zhǔn)確地切分出用戶搜索關(guān)鍵詞中的未登陸詞。
以站點(diǎn)為電商的站點(diǎn)為例,用戶在電商的站點(diǎn)內(nèi)搜索時(shí)輸入的站點(diǎn)內(nèi)搜索詞通常與商品名稱、品牌等相關(guān),站點(diǎn)內(nèi)搜索詞多屬于未登錄詞,但又表達(dá)了強(qiáng)烈的對(duì)商品的搜索意圖。為提升文本切分質(zhì)量,可以定期更新類目詞表、商品詞表、品牌詞表等預(yù)設(shè)詞表,類目詞表、商品詞表、品牌詞表中包含表示電商的站點(diǎn)內(nèi)的商品類別的關(guān)鍵詞、表示電商的站點(diǎn)內(nèi)的商品名稱的關(guān)鍵詞、表示電商的站點(diǎn)內(nèi)的商品品牌的關(guān)鍵詞。從而,在對(duì)用戶搜索關(guān)鍵詞進(jìn)行文本切分時(shí),可以根據(jù)定期更新的類目詞表、商品詞表、品牌詞表,準(zhǔn)確的切分出表示商品類別的關(guān)鍵詞、表示商品名稱的關(guān)鍵詞、表示商品品牌的關(guān)鍵詞等詞語(yǔ)。從而,提升文本切分的準(zhǔn)確度。
在一些實(shí)施例中,在對(duì)用戶搜索關(guān)鍵詞進(jìn)行文本切分,得到多個(gè)切分詞語(yǔ)之后,可以采用N-元組(N-Gram)模型對(duì)切分詞語(yǔ)進(jìn)行組合,得到用戶搜索關(guān)鍵詞元組。
例如,對(duì)用戶搜索關(guān)鍵詞進(jìn)行文本切分后得到的切分詞語(yǔ)中包含“蘋(píng)果”。對(duì)于“蘋(píng)果”,在不同的上下文中可能是指品牌或者商品??梢岳肗-元組模型對(duì)切分詞語(yǔ)進(jìn)行組合。在利用N-元組模型對(duì)切分詞語(yǔ)進(jìn)行組合時(shí),每個(gè)切分詞語(yǔ)可以與左右相鄰連續(xù)的詞匯構(gòu)成一個(gè)用戶搜索關(guān)鍵詞元組,最大長(zhǎng)度N是可調(diào)參數(shù)。從而,使得用戶搜索關(guān)鍵詞元組既包含了詞組本身也包含了一定的上下文信息,更能夠凸顯用戶的搜索意圖。例如,用戶搜索關(guān)鍵詞元組中包含“蘋(píng)果”和“手機(jī)”,則可以確定“蘋(píng)果”是指品牌,同時(shí)也能更準(zhǔn)確地反映用戶的搜索意圖為某品牌的手機(jī)產(chǎn)品。
步驟202,分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組。
在通過(guò)步驟201得到用戶搜索關(guān)鍵詞元組之后,例如,在結(jié)合預(yù)設(shè)詞表進(jìn)行文本切分和N-元組模型對(duì)從搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞進(jìn)行加工,得到用戶搜索關(guān)鍵詞元組之后,可以從預(yù)先得到的多個(gè)站內(nèi)搜索關(guān)鍵詞元組中分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,即從預(yù)先得到的多個(gè)站內(nèi)搜索關(guān)鍵詞元組中查找出用戶搜索關(guān)鍵詞的元組。
在一些實(shí)施例中,可以預(yù)先獲取海量的用戶在站點(diǎn)內(nèi)的歷史搜索中輸入的站內(nèi)搜索關(guān)鍵詞和點(diǎn)擊的站內(nèi)搜索關(guān)鍵詞對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果。然后,可以根據(jù)包含站點(diǎn)內(nèi)的未登陸詞的預(yù)設(shè)詞表,對(duì)獲取到的站內(nèi)搜索關(guān)鍵詞進(jìn)行文本切分,以及采用N-元組模型對(duì)切分后的切分詞語(yǔ)進(jìn)行組合,得到站內(nèi)搜索關(guān)鍵詞元組。
步驟203,從查找出的站內(nèi)搜索關(guān)鍵詞元組中挖掘核心詞語(yǔ)。
在通過(guò)步驟202查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組之后,可以進(jìn)一步從查找出的站內(nèi)搜索關(guān)鍵詞元組中挖掘核心詞語(yǔ)。
在一些實(shí)施例中,可以預(yù)先計(jì)算每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益,基于站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益,挖掘出核心詞語(yǔ)。對(duì)于任何一個(gè)搜索關(guān)鍵詞元組,可以定義信息增益為在有無(wú)該搜索關(guān)鍵詞元組的情況下,搜索意圖確定性的差異。以站點(diǎn)為電商的站點(diǎn)為例,假設(shè)沒(méi)有關(guān)鍵詞描述的搜索行為最終的轉(zhuǎn)化是均勻分布在所有商品上的,而此時(shí)加入搜索關(guān)鍵詞“手機(jī)”,則可以推斷轉(zhuǎn)化目標(biāo)只限于手機(jī)類目下的商品。加入搜索關(guān)鍵詞后引起的目標(biāo)范圍的縮小或者說(shuō)確定性的提升,可以用信息論中的信息增益來(lái)量化描述。
在一些實(shí)施例中,可以預(yù)先確定每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的歷史轉(zhuǎn)化類目集合以及每一個(gè)類目的轉(zhuǎn)化次數(shù)。例如,用戶在站點(diǎn)內(nèi)的歷史搜索中輸入了站內(nèi)搜索關(guān)鍵詞元組,用戶點(diǎn)擊了站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果中的一個(gè)類目的搜索結(jié)果,則該類目可以作為站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的歷史轉(zhuǎn)化類目,用戶對(duì)該類目的搜索結(jié)果的點(diǎn)擊次數(shù),可以作為該類目的轉(zhuǎn)化次數(shù)。在分別計(jì)算出每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的歷史轉(zhuǎn)化類目集合以及每一個(gè)類目的轉(zhuǎn)化次數(shù)之后,可以進(jìn)一步分別計(jì)算每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益。每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益可以為站點(diǎn)內(nèi)所有的類目轉(zhuǎn)化概率的熵減去在站內(nèi)搜索關(guān)鍵詞元組參與在站點(diǎn)內(nèi)搜索的情況下的類目轉(zhuǎn)化概率的條件熵。在計(jì)算出每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益之后,可以構(gòu)建包含站內(nèi)搜索關(guān)鍵詞元組和站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益的字典。
在一些實(shí)施例中,可以在包含站內(nèi)搜索關(guān)鍵詞元組和站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益的字典中,查找與用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,即在字典中查找出用戶搜索關(guān)鍵詞的元組。
若字典中不存在與用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,即在字典中未查找出用戶搜索關(guān)鍵詞的元組,則可以認(rèn)為信息增益為零。
若字典中存在與用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,即從字典中查找出了用戶搜索關(guān)鍵詞的元組,可以對(duì)查找出與用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的信息增益進(jìn)行排序,即將查找出的用戶搜索關(guān)鍵詞的元組按照信息增益從高到低排序,選取排名前幾個(gè)的用戶搜索關(guān)鍵詞元組作為核心詞語(yǔ)的候選。從而,使得篩選的核心詞語(yǔ)能夠更好地表現(xiàn)用戶的興趣和意圖。
以站點(diǎn)為電商的站點(diǎn)為例,用戶在搜索引擎中輸入“蘋(píng)果三星哪個(gè)好”,“小米6什么時(shí)候發(fā)售”等搜索詞,可以判斷這些搜索詞中是否存在“蘋(píng)果手機(jī)”、“三星手機(jī)”、“小米5”等在電商的站點(diǎn)內(nèi)搜索有用的語(yǔ)素,雖然小米6實(shí)際上沒(méi)有發(fā)售,但依然可以分析出用戶對(duì)電商的站點(diǎn)內(nèi)的商品的搜索的興趣,認(rèn)為用戶對(duì)小米感興趣,根據(jù)用戶在站內(nèi)的歷史熱度,可以推薦小米5。
在本申請(qǐng)中,可以通過(guò)基于類目而非商品構(gòu)建的信息增益,避免長(zhǎng)尾商品銷量記錄過(guò)少引起的計(jì)算數(shù)值不穩(wěn)定,也能夠適應(yīng)后續(xù)的中間頁(yè)優(yōu)化的需求。
步驟204,將核心詞語(yǔ)對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果呈現(xiàn)給用戶。
在通過(guò)步驟203得到核心詞語(yǔ)之后,可以對(duì)核心詞語(yǔ)進(jìn)行組合,得到核心詞語(yǔ)組合??梢岳煤诵脑~語(yǔ)組合在站點(diǎn)內(nèi)進(jìn)行搜索,得到用戶感興趣的搜索結(jié)果,將該搜索結(jié)果呈現(xiàn)給用戶。
在一些實(shí)施例中,利用核心詞語(yǔ)組合在站點(diǎn)內(nèi)進(jìn)行搜索,得到用戶感興趣的搜索結(jié)果之后,可以將搜索結(jié)果在搜索中間頁(yè)中呈現(xiàn)給用戶。
以站點(diǎn)為電商的站點(diǎn),搜索引擎為可以為電商的站點(diǎn)導(dǎo)入流量的搜索引擎為例,可以利用核心詞語(yǔ)組合在站點(diǎn)內(nèi)的商品檢索系統(tǒng)中進(jìn)行搜索,將得到的搜索結(jié)果在搜索中間頁(yè)呈現(xiàn)給用戶。由于核心詞語(yǔ)組合中的核心組合可以更好地表現(xiàn)用戶的興趣和意圖,因此,利用核心詞語(yǔ)組合在站點(diǎn)內(nèi)的商品檢索系統(tǒng)中進(jìn)行搜索得到的搜索結(jié)果為用戶感興趣的商品,可以將用戶感興趣的商品在在搜索中間頁(yè)中呈現(xiàn),從而,提升搜索商品展示準(zhǔn)確率。
請(qǐng)參考圖3,其示出了本申請(qǐng)?zhí)峁┑乃阉鞣椒ǖ囊粋€(gè)示例性流程圖。
將站內(nèi)搜索關(guān)鍵詞經(jīng)過(guò)文本切分和N-元組模型加工、匯總,得到站內(nèi)搜索關(guān)鍵詞元組。將用戶搜索關(guān)鍵詞經(jīng)過(guò)文本切分和N-元組模型加工、匯總,得到用戶搜索關(guān)鍵詞元組??梢灶A(yù)先根據(jù)站內(nèi)搜索關(guān)鍵詞對(duì)應(yīng)的點(diǎn)擊歷史,確定每一個(gè)站內(nèi)搜索關(guān)鍵詞元組對(duì)應(yīng)的歷史轉(zhuǎn)化類目集合以及每一個(gè)類目的轉(zhuǎn)化次數(shù),進(jìn)而計(jì)算每一個(gè)站內(nèi)搜索關(guān)鍵詞對(duì)應(yīng)的信息增益,信息增益為所有的類目轉(zhuǎn)化概率的熵減去在確定該元組情況下的類目轉(zhuǎn)化概率的條件熵,站內(nèi)搜索關(guān)鍵詞元組和對(duì)應(yīng)信息增益構(gòu)成字典。
可以從字典中查找出用戶搜索關(guān)鍵詞的元組。若不存在則認(rèn)為增益為零。若存在,可以將查找出的用戶搜索關(guān)鍵詞的元組按照信息增益從高到低排序,選取排名靠前的查找出的用戶搜索關(guān)鍵詞的元組作為核心詞語(yǔ)的候選。在得到信息增益排名靠前的多個(gè)元組后,可能出現(xiàn)有些元組是另一些元組的子集的情況,可以進(jìn)行去重以及去除敏感詞語(yǔ),得到核心詞語(yǔ),核心詞語(yǔ)可以更好地表現(xiàn)用戶的興趣和意圖。然后,可以對(duì)核心詞語(yǔ)進(jìn)行排列組合,得到改寫(xiě)目標(biāo)。從而,可以利用該改寫(xiě)目標(biāo)在站點(diǎn)內(nèi)的檢索系統(tǒng)中進(jìn)行搜索,得到用戶感興趣的搜索結(jié)果,將該搜索結(jié)果呈現(xiàn)給用戶。
以下以站點(diǎn)為電商的站點(diǎn)為例,說(shuō)明本申請(qǐng)的搜索方法的優(yōu)點(diǎn):在本申請(qǐng)中,可以利用電商的站點(diǎn)自身的搜索數(shù)據(jù)構(gòu)建反映用戶對(duì)不同的類目的搜索意圖的模型,該模型可以根據(jù)站內(nèi)搜索詞元組和站點(diǎn)搜索詞元組對(duì)應(yīng)的信息增益來(lái)構(gòu)建??梢詫⑺阉饕鎸?dǎo)入的搜索行為映射到該模型上,利用改寫(xiě)后的搜索詞元組在站點(diǎn)內(nèi)的商品檢索系統(tǒng)中進(jìn)行檢索,得到用戶感興趣的商品,在搜索中間頁(yè)呈現(xiàn)用戶感興趣的商品。從而,有效地解決了直接利用搜索引擎導(dǎo)入的用戶搜索關(guān)鍵詞直接傳入電商的站點(diǎn)的檢索系統(tǒng)進(jìn)行搜索,因在搜索引擎中輸入的搜索詞不正規(guī)以及搜索習(xí)慣上的差異導(dǎo)致的返回給用戶的內(nèi)容質(zhì)量低下的問(wèn)題,提升了搜索召回率。通過(guò)改寫(xiě)使得電商的站點(diǎn)搜索能夠返回用戶感興趣的商品,提升搜索商品展示準(zhǔn)確率。
請(qǐng)參考圖4,其示出了本申請(qǐng)的搜索裝置的一個(gè)結(jié)構(gòu)示意圖。搜索裝置包括:處理單元401,查找單元402,核心詞語(yǔ)篩選單元403,站點(diǎn)內(nèi)搜索單元404。其中,處理單元401配置用于對(duì)用戶在搜索引擎中輸入的用戶搜索關(guān)鍵詞進(jìn)行文本切分,以及對(duì)文本切分后得到的切分詞語(yǔ)進(jìn)行組合,得到多個(gè)用戶搜索關(guān)鍵詞元組;查找單元402配置用于從多個(gè)站內(nèi)搜索關(guān)鍵詞元組中分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,其中,站內(nèi)搜索關(guān)鍵詞元組基于預(yù)先對(duì)用戶在站點(diǎn)內(nèi)輸入的站內(nèi)搜索關(guān)鍵詞進(jìn)行文本切分得到的切分詞語(yǔ)進(jìn)行組合而生成;核心詞語(yǔ)篩選單元403配置用于從查找出的站內(nèi)搜索關(guān)鍵詞元組中選取出滿足預(yù)設(shè)條件的站內(nèi)搜索關(guān)鍵詞元組,以及從選取出的站內(nèi)搜索關(guān)鍵詞元組中選取出核心詞語(yǔ),預(yù)設(shè)條件包括:對(duì)應(yīng)的站點(diǎn)內(nèi)的至少一個(gè)類目的搜索意圖的強(qiáng)度大于閾值;站點(diǎn)內(nèi)搜索單元404配置用于將核心詞語(yǔ)對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果呈現(xiàn)給用戶。
本申請(qǐng)還提供了一種服務(wù)器,該服務(wù)器可以包括圖4所描述的搜索裝置。該服務(wù)器可以配置有一個(gè)或多個(gè)處理器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序,一個(gè)或多個(gè)程序中可以包含用以執(zhí)行上述步驟201-204中描述的操作的指令。當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行時(shí),使得一個(gè)或多個(gè)處理器執(zhí)行上述步驟201-204中描述的操作。
本申請(qǐng)還提供了一種計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以是服務(wù)器中所包括的;也可以是單獨(dú)存在,未裝配入服務(wù)器中。該計(jì)算機(jī)可讀介質(zhì)承載有一個(gè)或者多個(gè)程序,當(dāng)一個(gè)或者多個(gè)程序被該服務(wù)器執(zhí)行時(shí),使得該服務(wù)器:對(duì)用戶在搜索引擎中輸入的用戶搜索關(guān)鍵詞進(jìn)行文本切分,以及對(duì)文本切分后得到的切分詞語(yǔ)進(jìn)行組合,得到多個(gè)用戶搜索關(guān)鍵詞元組;從多個(gè)站內(nèi)搜索關(guān)鍵詞元組中分別查找出與每一個(gè)用戶搜索關(guān)鍵詞元組匹配的站內(nèi)搜索關(guān)鍵詞元組,其中,站內(nèi)搜索關(guān)鍵詞元組基于預(yù)先對(duì)用戶在站點(diǎn)內(nèi)輸入的站內(nèi)搜索關(guān)鍵詞進(jìn)行文本切分得到的切分詞語(yǔ)進(jìn)行組合而生成;從查找出的站內(nèi)搜索關(guān)鍵詞元組中選取出滿足預(yù)設(shè)條件的站內(nèi)搜索關(guān)鍵詞元組,以及從選取出的站內(nèi)搜索關(guān)鍵詞元組中選取出核心詞語(yǔ),預(yù)設(shè)條件包括:對(duì)應(yīng)的站點(diǎn)內(nèi)的至少一個(gè)類目的搜索意圖的強(qiáng)度大于閾值;將核心詞語(yǔ)對(duì)應(yīng)的站點(diǎn)內(nèi)的搜索結(jié)果呈現(xiàn)給用戶。
需要說(shuō)明的是,上述計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)或者是上述兩者的任意組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子可以包括但不限于:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤(pán)、硬盤(pán)、隨機(jī)訪問(wèn)存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器(EPROM或閃存)、光纖、便攜式緊湊磁盤(pán)只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本申請(qǐng)中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包括或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本申請(qǐng)中,計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以為多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包括的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于:無(wú)線、電線、光纜、RF等等,或者上述的任意合適的組合。
以上描述僅為本申請(qǐng)的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說(shuō)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請(qǐng)中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請(qǐng)中公開(kāi)的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。