亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種搜索方法和系統(tǒng)的制作方法

文檔序號:6489811閱讀:152來源:國知局
一種搜索方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種搜索方法和系統(tǒng),涉及計算機【技術(shù)領(lǐng)域】。所述方法包括:接收用戶端的查詢詞串;根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息;查找各產(chǎn)品信息所屬的產(chǎn)品提供方,或者查找各產(chǎn)品信息所屬的產(chǎn)品提供方和各產(chǎn)品信息所屬領(lǐng)域;提取各產(chǎn)品信息對應(yīng)的第一置信度,所述第一置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方的置信度,或提取各產(chǎn)品信息對應(yīng)的第二置信度,所述第二置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方中,所述產(chǎn)品信息的所屬領(lǐng)域的置信度;將所述第一置信度或第二置信度加入排序權(quán)重,并將各產(chǎn)品信息進行排序;將排序后的產(chǎn)品信息輸出給用戶端。本申請使得搜索得到的產(chǎn)品結(jié)果排序更接近實際需求,減少了冗余數(shù)據(jù)處理過程。
【專利說明】一種搜索方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請涉及計算機【技術(shù)領(lǐng)域】,特別是涉及一種搜索方法和系統(tǒng)。
【背景技術(shù)】
[0002]搜索引擎技術(shù)的發(fā)展是隨著電子技術(shù)不斷進步而形成的信息數(shù)字化和數(shù)據(jù)網(wǎng)絡(luò)化的必然產(chǎn)物。一個出色的搜索引擎能夠及時準(zhǔn)確的向用戶提供所需要的信息。Google搜索引擎依靠其Page Rank機制及收斂算法一直處在該領(lǐng)域的領(lǐng)先地位,其體系結(jié)構(gòu)代表了該搜索領(lǐng)域的傳統(tǒng)搜索引擎。
[0003]但隨著互聯(lián)網(wǎng)快速、細(xì)分的發(fā)展,需要對于各方向的網(wǎng)絡(luò)信息的搜索具有更加精確、更加專業(yè)、更具深度的搜索,而傳統(tǒng)搜索引擎的排名技術(shù)顯然不適用于專業(yè)垂直搜索的需求,比如在B2B電子商務(wù)垂直搜索等產(chǎn)品垂直搜索領(lǐng)域,基于互聯(lián)網(wǎng)的產(chǎn)品搜索服務(wù)器需要將散布于互聯(lián)網(wǎng)的各產(chǎn)品與相關(guān)數(shù)據(jù)搜集起來,提供統(tǒng)一的檢索服務(wù),因此產(chǎn)品數(shù)據(jù)的檢索功能對于整體業(yè)務(wù)而言是非常重要的,產(chǎn)品數(shù)據(jù)的檢索方法既要滿足產(chǎn)品數(shù)據(jù)的檢索這樣一個特定的要求,又要具有很高的性能。
[0004]以電子商務(wù)為例,用戶希望通過搜索獲得所需產(chǎn)品的相關(guān)信息并較好的完成交易。從計算機數(shù)據(jù)處理的過程來看,具體包括以下過程:計算機針對用戶搜索需求給出產(chǎn)品反饋信息,用戶查看產(chǎn)品相關(guān)信息并確定交易,計算機依據(jù)用戶指示完成交易(當(dāng)采用電子貨幣購買電子商品或者虛擬物品時,則全部過程為互聯(lián)網(wǎng)上的數(shù)據(jù)處理過程;當(dāng)購買實物時,則上述過程可能會涉及到一些線下過程)。
[0005]上述數(shù)據(jù)處理過程中,當(dāng)搜索的產(chǎn)品信息的結(jié)果排序不符合實際需求時,則用戶為了完成交易(完成整個數(shù)據(jù)處理過程),則可能需要點擊很多搜索結(jié)果,從而可能導(dǎo)致信息處理過程的冗余、服務(wù)器浪費和效率降低。
[0006]即迫切需要本領(lǐng)域技術(shù)人員解決的技術(shù)問題是:如何才能減少或者避免由于搜索結(jié)果排序不優(yōu)化,而導(dǎo)致的信息處理過程的冗余、服務(wù)器浪費和效率降低。

【發(fā)明內(nèi)容】

[0007]本申請所要解決的技術(shù)問題是提供一種搜索方法和系統(tǒng),解決現(xiàn)有技術(shù)中由于產(chǎn)品信息置信度導(dǎo)致的信息不夠精確,從而導(dǎo)致服務(wù)器負(fù)載壓力大,用戶搜索成本高的缺點;能精確返回用戶需求的產(chǎn)品信息,從而降低服務(wù)器負(fù)載壓力,降低用戶的搜索成本。
[0008]為了解決上述問題,本申請公開了一種搜索方法,包括:
[0009]接收用戶端的查詢詞串;
[0010]根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息;
[0011]查找各產(chǎn)品信息所屬的產(chǎn)品提供方,或者查找各產(chǎn)品信息所屬的產(chǎn)品提供方和各產(chǎn)品信息所屬領(lǐng)域;
[0012]提取各產(chǎn)品信息對應(yīng)的第一置信度,所述第一置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方的置信度,或提取各產(chǎn)品信息對應(yīng)的第二置信度,所述第二置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方中,所述產(chǎn)品信息的所屬領(lǐng)域的置信度;其中,所述每個產(chǎn)品信息的第一置信度通過分析所屬產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得,所述每個產(chǎn)品信息對應(yīng)的第二置信度通過分析所述產(chǎn)品提供方在該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得;
[0013]將所述第一置信度或第二置信度加入排序權(quán)重,并將各產(chǎn)品信息進行排序;
[0014]將排序后的產(chǎn)品信息輸出給用戶端。
[0015]優(yōu)選的,所述每個產(chǎn)品信息的第一置信度通過分析所屬產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得包括:
[0016]針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種行為記錄表包括所述各產(chǎn)品信息的對應(yīng)的交易行為記錄表、評價行為記錄表、和/或收藏行為記錄表;
[0017]針對每一所述產(chǎn)品信息,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值;
[0018]將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一置信度。
[0019]優(yōu)選的,所述每個產(chǎn)品信息對應(yīng)的第二置信度通過分析所述產(chǎn)品提供方在該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得包括:
[0020]針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方的各產(chǎn)品信息的核心產(chǎn)品詞,并提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種日志記錄表包括所述各產(chǎn)品信息的對應(yīng)的各交易行為記錄表、各評價行為記錄表、和/或各收藏行為記錄表;
[0021]根據(jù)所述核心產(chǎn)品詞,確定屬于同一領(lǐng)域的各條產(chǎn)品信息;
[0022]針對每一領(lǐng)域,分析統(tǒng)計所述領(lǐng)域內(nèi)各產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值;
[0023]將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息對應(yīng)的第二置信度。
[0024]優(yōu)選的,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值包括:
[0025]通過分析交易行為記錄表,獲得包括交易次數(shù)對應(yīng)特征維度下的特征值;
[0026]通過分析評價行為記錄表,獲得包括好評率對應(yīng)特征維度下的特征值;
[0027]通過分析收藏行為記錄表,獲得包括收藏次數(shù)對應(yīng)特征維度下的特征值。
[0028]優(yōu)選的,所述各種特征值相應(yīng)的權(quán)重獲得步驟包括:
[0029]對于每一個特征維度,選擇所述特征維度下的原始樣本使用極大似然估計構(gòu)造出目標(biāo)函數(shù)F(X);
[0030]選擇所述特征維度下的初始權(quán)重\,并結(jié)合目標(biāo)函數(shù)F(X)構(gòu)造搜索方向Pt和步長因子St ;
[0031]根據(jù)Wt+1 = fft+stPt迭代求出下一個迭代點Wt+1,當(dāng)基于Wt+1的F(X)值與基于Wt的F(X)值之間的差值的絕對值小于閾值,則將Wt+1作為所述特征維度下的權(quán)重。
[0032]優(yōu)選的,提取所述產(chǎn)品提供方的各產(chǎn)品信息的核心產(chǎn)品詞包括:[0033]提取所述產(chǎn)品信息的標(biāo)題信息;
[0034]對標(biāo)題信息進行切詞和詞性標(biāo)注;
[0035]依據(jù)各詞的詞性及修飾關(guān)系確認(rèn)所述產(chǎn)品信息的核心產(chǎn)品詞。
[0036]優(yōu)選的,根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息包括:
[0037]將所述查詢詞串進行分詞操作;
[0038]基于得到的各分詞進行擴展,得到擴展詞;
[0039]通過各分詞和擴展詞在索引中檢索獲得各產(chǎn)品信息。
[0040]優(yōu)選的,將所述第一置信度或第二置信度加入排序權(quán)重,將各產(chǎn)品信息進行排序包括:
[0041]計算所述各產(chǎn)品信息與所述查詢詞串的文本相關(guān)性值;
[0042]計算所述各產(chǎn)品信息的所屬領(lǐng)域與所述查詢詞串的領(lǐng)域相關(guān)性值;
[0043]利用各產(chǎn)品信息的第一置信度或第二置信度、相應(yīng)的文本相關(guān)性值、領(lǐng)域相關(guān)性值計算總相關(guān)性值;
[0044]基于所述總相關(guān)性值對各產(chǎn)品信息進行排序。
[0045]相應(yīng)的,本申請還公開了一種搜索系統(tǒng),包括:
[0046]查詢接收模塊,用于接收用戶端的查詢詞串;
[0047]檢索模塊,用于根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息;
[0048]查找模塊,用于查找各產(chǎn)品信息所屬的產(chǎn)品提供方,或者查找各產(chǎn)品信息所屬的產(chǎn)品提供方和各產(chǎn)品信息所屬領(lǐng)域;
[0049]置信度提取模塊,用于提取各產(chǎn)品信息第一置信度,所述第一置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方的置信度、或提取各產(chǎn)品信息的第二置信度,所述第二置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方中,所述產(chǎn)品信息的所屬領(lǐng)域的置信度;其中,所述每個產(chǎn)品信息的第一置信度通過分析所屬產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得,所述每個產(chǎn)品信息對應(yīng)的第二置信度通過分析所述產(chǎn)品提供方在該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得;
[0050]排序模塊,用于將所述第一置信度或第二置信度加入排序權(quán)重,并將各產(chǎn)品信息進行排序;
[0051 ] 輸出模塊,用于將排序后的產(chǎn)品信息輸出給用戶端。
[0052]優(yōu)選的,所述置信度提取模塊包括:
[0053]第一提取模塊,用于針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種行為記錄表包括所述各產(chǎn)品信息的對應(yīng)的交易行為記錄表、評價行為記錄表、和/或收藏行為記錄表;
[0054]第一特征值獲取模塊,針對每一所述產(chǎn)品信息,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值;
[0055]第一置信度計算模塊,用于將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一置信度。
[0056]優(yōu)選的,所述置信度提取模塊包括:
[0057]第二提取模塊,用于針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方的各產(chǎn)品信息的核心產(chǎn)品詞,并提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種日志記錄表包括所述各產(chǎn)品信息的對應(yīng)的各交易行為記錄表、各評價行為記錄表、和/或各收藏行為記錄表;
[0058]領(lǐng)域確認(rèn)模塊,用于根據(jù)所述核心產(chǎn)品詞,確定屬于同一領(lǐng)域的各條產(chǎn)品信息;
[0059]第二特征值獲取模塊,用于針對每一領(lǐng)域,分析統(tǒng)計所述領(lǐng)域內(nèi)各產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值;
[0060]第二置信度計算模塊,用于將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一置信度。
[0061]與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點:
[0062]本申請在搜索得到的產(chǎn)品結(jié)果排序時,引入了對該產(chǎn)品提供方的在當(dāng)前產(chǎn)品上的訂單轉(zhuǎn)化率的置信度參數(shù),從而使得搜索得到的產(chǎn)品結(jié)果排序更接近實際需求,使用戶能更便捷的獲取產(chǎn)品信息,不用再進行大量的點擊請求,降低了服務(wù)器負(fù)載壓力,減少了冗余數(shù)據(jù)處理過程,提高了電子商務(wù)這一互聯(lián)網(wǎng)數(shù)據(jù)處理過程的運行效率。
[0063]具體的,為了保證排序的客觀性和科學(xué)性,本申請針對該產(chǎn)品提供方的在當(dāng)前產(chǎn)品上的訂單轉(zhuǎn)化率的置信度參數(shù),即通過該用戶對該產(chǎn)品或者該領(lǐng)域的產(chǎn)品歷史行為記錄進行分析得到的訂單轉(zhuǎn)化率的置信度參數(shù)將搜索結(jié)果中的產(chǎn)品信息進行排序,從而使得搜索得到的產(chǎn)品結(jié)果排序更接近實際需求,使用戶能更便捷的獲取產(chǎn)品信息,不用再進行大量的點擊請求,降低了服務(wù)器負(fù)載壓力,減少了冗余數(shù)據(jù)處理過程。
【專利附圖】

【附圖說明】
[0064]圖1是本申請一種搜索方法的流程不意圖;
[0065]圖2是本申請一種搜索系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0066]為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和【具體實施方式】對本申請作進一步詳細(xì)的說明。
[0067]本申請的核心思想之一在于,在需要更加精確、更加專業(yè)、更具深度的對于產(chǎn)品信息的垂直搜索領(lǐng)域,本申請對于網(wǎng)絡(luò)中每個產(chǎn)品提供方提供的每個產(chǎn)品信息,在該產(chǎn)品提供方的每個產(chǎn)品粒度中,分析并預(yù)置針對該產(chǎn)品提供方的每個產(chǎn)品信息的第一置信度;或者在該產(chǎn)品提供方每個產(chǎn)品所屬領(lǐng)域
[0068](比如類目)的粒度中,分析并預(yù)置各產(chǎn)品信息在所屬產(chǎn)品提供方(賣家)中,各產(chǎn)品信息所屬領(lǐng)域的第二置信度;當(dāng)用戶搜索產(chǎn)品信息時,將所述第一置信度,或者第二置信度加入搜索引擎對產(chǎn)品信息進行排序的排序權(quán)重中,調(diào)整產(chǎn)品信息的排序,然后將更準(zhǔn)確,更符合用戶需求的產(chǎn)品信息有效展示給用戶,避免由于信息不精確導(dǎo)致的用戶多次點擊服務(wù)器,導(dǎo)致服務(wù)器負(fù)載過大的情況。
[0069]參照圖1,示出了本申請一種搜索方法的流程示意圖。
[0070]在本申請系統(tǒng)接收用戶查詢詞串之前,還包括:
[0071]步驟100,通過分析所屬產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得所述每個產(chǎn)品信息的第一置信度,或通過分析所述產(chǎn)品提供方該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得所述每個產(chǎn)品的第二置信度。
[0072]也即,可以理解為:所述第一置信度為各產(chǎn)品信息在所屬產(chǎn)品提供方的置信度,所述第二置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方中,所述產(chǎn)品信息所屬領(lǐng)域的置信度。對于第二置信度,例如賣家A經(jīng)營了領(lǐng)域a,b兩個領(lǐng)域,a領(lǐng)域內(nèi)有al,a2產(chǎn)品,b領(lǐng)域內(nèi)有bl,b2產(chǎn)品,那么以al+a2的產(chǎn)品信息行為記錄表進行分析獲得領(lǐng)域a的第二置信度,那么以bl+b2的產(chǎn)品信息行為記錄表進行分析獲得領(lǐng)域b的第二置信度;那么對于產(chǎn)品信息al來說,其對應(yīng)的第二置信度為:al在賣家A中,al所屬領(lǐng)域a的置信度。
[0073]實際中,所述第一置信度對應(yīng)的為產(chǎn)品提供方具體產(chǎn)品粒度,所述第二置信度對應(yīng)產(chǎn)品提供方每個領(lǐng)域的粒度。其中,所述領(lǐng)域可以理解為類目,比如手機,電腦,服裝產(chǎn)品類目等。
[0074]所述置信度更廣泛的可以理解為某個產(chǎn)品提供方的某一產(chǎn)品或者產(chǎn)品提供方某一產(chǎn)品在某一領(lǐng)域的置信度,也即產(chǎn)品提供方(賣家)對一產(chǎn)品或者一領(lǐng)域內(nèi)產(chǎn)品的權(quán)威性。
[0075]比如針對網(wǎng)絡(luò)平臺中的買家與賣家的情況,買家一般需要根據(jù)買家與賣家的互動信息(交易、評價、收藏等),識別出賣家的權(quán)威經(jīng)營產(chǎn)品或者權(quán)威經(jīng)營領(lǐng)域,所述權(quán)威經(jīng)營產(chǎn)品可為交易量大、和/或評價好、和/或收藏量高的產(chǎn)品或者領(lǐng)域。當(dāng)買家在網(wǎng)站搜索時,把買家關(guān)注的產(chǎn)品的置信度高的產(chǎn)品信息排在搜索list的前面,相應(yīng)對該產(chǎn)品的權(quán)威性高的賣家也在list前面,以減少買家搜索次數(shù),降低服務(wù)器的壓力,為賣家提供更可信的產(chǎn)品信息,減少買家對賣家的鑒別成本。進一步的講,可給予買家更好的搜索體驗,同時激勵賣家積極做好自身的誠信、權(quán)威性建設(shè),從而更好的服務(wù)買家,形成良性循環(huán)。更進一步的說,所述的置信度或者權(quán)威性可以理解為某個賣家的訂單轉(zhuǎn)化率,訂單轉(zhuǎn)化率高的說明該賣家的產(chǎn)品信息更真實可靠。
[0076]優(yōu)選的,在細(xì)化到產(chǎn)品提供方的具體單個產(chǎn)品信息粒度的情況下,所述每個產(chǎn)品信息的第一置信度通過分析所述產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得,包括:
[0077]步驟S71,針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種行為記錄表包括所述各產(chǎn)品信息的對應(yīng)的交易行為記錄表、評價行為記錄表、和/或收藏行為記錄表;
[0078]實際中,比如在網(wǎng)絡(luò)交易平臺中,賣家提供產(chǎn)品,買家在網(wǎng)絡(luò)中購買產(chǎn)品,那么買家和賣家在產(chǎn)品信息的交易過程中,或者買家對產(chǎn)品信息的操作過程中均會存在記錄,t匕如交易行為記錄表,記錄了各產(chǎn)品信息的交易次數(shù)、客戶數(shù)等特征;比如評價行為記錄表,記錄各產(chǎn)品信息獲得的用戶星級評價次數(shù)、好評率等特征;比如收藏行為記錄表,記錄了各產(chǎn)品信息獲得的收藏次數(shù)、收藏客戶數(shù)等特征。
[0079]對于交易相關(guān)特征:該產(chǎn)品的交易次數(shù)、客戶數(shù)等特征。買家購買了賣家某個產(chǎn)品,在一定程度上說明了買家對賣家該產(chǎn)品的認(rèn)可,如果該產(chǎn)品獲得的買家認(rèn)可越多,說明賣家是該產(chǎn)品的優(yōu)質(zhì)賣家。
[0080]對于評價相關(guān)特征:該產(chǎn)品獲得的用戶星級評價次數(shù)、好評率等特征。買家對賣家某個產(chǎn)品的好評越多,代表了買家對賣家該產(chǎn)品的認(rèn)可,好評率越高,說明賣家是該產(chǎn)品的優(yōu)質(zhì)賣家。[0081]對于收藏相關(guān)特征:該產(chǎn)品獲得的收藏次數(shù)、收藏客戶數(shù)等特征。買家對賣家某個產(chǎn)品的收藏同樣代表了買家對賣家該產(chǎn)品的認(rèn)可,收藏越多,說明賣家是該產(chǎn)品的賣家。
[0082]本步驟可從賣家的交易數(shù)據(jù)庫和產(chǎn)品信息數(shù)據(jù)庫中提取賣家每個產(chǎn)品信息的產(chǎn)品詞、交易、評價、收藏行為。
[0083]步驟S72,針對每一所述產(chǎn)品信息,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值;
[0084]因為各種行為記錄表記錄了相關(guān)的各種特征,比如前述交易行為記錄表,記錄了各產(chǎn)品信息的交易次數(shù)、客戶數(shù)等特征;比如評價行為記錄表,記錄各產(chǎn)品信息獲得的用戶星級評價次數(shù)、好評率等特征;比如收藏行為記錄表,記錄了各產(chǎn)品信息獲得的收藏次數(shù)、收藏客戶數(shù)等特征。
[0085]優(yōu)選的,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值包括:
[0086]步驟A71,通過分析交易行為記錄表,獲得包括交易次數(shù)對應(yīng)特征維度下的特征值;
[0087]比如如前所述,交易行為記錄表可能還包括了其他相關(guān)特征維度,比如客戶數(shù)等特征,那么還可統(tǒng)計客戶數(shù)特征維度下的特征值等。
[0088]步驟A72,通過分析評價行為記錄表,獲得包括好評率對應(yīng)特征維度下的特征值;
[0089]當(dāng)然,本步驟也還可統(tǒng)計其他相關(guān)的特征維度的特征值,比如用戶星級評價次數(shù)特征維度下的特征值。
[0090]步驟A73,通過分析收藏行為記錄表,獲得包括收藏次數(shù)對應(yīng)特征維度下的特征值。
[0091]當(dāng)然,本步驟也還可統(tǒng)計其他相關(guān)的特征維度的特征值,比如收藏客戶數(shù)特征維度下的特征值。
[0092]比如,對于每個產(chǎn)品信息,可提取該產(chǎn)品信息交易次數(shù)、客戶數(shù)、用戶星級評價次數(shù)、好評率、收藏次數(shù)、收藏客戶數(shù)等特征維度下的特征值,所述特征值即相應(yīng)維度下實際數(shù)值,比如交易次數(shù)、客戶數(shù)、用戶星級評價次數(shù)、好評率、收藏次數(shù)、收藏客戶數(shù)對應(yīng)的特征值分別為 100、80、55、0.90、150、88。
[0093]步驟S73,將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一
置信度。
[0094]所述第一置信度為前述對于具體產(chǎn)品信息的粒度,比如賣家X提供的產(chǎn)品信息包括offerl,offer2,offer3,offer4,那么通過前述步驟獲得每一個產(chǎn)品信息的第一置信度。
[0095]對于第i個特征維度下的特征值Xi,可將其向量化為一個特征向量X =
[0096](X1, X2,......Xn),比如對于前述例子中各特征值100、80、55、0.90、150、88,可將
其向量化為 X = (100、80、55、0.90,150,88)。
[0097]實際中,各特征維度對應(yīng)相應(yīng)的權(quán)重,也即第i個特征值對應(yīng)一個權(quán)重Wi。也可將相應(yīng)權(quán)重向量化為一個權(quán)重向量W = (W1, W2,......, Wn)。
[0098]然后利用上述得到的向量X,和w采用邏輯回歸模型:[0099]
【權(quán)利要求】
1.一種搜索方法,其特征在于,包括: 接收用戶端的查詢詞串; 根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息; 查找各產(chǎn)品信息所屬的產(chǎn)品提供方,或者查找各產(chǎn)品信息所屬的產(chǎn)品提供方和各產(chǎn)品信息所屬領(lǐng)域; 提取各產(chǎn)品信息對應(yīng)的第一置信度,所述第一置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方的置信度,或提取各產(chǎn)品信息對應(yīng)的第二置信度,所述第二置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方中,所述產(chǎn)品信息的所屬領(lǐng)域的置信度;其中,所述每個產(chǎn)品信息的第一置信度通過分析所屬 產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得,所述每個產(chǎn)品信息對應(yīng)的第二置信度通過分析所述產(chǎn)品提供方在該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得; 將所述第一置信度或第二置信度加入排序權(quán)重,并將各產(chǎn)品信息進行排序; 將排序后的產(chǎn)品信息輸出給用戶端。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述每個產(chǎn)品信息的第一置信度通過分析所屬產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得包括: 針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種行為記錄表包括所述各產(chǎn)品信息的對應(yīng)的交易行為記錄表、評價行為記錄表、和/或收藏行為記錄表; 針對每一所述產(chǎn)品信息,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值; 將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一置信度。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述每個產(chǎn)品信息對應(yīng)的第二置信度通過分析所述產(chǎn)品提供方在該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得包括: 針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方的各產(chǎn)品信息的核心產(chǎn)品詞,并提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種日志記錄表包括所述各產(chǎn)品信息的對應(yīng)的各交易行為記錄表、各評價行為記錄表、和/或各收藏行為記錄表; 根據(jù)所述核心產(chǎn)品詞,確定屬于同一領(lǐng)域的各條產(chǎn)品信息; 針對每一領(lǐng)域,分析統(tǒng)計所述領(lǐng)域內(nèi)各產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值; 將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息對應(yīng)的第二置信度。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值包括: 通過分析交易行為記錄表,獲得包括交易次數(shù)對應(yīng)特征維度下的特征值; 通過分析評價行為記錄表,獲得包括好評率對應(yīng)特征維度下的特征值; 通過分析收藏行為記錄表,獲得包括收藏次數(shù)對應(yīng)特征維度下的特征值。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述各種特征值相應(yīng)的權(quán)重獲得步驟包括:對于每一個特征維度,選擇所述特征維度下的原始樣本使用極大似然估計構(gòu)造出目標(biāo)am F (X); 選擇所述特征維度下的初始權(quán)重Wtl,并結(jié)合目標(biāo)函數(shù)F(X)構(gòu)造搜索方向Pt和步長因子St ; 根據(jù)wt+1 = fft+stPt迭代求出下一個迭代點Wt+1,當(dāng)基于Wt+1的F⑴值與基于Wt的F⑴值之間的差值的絕對值小于閾值,則將Wt+1作為所述特征維度下的權(quán)重。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,提取所述產(chǎn)品提供方的各產(chǎn)品信息的核心產(chǎn)品詞包括: 提取所述產(chǎn)品信息的標(biāo)題信息; 對標(biāo)題信息進行切詞和詞性標(biāo)注; 依據(jù)各詞的詞性及修飾關(guān)系確認(rèn)所述產(chǎn)品信息的核心產(chǎn)品詞。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息包括: 將所述查詢詞串進行分詞操作; 基于得到的各分詞進行擴展,得到擴展詞; 通過各分詞和擴展詞在索引中檢索獲得各產(chǎn)品信息。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述第一置信度或第二置信度加入排序權(quán)重,將各產(chǎn)品信息進行排序包括: 計算所述各產(chǎn)品信息與所述查詢詞串的文本相關(guān)性值; 計算所述各產(chǎn)品信息的所屬領(lǐng)域與所述查詢詞串的領(lǐng)域相關(guān)性值; 利用各產(chǎn)品信息的第一置信度或第二置信度、相應(yīng)的文本相關(guān)性值、領(lǐng)域相關(guān)性值計算總相關(guān)性值; 基于所述總相關(guān)性值對各產(chǎn)品信息進行排序。
9.一種搜索系統(tǒng),其特征在于,包括: 查詢接收模塊,用于接收用戶端的查詢詞串; 檢索模塊,用于根據(jù)所述查詢詞串檢索與查詢詞串相關(guān)的各產(chǎn)品信息; 查找模塊,用于查找各產(chǎn)品信息所屬的產(chǎn)品提供方,或者查找各產(chǎn)品信息所屬的產(chǎn)品提供方和各產(chǎn)品信息所屬領(lǐng)域; 置信度提取模塊,用于提取各產(chǎn)品信息第一置信度,所述第一置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方的置信度、或提取各產(chǎn)品信息的第二置信度,所述第二置信度為所述產(chǎn)品信息在所屬產(chǎn)品提供方中,所述產(chǎn)品信息的所屬領(lǐng)域的置信度;其中,所述每個產(chǎn)品信息的第一置信度通過分析所屬產(chǎn)品提供方的該產(chǎn)品信息對應(yīng)的行為記錄表獲得,所述每個產(chǎn)品信息對應(yīng)的第二置信度通過分析所述產(chǎn)品提供方在該產(chǎn)品信息所屬領(lǐng)域內(nèi)的各產(chǎn)品信息的行為記錄表獲得; 排序模塊,用于將所述第一置信度或第二置信度加入排序權(quán)重,并將各產(chǎn)品信息進行排序; 輸出模塊,用于將排序后的產(chǎn)品信息輸出給用戶端。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述置信度提取模塊包括: 第一提取模塊,用于針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種行為記錄表包括所述各產(chǎn)品信息的對應(yīng)的交易行為記錄表、評價行為記錄表、和/或收藏行為記錄表; 第一特征值獲取模塊,針對每一所述產(chǎn)品信息,分析統(tǒng)計所述產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值; 第一置信度計算模塊,用于將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一置信度。
11.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述置信度提取模塊包括: 第二提取模塊,用于針對每一產(chǎn)品提供方,提取所述產(chǎn)品提供方的各產(chǎn)品信息的核心產(chǎn)品詞,并提取所述產(chǎn)品提供方各產(chǎn)品信息對應(yīng)的各種行為記錄表;所述各種日志記錄表包括所述各產(chǎn)品信息的對應(yīng)的各交易行為記錄表、各評價行為記錄表、和/或各收藏行為記錄表; 領(lǐng)域確認(rèn)模塊,用于根據(jù)所述核心產(chǎn)品詞,確定屬于同一領(lǐng)域的各條產(chǎn)品信息; 第二特征值獲取模塊,用于針對每一領(lǐng)域,分析統(tǒng)計所述領(lǐng)域內(nèi)各產(chǎn)品信息對應(yīng)的各種行為記錄表,獲得各種特征維度下的特征值; 第二置信度計算模塊,用于將所述各種特征值向量化為一個特征向量,將所述各種特征值相應(yīng)的權(quán)重對應(yīng)向量化為一個權(quán)重向量,并利用所述特征向量和權(quán)重向量計算所述產(chǎn)品信息的第一置信度。`
【文檔編號】G06Q30/00GK103729365SQ201210387891
【公開日】2014年4月16日 申請日期:2012年10月12日 優(yōu)先權(quán)日:2012年10月12日
【發(fā)明者】宋超, 陳超, 馮景華, 郭寧 申請人:阿里巴巴集團控股有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1