個(gè)人信息獲得、推定、商品的分類、檢索方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開(kāi)了一種購(gòu)買者的個(gè)人信息的獲得方法,包括:獲取該購(gòu)買者的歷史購(gòu)買記錄中對(duì)一商品的評(píng)論信息;采用一常用詞詞庫(kù)并按照至少一個(gè)分類要素提取該評(píng)論信息中的常用詞;采用一分類要素信息詞庫(kù)得到該常用詞與每個(gè)分類要素一一對(duì)應(yīng)的分類要素信息;將該分類要素信息記錄入該個(gè)人信息中。本發(fā)明公開(kāi)了一種購(gòu)買者的個(gè)人信息的獲得系統(tǒng)、購(gòu)買者的個(gè)人信息的推定方法及系統(tǒng)、商品的分類方法及系統(tǒng)和商品的檢索方法及系統(tǒng)。本發(fā)明的購(gòu)買者的個(gè)人信息的來(lái)源多元化、不完全依賴于用戶的提供,且商品分類方式多元化、能夠根據(jù)不同的用戶人群為用戶提供更為快速、精準(zhǔn)的檢索結(jié)果。
【專利說(shuō)明】個(gè)人信息獲得、推定、商品的分類、檢索方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種購(gòu)買者的個(gè)人信息的獲得方法及系統(tǒng)、購(gòu)買者的個(gè)人信息的推定方法及系統(tǒng)、商品的分類方法及系統(tǒng)以及商品的檢索方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),中國(guó)的電子商務(wù)在最近幾年獲得了蓬勃的發(fā)展??焖倥蛎浀纳唐贩N類使得搜索在電子商務(wù)領(lǐng)域中扮演的愈來(lái)愈重要的角色。但是我們發(fā)現(xiàn)搜索過(guò)程中,用戶往往不再滿足于傳統(tǒng)的按照價(jià)格、銷量等排序。他們希望具有更大附加值的應(yīng)用出現(xiàn)。
[0003]對(duì)于某些種類的商品,不同人群會(huì)有各自的偏好。舉個(gè)例子,同樣一款手機(jī),可能受男性歡迎但不一定受女性歡迎,反之亦然。調(diào)查顯示,不同人群對(duì)于商品的需求差異較為迥異,在傳統(tǒng)的按照銷量、價(jià)格等分類檢索的方式中,有些用戶為了搜索適合其的商品,甚至需要瀏覽多張檢索目錄,操作繁瑣,檢索結(jié)果又不盡如人意,這為用戶帶來(lái)極大的困擾。
[0004]為了更貼近不同用戶的不同需求,使得不同需求的用戶能快速檢索到符合其需求的商品,需要一種新的商品分類方式,但同時(shí),又不能犧牲商品的檢索速度,即需要找到一種合理的商品的分類方式,在滿足了不同用戶的不同需求的同時(shí),仍然要保證較快的檢索速度和較為精準(zhǔn)的檢索結(jié)果。
【發(fā)明內(nèi)容】
[0005]本發(fā)明要解決的技術(shù)問(wèn)題是為了克服現(xiàn)有技術(shù)中購(gòu)買者的個(gè)人信息的來(lái)源單一、完全依賴于用戶的提供、商品分類方式單一、無(wú)法根據(jù)不同的用戶人群為用戶提供更為快速、精準(zhǔn)的檢索結(jié)果的缺陷,提供一種購(gòu)買者的個(gè)人信息的來(lái)源多元化、不完全依賴于用戶的提供、商品分類方式多元化、能夠根據(jù)不同的用戶人群為用戶提供更為快速、精準(zhǔn)的檢索結(jié)果的個(gè)人信息的獲得方法及系統(tǒng)、購(gòu)買者的個(gè)人信息的推定方法及系統(tǒng)、商品的分類方法及系統(tǒng)以及商品的檢索方法及系統(tǒng)。
[0006]本發(fā)明是通過(guò)下述技術(shù)方案來(lái)解決上述技術(shù)問(wèn)題的:
[0007]—種購(gòu)買者的個(gè)人信息的獲得方法,其特點(diǎn)在于,其包括以下步驟:
[0008]步驟Sp1、獲取該購(gòu)買者的歷史購(gòu)買記錄中對(duì)一商品的評(píng)論信息;
[0009]步驟Sp2、采用一常用詞詞庫(kù)并按照至少一個(gè)分類要素提取該評(píng)論信息中的常用詞;
[0010]步驟Sp3、采用一分類要素信息詞庫(kù)得到該常用詞與每個(gè)分類要素一一對(duì)應(yīng)的分類要素信息,該分類要素信息詞庫(kù)中記錄常用詞與分類要素信息之間的對(duì)應(yīng)關(guān)系;
[0011]步驟Sp4、將步驟Sp3中得到的該分類要素信息記錄入該個(gè)人信息中。
[0012]為了擴(kuò)展購(gòu)買者的個(gè)人信息的來(lái)源,不僅僅依賴于購(gòu)買者對(duì)自身個(gè)人信息的錄入,本發(fā)明還利用購(gòu)買者對(duì)商品的評(píng)論信息來(lái)推定獲得購(gòu)買者的身份,例如用戶偶爾也會(huì)在評(píng)價(jià)某個(gè)已購(gòu)買商品時(shí)透露自己或商品使用者的信息,例如“我太太非常喜歡這款手表”,那么我們可以認(rèn)為該用戶是男性。實(shí)現(xiàn)時(shí)可以采用該常用詞詞庫(kù)以及該分類要素信息詞庫(kù),進(jìn)行推理。舉幾個(gè)例子:如果出現(xiàn)“太太” “老婆” “妻子” “女朋友”,該用戶判定為男性;如果出現(xiàn)“丈夫” “老公” “男朋友”,該用戶判定為女性;如果出現(xiàn)“兒子” “女兒”,該用戶判定為成年人。這樣,就為獲得個(gè)人信息提供了更多的方式,而不僅僅依賴于用戶的信息錄入。
[0013]優(yōu)選地,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
[0014]本發(fā)明還提供一種購(gòu)買者的個(gè)人信息的推定方法,其特點(diǎn)在于,其包括以下步驟:
[0015]步驟Sq1、分別獲取第一購(gòu)買者的歷史記錄以及第二購(gòu)買者的歷史記錄,該歷史記錄中包括歷史購(gòu)買記錄和歷史瀏覽記錄,其中,該第一購(gòu)買者的個(gè)人信息為已知的,該第一購(gòu)買者的個(gè)人信息中包括與至少一個(gè)分類要素分類 對(duì)應(yīng)的分類要素信息;
[0016]步驟Sq2、將該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄相比較,獲取該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄中相同類目的商品的數(shù)量;
[0017]步驟Sq3、在該數(shù)量達(dá)到一數(shù)量閾值時(shí)將該第一購(gòu)買者的分類要素信息記錄入該第二購(gòu)買者的個(gè)人信息中。
[0018]除了上述的個(gè)人信息獲得方法之外,還可以從個(gè)人信息既定的購(gòu)買者的購(gòu)物行為、瀏覽行為來(lái)推定購(gòu)物行為、瀏覽行為確定但個(gè)人信息不定的購(gòu)買者的個(gè)人信息。很多時(shí)候用戶沒(méi)有主動(dòng)提供個(gè)人資料,顯性的個(gè)人信息是非常有限的。本發(fā)明提供的方法通過(guò)用戶行為來(lái)猜測(cè)、推定用戶的個(gè)人信息,這種推定所得的個(gè)人信息也可稱為隱性信息。即可以根據(jù)用戶在網(wǎng)站上的瀏覽(或者購(gòu)買)的行為,利用機(jī)器學(xué)習(xí)中的分類技術(shù),將他們大致劃分到不同人群。比如說(shuō)一個(gè)用戶經(jīng)常購(gòu)買女士化妝品和女士服裝,我們就可以將該用戶認(rèn)作“女性”。當(dāng)然這種劃分只是根據(jù)其行為的假設(shè),而不是對(duì)其真實(shí)身份的認(rèn)定。這樣,又進(jìn)一步擴(kuò)展了個(gè)人信息的來(lái)源。并且由于推定的整個(gè)過(guò)程是通過(guò)個(gè)人信息明確的用戶及其行為,來(lái)推斷未知用戶的個(gè)人信息,因而推斷結(jié)果具有較高的準(zhǔn)確度。
[0019]本發(fā)明還提供一種購(gòu)買者的個(gè)人信息的推定方法,其特點(diǎn)在于,其包括以下步驟:
[0020]步驟Sk1、分別獲取第一購(gòu)買者的歷史記錄以及第二購(gòu)買者的歷史記錄,該歷史記錄中包括歷史購(gòu)買記錄和歷史瀏覽記錄,其中,該第一購(gòu)買者的個(gè)人信息為已知的,該第一購(gòu)買者的個(gè)人信息中包括與至少一個(gè)分類要素分類一一對(duì)應(yīng)的分類要素信息,該歷史記錄以向量空間的形式表達(dá);
[0021]步驟Sk2、采用向量余弦?jiàn)A角的算法將該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄相比較,計(jì)算該第二購(gòu)買者的分類要素信息與該第一購(gòu)買者的分類要素信息相同的概率;
[0022]步驟Sk3、在該概率達(dá)到一概率閾值時(shí)將該第一購(gòu)買者的分類要素信息記錄入該第二購(gòu)買者的個(gè)人信息中。
[0023]舉例來(lái)說(shuō),推定過(guò)程中,首先收集真實(shí)用戶(購(gòu)買者)及其購(gòu)買案例。例如若干名男性、女性、學(xué)生、白領(lǐng)和他們的所有購(gòu)買記錄。這些用戶的個(gè)人信息都是已知的。
[0024]接著,將所有用戶行為數(shù)字化。不同模型可以有不同的表述,一種基本的實(shí)現(xiàn)是向量空間。假設(shè)一共有η中商品,一個(gè)用戶的購(gòu)買行為表達(dá)為[0025]U1=Lf1, f2, f3,...fn_1; fn]
[0026]其中fn表示該用戶購(gòu)買第n種商品的次數(shù)。如果存在向量稀疏性問(wèn)題(也就是說(shuō)商品數(shù)非常大,很多fn的取值都是0),為了保證下一步的匹配度,這里也可以用商品類目,fn表示該用戶購(gòu)買第η種類目的次數(shù)
[0027]將未知信息的用戶和已知用戶組里的每個(gè)用戶匹配(一種基本實(shí)現(xiàn)是用向量余弦?jiàn)A角)。最后求平均值,未知用戶將已一定的概率劃入已知用戶的分組,打上同樣的個(gè)人信息標(biāo)簽。對(duì)于用戶U1,屬于男性組(male)的概率計(jì)算如下:
【權(quán)利要求】
1.一種購(gòu)買者的個(gè)人信息的獲得方法,其特征在于,其包括以下步驟: 步驟Sp1、獲取該購(gòu)買者的歷史購(gòu)買記錄中對(duì)一商品的評(píng)論信息; 步驟Sp2、采用一常用詞詞庫(kù)并按照至少一個(gè)分類要素提取該評(píng)論信息中的常用詞;步驟Sp3、采用一分類要素信息詞庫(kù)得到該常用詞與每個(gè)分類要素一一對(duì)應(yīng)的分類要素信息,該分類要素信息詞庫(kù)中記錄常用詞與分類要素信息之間的對(duì)應(yīng)關(guān)系; 步驟Sp4、將步驟Sp3中得到的該分類要素信息記錄入該個(gè)人信息中。
2.如權(quán)利要求1所述的購(gòu)買者的個(gè)人信息的獲得方法,其特征在于,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
3.一種購(gòu)買者的個(gè)人信息的推定方法,其特征在于,其包括以下步驟: 步驟Sq1、分別獲取第一購(gòu)買者的歷史記錄以及第二購(gòu)買者的歷史記錄,該歷史記錄中包括歷史購(gòu)買記錄和歷史瀏覽記錄,其中,該第一購(gòu)買者的個(gè)人信息為已知的,該第一購(gòu)買者的個(gè)人信息中包括與至少一個(gè)分類要素分類對(duì)應(yīng)的分類要素信息; 步驟Sq2、將該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄相比較,獲取該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄中相同類目的商品的數(shù)量; 步驟Sq3、在該數(shù)量達(dá)到一數(shù)量閾值時(shí)將該第一購(gòu)買者的分類要素信息記錄入該第二購(gòu)買者的個(gè)人信息中。
4.一種購(gòu)買者的個(gè)人信息的推定方法,其特征在于,其包括以下步驟: 步驟Sk1、分別獲取第一購(gòu)買者的歷史記錄以及第二購(gòu)買者的歷史記錄,該歷史記錄中包括歷史購(gòu)買記錄和歷史瀏覽記錄,其中,該第一購(gòu)買者的個(gè)人信息為已知的,該第一購(gòu)買者的個(gè)人信息中包括與至少一個(gè)分類要素分類一一對(duì)應(yīng)的分類要素信息,該歷史記錄以向量空間的形式表達(dá); 步驟Sk2、采用向量余弦?jiàn)A角的算法將該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄相比較,計(jì)算該第二購(gòu)買者的分類要素信息與該第一購(gòu)買者的分類要素信息相同的概率; 步驟Sk3、在該概率達(dá)到一概率閾值時(shí)將該第一購(gòu)買者的分類要素信息記錄入該第二購(gòu)買者的個(gè)人信息中。
5.如權(quán)利要求3或4所述的購(gòu)買者的個(gè)人信息的推定方法,其特征在于,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
6.一種商品的分類方法,其特征在于,其包括以下步驟: 針對(duì)一商品數(shù)據(jù)庫(kù)中的每件商品: 步驟S1、調(diào)取每件商品的歷史購(gòu)買記錄; 步驟S2、提取該歷史購(gòu)買記錄中的所有購(gòu)買者的個(gè)人信息; 步驟S3、按照至少一個(gè)分類要素提取該個(gè)人信息中與每個(gè)分類要素一一對(duì)應(yīng)的分類要素信息; 步驟S4、針對(duì)每個(gè)分類要素,計(jì)算從該個(gè)人信息中提取相同分類要素信息的數(shù)量,并且在該數(shù)量達(dá)到一閾值時(shí)將該商品與相同的數(shù)量達(dá)到該閾值的分類要素信息相關(guān)聯(lián)以完成該商品按照該分類要素的分類。
7.如權(quán)利要求6所述的商品的分類方法,其特征在于,該個(gè)人信息通過(guò)如權(quán)利要求1所述的購(gòu)買者的個(gè)人信息的獲得方法獲得,和/或,該個(gè)人信息通過(guò)如權(quán)利要求3所述的購(gòu)買者的個(gè)人信息的推定方法獲得,和/或, 該個(gè)人信息通過(guò)如權(quán)利要求4所述的購(gòu)買者的個(gè)人信息的推定方法獲得。
8.如權(quán)利要求6所述的商品的分類方法,其特征在于,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
9.一種商品的檢索方法,其特征在于,按照如權(quán)利要求6-8中任意一項(xiàng)所述的商品的分類方法將該商品數(shù)據(jù)庫(kù)中的每件商品分類后,該商品的檢索方法還包括以下步驟: 針對(duì)該商品數(shù)據(jù)庫(kù)中的所有商品, 步驟S5、接收用戶所選擇的分類要素信息; 步驟S6、調(diào)取該商品數(shù)據(jù)庫(kù)中所有與該分類要素信息相應(yīng)的商品以顯示給用戶。
10.一種購(gòu)買者的個(gè)人信息的獲得系統(tǒng),其特征在于,其包括: 一接收裝置,用于獲取該購(gòu)買者的歷史購(gòu)買記錄中對(duì)一商品的評(píng)論信息; 一第一采集裝置,用于采用一常用詞詞庫(kù)并按照至少一個(gè)分類要素提取該評(píng)論信息中的常用詞; 一第二采集裝置,用于采用一分類要素信息詞庫(kù)得到該常用詞與每個(gè)分類要素一一對(duì)應(yīng)的分類要素信息,該分類要素信息詞庫(kù)中記錄常用詞與分類要素信息之間的對(duì)應(yīng)關(guān)系;一記錄裝置,用于將該第二采集裝置得到的該分類要素信息記錄入該個(gè)人信息中。
11.如權(quán)利要求10所述的購(gòu)買者的個(gè)人信息的獲得系統(tǒng),其特征在于,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
12.—種購(gòu)買者的個(gè)人信息的`推定系統(tǒng),其特征在于,其包括: 一接收裝置,用于分別獲取第一購(gòu)買者的歷史記錄以及第二購(gòu)買者的歷史記錄,該歷史記錄中包括歷史購(gòu)買記錄和歷史瀏覽記錄,其中,該第一購(gòu)買者的個(gè)人信息為已知的,該第一購(gòu)買者的個(gè)人信息中包括與至少一個(gè)分類要素分類一一對(duì)應(yīng)的分類要素信息; 一比較裝置,用于將該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄相比較,獲取該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄中相同類目的商品的數(shù)量; 一記錄裝置,用于在該數(shù)量達(dá)到一數(shù)量閾值時(shí)將該第一購(gòu)買者的分類要素信息記錄入該第二購(gòu)買者的個(gè)人信息中。
13.一種購(gòu)買者的個(gè)人信息的推定系統(tǒng),其特征在于,其包括: 一接收裝置,用于分別獲取第一購(gòu)買者的歷史記錄以及第二購(gòu)買者的歷史記錄,該歷史記錄中包括歷史購(gòu)買記錄和歷史瀏覽記錄,其中,該第一購(gòu)買者的個(gè)人信息為已知的,該第一購(gòu)買者的個(gè)人信息中包括與至少一個(gè)分類要素分類一一對(duì)應(yīng)的分類要素信息,該歷史記錄以向量空間的形式表達(dá); 一比較裝置,用于采用向量余弦?jiàn)A角的算法將該第一購(gòu)買者的歷史記錄和該第二購(gòu)買者的歷史記錄相比較,計(jì)算該第二購(gòu)買者的分類要素信息與該第一購(gòu)買者的分類要素信息相同的概率; 一記錄裝置,用于在該概率達(dá)到一概率閾值時(shí)將該第一購(gòu)買者的分類要素信息記錄入該第二購(gòu)買者的個(gè)人信息中。
14.如權(quán)利要求12或13所述的購(gòu)買者的個(gè)人信息的推定系統(tǒng),其特征在于,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
15.—種商品的分類系統(tǒng),其特征在于,其包括:針對(duì)一商品數(shù)據(jù)庫(kù)中的每件商品: 一歷史購(gòu)買記錄調(diào)取裝置,用于調(diào)取每件商品的歷史購(gòu)買記錄; 一個(gè)人信息提取裝置,用于提取該歷史購(gòu)買記錄中的所有購(gòu)買者的個(gè)人信息; 一分類要素信息提取裝置,用于按照至少一個(gè)分類要素提取該個(gè)人信息中與每個(gè)分類要素對(duì)應(yīng)的分類要素信息; 一關(guān)聯(lián)裝置,用于針對(duì)每個(gè)分類要素,計(jì)算從該個(gè)人信息中提取相同分類要素信息的數(shù)量,并且在該數(shù)量達(dá)到一閾值時(shí)將該商品與相同的數(shù)量達(dá)到該閾值的分類要素信息相關(guān)聯(lián)以完成該商品按照該分類要素的分類。
16.如權(quán)利要求15所述的商品的分類系統(tǒng),其特征在于,該個(gè)人信息通過(guò)如權(quán)利要求10所述的購(gòu)買者的個(gè)人信息的獲得系統(tǒng)獲得,和/或, 該個(gè)人信息通過(guò)如權(quán)利要求12所述的購(gòu)買者的個(gè)人信息的推定系統(tǒng)獲得,和/或, 該個(gè)人信息通過(guò)如權(quán)利要求13所述的購(gòu)買者的個(gè)人信息的推定系統(tǒng)獲得。
17.如權(quán)利要求15所述的商品的分類系統(tǒng),其特征在于,該分類要素選自:性別、職業(yè)、年齡、收入和居住地。
18.—種商品的檢索系統(tǒng),其特征在于,其包括如權(quán)利要求15-17中任意一項(xiàng)所述的商品的分類系統(tǒng),該商品的檢索系統(tǒng)還包括: 針對(duì)該商品數(shù)據(jù)庫(kù)中的所有商品, 一指令接收裝置,用于接收用戶所選擇的分類要素信息; 一檢索裝置,用于調(diào)取該商品數(shù)據(jù)庫(kù)中所有與該分類要素信息相應(yīng)的商品以顯示給用戶。
【文檔編號(hào)】G06F17/30GK103577472SQ201210276160
【公開(kāi)日】2014年2月12日 申請(qǐng)日期:2012年8月3日 優(yōu)先權(quán)日:2012年8月3日
【發(fā)明者】黃申, 韓軍 申請(qǐng)人:紐海信息技術(shù)(上海)有限公司