本發(fā)明涉及電子商務(wù)領(lǐng)域,具體來(lái)說(shuō),涉及搜索引擎中商品標(biāo)簽的構(gòu)建方法、系統(tǒng)及搜索方法和系統(tǒng)。
背景技術(shù):
當(dāng)前電子商務(wù)網(wǎng)站的搜索技術(shù)是基于關(guān)鍵詞完全匹配技術(shù)。如果商品目錄的數(shù)據(jù)庫(kù)不能完全匹配用戶(hù)輸入的所有關(guān)鍵詞時(shí),那么即使目標(biāo)商品存在,搜索結(jié)果仍然為零或者返回率低。搜索結(jié)果為零和返回率低的情況,例如:當(dāng)輸入關(guān)鍵詞“亞洲地圖圖書(shū)”搜索時(shí),沒(méi)有相關(guān)的結(jié)果顯示。這是因?yàn)闆](méi)有一件商品能夠同時(shí)匹配這三個(gè)關(guān)鍵詞。
對(duì)于部分商品一物多名而出現(xiàn)的無(wú)搜索結(jié)果,現(xiàn)有技術(shù)采用在數(shù)據(jù)庫(kù)里提供商品名稱(chēng)的同義詞或近義詞,并將此類(lèi)詞匯與商品名稱(chēng)聯(lián)系起來(lái)。然而在現(xiàn)實(shí)搜索中,除去商品名稱(chēng)不同,用戶(hù)對(duì)商品的需求可能停留在對(duì)某類(lèi)商品的特性上。
基于此,現(xiàn)有的商品標(biāo)簽的構(gòu)建方法難以適應(yīng)用戶(hù)的需求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供搜索引擎中商品標(biāo)簽的構(gòu)建方法、構(gòu)建系統(tǒng)及 搜索方法和搜索系統(tǒng),從多維度構(gòu)建商品標(biāo)簽,提高搜索返回率,進(jìn)而改善用戶(hù)體驗(yàn)。
為解決上述技術(shù)問(wèn)題,第一方面,本發(fā)明實(shí)施例提供一種搜索引擎中商品標(biāo)簽的構(gòu)建方法,該方法包括:
S11:對(duì)商品進(jìn)行分類(lèi),建立商品子類(lèi)列表;
S12:確定商品子類(lèi)的多維度標(biāo)簽;
S13:將S12確定的多維度標(biāo)簽加入商品子類(lèi)列表中,構(gòu)建商品標(biāo)簽。
結(jié)合第一方面,作為第一種可能實(shí)現(xiàn)的方式,所述的S11中,商品子類(lèi)列表包括大類(lèi)、小類(lèi)和商品子類(lèi)。
結(jié)合第一方面,作為第二種可能實(shí)現(xiàn)的方式,所述的S12中,利用實(shí)體識(shí)別方法和句子剖析方法自動(dòng)提取商品的多維度標(biāo)簽;多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞。
結(jié)合第一方面第二種可能實(shí)現(xiàn)的方式,作為第三種可能實(shí)現(xiàn)的方式,所述的S12具體包括:
S21用模版化的智能網(wǎng)頁(yè)爬蟲(chóng)獲取外部公共資源;
S22利用定制化的網(wǎng)絡(luò)機(jī)器人從外部公共資源抓取與該商品子類(lèi)相關(guān)聯(lián)的詞條,從而生成商品子類(lèi)相關(guān)詞條集合;
S23從商品子類(lèi)相關(guān)詞條集合中提取備選標(biāo)簽;
S24審閱備選標(biāo)簽,形成最終的標(biāo)簽。
結(jié)合第一方面的第三種可能實(shí)現(xiàn)的方式,作為第四種可能實(shí)現(xiàn)的方式,所述的步驟S22中,從外部公共資源抓取與該商品子類(lèi)相關(guān)聯(lián)的詞條的過(guò)程為:根據(jù)該詞條在商品子類(lèi)商品數(shù)據(jù)中的出現(xiàn)頻率和評(píng)價(jià)數(shù)據(jù)中的出現(xiàn)頻率,當(dāng)該兩種出現(xiàn)頻率均大于或等于事先設(shè)定的閾值時(shí),則將該詞條視為與商品子類(lèi)相關(guān)聯(lián)的詞條。
第二方面,本發(fā)明實(shí)施例提供一種搜索引擎中商品標(biāo)簽的構(gòu)建系統(tǒng),該系統(tǒng)包括:
分類(lèi)模塊:用于對(duì)商品進(jìn)行分類(lèi),建立商品子類(lèi)列表;
確定模塊:用于確定商品子類(lèi)的多維度標(biāo)簽;
構(gòu)建模塊:用于將確定的多維度標(biāo)簽,加入商品子類(lèi)列表中,構(gòu)建商品標(biāo)簽。
結(jié)合第二方面,作為第一種可能實(shí)現(xiàn)的方式,所述的確定模塊具體包括:
獲取子模塊:用于用模版化的智能網(wǎng)頁(yè)爬蟲(chóng)獲取外部公共資源;
生成子模塊:用于利用定制化的網(wǎng)絡(luò)機(jī)器人從外部公共資源抓取與該商品子類(lèi)相關(guān)聯(lián)的詞條,從而生成商品子類(lèi)相關(guān)詞條集合;
提取子模塊:用于從商品子類(lèi)相關(guān)詞條集合中提取備選標(biāo)簽;
審閱子模塊:用于審閱備選標(biāo)簽,形成最終的標(biāo)簽。
結(jié)合第二方面第一種可能實(shí)現(xiàn)的方式,作為第二種可能實(shí)現(xiàn)的方式,所述的生成子模塊具體包括:
統(tǒng)計(jì)單元:用于統(tǒng)計(jì)詞條在商品子類(lèi)商品數(shù)據(jù)中的出現(xiàn)頻率和評(píng)價(jià)數(shù)據(jù)中的出現(xiàn)頻率;
判斷單元:用于判斷兩種出現(xiàn)頻率是否均大于或等于事先設(shè)定的閾值,如果是,則該詞條為與商品子類(lèi)相關(guān)聯(lián)的詞條。
第三方面,本發(fā)明實(shí)施例提供一種商品搜索方法,該方法包括:
S61:建立商品子類(lèi)列表,所述的商品子類(lèi)列表包括大類(lèi)、小類(lèi)、商品子類(lèi)和多維度標(biāo)簽,多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞;
S62:在商品子類(lèi)列表中搜索用戶(hù)在搜索引擎中輸入的檢索詞,以及該檢索詞對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞,并顯示搜索結(jié)果。
第四方面,本發(fā)明實(shí)施例提供一種商品搜索系統(tǒng),該系統(tǒng)包括:
建立模塊:用于建立商品子類(lèi)列表,所述的商品子類(lèi)列表包括大類(lèi)、小類(lèi)、商品子類(lèi)和多維度標(biāo)簽,多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞;
輸入模塊:用于在搜索引擎中輸入檢索詞;
搜索模塊:用于在商品子類(lèi)列表中搜索檢索詞,以及該檢索詞對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞,并顯示搜索結(jié)果。
本發(fā)明實(shí)施例搜索引擎中商品標(biāo)簽的構(gòu)建方法、系統(tǒng)及搜索方法和系統(tǒng),通過(guò)在商品子類(lèi)列表中構(gòu)建商品的多維度標(biāo)簽,提高了搜索結(jié)果召回率。多維度標(biāo)簽包括同義詞、近義詞、廣義詞、商品功能詞以及特征詞。設(shè)置多維度標(biāo)簽,使得用戶(hù)在搜索時(shí),系統(tǒng)根據(jù)檢索詞,在多維度標(biāo)簽中搜索該檢索詞,以及該檢索詞的同義詞、近義詞、廣 義詞、商品功能詞以及特征詞,從而提高了搜索結(jié)果召回率。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例中商品標(biāo)簽的構(gòu)建方法的流程圖;
圖2是本發(fā)明實(shí)施例中確定商品子類(lèi)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞的流程圖;
圖3是本發(fā)明實(shí)施例中構(gòu)建系統(tǒng)的結(jié)構(gòu)框圖;
圖4是本發(fā)明實(shí)施例確定模塊的結(jié)構(gòu)框圖;
圖5是本發(fā)明實(shí)施例生成子模塊的結(jié)構(gòu)框圖;
圖6是本發(fā)明實(shí)施例查找商品的方法的流程圖;
圖7是本發(fā)明實(shí)施例查找商品的系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施方式
如圖1所示,本實(shí)施例提供一種電子商務(wù)搜索引擎中商品標(biāo)簽的構(gòu)建方法:
S11:對(duì)商品進(jìn)行分類(lèi),建立商品子類(lèi)列表。
整個(gè)商品子類(lèi)列表包括大類(lèi)、小類(lèi)和商品子類(lèi)。商品子類(lèi)、小類(lèi)和大類(lèi)是依據(jù)電子商務(wù)平臺(tái)的商品分類(lèi)信息而定。如表1所示,按照商品的用途,對(duì)商品進(jìn)行分類(lèi)。商品子類(lèi)對(duì)應(yīng)待搜索的商品。小類(lèi)是商品子類(lèi)的上一層次的分類(lèi),大類(lèi)是小類(lèi)的上一層次的分類(lèi)。在表1中,凈水器為商品子類(lèi),凈水器屬于的小類(lèi)為廚衛(wèi)電器,凈水器屬于 的大類(lèi)為廚衛(wèi)電器/生活電器。商品子類(lèi)包含不同或相同企業(yè)生產(chǎn)銷(xiāo)售的相同商品。
表1
S12:確定商品子類(lèi)的多維度標(biāo)簽。
多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞。
利用實(shí)體識(shí)別方法和句子剖析方法自動(dòng)提取商品的同義詞、近義詞、廣義詞、商品功能詞以及特征詞。S12進(jìn)一步包括:
S21用模版化的智能網(wǎng)頁(yè)爬蟲(chóng)獲取外部公共資源。
外部公共資源如電子商務(wù)網(wǎng)站、社交網(wǎng)站、百度百科、互聯(lián)百科等網(wǎng)站。這些網(wǎng)站中包含了商品的各類(lèi)信息,例如商品屬性、商品同義詞、近義詞、使用評(píng)價(jià)數(shù)據(jù)等。
S22利用定制化的網(wǎng)絡(luò)機(jī)器人從外部公共資源抓取與該商品子類(lèi)相關(guān)聯(lián)的詞條,從而生成商品子類(lèi)相關(guān)詞條集合。
根據(jù)每個(gè)網(wǎng)站的數(shù)據(jù)結(jié)構(gòu)等不同,網(wǎng)絡(luò)機(jī)器人有所改進(jìn),形成定制化的網(wǎng)絡(luò)機(jī)器人,以抓取最有效數(shù)據(jù)。在確定與該商品子類(lèi)相關(guān)聯(lián)的詞條時(shí),可以根據(jù)該詞條在商品子類(lèi)商品數(shù)據(jù)中的出現(xiàn)頻率和評(píng)價(jià)數(shù)據(jù)中的出現(xiàn)頻率而定。當(dāng)兩種出現(xiàn)頻率均大于或等于事先設(shè)定的閾值時(shí),則該詞條為與商品子類(lèi)相關(guān)聯(lián)的詞條;否則,則該詞條為與商品子類(lèi)不相關(guān)聯(lián)的詞條。
S23從商品子類(lèi)相關(guān)詞條集合中提取備選標(biāo)簽。
作為一種優(yōu)選例,通過(guò)實(shí)體識(shí)別方法和句子剖析方法,對(duì)商品子類(lèi)相關(guān)詞條集合中的詞條,進(jìn)行聚類(lèi)分析,詞性過(guò)濾之后,生成備選標(biāo)簽。實(shí)體識(shí)別方法包括構(gòu)建字典和詞典、分析比較不同搜索詞的用戶(hù)點(diǎn)擊方式、分析用戶(hù)搜索期間搜索詞的改寫(xiě)三種方法。通過(guò)分析商品數(shù)據(jù),以及百度百科等互聯(lián)網(wǎng)資源來(lái)建立各種詞典,比如商品類(lèi)別詞典、品牌詞典、型號(hào)詞典等。
通過(guò)實(shí)體識(shí)別方法查詢(xún)待搜索商品的同義詞、近義詞、廣義詞、商品功能詞以及特征詞。例如,搜索凈水器,在商品類(lèi)別詞典中出現(xiàn)的凈水機(jī)、過(guò)濾器為凈水器的同義詞/近義詞。
商品功能詞以及特征詞可以通過(guò)分析商品的描述等數(shù)據(jù)來(lái)獲得。
句子剖析方法采用自然語(yǔ)言處理技術(shù)來(lái)實(shí)現(xiàn)。句子剖析方法的具體過(guò)程是通過(guò)開(kāi)源自然語(yǔ)言處理包來(lái)進(jìn)行分詞,并進(jìn)行詞性標(biāo)注。比如采用斯坦福大學(xué)的開(kāi)源自然語(yǔ)言處理包進(jìn)行句子剖析方法。例如,百度詞條中出現(xiàn)的句子“凈水器也叫凈水機(jī)、過(guò)濾器”,通過(guò)開(kāi)源 自然語(yǔ)言處理包進(jìn)行處理后,識(shí)別為“凈水器也叫凈水機(jī)/過(guò)濾器”。
S24審閱備選標(biāo)簽,形成最后的標(biāo)簽。
備選標(biāo)簽中可能包含質(zhì)量不高的詞條。質(zhì)量不高的詞條是指:通過(guò)機(jī)器學(xué)習(xí)不可避免地出現(xiàn)一些備選商品類(lèi)不相關(guān)的詞,或者與電子商務(wù)不相關(guān)的詞,又或者備選標(biāo)簽里重復(fù)出現(xiàn)的同義詞。通過(guò)人工審閱,刪除質(zhì)量不高的詞條。這有利于進(jìn)一步提高備選標(biāo)簽的相關(guān)度和質(zhì)量。
同義詞是指:用同一種語(yǔ)言表達(dá)的意義相同的詞或者短語(yǔ)。近義詞是指:用同一種語(yǔ)言表達(dá)的意義相近的詞或者短語(yǔ)。同義詞和近義詞利用實(shí)體識(shí)別方法獲取。實(shí)體識(shí)別技術(shù)如前所述,主要包括1)詞典和字典的使用;2)用戶(hù)點(diǎn)擊方式;3)搜索詞的改寫(xiě)。
廣義詞:在電子商務(wù)情境下,由商品子類(lèi)本義而推廣出更一般化的詞條。廣義詞的確定主要依靠廣泛被認(rèn)可的外部公共數(shù)據(jù)資源來(lái)確定,如百科、維基網(wǎng)站中對(duì)關(guān)鍵詞的定義。廣義詞的確定采用實(shí)體識(shí)別和句子剖析方法。
商品功能是指商品子類(lèi)中的商品能發(fā)揮的有利作用或效能。商品特征是指商品子類(lèi)下商品異于其它商品的特有屬性和特點(diǎn)。商品功能以及商品特征主要依據(jù)商品目錄提供的描述以及消費(fèi)者的使用反饋和評(píng)價(jià)數(shù)據(jù)產(chǎn)生候選詞條,人工完善最終入選詞條,以確保描述的準(zhǔn)確性。例如,在表1中,商品子類(lèi)體溫計(jì)的功能之一是“量體溫”。
又例如,對(duì)商品子類(lèi)“足沐器”來(lái)說(shuō),其同義詞/近義詞是洗腳盆、足浴盆;廣義詞是個(gè)護(hù)健康和生活電器;商品功能為足部按摩、足浴和足療。
又例如,對(duì)商品子類(lèi)“調(diào)奶器”來(lái)說(shuō),商品特征是母嬰和親子。
S13:將S12確定的多維度標(biāo)簽加入商品子類(lèi)列表中,構(gòu)建商品標(biāo)簽。將多維度標(biāo)簽存儲(chǔ)在商品子類(lèi)列表中,作為商品子類(lèi)的多維度標(biāo)簽,并與各商品子類(lèi)相對(duì)應(yīng)。多維度標(biāo)簽包括同義詞、近義詞、廣義詞、商品功能詞以及特征詞。
本實(shí)施例中,商品標(biāo)簽采用多維度,即包括了商品子類(lèi)的名稱(chēng),還包括同義詞、近義詞、廣義詞、商品功能詞以及特征詞。
在深度了解用戶(hù)需求的基礎(chǔ)上,形成多維度的詞條,提供更加準(zhǔn)確的商品描述和搜索推薦。
多維度標(biāo)簽中包含商品屬性詞、特征詞和功能詞。商品屬性、特征和功能可以根據(jù)商品目錄以及消費(fèi)者評(píng)價(jià)數(shù)據(jù)來(lái)獲得。商品目錄是指存儲(chǔ)商品信息的數(shù)據(jù)庫(kù)。商品目錄包含商品顏色、尺寸、功能以及其它相關(guān)用于描述商品的屬性。消費(fèi)者評(píng)價(jià)數(shù)據(jù)可以網(wǎng)站獲取,包括電子商務(wù)網(wǎng)站以及社交網(wǎng)絡(luò)。
以電子商務(wù)為平臺(tái),深入了解商品為前提,建立全方位的多維度商品標(biāo)簽?zāi)P?。以這種多層次、多維度的詞匯標(biāo)簽在索引中擴(kuò)充該商品子類(lèi),完成對(duì)商品子類(lèi)的立體化,生動(dòng)化的描述。
商品標(biāo)簽的多層次體現(xiàn)在從商品本身出發(fā),既有橫向的標(biāo)簽,如商品的同義詞、近義詞;也有縱向的標(biāo)簽,如廣義詞、功能詞和特征 詞。本實(shí)施例的商品標(biāo)簽是在橫向和縱向發(fā)散性的綜合。這對(duì)商品的描述更全面,更形象化。
本實(shí)施例利用外部公共平臺(tái)的數(shù)據(jù)創(chuàng)建商品標(biāo)簽,突出電子商務(wù)詞匯的廣度和深度。根據(jù)商品的特征和功能描述,創(chuàng)建商品功能詞以及特征詞標(biāo)簽,為搜索者找到商品提供了可能性。與傳統(tǒng)的單一維度的商品描述相比,本實(shí)施例采用多維度的商品標(biāo)簽,提高了搜索結(jié)果召回率,從而改善用戶(hù)體驗(yàn),提升商品從搜索到購(gòu)買(mǎi)的轉(zhuǎn)化率。
如圖3所示,本實(shí)施例提供一種搜索引擎中商品標(biāo)簽的構(gòu)建系統(tǒng),該系統(tǒng)包括:
分類(lèi)模塊:用于對(duì)商品進(jìn)行分類(lèi),建立商品子類(lèi)列表;
確定模塊:用于確定商品子類(lèi)的多維度標(biāo)簽;
構(gòu)建模塊:用于將確定的多維度標(biāo)簽,加入商品子類(lèi)列表中,構(gòu)建商品標(biāo)簽。
該系統(tǒng)中,構(gòu)建模塊將多維度標(biāo)簽都加入商品子類(lèi)列表中,構(gòu)建商品標(biāo)簽。這樣,商品標(biāo)簽構(gòu)成多維度標(biāo)簽。多維度標(biāo)簽包括同義詞、近義詞、廣義詞、商品功能詞以及特征詞。多維度標(biāo)簽中包含商品屬性詞、特征詞和功能詞。商品屬性、特征和功能可以根據(jù)商品目錄以及消費(fèi)者評(píng)價(jià)數(shù)據(jù)來(lái)獲得。商品目錄是指存儲(chǔ)商品信息的數(shù)據(jù)庫(kù)。商品目錄包含商品顏色、尺寸、功能以及其它相關(guān)用于描述商品的屬性。消費(fèi)者評(píng)價(jià)數(shù)據(jù)可以網(wǎng)站獲取,包括電子商務(wù)網(wǎng)站以及社交網(wǎng)絡(luò)。商品標(biāo)簽從商品本身出發(fā),既有橫向的標(biāo)簽,如商品的同義詞、近義詞; 也有縱向的標(biāo)簽,如廣義詞、功能詞和特征詞。本實(shí)施例的商品標(biāo)簽是在橫向和縱向發(fā)散性的綜合。
上述系統(tǒng)中,確定模塊用于確定商品子類(lèi)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞。如圖4所示,確定模塊具體包括:
獲取子模塊:用于用模版化的智能網(wǎng)頁(yè)爬蟲(chóng)方法獲取外部公共資源;
生成子模塊:用于利用定制化的網(wǎng)絡(luò)機(jī)器人,從外部公共資源抓取與該商品子類(lèi)相關(guān)聯(lián)的詞條,從而生成商品子類(lèi)相關(guān)詞條集合;
提取子模塊:用于從商品子類(lèi)相關(guān)詞條集合中提取備選標(biāo)簽;
審閱子模塊:用于人工審閱備選標(biāo)簽,形成最終的標(biāo)簽。
確定模塊利用網(wǎng)絡(luò)技術(shù)自動(dòng)確定備選標(biāo)簽。由于本系統(tǒng)為提高搜索返回率,商品標(biāo)簽為包含有廣義詞、功能詞和特征詞的多維度標(biāo)簽。同義詞、近義詞、廣義詞、功能詞和特征詞往往需要通過(guò)外部公共資源獲取。因此,利用獲取子模塊來(lái)獲取外部公共資源。生成子模塊利用現(xiàn)有技術(shù)的定制化的網(wǎng)絡(luò)機(jī)器人,從外部公共資源抓取與該商品子類(lèi)相關(guān)聯(lián)的詞條,從而生成商品子類(lèi)相關(guān)詞條集合。如圖5所示,生成子模塊具體包括:統(tǒng)計(jì)單元:用于統(tǒng)計(jì)詞條在商品子類(lèi)商品數(shù)據(jù)中的出現(xiàn)頻率和評(píng)價(jià)數(shù)據(jù)中的出現(xiàn)頻率;判斷單元:用于判斷兩種出現(xiàn)頻率是否大于或等于事先設(shè)定的閾值時(shí),如果是,則該詞條為與商品子類(lèi)相關(guān)聯(lián)的詞條;否則,則該詞條為與商品子類(lèi)不相關(guān)聯(lián)的詞條。通過(guò)判斷單元來(lái)判斷詞條是否為與商品子類(lèi)相關(guān)聯(lián)的詞條。提取子模塊通過(guò)實(shí)體識(shí)別方法和句子剖析方法,對(duì)商品子類(lèi)相關(guān)詞條集合中的 詞條,進(jìn)行聚類(lèi)分析,詞性過(guò)濾之后,提取備選標(biāo)簽。備選標(biāo)簽中可能包含質(zhì)量不高的詞條。質(zhì)量不高的詞條是指:通過(guò)機(jī)器學(xué)習(xí)不可避免地出現(xiàn)一些備選商品類(lèi)不相關(guān)的詞,或者與電子商務(wù)不相關(guān)的詞,又或者備選標(biāo)簽里重復(fù)出現(xiàn)的同義詞。通過(guò)人工審閱,刪除質(zhì)量不高的詞條。這有利于進(jìn)一步提高備選標(biāo)簽的相關(guān)度和質(zhì)量。
本實(shí)施例利用外部公共平臺(tái)的數(shù)據(jù)創(chuàng)建商品標(biāo)簽,突出電子商務(wù)詞匯的廣度和深度。根據(jù)商品的特征和功能描述,創(chuàng)建商品功能詞以及特征詞標(biāo)簽,為搜索者找到商品提供了可能性。本實(shí)施例采用多維度的商品標(biāo)簽,提高了搜索結(jié)果召回率。
如圖6所示,一種利用電子商務(wù)搜索引擎查找商品的方法,包括
S61:建立商品子類(lèi)列表,所述的商品子類(lèi)列表包括大類(lèi)、小類(lèi)、商品子類(lèi)和多維度標(biāo)簽,多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞;
商品子類(lèi)、小類(lèi)和大類(lèi)是依據(jù)電子商務(wù)平臺(tái)的商品分類(lèi)信息而定。按照商品的用途,對(duì)商品進(jìn)行分類(lèi)。商品子類(lèi)對(duì)應(yīng)待搜索的商品。小類(lèi)是商品子類(lèi)的上一層次的分類(lèi),大類(lèi)是小類(lèi)的上一層次的分類(lèi)。多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞。利用實(shí)體識(shí)別方法和句子剖析方法自動(dòng)提取商品的同義詞、近義詞、廣義詞、商品功能詞以及特征詞。
S62:在商品子類(lèi)列表中搜索用戶(hù)在搜索引擎中輸入的檢索詞,以及該檢索詞對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞,并顯示搜索結(jié)果。
檢索詞可以為商品子類(lèi)的名稱(chēng)、同義詞、近義詞、廣義詞、商品功能詞、特征詞中的一種或任意組合。例如按照表1構(gòu)建的商品子類(lèi)列表中,在搜索引擎中輸入反滲透設(shè)備。反滲透設(shè)備是凈水器的近義詞,反滲透是凈水器的功能詞。
同義詞和商品子類(lèi)之間建立雙向索引關(guān)系,如商品子類(lèi)為“血糖儀”,它的同義詞是“血糖計(jì)”,那么在用戶(hù)搜索“血糖儀”時(shí),“血糖儀”和“血糖計(jì)”都會(huì)被返回在搜索結(jié)果里。反之亦然。
同樣,對(duì)于商品子類(lèi)的近義詞來(lái)說(shuō),近義詞和商品子類(lèi)之間建立雙向索引關(guān)系。如商品子類(lèi)為“健康秤”,它的近義詞“機(jī)械秤”,在用戶(hù)搜索“健康秤”時(shí),“健康秤”和“機(jī)械秤”都會(huì)被返回在搜索結(jié)果里。反之亦然。對(duì)于商品子類(lèi)的近義詞和同義詞,如果說(shuō)同義詞和搜索詞的關(guān)系是1:1,那么近義詞和搜索詞的關(guān)系小于1:1。如商品子類(lèi)為“健康秤”時(shí),作為同義詞的“體重秤”可以完全替換“健康秤”,但是作為近義詞的“機(jī)械秤”屬于相關(guān)但是不能完全替代,“機(jī)械秤”應(yīng)該排在健康秤/體重秤靠后的位置。
廣義詞的使用是將該廣義詞和對(duì)應(yīng)商品子類(lèi)建立單向索引關(guān)系,如商品子類(lèi)是“電腦”,它的廣義詞是“電子商品”,那么在用戶(hù)搜索“電子商品”時(shí),“電腦”會(huì)被返回在搜索結(jié)果里,反之則不成立。
商品功能詞、特征詞分別和對(duì)應(yīng)商品子類(lèi)之間建立單向索引關(guān)系。商品功能詞和特征詞在搜索商品時(shí)擔(dān)任過(guò)濾和幫助用戶(hù)選擇商品的作用。如商品子類(lèi)“眉筆”的功能之一是“描眉”,那么在用戶(hù)搜 索“描眉”時(shí),“眉筆”會(huì)在搜索結(jié)果中返回。描眉作為商品多維度標(biāo)簽會(huì)被加在商品子類(lèi)列表中。
本實(shí)施例有助于創(chuàng)建基于對(duì)用戶(hù)深度需求理解的智能化搜索,幫助用戶(hù)實(shí)現(xiàn)從內(nèi)在需求的簡(jiǎn)單搜索到發(fā)現(xiàn)滿(mǎn)意商品而購(gòu)買(mǎi)的過(guò)程。
本實(shí)施例以大數(shù)據(jù)及機(jī)器學(xué)習(xí)技術(shù)為依托,對(duì)公共網(wǎng)絡(luò)資源深入挖掘,利用實(shí)體識(shí)別和句子剖析方法來(lái)自動(dòng)提取商品的同義詞、近義詞、廣義詞、特征詞和功能詞,來(lái)完成對(duì)現(xiàn)存的單一扁平的商品子類(lèi)名稱(chēng)進(jìn)行多維度的生動(dòng)化的描述。
本實(shí)施例用一系列相關(guān)詞匯(組)來(lái)擴(kuò)充當(dāng)前單個(gè)商品子類(lèi),從而全面,準(zhǔn)確,立體地呈現(xiàn)該商品子類(lèi)。該發(fā)明將解決因需要關(guān)鍵詞完美匹配而導(dǎo)致的搜索結(jié)果為零或召回率低的情況,進(jìn)而改善用戶(hù)體驗(yàn),和提升網(wǎng)站商品從搜索到購(gòu)買(mǎi)的轉(zhuǎn)化率。對(duì)關(guān)鍵詞的多維度標(biāo)簽分析和整理提供深度了解用戶(hù)的途徑,為定制個(gè)性化搜索打下基礎(chǔ)。
如圖7所示,本發(fā)明實(shí)施例提供一種商品搜索系統(tǒng),該系統(tǒng)包括:
建立模塊:用于建立商品子類(lèi)列表,所述的商品子類(lèi)列表包括大類(lèi)、小類(lèi)、商品子類(lèi)和多維度標(biāo)簽,多維度標(biāo)簽包括商品子類(lèi)對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞以及特征詞;
輸入模塊:用于在搜索引擎中輸入檢索詞;
搜索模塊:用于在商品子類(lèi)列表中搜索檢索詞,以及該檢索詞對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞,并顯示搜索結(jié)果。
建立模塊建立的商品子類(lèi)列表,包括大類(lèi)、小類(lèi)、商品子類(lèi)和多維度標(biāo)簽。多維度標(biāo)簽包括對(duì)應(yīng)商品子類(lèi)的名稱(chēng),以及同義詞、近義詞、廣義詞、商品功能詞以及特征詞。商品子類(lèi)、小類(lèi)和大類(lèi)是依據(jù)電子商務(wù)平臺(tái)的商品分類(lèi)信息而定。例如按照商品的用途,對(duì)商品進(jìn)行分類(lèi)。商品子類(lèi)對(duì)應(yīng)待搜索的商品。小類(lèi)是商品子類(lèi)的上一層次的分類(lèi),大類(lèi)是小類(lèi)的上一層次的分類(lèi)。輸入模塊用于在搜索引擎中輸入檢索詞。搜索模塊根據(jù)檢索詞,在商品子類(lèi)列表中,尤其是多維度標(biāo)簽中,搜索檢索詞,以及檢索詞對(duì)應(yīng)的同義詞、近義詞、廣義詞、商品功能詞和特征詞,并顯示搜索結(jié)果。
上述的商品搜索系統(tǒng)中,商品子類(lèi)列表中建立了多層次、多維度的標(biāo)簽。這樣在索引中擴(kuò)充該商品子類(lèi),完成對(duì)商品子類(lèi)的立體化描述。商品標(biāo)簽的多層次體現(xiàn)在從商品本身出發(fā),既有橫向的標(biāo)簽,如商品的同義詞、近義詞;也有縱向的標(biāo)簽,如廣義詞、功能詞和特征詞。本實(shí)施例的商品標(biāo)簽是在橫向和縱向發(fā)散性的綜合。
本實(shí)施例系統(tǒng)突出電子商務(wù)詞匯的廣度和深度。根據(jù)商品的特征和功能描述,創(chuàng)建商品功能詞以及特征詞標(biāo)簽,為搜索者找到商品提供了可能性。通過(guò)在商品子類(lèi)列表中建立多維度標(biāo)簽,提高了搜索結(jié)果召回率,從而改善用戶(hù)體驗(yàn),提升商品從搜索到購(gòu)買(mǎi)的轉(zhuǎn)化率。
本領(lǐng)域技術(shù)人員應(yīng)該知曉,實(shí)現(xiàn)上述實(shí)施例的方法或者系統(tǒng),可以通過(guò)計(jì)算機(jī)程序指令來(lái)實(shí)現(xiàn)。該計(jì)算機(jī)程序指令裝載到可編程數(shù)據(jù)處理設(shè)備上,例如計(jì)算機(jī),從而在可編程數(shù)據(jù)處理設(shè)備上執(zhí)行相應(yīng)的指令,用于實(shí)現(xiàn)上述實(shí)施例的方法或者系統(tǒng)實(shí)現(xiàn)的功能。
本領(lǐng)域技術(shù)人員依據(jù)上述實(shí)施例,可以對(duì)本申請(qǐng)進(jìn)行非創(chuàng)造性的技術(shù)改進(jìn),而不脫離本發(fā)明的精神實(shí)質(zhì)。這些改進(jìn)仍應(yīng)視為在本申請(qǐng)權(quán)利要求的保護(hù)范圍之內(nèi)。