本發(fā)明涉及搜索技術(shù)領(lǐng)域,具體涉及一種搜索方法及裝置。
背景技術(shù):
垂直搜索引擎是針對某一特定領(lǐng)域、某一特定人群或某一特定需求的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對網(wǎng)頁庫中的某類專門的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。
目前,垂直搜索引擎是通過用戶輸入的搜索關(guān)鍵詞,按照全文搜索匹配的規(guī)則計(jì)算相關(guān)文檔得分,然后按照得分由高到低的順序?qū)⑺阉鹘Y(jié)果依次輸出給用戶。但是,這種方法僅僅是按照系統(tǒng)認(rèn)為的最優(yōu)排序?qū)⑺阉鹘Y(jié)果展示給用戶,完全沒有關(guān)心搜索結(jié)果排序是否符合用戶的真實(shí)需求。當(dāng)搜索結(jié)果排序和用戶的真實(shí)需求有所差距時(shí),將導(dǎo)致用戶真正想要的搜索結(jié)果沒有被優(yōu)先展示給用戶,從而影響了搜索轉(zhuǎn)化率和點(diǎn)擊率。比如,在房產(chǎn)領(lǐng)域,當(dāng)用戶搜索諸如城市、區(qū)縣或者開發(fā)商名稱這些特定類別的詞匯時(shí),垂直搜索引擎的搜索結(jié)果排序如果和用戶的真實(shí)需求有所差距時(shí),一方面將導(dǎo)致用戶無法快速找到需要的房產(chǎn)信息,另一方面也影響了房產(chǎn)的出租或出售。
因此,如何將更符合用戶真實(shí)需求的搜索結(jié)果優(yōu)先展示給用戶成為本領(lǐng)域技術(shù)人員亟待解決的問題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例提供一種搜索方法及裝置,能夠?qū)⒏嫌脩粽鎸?shí)需求的搜索結(jié)果優(yōu)先展示給用戶。
為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供如下技術(shù)方案:
一種搜索方法,包括:
接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;
根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集;
對所述搜索詞進(jìn)行分詞處理;
將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別;
提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值;
根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;
將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。
優(yōu)選的,所述根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集,包括:
根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行打分;
按照分?jǐn)?shù)由高至低的順序?qū)λ龀跏嫉乃阉鹘Y(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行排序,生成最終的搜索結(jié)果集。
優(yōu)選的,所述方法還包括:
獲取原始數(shù)據(jù)集;
采用詞庫分類器對所述原始數(shù)據(jù)集進(jìn)行訓(xùn)練,生成預(yù)設(shè)分類詞庫。
優(yōu)選的,所述方法還包括:
獲取增量數(shù)據(jù)集;
采用詞庫分類器對所述增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫。
優(yōu)選的,所述采用詞庫分類器對所述增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫,包括:
采用詞庫分類器從所述增量數(shù)據(jù)集中提取詞庫類別信息;
將所述詞庫類別信息添加至所述預(yù)設(shè)分類詞庫中。
一種搜索裝置,包括:
接收單元,用于接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;
搜索單元,用于根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集;
分詞單元,用于對所述搜索詞進(jìn)行分詞處理;
匹配單元,用于將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別;
權(quán)重調(diào)整單元,用于提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值;
搜索結(jié)果集調(diào)整單元,用于根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;
返回單元,用于將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。
優(yōu)選的,所述搜索結(jié)果集調(diào)整單元具體包括:
打分子單元,用于根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行打分;
排序子單元,用于按照分?jǐn)?shù)由高至低的順序?qū)λ龀跏嫉乃阉鹘Y(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行排序,生成最終的搜索結(jié)果集。
優(yōu)選的,所述裝置還包括:
獲取單元,用于獲取原始數(shù)據(jù)集;
訓(xùn)練單元,用于采用詞庫分類器對所述原始數(shù)據(jù)集進(jìn)行訓(xùn)練,生成預(yù)設(shè)分類詞庫。
優(yōu)選的,所述獲取單元還用于:
獲取增量數(shù)據(jù)集;
所述訓(xùn)練單元,還用于采用詞庫分類器對所述增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫。
優(yōu)選的,所述訓(xùn)練單元具體用于:
采用詞庫分類器從所述增量數(shù)據(jù)集中提取詞庫類別信息;
將所述詞庫類別信息添加至所述預(yù)設(shè)分類詞庫中。
基于上述技術(shù)方案,本發(fā)明實(shí)施例中公開了一種搜索方法及裝置,接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集;對所述搜索詞進(jìn)行分詞處理;將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別;提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值;根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。由于能夠按照用戶的搜索意圖,調(diào)整用戶的搜索詞對應(yīng)的權(quán)重?cái)?shù)值,從而能夠?qū)⒏嫌脩粽鎸?shí)需求的搜索結(jié)果優(yōu)先展示給用戶。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種搜索方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的另一種搜索方法的流程示意圖;
圖3為本發(fā)明實(shí)施例提供的一種搜索裝置的結(jié)構(gòu)框圖;
圖4為本發(fā)明實(shí)施例提供的另一種搜索裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
目前,垂直搜索引擎是通過用戶輸入的搜索關(guān)鍵詞,按照全文搜索匹配的規(guī)則計(jì)算相關(guān)文檔得分,然后按照得分由高到低的順序?qū)⑺阉鹘Y(jié)果依次輸出給用戶。但是,這種方法僅僅是按照系統(tǒng)認(rèn)為的最優(yōu)排序?qū)⑺阉鹘Y(jié)果展示給用戶,完全沒有關(guān)心搜索結(jié)果排序是否符合用戶的真實(shí)需求。當(dāng)搜索結(jié)果排序和用戶的真實(shí)需求有所差距時(shí),將導(dǎo)致用戶真正想要的搜索結(jié)果沒有被優(yōu)先展示給用戶,從而影響了搜索轉(zhuǎn)化率和點(diǎn)擊率。
為此,本發(fā)明提供了一種搜索方法及裝置,能夠?qū)⒏嫌脩粽鎸?shí)需求的搜索結(jié)果優(yōu)先展示給用戶。具體如下:
請參閱附圖1,為本發(fā)明提供的一種搜索方法的流程示意圖,該方法具體包括如下步驟:
步驟s100、接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞。
具體的,所述客戶端可以為安裝在電腦、pad或手機(jī)上的搜索應(yīng)用程序,也可以為具體的搜索引擎,對此,本實(shí)施例不進(jìn)行任何限定。而用戶通過所述客戶端輸入的搜索詞也可以為多種形式,比如在房產(chǎn)領(lǐng)域,用戶通過所述客戶端輸入的搜索詞可以為“萬科”、“通州”等。
步驟s110、根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集。
服務(wù)器在獲取用戶通過所述客戶端輸入的搜索詞之后,會生成與該搜索詞對應(yīng)的初始的搜索結(jié)果集,需要說明的是,此時(shí),初始的搜索結(jié)果集僅僅是在服務(wù)器端整理出來,并不返回給客戶端。還需要對搜索結(jié)果進(jìn)行排序,才會將排序后的搜索結(jié)果集返回給客戶端,具體通過下述內(nèi)容詳細(xì)說明。
步驟s120、對所述搜索詞進(jìn)行分詞處理。
具體的,可通過elasticsearch的ik插件進(jìn)行分詞,其中,使用的詞庫為標(biāo)準(zhǔn)詞庫加上房產(chǎn)領(lǐng)域的垂直自定義詞庫。
步驟s130、將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別。
比如,用戶通過所述客戶端輸入的搜索詞為“萬科”、“通州”,對上述搜索詞分詞處理后得到“萬科”、“通州”這兩個(gè)分詞。通過將“萬科”、“通州”這兩個(gè)分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配之后,確定“萬科”、“通州”這兩個(gè)分詞分別命中了開發(fā)商和區(qū)縣這兩個(gè)詞庫類別,則開發(fā)商和區(qū)縣這兩個(gè)詞庫類別即為目標(biāo)詞庫類別。
步驟s140、提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值。
具體的,可以將所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值更改為預(yù)設(shè)的最高權(quán)重的詞庫類別的權(quán)重?cái)?shù)值,預(yù)設(shè)的最高權(quán)重的詞庫類別的權(quán)重?cái)?shù)值更改為預(yù)設(shè)的次高權(quán)重的詞庫類別的權(quán)重?cái)?shù)值,以此類推。
步驟s150、根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集。
步驟s160、將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。
本實(shí)施例中公開了一種搜索方法,接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集;對所述搜索詞進(jìn)行分詞處理;將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別;提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值;根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。由于能夠按照用戶的搜索意圖,調(diào)整用戶的搜索詞對應(yīng)的權(quán)重?cái)?shù)值,從而能夠?qū)⒏嫌脩粽鎸?shí)需求的搜索結(jié)果優(yōu)先展示給用戶。
請參閱附圖2,為本發(fā)明公開的另一種搜索方法的流程示意圖,該方法具體包括如下步驟:
步驟s200、接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞。
步驟s210、根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集。
步驟s220、對所述搜索詞進(jìn)行分詞處理。
步驟s230、將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別。
具體的,可以獲取原始數(shù)據(jù)集,采用詞庫分類器對所述原始數(shù)據(jù)集進(jìn)行訓(xùn)練,生成預(yù)設(shè)分類詞庫。
優(yōu)選的,可以獲取增量數(shù)據(jù)集,采用詞庫分類器對所述增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫。其中,所述采用詞庫分類器對所述增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫,包括:采用詞庫分類器從所述增量數(shù)據(jù)集中提取詞庫類別信息;將所述詞庫類別信息添加至所述預(yù)設(shè)分類詞庫中。
步驟s240、提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值。
步驟s250、根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行打分。
步驟s260、按照分?jǐn)?shù)由高至低的順序?qū)λ龀跏嫉乃阉鹘Y(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行排序,生成最終的搜索結(jié)果集。
步驟s270、將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。
在本實(shí)施例中,采用詞庫分類器對增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新預(yù)設(shè)分類詞庫,能夠保證搜索結(jié)果集的精準(zhǔn)度。
下面對本發(fā)明實(shí)施例提供的搜索裝置進(jìn)行介紹,下文描述的搜索裝置可與上文的搜索方法相互對應(yīng)參照。
請參閱附圖3,為本發(fā)明實(shí)施例公開的一種搜索裝置的結(jié)構(gòu)框圖,該搜索裝置可以包括:
接收單元100,用于接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;
搜索單元110,用于根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集;
分詞單元120,用于對所述搜索詞進(jìn)行分詞處理;
匹配單元130,用于將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別;
權(quán)重調(diào)整單元140,用于提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值;
搜索結(jié)果集調(diào)整單元150,用于根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;
返回單元160,用于將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。
優(yōu)選的,所述搜索結(jié)果集調(diào)整單元150,具體包括:
打分子單元,用于根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行打分;
排序子單元,用于按照分?jǐn)?shù)由高至低的順序?qū)λ龀跏嫉乃阉鹘Y(jié)果集中的各個(gè)搜索結(jié)果進(jìn)行排序,生成最終的搜索結(jié)果集。
請參閱附圖4,為本發(fā)明實(shí)施例公開的另一種搜索裝置的結(jié)構(gòu)框圖,該搜索裝置還包括:
獲取單元170,用于獲取原始數(shù)據(jù)集;
訓(xùn)練單元180,用于采用詞庫分類器對所述原始數(shù)據(jù)集進(jìn)行訓(xùn)練,生成預(yù)設(shè)分類詞庫。
優(yōu)選的,所述獲取單元,還用于獲取增量數(shù)據(jù)集;
所述訓(xùn)練單元,還用于采用詞庫分類器對所述增量數(shù)據(jù)集進(jìn)行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫。
所述訓(xùn)練單元具體用于:
采用詞庫分類器從所述增量數(shù)據(jù)集中提取詞庫類別信息;
將所述詞庫類別信息添加至所述預(yù)設(shè)分類詞庫中。
綜上所述:
本發(fā)明實(shí)施例中公開了一種搜索方法及裝置,接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;根據(jù)所述搜索詞進(jìn)行搜索得到初始的搜索結(jié)果集;對所述搜索詞進(jìn)行分詞處理;將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進(jìn)行匹配,以確定所述搜索詞命中的詞庫類別作為目標(biāo)詞庫類別;提高所述目標(biāo)詞庫類別的權(quán)重?cái)?shù)值;根據(jù)提高后的目標(biāo)詞庫類別的權(quán)重?cái)?shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。由于能夠按照用戶的搜索意圖,調(diào)整用戶的搜索詞對應(yīng)的權(quán)重?cái)?shù)值,從而能夠?qū)⒏嫌脩粽鎸?shí)需求的搜索結(jié)果優(yōu)先展示給用戶。
本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見即可。對于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
專業(yè)人員還可以進(jìn)一步意識到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實(shí)施。軟件模塊可以置于隨機(jī)存儲器(ram)、內(nèi)存、只讀存儲器(rom)、電可編程rom、電可擦除可編程rom、寄存器、硬盤、可移動磁盤、cd-rom、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
對所公開的實(shí)施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實(shí)施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。