搜索結(jié)果排序方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種搜索結(jié)果排序方法和裝置,其中,搜索結(jié)果排序方法包括以下步驟:接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞;獲取與單詞對(duì)應(yīng)的搭配;獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果;以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。本發(fā)明實(shí)施例的搜索結(jié)果排序方法和裝置,通過接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞,獲取與單詞對(duì)應(yīng)的搭配,并獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果,以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序,對(duì)搜索結(jié)果的排序進(jìn)行優(yōu)化,優(yōu)先提供更加符合用戶意圖的搜索結(jié)果,提升用戶使用體驗(yàn)。
【專利說明】
搜索結(jié)果排序方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種搜索結(jié)果排序方法和裝置。
【背景技術(shù)】
[0002]隨著科技的高速發(fā)展,互聯(lián)網(wǎng)已經(jīng)深入到人們的日常生活中。用戶可通過搜索引擎查詢到所需要的信息。而如何對(duì)搜索結(jié)果進(jìn)行排序,將用戶需要的信息排在搜索結(jié)果的最前面,是當(dāng)前重點(diǎn)研究的課題。
[0003]目前,主要通過查詢語句與搜索結(jié)果的標(biāo)題之前的語義相似度來輔助完成搜索結(jié)果的排序工作。例如:計(jì)算查詢語句每一個(gè)詞的詞向量,相加之后獲得查詢語句的詞向量。同理,計(jì)算搜索結(jié)果的標(biāo)題的詞向量。最后,再計(jì)算兩個(gè)詞向量之間的語義相似度,從而對(duì)搜索結(jié)果進(jìn)行排序。
[0004]但是,上述方法未考慮到查詢語句的結(jié)構(gòu)信息,可能導(dǎo)致最終的排序結(jié)果有所偏差,例如“武松打死老虎”與“老虎打死武松”這兩個(gè)查詢語句的詞向量相同,降低了排序結(jié)果的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本發(fā)明的一個(gè)目的在于提出一種搜索結(jié)果排序方法,能夠?qū)λ阉鹘Y(jié)果的排序進(jìn)行優(yōu)化,優(yōu)先提供更加符合用戶意圖的搜索結(jié)果,提升用戶使用體驗(yàn)。
[0006]本發(fā)明的第二個(gè)目的在于提出一種搜索結(jié)果排序裝置。
[0007]為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面實(shí)施例提出了一種搜索結(jié)果排序方法,包括:接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞;獲取與單詞對(duì)應(yīng)的搭配;獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果;以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)tx排序。
[0008]本發(fā)明實(shí)施例的搜索結(jié)果排序方法,通過接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞,獲取與單詞對(duì)應(yīng)的搭配,并獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果,以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序,對(duì)搜索結(jié)果的排序進(jìn)行優(yōu)化,優(yōu)先提供更加符合用戶意圖的搜索結(jié)果,提升用戶使用體驗(yàn)。
[0009]本發(fā)明第二方面實(shí)施例提出了一種搜索結(jié)果排序裝置,包括:切分模塊,用于接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞;第一獲取模塊,用于獲取與單詞對(duì)應(yīng)的搭配;第二獲取模塊,用于獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果;以及排序模塊,用于根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。
[0010]本發(fā)明實(shí)施例的搜索結(jié)果排序裝置,通過接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞,獲取與單詞對(duì)應(yīng)的搭配,并獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果,以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序,對(duì)搜索結(jié)果的排序進(jìn)行優(yōu)化,優(yōu)先提供更加符合用戶意圖的搜索結(jié)果,提升用戶使用體驗(yàn)。
【附圖說明】
[0011]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索結(jié)果排序方法的流程圖;
[0012]圖2是獲取候選搭配的效果示意圖;
[0013]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序的流程圖;
[0014]圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索結(jié)果排序裝置的結(jié)構(gòu)示意圖一;
[0015]圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索結(jié)果排序裝置的結(jié)構(gòu)示意圖二。
【具體實(shí)施方式】
[0016]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0017]下面參考附圖描述本發(fā)明實(shí)施例的搜索結(jié)果排序方法和裝置。
[0018]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索結(jié)果排序方法的流程圖。
[0019]如圖1所示,搜索結(jié)果排序方法可包括:
[0020]S1、接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞。
[0021]舉例來說,查詢語句為“車載藍(lán)牙如何自動(dòng)連接?”,可將該查詢語句切分為“車載,,、“藍(lán)牙”、“如何”、“自動(dòng)”、“連接”和“?” O
[0022]S2、獲取與單詞對(duì)應(yīng)的搭配。
[0023]具體地,可先獲取當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞,然后將當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞組合為多個(gè)候選搭配,最后基于預(yù)設(shè)搭配詞典篩選出與當(dāng)前單詞對(duì)應(yīng)的搭配。
[0024]繼續(xù)上例進(jìn)行描述,假設(shè)當(dāng)前單詞為“車載”,預(yù)設(shè)窗長為5。那么與“車載”處于同一窗長內(nèi)的單詞可包括“藍(lán)牙”、“如何”、“自動(dòng)”和“連接”,則“車載”對(duì)應(yīng)的候選搭配為“車載藍(lán)牙”、“車載如何”、“車載自動(dòng)”、“車載連接”。同理,如圖2所示,與“藍(lán)牙”處于同一窗長內(nèi)的單詞可包括“如何”、“自動(dòng)”、“連接”和“?”,則“藍(lán)牙”對(duì)應(yīng)的候選搭配為“藍(lán)牙如何”、“藍(lán)牙自動(dòng)”、“藍(lán)牙連接”、“藍(lán)牙?”。以此類推,掃描查詢語句中的每一個(gè)單詞,獲取其對(duì)應(yīng)的候選搭配。
[0025]在此之后,可基于預(yù)設(shè)搭配詞典篩選出與合理的搭配。其中,合理的搭配可以是共現(xiàn)頻率高的搭配,也可以是對(duì)數(shù)似然比得分高的搭配。例如:“車載如何”、“車載自動(dòng)”、“車載連接”、“藍(lán)牙如何”、“藍(lán)牙自動(dòng)”、“藍(lán)牙?”這些候選搭配,均為共同出現(xiàn)頻率較低的搭配,或者對(duì)數(shù)似然比得分較低的搭配,因此可過濾掉上述候選搭配。最終獲得“車載藍(lán)牙”、“藍(lán)牙連接”這樣的合理性較高的搭配。
[0026]S3、獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果。
[0027]例如查詢語句為“車載藍(lán)牙如何自動(dòng)連接?”,則可基于該查詢語句檢索出與之對(duì)應(yīng)的多個(gè)搜索結(jié)果。
[0028]S4、根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。
[0029]在獲取單詞及其對(duì)應(yīng)的搭配,以及多個(gè)搜索結(jié)果之后,可基于B0W(Bag Of Words,詞袋)模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。
[0030]具體地,如圖3所示,排序的過程可分為以下幾個(gè)步驟:
[0031]S41、計(jì)算單詞的詞向量及單詞對(duì)應(yīng)的搭配的詞向量之和,將其作為查詢語句的詞向量。
[0032]舉例來說,查詢語句可包括單詞1、單詞2和單詞3,單詞I對(duì)應(yīng)的搭配為搭配1、搭配2,單詞2對(duì)應(yīng)的搭配為搭配3、搭配4和搭配5,單詞3對(duì)應(yīng)的搭配為搭配6,可分別計(jì)算單詞1、單詞2、單詞3、搭配1、搭配2、搭配3、搭配4、搭配5和搭配6的詞向量,將上述詞向量進(jìn)行相加,最終獲得查詢語句的詞向量。在計(jì)算查詢語句的詞向量時(shí),將搭配的詞向量添加至輸入特征中,加入了句法結(jié)構(gòu)的特征,能夠有效彌補(bǔ)只將單詞的詞向量作為輸入特征的缺點(diǎn),提高了語義區(qū)分度。
[0033]S42、計(jì)算多個(gè)搜索結(jié)果的詞向量。
[0034]本實(shí)施例中,搜索結(jié)果的詞向量實(shí)際為搜索結(jié)果對(duì)應(yīng)的標(biāo)題的詞向量。搜索結(jié)果對(duì)應(yīng)的標(biāo)題同為多個(gè)單詞組成,因此,可采取與計(jì)算查詢語句的詞向量相同的方法,計(jì)算搜索結(jié)果的詞向量。
[0035]S43、計(jì)算查詢語句的詞向量與多個(gè)搜索結(jié)果的詞向量的語義相似度。
[0036]在計(jì)算出查詢語句的詞向量和搜索結(jié)果的詞向量之后,可分別計(jì)算查詢語句的詞向量與每個(gè)搜索結(jié)果的詞向量的語義相似度。
[0037]S44、根據(jù)語義相似度對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。
[0038]本實(shí)施例中,可根據(jù)語義相似度從高到低的順序?qū)λ阉鹘Y(jié)果進(jìn)行排序,從而使與查詢語句語義相似度更高的搜索結(jié)果排名更靠前。
[0039]下面詳細(xì)介紹一下,建立預(yù)設(shè)搭配詞典的具體過程。
[0040]首先可獲取訓(xùn)練語料,并抽取訓(xùn)練語料中的候選詞對(duì)語料,然后可基于共現(xiàn)頻率或?qū)?shù)似然比得分從候選詞對(duì)語料中篩選出詞對(duì)語料,最后基于詞對(duì)語料建立預(yù)設(shè)搭配詞典。舉例來說,假設(shè)訓(xùn)練語料為“汽車藍(lán)牙自動(dòng)連接”,可將每個(gè)詞看作一個(gè)節(jié)點(diǎn),分析每兩個(gè)節(jié)點(diǎn)之間是否存在語法依存關(guān)系。將具有語法依存關(guān)系的兩個(gè)詞作為一個(gè)候選詞對(duì)語料。其中,在訓(xùn)練語料中可能會(huì)存在如“的”、“之”、“了”這樣的虛詞節(jié)點(diǎn),可過濾掉虛詞節(jié)點(diǎn)。在選取候選詞對(duì)語料之后,可對(duì)候選詞對(duì)語料進(jìn)行篩選。篩選方法可分為兩種。第一種方法是通過共現(xiàn)頻率進(jìn)行篩選,即組成候選詞對(duì)語料的兩個(gè)詞共同出現(xiàn)的次數(shù)。篩選出共現(xiàn)頻率大于預(yù)設(shè)次數(shù)的候選詞對(duì)語料。第二種方法是通過對(duì)數(shù)似然比得分進(jìn)行篩選,即篩選出對(duì)數(shù)似然比得分最高的前N名的候選詞對(duì)語料。其中,對(duì)數(shù)似然比得分主要通過搭配頻率、詞頻、語料庫大小等計(jì)算獲得。搭配頻率指的是組成候選詞對(duì)語料的兩個(gè)詞搭配的次數(shù);詞頻為組成候選詞對(duì)語料的兩個(gè)詞對(duì)于語料庫分別展現(xiàn)的次數(shù);語料庫大小為包含的詞的個(gè)數(shù)。最后,根據(jù)篩選后得到的詞對(duì)語料建立預(yù)設(shè)搭配詞典。
[0041]本發(fā)明實(shí)施例的搜索結(jié)果排序方法,通過接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞,獲取與單詞對(duì)應(yīng)的搭配,并獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果,以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序,對(duì)搜索結(jié)果的排序進(jìn)行優(yōu)化,優(yōu)先提供更加符合用戶意圖的搜索結(jié)果,提升用戶使用體驗(yàn)。
[0042]為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種搜索結(jié)果排序裝置。
[0043]圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索結(jié)果排序裝置的結(jié)構(gòu)示意圖一。
[0044]如圖4所示,搜索結(jié)果排序裝置可包括:切分模塊110、第一獲取模塊120、第二獲取模塊130和排序模塊140。其中,第一獲取模塊120可包括獲取單元121、組合單元122和篩選單元123。
[0045]切分模塊110用于接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞。舉例來說,查詢語句為“車載藍(lán)牙如何自動(dòng)連接?”,可將該查詢語句切分為“車載”、“藍(lán)牙”、“如何”、“自動(dòng)”、“連接”和“?”。
[0046]第一獲取模塊120用于獲取與單詞對(duì)應(yīng)的搭配。具體地,獲取單元121可先獲取當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞,然后組合單元122將當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞組合為多個(gè)候選搭配,最后篩選單元123基于預(yù)設(shè)搭配詞典篩選出與當(dāng)前單詞對(duì)應(yīng)的搭配。繼續(xù)上例進(jìn)行描述,假設(shè)當(dāng)前單詞為“車載”,預(yù)設(shè)窗長為5。那么與“車載”處于同一窗長內(nèi)的單詞可包括“藍(lán)牙”、“如何”、“自動(dòng)”和“連接”,則“車載”對(duì)應(yīng)的候選搭配為“車載藍(lán)牙”、“車載如何”、“車載自動(dòng)”、“車載連接”。同理,如圖2所示,與“藍(lán)牙”處于同一窗長內(nèi)的單詞可包括“如何”、“自動(dòng)”、“連接”和“?”,則“藍(lán)牙”對(duì)應(yīng)的候選搭配為“藍(lán)牙如何”、“藍(lán)牙自動(dòng)”、“藍(lán)牙連接”、“藍(lán)牙?”。以此類推,掃描查詢語句中的每一個(gè)單詞,獲取其對(duì)應(yīng)的候選搭配。在此之后,可基于預(yù)設(shè)搭配詞典篩選出與合理的搭配。其中,合理的搭配可以是共現(xiàn)頻率高的搭配,也可以是對(duì)數(shù)似然比得分高的搭配。例如:“車載如何”、“車載自動(dòng)”、“車載連接”、“藍(lán)牙如何”、“藍(lán)牙自動(dòng)”、“藍(lán)牙?”這些候選搭配,均為共同出現(xiàn)頻率較低的搭配,或者對(duì)數(shù)似然比得分較低的搭配,因此可過濾掉上述候選搭配。最終獲得“車載藍(lán)牙”、“藍(lán)牙連接”這樣的合理性較高的搭配。
[0047]第二獲取模塊130用于獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果。例如查詢語句為“車載藍(lán)牙如何自動(dòng)連接?”,則第二獲取模塊130可基于該查詢語句檢索出與之對(duì)應(yīng)的多個(gè)搜索結(jié)果。
[0048]排序模塊140用于根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。具體地,排序模塊140可先計(jì)算單詞的詞向量及單詞對(duì)應(yīng)的搭配的詞向量之和,將其作為查詢語句的詞向量。舉例來說,查詢語句可包括單詞1、單詞2和單詞3,單詞I對(duì)應(yīng)的搭配為搭配1、搭配2,單詞2對(duì)應(yīng)的搭配為搭配3、搭配4和搭配5,單詞3對(duì)應(yīng)的搭配為搭配6,可分別計(jì)算單詞1、單詞2、單詞3、搭配1、搭配2、搭配3、搭配4、搭配5和搭配6的詞向量,將上述詞向量進(jìn)行相加,最終獲得查詢語句的詞向量。在計(jì)算查詢語句的詞向量時(shí),將搭配的詞向量添加至輸入特征中,加入了句法結(jié)構(gòu)的特征,能夠有效彌補(bǔ)只將單詞的詞向量作為輸入特征的缺點(diǎn),提高了語義區(qū)分度。
[0049]然后,排序模塊140計(jì)算多個(gè)搜索結(jié)果的詞向量。本實(shí)施例中,搜索結(jié)果的詞向量實(shí)際為搜索結(jié)果對(duì)應(yīng)的標(biāo)題的詞向量。搜索結(jié)果對(duì)應(yīng)的標(biāo)題同為多個(gè)單詞組成,因此,可采取與計(jì)算查詢語句的詞向量相同的方法,計(jì)算搜索結(jié)果的詞向量。
[0050]之后,排序模塊140再計(jì)算查詢語句的詞向量與多個(gè)搜索結(jié)果的詞向量的語義相似度。
[0051]最后,排序模塊140可根據(jù)語義相似度對(duì)多個(gè)搜索結(jié)果進(jìn)行排序。例如,可根據(jù)語義相似度從高到低的順序?qū)λ阉鹘Y(jié)果進(jìn)行排序,從而使與查詢語句語義相似度更高的搜索結(jié)果排名更靠前。
[0052 ]此外,如圖5所示,第一獲取模塊120還可包括建立模塊124。
[0053]具體地,建立模塊124可先獲取訓(xùn)練語料,并抽取訓(xùn)練語料中的候選詞對(duì)語料,然后可基于共現(xiàn)頻率或?qū)?shù)似然比得分從候選詞對(duì)語料中篩選出詞對(duì)語料,最后基于詞對(duì)語料建立預(yù)設(shè)搭配詞典。舉例來說,假設(shè)訓(xùn)練語料為“汽車藍(lán)牙自動(dòng)連接”,可將每個(gè)詞看作一個(gè)節(jié)點(diǎn),分析每兩個(gè)節(jié)點(diǎn)之間是否存在語法依存關(guān)系。將具有語法依存關(guān)系的兩個(gè)詞作為一個(gè)候選詞對(duì)語料。其中,在訓(xùn)練語料中可能會(huì)存在如“的”、“之”、“了”這樣的虛詞節(jié)點(diǎn),可過濾掉虛詞節(jié)點(diǎn)。在選取候選詞對(duì)語料之后,可對(duì)候選詞對(duì)語料進(jìn)行篩選。篩選方法可分為兩種。第一種方法是通過共現(xiàn)頻率進(jìn)行篩選,即組成候選詞對(duì)語料的兩個(gè)詞共同出現(xiàn)的次數(shù)。篩選出共現(xiàn)頻率大于預(yù)設(shè)次數(shù)的候選詞對(duì)語料。第二種方法是通過對(duì)數(shù)似然比得分進(jìn)行篩選,即篩選出對(duì)數(shù)似然比得分最高的前N名的候選詞對(duì)語料。其中,對(duì)數(shù)似然比得分主要通過搭配頻率、詞頻、語料庫大小等計(jì)算獲得。搭配頻率指的是組成候選詞對(duì)語料的兩個(gè)詞搭配的次數(shù);詞頻為組成候選詞對(duì)語料的兩個(gè)詞對(duì)于語料庫分別展現(xiàn)的次數(shù);語料庫大小為包含的詞的個(gè)數(shù)。最后,根據(jù)篩選后得到的詞對(duì)語料建立預(yù)設(shè)搭配詞典。
[0054]本發(fā)明實(shí)施例的搜索結(jié)果排序裝置,通過接收輸入的查詢語句,并將查詢語句切分為多個(gè)單詞,獲取與單詞對(duì)應(yīng)的搭配,并獲取查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果,以及根據(jù)單詞及單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)多個(gè)搜索結(jié)果進(jìn)行排序,對(duì)搜索結(jié)果的排序進(jìn)行優(yōu)化,優(yōu)先提供更加符合用戶意圖的搜索結(jié)果,提升用戶使用體驗(yàn)。
[0055]此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。
[0056]在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
[0057]盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
【主權(quán)項(xiàng)】
1.一種搜索結(jié)果排序方法,其特征在于,包括以下步驟: 接收輸入的查詢語句,并將所述查詢語句切分為多個(gè)單詞; 獲取與所述單詞對(duì)應(yīng)的搭配; 獲取所述查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果;以及 根據(jù)所述單詞及所述單詞對(duì)應(yīng)的搭配,基于詞袋BOW模型對(duì)所述多個(gè)搜索結(jié)果進(jìn)行排序。2.如權(quán)利要求1所述的方法,其特征在于,獲取與所述單詞對(duì)應(yīng)的搭配,包括: 獲取當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞; 將所述當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞組合為多個(gè)候選搭配; 基于預(yù)設(shè)搭配詞典篩選出與所述當(dāng)前單詞對(duì)應(yīng)的搭配。3.如權(quán)利要求2所述的方法,其特征在于,在基于預(yù)設(shè)搭配詞典篩選出與所述當(dāng)前單詞對(duì)應(yīng)的搭配之前,還包括: 建立預(yù)設(shè)搭配詞典。4.如權(quán)利要求3所述的方法,其特征在于,建立預(yù)設(shè)搭配詞典,包括: 獲取訓(xùn)練語料,并抽取所述訓(xùn)練語料中的候選詞對(duì)語料; 基于共現(xiàn)頻率或?qū)?shù)似然比得分從所述候選詞對(duì)語料中篩選出詞對(duì)語料,并基于所述詞對(duì)語料建立預(yù)設(shè)搭配詞典。5.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述單詞及所述單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)所述多個(gè)搜索結(jié)果進(jìn)行排序,包括: 計(jì)算所述單詞的詞向量及所述單詞對(duì)應(yīng)的搭配的詞向量之和,作為所述查詢語句的詞向量; 計(jì)算所述多個(gè)搜索結(jié)果的詞向量; 計(jì)算所述查詢語句的詞向量與所述多個(gè)搜索結(jié)果的詞向量的語義相似度; 根據(jù)所述語義相似度對(duì)所述多個(gè)搜索結(jié)果進(jìn)行排序。6.一種搜索結(jié)果排序裝置,其特征在于,包括: 切分模塊,用于接收輸入的查詢語句,并將所述查詢語句切分為多個(gè)單詞; 第一獲取模塊,用于獲取與所述單詞對(duì)應(yīng)的搭配; 第二獲取模塊,用于獲取所述查詢語句對(duì)應(yīng)的多個(gè)搜索結(jié)果;以及排序模塊,用于根據(jù)所述單詞及所述單詞對(duì)應(yīng)的搭配,基于BOW模型對(duì)所述多個(gè)搜索結(jié)果進(jìn)行排序。7.如權(quán)利要求6所述的裝置,其特征在于,所述第一獲取模塊,包括: 獲取單元,用于獲取當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞; 組合單元,用于將所述當(dāng)前單詞和與當(dāng)前單詞在預(yù)設(shè)窗長內(nèi)的單詞組合為多個(gè)候選搭配; 篩選單元,用于基于預(yù)設(shè)搭配詞典篩選出與所述當(dāng)前單詞對(duì)應(yīng)的搭配。8.如權(quán)利要求7所述的裝置,其特征在于,所述第一獲取模塊,還包括: 建立單元,用于在基于預(yù)設(shè)搭配詞典篩選出與所述當(dāng)前單詞對(duì)應(yīng)的搭配之前,建立預(yù)設(shè)搭配詞典。9.如權(quán)利要求8所述的裝置,其特征在于,所述建立單元,用于: 獲取訓(xùn)練語料,并抽取所述訓(xùn)練語料中的候選詞對(duì)語料; 基于共現(xiàn)頻率或?qū)?shù)似然比得分從所述候選詞對(duì)語料中篩選出詞對(duì)語料,并基于所述詞對(duì)語料建立預(yù)設(shè)搭配詞典。10.如權(quán)利要求6所述的裝置,其特征在于,所述排序模塊,用于: 計(jì)算所述單詞的詞向量及所述單詞對(duì)應(yīng)的搭配的詞向量之和,作為所述查詢語句的詞向量; 計(jì)算所述多個(gè)搜索結(jié)果的詞向量; 計(jì)算所述查詢語句的詞向量與所述多個(gè)搜索結(jié)果的詞向量的語義相似度; 根據(jù)所述語義相似度對(duì)所述多個(gè)搜索結(jié)果進(jìn)行排序。
【文檔編號(hào)】G06F17/27GK105955993SQ201610245408
【公開日】2016年9月21日
【申請(qǐng)日】2016年4月19日
【發(fā)明人】蘇建雷, 吳文權(quán), 劉占, 劉占一
【申請(qǐng)人】北京百度網(wǎng)訊科技有限公司