亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

搜索方法及裝置的制造方法

文檔序號(hào):10594202閱讀:174來(lái)源:國(guó)知局
搜索方法及裝置的制造方法
【專(zhuān)利摘要】本發(fā)明提供一種搜索方法及裝置。本發(fā)明實(shí)施例通過(guò)根據(jù)所獲取的搜索關(guān)鍵詞,獲得搜索結(jié)果,進(jìn)而將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下,使得能夠輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶(hù)通過(guò)應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問(wèn)題,從而降低了搜索引擎的處理負(fù)擔(dān)。
【專(zhuān)利說(shuō)明】
搜索方法及裝置【
技術(shù)領(lǐng)域

[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù),尤其涉及一種搜索方法及裝置。【【背景技術(shù)】】
[0002]搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶(hù)提供搜索服務(wù),將用戶(hù)搜索相關(guān)的信息展示給用戶(hù)的系統(tǒng)。據(jù)國(guó)家統(tǒng)計(jì)局的報(bào)道,中國(guó)網(wǎng)民人數(shù)已經(jīng)超過(guò)了4億,這個(gè)數(shù)據(jù)意味著中國(guó)已經(jīng)超過(guò)美國(guó)成為世界上第一大網(wǎng)民國(guó),且中國(guó)的網(wǎng)站總數(shù)量已經(jīng)超過(guò)了200萬(wàn)。因此,如何利用搜索服務(wù)最大限度滿足用戶(hù)需求,對(duì)于互聯(lián)網(wǎng)企業(yè)而言,始終是一個(gè)重要的課題。用戶(hù)在搜索引擎對(duì)應(yīng)應(yīng)用中的搜索框中,輸入搜索關(guān)鍵詞,由應(yīng)用將搜索關(guān)鍵詞,發(fā)送給搜索引擎。搜索引擎則根據(jù)搜索關(guān)鍵詞,在數(shù)據(jù)庫(kù)中進(jìn)行搜索,以獲得與搜索關(guān)鍵詞匹配的資源例如,網(wǎng)頁(yè)或文檔等,以作為若干個(gè)搜索結(jié)果,并返回給應(yīng)用進(jìn)行輸出。
[0003]然而,由于原始的資源庫(kù)中的資源都是相互獨(dú)立的單一內(nèi)容,使得每個(gè)搜索結(jié)果之間也是相互獨(dú)立,可能無(wú)法滿足用戶(hù)真正的搜索意圖,例如,快速了解搜索結(jié)果的觀點(diǎn)等,使得用戶(hù)需要通過(guò)應(yīng)用反復(fù)進(jìn)行搜索,才能夠獲得所需要的內(nèi)容,這樣,會(huì)增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互,從而導(dǎo)致了搜索引擎的處理負(fù)擔(dān)的增加。【
【發(fā)明內(nèi)容】

[0004]本發(fā)明的多個(gè)方面提供一種搜索方法及裝置,用以降低搜索引擎的處理負(fù)擔(dān)。
[0005]本發(fā)明的一方面,提供一種搜索方法,包括:
[0006]獲取搜索關(guān)鍵詞;
[0007]根據(jù)所述搜索關(guān)鍵詞,獲得搜索結(jié)果;
[0008]將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下;
[0009]輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。[〇〇1〇]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述屬性包括觀點(diǎn)數(shù)據(jù)或者標(biāo)簽數(shù)據(jù)。
[0011]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下之前,還包括:
[0012]獲得所述搜索關(guān)鍵詞的屬性。
[0013]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得所述搜索關(guān)鍵詞的屬性,包括:
[0014]根據(jù)所述搜索關(guān)鍵詞,獲得所述搜索關(guān)鍵詞的屬性;或者
[0015]根據(jù)所述搜索結(jié)果,獲得所述搜索結(jié)果的關(guān)鍵信息,以作為所述搜索關(guān)鍵詞的屬性。
[0016]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,包括:
[0017]在搜索結(jié)果頁(yè)中的指定區(qū)域,輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。
[0018]本發(fā)明的另一方面,提供一種搜索裝置,包括:
[0019]獲取單元,用于獲取搜索關(guān)鍵詞;
[0020]處理單元,用于根據(jù)所述搜索關(guān)鍵詞,獲得搜索結(jié)果;
[0021]聚類(lèi)單元,用于將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下;
[0022]輸出單元,用于輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。
[0023]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述屬性包括觀點(diǎn)數(shù)據(jù)或者標(biāo)簽數(shù)據(jù)。
[0024]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述聚類(lèi)單元,還用于[〇〇25]獲得所述搜索關(guān)鍵詞的屬性。
[0026]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述聚類(lèi)單元,具體用于
[0027]根據(jù)所述搜索關(guān)鍵詞,獲得所述搜索關(guān)鍵詞的屬性;或者
[0028]根據(jù)所述搜索結(jié)果,獲得所述搜索結(jié)果的關(guān)鍵信息,以作為所述搜索關(guān)鍵詞的屬性。
[0029]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述輸出單元,具體用于
[0030]在搜索結(jié)果頁(yè)中的指定區(qū)域,輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。
[0031]由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過(guò)根據(jù)所獲取的搜索關(guān)鍵詞,獲得搜索結(jié)果,進(jìn)而將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下,使得能夠輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶(hù)通過(guò)應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問(wèn)題,從而降低了搜索引擎的處理負(fù)擔(dān)。 [〇〇32]另外,采用本發(fā)明所提供的技術(shù)方案,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠有效提高搜索的效率。
[0033]另外,采用本發(fā)明所提供的技術(shù)方案,通過(guò)輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,能夠使得搜索結(jié)果的展現(xiàn)效果具有重點(diǎn)突出且內(nèi)容清晰的特點(diǎn),從而有效地提升了用戶(hù)體驗(yàn)?!尽靖綀D說(shuō)明】】
[0034]為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0035]圖1為本發(fā)明一實(shí)施例提供的搜索方法的流程示意圖;
[0036]圖2為本發(fā)明另一實(shí)施例提供的搜索裝置的結(jié)構(gòu)示意圖。【【具體實(shí)施方式】】
[0037]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0038]需要說(shuō)明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于手機(jī)、個(gè)人數(shù)字助理(Personal Digital Assistant,PDA)、無(wú)線手持設(shè)備、平板電腦(Tablet Computer)、 個(gè)人電腦(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、 智能手表、智能手環(huán)等)等。[〇〇39]另外,本文中術(shù)語(yǔ)“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另夕卜,本文中字符7”,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。
[0040]圖1為本發(fā)明一實(shí)施例提供的搜索方法的流程示意圖,如圖1所示。[00411101、獲取搜索關(guān)鍵詞。
[0042]102、根據(jù)所述搜索關(guān)鍵詞,獲得搜索結(jié)果。
[0043]103、將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下。
[0044]104、輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。
[0045]需要說(shuō)明的是,101?104的執(zhí)行主體的部分或全部可以為位于本地終端的應(yīng)用, 或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開(kāi)發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的搜索引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對(duì)此不進(jìn)行特別限定。[〇〇46]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁(yè)程序(webApp),本實(shí)施例對(duì)此不進(jìn)行特別限定。[〇〇47]這樣,通過(guò)根據(jù)所獲取的搜索關(guān)鍵詞,獲得搜索結(jié)果,進(jìn)而將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下,使得能夠輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖, 因此,能夠避免現(xiàn)有技術(shù)中由于用戶(hù)通過(guò)應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問(wèn)題,從而降低了搜索引擎的處理負(fù)擔(dān)。
[0048]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,具體可以采集用戶(hù)所提供的所述搜索關(guān)鍵詞。具體來(lái)說(shuō),具體可以通過(guò)用戶(hù)所觸發(fā)的搜索命令實(shí)現(xiàn)。具體可以采用但不限于下述幾種方式觸發(fā)搜索命令:
[0049]方式一:
[0050]用戶(hù)可以在當(dāng)前應(yīng)用所展現(xiàn)的頁(yè)面上所輸入所述搜索關(guān)鍵詞,然后,通過(guò)點(diǎn)擊該頁(yè)面上的搜索按鈕例如,百度一下,以觸發(fā)搜索命令,該搜索命令中包含所述搜索關(guān)鍵詞。 其中,用戶(hù)輸入所述搜索關(guān)鍵詞的順序可以為任意順序。這樣,在接收到該搜索命令之后, 則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0051]方式二:[0〇52]采用異步加載技術(shù)例如,Ajax異步加載或Jsonp異步加載等,實(shí)時(shí)獲取用戶(hù)在當(dāng)前應(yīng)用所展現(xiàn)的頁(yè)面上所輸入的輸入內(nèi)容,為了與搜索關(guān)鍵詞進(jìn)行區(qū)分,此時(shí)的輸入內(nèi)容可以稱(chēng)為是輸入關(guān)鍵詞。其中,用戶(hù)輸入所述搜索關(guān)鍵詞的順序可以為任意順序。具體地,具體可以提供Ajax接口或Jsonp接口等接口,這些接口可以使用Java、超級(jí)文本預(yù)處理 (Hypertext Preprocessor,PHP)語(yǔ)言等語(yǔ)言進(jìn)行編寫(xiě),其具體的調(diào)用可以使用Jquery,或者原生的JavaScript等語(yǔ)言進(jìn)行編寫(xiě)。[〇〇53]方式三:用戶(hù)可以通過(guò)長(zhǎng)按當(dāng)前應(yīng)用所展現(xiàn)的頁(yè)面上的語(yǔ)音搜索按鈕,說(shuō)出想要輸入的語(yǔ)音內(nèi)容,然后,松開(kāi)語(yǔ)音搜索按鈕,以觸發(fā)搜索命令,該搜索命令中包含根據(jù)所說(shuō)出的語(yǔ)音內(nèi)容轉(zhuǎn)換的文本形式的搜索關(guān)鍵詞。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0054]方式四:用戶(hù)可以通過(guò)點(diǎn)擊當(dāng)前應(yīng)用所展現(xiàn)的頁(yè)面上的語(yǔ)音搜索按鈕,說(shuō)出想要輸入的語(yǔ)音內(nèi)容,待結(jié)束說(shuō)出語(yǔ)音內(nèi)容一段時(shí)間例如,2秒鐘之后,則觸發(fā)搜索命令,該搜索命令中包含根據(jù)所說(shuō)出的語(yǔ)音內(nèi)容轉(zhuǎn)換的文本形式的搜索關(guān)鍵詞。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0055]在獲取到所述輸入關(guān)鍵詞之后,則可以執(zhí)行后續(xù)操作即102?104。
[0056]本發(fā)明中,所述屬性,可以包括但不限于觀點(diǎn)數(shù)據(jù)或者標(biāo)簽數(shù)據(jù),本實(shí)施例對(duì)此不進(jìn)行特別限定。[〇〇57]通常,可以將搜索關(guān)鍵詞分為兩種類(lèi)型,一種類(lèi)型是,其搜索結(jié)果具有明顯的觀點(diǎn),如,Swisse品牌的保健品好不好等,這種類(lèi)型的搜索關(guān)鍵詞則可以具有觀點(diǎn)數(shù)據(jù)如 Swisse品牌的保健品好或Swisse品牌的保健品不好等;另一種類(lèi)型是,其搜索結(jié)果不具有明顯的觀點(diǎn),如,天空為什么是藍(lán)色的等,只是客觀的描述一個(gè)事實(shí),這種類(lèi)型的搜索關(guān)鍵詞則不再具有觀點(diǎn)數(shù)據(jù),而是根據(jù)其所對(duì)應(yīng)的搜索結(jié)果,可以獲得其標(biāo)簽數(shù)據(jù)例如,搜索結(jié)果的來(lái)源、質(zhì)量、用戶(hù)身份等。[〇〇58]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102中,具體可以采用現(xiàn)有的搜索方法,獲得與所述搜索關(guān)鍵詞,對(duì)應(yīng)的搜索結(jié)果。詳細(xì)描述可以參見(jiàn)現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不在贅述。
[0059]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103之前,還可以進(jìn)一步獲得所述搜索關(guān)鍵詞的屬性。
[0060]在一個(gè)具體的實(shí)現(xiàn)過(guò)程中,對(duì)于搜索結(jié)果具有明顯的觀點(diǎn)的搜索關(guān)鍵詞來(lái)說(shuō),具體可以根據(jù)所述搜索關(guān)鍵詞,直接獲得所述搜索關(guān)鍵詞的屬性。
[0061]例如,可以根據(jù)所述搜索關(guān)鍵詞,直接獲得觀點(diǎn)詞例如好、不好等,以作為所述搜索關(guān)鍵詞的屬性。
[0062]在另一個(gè)具體的實(shí)現(xiàn)過(guò)程中,對(duì)于搜索結(jié)果具有明顯的觀點(diǎn)的搜索關(guān)鍵詞來(lái)說(shuō), 具體還可以根據(jù)所述搜索關(guān)鍵詞,獲得所述搜索關(guān)鍵詞所對(duì)應(yīng)的搜索結(jié)果的類(lèi)型,進(jìn)而,根據(jù)所述搜索結(jié)果的類(lèi)型,在搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容中,抽取關(guān)鍵內(nèi)容,作為所述搜索關(guān)鍵詞的屬性。[〇〇63] 具體來(lái)說(shuō),首先,可以對(duì)所述搜索關(guān)鍵詞進(jìn)行分詞處理、詞性標(biāo)注處理、以及專(zhuān)有名詞識(shí)別處理等基礎(chǔ)分析。這些基礎(chǔ)分析,可以采用傳統(tǒng)的自然語(yǔ)言處理(Natural Language Processing,NLP)技術(shù),對(duì)所述搜索關(guān)鍵詞進(jìn)行處理,為后續(xù)的應(yīng)用分析提供一些底層的通用分析結(jié)果,此處不再贅述。[0〇64] 其次,貝lj可以采用詞匯回答類(lèi)型(Lexical Answer Type,LAT)方法,對(duì)經(jīng)過(guò)基礎(chǔ)分析的搜索關(guān)鍵詞進(jìn)行分析處理,獲得所述搜索關(guān)鍵詞中用來(lái)描述搜索結(jié)果類(lèi)型的上位詞, 以作為所述搜索關(guān)鍵詞所對(duì)應(yīng)的搜索結(jié)果的類(lèi)型。例如,搜索關(guān)鍵詞“糖尿病的癥狀”所對(duì)應(yīng)的LAT處理結(jié)果是“癥狀”,即為所述搜索關(guān)鍵詞所對(duì)應(yīng)的搜索結(jié)果的類(lèi)型。其中,LAT方法可以使用序列標(biāo)注模型學(xué)習(xí),由機(jī)器半自動(dòng)構(gòu)造訓(xùn)練數(shù)據(jù),并還可以進(jìn)一步結(jié)合經(jīng)驗(yàn)規(guī)則。
[0065]由于搜索關(guān)鍵詞的口語(yǔ)化特點(diǎn),使得所獲得的LAT處理結(jié)果并不是描述搜索結(jié)果類(lèi)型的上位詞,例如,搜索關(guān)鍵詞“什么東西去疤痕好”所對(duì)應(yīng)的LAT處理結(jié)果是信息量較低的“東西”,實(shí)際其隱含的搜索結(jié)果的類(lèi)型應(yīng)為“藥”或者“產(chǎn)品”等。因此,在獲得搜索結(jié)果的類(lèi)型之后,還可以進(jìn)一步對(duì)搜索結(jié)果的類(lèi)型,進(jìn)行歸一化處理,以獲得歸一化的類(lèi)型。具體來(lái)說(shuō),具體可以通過(guò)對(duì)用戶(hù)歷史行為數(shù)據(jù)中的搜索關(guān)鍵詞與搜索結(jié)果進(jìn)行統(tǒng)計(jì),獲得實(shí)際需要的搜索結(jié)果的類(lèi)型。這樣,就獲取到了搜索關(guān)鍵詞所對(duì)應(yīng)的搜索結(jié)果的類(lèi)型。
[0066]接著,可以根據(jù)所述搜索結(jié)果的類(lèi)型,在搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容中,抽取關(guān)鍵內(nèi)容,作為候選觀點(diǎn)。在獲得候選觀點(diǎn)之后,計(jì)算候選觀點(diǎn)的投票得分、所在句與搜索關(guān)鍵詞之間的相關(guān)性得分等特征得分,進(jìn)而,再根據(jù)經(jīng)驗(yàn)或機(jī)器學(xué)習(xí)技術(shù),獲得一個(gè)總分。接著, 按照總分從大到小的順序,對(duì)候選觀點(diǎn)進(jìn)行排序。然后,采用預(yù)先設(shè)置的閾值,選擇部分候選觀點(diǎn),作為搜索關(guān)鍵詞的屬性。
[0067]需要說(shuō)明的是,在獲得候選觀點(diǎn)之后,還可以進(jìn)一步利用同義詞表和候選觀點(diǎn)之間的相似度中的至少一項(xiàng),過(guò)濾掉重復(fù)的觀點(diǎn),能夠有效保證觀點(diǎn)的有效性。
[0068]具體來(lái)說(shuō),具體可以根據(jù)搜索結(jié)果中的統(tǒng)一資源定位符(Uniform Resource Locator,URL),獲得其所對(duì)應(yīng)的頁(yè)面內(nèi)容。
[0069]所謂的頁(yè)面,有時(shí)也可以稱(chēng)為萬(wàn)維網(wǎng)(World Wide Web,Web)頁(yè)面,可以是基于超文本標(biāo)記語(yǔ)言(HyperText Markup Language,HTML)編寫(xiě)的網(wǎng)頁(yè)(Web Page),即HTML頁(yè)面, 或者還可以是基于HTML和Java語(yǔ)言編寫(xiě)的網(wǎng)頁(yè),S卩Java服務(wù)器頁(yè)面(Java Server Page, JSP),或者還可以為其他編程語(yǔ)言編寫(xiě)的網(wǎng)頁(yè),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0070]具體地,頁(yè)面可以包括由一個(gè)或者多個(gè)頁(yè)面標(biāo)簽例如,超文本標(biāo)記語(yǔ)言 (HyperText Markup Language,HTML)標(biāo)簽、JSP標(biāo)簽等,定義的顯示區(qū)塊,稱(chēng)為頁(yè)面元素,例如,文本、圖片、超鏈接、按鈕、編輯框、下拉框等,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0071]在一個(gè)具體的實(shí)現(xiàn)過(guò)程中,可以根據(jù)頁(yè)面的來(lái)源不同,采用兩種不同的方法,獲得搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容。
[0072]例如,對(duì)于一般來(lái)自網(wǎng)站的頁(yè)面來(lái)說(shuō),可以直接從全量網(wǎng)頁(yè)庫(kù)獲得頁(yè)面的源代碼如超文本標(biāo)記語(yǔ)言(HyperText Markup Language,HTML)源代碼等,進(jìn)而,將所述源代碼中的頁(yè)面標(biāo)簽過(guò)濾之后,獲得頁(yè)面內(nèi)容,作為搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容;或者再例如,對(duì)于來(lái)自結(jié)構(gòu)化網(wǎng)站的頁(yè)面來(lái)說(shuō),可以利用預(yù)先配置的頁(yè)面模板,抽取相應(yīng)的字段,作為搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容。
[0073]在另一個(gè)具體的實(shí)現(xiàn)過(guò)程中,可以根據(jù)搜索關(guān)鍵詞的類(lèi)型,進(jìn)行關(guān)鍵內(nèi)容的抽取。
[0074]在該實(shí)現(xiàn)過(guò)程中,搜索關(guān)鍵詞的類(lèi)型,可以分為如下五種類(lèi)型,S卩非問(wèn)答類(lèi)型、 what類(lèi)型、how類(lèi)型、why類(lèi)型和是非(Yes-No)類(lèi)型??梢愿鶕?jù)搜索關(guān)鍵詞中的特征詞如疑問(wèn)詞,來(lái)判斷搜索關(guān)鍵詞的類(lèi)型。
[0075]例如,對(duì)于what類(lèi)型中的實(shí)體子類(lèi)來(lái)說(shuō),可以在搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容中,進(jìn)行實(shí)體識(shí)別,保留與所述搜索關(guān)鍵詞的屬性匹配的實(shí)體,以作為候選觀點(diǎn)。
[0076]或者,再例如,對(duì)于what類(lèi)型中除了實(shí)體子類(lèi)之外的其他子類(lèi)、how類(lèi)型、why類(lèi)型和是非類(lèi)型來(lái)說(shuō),這些類(lèi)型的搜索關(guān)鍵詞所對(duì)應(yīng)的搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容,并不適合進(jìn)行實(shí)體識(shí)別,那么,則可以在搜索結(jié)果所對(duì)應(yīng)的頁(yè)面內(nèi)容中,可以識(shí)別出與搜索關(guān)鍵詞的類(lèi)型一致的短句,并對(duì)這些短句進(jìn)行聚合處理,在聚合處理的結(jié)果中,抽取關(guān)鍵內(nèi)容,作為候選觀點(diǎn)。
[0077]在另一個(gè)具體的實(shí)現(xiàn)過(guò)程中,對(duì)于搜索結(jié)果不具有明顯的觀點(diǎn)的搜索關(guān)鍵詞來(lái)說(shuō),具體可以根據(jù)所述搜索結(jié)果,獲得所述搜索結(jié)果的關(guān)鍵信息,以作為所述搜索關(guān)鍵詞的屬性。
[0078]對(duì)于搜索結(jié)果不具有明顯的觀點(diǎn)的搜索關(guān)鍵詞來(lái)說(shuō),其搜索結(jié)果中可能會(huì)隱藏這一些很關(guān)鍵,并且用戶(hù)也很可能感興趣的信息,這就需要對(duì)搜索結(jié)果進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析, 以提取出屬性字段,這些字段標(biāo)記了搜索結(jié)果的來(lái)源、質(zhì)量、用戶(hù)身份等重要信息,例如,專(zhuān)業(yè)答案、被提問(wèn)者采納、精華帖子、用戶(hù)身份(達(dá)人、專(zhuān)家等稱(chēng)號(hào))等,這些信息會(huì)大大增強(qiáng)用戶(hù)對(duì)搜索結(jié)果質(zhì)量的判斷力。
[0079]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以利用所述搜索關(guān)鍵詞的屬性這一維度,對(duì)所述搜索結(jié)果重新進(jìn)行組織,將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下。這樣,無(wú)疑使得搜索結(jié)果的輸出更加清晰、有條理,能夠有效提升用戶(hù)查找信息的效率。
[0080]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在104中,具體可以在搜索結(jié)果頁(yè)中的指定區(qū)域,輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。例如,在搜索結(jié)果頁(yè)的最上方,分別輸出搜索關(guān)鍵詞所對(duì)應(yīng)的兩個(gè)屬性及該兩個(gè)屬性下所聚類(lèi)的搜索結(jié)果。在搜索結(jié)果頁(yè)中除了指定區(qū)域之外的其他區(qū)域,可以按照現(xiàn)有的規(guī)則,依次輸出其他的搜索結(jié)果。
[0081]具體來(lái)說(shuō),輸出所述屬性,可以通過(guò)輸出一用以指示所述屬性的指示信息來(lái)實(shí)現(xiàn), 例如圖片或指定標(biāo)記,用以指示所述屬性。
[0082]本實(shí)施例中,通過(guò)根據(jù)所獲取的搜索關(guān)鍵詞,獲得搜索結(jié)果,進(jìn)而將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下,使得能夠輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶(hù)通過(guò)應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問(wèn)題,從而降低了搜索引擎的處理負(fù)擔(dān)。[〇〇83]另外,采用本發(fā)明所提供的技術(shù)方案,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠有效提高搜索的效率。
[0084]另外,采用本發(fā)明所提供的技術(shù)方案,通過(guò)輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,能夠使得搜索結(jié)果的展現(xiàn)效果具有重點(diǎn)突出且內(nèi)容清晰的特點(diǎn),從而有效地提升了用戶(hù)體驗(yàn)。[〇〇85]需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
[0086]在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
[0087]圖2為本發(fā)明另一實(shí)施例提供的搜索裝置的結(jié)構(gòu)示意圖,如圖2所示。本實(shí)施例的搜索裝置可以包括獲取單元21、處理單元22、聚類(lèi)單元23和輸出單元24。其中,獲取單元21, 用于獲取搜索關(guān)鍵詞;處理單元22,用于根據(jù)所述搜索關(guān)鍵詞,獲得搜索結(jié)果;聚類(lèi)單元23, 用于將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下;輸出單元24,用于輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。[〇〇88]需要說(shuō)明的是,本實(shí)施例所提供的搜索裝置的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開(kāi)發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的搜索引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對(duì)此不進(jìn)行特別限定。[〇〇89]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁(yè)程序(webApp),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0090]本發(fā)明中,所述屬性,可以包括但不限于觀點(diǎn)數(shù)據(jù)或者標(biāo)簽數(shù)據(jù),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0091]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述聚類(lèi)單元23,還可以進(jìn)一步用于獲得所述搜索關(guān)鍵詞的屬性。
[0092]在一個(gè)具體的實(shí)現(xiàn)過(guò)程中,所述聚類(lèi)單元23,具體可以用于根據(jù)所述搜索關(guān)鍵詞, 獲得所述搜索關(guān)鍵詞的屬性。
[0093]在另一個(gè)具體的實(shí)現(xiàn)過(guò)程中,所述聚類(lèi)單元23,具體可以用于根據(jù)所述搜索結(jié)果, 獲得所述搜索結(jié)果的關(guān)鍵信息,以作為所述搜索關(guān)鍵詞的屬性。
[0094]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述輸出單元24,具體可以用于在搜索結(jié)果頁(yè)中的指定區(qū)域,輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。[〇〇95]需要說(shuō)明的是,圖1對(duì)應(yīng)的實(shí)施例中方法,可以由本實(shí)施例提供的搜索裝置實(shí)現(xiàn)。 詳細(xì)描述可以參見(jiàn)圖1對(duì)應(yīng)的實(shí)施例中的相關(guān)內(nèi)容,此處不再贅述。
[0096]本實(shí)施例中,通過(guò)處理單元根據(jù)獲取單元所獲取的搜索關(guān)鍵詞,獲得搜索結(jié)果,進(jìn)而由聚類(lèi)單元將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下,使得輸出單元能夠輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶(hù)通過(guò)應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問(wèn)題,從而降低了搜索引擎的處理負(fù)擔(dān)。[〇〇97]另外,采用本發(fā)明所提供的技術(shù)方案,由于對(duì)搜索結(jié)果進(jìn)行了聚類(lèi),使得每個(gè)搜索結(jié)果之間不再是相互獨(dú)立,而是每個(gè)屬性所聚類(lèi)的每個(gè)搜索結(jié)果都表達(dá)了相同或相似的觀點(diǎn)或含義,能夠基本滿足用戶(hù)真正的搜索意圖,因此,能夠有效提高搜索的效率。
[0098]另外,采用本發(fā)明所提供的技術(shù)方案,通過(guò)輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果,能夠使得搜索結(jié)果的展現(xiàn)效果具有重點(diǎn)突出且內(nèi)容清晰的特點(diǎn),從而有效地提升了用戶(hù)體驗(yàn)。
[0099]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng), 裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
[0100]在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如,多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0101]所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
[0102]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0103]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)裝置(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(Read-Only Memory ,R0M)、隨機(jī)存取存儲(chǔ)器 (Random Access Memory ,RAM)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。[〇1〇4]最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換; 而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1.一種搜索方法,其特征在于,包括:獲取搜索關(guān)鍵詞;根據(jù)所述搜索關(guān)鍵詞,獲得搜索結(jié)果;將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下;輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述屬性包括觀點(diǎn)數(shù)據(jù)或者標(biāo)簽數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān) 鍵詞的屬性下之前,還包括:獲得所述搜索關(guān)鍵詞的屬性。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲得所述搜索關(guān)鍵詞的屬性,包括: 根據(jù)所述搜索關(guān)鍵詞,獲得所述搜索關(guān)鍵詞的屬性;或者根據(jù)所述搜索結(jié)果,獲得所述搜索結(jié)果的關(guān)鍵信息,以作為所述搜索關(guān)鍵詞的屬性。5.根據(jù)權(quán)利要求1?4任一權(quán)利要求所述的方法,其特征在于,所述輸出所述屬性和所 述屬性下所聚類(lèi)的搜索結(jié)果,包括:在搜索結(jié)果頁(yè)中的指定區(qū)域,輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。6.—種搜索裝置,其特征在于,包括:獲取單元,用于獲取搜索關(guān)鍵詞;處理單元,用于根據(jù)所述搜索關(guān)鍵詞,獲得搜索結(jié)果;聚類(lèi)單元,用于將所述搜索結(jié)果,聚類(lèi)到所述搜索關(guān)鍵詞的屬性下;輸出單元,用于輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述屬性包括觀點(diǎn)數(shù)據(jù)或者標(biāo)簽數(shù)據(jù)。8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述聚類(lèi)單元,還用于 獲得所述搜索關(guān)鍵詞的屬性。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述聚類(lèi)單元,具體用于 根據(jù)所述搜索關(guān)鍵詞,獲得所述搜索關(guān)鍵詞的屬性;或者根據(jù)所述搜索結(jié)果,獲得所述搜索結(jié)果的關(guān)鍵信息,以作為所述搜索關(guān)鍵詞的屬性。10.根據(jù)權(quán)利要求6?9任一權(quán)利要求所述的裝置,其特征在于,所述輸出單元,具體用 于在搜索結(jié)果頁(yè)中的指定區(qū)域,輸出所述屬性和所述屬性下所聚類(lèi)的搜索結(jié)果。
【文檔編號(hào)】G06F17/30GK105956181SQ201610373492
【公開(kāi)日】2016年9月21日
【申請(qǐng)日】2016年5月31日
【發(fā)明人】馬艷軍, 李興建, 張偉萌, 費(fèi)曉旭, 韋豪杰
【申請(qǐng)人】北京百度網(wǎng)訊科技有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1