亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種搜索方法和裝置的制作方法

文檔序號:6443145閱讀:209來源:國知局
專利名稱:一種搜索方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機應(yīng)用技術(shù)領(lǐng)域,更具體的說是涉及一種搜索方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)中可提供給用戶的信息越來越龐大,各種搜索引擎應(yīng)運而生,用戶通過輸入查詢詞進行檢索,搜索引擎即可從索引數(shù)據(jù)庫中匹配該查詢詞的搜索信息并輸出。但是由于互聯(lián)網(wǎng)中充斥著大量信息,搜索引擎輸出的搜索信息大多類目繁雜,分類不明確,用戶通常需要自己從輸出的大量搜索信息中進行篩選,查找需要的信息內(nèi)容,特別是在用戶希望查詢某一領(lǐng)域的信息內(nèi)容時,由于搜索引擎輸出的信息無明確分類,用戶需要從搜索結(jié)果中逐一篩選,或者增加查詢詞匯反復(fù)搜索,因此需要耗費大量時間,從而導(dǎo)致搜索效率較低。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種搜索方法和裝置,用以解決現(xiàn)有的搜索方法導(dǎo)致搜索效率較低的技術(shù)問題。為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案一種搜索方法,該方法包括接收查詢信息,所述查詢信息包括至少一個查詢關(guān)鍵詞;在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息;依據(jù)所述查詢信息和第一擴展信息調(diào)用第三方搜索引擎進行搜索;獲取并輸出所述搜索結(jié)果;確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。優(yōu)選地,所述確定與所述查詢信息相關(guān)的第一擴展信息包括計算查詢信息與所述不同擴展信息的相關(guān)度值;確定相關(guān)度值大于第一閾值的擴展信息作為第一擴展信息。優(yōu)選地,所述確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息包括提取所述搜索結(jié)果中的搜索詞;分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值;確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。優(yōu)選地,所述獲取并輸出所述搜索結(jié)果包括獲取網(wǎng)絡(luò)爬蟲抓取的搜索結(jié)果,所述搜索結(jié)果為所述網(wǎng)絡(luò)爬蟲從抓取的初步搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第三匹配信息后,從所述初步搜索結(jié)果中確定的包含該第二匹配信息的搜索結(jié)果;將所述搜索結(jié)果輸出。優(yōu)選地,所述分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值包括統(tǒng)計相同的搜索詞在所述搜索結(jié)果中的出現(xiàn)次數(shù);按照出現(xiàn)次數(shù)的多少,計算搜索詞分別與查詢信息和第一擴展信息的相關(guān)度值。優(yōu)選地,所述查詢信息還包括類目信息,則所述在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息具體為在對應(yīng)所述類目信息的預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息。優(yōu)選地,所述確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息具體為確定用戶所選擇的目標(biāo)搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息。一種搜索裝置,該裝置包括接收模塊,用于接收用戶的查詢信息,所述查詢信息包括至少一個關(guān)鍵詞;擴展模塊,用于在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息;搜索模塊,用于依據(jù)所述查詢信息和相關(guān)信息調(diào)用第三方搜索引擎進行搜索;獲取模塊,用于獲取并輸出所述搜索結(jié)果;確定模塊,用于確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。優(yōu)選地,所述擴展模塊包括第一計算模塊,用于計算查詢信息與所述不同擴展信息的相關(guān)度值;擴展子模塊,用于確定相關(guān)度值大于第一閾值的擴展信息作為第一擴展信息。優(yōu)選地,所述確定模塊包括提取模塊,用于提取所述搜索結(jié)果中的搜索詞;第二計算模塊,用于分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值;確定子模塊,用于確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明提供了一種搜索方法和裝置, 通過接收查詢信息,在預(yù)設(shè)知識庫中確定與查詢信息相關(guān)的第一擴展信息,并根據(jù)該查詢信息和第一擴展信息再調(diào)用第三方搜索引擎進行搜索,然后獲取所述搜索結(jié)果并輸出,由于通過增加預(yù)設(shè)知識庫對查詢信息進行了擴展,且預(yù)設(shè)知識庫包括根據(jù)每一搜索結(jié)果提取出的第一匹配信息,因此對查詢信息進行的擴展是符合用戶意圖的,使得輸出的搜索結(jié)果更精確,也就減少了搜索操作,提高了搜索效率。而由于提高了搜索效率,使得用戶無需反復(fù)查找或者重復(fù)搜索,因此也就減小的系統(tǒng)的運算量,進而提高了系統(tǒng)性能。


為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。圖1為本發(fā)明一種搜索方法實施例1的流程圖;圖2為本發(fā)明一種搜索方法實施例2的流程圖;圖3為本發(fā)明一種搜索裝置實施例1的結(jié)構(gòu)示意圖;圖4為本發(fā)明一種搜索方法實施例2的結(jié)構(gòu)示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明的主要思想之一可以包括接收查詢信息,并在預(yù)設(shè)知識庫中確定與查詢信息相關(guān)的第一擴展信息,然后根據(jù)該查詢信息和第一擴展信息調(diào)用第三方搜索引擎進行搜索,獲取所述搜索結(jié)果并輸出,由于對查詢信息進行了擴展,且預(yù)設(shè)知識庫包括根據(jù)每一次搜索結(jié)果提取出的第一匹配信息,因此對查詢信息進行的擴展是符合用戶意圖的,使得輸出的搜索結(jié)果更精確,也就減少了搜索操作,提高了搜索效率。而由于提高了搜索效率, 使得用戶無需反復(fù)查找或者重復(fù)搜索,因此也就減小的系統(tǒng)的運算量,進而提高了系統(tǒng)性能。參見圖1,示出了本發(fā)明一種搜索方法實施例1的流程圖,該方法可以包括步驟101 接收查詢信息,所述查詢信息包括至少一個關(guān)鍵詞。所述查詢信息可以包括用戶通過操作界面輸入的查詢信息,其可以包括一個或者多個查詢關(guān)鍵詞。步驟102 在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息。所述預(yù)設(shè)知識庫是指對應(yīng)某一類型,或者某一領(lǐng)域的知識庫,例如關(guān)于旅游的知識庫,關(guān)于體彩的知識庫等,關(guān)于電子技術(shù)的知識庫。其包括不同的擴展信息,可以是指詞匯和/或多個詞匯形成的詞匯集。系統(tǒng)預(yù)設(shè)的知識庫可以包括多個,對應(yīng)不同類型或者不同領(lǐng)域。因此所述的查詢信息還包括類目信息,每一類目對應(yīng)一個知識庫,則可以根據(jù)該類目信息查找到對應(yīng)的知識庫,并在該知識庫中查找匹配的擴展信息,即得到第一擴展信息。查詢信息包括至少一個關(guān)鍵詞,而擴展信息可以是指詞匯或者由多個詞匯形成的詞匯集,確定與查詢信息相關(guān)的第一擴展信息,可以是通過計算不同擴展信息與查詢信息的相關(guān)度值,并將相關(guān)度值大于第一閾值的擴展信息作為第一擴展信息。計算擴展信息與查詢信息的相關(guān)度值可以采用多種方式,例如一種方式可以采用語義網(wǎng)技術(shù)賦值,例如查詢信息只包括一個關(guān)鍵詞,擴展信息為擴展詞匯,則利用語義網(wǎng)絡(luò)為關(guān)鍵詞與擴展詞匯賦予語義相關(guān)度值。語義網(wǎng)技術(shù)通??梢允侵咐弥W(wǎng)等知識源提供的分類體系,來計算詞語之間的語義相關(guān)度值。所述知網(wǎng)是指以詞語所代表概念為描述對象,揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識知識庫。例如查詢信息為“醫(yī)生”,則通過語義網(wǎng)賦值可以確定“醫(yī)院” “患者”與“醫(yī)生”的相關(guān)度較高,而“銀行”與“醫(yī)生”相關(guān)度較低,醫(yī)院、患者、銀行與醫(yī)生的相關(guān)度值可以分別為0.8、0. 8、 0. 1 等。所述的第一閾值可以是根據(jù)實際情況來設(shè)定,例如設(shè)定該閾值為0.5。也可以根據(jù)需要選擇的擴展信息個數(shù)來確定,具體是確定相關(guān)度值從大到小的順序,按照該順序確定第N個相關(guān)度值為第一閾值,則可以確定出N個第一擴展信息,該N值即為需要選擇的擴展信息個數(shù)。另一種方式可以是根據(jù)用戶的選擇來確定擴展信息和查詢信息的相關(guān)度,接收到用戶的查詢信息后,可以在顯示界面呈現(xiàn)擴展信息,由用戶為不同擴展信息賦值。當(dāng)然計算相關(guān)度值還可以采用其他相關(guān)度算法,例如采用參數(shù)估計、概率統(tǒng)計、特征獲取等學(xué)習(xí)模型計算詞語之間的相關(guān)度值。當(dāng)查詢信息包括多個關(guān)鍵詞時,是分別計算每一關(guān)鍵詞與擴展信息的相關(guān)度值, 然后在按照相關(guān)度值大小進行篩選。其中所述的預(yù)設(shè)知識庫在初始查詢時可以為空,即可以不包括擴展信息。步驟103 依據(jù)所述查詢信息和第一擴展信息調(diào)用第三方搜索引擎進行搜索。將查詢信息以及與其相關(guān)的第一擴展信息,例如用戶的查詢信息為“廣州”,而該預(yù)設(shè)知識庫為旅游知識庫,則所述第一擴展信息可能包括“景點”、“酒店”、“旅游路線”等詞匯或者詞匯集,則可以將“廣州”、“景點”、“酒店”、“旅游路線”作為新的搜索關(guān)鍵詞,通過調(diào)用第三方搜索引擎進行搜索。由于對用戶的查詢信息進行了擴展,因此在通過第三方搜索引擎搜索的結(jié)果更符合用戶的查詢意圖。步驟104 獲取并輸出所述搜索結(jié)果。獲取第三搜索引擎的搜索結(jié)果,可以通過與第三方搜索引擎的相應(yīng)的接口來獲取,也可以通過網(wǎng)絡(luò)爬蟲抓取搜索結(jié)果。網(wǎng)絡(luò)爬蟲是指一種按照一定的規(guī)則,自動的抓取萬維網(wǎng)信息的程序或者腳本。步驟105 確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。將搜索結(jié)果輸出后,還需要對獲取的搜索結(jié)果進行分析,該搜索結(jié)果由于是獲取的不同網(wǎng)頁的信息內(nèi)容,從該信息內(nèi)容中確定與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,所述第一匹配信息可以是指詞匯或者詞匯集,則將該匹配信息作為擴展信息加入所述預(yù)設(shè)知識庫中。從搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息可以具體包括 首先,提取搜索結(jié)果中的搜索詞。由于搜索結(jié)果包含多條信息內(nèi)容,每一條信息內(nèi)容對應(yīng)不同的網(wǎng)頁內(nèi)容。提取搜索詞即是將信息內(nèi)容進行分詞,然后去除掉停用詞后,即可得到搜索詞。分詞是指就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。停用詞是指一些沒有實際含義的功能詞,例如“的” “一些” “則”等詞。然后分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值,并確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。
計算搜索詞分別與查詢信息和第一擴展信息的相關(guān)度值也可以采用多種方式,一種方式可以采用上文所述的語義網(wǎng)賦值方式。另一種方式可以根據(jù)相同的搜索詞在所述搜索結(jié)果中出現(xiàn)的次數(shù)來確定,具體的,首先統(tǒng)計相同的搜索詞在所述搜索結(jié)果中出現(xiàn)的次數(shù),例如“白云山”在多條信息內(nèi)容中均出現(xiàn),則可認(rèn)為其與查詢信息和第一擴展信息最相關(guān)。之后按照出現(xiàn)次數(shù)從多到少的順序,確定搜索詞與查詢信息和第一擴展信息的相關(guān)度值,每一搜索詞具體賦值多少可以采用多種方式,例如根據(jù)次數(shù)多少的比例關(guān)系等,只需滿足出現(xiàn)次數(shù)較多的搜索詞其相關(guān)度值較高即可。又一種可能方式也可以采用人工賦值的方式,從搜索詞中選擇符合該預(yù)設(shè)知識庫類型的詞,則相應(yīng)所選擇的搜索詞即相關(guān)度值較高,而其他未選擇的搜搜索詞則相關(guān)度較低。又一種可能方式,可以首先按照語義網(wǎng)賦值或者搜索詞出現(xiàn)的次數(shù)多少進行相關(guān)度賦值,然后再根據(jù)人工選擇的搜索詞,而增加其對應(yīng)的相關(guān)度值。所述的第二閾值可以根據(jù)實際情況而確定,也可以是根據(jù)需要選擇的搜索詞個數(shù)來確定。本發(fā)明實施例所述的預(yù)設(shè)知識庫是由根據(jù)搜索結(jié)果的信息內(nèi)容所提取的第一匹配信息而形成的,由于該第一匹配信息與查詢信息和第一擴展信息相關(guān)。因此預(yù)設(shè)知識庫所包含的擴展信息,包括第一匹配信息形成的擴展信息,是符合用戶查詢意圖,且該預(yù)設(shè)知識庫在每次查詢后都可能增加新的屬于該知識庫類型的查詢信息,因此使得在每次進行查詢時,第一擴展信息將更符合用戶的查詢意圖,從而使得最終輸出的搜索結(jié)果為符合用戶查詢意圖的搜索結(jié)果,因此無需用戶在重新進行查找或者反復(fù)搜索,提高了搜索速率。在本實施中,通過接收查詢信息,并在預(yù)設(shè)知識庫中確定查詢信息相關(guān)的第一擴展信息,并根據(jù)該查詢信息和第一擴展信息再調(diào)用第三方搜索引擎進行搜索,然后獲取所述搜索結(jié)果并輸出,由于對查詢信息進行了擴展,且預(yù)設(shè)知識庫包括根據(jù)每一搜索結(jié)果提取的匹配信息,因此對查詢信息進行的擴展是符合用戶意圖的,使得輸出的搜索結(jié)果更精確,也就減少了搜索操作,提高了搜索效率。而由于提高了搜索效率,使得用戶無需反復(fù)查找或者重復(fù)搜索,因此減小的系統(tǒng)的運算量,進行提高了系統(tǒng)性能。參見圖2,示出了本發(fā)明一種搜索方法實施例2的流程圖,該方法可以包括步驟201 接收查詢信息,所述查詢信息包括至少一個查詢關(guān)鍵詞和類目信息。所述查詢關(guān)鍵詞是指用戶輸入的關(guān)鍵詞,可以包括一個或多個。所述類目信息是用于表示不同的類型或不同領(lǐng)域的詞匯或詞匯集,例如“旅游”、“體彩”、“電子”等,該類目信息可以通過顯示界面進行顯示,用戶點擊即可選擇。不同的類目信息對應(yīng)不同的知識庫。步驟202 在對應(yīng)該類目信息的預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息。根據(jù)類目信息,選擇對應(yīng)的預(yù)設(shè)知識庫,該預(yù)設(shè)知識庫中包含對應(yīng)某一類型、或者某一領(lǐng)域的擴展信息。該預(yù)設(shè)知識庫初始使用時可以為空,也可以包括預(yù)設(shè)的擴展信息。確定與所述查詢信息相關(guān)的第一擴展信息具體過程可以參件上述方法實施例1 中所述。由于查詢信息包括類目信息和關(guān)鍵詞,該類目信息也即為詞匯,因此在計算查詢信息和不同擴展信息的相關(guān)度值時,需要計算關(guān)鍵詞和類目信息的詞匯分別與不同擴展信息的相關(guān)度值,類目信息的詞匯也即作為查詢關(guān)鍵詞。步驟203 依據(jù)所述查詢信息和第一擴展信息調(diào)用第三方搜索引擎進行搜索。也即將查詢信息和第一擴展信息作為搜索關(guān)鍵詞發(fā)送至第三方搜索引擎,由第三方搜索引擎進行搜索。本發(fā)明實施例是借助第三方搜索引擎進行搜索,可以精確搜索關(guān)鍵詞,因此能夠?qū)崿F(xiàn)針對某一類型,或者某一領(lǐng)域的搜索。例如在“電子”領(lǐng)域中,如果用戶直接通過第三方搜索引擎進行搜索,例如查詢關(guān)鍵詞“手機”,則得到的搜索內(nèi)容信息量很多,且類目繁雜, 而實際用戶是想要搜索手機的元器件,或者手機的功能類型等,而采用本發(fā)明實施例所述的方法,首先會將查詢關(guān)鍵詞“手機”進行擴展,由于是在預(yù)設(shè)的對應(yīng)某一類型或者某一領(lǐng)域的知識庫中進行查找,因此匹配的第一擴展信息包括“功能” “器件”等擴展詞,因此在調(diào)用第三方搜索引擎進行搜索時,即可得到更為精確并符合用戶查詢意圖的搜索內(nèi)容。步驟204 獲取網(wǎng)絡(luò)爬蟲抓取的搜索結(jié)果并輸出。其中,所述搜索結(jié)果為所述網(wǎng)絡(luò)爬蟲從抓取的初步搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第三匹配信息后,從所述初步搜索結(jié)果中確定的包含該第二匹配信息的初步搜索結(jié)果。第三方搜索引擎根據(jù)查詢信息和第一擴展信息進行搜索后,會得到初步搜索結(jié)果,包括對應(yīng)不同網(wǎng)頁內(nèi)容的信息內(nèi)容。系統(tǒng)需要獲取信息內(nèi)容并輸出,具體可以通過網(wǎng)絡(luò)爬蟲來抓取。網(wǎng)絡(luò)爬蟲在抓取搜索結(jié)果時可以進行初步篩選。具體過程可以為首先將從抓取的初步搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第二匹配信息,其包括提取所述搜索內(nèi)容中的初步搜索詞。分別計算初步搜索詞與查詢信息和第一擴展信息的相關(guān)度值。確定相關(guān)度值大于第三閾值的初步搜索詞作為第二匹配信息。然后將包含該第二匹配信息的初步搜索結(jié)果作為搜索結(jié)果。由于第三搜索引擎的初步搜索結(jié)果是包括根據(jù)查詢信息和第一擴展信息確定的詞或者字段的所有信息內(nèi)容。因此網(wǎng)絡(luò)爬蟲先進行初步篩選,從初步搜索結(jié)果中確定出包含該第二匹配信息的初步搜索結(jié)果,作為搜索結(jié)果傳輸給系統(tǒng),系統(tǒng)在輸出該搜索結(jié)果,因此進一步的精確了查詢內(nèi)容。步驟205 確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。其中具體的可以是確定用戶所選擇的目標(biāo)搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,將第一匹配信息作為擴展信息加入所述預(yù)設(shè)知識庫中。用戶所選擇的目標(biāo)搜索結(jié)果是根據(jù)用戶的點擊信息而確定的,獲取的搜索結(jié)果輸出后在顯示界面顯示,呈現(xiàn)給用戶的顯示信息是由不同鏈接或網(wǎng)頁標(biāo)題或者部分內(nèi)容摘要形成的記錄,用戶通過點擊記錄獲取搜索內(nèi)容,根據(jù)用戶所選擇的記錄可以認(rèn)為該記錄對應(yīng)的搜索結(jié)果為符合用戶查詢意圖的搜索結(jié)果,即可確定該搜索結(jié)果為目標(biāo)搜索結(jié)果,然后根據(jù)該目標(biāo)搜索結(jié)果的信息內(nèi)容,確定與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,并作為擴展信息加入所述預(yù)設(shè)知識庫中。根據(jù)信息內(nèi)容,確定與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息的具體過程可以參加方法實施例1中所述,在此不再贅述。在本實施例中,預(yù)設(shè)知識庫可以包括多個,用戶可以根據(jù)自己的查詢意圖選擇相應(yīng)的類目信息進而確定進行查詢信息擴展的預(yù)設(shè)知識庫,在該預(yù)設(shè)知識庫中對查詢信息進行擴展,即確定與查詢信息相關(guān)的第一擴展信息,并依據(jù)該查詢信息和第一擴展信息調(diào)用第三搜索引擎搜索,將獲取的搜索結(jié)果輸出,并根據(jù)用戶選擇的目標(biāo)搜索結(jié)果確定第一匹配信息,作為擴展信息,從而使得該擴展信息在當(dāng)前類型或領(lǐng)域中是更為符合用戶意圖的擴展信息,因此可以使得后續(xù)搜索更為精確,輸出結(jié)果也更為符合用戶意圖,因此可以提高搜索效率。而由于提高了搜索效率,使得用戶無需反復(fù)查找或者重復(fù)搜索,因此也就減小的系統(tǒng)的運算量,進而提高了系統(tǒng)性能。與上述本申請一種搜索方法實施例1所提供的方法相對應(yīng),參見圖3,本申請還提供了一種搜索裝置實施例1,在本實施例中,該裝置可以包括接收模塊301,用于接收用戶的查詢信息,所述查詢信息包括至少一個關(guān)鍵詞。所述查詢信息可以包括用戶通過操作界面輸入的查詢信息,其可以包括一個或者多個查詢關(guān)鍵詞。擴展模塊302,用于在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息。查詢信息包括至少一個關(guān)鍵詞,而擴展信息可以是指詞匯或者由多個詞匯形成的詞匯集,確定與查詢信息相關(guān)的第一擴展信息,可以是通過計算不同擴展信息與查詢信息的相關(guān)度值,并將相關(guān)度值大于第一閾值的擴展信息作為第一擴展信息。因此,所述擴展模塊302可以包括第一計算模塊3021,用于計算查詢信息與所述不同擴展信息的相關(guān)度值。計算擴展信息與查詢信息的相關(guān)度值可以采用多種方式,相關(guān)度的計算可以具體參見方法實施例中所述。擴展子模塊3022,用于確定相關(guān)度值大于第一閾值的擴展信息作為第一擴展信肩、ο搜索模塊303,用于依據(jù)所述查詢信息和相關(guān)信息調(diào)用第三方搜索引擎進行搜索;獲取模塊304,用于獲取并輸出所述搜索結(jié)果。獲取第三搜索引擎的搜索結(jié)果,可以通過與第三方搜索引擎的相應(yīng)的接口來獲取,也可以通過網(wǎng)絡(luò)爬蟲爬取搜索結(jié)果。網(wǎng)絡(luò)爬蟲是指一種按照一定的規(guī)則,自動的抓取萬維網(wǎng)信息的程序或者腳本。確定模塊305,用于確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。將搜索結(jié)果輸出后,還需要對獲取的搜索結(jié)果進行分析,該搜索結(jié)果由于是獲取的不同網(wǎng)頁的信息內(nèi)容,從該信息內(nèi)容中確定與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,所述第一匹配信息可以是指詞匯或者詞匯集,則將該匹配信息作為擴展信息加入所述預(yù)設(shè)知識庫中。其中,所述確定模塊305可以具體包括提取模塊3051,用于提取所述搜索結(jié)果中的搜索詞。
由于搜索結(jié)果包含多條信息內(nèi)容,每一條信息內(nèi)容對應(yīng)不同的網(wǎng)頁內(nèi)容。所述提取模塊具體是首先是將信息內(nèi)容進行分詞,然后去除掉停用詞后,得到搜索詞。第二計算模塊3052,用于分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值。計算搜索詞分別與查詢信息和第一擴展信息的相關(guān)度值也可以采用多種方式,一種方式可以采用所述的語義網(wǎng)賦值方式。另一種方式可以根據(jù)相同的搜索詞在所述搜索結(jié)果中出現(xiàn)的次數(shù)來確定。因此所述第二計算模塊3052還可以包括統(tǒng)計模塊30521,用于統(tǒng)計相同的搜索詞在所述搜索結(jié)果中出現(xiàn)的次數(shù)。第二計算子模塊30522,用于按照出現(xiàn)次數(shù)從多到少的順序,計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值。每一搜索詞具體賦值多少可以采用多種方式,例如根據(jù)次數(shù)多少的比例關(guān)系等,只需滿足出現(xiàn)次數(shù)較多的搜索詞其相關(guān)度值較高即可。又一種可能方式也可以采用人工賦值的方式。又一種可能方式,可以首先按照語義網(wǎng)賦值或者搜索詞出現(xiàn)的次數(shù)多少進行相關(guān)度賦值,然后再根據(jù)人工選擇的搜索詞,而增加其對應(yīng)的相關(guān)度值。確定子模塊3053,用于確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。在本實施中,所述搜索裝置接收查詢信息后,在預(yù)設(shè)知識庫中確定查詢信息相關(guān)的第一擴展信息,并根據(jù)該查詢信息和第一擴展信息再調(diào)用第三方搜索引擎進行搜索,然后獲取所述搜索結(jié)果并輸出,由于對查詢信息進行了擴展,且預(yù)設(shè)知識庫包括根據(jù)每一搜索結(jié)果提取的匹配信息,因此對查詢信息進行的擴展是符合用戶意圖的,使得輸出的搜索結(jié)果更精確,也就減少了搜索操作,提高了搜索效率。而由于提高了搜索效率,使得用戶無需反復(fù)查找或者重復(fù)搜索,因此減小的系統(tǒng)的運算量,進而提高了系統(tǒng)性能。本實施例所述的裝置可以集成到服務(wù)器上,也可以單獨作為一個實體與服務(wù)器相連。另外,需要說明的是,當(dāng)本申請所述的方法采用軟件實現(xiàn)時,可以作為搜索引擎的服務(wù)器新增的一個功能,也可以單獨編寫相應(yīng)的程序,本申請不限定所述方法或裝置的實現(xiàn)方式。在實際應(yīng)用中,本實施例所述的搜索裝置可以集成在用于在某一領(lǐng)域搜索的搜索引擎服務(wù)器中,該搜索引擎服務(wù)器還包括預(yù)設(shè)知識庫。也即形成用于專門搜索某一領(lǐng)域的專業(yè)搜索引擎,其通過對查詢信息進行擴展,再調(diào)用第三搜索引擎進行搜索,將獲取的搜索結(jié)果輸出給用戶。通過所述的專業(yè)搜索引擎可以得到精確的搜索結(jié)果,提高了搜索效率,減小服務(wù)器的運算量,因此可以提高服務(wù)器的性能,且搜索過程是通過人機交互系統(tǒng)進行的, 由于用戶無需反復(fù)查找和重復(fù)搜索,因此也提高計算機的性能。與上述本申請一種搜索方法實施例2所提供的方法相對應(yīng),參見圖4,本申請還提供了一種搜索裝置實施例2,在本實施例中,該裝置可以包括接收模塊401,用于接收用戶的查詢信息,所述查詢信息包括至少一個查詢關(guān)鍵詞和類目信息。所述查詢關(guān)鍵詞是指用戶輸入的關(guān)鍵詞,可以包括一個或多個。所述類目信息是用于表示不同的類型或不同領(lǐng)域的詞匯或詞匯集,例如“旅游”、“體彩”、“電子”等,該類目信息可以通過顯示界面進行顯示,用戶點擊即可選擇。不同的類目信息對應(yīng)不同的知識庫。
擴展模塊402,用于在對應(yīng)所述類目信息的預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息。根據(jù)類目信息,選擇對應(yīng)的預(yù)設(shè)知識庫,該預(yù)設(shè)知識庫中包含對應(yīng)某一類型、或者某一領(lǐng)域的擴展信息。該預(yù)設(shè)知識庫初始使用時可以為空,也可以包括預(yù)設(shè)的擴展信息。其中該擴展模塊402可以具體包括第一計算模塊4021,用于計算查詢信息與所述不同擴展信息的相關(guān)度值。擴展子模塊4022,用于確定相關(guān)度值大于第一閾值的擴展信息作為第一擴展信肩、ο搜索模塊403,用于依據(jù)所述查詢信息和相關(guān)信息調(diào)用第三方搜索引擎進行搜索。本發(fā)明實施例是借助第三方搜索引擎進行搜索,可以精確搜索關(guān)鍵詞,因此能夠?qū)崿F(xiàn)針對某一類型,或者某一領(lǐng)域的搜索。例如在“電子”領(lǐng)域中,如果用戶直接通過第三方搜索引擎進行搜索,例如查詢關(guān)鍵詞“手機”,則得到的搜索內(nèi)容信息量很多,且類目繁雜, 而實際用戶是想要搜索手機的元器件,或者手機的功能類型等,而采用本發(fā)明實施例所述的方法,首先會將查詢關(guān)鍵詞“手機”進行擴展,由于是在預(yù)設(shè)的對應(yīng)某一類型或者某一領(lǐng)域的知識庫中進行查找,因此匹配的第一擴展信息包括“功能” “器件”等擴展詞,因此在調(diào)用第三方搜索引擎進行搜索時,即可得到更為精確并符合用戶查詢意圖的搜索內(nèi)容。獲取模塊404,用于獲取網(wǎng)絡(luò)爬蟲抓取的搜索結(jié)果。所述網(wǎng)絡(luò)爬蟲首先抓取的初步搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第二匹配信息后,然后將包含該第二匹配信息的初步搜索結(jié)果作為搜索結(jié)果。第三方搜索引擎根據(jù)查詢信息和第一擴展信息進行搜索后,會得到初步搜索結(jié)果,包括對應(yīng)不同網(wǎng)頁內(nèi)容的信息內(nèi)容。系統(tǒng)需要獲取信息內(nèi)容并輸出,具體可以通過網(wǎng)絡(luò)爬蟲來抓取。網(wǎng)絡(luò)爬蟲在抓取搜索結(jié)果時可以進行初步篩選。具體過程可以為首先將從抓取的初步搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第二匹配信息,其包括提取所述搜索內(nèi)容中的初步搜索詞。分別計算初步搜索詞與查詢信息和第一擴展信息的相關(guān)度值。確定相關(guān)度值大于第三閾值的初步搜索詞作為第二匹配信息。然后將包含該第二匹配信息的初步搜索結(jié)果作為搜索結(jié)果。由于第三搜索引擎的初步搜索結(jié)果是包括根據(jù)查詢信息和第一擴展信息確定的詞或者字段的所有信息內(nèi)容。因此網(wǎng)絡(luò)爬蟲先進行初步篩選,從初步搜索結(jié)果中確定出包含該第二匹配信息的初步搜索結(jié)果,作為搜索結(jié)果傳輸給系統(tǒng),系統(tǒng)在輸出該搜索結(jié)果,因此進一步的精確了查詢內(nèi)容。確定模塊405,用于確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。其中,所述確定模塊具體是確定用戶所選擇的目標(biāo)搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配用戶所選擇的搜索結(jié)果是根據(jù)用戶的點擊信息而確定的。獲取的搜索結(jié)果輸出后在顯示界面顯示,而呈現(xiàn)給用戶的顯示信息是由不同鏈接或網(wǎng)頁標(biāo)題或者部分內(nèi)容摘要形成的記錄,用戶通過點擊記錄獲取搜索內(nèi)容,根據(jù)用戶所選擇的記錄可以認(rèn)為該條記錄對應(yīng)的搜索結(jié)果為符合用戶查詢意圖的搜索結(jié)果,則可確定該搜索結(jié)果為目標(biāo)搜索結(jié)果。然后可以根據(jù)該目標(biāo)搜索結(jié)果的信息內(nèi)容,確定與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,并作為擴展信息加入所述預(yù)設(shè)知識庫中。其中,所述確定模塊405可以具體包括提取模塊4051,用于提取所述搜索結(jié)果中的搜索詞。第二計算模塊4052,用于分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值。確定子模塊4053,用于確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。在本實施例中,預(yù)設(shè)知識庫可以包括多個,用戶可以根據(jù)自己的查詢意圖選擇相應(yīng)的類目信息進而確定進行查詢信息擴展的預(yù)設(shè)知識庫,在該預(yù)設(shè)知識庫中對查詢信息進行擴展,即確定與查詢信息相關(guān)的第一擴展信息,并依據(jù)該查詢信息和第一擴展信息調(diào)用第三搜索引擎搜索,將獲取的搜索結(jié)果輸出,并根據(jù)用戶選擇的搜索結(jié)果確定第一匹配信息,作為擴展信息,從而使得該擴展信息在當(dāng)前類型或領(lǐng)域中是更為符合用戶意圖的擴展信息,因此可以使得后續(xù)搜索更為精確,輸出結(jié)果也更為符合用戶意圖,因此可以提高搜索效率。而由于提高了搜索效率,使得用戶無需反復(fù)查找或者重復(fù)搜索,因此也就減小的系統(tǒng)的運算量,進行提高了系統(tǒng)性能。在實際應(yīng)用中,本實施例所述的搜索裝置可以集成到專業(yè)的搜索引擎服務(wù)器中, 該搜索引擎服務(wù)器可以包括多個不同類型或者不同領(lǐng)域的預(yù)設(shè)知識庫,該專業(yè)搜索引擎可以實現(xiàn)多個專業(yè)領(lǐng)域的信息的搜索,從而可以使得搜索結(jié)果符合用戶意圖,更精確。本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當(dāng)然,在實施本發(fā)明可以把各單元的功能在同一個或多個軟件和/或硬件中實現(xiàn)。通過以上的實施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備 (可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。
13對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
權(quán)利要求
1.一種搜索方法,其特征在于,該方法包括接收查詢信息,所述查詢信息包括至少一個查詢關(guān)鍵詞;在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息;依據(jù)所述查詢信息和第一擴展信息調(diào)用第三方搜索引擎進行搜索; 獲取并輸出所述搜索結(jié)果;確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定與所述查詢信息相關(guān)的第一擴展信息包括計算查詢信息與所述不同擴展信息的相關(guān)度值; 確定相關(guān)度值大于第一閾值的擴展信息作為第一擴展信息。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息包括提取所述搜索結(jié)果中的搜索詞;分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值; 確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取并輸出所述搜索結(jié)果包括獲取網(wǎng)絡(luò)爬蟲抓取的搜索結(jié)果,所述搜索結(jié)果為所述網(wǎng)絡(luò)爬蟲從抓取的初步搜索結(jié)果中確定與所述查詢信息和第一擴展信息相關(guān)的第三匹配信息后,從所述初步搜索結(jié)果中確定的包含該第二匹配信息的搜索結(jié)果; 將所述搜索結(jié)果輸出。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值包括統(tǒng)計相同的搜索詞在所述搜索結(jié)果中的出現(xiàn)次數(shù);按照出現(xiàn)次數(shù)的多少,計算搜索詞分別與查詢信息和第一擴展信息的相關(guān)度值。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述查詢信息還包括類目信息,則所述在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息具體為在對應(yīng)所述類目信息的預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息具體為確定用戶所選擇的目標(biāo)搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配 fn息ο
8.一種搜索裝置,其特征在于,該裝置包括接收模塊,用于接收用戶的查詢信息,所述查詢信息包括至少一個關(guān)鍵詞; 擴展模塊,用于在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息;搜索模塊,用于依據(jù)所述查詢信息和相關(guān)信息調(diào)用第三方搜索引擎進行搜索; 獲取模塊,用于獲取并輸出所述搜索結(jié)果;確定模塊,用于確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。
9.根據(jù)權(quán)利要求1所述的搜索裝置,其特征在于,所述擴展模塊包括 第一計算模塊,用于計算查詢信息與所述不同擴展信息的相關(guān)度值;擴展子模塊,用于確定相關(guān)度值大于第一閾值的擴展信息作為第一擴展信息。
10.根據(jù)權(quán)利要求1所述的搜索裝置,其特征在于,所述確定模塊包括 提取模塊,用于提取所述搜索結(jié)果中的搜索詞;第二計算模塊,用于分別計算搜索詞與查詢信息和第一擴展信息的相關(guān)度值; 確定子模塊,用于確定相關(guān)度值大于第二閾值的搜索詞作為第一匹配信息。
全文摘要
本發(fā)明提供了一種搜索方法和裝置,所述方法包括接收查詢信息,所述查詢信息包括至少一個查詢關(guān)鍵詞;在預(yù)設(shè)知識庫中確定與所述查詢信息相關(guān)的第一擴展信息,所述預(yù)設(shè)知識庫包括不同的擴展信息;依據(jù)所述查詢信息和第一擴展信息調(diào)用第三方搜索引擎進行搜索;獲取并輸出所述搜索結(jié)果;確定所述搜索結(jié)果中與所述查詢信息和第一擴展信息相關(guān)的第一匹配信息,作為擴展信息加入所述預(yù)設(shè)知識庫中。通過本發(fā)明實施例可以提高搜索效率,且使得搜索結(jié)果更精確。
文檔編號G06F17/30GK102402619SQ20111044033
公開日2012年4月4日 申請日期2011年12月23日 優(yōu)先權(quán)日2011年12月23日
發(fā)明者曾相宗 申請人:廣東威創(chuàng)視訊科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1