亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種信息搜索系統(tǒng)和方法

文檔序號:6607892閱讀:166來源:國知局
專利名稱:一種信息搜索系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)通信技術(shù),特別涉及一種信息搜索系統(tǒng)和方法。
背景技術(shù)
隨著網(wǎng)絡(luò)應(yīng)用的不斷發(fā)展,網(wǎng)絡(luò)搜索服務(wù)也隨之得到了發(fā)展。在網(wǎng)絡(luò)搜索服務(wù)中, 搜索引擎(search engines)是一個(gè)提供信息檢索服務(wù)的網(wǎng)站,它通過使用某些程序能夠把因特網(wǎng)上的所有信息歸類,以幫助用戶在茫茫網(wǎng)海中搜尋到所需要的信息。目前常用的搜索引擎有百度,Google,搜狐,雅虎,有道,中搜,搜搜,搜客等。目前的網(wǎng)絡(luò)搜索服務(wù)中,只需用戶輸入搜索關(guān)鍵字,搜索引擎就可從索引數(shù)據(jù)庫中匹配到該搜索關(guān)鍵字相關(guān)的網(wǎng)頁,之后顯示該匹配出的網(wǎng)頁。通常,為了便于用戶判斷, 該顯示的網(wǎng)頁除了提供網(wǎng)頁標(biāo)題和URL外,還會(huì)提供一段來自網(wǎng)頁的摘要以及其他信息。但是,目前的搜索引擎只是羅列出匹配出的網(wǎng)頁,而通常,該羅列出的網(wǎng)頁比較多、且雜亂。并且,隨著網(wǎng)絡(luò)應(yīng)用的不斷發(fā)展,以問題樹的形式提供信息是目前發(fā)展的趨勢, 然而,目前還沒有以問題樹的形式提供信息的搜索方法。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種信息搜索系統(tǒng)和方法,以便實(shí)現(xiàn)以問題樹的形式提供搜索的信息。本發(fā)明提供的技術(shù)方案包括一種信息搜索系統(tǒng),包括數(shù)據(jù)生成單元,用于生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù);數(shù)據(jù)查詢單元,用于提供搜索關(guān)鍵字給數(shù)據(jù)檢索單元,以及以問題樹的形式顯示數(shù)據(jù)檢索單元提供的分類后的問題樹數(shù)據(jù);數(shù)據(jù)檢索單元,用于在所述數(shù)據(jù)生成單元存儲(chǔ)的問題樹數(shù)據(jù)中檢索所述搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類并提供給數(shù)據(jù)查詢單元。一種信息搜索方法,包括生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù);當(dāng)接收到搜索關(guān)鍵字時(shí),在已存儲(chǔ)的問題樹數(shù)據(jù)中檢索該搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類,并以問題樹的形式顯示。由以上技術(shù)方案可以看出,本發(fā)明中,先生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù); 當(dāng)用戶需要搜索某一信息時(shí),直接提高該信息的搜索關(guān)鍵字,以便后臺根據(jù)該搜索關(guān)鍵字在已存儲(chǔ)的問題樹數(shù)據(jù)中進(jìn)行檢索,當(dāng)檢索到的相應(yīng)的問題樹數(shù)據(jù)時(shí),對該檢索到的問題樹數(shù)據(jù)進(jìn)行分類并以問題樹的形式顯示,這實(shí)現(xiàn)了以問題樹的形式提供搜索的信息。進(jìn)一步地,本發(fā)明以問題樹的形式提供搜索的信息,并非現(xiàn)有技術(shù)那樣籠統(tǒng)顯示網(wǎng)頁,這能直接、準(zhǔn)確、快速定位到搜索的信息。


圖1為本發(fā)明實(shí)施例提供的系統(tǒng)的基本結(jié)構(gòu)圖;圖2為本發(fā)明實(shí)施例提供的系統(tǒng)的詳細(xì)結(jié)構(gòu)圖;圖3為本發(fā)明實(shí)施例提供的問題樹顯示截圖;圖4為本發(fā)明實(shí)施例提供的基本流程圖。
具體實(shí)施例方式在對本發(fā)明提供的技術(shù)方案進(jìn)行分析之前,先對問題樹進(jìn)行描述。所謂問題樹,其實(shí)質(zhì)上是以樹的形式將各個(gè)信息關(guān)聯(lián)起來所形成的集合。比如,當(dāng)用戶A外出旅游時(shí),其可能需要做一些準(zhǔn)備工作,而由于用戶A不經(jīng)常旅游,其可能不知道需要準(zhǔn)備哪些工作,而問題樹就是需要準(zhǔn)備的一些以樹狀的形式組成的工作集合,其具體可包含保險(xiǎn)、簽證、線路、行李、費(fèi)用、宿舍、旅游團(tuán)等信息。下面為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對本發(fā)明進(jìn)行詳細(xì)描述。參見圖1,圖1為本發(fā)明實(shí)施例提供的系統(tǒng)的基本結(jié)構(gòu)圖。如圖1所示,該系統(tǒng)可包括數(shù)據(jù)生成單元101,其為本實(shí)施例中信息搜索系統(tǒng)的核心模塊,用于針對具體問題生成并存儲(chǔ)對應(yīng)的問題樹數(shù)據(jù);用戶查詢單元102,用于提供搜索關(guān)鍵字給數(shù)據(jù)檢索單元103,以及以問題樹的形式顯示數(shù)據(jù)檢索單元103提供的分類后的問題樹數(shù)據(jù);數(shù)據(jù)檢索單元103,用于在數(shù)據(jù)生成單元101存儲(chǔ)的問題樹數(shù)據(jù)中檢索所述搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類并提供給用戶查詢單元102。以上對本發(fā)明實(shí)施例提供的系統(tǒng)的基本結(jié)構(gòu)進(jìn)行了描述,下面對被發(fā)明實(shí)施例提供的系統(tǒng)進(jìn)行詳細(xì)描述。參見圖2,圖2為本發(fā)明實(shí)施例提供的系統(tǒng)的詳細(xì)結(jié)構(gòu)圖。如圖2所示,該系統(tǒng)可包括數(shù)據(jù)生成單元201、用戶查詢單元202和數(shù)據(jù)檢索單元203。其中,數(shù)據(jù)生成單元201、用戶查詢單元202和數(shù)據(jù)檢索單元203具有的功能分別與上述的數(shù)據(jù)生成單元101、用戶查詢單元102和數(shù)據(jù)檢索單元103具有的功能類似,不再詳述。優(yōu)選地,如圖3所示,數(shù)據(jù)生成單元201具體可包括數(shù)據(jù)處理模塊2011和數(shù)據(jù)生成模塊2012。其中,數(shù)據(jù)處理模塊2011,用于從網(wǎng)絡(luò)上爬取的所述具體問題的相關(guān)數(shù)據(jù)中提取出設(shè)定數(shù)據(jù),并確定該設(shè)定數(shù)據(jù)對應(yīng)的問題樹數(shù)據(jù)建立操作和問題樹數(shù)據(jù)存儲(chǔ)規(guī)則;而數(shù)據(jù)生成模塊2012,用于根據(jù)數(shù)據(jù)處理模塊2011確定的問題樹數(shù)據(jù)建立操作生成所述具體問題對應(yīng)的問題樹數(shù)據(jù),并根據(jù)確定的所述問題樹數(shù)據(jù)存儲(chǔ)規(guī)則存儲(chǔ)生成的問題樹數(shù)據(jù)。在上面描述中,問題樹數(shù)據(jù)建立操作主要可包括特征詞典建立操作、情感詞典建立操作等。其中,特征詞典主要為具體問題的特點(diǎn),而情感詞典可為用戶對該具體問題的評價(jià)。比如,若具體問題為諾基亞5800手機(jī),則特征詞典主要為該諾基亞5800手機(jī)的相關(guān)特
4點(diǎn)數(shù)據(jù),比如軟件、顯示、速度、質(zhì)量、聲音等數(shù)據(jù),而情感詞典主要為用戶對該諾基亞5800 手機(jī)的評價(jià)比如性能好壞等數(shù)據(jù)。至于問題樹數(shù)據(jù)存儲(chǔ)規(guī)則主要為問題樹數(shù)據(jù)的存儲(chǔ)方式,這里不具體限定。本實(shí)施例中,考慮到節(jié)省資源,可針對同一類具體問題比如手機(jī)或者筆記本電腦等,可建立同一個(gè)數(shù)據(jù)集合?;诖耍筛鶕?jù)從具體問題提取出的設(shè)定數(shù)據(jù)分別從同一個(gè)數(shù)據(jù)集合內(nèi)選擇出對應(yīng)的問題樹數(shù)據(jù)建立操作和問題樹存儲(chǔ)規(guī)則,該數(shù)據(jù)集合中包含了該具體問題涉及的可能用到的問題樹數(shù)據(jù)建立操作和問題樹存儲(chǔ)規(guī)則。本實(shí)施例中,用戶查詢單元202可基于Apache (其是世界使用排名第一的Web服務(wù)器軟件,可以運(yùn)行在幾乎所有廣泛使用的計(jì)算機(jī)平臺上,由于其跨平臺和安全性被廣泛使用,是最流行的Web服務(wù)器端軟件之一)+超級文本預(yù)處理語言PHP的網(wǎng)站開發(fā)技術(shù)實(shí)現(xiàn),其主要提供一查詢界面,便于用戶在該查詢界面輸入搜索關(guān)鍵字,以及將數(shù)據(jù)檢索單元 203分類后的問題樹數(shù)據(jù)解析成問題樹的表項(xiàng)形式,并顯示給用戶。本實(shí)施例中,數(shù)據(jù)檢索單元203可基于開源檢索系統(tǒng)Lucene實(shí)現(xiàn),其能夠?qū)崿F(xiàn)中文分詞、多線程Socket查詢服務(wù)端等操作。本實(shí)施例中,數(shù)據(jù)檢索單元203以Socket方式搜索問題樹數(shù)據(jù)的。另外,數(shù)據(jù)檢索單元203對檢索到的問題樹數(shù)據(jù)進(jìn)行分類主要是根據(jù)問題樹數(shù)據(jù)被訪問的熱度執(zhí)行的。以搜搜網(wǎng)站為例,若用戶在查詢界面輸入搜索關(guān)鍵字為5800,檢索到的相關(guān)數(shù)據(jù)為諾基亞手機(jī)5800i對應(yīng)的問題樹數(shù)據(jù),其分別為軟件、顯示、速度、質(zhì)量和聲音的數(shù)據(jù),假如該問題樹數(shù)據(jù)被訪問的熱度按照大小排序?yàn)檐浖?、顯示、速度、質(zhì)量和聲音,則基于此, 以問題樹形式顯示的該諾基亞手機(jī)5800i的數(shù)據(jù)在搜搜網(wǎng)上的截圖如圖3所示。其中,在圖 3中,最左面一列(即網(wǎng)頁結(jié)果所在的列)中的問題樹加粗并變黑,其表示當(dāng)前頁面是以問題樹顯示數(shù)據(jù)的,中間一列(即諾基亞5800i所在的列)為以問題樹形式顯示諾基亞5800i 對應(yīng)的問題樹數(shù)據(jù),而最右面一列(即諾基亞5800XM手機(jī)報(bào)價(jià)參數(shù)所在列)為選中問題樹中某問題樹數(shù)據(jù)時(shí)所對應(yīng)的網(wǎng)頁,目前為選中問題樹中作為問題樹數(shù)據(jù)的軟件時(shí)所對應(yīng)的網(wǎng)頁。以上對本發(fā)明實(shí)施例提供的系統(tǒng)進(jìn)行了詳細(xì)描述,下面對本發(fā)明實(shí)施例提供的方法進(jìn)行詳細(xì)描述。參見圖4,圖4為本發(fā)明實(shí)施例提供的基本流程圖。如圖4所示,該流程可包括以下步驟 步驟401,生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù)。步驟402,當(dāng)接收到搜索關(guān)鍵字時(shí),在已存儲(chǔ)的問題樹數(shù)據(jù)中檢索該搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類,并以問題樹的形式顯示。在上述步驟401中,生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù)具體可包括從網(wǎng)絡(luò)上爬取的所述具體問題的相關(guān)數(shù)據(jù)中提取出設(shè)定數(shù)據(jù),并確定該設(shè)定數(shù)據(jù)對應(yīng)的問題樹數(shù)據(jù)建立操作和問題樹數(shù)據(jù)存儲(chǔ)規(guī)則;根據(jù)所述數(shù)據(jù)處理模塊確定的問題樹數(shù)據(jù)建立操作生成所述具體問題對應(yīng)的問題樹數(shù)據(jù),并根據(jù)確定的所述問題樹數(shù)據(jù)存儲(chǔ)規(guī)則存儲(chǔ)生成的問題樹數(shù)據(jù)。在上述步驟402中,對檢索到的問題樹數(shù)據(jù)進(jìn)行分類具體包括統(tǒng)計(jì)檢索到的各個(gè)問題樹數(shù)據(jù)被訪問的熱度;按照熱度的大小對各個(gè)問題樹數(shù)據(jù)進(jìn)行分類。
需要說明的是,圖4所示的流程對應(yīng)圖2所示的系統(tǒng),其中,步驟401、以及步驟 402中的搜索和分類都是由服務(wù)端,具體由服務(wù)端中的數(shù)據(jù)生成單元和數(shù)據(jù)搜索單元執(zhí)行的。其中,數(shù)據(jù)檢索單元是基于開源檢索系統(tǒng)Lucene實(shí)現(xiàn)。在上述步驟402中,以問題樹形式顯示的操作由客戶端執(zhí)行,具體包括客戶端將服務(wù)端分類后的問題樹數(shù)據(jù)解析成問題樹的表項(xiàng)形式,并顯示給用戶。其中,該顯示具體可由客戶端中設(shè)置的用戶查詢單元執(zhí)行,優(yōu)選地,本實(shí)施例中該用戶查詢單元可基于 Apache+PHP的網(wǎng)站開發(fā)技術(shù)實(shí)現(xiàn)。至此,通過上述步驟401至步驟402能夠?qū)崿F(xiàn)客戶端以問題樹的形式顯示數(shù)據(jù)。由以上技術(shù)方案可以看出,本發(fā)明中,先生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù); 當(dāng)用戶需要搜索某一信息時(shí),直接提高該信息的搜索關(guān)鍵字,以便后臺根據(jù)該搜索關(guān)鍵字在已存儲(chǔ)的問題樹數(shù)據(jù)中進(jìn)行檢索,當(dāng)檢索到的相應(yīng)的問題樹數(shù)據(jù)時(shí),對該檢索到的問題樹數(shù)據(jù)進(jìn)行分類并以問題樹的形式顯示,這實(shí)現(xiàn)了以問題樹的形式提供搜索的信息。進(jìn)一步地,本發(fā)明以問題樹的形式提供搜索的信息,并非現(xiàn)有技術(shù)那樣籠統(tǒng)顯示網(wǎng)頁,這能直接、準(zhǔn)確、快速定位到搜索的信息。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種信息搜索系統(tǒng),其特征在于,該系統(tǒng)包括數(shù)據(jù)生成單元,用于生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù);用戶查詢單元,用于提供搜索關(guān)鍵字給問題樹檢索單元,以及以問題樹的形式顯示數(shù)據(jù)檢索單元提供的分類后的問題樹數(shù)據(jù);數(shù)據(jù)檢索單元,用于在所述數(shù)據(jù)生成單元存儲(chǔ)的問題樹數(shù)據(jù)中檢索所述搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類并提供給用戶查詢單元。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)生成單元包括數(shù)據(jù)處理模塊,用于從網(wǎng)絡(luò)上爬取的所述具體問題的相關(guān)數(shù)據(jù)中提取出設(shè)定數(shù)據(jù),并確定該設(shè)定數(shù)據(jù)對應(yīng)的問題樹數(shù)據(jù)建立操作和問題樹數(shù)據(jù)存儲(chǔ)規(guī)則;數(shù)據(jù)生成模塊,用于根據(jù)所述數(shù)據(jù)處理模塊確定的問題樹數(shù)據(jù)建立操作生成所述具體問題對應(yīng)的問題樹數(shù)據(jù),并根據(jù)確定的所述問題樹數(shù)據(jù)存儲(chǔ)規(guī)則存儲(chǔ)生成的問題樹數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)檢索單元基于開源檢索系統(tǒng) Lucene 實(shí)現(xiàn)。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述用戶查詢單元基于Apache和超級文本預(yù)處理語言PHP的網(wǎng)站開發(fā)技術(shù)實(shí)現(xiàn)。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),所述數(shù)據(jù)檢索單元根據(jù)問題樹數(shù)據(jù)被訪問的熱度對檢索到的問題樹數(shù)據(jù)進(jìn)行分類。
6.一種信息搜索方法,其特征在于,該方法包括生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù);當(dāng)接收到搜索關(guān)鍵字時(shí),在已存儲(chǔ)的問題樹數(shù)據(jù)中檢索該搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類,并以問題樹的形式顯示。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù)包括從網(wǎng)絡(luò)上爬取的所述具體問題的相關(guān)數(shù)據(jù)中提取出設(shè)定數(shù)據(jù),并確定該設(shè)定數(shù)據(jù)對應(yīng)的問題樹數(shù)據(jù)建立操作和問題樹數(shù)據(jù)存儲(chǔ)規(guī)則;根據(jù)所述數(shù)據(jù)處理模塊確定的問題樹數(shù)據(jù)建立操作生成所述具體問題對應(yīng)的問題樹數(shù)據(jù),并根據(jù)確定的所述問題樹數(shù)據(jù)存儲(chǔ)規(guī)則存儲(chǔ)生成的問題樹數(shù)據(jù)。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述對檢索到的問題樹數(shù)據(jù)進(jìn)行分類包括統(tǒng)計(jì)檢索到的各個(gè)問題樹數(shù)據(jù)被訪問的熱度;按照熱度的大小對各個(gè)問題樹數(shù)據(jù)進(jìn)行分類。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù)、在已存儲(chǔ)的問題樹數(shù)據(jù)中檢索該搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù)、以及對檢索到的問題樹數(shù)據(jù)進(jìn)行分類都是由服務(wù)端執(zhí)行的。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述以問題樹的形式顯示由客戶端執(zhí)行,具體包括客戶端將服務(wù)端分類后的問題樹數(shù)據(jù)解析成問題樹的表項(xiàng)形式,并顯示給用戶。
全文摘要
本發(fā)明實(shí)施例提供了一種信息搜索系統(tǒng)和方法,其中,該系統(tǒng)可包括數(shù)據(jù)生成單元,用于生成并存儲(chǔ)具體問題對應(yīng)的問題樹數(shù)據(jù);用戶查詢單元,用于提供搜索關(guān)鍵字給數(shù)據(jù)檢索單元,以及以問題樹的形式顯示數(shù)據(jù)檢索單元提供的分類后的問題樹數(shù)據(jù);數(shù)據(jù)檢索單元,用于在所述數(shù)據(jù)生成單元存儲(chǔ)的問題樹數(shù)據(jù)中檢索搜索關(guān)鍵字相關(guān)的問題樹數(shù)據(jù),對檢索到的問題樹數(shù)據(jù)進(jìn)行分類并提供給用戶查詢單元。采用本發(fā)明,能夠?qū)崿F(xiàn)以問題樹的形式提供搜索的信息。
文檔編號G06F17/30GK102375835SQ20101025699
公開日2012年3月14日 申請日期2010年8月17日 優(yōu)先權(quán)日2010年8月17日
發(fā)明者姚靜, 李輝 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1