專利名稱:信息請(qǐng)求方法和信息提供方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種通過(guò)互聯(lián)網(wǎng)請(qǐng)求信息和提供信息的方法,尤其涉及一種在不啟動(dòng)全面網(wǎng)頁(yè)搜索的情況下請(qǐng)求和提供有關(guān)用戶給出的查詢?cè)~的解釋的方法。
背景技術(shù):
計(jì)算機(jī)的發(fā)明給人類帶來(lái)了信息技術(shù)和信息革命。當(dāng)前,信息爆炸性地增長(zhǎng),而現(xiàn)有的信息技術(shù)無(wú)法使人有效地使用已有的信息。以信息檢索理論為原理的搜索引擎是目前主要的信息查找方法,它主要是通過(guò)網(wǎng)絡(luò)蜘蛛盡可能抓取互聯(lián)網(wǎng)網(wǎng)頁(yè),然后用超鏈分析等方法給出網(wǎng)頁(yè)排名,再用關(guān)鍵詞來(lái)索引所有的網(wǎng)頁(yè)。當(dāng)用戶輸入關(guān)鍵詞進(jìn)行搜索時(shí),搜索引擎從索引數(shù)據(jù)庫(kù)中找到匹配該關(guān)鍵詞的網(wǎng)頁(yè)提供給用戶。搜索引擎通常涵蓋非常大的互聯(lián)網(wǎng)范圍,但是經(jīng)常返回大量的低質(zhì)量網(wǎng)頁(yè)。即使用戶想了解有關(guān)特定主題的一般知識(shí),也經(jīng)常需要一一點(diǎn)擊搜索引擎返回的網(wǎng)頁(yè)鏈接,花費(fèi)很多時(shí)間從大量網(wǎng)頁(yè)篩選出相關(guān)的信息,因而經(jīng)常產(chǎn)生挫折感。因此,需要一種向用戶直接提供有關(guān)特定主題的知識(shí)信息的方法,而不需要用戶啟動(dòng)搜索,從搜索引擎返回的網(wǎng)頁(yè)鏈接查找相關(guān)信息,從而為搜索引擎的用戶提供便利。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種通過(guò)互聯(lián)網(wǎng)請(qǐng)求信息的方法,從而在用戶輸入查詢的同時(shí),可以獲得有關(guān)用戶查詢的提示結(jié)果。本發(fā)明的另一目的在于提供一種通過(guò)互聯(lián)網(wǎng)提供信息的方法,從而當(dāng)收到用戶查詢字符串時(shí),可以直接提供有關(guān)用戶查詢的信息,而不需要用戶啟動(dòng)網(wǎng)頁(yè)搜索。本發(fā)明的另一目的在于提供一種通過(guò)互聯(lián)網(wǎng)提供信息的方法,從而當(dāng)收到用戶查詢字符串時(shí),可以直接提供與用戶查詢的主題相關(guān)度高的信息以及提示關(guān)鍵詞,而不需要用戶啟動(dòng)網(wǎng)頁(yè)搜索。為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種通過(guò)互聯(lián)網(wǎng)提供信息的方法,所述方法包括, 使用網(wǎng)絡(luò)蜘蛛程序下載預(yù)定范圍的網(wǎng)頁(yè),并且對(duì)每個(gè)網(wǎng)頁(yè)進(jìn)行以下處理按照預(yù)定的規(guī)則對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行分析,提取至少一個(gè)對(duì)象的信息,并且根據(jù)網(wǎng)頁(yè)的內(nèi)容相關(guān)度、排名、瀏覽量、官方評(píng)分值和用戶投票值中的至少一個(gè),計(jì)算所述對(duì)象的分值,所述對(duì)象的信息包括對(duì)象名稱、以及一個(gè)或多個(gè)屬性和簡(jiǎn)介中的至少一個(gè),所述屬性包括屬性名稱和屬性值;從存儲(chǔ)有多個(gè)結(jié)構(gòu)對(duì)象的對(duì)象數(shù)據(jù)庫(kù)搜索具有提取的對(duì)象名稱的結(jié)構(gòu)對(duì)象,所述結(jié)構(gòu)對(duì)象包括對(duì)象名稱、分值、以及一個(gè)或多個(gè)屬性和簡(jiǎn)介中的至少一個(gè);如果沒(méi)有搜索到相應(yīng)的結(jié)構(gòu)對(duì)象,則使用提取的對(duì)象信息和計(jì)算的分值構(gòu)建結(jié)構(gòu)對(duì)象,并且將構(gòu)建的結(jié)構(gòu)對(duì)象寫入到對(duì)象數(shù)據(jù)庫(kù)中;和如果搜索到相應(yīng)的結(jié)構(gòu)對(duì)象并且結(jié)構(gòu)對(duì)象的分值小于計(jì)算的分值,則使用提取的對(duì)象信息和計(jì)算的分值更新對(duì)象數(shù)據(jù)庫(kù)中的所述結(jié)構(gòu)對(duì)象。其中,當(dāng)接收到來(lái)自用戶的包含查詢字符串的提示請(qǐng)求消息時(shí),從對(duì)象數(shù)據(jù)庫(kù)提取與查詢字符串相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息。
所述結(jié)構(gòu)對(duì)象可以以JSON(JavaScript Object Notation)格式進(jìn)行存儲(chǔ)??梢砸詳?shù)據(jù)庫(kù)和硬盤文件之一或者其結(jié)合存儲(chǔ)所述對(duì)象數(shù)據(jù)庫(kù)??梢愿鶕?jù)以下方法計(jì)算所述對(duì)象的分值對(duì)于提取自百科類網(wǎng)站的網(wǎng)頁(yè)的對(duì)象,分值=V評(píng)分值Uj^,其中,所
Alexa排名
述評(píng)分值是用戶對(duì)所述網(wǎng)頁(yè)的用戶投票值或官方評(píng)分值,瀏覽量是所述網(wǎng)頁(yè)被瀏覽的次數(shù)統(tǒng)計(jì),Alexa排名是Alexa公司對(duì)全球網(wǎng)站給予的排名;對(duì)于提取自對(duì)象主題所屬類別的網(wǎng)站的對(duì)象,指定預(yù)定的固定分值;和對(duì)于從其他網(wǎng)站的網(wǎng)頁(yè)提取的對(duì)象,分值=Ι/Alexa排名。還可以為對(duì)象數(shù)據(jù)庫(kù)建立對(duì)象索引并將所述對(duì)象索引存儲(chǔ)在存儲(chǔ)介質(zhì)上,每個(gè)索引項(xiàng)包括關(guān)鍵詞詞條以及指針,所述關(guān)鍵詞詞條是對(duì)象名稱或者對(duì)象名稱與對(duì)象屬性的組合,所述指針是對(duì)象數(shù)據(jù)庫(kù)中具有所述對(duì)象名稱的結(jié)構(gòu)對(duì)象的指針。其中,當(dāng)接收到包含查詢字符串的提示請(qǐng)求消息時(shí),從所述對(duì)象索引搜索關(guān)鍵詞詞條與所述查詢字符串相應(yīng)的索引項(xiàng),并且根據(jù)搜索到的索引項(xiàng)中的指針從對(duì)象數(shù)據(jù)庫(kù)提取相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息。可以以預(yù)定的第一時(shí)間間隔定期地更新所述對(duì)象索引。當(dāng)更新對(duì)象索引時(shí),可以為自上一次更新對(duì)象索引后新增的每個(gè)結(jié)構(gòu)對(duì)象,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和所述結(jié)構(gòu)對(duì)象在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng), 對(duì)所述結(jié)構(gòu)對(duì)象的每個(gè)屬性,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和屬性名稱的組合以及所述結(jié)構(gòu)對(duì)象或所述屬性在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng);然后,將構(gòu)建的全部索引項(xiàng)寫入對(duì)象索引。還可以建立具有與對(duì)象索引相同結(jié)構(gòu)的增量索引,并將所述增量索引獨(dú)立于對(duì)象索引存儲(chǔ)在存儲(chǔ)介質(zhì)上。其中,當(dāng)接收到包含查詢字符串的提示請(qǐng)求消息時(shí),從所述對(duì)象索引和增量索引搜索關(guān)鍵詞詞條與所述查詢字符串相應(yīng)的索引項(xiàng),并且根據(jù)搜索到的索引項(xiàng)中的指針從對(duì)象數(shù)據(jù)庫(kù)提取相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息;其中,當(dāng)更新所述對(duì)象索引時(shí),為自上一次更新起新增的每個(gè)結(jié)構(gòu)對(duì)象,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和所述結(jié)構(gòu)對(duì)象在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng),對(duì)所述結(jié)構(gòu)對(duì)象的每個(gè)屬性,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和屬性名稱的組合以及所述結(jié)構(gòu)對(duì)象或所述屬性在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng);然后,將構(gòu)建的全部索引項(xiàng)寫入所述增量索引;并且其中,以大于所述第一時(shí)間間隔的第二時(shí)間間隔將增量索引中的索引項(xiàng)合并到對(duì)象索引中,并且清空所述全部增量索引。所述對(duì)象索引和增量索引可以是倒排索引。還可以為對(duì)象數(shù)據(jù)庫(kù)中的結(jié)構(gòu)對(duì)象生成包括多個(gè)關(guān)鍵詞詞條項(xiàng)的提示關(guān)鍵詞詞庫(kù),其中,所述關(guān)鍵詞詞條項(xiàng)包括所述關(guān)鍵詞詞條和復(fù)合分值,當(dāng)所述關(guān)鍵詞詞條是對(duì)象名稱時(shí),所述復(fù)合分值是對(duì)象的分值,當(dāng)所述關(guān)鍵詞詞條是對(duì)象名稱和屬性名稱的組合時(shí),所述復(fù)合分值是基于對(duì)象的屬性計(jì)算的分值;其中,以所述第一時(shí)間間隔更新提示關(guān)鍵詞詞庫(kù)。可以按照以下公式計(jì)算所述基于對(duì)象的屬性計(jì)算的分值
5復(fù)合分值=其中,R是所述結(jié)構(gòu)對(duì)象的分值,V是所述關(guān)鍵詞詞條基于海量網(wǎng)頁(yè)統(tǒng)計(jì)的次數(shù),L 是所述屬性名稱的長(zhǎng)度。當(dāng)接收到來(lái)自用戶的包含查詢字符串的提示請(qǐng)求消息時(shí),還可以從關(guān)鍵詞詞庫(kù)提取預(yù)定數(shù)目的以查詢字符串為前綴的關(guān)鍵詞,并且構(gòu)建和發(fā)送包括所述提取的關(guān)鍵詞以及提取的結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息。當(dāng)接收到來(lái)自用戶的包含查詢字符串的提示請(qǐng)求消息時(shí),可以在將查詢字符串中的拼音轉(zhuǎn)換為相應(yīng)的中文字符串以后,基于所述中文字符串從關(guān)鍵詞詞庫(kù)提取關(guān)鍵詞,并且從對(duì)象索引以及對(duì)象數(shù)據(jù)庫(kù)搜索結(jié)構(gòu)對(duì)象的相應(yīng)信息以構(gòu)建和發(fā)送提示響應(yīng)消息。本發(fā)明還提供一種通過(guò)互聯(lián)網(wǎng)請(qǐng)求信息的方法,包括檢測(cè)網(wǎng)絡(luò)瀏覽器中的用戶操作;當(dāng)檢測(cè)到的用戶操作是輸入字符串的改變時(shí),構(gòu)建并發(fā)送包括用戶輸入字符串的第一提示請(qǐng)求消息;當(dāng)接收到響應(yīng)于所述第一提示請(qǐng)求消息的第一提示響應(yīng)消息時(shí),從所述第一提示響應(yīng)消息提取關(guān)于用戶輸入字符串表示的主題的解釋,在瀏覽器的指定位置彈出提示窗口,并且在所述提示窗口的指定位置顯示所述解釋。當(dāng)檢測(cè)到的用戶操作是搜索命令時(shí),構(gòu)建并發(fā)送包括用戶輸入字符串的搜索請(qǐng)求消息;當(dāng)接收到響應(yīng)于所述搜索請(qǐng)求消息的搜索響應(yīng)消息時(shí),從搜索響應(yīng)消息提取關(guān)于用戶輸入字符串的搜索結(jié)果,并且在瀏覽器當(dāng)前顯示的窗口中顯示所述搜索結(jié)果。接收的第一提示響應(yīng)消息還包括提示關(guān)鍵詞列表,所述提示關(guān)鍵詞列表可以還包括多個(gè)提示關(guān)鍵詞。其中,當(dāng)接收到所述第一提示響應(yīng)消息時(shí),還提取所述提示關(guān)鍵詞列表,并且在彈出的提示窗口的另一指定位置顯示所述多個(gè)提示關(guān)鍵詞。當(dāng)檢測(cè)到的用戶操作是選定顯示的提示關(guān)鍵詞之一時(shí),可以還構(gòu)建并發(fā)送包括選定的提示關(guān)鍵詞的字符串的第二提示請(qǐng)求消息;當(dāng)接收到響應(yīng)于所述第二提示請(qǐng)求消息的第二提示響應(yīng)消息時(shí),從所述第二提示響應(yīng)消息提取關(guān)于選定的提示關(guān)鍵詞表示的主題的解釋,并且在所述提示窗口的指定位置顯示所述解釋。用戶的輸入字符串可以是漢字、漢語(yǔ)拼音和西文之一。
通過(guò)下面結(jié)合示例性地示出一例的附圖進(jìn)行的描述,本發(fā)明的上述和其他目的和特點(diǎn)將會(huì)變得更加清楚,其中圖1是根據(jù)本發(fā)明的示例性實(shí)施例的信息請(qǐng)求方法和信息提供方法的互聯(lián)網(wǎng)系統(tǒng)的示意圖;圖2是根據(jù)本發(fā)明的示例性實(shí)施例存儲(chǔ)在對(duì)象數(shù)據(jù)庫(kù)中的結(jié)構(gòu)對(duì)象的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖3示出根據(jù)本發(fā)明的示例性實(shí)施例以JSON格式表達(dá)的結(jié)構(gòu)對(duì)象的示例;圖4A至圖4C示出根據(jù)本發(fā)明的示例性實(shí)施例在客戶機(jī)12或14上請(qǐng)求信息時(shí)的瀏覽器界面顯示;圖5是示出根據(jù)本發(fā)明的示例性實(shí)施例在客戶端請(qǐng)求信息時(shí)進(jìn)行的處理的流程圖;和
圖6是示出根據(jù)本發(fā)明的示例性實(shí)施例在提示信息服務(wù)器端執(zhí)行信息提供方法的處理的流程圖。
具體實(shí)施例方式本發(fā)明通過(guò)使用網(wǎng)絡(luò)蜘蛛程序從互聯(lián)網(wǎng)的預(yù)定范圍抓取網(wǎng)頁(yè),對(duì)網(wǎng)頁(yè)的內(nèi)容進(jìn)行分析并提取有關(guān)指示特定主題的對(duì)象的信息,并且使用所述提取的對(duì)象的信息生成對(duì)象數(shù)據(jù)庫(kù),從而當(dāng)接收到用戶的信息請(qǐng)求時(shí),直接將對(duì)象數(shù)據(jù)庫(kù)中的相應(yīng)知識(shí)信息提供給用戶。 而在客戶端,用戶在輸入窗口中輸入其想要了解的查詢?cè)~的內(nèi)容時(shí),不需要啟動(dòng)搜索程序, 再?gòu)乃阉鹘Y(jié)構(gòu)中進(jìn)行篩選,而可以直接獲得有關(guān)查詢?cè)~的解釋內(nèi)容。以下,參照附圖來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施例。圖1是根據(jù)本發(fā)明的示例性實(shí)施例的信息請(qǐng)求方法和信息提供方法的互聯(lián)網(wǎng)系統(tǒng)10的示意圖。參照?qǐng)D1,客戶機(jī)12和14提供如網(wǎng)絡(luò)瀏覽器的用戶界面,用戶通過(guò)該用戶界面與執(zhí)行本發(fā)明的信息提供方法的信息提供服務(wù)器18交互。客戶機(jī)12和14可以是傳統(tǒng)的臺(tái)式計(jì)算機(jī),或者是包括筆記本電腦、具有上網(wǎng)功能的手機(jī)等的各種移動(dòng)裝置。信息提供服務(wù)器18可以是單獨(dú)的服務(wù)器或者服務(wù)器集群,通過(guò)互聯(lián)網(wǎng)16從分布于全球各處的網(wǎng)絡(luò)服務(wù)器22收集信息并進(jìn)行處理,建立和維護(hù)所述對(duì)象數(shù)據(jù)庫(kù),并且響應(yīng)用戶的查詢請(qǐng)求,提供對(duì)象數(shù)據(jù)庫(kù)中與用戶的查詢相應(yīng)的信息。用戶通過(guò)客戶機(jī)12和14的用戶界面輸入所述用戶的查詢請(qǐng)求,通過(guò)互聯(lián)網(wǎng)16發(fā)送給信息提供服務(wù)器18。在互聯(lián)網(wǎng)系統(tǒng)10中,還可能有用于提供搜索服務(wù)的搜索引擎服務(wù)器20。根據(jù)本發(fā)明的可選實(shí)施例,信息提供服務(wù)器18還可以同時(shí)運(yùn)行搜索引擎服務(wù)。為了收集相關(guān)性強(qiáng)的知識(shí)信息,考慮到本發(fā)明建立知識(shí)庫(kù)性質(zhì)的對(duì)象數(shù)據(jù)庫(kù),有針對(duì)性地選擇和確定抓取網(wǎng)頁(yè)的范圍,例如百科類百度百科、互動(dòng)百科、維基百科企業(yè)信息企業(yè)黃頁(yè)財(cái)經(jīng)新浪財(cái)經(jīng)、Google財(cái)經(jīng)音樂(lè)Iting體育新浪體育、搜狐體育讀書新浪讀書頻道、騰訊讀書、豆瓣讀書頻道…通過(guò)對(duì)抓取的網(wǎng)頁(yè)進(jìn)行分析,能夠?qū)⑴c特定主題(即對(duì)象)相關(guān)的信息集中進(jìn)行存儲(chǔ)和管理,將對(duì)象和其屬性以及其他對(duì)象關(guān)聯(lián)起來(lái),提高提供的對(duì)象信息的相關(guān)度。將本發(fā)明的對(duì)象數(shù)據(jù)庫(kù)的存儲(chǔ)單位稱為結(jié)構(gòu)對(duì)象,所述結(jié)構(gòu)對(duì)象包含有關(guān)對(duì)象的信息。根據(jù)本發(fā)明的示例性實(shí)施例,如圖2所示,結(jié)構(gòu)對(duì)象200包括對(duì)象名稱210、分值220 和簡(jiǎn)介230。分值220是基于作為當(dāng)前的對(duì)象數(shù)據(jù)的來(lái)源的網(wǎng)頁(yè)計(jì)算的數(shù)值。簡(jiǎn)介230是有關(guān)所述對(duì)象的定義、說(shuō)明或者解釋性文字。通常,結(jié)構(gòu)對(duì)象200還包括至少一個(gè)屬性M0。 屬性240包括屬性名稱和屬性值。屬性值可以是單個(gè)值也可以是多個(gè)值。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,以JSON(Javascript Object Notation)格式存儲(chǔ)所述結(jié)構(gòu)對(duì)象。JSON是基于純文本的數(shù)據(jù)格式,在JSON中通常以至少一個(gè)鍵值對(duì)(Key-Value Pair)的形式進(jìn)行表達(dá)一個(gè)對(duì)象(Object)。
根據(jù)本發(fā)明的示例性實(shí)施例,以數(shù)據(jù)庫(kù)和硬盤文件之一或者其結(jié)合存儲(chǔ)所述對(duì)象數(shù)據(jù)庫(kù)。圖3示出根據(jù)本發(fā)明的示例性實(shí)施例以JSON格式表達(dá)的結(jié)構(gòu)對(duì)象300的示例。參照?qǐng)D3,以下劃線標(biāo)識(shí)的對(duì)象名稱310是“劉德華”,分值320和簡(jiǎn)介330也都以屬性的形式進(jìn)行表達(dá),340-360以及“春晚記錄”為屬性名稱,在所述屬性名稱的冒號(hào)右側(cè)分別是所述屬性的值。其中,使用方括號(hào)標(biāo)識(shí)具有包含多個(gè)屬性項(xiàng)的屬性,例如電影票房360。在客戶機(jī)12和14端,通過(guò)下載和運(yùn)行嵌入在網(wǎng)頁(yè)中的如Jav必cript腳本程序來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明的示例性實(shí)施例的信息請(qǐng)求方法。所述網(wǎng)頁(yè)提供用于用戶輸入查詢?cè)~的文本輸入框以及相關(guān)的命令按鈕,其可以在用于本發(fā)明的信息請(qǐng)求以外,同時(shí)用于一般的網(wǎng)頁(yè)搜索。所述腳本程序用于檢測(cè)瀏覽器窗口中用戶的操作,根據(jù)用戶的操作構(gòu)建和發(fā)送相應(yīng)的提示請(qǐng)求消息并且顯示接收的提示響應(yīng)消息中的信息。在網(wǎng)頁(yè)瀏覽器中,用戶首先使用指定的統(tǒng)一資源定位符(URL)下載所述具有腳本程序的網(wǎng)頁(yè),然后,在網(wǎng)頁(yè)的文本輸入框中輸入查詢?cè)~,由此在單獨(dú)彈出的提示窗口中得到有關(guān)查詢?cè)~的信息。所述查詢?cè)~的信息可以是有關(guān)特定對(duì)象主題的解釋(“劉德華”的簡(jiǎn)介),也可以是特定對(duì)象主題的指定屬性的值(如“劉德華”的“妻子”為“朱麗倩”)。根據(jù)本發(fā)明的另一示例性實(shí)施例,用戶還可以在所述彈出的提示窗口中或者另一單獨(dú)彈出的提示窗口中得到預(yù)定數(shù)目的提示關(guān)鍵詞。圖4A至圖4C示出根據(jù)本發(fā)明的示例性實(shí)施例在客戶機(jī)12或14上請(qǐng)求信息時(shí)的瀏覽器界面顯示。稍后將參照?qǐng)D5詳細(xì)地描述所述請(qǐng)求信息的處理。參照?qǐng)D4A,當(dāng)用戶在瀏覽器的文本輸入框410中一次性地輸入“北京大學(xué)校長(zhǎng)” 時(shí),在瀏覽器的當(dāng)前頁(yè)面上彈出一個(gè)提示窗口 420,并且在其中的預(yù)定位置(如右側(cè))顯示出當(dāng)前北大校長(zhǎng)的查詢結(jié)果“周其鳳”。請(qǐng)注意,在這里用戶并沒(méi)有給出查詢或搜索指令,而是由該網(wǎng)頁(yè)中的JavMcript腳本在檢測(cè)到用戶的輸入后直接生成并發(fā)送提示請(qǐng)求消息, 并且顯示接收的響應(yīng)消息中提供的結(jié)果。當(dāng)然,如果用戶當(dāng)前的輸入是“北”,而沒(méi)有相應(yīng)的查詢結(jié)果時(shí),則不彈出提示窗口,也不顯示任何信息。根據(jù)本發(fā)明的另一示例性實(shí)施例,參照?qǐng)D4B,當(dāng)用戶在瀏覽器的文本輸入框410 中一次性地輸入“錢學(xué)森”時(shí),在瀏覽器的當(dāng)前頁(yè)面上彈出一個(gè)提示窗口 420。此時(shí),不僅在窗口的預(yù)定位置(如右側(cè))顯示“錢學(xué)森”的簡(jiǎn)介,而且還在另一預(yù)定位置(如左側(cè))顯示相關(guān)的一列提示關(guān)鍵詞。所述提示關(guān)鍵詞也來(lái)自響應(yīng)于網(wǎng)頁(yè)中JavMcript腳本生成的提示請(qǐng)求的響應(yīng)消息。根據(jù)本發(fā)明的另一示例性實(shí)施例,在如圖4B所示的提示窗口被顯示以后,如果用戶例如使用鼠標(biāo)選擇了所述多個(gè)提示關(guān)鍵詞之一(如使用鼠標(biāo)在所述提示關(guān)鍵詞上停留足夠時(shí)間),如圖4C所示,“錢學(xué)森主要成就”被選擇,則在彈出的提示窗口的預(yù)定位置(如右側(cè))顯示出相應(yīng)的內(nèi)容。圖5是示出根據(jù)本發(fā)明的示例性實(shí)施例在客戶端請(qǐng)求信息時(shí)進(jìn)行的處理的流程圖。下面參照?qǐng)D4B、圖4C和圖5詳細(xì)描述所述處理。參照?qǐng)D5,在客戶機(jī)12或14端,用戶從指定URL下載用于請(qǐng)求信息的網(wǎng)頁(yè)。所述提示信息請(qǐng)求的處理起始自“A”。根據(jù)本發(fā)明的示例性實(shí)施例,使用 AJAX (異步 JavaScript 和 XML,Asynchronous JavaScript and XML) 創(chuàng)建本發(fā)明的提示請(qǐng)求并與信息提供服務(wù)器18交互。在步驟S510,檢測(cè)網(wǎng)頁(yè)瀏覽器當(dāng)前網(wǎng)頁(yè)中的用戶操作。然后,當(dāng)檢測(cè)到用戶操作時(shí),在步驟S520,確定用戶操作的類型。如果確定檢測(cè)到的用戶操作是文本輸入框410中輸入的改變(如輸入字符串的變化),如圖4B所示一次性地輸入“錢學(xué)森”,則在步驟S540,構(gòu)建包含用戶輸入字符串的第一提示請(qǐng)求消息,并且通過(guò)互聯(lián)網(wǎng)16發(fā)送給信息提供服務(wù)器 18。然后,當(dāng)在步驟S542,從信息提供服務(wù)器18接收到響應(yīng)于所述第一提示請(qǐng)求消息的第一提示響應(yīng)消息時(shí),對(duì)所述第一提示響應(yīng)消息進(jìn)行解析并提取用戶輸入字符串的提示查詢結(jié)果。根據(jù)本發(fā)明的另一示例性實(shí)施例,所述第一提示響應(yīng)消息還包括與用戶輸入字符串相關(guān)的提示關(guān)鍵詞列表,所述提示關(guān)鍵詞列表包括預(yù)定數(shù)目的提示關(guān)鍵詞。然后,在步驟S545,在瀏覽器當(dāng)前頁(yè)面上彈出提示窗口 420,并且在所述提示窗口的預(yù)定位置顯示所述用戶輸入字符串的提示查詢結(jié)果,如圖4B中提示窗口 420的右側(cè)所示。然后,根據(jù)本發(fā)明的另一示例性實(shí)施例,在步驟S548,在彈出的提示窗口 420的另一預(yù)定位置顯示所述提示關(guān)鍵詞列表,如圖4B中提示窗口 420的左側(cè)所示。所述提示關(guān)鍵詞列表和所述查詢結(jié)果可以在同一提示窗口中顯示,也可以在單獨(dú)的彈出窗口中分別顯示。然后,所述處理返回到“A”。也就是說(shuō),每次當(dāng)用戶在文本輸入框410中輸入、改變或刪除字符時(shí),都進(jìn)行上述步驟S540的處理。當(dāng)然,響應(yīng)于所述第一提示請(qǐng)求消息的第一提示響應(yīng)消息不一定總是包含提示查詢結(jié)果,此時(shí)不執(zhí)行步驟S545和S548。如果在步驟S520,確定所述用戶操作是從如上所示的所述提示關(guān)鍵詞列表中選定任一提示關(guān)鍵詞(如使用鼠標(biāo)在特定提示關(guān)鍵詞上停留足夠的時(shí)間),如圖4C中的左側(cè)所示,用戶選定了“錢學(xué)森主要成就”,則在步驟S550,構(gòu)建包含用戶選定的提示關(guān)鍵詞的第二提示請(qǐng)求消息,并且通過(guò)互聯(lián)網(wǎng)16發(fā)送給信息提供服務(wù)器18。然后,當(dāng)在步驟S552,從信息提供服務(wù)器18接收到響應(yīng)于所述第二提示請(qǐng)求消息的第二提示響應(yīng)消息時(shí),對(duì)所述第二提示響應(yīng)消息進(jìn)行解析并提取所述提示關(guān)鍵詞的提示查詢結(jié)果。然后,在步驟S555,在已彈出的提示窗口的預(yù)定位置或者單獨(dú)的彈出窗口顯示所述提示查詢結(jié)果,如圖4C中提示窗口 420的右側(cè)所示。然后,所述處理返回到“A”。根據(jù)本發(fā)明的另一示例性實(shí)施例,如果在步驟S520,確定檢測(cè)到的用戶操作是啟動(dòng)搜索的命令(如點(diǎn)擊搜索按鈕、輸入回車鍵或者點(diǎn)擊所述關(guān)鍵詞列表中的任一個(gè)等),則在步驟S530,構(gòu)建包含用戶輸入字符串的搜索請(qǐng)求消息(如HTTP請(qǐng)求),并且通過(guò)互聯(lián)網(wǎng) 16發(fā)送給搜索引擎服務(wù)器20。然后,在步驟S532,從搜索引擎服務(wù)器20接收到響應(yīng)于所述搜索請(qǐng)求消息的搜索響應(yīng)消息并且對(duì)所述搜索響應(yīng)消息進(jìn)行解析;在步驟S535,在瀏覽器當(dāng)前的窗口中顯示搜索結(jié)果。然后,所述處理返回到“A”。在這里,可以在信息提供服務(wù)器 18上運(yùn)行所述搜索引擎程序。如果在步驟S520,確定所述用戶操作是關(guān)閉當(dāng)前網(wǎng)頁(yè)(未示出),則終止所述圖5 中的處理。如果在步驟S520,確定所述用戶操作不是上述任何一種操作,則所述處理返回到 “K”。根據(jù)本發(fā)明的示例性實(shí)施例,用戶的輸入字符串可以是漢字、漢語(yǔ)拼音和西文之
ο圖6是示出根據(jù)本發(fā)明的示例性實(shí)施例在提示信息服務(wù)器端執(zhí)行信息提供方法的處理的流程圖。信息提供服務(wù)器18在存儲(chǔ)和維護(hù)對(duì)象數(shù)據(jù)庫(kù)的同時(shí),還維護(hù)用于查詢對(duì)象數(shù)據(jù)庫(kù)的對(duì)象索引。所述索引包括多個(gè)索引項(xiàng),其每個(gè)索引項(xiàng)是關(guān)鍵詞詞條和指向?qū)ο髷?shù)據(jù)庫(kù)的特定位置的指針的鍵值對(duì)。所述索引項(xiàng)中的所述關(guān)鍵詞詞條是對(duì)象名稱,或者對(duì)象名稱和屬性名稱的組合,其相應(yīng)的指針是對(duì)象數(shù)據(jù)庫(kù)中與所述對(duì)象相應(yīng)的結(jié)構(gòu)對(duì)象或者其相應(yīng)屬性的指針。通常使用預(yù)定的分隔符(如空格、逗號(hào)、分號(hào)等)來(lái)組合對(duì)象名稱和屬性名稱。根據(jù)本發(fā)明的示例性實(shí)施例,以倒排索引的形式組織和管理所述對(duì)象索引,并在存儲(chǔ)介質(zhì)上存儲(chǔ)所述對(duì)象索引。參照?qǐng)D6,信息提供服務(wù)器18使用如開(kāi)源網(wǎng)絡(luò)爬蟲(chóng)工具Heritrix的網(wǎng)頁(yè)蜘蛛程序從互聯(lián)網(wǎng)16下載預(yù)定范圍的網(wǎng)頁(yè)。然后,對(duì)每個(gè)下載的網(wǎng)頁(yè)進(jìn)行從步驟S620至步驟S660 的處理。在步驟S620,信息提供服務(wù)器18對(duì)下載的網(wǎng)頁(yè)中的數(shù)據(jù)進(jìn)行分析,并且使用預(yù)先定義的規(guī)則從網(wǎng)頁(yè)數(shù)據(jù)中提取有關(guān)對(duì)象的信息。其中,跳過(guò)大量重復(fù)性出現(xiàn)的數(shù)據(jù)(如菜單、導(dǎo)航條等),并且由于各網(wǎng)站的網(wǎng)頁(yè)都具有較固定的格式,因此通常為每個(gè)網(wǎng)站預(yù)先制作用于分析網(wǎng)頁(yè)及提取對(duì)象信息的模板。例如,對(duì)“百度百科”的網(wǎng)頁(yè),通常從〈title〉標(biāo)簽提取對(duì)象名稱,如從〃〈title〉 劉德華_百度百科〈/title〉"提取“劉德華”作為對(duì)象名稱,從該網(wǎng)頁(yè)中的“百科名片”項(xiàng)提取簡(jiǎn)介,并且從滿足于<tr><td>格式的項(xiàng)目中提取對(duì)象的屬性信息,如從以下HTML源代碼段提取屬性“身高” “174cm”、“體重” “63kg”。<tr><td class=" cardFirstTd" > 身高</td><td class=" cardSecondTd" >174cm</td></tr><tr><td class=" cardFirstTd" > 體重</td><td class=" cardSecondTd" >63kg</td></tr>—般說(shuō)來(lái),從一個(gè)選取的網(wǎng)頁(yè)提取一個(gè)在完成對(duì)網(wǎng)頁(yè)數(shù)據(jù)的分析和提取后,在步驟S630,根據(jù)作為對(duì)象來(lái)源的網(wǎng)頁(yè)的以下指標(biāo)中的至少一個(gè)來(lái)計(jì)算當(dāng)前對(duì)象的分值網(wǎng)頁(yè)的內(nèi)容相關(guān)度、瀏覽量、內(nèi)容相關(guān)度、官方評(píng)分值、用戶的投票值以及網(wǎng)站排名(如Alexa排名)。例如,對(duì)于提取自百科類網(wǎng)站的網(wǎng)頁(yè)的對(duì)象,使用以下公式計(jì)算對(duì)象的分值
權(quán)利要求
1.一種通過(guò)互聯(lián)網(wǎng)提供信息的方法,所述方法包括使用網(wǎng)絡(luò)蜘蛛程序下載預(yù)定范圍的網(wǎng)頁(yè),并且對(duì)每個(gè)網(wǎng)頁(yè)進(jìn)行以下處理 按照預(yù)定的規(guī)則對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行分析,提取至少一個(gè)對(duì)象的信息,并且根據(jù)網(wǎng)頁(yè)的內(nèi)容相關(guān)度、排名、瀏覽量、官方評(píng)分值和用戶投票值中的至少一個(gè),計(jì)算所述對(duì)象的分值,所述對(duì)象的信息包括對(duì)象名稱、以及一個(gè)或多個(gè)屬性和簡(jiǎn)介中的至少一個(gè),所述屬性包括屬性名稱和屬性值;從存儲(chǔ)有多個(gè)結(jié)構(gòu)對(duì)象的對(duì)象數(shù)據(jù)庫(kù)搜索具有提取的對(duì)象名稱的結(jié)構(gòu)對(duì)象,所述結(jié)構(gòu)對(duì)象包括對(duì)象名稱、分值、以及一個(gè)或多個(gè)屬性和簡(jiǎn)介中的至少一個(gè);如果沒(méi)有搜索到相應(yīng)的結(jié)構(gòu)對(duì)象,則使用提取的對(duì)象信息和計(jì)算的分值構(gòu)建結(jié)構(gòu)對(duì)象,并且將構(gòu)建的結(jié)構(gòu)對(duì)象寫入到對(duì)象數(shù)據(jù)庫(kù)中;和如果搜索到相應(yīng)的結(jié)構(gòu)對(duì)象并且結(jié)構(gòu)對(duì)象的分值小于計(jì)算的分值,則使用提取的對(duì)象信息和計(jì)算的分值更新對(duì)象數(shù)據(jù)庫(kù)中的所述結(jié)構(gòu)對(duì)象,其中,當(dāng)接收到來(lái)自用戶的包含查詢字符串的提示請(qǐng)求消息時(shí),從對(duì)象數(shù)據(jù)庫(kù)提取與查詢字符串相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息。
2.如權(quán)利要求1所述的方法,其中,根據(jù)以下方法計(jì)算所述對(duì)象的分值對(duì)于提取自百科類網(wǎng)站的網(wǎng)頁(yè)的對(duì)象,分值=V評(píng)分值^ ,其中,所述評(píng)Alexa排名分值是用戶對(duì)所述網(wǎng)頁(yè)的用戶投票值或官方評(píng)分值,瀏覽量是所述網(wǎng)頁(yè)被瀏覽的次數(shù)統(tǒng)計(jì),Alexa排名是Alexa公司對(duì)全球網(wǎng)站給予的排名;對(duì)于提取自對(duì)象主題所屬類別的網(wǎng)站的對(duì)象,指定預(yù)定的固定分值;和對(duì)于從其他網(wǎng)站的網(wǎng)頁(yè)提取的對(duì)象,分值=Ι/Alexa排名。
3.如權(quán)利要求1所述的方法,還包括為對(duì)象數(shù)據(jù)庫(kù)建立對(duì)象索引并將所述對(duì)象索引存儲(chǔ)在存儲(chǔ)介質(zhì)上,每個(gè)索引項(xiàng)包括關(guān)鍵詞詞條以及指針,所述關(guān)鍵詞詞條是對(duì)象名稱或者對(duì)象名稱與對(duì)象屬性的組合,所述指針是對(duì)象數(shù)據(jù)庫(kù)中具有所述對(duì)象名稱的結(jié)構(gòu)對(duì)象的指針,其中,當(dāng)接收到包含查詢字符串的提示請(qǐng)求消息時(shí),從所述對(duì)象索引搜索關(guān)鍵詞詞條與所述查詢字符串相應(yīng)的索引項(xiàng),并且根據(jù)搜索到的索引項(xiàng)中的指針從對(duì)象數(shù)據(jù)庫(kù)提取相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息。
4.如權(quán)利要求3所述的方法,還包括以預(yù)定的第一時(shí)間間隔定期地更新所述對(duì)象索引。
5.如權(quán)利要求4所述的方法,其中,當(dāng)更新對(duì)象索引時(shí),為自上一次更新對(duì)象索引后新增的每個(gè)結(jié)構(gòu)對(duì)象,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和所述結(jié)構(gòu)對(duì)象在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng),對(duì)所述結(jié)構(gòu)對(duì)象的每個(gè)屬性,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和屬性名稱的組合以及所述結(jié)構(gòu)對(duì)象或所述屬性在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng);然后,將構(gòu)建的全部索引項(xiàng)寫入對(duì)象索引。
6.如權(quán)利要求4所述的方法,還包括建立具有與對(duì)象索引相同結(jié)構(gòu)的增量索引,并將所述增量索引獨(dú)立于對(duì)象索引存儲(chǔ)在存儲(chǔ)介質(zhì)上,其中,當(dāng)接收到包含查詢字符串的提示請(qǐng)求消息時(shí),從所述對(duì)象索引和增量索引搜索關(guān)鍵詞詞條與所述查詢字符串相應(yīng)的索引項(xiàng),并且根據(jù)搜索到的索引項(xiàng)中的指針從對(duì)象數(shù)據(jù)庫(kù)提取相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息;其中,當(dāng)更新所述對(duì)象索引時(shí),為自上一次更新起新增的每個(gè)結(jié)構(gòu)對(duì)象,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和所述結(jié)構(gòu)對(duì)象在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng),對(duì)所述結(jié)構(gòu)對(duì)象的每個(gè)屬性,構(gòu)建包括作為關(guān)鍵詞詞條的對(duì)象名稱和屬性名稱的組合以及所述結(jié)構(gòu)對(duì)象或所述屬性在對(duì)象數(shù)據(jù)庫(kù)中的位置的指針的索引項(xiàng);然后,將構(gòu)建的全部索引項(xiàng)寫入所述增量索引;并且其中,以大于所述第一時(shí)間間隔的第二時(shí)間間隔將增量索引中的索引項(xiàng)合并到對(duì)象索引中,并且清空所述全部增量索引。
7.如權(quán)利要求3或權(quán)利要求5所述的方法,其中,所述對(duì)象索引是倒排索引。
8.如權(quán)利要求4所述的方法,還包括為對(duì)象數(shù)據(jù)庫(kù)中的結(jié)構(gòu)對(duì)象生成包括多個(gè)關(guān)鍵詞詞條項(xiàng)的提示關(guān)鍵詞詞庫(kù),其中,所述關(guān)鍵詞詞條項(xiàng)包括所述關(guān)鍵詞詞條和復(fù)合分值,當(dāng)所述關(guān)鍵詞詞條是對(duì)象名稱時(shí),所述復(fù)合分值是對(duì)象的分值,當(dāng)所述關(guān)鍵詞詞條是對(duì)象名稱和屬性名稱的組合時(shí),所述復(fù)合分值是基于對(duì)象的屬性計(jì)算的分值;其中,以所述第一時(shí)間間隔更新提示關(guān)鍵詞詞庫(kù)。
9.一種通過(guò)互聯(lián)網(wǎng)請(qǐng)求信息的方法,包括檢測(cè)網(wǎng)絡(luò)瀏覽器中的用戶操作;當(dāng)檢測(cè)到的用戶操作是輸入字符串的改變時(shí),構(gòu)建并發(fā)送包括用戶輸入字符串的第一提示請(qǐng)求消息;當(dāng)接收到響應(yīng)于所述第一提示請(qǐng)求消息的第一提示響應(yīng)消息時(shí),從所述第一提示響應(yīng)消息提取關(guān)于用戶輸入字符串表示的主題的解釋,在瀏覽器的指定位置彈出提示窗口,并且在所述提示窗口的指定位置顯示所述解釋;當(dāng)檢測(cè)到的用戶操作是搜索命令時(shí),構(gòu)建并發(fā)送包括用戶輸入字符串的搜索請(qǐng)求消息;當(dāng)接收到響應(yīng)于所述搜索請(qǐng)求消息的搜索響應(yīng)消息時(shí),從搜索響應(yīng)消息提取關(guān)于用戶輸入字符串的搜索結(jié)果,并且在瀏覽器當(dāng)前顯示的窗口中顯示所述搜索結(jié)果。
10.如權(quán)利要求9所述的方法,其特征在于,接收的第一提示響應(yīng)消息還包括提示關(guān)鍵詞列表,所述提示關(guān)鍵詞列表包括多個(gè)提示關(guān)鍵詞,其中,當(dāng)接收到所述第一提示響應(yīng)消息時(shí),還提取所述提示關(guān)鍵詞列表,并且在彈出的提示窗口的另一指定位置顯示所述多個(gè)提示關(guān)鍵詞。
全文摘要
一種通過(guò)互聯(lián)網(wǎng)提供信息和請(qǐng)求信息的方法,所述信息提供方法包括使用網(wǎng)絡(luò)蜘蛛程序下載預(yù)定范圍的網(wǎng)頁(yè),并且按照預(yù)定的規(guī)則對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行分析,提取至少一個(gè)對(duì)象的信息,并且根據(jù)網(wǎng)頁(yè)的內(nèi)容相關(guān)度、排名、瀏覽量、官方評(píng)分值和用戶投票值中的至少一個(gè),計(jì)算所述對(duì)象的分值;從存儲(chǔ)有多個(gè)結(jié)構(gòu)對(duì)象的對(duì)象數(shù)據(jù)庫(kù)搜索具有提取的對(duì)象名稱的結(jié)構(gòu)對(duì)象;如果沒(méi)有搜索到相應(yīng)的結(jié)構(gòu)對(duì)象,則使用提取的對(duì)象信息和計(jì)算的分值構(gòu)建結(jié)構(gòu)對(duì)象,并且將構(gòu)建的結(jié)構(gòu)對(duì)象寫入到對(duì)象數(shù)據(jù)庫(kù)中。其中,當(dāng)接收到來(lái)自用戶的包含查詢字符串的提示請(qǐng)求消息時(shí),從對(duì)象數(shù)據(jù)庫(kù)提取與查詢字符串相應(yīng)的結(jié)構(gòu)對(duì)象,并且構(gòu)建和發(fā)送包含所述結(jié)構(gòu)對(duì)象中的相應(yīng)信息的提示響應(yīng)消息。
文檔編號(hào)G06F17/30GK102486784SQ201010574338
公開(kāi)日2012年6月6日 申請(qǐng)日期2010年12月6日 優(yōu)先權(quán)日2010年12月6日
發(fā)明者尹紅風(fēng) 申請(qǐng)人:耶寶智慧(北京)技術(shù)發(fā)展有限公司