展現(xiàn)和獲取詞條信息的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種展現(xiàn)和獲取詞條信息的方法和裝置,其中的展現(xiàn)詞條信息的方法具體包括:將當(dāng)前瀏覽頁面的頁面信息進(jìn)行發(fā)送;接收與所述當(dāng)前瀏覽頁面對應(yīng)的百科詞條的詞條信息;所述詞條信息為在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息進(jìn)行分析選擇后所返回;對所述詞條信息進(jìn)行展現(xiàn)。本發(fā)明能夠在用戶使用瀏覽器瀏覽網(wǎng)頁的過程中自動(dòng)展現(xiàn)與當(dāng)前瀏覽頁面相關(guān)的詞條信息,能夠提高瀏覽器的信息訪問效率。
【專利說明】展現(xiàn)和獲取詞條信息的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本申請涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種展現(xiàn)和獲取詞條信息的方法和裝置?!颈尘凹夹g(shù)】
[0002]目前,隨著互聯(lián)網(wǎng)的普及,每天都有大量的新聞、事件等消息通過網(wǎng)絡(luò)被迅速傳播,人們對于各種信息的傳播熱情與共享程度達(dá)到了空前的高度。為方便人類不斷積累沉淀并傳承文明,一種通過電子大百科全書記錄百科詞條的方式應(yīng)運(yùn)而生。人們可以對已有知識或剛剛形成的智力成果進(jìn)行梳理和積累,或者憑借自身的知識能力對自己感興趣領(lǐng)域的相關(guān)知識主題進(jìn)行編輯和完善。不斷完善的電子大百科全書不僅對知識體系進(jìn)行了有效的梳理和保存,而且有利于進(jìn)行知識的檢索或查閱。
[0003]例如,當(dāng)用戶打開瀏覽器閱讀一篇新聞時(shí),如果遇到含有陌生或未知詞匯時(shí),則需要去電子大百科全書中進(jìn)行檢索相應(yīng)的百科釋義;現(xiàn)有技術(shù)中典型的檢索為“搜索框+關(guān)鍵詞”的檢索,通常,用戶需要打開電子大百科全書的網(wǎng)頁,在該網(wǎng)頁的搜索框中輸入陌生詞匯,并通過瀏覽搜索結(jié)果得到與該陌生詞匯相應(yīng)的百科釋義。這樣,在一篇新聞中具有一個(gè)以上的陌生詞匯時(shí),特別是陌生詞匯具有多項(xiàng)詞條信息時(shí),需要進(jìn)行多次檢索,并對各詞條信息進(jìn)行分析判斷,從而消耗了大量資源,影響了瀏覽器的信息訪問效率。
[0004]總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是:如何能夠提高瀏覽器的信息訪問效率。
【發(fā)明內(nèi)容】
[0005]本申請所要解決的技術(shù)問題是提供一種展現(xiàn)和獲取詞條信息的方法和裝置,在用戶使用瀏覽器瀏覽網(wǎng)頁的過程中自動(dòng)展現(xiàn)與當(dāng)前瀏覽頁面相關(guān)的詞條信息,能夠提高瀏覽器的信息訪問效率。
[0006]為了解決上述問題,本申請公開了一種獲取詞條信息的方法,包括:
[0007]分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條;
[0008]依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息;
[0009]在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息;
[0010]將所選擇的該項(xiàng)詞條信息進(jìn)行返回。
[0011]優(yōu)選的,所述對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息的步驟進(jìn)一步包括:
[0012]根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信息。
[0013]優(yōu)選的,所述方法還包括:
[0014]獲取所述百科詞條的各項(xiàng)詞條信息的詞條信息類別;
[0015]則所述根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信息的步驟具體為,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別最匹配的一項(xiàng)詞條信息。
[0016]優(yōu)選的,所述方法還包括:
[0017]分析所述當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別。
[0018]優(yōu)選的,所述方法還包括:
[0019]分析所述當(dāng)前用戶的使用歷史信息,得到相應(yīng)的用戶信息類別。
[0020]優(yōu)選的,所述分析所述當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別的步驟,包括:
[0021]分析所述當(dāng)前瀏覽頁面的統(tǒng)一資源定位符信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別;和/或
[0022]分析所述當(dāng)前瀏覽頁面的面包屑,導(dǎo)航得到相應(yīng)的當(dāng)前瀏覽頁面的類別;和/或
[0023]分析所述當(dāng)前瀏覽頁面中所述百科詞條分別在各既定類別的權(quán)重,得到當(dāng)前瀏覽頁面的各既定類別的總權(quán)重,并以總權(quán)重最大的既定類別作為當(dāng)前瀏覽頁面的類別。
[0024]優(yōu)選的,所述使用歷史信息包括:當(dāng)前用戶的瀏覽器訪問歷史記錄和/或輸入歷史記錄。
[0025]優(yōu)選的,所述分析所述當(dāng)前用戶的使用歷史信息,得到相應(yīng)的用戶信息類別的步驟,包括:
[0026]分析獲取所述當(dāng)前用戶的瀏覽器訪問歷史記錄中對應(yīng)頁面的頁面類別,并將頻率最高的頁面類別作為當(dāng)前用戶的用戶信息類別;和/或
[0027]分析統(tǒng)計(jì)所述當(dāng)前用戶的輸入歷史記錄,得到所述輸入歷史記錄對應(yīng)的詞匯類另O,并將頻率最高的詞匯類別作為當(dāng)前用戶的用戶信息類別。
[0028]優(yōu)選的,所述當(dāng)前瀏覽頁面的頁面信息包括當(dāng)前瀏覽頁面的內(nèi)容;
[0029]所述分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條的步驟,包括:
[0030]對所述當(dāng)前瀏覽頁面的內(nèi)容進(jìn)行分詞處理,得到相應(yīng)的詞條;
[0031]將所述詞條與服務(wù)器端存儲的詞庫進(jìn)行分析匹配;
[0032]將匹配成功的對應(yīng)詞條作為百科詞條。
[0033]優(yōu)選的,所述方法還包括:
[0034]統(tǒng)計(jì)各詞條在所述當(dāng)前瀏覽頁面出現(xiàn)的頻率;
[0035]則將匹配成功的對應(yīng)詞條作為百科詞條的步驟具體為,將匹配成功、且統(tǒng)計(jì)的頻率超過既定頻率閾值的對應(yīng)詞條作為百科詞條。
[0036]另一方面,本申請還公開了一種展現(xiàn)詞條信息的方法,包括:
[0037]將當(dāng)前瀏覽頁面的頁面信息進(jìn)行發(fā)送;
[0038]接收與所述當(dāng)前瀏覽頁面對應(yīng)的百科詞條的詞條信息;所述詞條信息在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息分析選擇后進(jìn)行返回;
[0039]對所述詞條信息進(jìn)行展現(xiàn)。
[0040]優(yōu)選的,所述對所述詞條信息進(jìn)行展現(xiàn)時(shí),采用彈窗形式對所述詞條信息進(jìn)行展現(xiàn)。
[0041]優(yōu)選的,所述對所述詞條信息進(jìn)行展現(xiàn)時(shí),對所述詞條信息的長度進(jìn)行預(yù)估,結(jié)合預(yù)估結(jié)果展現(xiàn)所述詞條信息。
[0042]另一方面,本申請還公開了一種獲取詞條信息的裝置,包括:
[0043]百科詞條獲取模塊,用于分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條;
[0044]百科詞條檢索模塊,用于依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息;
[0045]信息選擇模塊,用于在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息 '及
[0046]返回模塊,用于將所選擇的該項(xiàng)詞條信息進(jìn)行返回。
[0047]優(yōu)選的,所述信息選擇模塊,具體用于根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信息。
[0048]優(yōu)選的,所述裝置還包括:
[0049]詞條信息類別獲取模塊,用于獲取所述百科詞條的各項(xiàng)詞條信息的詞條信息類別;
[0050]則所述信息選擇模塊,具體用于從所述百科詞條的一項(xiàng)以上的詞條信息中選擇詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別最匹配的一項(xiàng)詞條信息。
[0051]另一方面,本申請還公開了一種展現(xiàn)詞條信息的裝置,包括:
[0052]發(fā)送模塊,用于將當(dāng)前瀏覽頁面的頁面信息進(jìn)行發(fā)送;
[0053]接收模塊,用于接收與所述當(dāng)前瀏覽頁面對應(yīng)的百科詞條的詞條信息;所述詞條信息在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息分析選擇后進(jìn)行返回;及
[0054]展現(xiàn)模塊,用于對所述詞條信息進(jìn)行展現(xiàn)。
[0055]優(yōu)選的,所述展現(xiàn)模塊,具體用于采用彈窗形式對與所述詞條信息進(jìn)行展現(xiàn)。
[0056]與現(xiàn)有技術(shù)相比,本申請具有以下優(yōu)點(diǎn):
[0057]用戶在使用瀏覽器瀏覽網(wǎng)頁的過程中,會遇到陌生或未知詞匯等時(shí),本申請用百科詞條表示當(dāng)前瀏覽頁面中出現(xiàn)的一些關(guān)鍵詞匯,并在瀏覽器客戶端自動(dòng)展現(xiàn)與當(dāng)前瀏覽頁面相應(yīng)的百科詞條的詞條信息;對于用戶而言,其無需打開搜索框和輸入關(guān)鍵詞進(jìn)行檢索,就能直接得到相應(yīng)的詞條信息;因此,本申請?jiān)陲@示當(dāng)前瀏覽頁面的同時(shí)提供頁面中對應(yīng)百科詞條的詞條信息,豐富了向用戶提供的信息內(nèi)容,從而提高了瀏覽器的信息訪問效率。
[0058]另外,本申請還可以在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇一項(xiàng)詞條信息;所述選取能夠從百科詞條的一項(xiàng)以上的詞條信息中選擇與當(dāng)前瀏覽頁面和/或當(dāng)前用戶最相關(guān)的一項(xiàng)詞條信息,故能夠使用盡可能小的區(qū)域展現(xiàn)最貼近用戶需求的一項(xiàng)詞條信息,準(zhǔn)確地向用戶展現(xiàn)多義詞中對應(yīng)的詞條信息,提高瀏覽器的信息訪問效率。
【專利附圖】
【附圖說明】
[0059]圖1是本申請一種展現(xiàn)詞條信息的方法實(shí)施例的流程圖;
[0060]圖2是本申請一種獲取詞條信息的方法實(shí)施例1的流程圖;[0061]圖3是本申請一種獲取詞條信息的方法實(shí)施例2的流程圖;
[0062]圖4是本申請一種展現(xiàn)詞條信息的裝置實(shí)施例的結(jié)構(gòu)圖;
[0063]圖5是本申請一種獲取詞條信息的裝置實(shí)施例的結(jié)構(gòu)圖.【具體實(shí)施方式】
[0064]為使本申請的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對本申請作進(jìn)一步詳細(xì)的說明。
[0065]本申請實(shí)施例在用戶使用瀏覽器瀏覽網(wǎng)頁的過程中,將當(dāng)前瀏覽頁面和當(dāng)前用戶的需求相結(jié)合,在瀏覽器客戶端自動(dòng)展現(xiàn)與當(dāng)前瀏覽頁面相應(yīng)的百科詞條的詞條信息;對于用戶而言,其在遇到陌生或未知詞匯等當(dāng)前瀏覽網(wǎng)頁的關(guān)鍵詞匯時(shí),無需打開搜索框和輸入關(guān)鍵詞進(jìn)行檢索,就能直接得到該陌生或未知詞匯的詞條信息;因此,本申請實(shí)施例能夠準(zhǔn)確地向用戶展現(xiàn)多義詞中對應(yīng)的詞條信息,從而能夠在豐富了向用戶提供的信息內(nèi)容的同時(shí),提高瀏覽器的信息訪問效率。
[0066]參照圖1,示出了本申請一種展現(xiàn)詞條信息的方法實(shí)施例的流程圖,具體可以包括:
[0067]步驟101、瀏覽器客戶端將當(dāng)前瀏覽頁面的頁面信息發(fā)送至瀏覽器服務(wù)器端;
[0068]步驟102、瀏覽器客戶端接收與所述當(dāng)前瀏覽頁面對應(yīng)的百科詞條的詞條信息;所述詞條信息在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),由瀏覽器服務(wù)器端對各項(xiàng)詞條信息分析選擇后進(jìn)行返回;
[0069]步驟103、瀏覽器客戶端對所述詞條信息進(jìn)行展現(xiàn)。
[0070]例如,當(dāng)用戶打開瀏覽器閱讀一篇新聞時(shí),本申請實(shí)施例的瀏覽器客戶端會自動(dòng)在當(dāng)前瀏覽頁面下方展現(xiàn)該新聞標(biāo)題或正文中的一些關(guān)鍵詞匯的詞條信息,這里的關(guān)鍵詞匯具體可以包括該新聞中涉及的主要人名、地名、事件等,這里的詞條信息具體可以包括關(guān)鍵詞匯的百科釋義等等。
[0071]本申請實(shí)施例用百科詞條表示當(dāng)前瀏覽頁面中出現(xiàn)的一些關(guān)鍵詞匯,這些關(guān)鍵詞匯對于用戶而言很有可能是陌生或未知的,也即,用戶很有可能對這些關(guān)鍵詞匯的詳細(xì)信息存在著弄清其含義的需求,故本申請將其作為百科詞條并自動(dòng)展現(xiàn)相應(yīng)的詞條信息。
[0072]本申請實(shí)施例中詞條信息泛指能夠增強(qiáng)用戶對百科詞條的理解的所有信息,其可以包括解釋性信息,一個(gè)典型的例子是百科釋義,其中,百科釋義可以主要來源于專業(yè)的百科網(wǎng)站或經(jīng)人工編輯而具有一定權(quán)威性普適性的網(wǎng)站頻道,如維基百科、百度百科、搜狐娛樂明星庫等等。本申請自動(dòng)展現(xiàn)當(dāng)前瀏覽頁面中與百科詞條相應(yīng)的詞匯的釋義信息,使得用戶不必檢索就可以弄清楚該詞匯的含義。
[0073]在具體實(shí)現(xiàn)中,當(dāng)用戶打開一個(gè)瀏覽頁面時(shí),瀏覽器客戶端會將其作為當(dāng)前瀏覽頁面,并將當(dāng)前瀏覽頁面的頁面信息發(fā)送至瀏覽器服務(wù)器端,接收瀏覽器服務(wù)器端返回的與所述當(dāng)前瀏覽頁面相應(yīng)的百科詞條的詞條信息,并進(jìn)行展現(xiàn)。
[0074]本申請實(shí)施例中,發(fā)送給瀏覽器服務(wù)器端的當(dāng)前瀏覽頁面的頁面信息主要可以包括:URL (統(tǒng)一資源定位符,Uniform Resource Locator)和/或當(dāng)前瀏覽頁面的內(nèi)容(例如新聞的標(biāo)題和正文)等等,本申請對具體的發(fā)送給瀏覽器服務(wù)器端的當(dāng)前瀏覽頁面的頁面信息不加以限制。瀏覽器客戶端可以發(fā)送當(dāng)前瀏覽頁面的URL到瀏覽器服務(wù)器端,瀏覽器服務(wù)器端觸發(fā)該URL得到當(dāng)前瀏覽頁面的內(nèi)容,也可以直接發(fā)送當(dāng)前瀏覽頁面的內(nèi)容供瀏覽器服務(wù)器進(jìn)行分析統(tǒng)計(jì)。
[0075]在具體實(shí)現(xiàn)中,瀏覽器服務(wù)器端返回的與所述當(dāng)前瀏覽頁面相應(yīng)的百科詞條的詞條信息通常為XML(可擴(kuò)展標(biāo)記語言,Extensible Markup Language)格式。鑒于XML和HTML的區(qū)別:XML是用來存儲數(shù)據(jù)的,其焦點(diǎn)是數(shù)據(jù)的內(nèi)容。而HTML被設(shè)計(jì)用來顯示數(shù)據(jù),其焦點(diǎn)是數(shù)據(jù)的外觀,故在本申請的一種應(yīng)用示例中,所述步驟102展現(xiàn)的過程具體可以包括:瀏覽器客戶端將XML格式的詞條信息轉(zhuǎn)換為HTML (超文本標(biāo)記語言,Hypertext MarkupLanguage)格式,并將HTML格式的詞條信息嵌入至插件,由該插件利用javascript、ajax(異步 JavaScript 和 XML, Asynchronous JavaScript and XML)、jquery 等前端腳本技術(shù)加載HTML格式的詞條信息,并進(jìn)行展現(xiàn)。
[0076]關(guān)于詞條信息的展現(xiàn)位置,其可以為瀏覽器的任意位置,例如,上方、下方、左方、右方等等。為了不影響和不干擾用戶瀏覽的當(dāng)前瀏覽頁面的內(nèi)容,在本申請的一種優(yōu)選實(shí)施例中,所述展現(xiàn)位置可以為瀏覽器的下方或右方。
[0077]關(guān)于詞條信息的展現(xiàn)形式,其可以為任意的形式,如彈窗、氣泡等等。在本申請的一種優(yōu)選實(shí)施例中,所述步驟102的實(shí)現(xiàn)過程可以為,采用彈窗形式對與所述當(dāng)前瀏覽頁面相應(yīng)的百科詞條的詞條信息進(jìn)行展現(xiàn)。該彈窗可以位于瀏覽器的任意位置;該彈窗可提供有關(guān)閉按鈕,可依據(jù)用戶對該關(guān)閉按鈕的操作而關(guān)閉,或者,該彈窗可被設(shè)置具有一定生命周期(如50秒),在生命周期結(jié)束后該彈窗自動(dòng)退出。
[0078]當(dāng)然,除了彈窗、氣泡的展現(xiàn)形式外,本申請的展現(xiàn)形式還可以包括浮動(dòng)工具條、菜單欄、工具欄、狀態(tài)欄等等,凡是能夠?yàn)橛脩粽宫F(xiàn)詞條信息入口的Π (用戶界面,userinterface)均屬于本申請的保護(hù)范圍內(nèi)。
[0079]百科詞條的詞條信息的長度不一,有長有短,為了不影響和不干擾用戶瀏覽的當(dāng)前瀏覽頁面的內(nèi)容,瀏覽器客戶端可以采取一定的策略。
[0080]在本申請的一種優(yōu)選實(shí)施例中,所述瀏覽器客戶端對所述詞條信息進(jìn)行展現(xiàn)時(shí),瀏覽器客戶端可以對所述詞條信息的長度進(jìn)行預(yù)估,結(jié)合預(yù)估結(jié)果展現(xiàn)所述詞條信息。
[0081]在此提供一種對所述詞條信息的長度進(jìn)行預(yù)估的應(yīng)用示例。瀏覽器客戶端可以針對展現(xiàn)區(qū)域的面積設(shè)置一個(gè)面積上限閾值,這樣,在所述詞條信息的長度所占用的實(shí)際面積小于等于面積上限閾值時(shí),就可以直接依據(jù)實(shí)際面積進(jìn)行展現(xiàn),此時(shí)展現(xiàn)的為所述詞條信息的全部內(nèi)容;在所述詞條信息的長度所占用的實(shí)際面積大于面積上限閾值時(shí),可以只展示面積上限閾值能承受的詞條信息,例如,按照從前到后的順序截取面積上限閾值的詞條信息,丟棄其它的詞條信息,此時(shí)展現(xiàn)的為所述詞條信息的部分內(nèi)容。所述面積上限閾值可根據(jù)彈窗、氣泡的展現(xiàn)形式的展現(xiàn)區(qū)域的面積進(jìn)行設(shè)定。
[0082]在有些情況下,與所述當(dāng)前瀏覽頁面相應(yīng)的百科詞條可能只有一個(gè),此時(shí)可以直接對這個(gè)百科詞條的詞條信息進(jìn)行展現(xiàn)。
[0083]在另外一些情況下,與所述當(dāng)前瀏覽頁面相應(yīng)的百科詞條可能為一個(gè)以上,為了不影響和不干擾用戶瀏覽的當(dāng)前瀏覽頁面的內(nèi)容,在本申請的一種優(yōu)選實(shí)施例中,所述百科詞條為一個(gè)以上;所述方法還可以包括:瀏覽器客戶端對與所述當(dāng)前瀏覽頁面相應(yīng)的一個(gè)以上百科詞條的標(biāo)識信息進(jìn)行展現(xiàn)。
[0084]所述標(biāo)識信息主要用于區(qū)分不同的百科詞條,也即,用戶看到展現(xiàn)的標(biāo)識信息,就能知道想要哪個(gè)百科詞條的信息。假設(shè)百科詞條為人名,相應(yīng)的標(biāo)識信息可以包括人名及相應(yīng)的頭像,假設(shè)百科詞條為地名,則相應(yīng)的標(biāo)識信息可以包括地名及相應(yīng)的標(biāo)識縮略圖,等等。本申請對具體的百科詞條的標(biāo)識信息不加以限制。
[0085]在本申請的一種優(yōu)選實(shí)施例中,所述方法還可以進(jìn)一步包括:
[0086]瀏覽器客戶端依據(jù)接收到的用戶針對所展現(xiàn)的所述一個(gè)以上百科詞條的標(biāo)識信息的選擇信息,展現(xiàn)所選擇的該百科詞條的詞條信息。
[0087]假設(shè)用戶通過鼠標(biāo)、鍵盤或者觸摸手勢選中或點(diǎn)擊了某個(gè)百科詞條的標(biāo)識信息的選擇信息,則認(rèn)為用戶想要查看所選擇的該百科詞條的詞條信息,于是對其進(jìn)行展現(xiàn)。
[0088]在其他實(shí)施例中,將當(dāng)前瀏覽頁面的頁面信息進(jìn)行發(fā)送的過程不限于瀏覽器客戶端,瀏覽器服務(wù)端也可執(zhí)行此操作;同理步驟102?步驟103中涉及到的實(shí)體也不限于瀏覽器客戶端,瀏覽器服務(wù)器端也可以執(zhí)行對應(yīng)的操作,完成本申請所述的邏輯過程,使對應(yīng)的詞條信息展現(xiàn)給用戶。
[0089]參照圖2,示出了本申請一種獲取詞條信息的方法實(shí)施例1的流程圖,具體可以包括:
[0090]步驟201、瀏覽器服務(wù)器端分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條;
[0091]步驟202、瀏覽器服務(wù)器端依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息;
[0092]步驟203、在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),瀏覽器服務(wù)器端對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息;
[0093]步驟204、瀏覽器服務(wù)器端將所選擇的該項(xiàng)詞條信息返回給瀏覽器客戶端。
[0094]本申請實(shí)施例用百科詞條表示當(dāng)前瀏覽頁面中出現(xiàn)的一些關(guān)鍵詞匯,這些關(guān)鍵詞匯對于用戶而言很有可能是陌生或未知的,也即,用戶很有可能對這些關(guān)鍵詞匯的詳細(xì)信息存在著需求,故本申請將其作為百科詞條并自動(dòng)展現(xiàn)相應(yīng)的詞條信息。
[0095]在本申請的一種優(yōu)選實(shí)施例中,所述當(dāng)前瀏覽頁面的頁面信息具體可以包括當(dāng)前瀏覽頁面的內(nèi)容;
[0096]所述瀏覽器服務(wù)器端分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條的步驟,可以進(jìn)一步包括:
[0097]子步驟Al、瀏覽器服務(wù)器端對所述當(dāng)前瀏覽頁面的內(nèi)容進(jìn)行分詞處理,得到相應(yīng)的詞條;
[0098]子步驟A2、瀏覽器服務(wù)器端將所述當(dāng)前瀏覽頁面內(nèi)容的詞條與服務(wù)器端存儲的詞庫進(jìn)行分析匹配;
[0099]子步驟A3、瀏覽器服務(wù)器端將匹配成功的對應(yīng)詞條作為百科詞條。
[0100]在本申請實(shí)施例中,服務(wù)器端存儲的詞庫可用于存儲一系列的詞條。在實(shí)際應(yīng)用中,可以依據(jù)專業(yè)的百科網(wǎng)站或經(jīng)人工編輯而具有一定權(quán)威性普適性的網(wǎng)站頻道整理得到所述詞條,如維基百科、百度百科、搜狐娛樂明星庫、電子大百科全書等等。并且,服務(wù)器端存儲的詞庫可以隨著網(wǎng)站頻道的變化而同步更新。
[0101]在本優(yōu)選實(shí)施例中,如果所述當(dāng)前瀏覽頁面內(nèi)容的詞條命中服務(wù)器端存儲的詞庫,即可推斷用戶對該詞條的詳細(xì)信息存在著需求,于是,將該詞條作為百科詞條,并依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息。
[0102]在具體實(shí)現(xiàn)中,依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息的方案可以有多種。例如,可以直接將所述百科詞條輸入至維基百科、百度百科、搜狐娛樂明星庫、電子大百科全書等已有的檢索網(wǎng)站中去查詢;又如,也可以依據(jù)維基百科、百度百科、搜狐娛樂明星庫、電子大百科全書等已有的檢索網(wǎng)站的數(shù)據(jù)進(jìn)行抓取后整理得到一個(gè)新的百科數(shù)據(jù)庫,該新的百科數(shù)據(jù)庫存儲有百科詞條和相應(yīng)的詞條信息,這樣,將所述百科詞條輸入至該新的百科數(shù)據(jù)庫進(jìn)行查詢,也可以得到相應(yīng)的詞條信息??傊?,本申請對依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息的方案不加以限制。
[0103]在本申請的另一種優(yōu)選實(shí)施例中,所述瀏覽器服務(wù)器端分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條的步驟還可以包括:
[0104]統(tǒng)計(jì)各詞條在所述當(dāng)前瀏覽頁面內(nèi)容中出現(xiàn)的頻率;
[0105]則瀏覽器服務(wù)器端將匹配成功的對應(yīng)詞條作為百科詞條的步驟可以具體為,將匹配成功、且統(tǒng)計(jì)的頻率超過既定頻率閾值的對應(yīng)詞條作為百科詞條。
[0106]為了避免本申請百科詞條的詞條信息對用戶的干擾,本優(yōu)選實(shí)施例增加了百科詞條的確定門檻,也即,在當(dāng)前瀏覽頁面內(nèi)容的詞條命中服務(wù)器端存儲的詞庫,且詞條在所述當(dāng)前瀏覽頁面內(nèi)容中出現(xiàn)的頻率超過既定頻率閾值時(shí),才推斷用戶對該詞條的詳細(xì)信息存在著需求。這里的既定頻率閾值可由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需求設(shè)置,本申請對具體的既定頻率閾值不加以限制。
[0107]百科詞條的詞條信息的長度不一,有長有短,為了不影響和不干擾用戶瀏覽的當(dāng)前瀏覽頁面的內(nèi)容,瀏覽器服務(wù)器端可以采取一定的策略。
[0108]例如,在本申請的一種應(yīng)用示例中,瀏覽器服務(wù)器端可以根據(jù)具體需求對百科詞條的詞條信息進(jìn)行調(diào)整,例如,在百科詞條的詞條信息短時(shí),可以不作任何調(diào)整,而在百科詞條的詞條信息長時(shí),從中摘取主要內(nèi)容直至詞條信息的長度不超過一定的長度閾值等等。這里的長度閾值可由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需求設(shè)置,本申請對具體的長度閾值不加以限制。
[0109]需要說明的是,在具體實(shí)現(xiàn)中,瀏覽器服務(wù)器端可以首先將所述詞條信息封裝為XML格式。然后返回給瀏覽器客戶端。
[0110]由于多義詞等原因,在有些情況下,所述百科詞條可能對應(yīng)一項(xiàng)以上的詞條信息。例如,百科詞條“孫悅”可能涉及到“歌手孫悅”,也有可能涉及到“球員孫悅”;又如,百科詞條“蘋果”可能涉及到植物、公司、國內(nèi)電影以及國外電影等等。
[0111]在上述百科詞條對應(yīng)一項(xiàng)以上的詞條信息的情況下,如果瀏覽器服務(wù)器端直接將一項(xiàng)以上的詞條信息返回給瀏覽器客戶端,則瀏覽器客戶端可以依據(jù)自身的策略,展現(xiàn)一項(xiàng)以上的詞條信息的全部或部分內(nèi)容。無疑展現(xiàn)一項(xiàng)以上的詞條信息的全部內(nèi)容會造成展現(xiàn)區(qū)域的浪費(fèi),并且很容易影響和干擾用戶瀏覽的當(dāng)前瀏覽頁面的內(nèi)容;但是,展現(xiàn)一項(xiàng)以上的詞條信息的部分內(nèi)容,會存在不能滿足用戶需求的風(fēng)險(xiǎn),例如,用戶在查看關(guān)于文藝報(bào)道的網(wǎng)頁,想要“歌手孫悅”的詞條信息時(shí)展現(xiàn)了“球員孫悅”的詞條信息,此時(shí)本申請自動(dòng)展現(xiàn)詞條內(nèi)容就變得毫無價(jià)值。
[0112]因此,為了在避免造成展現(xiàn)區(qū)域的浪費(fèi),及避免影響和干擾用戶瀏覽的當(dāng)前瀏覽頁面的內(nèi)容的前提下,自動(dòng)展現(xiàn)用戶想要的詞條信息,本實(shí)施例在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇一項(xiàng)詞條信息顯示給用戶;從而使用盡可能小的區(qū)域展現(xiàn)最貼近用戶需求的一項(xiàng)詞條信息,能夠在提升用戶體驗(yàn)的同時(shí),進(jìn)一步增強(qiáng)瀏覽器的信息訪問效率。
[0113]在本申請的一種優(yōu)選實(shí)施例中,所述瀏覽器服務(wù)器端對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息的步驟可以進(jìn)一步包括:瀏覽器服務(wù)器端根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信息。
[0114]在本申請的一種優(yōu)選實(shí)施例中,所述方法還可以包括:
[0115]瀏覽器服務(wù)器端分析所述當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別。[0116]本申請可以提供如下獲取頁面類別的技術(shù)方案:
[0117]頁面類別獲取方案1、
[0118]頁面類別獲取方案I具體可以包括:瀏覽器服務(wù)器端分析所述當(dāng)前瀏覽頁面的統(tǒng)一資源定位符信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別。
[0119]在實(shí)際應(yīng)用中,各大網(wǎng)站通常設(shè)置有一個(gè)以上頻道類別,例如,新聞、體育、娛樂、財(cái)經(jīng)、視頻、女人、科技、手機(jī)、數(shù)碼、汽車、旅游、房產(chǎn)、論壇、博客、游戲、微博、服飾、應(yīng)用等等。而頻道類別的URL通常具有一定的規(guī)律,也即,相同頻率類別的URL具有相同的特征,而不同頻率類別的URL具有差異。
[0120]因此,頁面類別獲取方案I可以利用各大網(wǎng)站頻道類別的URL規(guī)律分析所述當(dāng)前瀏覽頁面的統(tǒng)一資源定位符信息,將相應(yīng)的當(dāng)前瀏覽頁面的類別定位到頻道類別的細(xì)粒度。
[0121]在此提供一些網(wǎng)站頻道類別的URL規(guī)律,例如,某些網(wǎng)站娛樂頻道類別的URL中會包括有“yule (娛樂的中文全拼)”,例如http://yule, sohu.com/,還有一些網(wǎng)站娛樂頻道類別的URL中會包含有“ent (娛樂entertainment白勺英文縮寫)”,例如,http: //ent.sina.com.cn/、http://ent.163.com/等等。這樣,如果當(dāng)前瀏覽頁面的URL中包含有“yule”或“ent”,則可以認(rèn)為當(dāng)前瀏覽頁面的頁面類別為“娛樂”類別。
[0122]當(dāng)然,上述網(wǎng)站娛樂頻道類別的URL規(guī)律只是作為示例,其不作為本申請的應(yīng)用限制。
[0123]頁面類別獲取方案2、
[0124]頁面類別獲取方案2具體可以包括:瀏覽器服務(wù)器端分析所述當(dāng)前瀏覽頁面的面包屑,導(dǎo)航得到相應(yīng)的當(dāng)前瀏覽頁面的類別。
[0125]面包屑是一種“歷史記錄”的應(yīng)用方式,目的是幫助用戶追溯來路,因而它是一種線性的導(dǎo)航方式。主要用來表達(dá)內(nèi)容歸屬關(guān)系的界面元素,也就是“主分類 > 一級分類> 二級分類 > 三級分類 >…… > 最終內(nèi)容頁面”這樣的方式。
[0126]關(guān)于如何分析所述當(dāng)前瀏覽頁面的面包屑,導(dǎo)航得到相應(yīng)的當(dāng)前瀏覽頁面的類別,在本申請的一種應(yīng)用示例中,可以在網(wǎng)絡(luò)爬蟲抓取當(dāng)前瀏覽頁面的HTML內(nèi)容后,解析所述HTML內(nèi)容,按照各個(gè)網(wǎng)站的模板或者提取含有一個(gè)以上符號’ >’的內(nèi)容定位出站內(nèi)導(dǎo)航條,從而得到處對應(yīng)的文字;由于該站內(nèi)導(dǎo)航條一般為描述了當(dāng)前瀏覽頁面在站內(nèi)的目錄層次,故通過相應(yīng)類別對應(yīng)的關(guān)鍵詞即可定位出當(dāng)前瀏覽頁面的頁面類別。例如,在站內(nèi)導(dǎo)航條為“網(wǎng)易〉體育頻道〉中國籃球〉正文”時(shí),可以確定當(dāng)前瀏覽頁面為“體育”類別。[0127]頁面類別獲取方案3、
[0128]頁面類別獲取方案3具體可以包括:瀏覽器服務(wù)器端分析所述當(dāng)前瀏覽頁面中所述百科詞條分別在各既定類別的權(quán)重,得到當(dāng)前瀏覽頁面的各既定類別的總權(quán)重,并以總權(quán)重最大的既定類別作為當(dāng)前瀏覽頁面的頁面類別。
[0129]在具體實(shí)現(xiàn)中,可以預(yù)置一系列的既定類別(本申請的既定類別主要用于表示詞條所屬的頁面類別,在實(shí)際中可以依據(jù)各大網(wǎng)站的頻道類別,),并獲取當(dāng)前瀏覽頁面中所述百科詞條在各既定類別的權(quán)重。在此給出一種權(quán)重獲取方案,當(dāng)然其并不作為本申請的應(yīng)用限制。
[0130]該權(quán)重獲取方案采用機(jī)器學(xué)習(xí)的方法,預(yù)先設(shè)定基礎(chǔ)訓(xùn)練集,由人工標(biāo)注各個(gè)詞條樣本及在各個(gè)既定類別的權(quán)重,并依據(jù)該訓(xùn)練集得到相應(yīng)的權(quán)重分類器。這樣,可以分別將當(dāng)前瀏覽頁面中各百科詞條輸入至權(quán)重分類器,輸出各百科詞條在各個(gè)既定類別的權(quán)重。
[0131]在實(shí)際應(yīng)用中,權(quán)重的范圍通常從O到1,越趨近于1,表明這個(gè)百科詞條越傾向于這個(gè)既定類別,反之表明這個(gè)百科詞條越不傾向于這個(gè)既定類別。例如“NBA”在體育類別權(quán)重的很大,而在“軍事”類別的權(quán)重很小等等。對所有百科詞條的各個(gè)既定類別的權(quán)重分別求和,即得到當(dāng)前瀏覽頁面的各既定類別的總權(quán)重,選擇總權(quán)重最大的既定類別為當(dāng)前瀏覽頁面的頁面類別。
[0132]以上對三種頁面類別獲取方案進(jìn)行了詳細(xì)介紹,可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)需要結(jié)合使用上述幾種方案,或者,使用其中任一種方案,或者,使用其它方案獲取當(dāng)前瀏覽頁面的頁面類別,本發(fā)明對此不加以限制。
[0133]在本申請的一種優(yōu)選實(shí)施例中,所述方法還可以包括:
[0134]瀏覽器服務(wù)器端分析所述當(dāng)前用戶的使用歷史信息,得到相應(yīng)的用戶信息類別。
[0135]在本申請實(shí)施例中,優(yōu)選的是,所述使用歷史信息具體可以包括:當(dāng)前用戶的瀏覽器訪問歷史記錄和/或輸入歷史記錄。其中,所述瀏覽器訪問歷史記錄可由瀏覽器日志統(tǒng)計(jì)得到,所述輸入歷史記錄可由輸入法客戶端統(tǒng)計(jì)得到。
[0136]本申請可以提供如下獲取用戶信息類別的技術(shù)方案:
[0137]用戶信息類別獲取方案1、
[0138]用戶信息類別獲取方案I具體可以包括:瀏覽器服務(wù)器端分析獲取所述當(dāng)前用戶的瀏覽器訪問歷史記錄中對應(yīng)頁面的頁面類別,并將頻率最高的頁面類別作為當(dāng)前用戶的用戶信息類別。
[0139]用戶個(gè)性化需求往往是源自用戶的興趣愛好的,例如,某用戶有追星的愛好,且是影視愛好者,故其每天上網(wǎng)主要就是為了瀏覽國內(nèi)外的明星和影視動(dòng)態(tài);又如,某用戶是足球和籃球愛好者,其每天上網(wǎng)主要就是為了瀏覽國內(nèi)外的足球和籃球動(dòng)態(tài);再如,某用戶是數(shù)碼愛好者,其每天上網(wǎng)瀏覽大部分是數(shù)碼類的頁面。故用戶信息類別獲取方案I依據(jù)當(dāng)前用戶的瀏覽器訪問歷史記錄,統(tǒng)計(jì)當(dāng)前用戶的用戶信息類別,此種情形下的用戶信息類別與用戶的興趣愛好相當(dāng)。
[0140]在實(shí)際中,瀏覽器訪問歷史記錄通常記錄有用戶標(biāo)識、頁面URL、訪問時(shí)間等信息,在具體實(shí)現(xiàn)中,可以利用上述三種頁面類別獲取方案中的一種或多種獲取當(dāng)前用戶的瀏覽器訪問歷史記錄中頁面的頁面類別,然后,統(tǒng)計(jì)出其中出現(xiàn)次數(shù)最多(也即頻率最高)的頁面類別,作為當(dāng)前用戶的用戶信息類別。之所以選擇頻率最高的頁面類別,說明當(dāng)前用戶對此頁面類別比較關(guān)注,也即此種情形下的用戶信息類別與用戶的興趣愛好相當(dāng)。
[0141]在具體實(shí)現(xiàn)中,可以依據(jù)時(shí)間點(diǎn)對所要統(tǒng)計(jì)的當(dāng)前用戶的瀏覽器訪問歷史記錄進(jìn)行限制。例如,所要統(tǒng)計(jì)的當(dāng)前用戶的瀏覽器訪問歷史記錄可以為:從打開瀏覽器界面到當(dāng)前瀏覽頁面的所有歷史記錄;又如,所要統(tǒng)計(jì)的當(dāng)前用戶的瀏覽器訪問歷史記錄可以為N (可由本領(lǐng)域技術(shù)人員依據(jù)實(shí)際需求設(shè)置)天來的所有歷史記錄,等等。
[0142]在具體實(shí)現(xiàn)中,還可以依據(jù)數(shù)量對所要統(tǒng)計(jì)的當(dāng)前用戶的瀏覽器訪問歷史記錄進(jìn)行限制。例如,所要統(tǒng)計(jì)的當(dāng)前用戶的瀏覽器訪問歷史記錄的數(shù)量為10條或100條,等等。當(dāng)然,上述時(shí)間點(diǎn)和數(shù)量可以結(jié)合使用,本申請對此不加以限制。
[0143]用戶信息類別獲取方案2、
[0144]用戶信息類別獲取方案2具體可以包括:瀏覽器服務(wù)器端分析統(tǒng)計(jì)所述當(dāng)前用戶的輸入歷史記錄,即分析統(tǒng)計(jì)瀏覽器界面中的輸入歷史,包括瀏覽器地址欄的輸入歷史、瀏覽器頁面中搜索框、輸入框等控件的輸入歷史等,得到所述輸入歷史記錄對應(yīng)的詞匯類別,并將頻率最高的詞匯類別作為當(dāng)前用戶的用戶信息類別。
[0145]目前,隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,現(xiàn)在的時(shí)代儼然變成了信息時(shí)代,大多數(shù)上班族需要長期伏案工作面對電腦,通常他們在電腦上輸入的為與職業(yè)相關(guān)的詞匯,例如,行政助理輸入的是辦公管理相關(guān)的詞匯,會計(jì)輸入的是財(cái)務(wù)相關(guān)的詞匯,建筑設(shè)計(jì)師輸入的是房地產(chǎn)、結(jié)構(gòu)相關(guān)的詞匯,程序員輸入的是計(jì)算機(jī)、代碼相關(guān)的詞匯等等。
[0146]上述與職業(yè)相關(guān)的詞匯可以在特定的正式應(yīng)用環(huán)境下統(tǒng)計(jì),例如,在worcUexcel、autocad、powerpoint、protel、技術(shù)論壇等特定的應(yīng)用環(huán)境下統(tǒng)計(jì)。
[0147]因此,用戶的輸入歷史記錄能夠在一定程度上反映用戶的職業(yè)信息,進(jìn)而可以引申出用戶對與職業(yè)信息相關(guān)的信息存在著需求,例如,程序員就是關(guān)注計(jì)算機(jī)相關(guān)的信息
坐坐寸寸ο
[0148]除了與職業(yè)相關(guān)的詞匯外,用戶的輸入歷史記錄還能夠在一定程度上反映用戶的興趣愛好信息;與興趣愛好相關(guān)的輸入歷史記錄可以在一些特定的非正式應(yīng)用環(huán)境下統(tǒng)計(jì),例如QQ、飛信等即時(shí)通訊程序,又如天涯、水木、貓撲等各種娛樂論壇等等。如果用戶對星座感興趣,則其在這些非正式應(yīng)用環(huán)境下會輸入相應(yīng)的詞匯,如“天秤”、“金?!钡?;如果用戶對游泳感興趣,則其在這些非正式應(yīng)用環(huán)境下會輸入相應(yīng)的詞匯,如“蛙泳”、“踩水”等;如果用戶對足球感興趣,則其在這些非正式應(yīng)用環(huán)境下會輸入相應(yīng)的詞匯,如“尤文圖斯”、“切爾西”等。
[0149]如果用戶有固定的職業(yè)習(xí)慣和/或興趣愛好,則會經(jīng)常輸入特定詞匯類別的詞匯。因此,用戶信息類別獲取方案2得到所述輸入歷史記錄所述的詞匯類別,將頻率最高的詞匯類別作為當(dāng)前用戶的用戶信息類別。在具體實(shí)現(xiàn)中,可以預(yù)置一系列的詞匯類別(詞匯所屬的類別,在實(shí)際中可以依據(jù)輸入法的專業(yè)詞匯類別和/或各大網(wǎng)站的頻道類別預(yù)置得到)。
[0150]以上對兩種用戶信息類別獲取方案進(jìn)行了詳細(xì)介紹,可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)需要結(jié)合使用上述幾種方案,或者,使用其中任一種方案,或者,使用其它方案獲取當(dāng)前用戶的用戶信息類別,本發(fā)明對此不加以限制。
[0151]綜上,所述當(dāng)前瀏覽頁面的類別主要為用戶瀏覽內(nèi)容的標(biāo)識,其與用戶的內(nèi)容需求密切相關(guān);所述當(dāng)前用戶的用戶信息類別能夠在一定程度上反映用戶的興趣愛好和/或職業(yè)習(xí)慣,其與用戶的個(gè)性化需求密切相關(guān);因此,本實(shí)施例在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇一項(xiàng)詞條信息;所述選取能夠從百科詞條的一項(xiàng)以上的詞條信息中選擇與當(dāng)前瀏覽頁面和/或當(dāng)前用戶最相關(guān)的一項(xiàng)詞條信息,故能夠使用盡可能小的區(qū)域展現(xiàn)最貼近用戶需求的一項(xiàng)詞條信息。
[0152]在本申請的一種優(yōu)選實(shí)施例中,所述方法還可以包括:
[0153]瀏覽器服務(wù)器端獲取所述百科詞條的各項(xiàng)詞條信息的詞條信息類別;
[0154]則所述根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇一項(xiàng)詞條信息的步驟具體可以為,在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),從所述百科詞條的一項(xiàng)以上的詞條信息中選擇詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別最匹配的一項(xiàng)詞條信息。
[0155]由于所述百科詞條的各項(xiàng)詞條信息由文字組成,故在實(shí)際中,可以采用頁面類別獲取方案3的原理獲取所述百科詞條的各項(xiàng)詞條信息的詞條信息類別,所述獲取過程具體可以包括:
[0156]步驟B1、瀏覽器服務(wù)器端對所述百科詞條的某項(xiàng)詞條信息進(jìn)行分詞處理,得到一系列的詞;
[0157]步驟B2、分析所述各詞在對應(yīng)的詞條信息類別的權(quán)重,將權(quán)重加和得到各詞條信息類別對應(yīng)的總權(quán)重,并以總權(quán)重最大時(shí)所對應(yīng)的詞條信息類別作為所述百科詞條的該項(xiàng)詞條信息的詞條信息類別。
[0158]在具體實(shí)現(xiàn)中,可以預(yù)置一系列的詞條信息類別(詞條信息所屬的類別,在實(shí)際中可以依據(jù)各大網(wǎng)站的頻道類別進(jìn)行預(yù)置得到)。
[0159]在實(shí)際中,可以將各項(xiàng)詞條信息的詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別進(jìn)行匹配,如果某項(xiàng)詞條信息對應(yīng)的詞條信息類別匹配率最大,可以認(rèn)為該詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別最匹配,選擇該詞條信息類別下的詞條信息返回給瀏覽器客戶端。
[0160]參照圖3,示出了本申請一種獲取詞條信息的方法實(shí)施例2的流程圖,具體可以包括:
[0161]步驟301、瀏覽器服務(wù)器端分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條;
[0162]步驟302、瀏覽器服務(wù)器端依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息;
[0163]步驟303、在所述百科詞條對應(yīng)一項(xiàng)詞條信息時(shí),瀏覽器服務(wù)器端將所該項(xiàng)詞條信息返回給相應(yīng)的瀏覽器客戶端;
[0164]步驟304、在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),瀏覽器服務(wù)器端根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇一項(xiàng)詞條信息;
[0165]步驟305、瀏覽器服務(wù)器端將所選擇的該項(xiàng)詞條信息返回給瀏覽器客戶端。
[0166]在上述獲取詞條信息的方法實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述即可。
[0167]并且,本領(lǐng)域技術(shù)人員易于想到的是:上述獲取詞條信息的方法實(shí)施例1 一實(shí)施例2任意組合應(yīng)用都是可行的,故上述獲取詞條信息的方法實(shí)施例1 一實(shí)施例2之間的任意組合都是本發(fā)明的實(shí)施方案,但是由于篇幅限制,本說明書在此就不一一詳述了。
[0168]為使本領(lǐng)域技術(shù)人員更好地本申請,以下提供本申請一種獲取和展現(xiàn)詞條信息的應(yīng)用方法實(shí)施例。
[0169]應(yīng)用方法實(shí)施例1、
[0170]應(yīng)用方法實(shí)施例1的應(yīng)用場景為,用戶在瀏覽一個(gè)與“孫悅”有關(guān)的網(wǎng)頁:http://sports.163.com/12/0317/16/7SQFA0VM00052UUC.html,當(dāng)前瀏覽頁面的標(biāo)題為“孫悅復(fù)出以賽代練找狀態(tài)稱不做林書豪的復(fù)制品”;所述應(yīng)用方法實(shí)施例1具體可以包括:
[0171]步驟R1、瀏覽器客戶端將當(dāng)前瀏覽頁面的頁面信息發(fā)送至瀏覽器服務(wù)器端;
[0172]步驟R2、瀏覽器服務(wù)器端對當(dāng)前瀏覽頁面的內(nèi)容進(jìn)行分析,即進(jìn)行分詞和詞頻統(tǒng)計(jì),與服務(wù)器端存儲的詞庫匹配,判斷出“孫悅”在該當(dāng)前瀏覽頁面中出現(xiàn)多次、且命中服務(wù)器端存儲的詞庫,于是將其作為百科詞條;
[0173]步驟R3、瀏覽器服務(wù)器端依據(jù)該百科詞條檢索得到相應(yīng)的詞條信息;該詞條信息為百科釋義http: //baike.baidu.com/view/6886, htm,可以看出,該百科詞條是一個(gè)多義詞,對應(yīng)了中國流行女歌手,中國籃球職業(yè)運(yùn)動(dòng)員,魯迅美術(shù)學(xué)院中國畫系講師等多項(xiàng)百科釋義;
[0174]步驟R4、依據(jù)該當(dāng)前瀏覽頁面的面包屑導(dǎo)航信息(網(wǎng)易〉體育頻道〉中國籃球〉正文),識別出該當(dāng)前瀏覽頁面 為“體育”類別;
[0175]步驟R5、對于對應(yīng)的多項(xiàng)百科釋義,依據(jù)分詞后的所有詞在對應(yīng)的詞條信息類別的權(quán)重得到各詞條信息類別對應(yīng)的總權(quán)重,將總權(quán)重最大時(shí)所對應(yīng)的詞條信息類別確定為相應(yīng)的詞條信息類別;
[0176]如“中國流行女歌手。九十年代中期中國流行樂壇……”的百科釋義,由于“歌手”、“音樂”等詞條在詞條信息類別“娛樂”的權(quán)重值很高,則計(jì)算出該項(xiàng)百科釋義在“娛樂”類別的權(quán)重值最高,從而確定為“娛樂”類別;如“中國職業(yè)籃球運(yùn)動(dòng)員。國家隊(duì):中國。中國男籃號碼:9……”,由于“籃球”、“運(yùn)動(dòng)員”等詞條在詞條信息類別“體育”的權(quán)重值很高,則計(jì)算出該項(xiàng)百科釋義在“體育”類別的權(quán)重值最高,從而確定為“體育”類別;如“魯迅美術(shù)學(xué)院中國畫系講師。從事中國人物畫、花島畫的教學(xué)與創(chuàng)作……”的百科釋義,由于“美術(shù)”,“人物畫”等詞條在“藝術(shù)”類別的權(quán)重值很高,計(jì)算出該釋義在詞條信息類別“藝術(shù)”的權(quán)重最高,從而確定為“藝術(shù)”類別。
[0177]步驟R6、瀏覽器服務(wù)器端根據(jù)所述當(dāng)前瀏覽頁面的類別,從該百科詞條的多項(xiàng)百科釋義中選擇一項(xiàng)百科釋義;
[0178]確定當(dāng)前瀏覽頁面類別“體育”與“中國職業(yè)籃球運(yùn)動(dòng)員”對應(yīng)的詞條信息類別“體育”最相匹配,選擇“中國職業(yè)籃球運(yùn)動(dòng)員”項(xiàng)作為待發(fā)送的百科釋義。
[0179]步驟R7、瀏覽器服務(wù)器端將所選擇的該項(xiàng)百科釋義封裝為XML格式,并返回給瀏覽器客戶端。
[0180]在此給出一種封裝后的XML格式的百科釋義的示例:
[0181]<baike>
<iit!c> <!/( ?)Α TA/ 孫悅 WJX.百科jj></丨itle>
<name> < !/(DA TA / 孫丨兌j /> </name>
<showurl> < 11CDA TA jhllp://haikc.baidu.com/view/6886.him/ j > </showuri
>
〈person〉<! [CDATA [中國職業(yè)籃球運(yùn)動(dòng)員]]></person>
<?ιη<<ζ> < ![CDA TA jhUp://imgsrc.baidu.coin/batke/abpic/Uem/cf'5a83166ci/34515f3de32eh.jpg//> </img>
<abs><![CDATA[個(gè)人檔案國家隊(duì):中國中國男籃號碼..9效力聯(lián)賽..AB孫悅大力扣籃…]]> </ahs>
</baike>
[0182]步驟R8、瀏覽器客戶端接收封裝為XML格式的百科釋義,將XML格式的百科釋義轉(zhuǎn)換為HTML格式,并將HTML格式的百科釋義嵌入至插件,由該插件利用前端腳本技術(shù)加載HTML格式的百科釋義,并進(jìn)行展現(xiàn)。
[0183]總之,應(yīng)用方法實(shí)施例1自動(dòng)展現(xiàn)與用戶當(dāng)前瀏覽頁面的類別最相關(guān)的那項(xiàng)百科釋義,故能夠使用盡可能小的區(qū)域展現(xiàn)最貼近用戶需求的一項(xiàng)詞條信息。
[0184]應(yīng)用方法實(shí)施例2、
`[0185]應(yīng)用方法實(shí)施例2的應(yīng)用場景為,假設(shè)用戶是一個(gè)美食達(dá)人,已經(jīng)瀏覽了一系列美食方面的網(wǎng)頁,然后點(diǎn)了一個(gè)介紹培根雞肉卷的頁面;所述應(yīng)用方法實(shí)施例2具體可以包括:
[0186]步驟S1、瀏覽器客戶端將當(dāng)前瀏覽頁面的頁面信息發(fā)送至瀏覽器服務(wù)器端;
[0187]步驟S2、瀏覽器服務(wù)器端對當(dāng)前瀏覽頁面的內(nèi)容進(jìn)行分析,即進(jìn)行分詞和詞頻統(tǒng)計(jì),與服務(wù)器端存儲的詞庫匹配,判斷出“培根”在該當(dāng)前瀏覽頁面中出現(xiàn)多次、且命中服務(wù)器端存儲的詞庫,于是將其作為百科詞條;
[0188]步驟S3、瀏覽器服務(wù)器端依據(jù)該百科詞條檢索得到相應(yīng)的詞條信息該詞條信息為百科釋義http://baike.baidu.com/view/1102, htm,可以看出,它是一個(gè)多義詞,對應(yīng)了英國哲學(xué)家,愛爾蘭畫家,培根肉制品等多項(xiàng)百科釋義;
[0189]步驟S4、分析當(dāng)前用戶在瀏覽器的訪問歷史記錄,即前100個(gè)訪問網(wǎng)頁,可以通過以利用上述三種頁面類別獲取方案中的一種或多種獲取每個(gè)網(wǎng)頁的頁面類別,將出現(xiàn)次數(shù)最多,即頻率最高的頁面類別為當(dāng)前用戶的用戶信息類別,可以判定出當(dāng)前用戶的用戶信息類別屬于“美食”類別;
[0190]步驟R5、對于對應(yīng)的多項(xiàng)百科釋義,依據(jù)分詞后的所有詞在對應(yīng)的詞條信息類別的權(quán)重得到各詞條信息類別對應(yīng)的總權(quán)重,將總權(quán)重最大時(shí)所對應(yīng)的詞條信息類別確定為相應(yīng)的詞條信息類別;
[0191]如“英國哲學(xué)家。佛朗西斯培根,英國文藝復(fù)興時(shí)期最重要的作家……”的百科釋義,由于“哲學(xué)”,“文藝復(fù)興”等詞條在詞條信息類別“歷史”的權(quán)重值很高,則計(jì)算出該項(xiàng)百科釋義在“歷史”類別的權(quán)重值最高,從而確定為“歷史”類別;如“愛爾蘭畫家。出生于愛爾蘭都柏林……”的百科釋義,由于“畫家”,“美術(shù)館”等詞條在詞條信息類別“藝術(shù)”的權(quán)重值很高,則計(jì)算出該項(xiàng)百科釋義在“藝術(shù)”類別的權(quán)重值最高,從而確定為“藝術(shù)”類別;如“培根肉制品。原意是煙熏肋條肉.....”的百科釋義,由于“肉制品”,“肋條肉”等詞條在詞條信息類別“美食”的權(quán)重值很高,則計(jì)算出該項(xiàng)百科釋義在“美食”類別的權(quán)重最高,從而確定為“美食”類別。
[0192]步驟R6、瀏覽器服務(wù)器端根據(jù)當(dāng)前用戶的用戶信息類別,從該百科詞條的多項(xiàng)百科釋義中選擇一項(xiàng)百科釋義;
[0193]確定當(dāng)前用戶的用戶信息類別“美食”與“培根肉制品”對應(yīng)的詞條信息類別“美食”最相匹配,選擇“培根肉制品”項(xiàng)作為待發(fā)送的百科釋義。
[0194]步驟R7、瀏覽器服務(wù)器端將所選擇的該項(xiàng)百科釋義封裝為XML格式,并返回給瀏覽器客戶端。
[0195]在此給出一種封裝后的XML格式的百科釋義的示例:
[0196]
【權(quán)利要求】
1.一種獲取詞條信息的方法,其特征在于,包括: 分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條; 依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息; 在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息; 將所選擇的該項(xiàng)詞條信息進(jìn)行返回。
2.如權(quán)利要求1所述的方法,其特征在于,所述對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息的步驟進(jìn)一步包括: 根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信息。
3.如權(quán)利要求2所述的方法,其特征在于,還包括: 獲取所述百科詞條的各項(xiàng)詞條信息的詞條信息類別; 則所述根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信息的步驟具體為,從所述百科詞條的一項(xiàng)以上的詞條信息中選擇詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別最匹配的一項(xiàng)詞條信息。
4.如權(quán)利要求1或2所述的方法,其特征在于,還包括: 分析所述當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別。
5.如權(quán)利要求1或2所述的方法,其特征在于,還包括: 分析所述當(dāng)前用戶的使用歷史信息,得到相應(yīng)的用戶信息類別。
6.如權(quán)利要求4所述的方法,其特征在于,所述分析所述當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別的步驟,包括: 分析所述當(dāng)前瀏覽頁面的統(tǒng)一資源定位符信息,得到相應(yīng)的當(dāng)前瀏覽頁面的類別;和/或 分析所述當(dāng)前瀏覽頁面的面包屑,導(dǎo)航得到相應(yīng)的當(dāng)前瀏覽頁面的類別;和/或分析所述當(dāng)前瀏覽頁面中所述百科詞條分別在各既定類別的權(quán)重,得到當(dāng)前瀏覽頁面的各既定類別的總權(quán)重,并以總權(quán)重最大的既定類別作為當(dāng)前瀏覽頁面的類別。
7.如權(quán)利要求5所述的方法,其特征在于,所述使用歷史信息包括:當(dāng)前用戶的瀏覽器訪問歷史記錄和/或輸入歷史記錄。
8.如權(quán)利要求7所述的方法,其特征在于,所述分析所述當(dāng)前用戶的使用歷史信息,得到相應(yīng)的用戶信息類別的步驟,包括: 分析獲取所述當(dāng)前用戶的瀏覽器訪問歷史記錄中對應(yīng)頁面的頁面類別,并將頻率最高的頁面類別作為當(dāng)前用戶的用戶信息類別;和/或 分析統(tǒng)計(jì)所述當(dāng)前用戶的輸入歷史記錄,得到所述輸入歷史記錄對應(yīng)的詞匯類別,并將頻率最高的詞匯類別作為當(dāng)前用戶的用戶信息類別。
9.如權(quán)利要求1所述的方法,其特征在于,所述當(dāng)前瀏覽頁面的頁面信息包括當(dāng)前瀏覽頁面的內(nèi)容; 所述分析當(dāng)前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條的步驟,包括: 對所述當(dāng)前瀏覽頁面的內(nèi)容進(jìn)行分詞處理,得到相應(yīng)的詞條;將所述詞條與服務(wù)器端存儲的詞庫進(jìn)行分析匹配; 將匹配成功的對應(yīng)詞條作為百科詞條。
10.如權(quán)利要求9所述的方法,其特征在于,還包括: 統(tǒng)計(jì)各詞條在所述當(dāng)前瀏覽頁面出現(xiàn)的頻率; 則將匹配成功的對應(yīng)詞條作為百科詞條的步驟具體為,將匹配成功、且統(tǒng)計(jì)的頻率超過既定頻率閾值的對應(yīng)詞條作為百科詞條。
11.一種展現(xiàn)詞條信息的方法,其特征在于,包括: 將當(dāng)前瀏覽頁面的頁面信息進(jìn)行發(fā)送; 接收與所述當(dāng)前瀏覽頁面對應(yīng)的百科詞條的詞條信息;所述詞條信息在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息分析選擇后進(jìn)行返回; 對所述詞條信息進(jìn)行展現(xiàn)。
12.如權(quán)利要求11所述的方法,其特征在于,所述對所述詞條信息進(jìn)行展現(xiàn)時(shí),采用彈窗形式對所述詞條信息進(jìn)行展現(xiàn)。
13.如權(quán)利要求11所述的方法,其特征在于,所述對所述詞條信息進(jìn)行展現(xiàn)時(shí),對所述詞條信息的長度進(jìn)行預(yù)估,結(jié)合預(yù)估結(jié)果展現(xiàn)所述詞條信息。
14.一種獲取詞條信息的裝置,其特征在于,包括: 百科詞條獲取模塊,用于分析當(dāng)`前瀏覽頁面的頁面信息,得到相應(yīng)的百科詞條; 百科詞條檢索模塊,用于依據(jù)所述百科詞條檢索得到相應(yīng)的詞條信息; 信息選擇模塊,用于在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息進(jìn)行分析,并選擇對應(yīng)一項(xiàng)詞條信息;及 返回模塊,用于將所選擇的該項(xiàng)詞條信息進(jìn)行返回。
15.如權(quán)利要求14所述的裝置,其特征在于,所述信息選擇模塊,具體用于根據(jù)所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別,從所述詞條信息中選擇一項(xiàng)詞條信肩、O
16.如權(quán)利要求15所述的裝置,其特征在于,還包括:詞條信息類別獲取模塊,用于獲取所述百科詞條的各項(xiàng)詞條信息的詞條信息類別;則所述信息選擇模塊,具體用于從所述百科詞條的一項(xiàng)以上的詞條信息中選擇詞條信息類別與所述當(dāng)前瀏覽頁面的類別和/或當(dāng)前用戶的用戶信息類別最匹配的一項(xiàng)詞條信肩、O
17.一種展現(xiàn)詞條信息的裝置,其特征在于,包括: 發(fā)送模塊,用于將當(dāng)前瀏覽頁面的頁面信息進(jìn)行發(fā)送; 接收模塊,用于接收與所述當(dāng)前瀏覽頁面對應(yīng)的百科詞條的詞條信息;所述詞條信息在所述百科詞條對應(yīng)的詞條信息為一項(xiàng)以上時(shí),對各項(xiàng)詞條信息分析選擇后進(jìn)行返回;及展現(xiàn)模塊,用于對所述詞條信息進(jìn)行展現(xiàn)。
18.如權(quán)利要求17所述的裝置,其特征在于,所述展現(xiàn)模塊,具體用于采用彈窗形式對與所述詞條信息進(jìn)行展現(xiàn)。
【文檔編號】G06F17/30GK103455524SQ201210183870
【公開日】2013年12月18日 申請日期:2012年6月5日 優(yōu)先權(quán)日:2012年6月5日
【發(fā)明者】王瀟, 周黃玲, 蘇雪峰 申請人:北京搜狗信息服務(wù)有限公司, 北京搜狗科技發(fā)展有限公司