專利名稱:網(wǎng)絡百科內容形成方法、網(wǎng)絡服務器和客戶端的制作方法
網(wǎng)絡百科內容形成方法、網(wǎng)絡服務器和客戶端
技術領域:
本發(fā)明涉及計算機技術領域,特別是涉及網(wǎng)絡百科內容形成方法、網(wǎng)絡服務器和
客戶端。
背景技術:
2000多年前,古希臘學者亞里士多德萌發(fā)了一個偉大的創(chuàng)意將當時的“學問”通過講義的形式全部記載下來,試圖編成人類歷史上最全面的“百科全書”。隨著信息技術的發(fā)展,上述編輯百科全書的夢想有可能由不斷迅猛發(fā)展的互聯(lián)網(wǎng)技術以及遍布全球的網(wǎng)民來完成。比如,目前,各種網(wǎng)絡百科依靠互聯(lián)網(wǎng)的開放、可重復擦寫、無地域限制、永遠在線的特點,逐漸出現(xiàn)。從2001年“維基百科”的創(chuàng)立開始,到傳統(tǒng)百
科領域“在線版”的Encyclopedia、Brockhaus等、微軟的Encarta、谷歌的Knol......形形
色色的網(wǎng)絡百科正在孕育、誕生、壯大。但是,仍存在阻礙網(wǎng)絡百科發(fā)展的因素,現(xiàn)有技術中,網(wǎng)民通過互聯(lián)網(wǎng)進行網(wǎng)絡百科編輯的方式,主要是通過網(wǎng)頁編輯的通行方式,即以段落為單元編輯文檔內容,效率較低,阻礙了網(wǎng)絡百科的進一步發(fā)展?,F(xiàn)有技術為提高網(wǎng)頁編輯的便利性,曾經于2003年I月29日公開一種發(fā)明專利申請?zhí)枮椤?1121910. 6”名稱為“模塊化的網(wǎng)頁編輯與實時轉換的網(wǎng)頁顯示系統(tǒng)與方法”的中國專利申請文件。所述系統(tǒng)中,當網(wǎng)頁瀏覽者經由互聯(lián)網(wǎng)連至該伺服器主機以瀏覽該目標網(wǎng)頁時,該伺服器主機始啟動該功能區(qū)塊轉換模塊,將該目標網(wǎng)頁中所包含的每一功能區(qū)塊轉換為相對應的圖形或文字顯示。而當該網(wǎng)頁瀏覽者按動該目標網(wǎng)頁中的功能連結時,該伺服器主機始啟動該功能連結轉換模塊,將該功能連結轉換為相對應的實際網(wǎng)址,并回傳給該網(wǎng)頁瀏覽者的瀏覽器,使該瀏覽器得以顯示出相對應實際網(wǎng)址的網(wǎng)頁。
發(fā)明內容
本發(fā)明提供了一種形成效率高、編輯方便的網(wǎng)絡百科內容形成方法、網(wǎng)絡服務器和客戶端。具體技術方案如下提供一種網(wǎng)絡百科內容形成方法,包括向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容;將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。其中,在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面步驟之前,包括向用戶呈現(xiàn)模塊化編輯界面的種類選擇界面;接收用戶選擇的模塊化編輯界面種類并向用戶呈現(xiàn)此類模塊化編輯界面。其中,在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面步驟中,每種所述百科內容對應唯一的百科模塊。
其中,通過數(shù)據(jù)挖掘的方式在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中。其中,在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容步驟包括選擇需要處理的本地非格式化現(xiàn)有詞條列表;在選擇好所述詞條列表后選擇詞條關鍵詞作為訓練集;在選擇關鍵詞后選擇分類方法并設定預定閾值條件,通過數(shù)據(jù)挖掘的方式在每個所述現(xiàn)有詞條列表的詞條中選擇與所述訓練集同屬一類的一級標題或者二級標題。其中,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到所述百科模塊對應的結構中步驟包括對所述一級標題或二級標題下的內容依據(jù)特點文字、換行以及字體信息進行分離得到不同子結構并依次抽取,將抽取后的所述文字、換行以及字體信息依次填寫到所述百科模塊對應的子結構中。
其中,通過動態(tài)或靜態(tài)接口調用外源數(shù)據(jù),并通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范,得到另一種所述百科模塊對應的結構,最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。其中,在得到另一種所述百科模塊對應的結構步驟之后、最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁之前,包括依據(jù)搜索平臺中所述外源數(shù)據(jù)相關查詢指令query的比例以及非百科現(xiàn)有資源的滿足情況判斷用戶需求的數(shù)量,根據(jù)所述用戶需求的數(shù)量決定本地詞條對應百科模塊與外源數(shù)據(jù)對應百科模塊的排名,用戶需求的數(shù)量越大則排名越靠前;在所述用戶需求的數(shù)量一致的情況下,分別判斷本地詞條內容與正文契合度、外源數(shù)據(jù)與正文契合度,使與正文契合程度高的百科模塊排名靠前,與正文契合度低的排名靠后。其中,所述百科內容種類包括文字、圖片、視頻、音頻。還提供一種網(wǎng)絡服務器,包括界面呈現(xiàn)單元,用于向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;內容接收單元,用于接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容;百科生成單元,用于將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。其中,所述服務器包括界面選擇單元,用于在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面之前,在界面呈現(xiàn)單元呈現(xiàn)的界面中向用戶呈現(xiàn)模塊化編輯界面的種類選擇界面;界面確定單元,用于接收用戶選擇的模塊化編輯界面種類并控制所述界面呈現(xiàn)單元向用戶呈現(xiàn)此類模塊化編輯界面。其中,每種所述百科內容對應唯一的百科模塊。其中,所述服務器包括內引模塊單元,用于通過數(shù)據(jù)挖掘的方式在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中。其中,所述內引模塊單元包括詞條列表選擇器,用于選擇需要處理的本地非格式化現(xiàn)有詞條列表;訓練集產生器,用于在選擇好所述詞條列表后選擇詞條關鍵詞作為訓練集;標題選擇器,用于在選擇關鍵詞后選擇分類方法并設定預定閾值條件,通過數(shù)據(jù)挖掘的方式在每個所述現(xiàn)有詞條列表的詞條中選擇與所述訓練集同屬一類的一級標題或者二級標題;百科模塊填充器,用于對所述一級標題或二級標題下的內容依據(jù)特點文字、換行以及字體信息進行分離得到不同子結構并依次抽取,將抽取后的所述文字、換行以及字體信息依次填寫到所述百科模塊對應的子結構中。其中,所述服務器包括外引模塊單元,用于通過動態(tài)或靜態(tài)接口調用外源數(shù)據(jù), 并通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范,得到另一種所述百科模塊對應的結構,最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。其中,所述服務器包括第一排名單元,用于在得到另一種所述百科模塊對應的結構之后,依據(jù)大眾搜索平臺中所述外源數(shù)據(jù)相關查詢指令query的比例以及非百科現(xiàn)有資源的滿足情況判斷用戶需求的數(shù)量,根據(jù)所述用戶需求的數(shù)量決定本地詞條對應百科模塊與外源數(shù)據(jù)對應百科模塊的排名,用戶需求的數(shù)量越大則排名越靠前;第二排名單元,用于在所述用戶需求的數(shù)量一致的情況下,分別判斷本地詞條內容與正文契合度、外源數(shù)據(jù)與正文契合度,使與正文契合程度高的百科模塊排名靠前,與正文契合度低的排名靠后。另提供一種客戶端,包括界面繪制單元,用于接收來自服務器的帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面數(shù)據(jù),并繪制所述模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;內容輸入單元,用于接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容,并向所述服務器發(fā)送。其中,所述客戶端包括選擇繪制單元,用于在繪制所述模塊化編輯界面時,一同在界面中繪制模塊化編輯界面的種類選擇界面;界面選定單元,用于接收用戶選擇的模塊化編輯界面種類并向所述服務器發(fā)送,觸發(fā)服務器返回此類模塊化編輯界面數(shù)據(jù)。由以上技術方案可以看出,針對現(xiàn)有技術網(wǎng)絡百科以段落為單元編輯文檔內容、效率較低的情況,本發(fā)明為網(wǎng)絡百科的形成提供模塊化、結構化的技術手段,即基于以下兩點1)基于模塊的文檔內容聚合;(2)結構化編輯技術手段。具體而言,是在編輯或處理網(wǎng)絡百科內容集時,以模塊而非段落為單元編輯文檔內容,用戶無需自行創(chuàng)建文檔的框架結構,只需依據(jù)給定框架的編輯界面編輯文檔內容。本發(fā)明脫離傳統(tǒng)互聯(lián)網(wǎng)用戶生成內容(UGC)以段落、章節(jié)為基本構成的文檔內容組織方式,建立以模塊為內容單元的文檔編輯流程與展示方式,既方便用戶編輯,同時為文檔內容的格式化輸出提了方法基礎與保障,填補互聯(lián)網(wǎng)行業(yè)中百科類產品結構化編輯的空白,能夠提高網(wǎng)絡百科的形成效率、方便編輯,有效促進網(wǎng)絡百科的發(fā)展。在一個實施例中,網(wǎng)絡百科的編輯流程隨不同模塊的給定格式而可以不同,所有編輯內容均對應唯一的模塊,這樣能夠讓用戶靈活選擇合適的百科模塊,也能夠極大地方便用戶,實現(xiàn)傻瓜式的操作。
圖I是本發(fā)明網(wǎng)絡百科內容形成方法實施例的流程圖;圖2是本發(fā)明網(wǎng)絡服務器實施例一的原理框圖;圖3是本發(fā)明網(wǎng)絡服務器實施例二的原理框圖;圖4是本發(fā)明網(wǎng)絡服務器實施例三的原理框圖5是本發(fā)明網(wǎng)絡服務器一實施例中內引模塊單元的結構示意圖;圖6是本發(fā)明網(wǎng)絡服務器實施例四的原理框圖;圖7是本發(fā)明客戶端實施例一的原理框圖;
圖8是本發(fā)明客戶端實施例二的原理框圖。
具體實施方式為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖和具體實施例對本發(fā)明進行詳細描述。參閱圖1,本發(fā)明網(wǎng)絡百科內容形成方法實施例包括步驟101 :向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;所述向用戶呈現(xiàn)模塊化編輯界面,可以通過服務器向客戶端呈現(xiàn)的方式,也可以是客戶端與服務器協(xié)議好,客戶端向用戶呈現(xiàn)模塊化編輯界面,而服務器則接收用戶輸入的數(shù)據(jù);所述模塊化編輯,具體而言,是在編輯或處理網(wǎng)絡百科內容集時,以模塊而非段落為單元編輯文檔內容,用戶無需自行創(chuàng)建文檔的框架結構,只需依據(jù)給定框架的編輯界面編輯文檔內容;由于模塊化編輯的框架結構,因此可集成各種百科內容;而在模塊化編輯界面中,每種百科內容則設有對應所述輸入窗口或選擇項,比如設有文字的輸入窗口、圖片的輸入窗口等等;所述輸入窗口可以輸入各種百科內容的數(shù)據(jù),比如文字、圖片、視頻等;所述選擇項可以采用下列列表方式或樹形、平板方式顯示各種可選項目,當選擇一種或幾種項目時,也是輸入百科內容的一種方式;在本實施例或其他實施例中,可以有另外一種用來進行百科內容輸入設置或編輯界面設置等的選擇項。步驟102 :接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容;在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面后,等待用戶在模塊化編輯界面上的操作,比如百科內容的輸入;當檢查到各個輸入窗口或選擇項有已完成的百科內容輸入或接收到用戶的確定指令時,接收用戶在各個輸入窗口或選擇項輸入的百科內容;步驟103 :將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。當接收完輸入的全部百科內容時,根據(jù)聚合指令,將輸入的百科內容聚合為預定格式的百科內容集,比如將各種文字、圖片、視頻等按預定格式聚合成一個百科內容集;所述百科內容集可以是網(wǎng)絡百科的一個最小百科單元,比如一篇文章、一件圖文集等等;也可以是幾個最小百科單元的聯(lián)合體,根據(jù)需要而設定;所述預定格式,是指預先設計好的各種網(wǎng)絡百科的結構、呈現(xiàn)形式等等。以上可以了解,本發(fā)明實施例為網(wǎng)絡百科的形成提供模塊化、結構化的技術手段,即基于以下兩點I)基于模塊的文檔內容聚合;2)結構化編輯技術手段。具體而言,是在編輯或處理網(wǎng)絡百科內容集時,以模塊而非段落為單元編輯文檔內容,用戶無需自行創(chuàng)建文檔 的框架結構,只需依據(jù)給定框架的編輯界面編輯文檔內容。本發(fā)明脫離傳統(tǒng)互聯(lián)網(wǎng)用戶生成內容(UGC)以段落、章節(jié)為基本構成的文檔內容組織方式,建立以模塊為內容單元的文檔編輯流程與展示方式,既方便用戶編輯,同時為文檔內容的格式化輸出提了方法基礎與保障,填補互聯(lián)網(wǎng)行業(yè)中百科類產品結構化編輯的空白,能夠提高網(wǎng)絡百科的形成效率、方便編輯,有效促進網(wǎng)絡百科的發(fā)展。在其他實施例中,在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面步驟之前,包括以下步驟I)向用戶呈現(xiàn)模塊化編輯界面的種類選擇界面;S卩,前述實施例中的模塊化編輯界面,可以進行選擇,不限于一種編輯界面,可以根據(jù)不同的喜好風格、不同的百科內容集要求進行選擇,比如電視劇的百科內容集的編輯界面,是不同于世界杯的百科內容集的編輯界面的;2)接收用戶選擇的模塊化編輯界面種類并向用戶呈現(xiàn)此類模塊化編輯界面。當接收用戶選擇的模塊化編輯界面種類后,即向用戶呈現(xiàn)此類模塊化編輯界面,以方便用戶后續(xù)的百科內容輸入。在其他實施例中,可以進一步包括如下步驟在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面步驟中,每種所述百科內容對應唯一的百科模塊。每種所述百科內容對應唯一的百科模塊,可以讓模塊化的實現(xiàn)更有效率,百科內容集的形成更加符合格式要求。在其他實施例中,除了根據(jù)用戶的當前輸入來形成百科內容集,還可以根據(jù)其他途徑來形成百科內容集,比如可以進一步包括如下步驟通過數(shù)據(jù)挖掘的方式在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中。在本實施例中,上述在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容步驟,可以稱之為“內引模塊”百科內容形成方式,即對現(xiàn)成的本地非格式化現(xiàn)有詞條內容進行整理,按照預定條件,對這些現(xiàn)有詞條內容先進行拆分,然后填充到一種所述百科模塊對應的結構中,形成百科內容集。進一步地,在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容步驟,可以詳細包括如下子步驟I)選擇需要處理的本地非格式化現(xiàn)有詞條列表;“內引模塊”百科內容形成方式中,先選擇需要處理的本地非格式化現(xiàn)有詞條列表;2)在選擇好所述詞條列表后選擇詞條關鍵詞作為訓練集;選擇詞條關鍵詞作為訓練集,以作為預定閥值條件的基準;3)在選擇關鍵詞后選擇分類方法并設定預定閾值條件,通過數(shù)據(jù)挖掘的方式在每個所述現(xiàn)有詞條列表的詞條中選擇與所述訓練集同屬一類的一級標題或者二級標題。進一步地,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到所述百科模塊對應的結構中步驟包括對所述一級標題或二級標題下的內容依據(jù)特點文字、換行以及字體信息進行分離得到不同子結構并依次抽取,將抽取后的所述文字、換行以及字體信息依次填寫到所述百科模塊對應的子結構中。當然,除了根據(jù)用戶的當前輸入來形成百科內容集,還可以根據(jù)其他途徑來形成百科內容集、以及內引模塊”百科內容形成方式,還存在更多的百科內容形成方式,比如包括如下步驟通過動態(tài)或靜態(tài)接口調用外源數(shù)據(jù),并通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范,得到另一種所述百科模塊對應的結構,最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。 這種百科內容形成方式,是采用動態(tài)或靜態(tài)接口對外界的數(shù)據(jù)即外源數(shù)據(jù)進行整理,以得到另一種所述百科模塊對應的結構,然后最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。此外,進一步地,在得到另一種所述百科模塊對應的結構步驟之后、最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁之前,還可以包括以下步驟I)依據(jù)搜索平臺中所述外源數(shù)據(jù)相關查詢指令query的比例以及非百科現(xiàn)有資源的滿足情況判斷用戶需求的數(shù)量,根據(jù)所述用戶需求的數(shù)量決定本地詞條對應百科模塊與外源數(shù)據(jù)對應百科模塊的排名,用戶需求的數(shù)量越大則排名越靠前;2)在所述用戶需求的數(shù)量一致的情況下,分別判斷本地詞條內容與正文契合度、外源數(shù)據(jù)與正文契合度,使與正文契合程度高的百科模塊排名靠前,與正文契合度低的排名靠后。上述實施例,是對形成的百科內容集的各種方式進行排序,排序的首要標準是用戶需求數(shù)量,其次是與正文契合度。本發(fā)明實施例中,所述百科內容種類包括文字、圖片、視頻或音頻,還可以是綜合類等,甚至在文字類中,也可以細分為不同的類。參閱圖2,基于本發(fā)明精神,提供一種網(wǎng)絡服務器實施例,所述網(wǎng)絡服務器包括界面呈現(xiàn)單元,用于向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;所述界面呈現(xiàn)單元可以是負責向客戶端呈現(xiàn)界面的程序,也可以是顯示器等硬件結構;內容接收單元,用于接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容;所述內容接收單元可以是各種程序輸入接口,也可以是硬件結構;百科生成單元,用于將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。所述百科生成單元可以是計算機內部的程序模塊,也可以是處理器等硬件結構。如前述,所述網(wǎng)絡服務器對網(wǎng)絡百科的形成技術,脫離傳統(tǒng)互聯(lián)網(wǎng)用戶生成內容(UGC)以段落、章節(jié)為基本構成的文檔內容組織方式,即建立以模塊為內容單元的文檔編輯流程與展示方式,既方便用戶編輯,同時為文檔內容的格式化輸出提了方法基礎與保障,填補互聯(lián)網(wǎng)行業(yè)中百科類產品結構化編輯的空白,能夠提高網(wǎng)絡百科的形成效率、方便編輯,有效促進網(wǎng)絡百科的發(fā)展。
參閱圖3,在其他實施例中,所述服務器包括界面選擇單元,用于在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面之前,在界面呈現(xiàn)單元呈現(xiàn)的界面中向用戶呈現(xiàn)模塊化編輯界面的種類選擇界面;界面確定單元,用于接收用戶選擇的模塊化編輯界面種類并控制所述界面呈現(xiàn)單元向用戶呈現(xiàn)此類模塊化編輯界面。同理,上述兩單元可以是程序,也可以是硬件結構。在其他實施例中,每種所述百科內容對應唯一的百科模塊。參閱圖4,在其他實施例中,為加快網(wǎng)絡百科的形成速度、增加百科內容的豐富度,所述服務器包括內引模塊單元,用于通過數(shù)據(jù)挖掘的方式在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中。其中,所述將非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中的動作,可以由前述的百科生成單元完成。參閱圖5,在其他實施例中,進一步地,所述內引模塊單元包括詞條列表選擇器,用于選擇需要處理的本地非格式化現(xiàn)有詞條列表;訓練集產生器,用于在選擇好所述詞條列表后選擇詞條關鍵詞作為訓練集;標題選擇器,用于在選擇關鍵詞后選擇分類方法并設定預定閾值條件,通過數(shù)據(jù)挖掘的方式在每個所述現(xiàn)有詞條列表的詞條中選擇與所述訓練集同屬一類的一級標題或者二級標題;百科模塊填充器,用于對所述一級標題或二級標題下的內容依據(jù)特點文字、換行以及字體信息進行分離得到不同子結構并依次抽取,將抽取后的所述文字、換行以及字體信息依次填寫到所述百科模塊對應的子結構中。參閱圖6,在其他實施例中,為加快網(wǎng)絡百科的形成速度、增加百科內容的豐富度,所述服務器包括外引模塊單元,用于通過動態(tài)或靜態(tài)接口調用外源數(shù)據(jù),并通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范,得到另一種所述百科模塊對應的結構,最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。、
其中,所述通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范得到另一種所述百科模塊對應的結構動作,可以由前述的百科生成單元完成。為更好整合外引模塊單元和內引模塊單元的功能,所述服務器包括第一排名單元,用于在得到另一種所述百科模塊對應的結構之后,依據(jù)大眾搜索平臺中所述外源數(shù)據(jù)相關查詢指令query的比例以及非百科現(xiàn)有資源的滿足情況判斷用戶需求的數(shù)量,根據(jù)所述用戶需求的數(shù)量決定本地詞條對應百科模塊與外源數(shù)據(jù)對應百科模塊的排名,用戶需求的數(shù)量越大則排名越靠前;第二排名單元,用于在所述用戶需求的數(shù)量一致的情況下,分別判斷本地詞條內容與正文契合度、外源數(shù)據(jù)與正文契合度,使與正文契合程度高的百科模塊排名靠前,與正文契合度低的排名靠后。
參閱圖7,基于本發(fā)明精神,還提供一種客戶端實施例,包括界面繪制單元,用于接收來自服務器的帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面數(shù)據(jù),并繪制所述模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;內容輸入單兀,用于接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容,并向所述服務器發(fā)送。參閱圖8,為提供更多的編輯界面種類選擇,所述客戶端包括選擇繪制單元,用于在繪制所述模塊化編輯界面時,一同在界面中繪制模塊化編 輯界面的種類選擇界面;界面選定單元,用于接收用戶選擇的模塊化編輯界面種類并向所述服務器發(fā)送,觸發(fā)服務器返回此類模塊化編輯界面數(shù)據(jù)。下面以形成某電視劇的百科內容集為例,說明本發(fā)明的其中一個實施例第一步提供模塊化編輯界面的種類選擇界面;比如在一個網(wǎng)頁窗口形式的編輯界面中,第一窗口設有“選擇模板”的操作界面,讓用戶選擇諸如劇情簡介或分集劇情等的模板,每一模板對應有單獨的編輯界面;第二步接收用戶對模塊化編輯界面的種類選擇指令;等用戶選擇了劇情簡介的模板后,接收該選擇指令;第三步提供劇情簡介模板的編輯界面,用戶可以編輯該編輯界面,以更自由、靈活的形成用戶需要的百科內容集;比如編輯劇情簡介的模板,使其具有一級目錄、二級目錄、劇集圖片等;第四步在編輯好劇情簡介模板的編輯界面后,向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;這一步,實際上在編輯劇情簡介模板的編輯界面過程中動態(tài)更新該界面,這里的輸入窗口或選擇項,即所述的一級目錄、二級目錄、劇集圖片、劇集介紹等;第五步接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容;用戶在劇情簡介模板的編輯界面中,在劇集介紹的窗口中輸入劇情介紹,設定好一級目錄還是二級目錄、點擊上傳按鈕上載劇集圖片后,系統(tǒng)自動接收這些信息;第六步將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集;系統(tǒng)將劇情介紹、好一級目錄還是二級目錄的設定、劇集圖片等輸入的百科內容自動聚合為預定格式的百科內容集,完成編輯。在完成編輯后,向用戶呈現(xiàn)百科內容集的網(wǎng)頁形式,用戶可以瀏覽。并且,可以在瀏覽的網(wǎng)頁中的每個百科內容上方或下方,設編輯按鈕,比如劇情編輯、詞條編輯等,有權限的用戶可以點擊編輯。點擊后彈出編輯界面或在原網(wǎng)頁加載編輯界面,對該百科內容進行修改、更新或刪除等操作。本發(fā)明的百科內容并不限于上述形式,可以采用已經存在的各種百科內容形式、甚至隨著社會、科技的發(fā)展采用各種新百科內容形式;本發(fā)明的百科內容形成方法、服務器和客戶端并不限于上述的實施例,只要建立以模塊為內容單元的文檔編輯流程與展示方式,都可以應用。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所做的任何修改、等同替換、改進等, 均應包含在本發(fā)明保護的范圍之內。
權利要求
1.一種網(wǎng)絡百科內容形成方法,其特征在于,包括 向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項; 接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容; 將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。
2.根據(jù)權利要求I所述的方法,其特征在于,包括 在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面步驟之前,包括 向用戶呈現(xiàn)模塊化編輯界面的種類選擇界面; 接收用戶選擇的模塊化編輯界面種類并向用戶呈現(xiàn)此類模塊化編輯界面。
3.根據(jù)權利要求2所述的方法,其特征在于,包括 在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面步驟中,每種所述百科內容對應唯一的百科模塊。
4.根據(jù)權利要求3所述的方法,其特征在于,包括 通過數(shù)據(jù)挖掘的方式在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中。
5.根據(jù)權利要求4所述的方法,其特征在于,包括 在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容步驟包括 選擇需要處理的本地非格式化現(xiàn)有詞條列表; 在選擇好所述詞條列表后選擇詞條關鍵詞作為訓練集; 在選擇關鍵詞后選擇分類方法并設定預定閾值條件,通過數(shù)據(jù)挖掘的方式在每個所述現(xiàn)有詞條列表的詞條中選擇與所述訓練集同屬一類的一級標題或者二級標題。
6.根據(jù)權利要求5所述的方法,其特征在于,包括 將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到所述百科模塊對應的結構中步驟包括對所述一級標題或二級標題下的內容依據(jù)特點文字、換行以及字體信息進行分離得到不同子結構并依次抽取,將抽取后的所述文字、換行以及字體信息依次填寫到所述百科模塊對應的子結構中。
7.根據(jù)權利要求4所述的方法,其特征在于,包括 通過動態(tài)或靜態(tài)接口調用外源數(shù)據(jù),并通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范,得到另一種所述百科模塊對應的結構,最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。
8.根據(jù)權利要求7所述的方法,其特征在于,在得到另一種所述百科模塊對應的結構步驟之后、最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁之前,包括 依據(jù)搜索平臺中所述外源數(shù)據(jù)相關查詢指令query的比例以及非百科現(xiàn)有資源的滿足情況判斷用戶需求的數(shù)量,根據(jù)所述用戶需求的數(shù)量決定本地詞條對應百科模塊與外源數(shù)據(jù)對應百科模塊的排名,用戶需求的數(shù)量越大則排名越靠前; 在所述用戶需求的數(shù)量一致的情況下,分別判斷本地詞條內容與正文契合度、外源數(shù)據(jù)與正文契合度,使與正文契合程度高的百科模塊排名靠前,與正文契合度低的排名靠后。
9.根據(jù)權利要求3至8任一項所述的方法,其特征在于,包括 所述百科內容種類包括文字、圖片、視頻、音頻。
10.一種網(wǎng)絡服務器,其特征在于,包括 界面呈現(xiàn)單元,用于向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;內容接收單元,用于接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容; 百科生成單元,用于將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。
11.根據(jù)權利要求10所述的服務器,其特征在于,所述服務器包括 界面選擇單元,用于在向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面之前,在界面呈現(xiàn)單元呈現(xiàn)的界面中向用戶呈現(xiàn)模塊化編輯界面的種類選擇界面; 界面確定單元,用于接收用戶選擇的模塊化編輯界面種類并控制所述界面呈現(xiàn)單元向用戶呈現(xiàn)此類模塊化編輯界面。
12.根據(jù)權利要求11所述的服務器,其特征在于 每種所述百科內容對應唯一的百科模塊。
13.根據(jù)權利要求12所述的服務器,其特征在于,所述服務器包括 內引模塊單元,用于通過數(shù)據(jù)挖掘的方式在給定樣本空間下在本地非格式化現(xiàn)有詞條內容中尋找并讀取相似度滿足預定閾值條件的內容,將所述非格式化的現(xiàn)有詞條內容拆分為不同的子結構并依次填充到一種所述百科模塊對應的結構中。
14.根據(jù)權利要求13所述的服務器,其特征在于,所述內引模塊單元包括 詞條列表選擇器,用于選擇需要處理的本地非格式化現(xiàn)有詞條列表; 訓練集產生器,用于在選擇好所述詞條列表后選擇詞條關鍵詞作為訓練集; 標題選擇器,用于在選擇關鍵詞后選擇分類方法并設定預定閾值條件,通過數(shù)據(jù)挖掘的方式在每個所述現(xiàn)有詞條列表的詞條中選擇與所述訓練集同屬一類的一級標題或者二級標題; 百科模塊填充器,用于對所述一級標題或二級標題下的內容依據(jù)特點文字、換行以及字體信息進行分離得到不同子結構并依次抽取,將抽取后的所述文字、換行以及字體信息依次填寫到所述百科模塊對應的子結構中。
15.根據(jù)權利要求13所述的服務器,其特征在于,所述服務器包括 外引模塊單元,用于通過動態(tài)或靜態(tài)接口調用外源數(shù)據(jù),并通過詞條篩選與內容篩選對所述外源數(shù)據(jù)進行整理規(guī)范,得到另一種所述百科模塊對應的結構,最終以結構化的方式將所述外源數(shù)據(jù)展示在詞條瀏覽頁。
16.根據(jù)權利要求15所述的服務器,其特征在于,所述服務器包括 第一排名單元,用于在得到另一種所述百科模塊對應的結構之后,依據(jù)大眾搜索平臺中所述外源數(shù)據(jù)相關查詢指令query的比例以及非百科現(xiàn)有資源的滿足情況判斷用戶需求的數(shù)量,根據(jù)所述用戶需求的數(shù)量決定本地詞條對應百科模塊與外源數(shù)據(jù)對應百科模塊的排名,用戶需求的數(shù)量越大則排名越靠前; 第二排名單元,用于在所述用戶需求的數(shù)量一致的情況下,分別判斷本地詞條內容與正文契合度、外源數(shù)據(jù)與正文契合度,使與正文契合程度高的百科模塊排名靠前,與正文契合度低的排名靠后。
17.一種客戶端,其特征在于,包括 界面繪制單元,用于接收來自服務器的帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面數(shù)據(jù),并繪制所述模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項; 內容輸入單元,用于接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容,并向所述服務器發(fā)送。
18.根據(jù)權利要求17所述的客戶端,其特征在于,所述客戶端包括 選擇繪制單元,用于在繪制所述模塊化編輯界面時,一同在界面中繪制模塊化編輯界面的種類選擇界面; 界面選定單元,用于接收用戶選擇的模塊化編輯界面種類并向所述服務器發(fā)送,觸發(fā)服務器返回此類模塊化編輯界面數(shù)據(jù)。
全文摘要
本發(fā)明提供一種網(wǎng)絡百科內容形成方法、網(wǎng)絡服務器和客戶端,屬于計算機技術領域。所述方法包括向用戶呈現(xiàn)帶有輸入窗口或選擇項的可集成各種百科內容的模塊化編輯界面,每種百科內容設有對應所述輸入窗口或選擇項;接收用戶在所述編輯界面相應輸入窗口或選擇項輸入的百科內容;將所述輸入窗口或選擇項輸入的百科內容聚合為預定格式的百科內容集。本發(fā)明能夠提高網(wǎng)絡百科的形成效率、方便編輯,有效促進網(wǎng)絡百科的發(fā)展。
文檔編號G06F9/44GK102637173SQ201110035730
公開日2012年8月15日 申請日期2011年2月10日 優(yōu)先權日2011年2月10日
發(fā)明者嚴冰, 唐益龍, 戴少偉, 李天華, 李永強, 李超, 王坤, 鄧亮, 陳浩然 申請人:北京百度網(wǎng)訊科技有限公司