基于xml的文字信息處理方法和文字內容服務器的制造方法
【專利摘要】本發(fā)明提供一種基于XML的文字信息處理方法和文字內容服務器。方法,包括:文字內容服務器獲取待處理的一段文字信息;所述文字內容服務器采用預先存儲的至少兩種評價規(guī)則描述文件,確定所述待處理的該段文字信息的評價信息,其中,各評價規(guī)則描述文件用于對一段文字信息的一類特征內容所對應的評價信息進行描述,且所述評價規(guī)則描述文件為采用XML描述的文件;所述文字內容服務器采用獲得的各評價信息對該段文字信息進行標記。本發(fā)明使得用戶在進行檢索時可以根據該評價信息獲得該段文字的綜合評價,盡快找到用戶所需的內容。
【專利說明】基于XML的文字信息處理方法和文字內容服務器
【技術領域】
[0001] 本發(fā)明涉及計算機技術,尤其涉及一種基于可擴展標記語言(Extensible Markup Language,以下簡稱:XML)的文字信息處理方法和文字內容服務器。
【背景技術】
[0002] 隨著互聯(lián)網技術的不斷發(fā)展,人類正在迎來一個信息大爆炸的時代。人們可以通 過網絡獲取到大量的文字信息,例如新聞、論文、微博等。
[0003] 在這大量的文字信息中,用戶在需要查找自己所需要的文字信息時,時長會受到 一些無效信息、不感興趣的信息、甚至一些非法信息的干擾,從而為用戶的查找?guī)聿槐恪?br>
[0004] 因此,在現(xiàn)有存在大量文字信息的情況下,如何使用戶方便地獲知一段文字信息 的綜合評價,以便用戶更快地找到其所需內容,成為亟待解決的問題。
【發(fā)明內容】
[0005] 本發(fā)明提供一種基于XML的文字信息處理方法和文字內容服務器。
[0006] 本發(fā)明提供一種基于XML的文字信息處理方法,包括:
[0007] 文字內容服務器獲取待處理的一段文字信息;
[0008] 所述文字內容服務器采用預先存儲的至少兩種評價規(guī)則描述文件,確定所述待處 理的該段文字信息的評價信息,其中,各評價規(guī)則描述文件用于對一段文字信息的一類特 征內容所對應的評價信息進行描述,且所述評價規(guī)則描述文件為采用XML描述的文件; [0009] 所述文字內容服務器采用獲得的各評價信息對該段文字信息進行標記。
[0010] 本發(fā)明提供一種文字內容服務器,包括:
[0011] 獲取模塊,用于確定待處理的一段文字信息;
[0012] 確定模塊,用于采用預先存儲的至少兩種評價規(guī)則描述文件,確定所述待處理的 該段文字信息的評價信息,其中,各評價規(guī)則描述文件用于對一段文字信息的一類特征內 容所對應的評價信息進行描述,且所述評價規(guī)則描述文件為采用XML描述的文件;
[0013] 標記模塊,用于采用獲得的各評價信息對該段文字信息進行標記。
[0014] 本發(fā)明中,文字內容服務器上可以預存用于對一段文字信息的至少兩類特征內容 所對應的評價信息分別進行描述的評價規(guī)則描述文件,通過該評價規(guī)則描述文件可以對一 段文字信息的各類特征內容進行評價,從而從多個角度對該段文字信息進行綜合評價,并 采用該評價信息對該段文字信息進行標記,進而使得用戶在進行檢索時,可以根據該評價 信息獲得該段文字的綜合評價,盡快找到用戶所需的內容。而且,該評價規(guī)則描述文件采用 XML來描述,其通用性和擴展性較好。
【專利附圖】
【附圖說明】
[0015] 圖1為本發(fā)明基于XML的文字信息處理方法實施例的流程圖;
[0016] 圖2為本發(fā)明文字內容服務器實施例的結構示意圖。
【具體實施方式】
[0017] 圖1為本發(fā)明基于XML的文字信息處理方法實施例的流程圖,如圖1所示,本實施 例的方法可以包括:
[0018] 步驟101、文字內容服務器獲取待處理的一段文字信息;
[0019] 步驟102、文字內容服務器采用預先存儲的至少兩種評價規(guī)則描述文件,確定所述 待處理的文字信息的評價信息,其中,各評價規(guī)則描述文件用于對一段文字信息的一類特 征內容所對應的評價信息進行描述,且所述評價規(guī)則描述文件為采用XML描述的文件;
[0020] 步驟103、文字內容服務器采用獲得的各評價信息對該段文字信息進行標記。
[0021] 具體來說,文字內容服務器可以預先生成并存儲至少兩個評價規(guī)則描述文件。而 且,該評價規(guī)則描述文件為采用XML描述的文件,每個評價規(guī)則描述文件可以用于對一段 文字信息的一類特征內容所對應的評價信息進行描述。
[0022] 舉例來說,字數、敏感詞、關鍵詞出現(xiàn)頻率等均可以作為一段文字信息的特征內 容。對應地,該文字內容服務器上即可存儲與每類特征內容對應的評價規(guī)則描述文件。
[0023] 以字數為特征內容舉例來說,對應的評價規(guī)則,例如可以為:
[0024] 文章整體字數在0-100字,且標題大于30字,得60分;
[0025] 文章整體字數在100-200字,得70分;
[0026] 文章整體字數在200-300字,得80分;
[0027] 文章整體字數在300-400字,得90分;
[0028] 文章整體字數在500字以上,得100分;
[0029] 其余文章得0分。
[0030] 為了描述該評價規(guī)則,本實施例采用XML描述的評價規(guī)則描述文件來實現(xiàn)。例如 schema文件,其描述框架,例如可以如下所示:
[0031]
【權利要求】
1. 一種基于可擴展標記語言XML的文字信息處理方法,其特征在于,包括: 文字內容服務器獲取待處理的一段文字信息; 所述文字內容服務器采用預先存儲的至少兩種評價規(guī)則描述文件,確定所述待處理的 該段文字信息的評價信息,其中,各評價規(guī)則描述文件用于對一段文字信息的一類特征內 容所對應的評價信息進行描述,且所述評價規(guī)則描述文件為采用XML描述的文件; 所述文字內容服務器采用獲得的各評價信息對該段文字信息進行標記。
2. 根據權利要求1所述的方法,其特征在于,所述文字內容服務器獲取待處理的一段 文字信息之前,還包括: 生成所述至少兩種評價規(guī)則描述文件并存儲。
3. 根據權利要求1或2所述的方法,其特征在于,所述文字內容服務器采用獲得的各評 價信息對該段文字信息進行標記之后,還包括: 所述文字內容服務器接收用戶輸入的搜索請求,所述搜索請求中包含關鍵字; 所述文字內容服務器確定與所述關鍵字對應的文字信息; 所述文字內容服務器向所述用戶推送搜索結果,所述搜索結果包括所述文字信息和該 文字信息對應的各評價信息。
4. 根據權利要求1或2所述的方法,其特征在于,所述文字內容服務器采用獲得的各評 價信息對該段文字信息進行標記之后,還包括: 所述文字內容服務器接收用戶輸入的搜索請求,所述搜索請求中包含關鍵字和用戶需 求信息; 所述文字內容服務器確定與所述關鍵字對應的文字信息,并根據所述文字信息對應的 各評價信息確定滿足用戶需求信息的文字信息; 所述文字內容服務器將滿足用戶需求的文字信息推送給所述用戶。
5. -種文字內容服務器,其特征在于,包括: 獲取模塊,用于確定待處理的一段文字信息; 確定模塊,用于采用預先存儲的至少兩種評價規(guī)則描述文件,確定所述待處理的該段 文字信息的評價信息,其中,各評價規(guī)則描述文件用于對一段文字信息的一類特征內容所 對應的評價信息進行描述,且所述評價規(guī)則描述文件為采用XML描述的文件; 標記模塊,用于采用獲得的各評價信息對該段文字信息進行標記。
6. 根據權利要求5所述的服務器,其特征在于,還包括: 生成模塊,用于在所述獲取模塊獲取待處理的一段文字信息之前,生成所述至少兩種 評價規(guī)則描述文件并存儲。
7. 根據權利要求5或6所述的服務器,其特征在于,還包括: 搜索處理模塊,用于接收用戶輸入的搜索請求,所述搜索請求中包含關鍵字;確定與所 述關鍵字對應的文字信息;向所述用戶推送搜索結果,所述搜索結果包括所述文字信息和 該文字信息對應的各評價信息;或者,用于接收用戶輸入的搜索請求,所述搜索請求中包含 關鍵字和用戶需求信息;確定與所述關鍵字對應的文字信息,并根據所述文字信息對應的 各評價信息確定滿足用戶需求信息的文字信息;將滿足用戶需求的文字信息推送給所述用 戶。
【文檔編號】G06F17/30GK104424252SQ201310381678
【公開日】2015年3月18日 申請日期:2013年8月28日 優(yōu)先權日:2013年8月28日
【發(fā)明者】畢繼安 申請人:北大方正集團有限公司, 北京北大方正電子有限公司