專利名稱:基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法
技術領域:
本發(fā)明涉及一種基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法,屬于云計算領域的服務應用技術研究。
背景技術:
水利事業(yè)事關國家命脈,防汛防旱又是水利事業(yè)的重中之重,關系重大。能夠更高效,更方便,更快速地將實時的天氣、水雨情、災情等狀況詳細地反映出來,并做出及時的應急措施,會大大減少汛情或旱情帶來的巨大損失。傳統(tǒng)的水利防汛防旱簡報寫作過程,需要多名工作人員合作,要從多個遺產(chǎn)系統(tǒng)中查詢相關數(shù)據(jù)、編寫相關報告、手動繪制圖表等相關工作,存在以下主要問題:I)傳統(tǒng)防汛防旱簡報均以文件的方式保存在文件系統(tǒng)中,難以分類查找;2)防汛防旱簡報中涉及如氣象、水文、災害等多項實時數(shù)據(jù),需要從多個相關遺產(chǎn)系統(tǒng)中獲取數(shù)據(jù),耗費時間多、操作繁瑣;3)數(shù)據(jù)的分析和處理,圖標的生成需要人為手工完成,計算復雜;4)要求工作人員有多年的工作經(jīng)驗。顯然傳統(tǒng)撰寫防汛防旱簡報的方式耗費人力較多,且實時性較差,造成不必要的損失。隨著云計算的發(fā)展和“水利云”平臺的建設成功,充分利用云服務帶來的安全、快捷、準確的實時數(shù)據(jù),構建一套云環(huán)境中的防訊防旱簡報自動生成系統(tǒng),成為一種趨勢。
發(fā)明內容
發(fā)明目的:針對上述現(xiàn)有防汛防旱簡報編寫所存在的問題和不足,本發(fā)明的目的是提供一種基于水利云平臺的防汛防旱簡報自動生成系統(tǒng)的構建方法。技術方案:一種基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法,根據(jù)用戶的相關需求以及防汛防旱簡報類型,自動從防汛防旱簡報數(shù)據(jù)庫中檢索出相關段落,并自動選擇匹配度最高的段落組合生成一篇完整防汛防旱簡報,系統(tǒng)分為防汛防旱簡報錄入過程和防汛防旱簡報生成過程,錄入過程包括:步驟11:對已有的歷年防汛防旱簡報的分類,如按年份、旱澇年、緊要程度、報送級別等分類,然后添加相應的分類標簽;步驟12:錄入文章標題和標簽;步驟13:判斷是否已錄入文章標題和標簽,若未錄入或文章已存在返回步驟11,否則跳到步驟14 ;步驟14:為歷年的防汛防旱簡報的每個章節(jié)添加章節(jié)標簽,標記章節(jié)內的重要關鍵詞語;步驟15:錄入章節(jié)標題和標簽;步驟16:判斷是否已錄入章節(jié)標題和標簽,若未錄入,跳到步驟15,否則跳到步驟17 ;
步驟17:給未錄入的章節(jié)添加章節(jié)段落,并為段落錄入標題、內容、標簽,并保存;步驟18:若所有段落已錄入跳到步驟19,否則返回步驟17 ;步驟19:保存至文檔數(shù)據(jù)庫并返回操作結果。當有足量的相關歷史防汛防旱簡報被錄入,生成系統(tǒng)就能夠靈活,快捷地根據(jù)用戶需求生成防汛防旱簡報,防汛防旱簡報生成過程包括:步驟21:根據(jù)現(xiàn)有防汛防旱簡報標簽庫中標簽的搜索熱度,降序生成推薦標簽列表,以供用戶選擇;步驟22:用戶點選一個或多個標簽;步驟23:若需要進行補充,用戶輸入更多需要查詢的標簽;步驟24:判斷用戶是否提交標簽集,或未提交返回步驟22,否則跳到步驟25 ;步驟25:獲取用戶輸入的標簽集,并從防汛防旱簡報庫中檢索;步驟26:根據(jù)多模式防訊防旱簡報標簽匹配算法(Mult1-Mode Label MatchingAlgorithm)計算文章匹配度,降序輸出文章列表;步驟27:選擇匹配度最高的作為模板,展開文章章節(jié)和段落;步驟28:若段落中含有實時數(shù)據(jù),跳到步驟29,否則跳到步驟211 ;步驟29:從云平臺中選擇符合標簽的云服務獲取相關數(shù)據(jù),并將段落中的數(shù)據(jù)替換;步驟210:將數(shù)云服務獲取的數(shù)據(jù)以柱狀圖、餅圖、折線圖或數(shù)據(jù)表等形式插入至實時段落之后,用戶也可根據(jù)需要添加和刪除;步驟211:判斷用戶是否選擇修改章節(jié)或段落,若需要修改跳到步驟212,否則跳到步驟214 ;步驟212:根據(jù)需要修改的章節(jié)/段落標簽,根據(jù)MLMA算法檢索與內容相似的章節(jié)/段落作為備選;步驟213:用戶選擇并修改相關段落內容,并保存;步驟214:生成完整的防汛防旱簡報草稿,并預覽。本發(fā)明采用上述技術方案,具有以下有益效果:基于水利云平臺的防汛防旱簡報自動生成系統(tǒng)的構建方法,基于淮安防辦的水利云平臺,考慮到防汛防旱簡報生成過程的特點,充分利用云平臺資源共享的優(yōu)勢,快速、準確、高效地為段落獲取實時數(shù)據(jù);同時將文件形式的防汛防旱簡報抽象為離散的防汛防旱簡報、章節(jié)和段落3類對象,同一篇文章會相互關聯(lián);對象分別用標簽對其內容進行描述或概況,以便能夠進行檢索;設計了多模式標簽匹配算法(MLMA)完成對這3類對象的檢索工作。從而能夠高效、快捷地生成符合需求的水利防汛防旱簡報。
圖1為本發(fā)明實施例的防汛防旱簡報錄入流程圖;圖2為本發(fā)明實施例的防汛防旱簡報檢索流程圖。
具體實施例方式下面結合具體實施例,進一步闡明本發(fā)明,應理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領域技術人員對本發(fā)明的各種等價形式的修改均落于本申請所附權利要求所限定的范圍?;谒破脚_的防汛防旱簡報生成系統(tǒng)的構建方法:首先,利用基于標簽的防汛防旱簡報描述模型,將文件形式的防汛防旱簡報抽象為離散的防汛防旱簡報、章節(jié)和段落3類對象。防汛防旱簡報描述模型規(guī)則如下:I)防汛防旱簡報結構:在本模型下,傳統(tǒng)防汛防旱簡報被分為3類對象,分別是防汛防旱簡報對象(Doc),章節(jié)對象(Section),段落對象(Para);每一篇實際防汛防旱簡報由3種對象實體進行描述;每類對象實體又同時由一個或多個標簽對象(Label)進行描述;這4類對象構成該模型下的防訊防旱簡報組成結構;document = {D, S,P, L}2)防汛防旱簡報對象:防汛防旱簡報對象是記錄該防汛防旱簡報的標題,防汛防旱簡報日期,防汛防旱簡報章節(jié)結構;一個防汛防旱簡報對象包含多個章節(jié),任意一個防汛防旱簡報對象實體都可以根據(jù)防汛防旱簡報-章節(jié)關系、章節(jié)-段落關系還原一篇實際防訊防旱簡報;d = {title, date, S,L}3)章節(jié)對象:每篇防汛防旱簡報會有多個章節(jié),章節(jié)對象描述該章節(jié)的名稱;一個章節(jié)包含多個段落;s = {name, P, L}4)段落對象:段落是組成防汛防旱簡報的基本對象,段落對象記錄防汛防旱簡報中對應段落的名稱,段落內容。P= {name, content, L}5)標簽對象:標簽對象是用于描述上述3中對象的元對象,該對象主要用于描述防訊防旱簡報、章節(jié)、段落的基本內容,便于進行分類、檢索;1 = {name, describe}本模型中,主要是將防汛防旱簡報內容進行分類,并將各類信息進行抽象、定義和使用,使原本文件化的防汛防旱簡報離散化,抽象為可被記錄和檢索的數(shù)據(jù)對象,這種描述方式不僅保留了原防汛防旱簡報的全部信息,同時又可以對其進行不同對象的數(shù)據(jù)檢索,增加了數(shù)據(jù)檢索的靈活性。系統(tǒng)在投入使用前,必須將歷史防汛防旱簡報在上述防汛防旱簡報描述模型下進行描述,并錄入系統(tǒng)中。當有足量的相關歷史防汛防旱簡報被錄入,生成系統(tǒng)就能夠靈活,快捷地根據(jù)用戶需求生成。依據(jù)防汛防旱簡報描述模型,被發(fā)明設計了一套在該模型下的多模式防汛防旱簡報標簽匹配算法(MLMA算法),算法如下:I)等待用戶輸入的標簽集,標簽集中包含一個或多個用戶需要檢索的標簽;2)單個標簽匹配:單個標簽匹配就是根據(jù)某一個特定的標簽,檢索出與該標簽匹配的防汛防旱簡報、章節(jié)或段落對象;單個標簽匹配需要按順序使用以下XXX類匹配模式進行匹配(以搜索防汛防旱簡報為例):A,完全匹配,即所輸入的內容與描述該防汛防旱簡報的標簽內容完全一致,匹配成功,匹配度 match_degree=l ;B,語義等價匹配,這種匹配需要借助已建立的語義等價表,在實際應用中如“未來計劃”、“未來打算”、“下階段計劃”、“下階段打算”在語義上是一致的,若用戶輸入的是“未來計劃”,則“未來計劃”為完全匹配,“下階段打算”等為語義等價匹配,match_degree=l ;C,部分聯(lián)想匹配,當完全匹配和語義等價匹配都失效,采用部分聯(lián)想匹配,這種匹配針對用戶輸入的標簽與實際標簽的部分內容完成一致,例如用戶輸入“雨情”,與“全市雨情”實際上語義相近,可作為近似聯(lián)想匹配。聯(lián)想后字數(shù)為n,匹配字數(shù)為m,match.degree=m/n ;D,破壞匹配,這種匹配為標簽匹配的最壞情況,當標簽匹配都不滿足上面3種情況時,可以嘗試使用破壞匹配。這種匹配需要將被匹配的兩個標簽中都破壞掉部分文字后達到完全匹配或語義等價匹配。這類匹配的目的是防止用戶在檢索時輸入錯誤,但是有時候會造成語義上的偏差。最終匹配字數(shù)為η,破壞字數(shù)總是為k,match_degree=(n-k)/k ;若搜索“雨情”,則標簽“水情”與其的破壞匹配度為(2-2)/2=0 ;這樣就防止了在破壞語義的情況下,使破壞匹配的匹配度會盡量低。根據(jù)上面的匹配規(guī)則,選擇匹配度最高的一組標簽組作為匹配結果,顯然完全匹配和語義等價匹配會優(yōu)先被選擇。當匹配度低到一定程度后就認為匹配失敗。3)全集合匹配:枚舉庫中的防汛防旱簡報,將防汛防旱簡報的標簽與用戶的輸入標簽集合一一匹配,計算防汛防旱簡報與標簽集合相似度,相似度由如下公式計算:similarity_degree = Xmatch_degree根據(jù)相似度降序排序,選擇前10個防汛防旱簡報作為檢索結果返回,而顯然相似度最高的防汛防旱簡報則很可能滿足用戶的搜索需求。該算法不僅可以用于用戶搜索防汛防旱簡報時使用,同時可以檢索防汛防旱簡報之間、章節(jié)之間、段落之間的相似度。當用戶需要替換某個章節(jié)或段落時,就可以用該算法匹配出相似度最高的章節(jié)或段落作為推薦。實時數(shù)據(jù)的替換:防汛防旱簡報中有不少段落是包含實時數(shù)據(jù)的,這些實時數(shù)據(jù)需要根據(jù)現(xiàn)實情況進行替換。替換算法如下:I)獲取替換規(guī)則編號;2)根據(jù)替換規(guī)則編號,從數(shù)據(jù)庫中獲取替換規(guī)則類;3)運行替換規(guī)則類方法,方法中進行數(shù)據(jù)對應云服務的安全認證,并數(shù)據(jù)獲?。?)將原文中的數(shù)據(jù)替換為對應占位符;5)將文中的站位符依次替換,得到實時數(shù)據(jù)段落;6)返回段落內容。實時數(shù)據(jù)在處理結束后,得到的數(shù)據(jù)信息還將傳遞給圖表生成類進行圖表的生成,根據(jù)需求的不同生成不同的圖表,返回到前臺,并實時插入至對應段落后。所有工作完成后,就得到了自動生成的一篇新的防汛防旱簡報。
權利要求
1.一種基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法,其特征在于,該方法以水利云平臺為基礎,結合防汛防旱業(yè)務需求,根據(jù)已有的防汛防旱業(yè)務簡報,自動從文檔數(shù)據(jù)庫中檢索出相關段落,并自動選擇匹配度最高的段落組合生成一篇完整防汛防旱簡報,整個方法具體可分為防汛防旱簡報錄入過程和生成過程,錄入過程包括如下步驟: 步驟11:對已有的歷年防汛防旱簡報的分類,然后添加相應的分類標簽; 步驟12:錄入文章標題和標簽; 步驟13:判斷是否已錄入文章標題和標簽,若未錄入或文章已存在返回步驟11,否則跳到步驟14 ; 步驟14:為歷年的防汛防旱簡報的每個章節(jié)添加章節(jié)標簽,標記章節(jié)內的重要關鍵詞語; 步驟15:錄入章節(jié)標題和標簽; 步驟16:判斷是否已錄入章節(jié)標題和標簽,若未錄入,跳到步驟15,否則跳到步驟17 ; 步驟17:為段落錄入標題、內容標簽,并保存; 步驟18:若所有段落已錄入跳到步驟19,否則返回步驟17 ; 步驟19:保存至文檔數(shù)據(jù)庫并返回操作結果。
防汛防旱簡報生成過程包括如下步驟: 步驟21:根據(jù)現(xiàn)有防汛防旱簡報標簽庫中標簽的搜索熱度,降序生成推薦標簽列表,以供用戶選擇; 步驟22:用戶點選一個或多個標簽; 步驟23:若需要進行補充,用戶輸入更多需要查詢的標簽; 步驟24:判斷用戶是否提交標簽集,或未提交返回步驟22,否則跳到步驟25 ; 步驟25:獲取用戶輸入的標簽集,并從防汛防旱簡報庫中檢索; 步驟26:根據(jù)多模式防汛防旱簡報標簽匹配算法計算文章匹配度,降序輸出文章列表; 步驟27:選擇匹配度最高的作為模板,展開文章章節(jié)和段落; 步驟28:若段落中含有實時數(shù)據(jù),跳到步驟29,否則跳到步驟211 ; 步驟29:從云平臺中選擇符合標簽的云服務獲取相關數(shù)據(jù),并將段落中的數(shù)據(jù)替換;步驟210:將數(shù)云服務獲取的數(shù)據(jù)以柱狀圖、餅圖、折線圖或數(shù)據(jù)表等形式插入至實時段落之后,用戶也可根據(jù)需要添加和刪除; 步驟211:判斷用戶是否選擇修改章節(jié)或段落,若需要修改跳到步驟212,否則跳到步驟 214 ; 步驟212:根據(jù)需要修改的章節(jié)/段落標簽,根據(jù)MLMA算法檢索與內容相似的章節(jié)/段落作為備選; 步驟213:用戶選擇并修改相關段落內容,并保存; 步驟214:生成完整的防汛防旱簡報草稿,并預覽。
2.如權利要求1所述的基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法,其特征在于,步驟11中用戶可自定義分類標簽。
3.如權利要求1所述的基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法,其特征在于,步驟14中用戶可自定義章節(jié)標簽。
全文摘要
本發(fā)明公開一種基于水利云平臺的防汛防旱簡報生成系統(tǒng)的構建方法,以水利云平臺為基礎,結合防汛防旱業(yè)務需求,根據(jù)已有的防汛防旱業(yè)務簡報,實現(xiàn)了如下功能自動從簡報文檔數(shù)據(jù)庫中檢索出符合要求的段落,并選擇匹配度最高的段落,然后按預先定義的格式組合成完整簡報初稿;對于簡報內容中往往需要包含實時水雨情、災情、險情、氣象等內容,系統(tǒng)利用云服務獲取相關數(shù)據(jù),并生成對應圖表,自動插入文檔;若用戶需要替換某些段落或章節(jié),系統(tǒng)具有內容自動推薦功能,可推薦多個內容相關的或相似段落供用戶選擇。本發(fā)明能快速地幫助防辦工作人員準備防汛防旱簡報,顯著地提高了防汛防旱指揮、決策工作的效率。
文檔編號G06Q50/06GK103150632SQ201310080868
公開日2013年6月12日 申請日期2013年3月13日 優(yōu)先權日2013年3月13日
發(fā)明者許峰, 姜鵬, 葉楓, 高中衛(wèi), 湯建均, 吳際, 王濤 申請人:河海大學