本發(fā)明涉及電子傳媒領(lǐng)域,尤其涉及一種基于云平臺的新聞閱讀系統(tǒng)。
背景技術(shù):
隨著移動終端的快速普及和智能化發(fā)展,以及高速無線互聯(lián)網(wǎng)的技術(shù)日新月異,讓信息跟著人走已成為現(xiàn)實(shí),移動終端已經(jīng)成為隨身攜帶的工作平臺、信息獲取平臺,可實(shí)現(xiàn)與現(xiàn)存的IT應(yīng)用系統(tǒng)進(jìn)行通訊,或遠(yuǎn)程使用固定的辦公配套設(shè)備,以便在任何需要的時間和場合,方便、高效、迅速地獲取和處理業(yè)務(wù)信息,決策于千里之外,打破傳統(tǒng)的信息處理模式。
伴隨著3G技術(shù)的成熟以及4G時代的興起,網(wǎng)絡(luò)從原來的時髦化,轉(zhuǎn)變?yōu)楝F(xiàn)在的大眾化、個性化、智能化。網(wǎng)絡(luò)的興起也加速了網(wǎng)絡(luò)新聞信息的增長程度,人們迫切需要能通過不同移動終端實(shí)現(xiàn)對新聞信息的快速發(fā)現(xiàn),快速聚類分析輿情事件的發(fā)展趨勢,實(shí)時閱讀輿情實(shí)際信息以及擴(kuò)散狀況,以及進(jìn)行事后溯源追蹤,現(xiàn)有技術(shù)中的新聞閱讀設(shè)備已經(jīng)不能滿足新聞海量數(shù)據(jù)處理的需求,面向?qū)I(yè)客戶的信息管理需求,提供基于云平臺的綜合型的集成解決方案,實(shí)現(xiàn)互聯(lián)網(wǎng)新聞信息的快速移動部署,輔助用戶在任何時間、任何地點(diǎn)靈活處理任何新聞信息工作,符合現(xiàn)有的移動信息行業(yè)的發(fā)展趨勢。
技術(shù)實(shí)現(xiàn)要素:
為克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的是:提供一種基于云平臺的新聞閱讀系統(tǒng),能通過不同移動終端實(shí)現(xiàn)對新聞信息的快速發(fā)現(xiàn),快速聚類分析輿情事件的發(fā)展趨勢,實(shí)時閱讀新聞輿情信息以及擴(kuò)散狀況,以及進(jìn)行事后溯源追蹤。
為了解決背景技術(shù)中的技術(shù)問題,本發(fā)明提供了一種基于云平臺的新聞閱讀系統(tǒng),包括數(shù)據(jù)服務(wù)器、分析服務(wù)器、安全加密引擎模塊、用戶與權(quán)限管理模塊及以下模塊:
信息采集模塊,用于向網(wǎng)站采集新聞信息;
信息處理模塊,用于設(shè)置采集策略和管理策略,及對采集的新聞信息進(jìn)行聚類、分類和數(shù)據(jù)流轉(zhuǎn)處理;
功能服務(wù)模塊,包括全網(wǎng)監(jiān)控單元、檢索單元、分類查看單元、新聞研判單元、傳播分析單元、事件布控單元、工作信息流轉(zhuǎn)單元。
具體地,所述全網(wǎng)監(jiān)控單元的監(jiān)控對象包括新聞標(biāo)題、作者、信息正文、來源網(wǎng)站、轉(zhuǎn)載源、發(fā)布時間和新聞鏈接。
進(jìn)一步地,所述采集策略包括用戶配置站點(diǎn)起始URL、URL過濾規(guī)則、抓取深度、抓取網(wǎng)頁數(shù)量、掃描間隔、所屬頻道采集。
具體地,所述檢索單元用于在更新的同時進(jìn)行全文檢索獲得新聞主題、來源、作者和時間信息,并根據(jù)信息傳播的方式,提取信息轉(zhuǎn)發(fā)、評論和回復(fù)信息。
具體地,所述分類查看單元通過自然語言語義分類技術(shù)與關(guān)鍵詞配置規(guī)則的結(jié)合,實(shí)現(xiàn)對搜索信息的細(xì)化分析并分類。
具體地,所述新聞研判單元用于對新聞事件進(jìn)行多維度統(tǒng)計分析,進(jìn)行事件全貌還原,根據(jù)需求生成研判專題分析報告和進(jìn)行新聞挖掘。
具體地,所述傳播分析單元通過分析信息來源,根據(jù)輿情文章的內(nèi)容語義發(fā)現(xiàn)熱點(diǎn)信息,進(jìn)行自動聚類和關(guān)聯(lián)處理,在統(tǒng)計出信息數(shù)量的基礎(chǔ)上,得出文章在報紙、雜志和網(wǎng)絡(luò)媒體中的傳播情況,并以可視化圖形的方式顯示傳播情況。
具體地,所述事件布控單元用于跟蹤事件在新聞網(wǎng)站中的發(fā)展動向。
具體地,所述工作信息流轉(zhuǎn)單元包括以下三個子單元:
收到信息子單元,用于對收到信息的內(nèi)容進(jìn)行查看,查看結(jié)果以列表形式進(jìn)行展現(xiàn),查看結(jié)果包括標(biāo)題、發(fā)送人和發(fā)送時間,并支持對每條推送信息進(jìn)行回復(fù)和轉(zhuǎn)發(fā),同時支持查看信息的詳細(xì)情況;
發(fā)出信息子單元,用于對發(fā)出信息的內(nèi)容進(jìn)行查看,查看結(jié)果以列表形式進(jìn)行展現(xiàn),查看結(jié)果包括標(biāo)題、接收人和時間,同時支持查看信息的詳細(xì)情況;
推送信息子單元,用于向用戶推送信息,支持手動添加信息內(nèi)容,同時支持從本地或網(wǎng)上上傳圖片作為發(fā)送信息的附件。
進(jìn)一步地,本發(fā)明的基于云平臺的新聞閱讀系統(tǒng)還包括接口模塊,所述接口模塊包括管理數(shù)據(jù)接口單元、應(yīng)用系統(tǒng)數(shù)據(jù)接口單元和索引數(shù)據(jù)接口單元。
采用上述技術(shù)方案,本發(fā)明的基于云平臺的新聞閱讀系統(tǒng)具有易擴(kuò)展、高性能、處理性能高的技術(shù)特點(diǎn),能實(shí)時焦距閱讀實(shí)時發(fā)現(xiàn)、檢索、聚類、研判、分析新聞熱點(diǎn),包括境內(nèi)、境外信息熱點(diǎn)等,并能檢索出新聞主題、來源、作者、時間等信息,并且能根據(jù)信息傳播的方式,提取信息轉(zhuǎn)發(fā)、評論、回復(fù)等信息內(nèi)容,同時用戶可根據(jù)事件類型進(jìn)行事件布控訂閱,監(jiān)查事件信息在網(wǎng)上的傳播狀況,并根據(jù)信息熱度算法對新聞熱點(diǎn)進(jìn)行熱度排行,用戶通過新聞閱讀器閱讀新聞熱點(diǎn),并根據(jù)信息熱點(diǎn)類型進(jìn)行分類,在實(shí)際使用過程中,系統(tǒng)支持用戶可根據(jù)不同新聞類型進(jìn)行上報的業(yè)務(wù)需要。
附圖說明
為了更清楚地說明本發(fā)明的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它附圖。
圖1是本發(fā)明實(shí)施例提供的基于云平臺的新聞閱讀系統(tǒng)的系統(tǒng)框圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例:圖1是本發(fā)明實(shí)施例提供的基于云平臺的新聞閱讀系統(tǒng)的系統(tǒng)框圖,從圖中可以看出,所述基于云平臺的新聞閱讀系統(tǒng)包括數(shù)據(jù)服務(wù)器、分析服務(wù)器、安全加密引擎模塊、用戶與權(quán)限管理模塊及以下模塊:
信息采集模塊,用于向網(wǎng)站采集新聞信息;
信息處理模塊,用于設(shè)置采集策略和管理策略,及對采集的新聞信息進(jìn)行聚類、分類和數(shù)據(jù)流轉(zhuǎn)處理;
功能服務(wù)模塊,包括全網(wǎng)監(jiān)控單元、檢索單元、分類查看單元、新聞研判單元、傳播分析單元、事件布控單元、工作信息流轉(zhuǎn)單元。
具體地,所述全網(wǎng)監(jiān)控單元的監(jiān)控對象包括新聞標(biāo)題、作者、信息正文、來源網(wǎng)站、轉(zhuǎn)載源、發(fā)布時間和新聞鏈接。全網(wǎng)監(jiān)控功能可以實(shí)現(xiàn)全國重點(diǎn)新聞網(wǎng)站的信息采集,采集的要素包括:標(biāo)題、作者、信息正文、來源(當(dāng)前網(wǎng)站)、轉(zhuǎn)載源、發(fā)布時間、新聞鏈接等多種要素。在采集站點(diǎn)配置方面,可以根據(jù)不同的站點(diǎn)靈活設(shè)定采集策略,允許用戶配置站點(diǎn)起始URL、URL過濾規(guī)則、抓取深度、抓取網(wǎng)頁數(shù)量、掃描間隔、所屬頻道等采集和國內(nèi)外各網(wǎng)站、論壇、博客、采集的開始時間、頻率、采集優(yōu)先級等,對于網(wǎng)站中需要重點(diǎn)監(jiān)控的頻道可以設(shè)成更新站點(diǎn)并設(shè)置較高采集頻率,每個網(wǎng)站的采集方案可進(jìn)行保存、查看和修改。同時通過鏈接判重引擎對網(wǎng)頁進(jìn)行增量更新,可保證重復(fù)的網(wǎng)頁不再下載,進(jìn)而提高了全網(wǎng)監(jiān)控的數(shù)據(jù)采集效率。
進(jìn)一步地,所述采集策略包括用戶配置站點(diǎn)起始URL、URL過濾規(guī)則、抓取深度、抓取網(wǎng)頁數(shù)量、掃描間隔、所屬頻道采集。
具體地,所述檢索單元用于在更新的同時進(jìn)行全文檢索獲得新聞主題、來源、作者和時間信息,并根據(jù)信息傳播的方式,提取信息轉(zhuǎn)發(fā)、評論和回復(fù)信息。新聞閱讀器軟件的檢索功能支持實(shí)時索引更新,支持更新與搜索的同時進(jìn)行。系統(tǒng)提供多種檢索方式,除了能檢索本地搜索引擎采集到新聞輿情外,還可以實(shí)時調(diào)用云平臺搜索引擎的檢索結(jié)果,把檢索結(jié)果和本地搜索引擎的結(jié)果進(jìn)行整合,自動去除重復(fù)鏈接,使用戶查詢到在各大網(wǎng)站中出現(xiàn)的新聞輿情。用戶可自由設(shè)計多組合檢索規(guī)則,提高信息檢索精度。同時提供分布式檢索和負(fù)載均衡集群服務(wù)器,實(shí)現(xiàn)分布式檢索和負(fù)載均衡功能,滿足大數(shù)據(jù)量和高并發(fā)的檢索要求。用戶可在安有新聞閱讀器軟件的移動客戶端上通過強(qiáng)大的全文檢索,輸入關(guān)鍵字即可搜索出相應(yīng)的詳細(xì)輿情信息,包括新聞主題、來源、作者、時間等信息,并且能根據(jù)信息傳播的方式,提取信息轉(zhuǎn)發(fā)、評論、回復(fù)等信息內(nèi)容。
具體地,所述分類查看單元通過自然語言語義分類技術(shù)與關(guān)鍵詞配置規(guī)則的結(jié)合,實(shí)現(xiàn)對搜索信息的細(xì)化分析并分類。新聞閱讀器軟件提供新聞輿情信息的分類查看功能,分類查看規(guī)則配置靈活,通過自然語言語義分類技術(shù)與關(guān)鍵詞配置規(guī)則(與、或、非、優(yōu)先級)的完美集合,實(shí)現(xiàn)對搜索信息的細(xì)化分析,方便用戶在海量的新聞輿情信息中進(jìn)行梳理,從而實(shí)現(xiàn)新聞輿情信息的有效管理。
具體地,所述新聞研判單元用于對新聞事件進(jìn)行多維度統(tǒng)計分析,進(jìn)行事件全貌還原,根據(jù)需求生成研判專題分析報告和進(jìn)行新聞挖掘。新聞閱讀器軟件的新聞研判功能,可支持對新聞事件進(jìn)行多維度統(tǒng)計分析,快速進(jìn)行事件全貌還原,對任意熱點(diǎn)新聞事件,可根據(jù)需求生成研判專題分析報告,同時,根據(jù)用戶業(yè)務(wù)的具體需要,可以對事件進(jìn)行不同深度的挖掘。使用戶第一時間從宏觀角度掌握新聞事件的總體情況,為進(jìn)一步的分析決策提供輔助依據(jù)。
具體地,所述傳播分析單元通過分析信息來源,根據(jù)輿情文章的內(nèi)容語義發(fā)現(xiàn)熱點(diǎn)信息,進(jìn)行自動聚類和關(guān)聯(lián)處理,在統(tǒng)計出信息數(shù)量的基礎(chǔ)上,得出文章在報紙、雜志和網(wǎng)絡(luò)媒體中的傳播情況,并以可視化圖形的方式顯示傳播情況。新聞閱讀器軟件對于重要的新聞輿情信息,可通過分析各信息的來源,根據(jù)輿情文章的內(nèi)容語義發(fā)現(xiàn)熱點(diǎn)信息,進(jìn)行自動聚類、關(guān)聯(lián)等后臺處理,在統(tǒng)計出信息數(shù)量的基礎(chǔ)上,得出文章在各報紙、雜志和網(wǎng)絡(luò)媒體中的傳播情況,最終以可視化圖形的方式直觀顯示其傳播情況。使用戶不僅僅能發(fā)現(xiàn)新聞輿情出現(xiàn)的時間順序,還可以找出國外和國內(nèi)輿情之間直接傳播的路徑,進(jìn)而從根本上了解輿情的傳播情況,及時準(zhǔn)確地把握宏觀輿情走勢。
具體地,所述事件布控單元用于跟蹤事件在新聞網(wǎng)站中的發(fā)展動向。新聞閱讀器軟件可以對關(guān)注的新聞事件進(jìn)行配置,系統(tǒng)自動跟蹤事件在各大新聞網(wǎng)站中的發(fā)展動向。用戶可對布控事件的信息進(jìn)行管理,如需了解某一事件的具體信息,系統(tǒng)還提供了正文、作者、轉(zhuǎn)載量、出處、時間段等多種要素供用戶隨時查看。
具體地,所述工作信息流轉(zhuǎn)單元包括以下三個子單元:
收到信息子單元,用于對收到信息的內(nèi)容進(jìn)行查看,查看結(jié)果以列表形式進(jìn)行展現(xiàn),查看結(jié)果包括標(biāo)題、發(fā)送人和發(fā)送時間,并支持對每條推送信息進(jìn)行回復(fù)和轉(zhuǎn)發(fā),同時支持查看信息的詳細(xì)情況;
發(fā)出信息子單元,用于對發(fā)出信息的內(nèi)容進(jìn)行查看,查看結(jié)果以列表形式進(jìn)行展現(xiàn),查看結(jié)果包括標(biāo)題、接收人和時間,同時支持查看信息的詳細(xì)情況;
推送信息子單元,用于向用戶推送信息,支持手動添加信息內(nèi)容,同時支持從本地或網(wǎng)上上傳圖片作為發(fā)送信息的附件,用戶可以借助以上工作信息流轉(zhuǎn)單元的三個子單元完成新聞輿情業(yè)務(wù)工作的信息上報與轉(zhuǎn)發(fā)等功能。
新聞閱讀器軟件通過遍布全國的蜘蛛采集集群以及海外代理服務(wù)器,能夠?qū)崟r采集國內(nèi)外的各種新聞輿情數(shù)據(jù),并且基于統(tǒng)計的文本信息處理方法實(shí)現(xiàn)能對新聞輿情信息的熱點(diǎn)信息的自動聚類??梢詫?shí)現(xiàn)對增長異常的新聞事件、新聞突發(fā)事件、涉及內(nèi)容安全的敏感新聞等信息的及時發(fā)現(xiàn),并對各類熱點(diǎn)輿情信息進(jìn)行熱點(diǎn)信息排序分析。
進(jìn)一步地,本發(fā)明的基于云平臺的新聞閱讀系統(tǒng)還包括接口模塊,所述接口模塊包括管理數(shù)據(jù)接口單元、應(yīng)用系統(tǒng)數(shù)據(jù)接口單元和索引數(shù)據(jù)接口單元。所述新聞閱讀器采用先進(jìn)BCE中間件信息技術(shù)能有效融合各類系統(tǒng)數(shù)據(jù)接口,通過信息聚合技術(shù)對銜接系統(tǒng)數(shù)據(jù)進(jìn)行采集、分類、聚合、處置、傳輸?shù)纫幌盗械牧鞒?,在通過系統(tǒng)綜合應(yīng)用平臺統(tǒng)一展現(xiàn)。
本實(shí)施例提供的新聞閱讀系統(tǒng)的硬件環(huán)境如下:
●CPU:Intel雙核@2.50GHz或以上;
●硬盤:40G以上;
●內(nèi)存:1G以上;
●顯示器:分辨率1024*768或以上;
●外設(shè):USB接口,鍵盤鼠標(biāo);
●網(wǎng)絡(luò)帶寬:要求1M帶寬;建議2M以上;
本實(shí)施例提供的新聞閱讀系統(tǒng)的軟件環(huán)境如下:
linunx\windows xp\windows 7\windows 8\windows 2003\winodows 2008,并采用c\Python\java編程語言。
應(yīng)用業(yè)務(wù)流程如下:系統(tǒng)管理員根據(jù)用戶需求進(jìn)行采集策略配置,包括站點(diǎn)的監(jiān)控范圍、采集頻率、關(guān)鍵詞配置等,數(shù)據(jù)中心根據(jù)采集策略配置將符合要求的數(shù)據(jù)采集回來進(jìn)行預(yù)處理后,再將輿情數(shù)據(jù)結(jié)果推送至用戶分析服務(wù)器進(jìn)行數(shù)據(jù)分析,用戶經(jīng)過身份驗證登陸新聞閱讀器軟件,進(jìn)行新聞輿情數(shù)據(jù)的查看、分析、處置、上報等業(yè)務(wù)工作。
用戶對應(yīng)用系統(tǒng)與發(fā)布平臺進(jìn)行各類數(shù)據(jù)接口銜接,完成數(shù)據(jù)銜接,進(jìn)行數(shù)據(jù)統(tǒng)一整合分類,在把相關(guān)數(shù)據(jù)推送至系統(tǒng)應(yīng)用中去。用戶通過客戶端根據(jù)系統(tǒng)URL登錄路徑進(jìn)行系統(tǒng)登錄,進(jìn)入系統(tǒng)進(jìn)行各類信息數(shù)據(jù)的應(yīng)用。
本實(shí)施例提供的新聞閱讀系統(tǒng)采用基于云平臺的B/S架構(gòu)方式,結(jié)合全球領(lǐng)先的信息采集檢索技術(shù)和算法,根據(jù)自身豐富的專業(yè)經(jīng)驗和長期的行業(yè)積累經(jīng)驗,對新聞輿情信息進(jìn)行深入挖掘,過濾和屏蔽垃圾信息,顯示格式化新聞內(nèi)容信息,用戶通過閱讀器可以直白的閱讀新聞內(nèi)容和發(fā)展?fàn)顩r。本產(chǎn)品基于分布式云平臺和先進(jìn)的采集技術(shù)進(jìn)行設(shè)計開發(fā),具有易擴(kuò)展、高性能、處理性能高的技術(shù)特點(diǎn)。
本發(fā)明的基于云平臺的新聞閱讀系統(tǒng)面向新聞輿情領(lǐng)域,形成海量數(shù)據(jù)應(yīng)用簡單化、移動化、業(yè)務(wù)流程移動化、全業(yè)務(wù)流程的端到端整合,并深入信息優(yōu)化,實(shí)現(xiàn)業(yè)務(wù)能力和管理能力的全面提升,對新聞信息進(jìn)行深入挖掘,過濾和屏蔽垃圾信息,顯示格式化新聞內(nèi)容信息,用戶通過閱讀器可以直白的閱讀新聞內(nèi)容和發(fā)展?fàn)顩r。
以上所揭露的僅為本發(fā)明的幾種較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。