亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種企業(yè)軟件著作權(quán)公告信息抓取與管理系統(tǒng)的制作方法

文檔序號:8943552閱讀:373來源:國知局
一種企業(yè)軟件著作權(quán)公告信息抓取與管理系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明主要涉及一種企業(yè)軟件著作權(quán)信息抓取與管理系統(tǒng),尤其是通過軟件著作權(quán)公布網(wǎng)站的頁面信息抓取、分析、整理和建檔的系統(tǒng)。
【背景技術(shù)】
[0002]目前,軟件著作權(quán)的信息獲取大多基于通過相關(guān)部門所公開的數(shù)據(jù)接口來實現(xiàn)軟件著作權(quán)信息的同步,或者通過復(fù)雜的運算與抓取而獲得信息量較少的信息。此方法對于經(jīng)常性的、大數(shù)據(jù)的企業(yè)軟件著作權(quán)的信息獲取顯得難以勝任,并且應(yīng)用成本高,風(fēng)險大,不利于中小中介服務(wù)機構(gòu)推廣應(yīng)用。
[0003]軟件著作權(quán)的信息,尤其是建立企業(yè)研發(fā)信用體系,更顯得非常重要,同時也是中介服務(wù)機構(gòu)提尚自身服務(wù)質(zhì)量的有力支持。

【發(fā)明內(nèi)容】

[0004]為了解決上述問題,本發(fā)明提出了一種基于軟件著作權(quán)的公眾公開的登記或變更公告數(shù)據(jù)的頁面級別的通過getHTTPPage方法的抓取技術(shù),再結(jié)合標記分析方法獲得第一信息碼、第二信息碼和第三信息碼,再通過上述信息碼之間的對比,在相應(yīng)程序下生成第四信息碼,然后依對應(yīng)的方法寫入第一軟件著作權(quán)信息庫和第二軟件著作權(quán)信息庫,以備不同的場合使用的一種企業(yè)軟件著作權(quán)公告信息抓取與管理的系統(tǒng)。
[0005]一種企業(yè)軟件著作權(quán)公告信息抓取與管理系統(tǒng),其主要包含以下結(jié)構(gòu):
企業(yè)信息庫、編碼管理程序、軟件著作權(quán)公布數(shù)據(jù)采集管理模塊、信息碼管理模塊、第一比對信息庫、第二比對信息庫、企業(yè)軟件著作權(quán)公告信息庫和接口管理模塊;其中信息碼管理模塊由第一信息碼、第二信息碼、第三信息碼和第四信息碼組成;企業(yè)信息庫包含企業(yè)信息數(shù)據(jù)和SQL語句管理模塊,其通過SQL語句條件檢索后返回值給編碼管理程序確定編碼方式,然后輸出對應(yīng)編碼方式編碼后的企業(yè)名稱,同時發(fā)送到軟件著作權(quán)公布數(shù)據(jù)采集管理模塊生成相應(yīng)的以上述編碼后的企業(yè)名稱為變量的URL,信息碼管理模塊通過getHTTPPage方式訪問生成的URL,并將獲得的頁面HTML靜態(tài)化,同時執(zhí)行信息碼管理模塊中的標記識別截取頁面信息以對應(yīng)生成第一信息碼、第二信息碼、第三信息碼和第四信息碼;當(dāng)?shù)谝恍畔⒋a為空時,系統(tǒng)將返回重新執(zhí)行企業(yè)信息庫的SQL語句操作,并檢查網(wǎng)絡(luò)、數(shù)據(jù)可靠性以及各模塊運作是否正常;當(dāng)?shù)谝恍畔⒋a不為空,第二信息碼為空時,將第三信息碼和第四信息碼設(shè)置為“0”,然后寫入第一比對信息庫,同時寫入企業(yè)軟件著作權(quán)公告信息庫;當(dāng)?shù)诙畔⒋a不為空,通過信息碼管理模塊標記識別截取頁面信息,去雜后生成第三信息碼,當(dāng)?shù)谌畔⒋a也為空時,設(shè)置第四信息碼為“1”,當(dāng)?shù)谌畔⒋a不為空時,設(shè)置第四信息碼的值與第三信息碼的值相同,與輔助信息一并寫入第二比對信息庫,同時寫入企業(yè)軟件著作權(quán)公告信息庫;企業(yè)軟件著作權(quán)公告信息庫通過SQL語句與存貯過程共同組成接口,通過接口管理模塊供第三方系統(tǒng)調(diào)用。
[0006]所述的企業(yè)信息庫所包含的SQL語句管理模塊,包括企業(yè)類型、企業(yè)成立時間、企業(yè)注冊資金、企業(yè)注冊地址和企業(yè)是否是高新技術(shù)企業(yè)分別或者組合作為條件檢索篩選時所需要的SQL語句或SQL語句集合。
[0007]企業(yè)信息庫還可以包含采集比對記錄字段集,將比對的結(jié)果、比對次數(shù)和比對時間進行記錄。
[0008]所述的輔助數(shù)據(jù)包括企業(yè)名、當(dāng)前的系統(tǒng)時間、操作人員的sess1n值或值的組合和數(shù)據(jù)對比的次數(shù)的信息的一種或多種的集合。
[0009]每個企業(yè)信息庫還可以設(shè)置一定數(shù)量的采樣數(shù)據(jù)進行采樣,采樣數(shù)據(jù)包括企業(yè)擁有軟件著作權(quán)公告的一定量的企業(yè),以及沒有任何軟件著作權(quán)的一定量的企業(yè),采樣走完整個流程,查看相關(guān)采集是否正常,確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確,采樣數(shù)據(jù)通過獨立的字段值進行標識,或者通過單獨的表進行存放,在進行比對時,通過SQL語句檢索獲得相應(yīng)的數(shù)據(jù)。
[0010]當(dāng)?shù)诙畔⒋a不為空時,信息碼管理模塊還可以設(shè)置第四信息碼的值為“I”而不米集生成第二 ?目息碼。
[0011]所述軟件著作權(quán)公布數(shù)據(jù)采集管理模塊包含手動設(shè)置URL、編碼方式和采集規(guī)則的程序,當(dāng)官方機構(gòu)公布的URL、發(fā)布的編碼方式、發(fā)布的數(shù)據(jù)結(jié)構(gòu)發(fā)生變更時,軟件著作權(quán)公布數(shù)據(jù)采集管理模塊的手動設(shè)置程序?qū)λl(fā)生的變化進行容錯更正。
【附圖說明】
[0012]圖1一種企業(yè)軟件著作權(quán)公告信息抓取與管理系統(tǒng)結(jié)構(gòu)圖。
[0013]
【具體實施方式】
[0014]如圖1,一種企業(yè)軟件著作權(quán)公告信息抓取與管理系統(tǒng),其主要包含以下結(jié)構(gòu): 企業(yè)信息庫(Α01)、編碼管理程序(Α02)、軟件著作權(quán)公布數(shù)據(jù)采集管理模塊(Α03)、信息碼管理模塊(Α04)、第一比對信息庫(Α05 )、第二比對信息庫(Α06 )、企業(yè)軟件著作權(quán)公告信息庫(Α07 )和接口管理模塊(Α08 );其中信息碼管理模塊(Α04 )由第一信息碼(B11)、第二信息碼(Β12)、第三信息碼(Β13)和第四信息碼(Β14)組成;企業(yè)信息庫(Α01)包含企業(yè)信息數(shù)據(jù)和SQL語句管理模塊,其通過SQL語句條件檢索后返回值給編碼管理程序(Α02)確定編碼方式,然后輸出對應(yīng)編碼方式編碼后的企業(yè)名稱,同時發(fā)送到軟件著作權(quán)公布數(shù)據(jù)采集管理模塊(Α03)生成相應(yīng)的以上述編碼后的企業(yè)名稱為變量的URL,信息碼管理模塊(Α04)通過getHTTPPage方式訪問生成的URL,并將獲得的頁面HTML靜態(tài)化,同時執(zhí)行信息碼管理模塊(A04)中的標記識別截取頁面信息以對應(yīng)生成第一信息碼(B11)、第二信息碼(B12 )、第三信息碼(B13 )和第四信息碼(B14 );當(dāng)?shù)谝恍畔⒋a(B11)為空時,系統(tǒng)將返回重新執(zhí)行企業(yè)信息庫(A01)的SQL語句操作,并檢查網(wǎng)絡(luò)、數(shù)據(jù)可靠性以及各模塊運作是否正常;當(dāng)?shù)谝恍畔⒋a(Bll)不為空,第二信息碼(B12)為空時,將第三信息碼(B13)和第四信息碼(B14)設(shè)置為“0”,然后寫入第一比對信息庫(A05),同時寫入企業(yè)軟件著作權(quán)公告信息庫(A07);當(dāng)?shù)诙畔⒋a(B12)不為空,通過信息碼管理模塊(A04)標記識別截取頁面信息,去雜后生成第三信息碼(B13),當(dāng)?shù)谌畔⒋a(B13)也為空時,設(shè)置第四信息碼(B14)為“1”,當(dāng)?shù)谌畔⒋a(B13)不為空時,設(shè)置第四信息碼(B14)的值與第三信息碼(B13)的值相同,與輔助信息一并寫入第二比對信息庫(A06),同時寫入企業(yè)軟件著作權(quán)公告信息庫(A07);企業(yè)軟件著作權(quán)公告信息庫(A07)通過SQL語句與存貯過程共同組成接口,通過接口管理模塊(A08)供第三方系統(tǒng)調(diào)用。
[0015]所述的企業(yè)信息庫(AOl)所包含的SQL語句管理模塊,包括企業(yè)類型、企業(yè)成立時間、企業(yè)注冊資金、企業(yè)注冊地址和企業(yè)是否是高新技術(shù)企業(yè)分別或者組合作為條件檢索篩選時所需要的SQL語句或SQL語句集合。
[0016]企業(yè)信息庫(AOl)還可以包含采集比對記錄字段集,將比對的結(jié)果、比對次數(shù)和比對時間進行記錄。
[0017]所述的輔助數(shù)據(jù)包括企業(yè)名、當(dāng)前的系統(tǒng)時間、操作人員的sess1n值或值的組合和數(shù)據(jù)對比的次數(shù)的信息的一種或多種的集合。
[0018]每個企業(yè)信息庫(AOl)還可以設(shè)置一定數(shù)量的采樣數(shù)據(jù)進行采樣,采樣數(shù)據(jù)包括企業(yè)擁有軟件著作權(quán)公告的一定量的企業(yè),以及沒有任何軟件著作權(quán)的一定量的企業(yè),采樣走完整個流程,查看相關(guān)采集是否正常,確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確,采樣數(shù)據(jù)通過獨立的字段值進行標識,或者通過單獨的表進行存放,在進行比對時,通過SQL語句檢索獲得相應(yīng)的數(shù)據(jù)。
[0019]當(dāng)?shù)诙畔⒋a(B12)不為空時,信息碼管理模塊(A04)還可以設(shè)置第四信息碼(B14)的值為“ I ”而不采集生成第三信息碼(B13)。
[0020]所述軟件著作權(quán)公布數(shù)據(jù)采集管理模塊(A03)包含手動設(shè)置URL、編碼方式和采集規(guī)則的程序,當(dāng)官方機構(gòu)公布的URL、發(fā)布的編碼方式、發(fā)布的數(shù)據(jù)結(jié)構(gòu)發(fā)生變更時,軟件著作權(quán)公布數(shù)據(jù)采集管理模塊(A03)的手動設(shè)置程序?qū)λl(fā)生的變化進行容錯更正。
[0021]一種企業(yè)軟件
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1