置一定數(shù)量的采樣數(shù)據(jù)進行采樣,采樣數(shù)據(jù)包括企業(yè)擁有三種知識產(chǎn)權(quán)類別的一種、兩種、三種及上述組合的一定量的企業(yè),以及沒有任何知識產(chǎn)權(quán)的一定量的企業(yè),采樣走完整個流程,查看相關(guān)采集是否正常,此步驟確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確。
[0012]步驟S203所述的第五信息碼截取的開始標記與結(jié)束標記與第一信息碼的標記相同,第六信息碼截取的開始標記與結(jié)束標記與二信息碼的標記相同,第七信息碼截取的開始標記與結(jié)束標記與三信息碼的標記相同,第八信息碼對應(yīng)的起止標記分別如下:
專利:開始標記‘‘〈input type=' text' class=' form-control' value=' I' /> /,,,結(jié)束標記為 “ 〈/liXliXa href=’#’ class=’’ data-page=’2’data-startrow=’ 11’ >,,;
商標:開始標記“頁 共”,結(jié)束標記:“頁”;
軟件著作權(quán):開始標記:“頁/共”,結(jié)束標記頁”。
[0013]步驟S103所述的編碼方式,當官方機構(gòu)公布的數(shù)據(jù)對應(yīng)的編碼發(fā)生變更時,本方法將根據(jù)實際所發(fā)生的變化變更編碼方式;步驟S104所述的URL中,當官方機構(gòu)公布時采用的URL進行加密發(fā)布時,本方法將根據(jù)實際情況進行數(shù)據(jù)加密編碼;步驟S104所述的URLencode/URLDecode加密/解密函數(shù)將上述步驟S103的數(shù)據(jù)進行加密,其加密編碼根據(jù)實際情況進行一次加密、二次和多次加密。
[0014]步驟S203中,當?shù)诎诵畔⒋a的值大于I時,通過獲取專利公告的條數(shù)的統(tǒng)計數(shù)據(jù)第十三信息碼與現(xiàn)有的第二企業(yè)知識產(chǎn)權(quán)信息庫中的數(shù)據(jù)對比,當?shù)谑畔⒋a不大于第二企業(yè)知識產(chǎn)權(quán)信息庫中對應(yīng)的企業(yè)的專利公告的總計數(shù)值時,不必進行第二頁及后面的讀??;當?shù)谑畔⒋a大于第二企業(yè)知識產(chǎn)權(quán)信息庫中對應(yīng)的企業(yè)的專利公告的總計數(shù)值時,根據(jù)超出的數(shù)量進行增量更新。
【附圖說明】
[0015]圖1一種實現(xiàn)區(qū)域企業(yè)專利信息摸底與管理的方法的總體流程圖。
[0016]圖2—種實現(xiàn)區(qū)域企業(yè)專利信息摸底與管理的方法第一組步驟集合的流程圖。
【具體實施方式】
[0017]—種實現(xiàn)區(qū)域企業(yè)專利信息摸底與管理的方法,其主要包含以下步驟:
步驟S101,進行企業(yè)信息查詢中,進行企業(yè)類型等條件檢索篩選出所需要檢索的數(shù)據(jù)。
[0018]步驟S102,在企業(yè)信息庫中讀出企業(yè)名稱的待查數(shù)據(jù),設(shè)變量為“aa”。
[0019]步驟S103,根據(jù)三種類別將步驟S102所讀出的企業(yè)名稱通過函數(shù)轉(zhuǎn)為UTF8方式進行數(shù)據(jù)編碼。
[0020]其中UTF8編碼的需要在文件頭加入以下代碼段:
〈script language=,,javaScript,, runat=〃Server〃>funct1n ce(str)
{
return encodeURIComponent(str)
}
</script)
〈head〉
<meta http-equiv=〃Content_Type〃 content=〃text/html; charset=UTF8〃>
<meta http-equiv=〃Content_Language〃 content=〃zh_cn〃>
步驟S104,在步驟S103生成的對應(yīng)編碼方式的數(shù)據(jù)后,通過URLencode/URLDecode加密/解密函數(shù)將上述步驟S103的數(shù)據(jù)進行加密,并輸出為第一變量,其中軟件著作權(quán)公告信息中,第一變量為明文,不進行加密山RLencode/URLDecode加密/解密函數(shù)將上述步驟S103的數(shù)據(jù)進行加密,其加密編碼根據(jù)實際情況進行一次加密、二次和多次加密,其中一次加密的bb=ce (〃〃&aa&〃〃),兩次加密的方式為CC= ce (〃〃&bb&〃〃),多次加密的方法類似。
[0021]步驟S105,以上述第一變量作為對應(yīng)的URL的對應(yīng)參數(shù)值生成第一 URL,使用ASP開發(fā)語言分別表達如下第一變量假設(shè)為cname:
http://cpquery.sip0.gov.cn//txnQueryOrdinaryPatents.do?select_key%3Ashenqingh=&select-key%3Azhuanlimc=&select-key%3Ashenqingrxm=<%=cname%>&select-key%3Azhuanlilx=&select-key%3Ashenqingr_from=&select-key%3Ashenqingr_to=&attribute_node:record_start-row=60&attribute_node:record_page-row=100&#anchor
步驟S106,通過getHTTPPage方式訪問步驟S105生成的第一 URL,獲得第一 URL對應(yīng)的頁面的HTML格式的數(shù)據(jù)源碼供步驟S107進行標記截取。
[0022]步驟S107,通過S106獲得的HTML格式的數(shù)據(jù)源碼,通過以“〈title〉”標記開始和“〈/title〉”標記結(jié)束生成第一信息碼;通過開始標記為“sop-totalCount”,結(jié)束標記為“〈/span〉] ”標記截取生成第二信息碼。
[0023]當?shù)谝恍畔⒋a的值為空時,返回S102步驟,同時檢查網(wǎng)絡(luò)是否正常;當?shù)诙畔⒋a為空時,跳過步驟S108,并設(shè)置第三信息碼的值為“O”;當?shù)诙畔⒋a不為空時,執(zhí)行步驟S108o
[0024]步驟S108,生成第三信息碼:第二信息碼不為空時,第三信息碼通過第二信息碼去雜質(zhì)后剩下數(shù)字為第三信息碼的值;知識產(chǎn)權(quán)類型為商標時,第二信息碼不為空時,第三信息碼的值為“I”。
[0025]步驟S109,當?shù)诙畔⒋a不為空時,將第一信息碼、第二信息碼和第三信息碼的信息,以及相應(yīng)的輔助數(shù)據(jù)對應(yīng)存貯在擁有知識產(chǎn)權(quán)的企業(yè)信息庫中,輔助數(shù)據(jù)包括通過步驟S102所讀出的企業(yè)名稱傳遞而獲得企業(yè)名稱,通過步驟S107和步驟S108追加獲取當前的系統(tǒng)時間。
[0026]將所有數(shù)據(jù)執(zhí)行步驟SllO存入知識產(chǎn)權(quán)的企業(yè)信息總表,同時返回步驟SlOl將已經(jīng)成功檢索的記錄的進行已執(zhí)行的標記然后,返回步驟S102循環(huán)執(zhí)行,直至所有符合條件的企業(yè)數(shù)據(jù)檢索完成為止。
[0027]在執(zhí)行步驟S102前,通過設(shè)置一定數(shù)量的采樣數(shù)據(jù)進行采樣,采樣數(shù)據(jù)包括企業(yè)擁有三種知識產(chǎn)權(quán)類別的一種、兩種、三種及上述組合的一定量的企業(yè),以及沒有任何知識產(chǎn)權(quán)的一定量的企業(yè),采樣走完整個流程,查看相關(guān)采集是否正常,此步驟確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確。
[0028]當全部待查的企業(yè)信息庫中符合條件的數(shù)據(jù)均已被正確執(zhí)行,并存入第一比對信息庫后,第一比對信息庫里的信息即為擁有專利公告信息的企業(yè),接下來執(zhí)行步驟S201獲取詳細的專利狀態(tài)記錄及年費信息;
步驟S201從第一比對信息庫中獲取企業(yè)名稱,將編碼方式改為UTF8和URLencode/URLDecode加密/解密函數(shù)對應(yīng)生成符合規(guī)范的企業(yè)名稱數(shù)據(jù),并設(shè)置為第二變量;
步驟S202,生成對應(yīng)的帶第二變量的第二 URL,并通過getHTTPPage方式訪問第二 URL,將結(jié)果HTML靜態(tài)化,供步驟S203分別進行標記截?。?br> 步驟S203,根據(jù)標記進行HTML內(nèi)容截取獲得第五信息碼、第六信息碼、第七信息碼和第八信息碼;當?shù)谖逍畔⒋a為空時,對應(yīng)的企業(yè)的專利公告信息截取出錯,返回步驟S201,并檢查網(wǎng)絡(luò)連接狀態(tài)、第一信息庫連接情況和對應(yīng)的專利公告信息發(fā)布網(wǎng)站的URL是否發(fā)生變化;
當?shù)谖逍畔?