一種實(shí)現(xiàn)區(qū)域企業(yè)專利信息摸底與管理的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明主要涉及一種實(shí)現(xiàn)區(qū)域企業(yè)專利信息摸底與管理的方法,尤其是通過(guò)專利公告公布網(wǎng)站的頁(yè)面信息抓取、分析、整理、建檔和運(yùn)用以實(shí)現(xiàn)待查的區(qū)域的企業(yè)的專利法律狀態(tài)摸底以及擁有專利的企業(yè)進(jìn)行狀態(tài)監(jiān)控、年費(fèi)提醒等功能的方法。
【背景技術(shù)】
[0002]目前,一個(gè)地區(qū),或者說(shuō)一定區(qū)域的企業(yè),想查詢所有企業(yè)各自的專利公告擁有情況,尤其是廣譜式的全民式查底,目前的方法相對(duì)難以實(shí)現(xiàn),其不但需要到每個(gè)部門將專利數(shù)據(jù)歸庫(kù),并且需要對(duì)每個(gè)地區(qū)數(shù)以百萬(wàn)計(jì)的企業(yè)與數(shù)以百萬(wàn)計(jì)的數(shù)據(jù)進(jìn)行比對(duì),這樣不但成本高,而且數(shù)據(jù)源相對(duì)敏感而難以實(shí)現(xiàn)。
[0003]然而,一個(gè)地區(qū)的企業(yè)的專利狀況,對(duì)于地方知識(shí)產(chǎn)權(quán)政策的制定與實(shí)施,以及地方政府對(duì)企業(yè)知識(shí)產(chǎn)權(quán)的管理等具有極強(qiáng)的基礎(chǔ)性需求。
【發(fā)明內(nèi)容】
[0004]為了解決上述問(wèn)題,本發(fā)明提出了一種基于專利的公眾公開的登記或變更公告數(shù)據(jù)的頁(yè)面級(jí)別的通過(guò)getHTTPPage方法的抓取技術(shù),再結(jié)合數(shù)據(jù)庫(kù)技術(shù),采用企業(yè)數(shù)據(jù)預(yù)處理,第一次定性查詢,第二次定量查詢和第三次詳情查詢,最后進(jìn)行第二數(shù)據(jù)庫(kù)為基礎(chǔ)的專利法律狀態(tài)監(jiān)控、年費(fèi)提醒等監(jiān)控與管理的方法,此方法無(wú)需第三方的各種許可,而是通過(guò)合法的數(shù)據(jù)獲取而低成本高速度地實(shí)現(xiàn)。
[0005]—種實(shí)現(xiàn)區(qū)域企業(yè)專利信息摸底與管理的方法,其主要包含以下步驟:
步驟S102,在企業(yè)信息庫(kù)中讀出企業(yè)名稱的待查數(shù)據(jù);
步驟S103,將步驟S102所讀出的企業(yè)名稱通過(guò)函數(shù)轉(zhuǎn)為UTF8編碼方式進(jìn)行數(shù)據(jù)編碼;
步驟S104,在步驟S103生成的對(duì)應(yīng)編碼方式的數(shù)據(jù)后,通過(guò)URLencode/URLDecode加密/解密函數(shù)將上述步驟S103的數(shù)據(jù)進(jìn)行加密,并輸出為第一變量;
步驟S105,以上述第一變量作為對(duì)應(yīng)的URL的對(duì)應(yīng)參數(shù)值生成第一 URL ;
步驟S106,通過(guò)getHTTPPage方式訪問(wèn)步驟S105生成的第一 URL,獲得第一 URL對(duì)應(yīng)的頁(yè)面的HTML格式的數(shù)據(jù)源碼供步驟S107進(jìn)行標(biāo)記截?。?br> 步驟S107,通過(guò)S106獲得的HTML格式的數(shù)據(jù)源碼,通過(guò)以“〈title〉”標(biāo)記開始和“〈/title〉”標(biāo)記結(jié)束生成第一信息碼;通過(guò)如下標(biāo)記截取生成第二信息碼:開始標(biāo)記為“ sop-totalCount ”,結(jié)束標(biāo)記為 “ </span〉] ” ;
當(dāng)?shù)谝恍畔⒋a的值為空時(shí),返回S102步驟,同時(shí)檢查網(wǎng)絡(luò)是否正常;當(dāng)?shù)诙畔⒋a為空時(shí),跳過(guò)步驟S108和S109,并設(shè)置第三信息碼的值為“O” ;當(dāng)?shù)诙畔⒋a不為空時(shí),執(zhí)行步驟S108 ;
步驟S108,生成第三信息碼:第二信息碼不為空時(shí),第三信息碼通過(guò)第二信息碼去雜質(zhì)后剩下數(shù)字獲得; 步驟S109,當(dāng)?shù)诙畔⒋a不為空時(shí),將第一信息碼、第二信息碼和第三信息碼的信息,以及相應(yīng)的輔助數(shù)據(jù)對(duì)應(yīng)存貯在擁有專利申請(qǐng)的企業(yè)信息庫(kù)中;
將所有數(shù)據(jù)執(zhí)行步驟SllO存入專利企業(yè)信息總表,同時(shí)返回步驟SlOl將已經(jīng)成功檢索的記錄的進(jìn)行已執(zhí)行的標(biāo)記然后,返回步驟S102循環(huán)執(zhí)行,直至所有符合條件的企業(yè)數(shù)據(jù)檢索完成為止;
當(dāng)全部待查的企業(yè)信息庫(kù)中符合條件的數(shù)據(jù)均已被正確執(zhí)行,并存入第一比對(duì)信息庫(kù)后,第一比對(duì)信息庫(kù)里的信息即為擁有專利公告信息的企業(yè),接下來(lái)執(zhí)行步驟S201獲取詳細(xì)的專利狀態(tài)記錄及年費(fèi)信息;
步驟S201從第一比對(duì)信息庫(kù)中獲取企業(yè)名稱,將編碼方式改為UTF8和URLencode/URLDecode加密/解密函數(shù)對(duì)應(yīng)生成符合規(guī)范的企業(yè)名稱數(shù)據(jù),并設(shè)置為第二變量;
步驟S202,生成對(duì)應(yīng)的帶第二變量的第二 URL,并通過(guò)getHTTPPage方式訪問(wèn)第二 URL,將結(jié)果HTML靜態(tài)化,供步驟S203分別進(jìn)行標(biāo)記截取;
步驟S203,根據(jù)標(biāo)記進(jìn)行HTML內(nèi)容截取獲得第五信息碼、第六信息碼、第七信息碼和第八信息碼;當(dāng)?shù)谖逍畔⒋a為空時(shí),對(duì)應(yīng)的企業(yè)的專利公告信息截取出錯(cuò),返回步驟S201,并檢查網(wǎng)絡(luò)連接狀態(tài)、第一信息庫(kù)連接情況和對(duì)應(yīng)的專利公告信息發(fā)布網(wǎng)站的URL是否發(fā)生變化;
當(dāng)?shù)谖逍畔⒋a不為空,第六信息碼為空時(shí),表明該企業(yè)對(duì)應(yīng)的專利公告信息公布頁(yè)面中顯示只有一頁(yè)的對(duì)應(yīng)的專利公告信息,不翻頁(yè),程序依次標(biāo)記并截取生成如下字段:企業(yè)名稱、專利名稱、專利類型、專利法律狀態(tài)、專利申請(qǐng)?zhí)柣蛘邔@?hào)和專利公開時(shí)間,同時(shí)與第二輔助信息存貯到第一企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù);
當(dāng)?shù)谖逍畔⒋a和第六信息碼同時(shí)不為空,并且第七信息碼為空時(shí),第八信息碼即為頁(yè)碼,將第八信息碼去雜余數(shù)字后加入U(xiǎn)RL的頁(yè)碼參數(shù),生成第三URL,以第三URL中的第八信息碼為結(jié)束碼,O為開始碼生成FOR循環(huán)列出第三URL的子URL,并且依次執(zhí)行步驟S203步驟,直至FOR循環(huán)結(jié)束;
步驟S204,通過(guò)步驟S203,專利的基本信息存入第一企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)后,按照步驟S201和步驟S202的方法,以第一企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)為數(shù)據(jù)基礎(chǔ),讀取出企業(yè)名稱、專利名稱和專利申請(qǐng)?zhí)柣蛘邔@?hào),經(jīng)過(guò)格式轉(zhuǎn)化后獲得對(duì)應(yīng)的非加密的企業(yè)名稱,不帶點(diǎn)的專利號(hào)和通過(guò)URLencode加密后的專利名稱,并通過(guò)專利號(hào)或?qū)@暾?qǐng)?zhí)枮樽兞繀?shù),與專利公告發(fā)布網(wǎng)站的URL形成第三URL,并通過(guò)getHTTPPage方式訪問(wèn)第三URL,將結(jié)果HTML靜態(tài)化,供步驟S205分別進(jìn)行標(biāo)記截??;
步驟S205,通過(guò)標(biāo)記截取獲得第九信息碼、第十信息碼、第十一信息碼和第十二信息碼,其中第九信息為申請(qǐng)人名稱,第十信息碼為專利申請(qǐng)?zhí)柣蛘邔@?hào),第十一信息碼為申請(qǐng)日期,第十二信息碼為專利狀態(tài),當(dāng)專利法律狀態(tài)為“專利權(quán)維持”時(shí),轉(zhuǎn)到對(duì)應(yīng)的以專利申請(qǐng)?zhí)柣蛘邔@?hào)為變量參數(shù)的指向“專利費(fèi)用信息”的第四URL,并通過(guò)getHTTPPage方式訪問(wèn)第四URL,將結(jié)果HTML靜態(tài)化,通過(guò)標(biāo)識(shí)截取首年年費(fèi)金額,將上述信息與第三輔助信息一并存入第二企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù);
步驟S206,讀出第二企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)的專利狀態(tài)為“專利權(quán)維持”的專利的專利申請(qǐng)?zhí)柣驅(qū)@?hào)、專利名稱、專利申請(qǐng)日期、專利首年年費(fèi)金額信息,通過(guò)公式計(jì)算出第二年所需要繳納的年費(fèi)金額及繳費(fèi)時(shí)間,然后發(fā)出信號(hào)提醒年費(fèi)時(shí)間; 步驟S301,上述所有步驟完成后,分別對(duì)第一組步驟S101、S102、S103、S104、S105、S106、S107、S108 和 S109,第二組步驟 S201、S202、S203、S204、S205 和 S206 分別設(shè)定下一次的執(zhí)行時(shí)間以定期檢索,并且可以對(duì)SlOl的企業(yè)信息庫(kù)中新增的企業(yè)進(jìn)行增量的檢索;步驟S302,上述所有步驟完成后,結(jié)束全部步驟。
[0006]所述的第一信息碼:通過(guò)以“〈title〉”標(biāo)記開始和“〈/title〉”標(biāo)記結(jié)束生成;第二信息碼:開始標(biāo)記為“sop-totalCount”,結(jié)束標(biāo)記為“〈/span〉] ”。
[0007]執(zhí)行步驟S102前執(zhí)行步驟SlOl進(jìn)行企業(yè)信息查詢中,進(jìn)行企業(yè)類型、企業(yè)名稱、企業(yè)成立時(shí)間、企業(yè)注冊(cè)資金和企業(yè)注冊(cè)地址的一種條件或者多個(gè)條件組合檢索篩選出所需要檢索的數(shù)據(jù)。
[0008]其特征包括,所述的步驟S205,當(dāng)專利法律狀態(tài)為“專利權(quán)維持”時(shí),還可以循環(huán)標(biāo)記截取“應(yīng)繳費(fèi)信息”對(duì)應(yīng)的每年的年費(fèi)金額及對(duì)應(yīng)的繳費(fèi)截止日期并存入第二企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)中年費(fèi)信息表中,并通過(guò)上述年費(fèi)信息表與系統(tǒng)時(shí)間進(jìn)行比對(duì),在設(shè)定的提醒時(shí)間范圍進(jìn)行提醒。
[0009]所述的步驟S205,當(dāng)專利法律狀態(tài)為“專利權(quán)維持”時(shí),第二年年費(fèi)的時(shí)間計(jì)算為“專利申請(qǐng)日”+當(dāng)前系統(tǒng)的時(shí)間中的年份;與此對(duì)應(yīng)所需要繳納的年費(fèi)金額為:首年年費(fèi)金額與第二企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)中年費(fèi)對(duì)照表的數(shù)據(jù)比對(duì)確定是否減緩,然后根據(jù)減緩標(biāo)記、申請(qǐng)時(shí)間和首年年費(fèi)繳納時(shí)間進(jìn)行比對(duì),確定專利類型和第二年年費(fèi)的金額。
[0010]步驟S109所述的輔助數(shù)據(jù)包括通過(guò)步驟S102所讀出的企業(yè)名稱傳遞而獲得企業(yè)名稱,通過(guò)步驟S107和步驟S108追加獲取當(dāng)前的系統(tǒng)時(shí)間。
[0011]在執(zhí)行步驟S102前,通過(guò)設(shè)