本實(shí)用新型涉及互聯(lián)網(wǎng)數(shù)據(jù)處理領(lǐng)域,特別涉及一種網(wǎng)頁(yè)數(shù)據(jù)采集裝置。
背景技術(shù):
隨著計(jì)算機(jī)網(wǎng)絡(luò)的迅速發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為一個(gè)巨大的信息資源庫(kù),最常用的資源通常通過(guò)網(wǎng)頁(yè)的方式呈現(xiàn)。通過(guò)網(wǎng)頁(yè),用戶(hù)獲取信息的方式得到了拓展,并且隨著網(wǎng)絡(luò)技術(shù)的不斷成熟,互聯(lián)網(wǎng)已經(jīng)成為用戶(hù)獲取信息的主要載體。通過(guò)該信息資源庫(kù),我們可以從浩瀚的信息資源海洋中精準(zhǔn)采集到我們所需要的信息;在對(duì)采集的信息進(jìn)行加工分析的基礎(chǔ)上就可以使用戶(hù)在信息采集,資源整合方面節(jié)約大量的人力與資金。
目前的數(shù)據(jù)采集方式主要是將從網(wǎng)頁(yè)上采集到的相關(guān)數(shù)據(jù)下載到電腦或移動(dòng)磁盤(pán)中,在對(duì)下載的數(shù)據(jù)進(jìn)行分析處理,以實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)數(shù)據(jù)的精準(zhǔn)采集。在通過(guò)提取網(wǎng)頁(yè)進(jìn)行數(shù)據(jù)信息采集時(shí),每?jī)纱涡畔⒉杉g存在一定的時(shí)間間隔,現(xiàn)有技術(shù)中一般每?jī)纱涡畔⒉杉g的時(shí)間間隔相等,或者該時(shí)間間隔符合泊松分布。在進(jìn)行信息采集時(shí),每?jī)纱涡畔⒉杉g采用相等的時(shí)間間隔時(shí),如果應(yīng)用在更新比較緩慢的網(wǎng)站上,由于網(wǎng)站的更新比較慢,每?jī)纱涡畔⒉杉^(guò)程中可能采集的信息相同,從而造成了搜索引擎資源的浪費(fèi),并且還可能帶來(lái)帶寬的浪費(fèi)。當(dāng)該時(shí)間間隔應(yīng)用在更新比較頻繁的網(wǎng)站上時(shí),由于網(wǎng)站的更新比較頻繁,網(wǎng)站的內(nèi)容可能已經(jīng)更新了,但是下一采集時(shí)間還沒(méi)有到來(lái),因此可能由于信息的漏采,造成信息采集的不準(zhǔn)確。而當(dāng)時(shí)間間隔符合泊松分布時(shí),也只是由搜索引擎運(yùn)行的時(shí)間增長(zhǎng),而使時(shí)間間隔趨于一個(gè)穩(wěn)定值,即當(dāng)搜索引擎長(zhǎng)時(shí)間運(yùn)行時(shí),搜索引擎的信息采集的時(shí)間間隔也為一恒定值,因此該時(shí)間間隔在進(jìn)行信息采集的過(guò)程中也會(huì)造成資源的浪費(fèi),及信息采集不準(zhǔn)確的問(wèn)題。
針對(duì)這種情況,出現(xiàn)了申請(qǐng)?zhí)枮?01010236363.7的專(zhuān)利文件“一種網(wǎng)頁(yè)數(shù)據(jù)信息的定向采集方法及裝置”,該裝置包括抽取模塊、第一確定模塊、第二確定模塊和確定采集模塊。其中,抽取模塊用于根據(jù)采集到的列表頁(yè)對(duì)應(yīng)網(wǎng)頁(yè)的內(nèi)容,抽取每個(gè)內(nèi)容所在的內(nèi)容頁(yè)的統(tǒng)一資源定位符信息,其中所述列表頁(yè)為用于數(shù)據(jù)信息采集的網(wǎng)頁(yè);第一確定模塊,用于根據(jù)抽取的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息,及服務(wù)器中保存的已經(jīng)進(jìn)行了數(shù)據(jù)信息采集的每個(gè)統(tǒng)一資源定位符信息,確定該列表頁(yè)中未進(jìn)行數(shù)據(jù)信息采集的統(tǒng)一資源定位符信息的數(shù)量;第二確定模塊,用于根據(jù)確定的所述列表頁(yè)中未進(jìn)行數(shù)據(jù)信息采集的統(tǒng)一資源定位符信息的數(shù)量,及抽取的所述內(nèi)容頁(yè)的統(tǒng)一資源定位符信息的數(shù)量,確定所述列表頁(yè)(列表頁(yè)為用于數(shù)據(jù)信息采集的網(wǎng)頁(yè))當(dāng)前的頁(yè)面更新率;確定采集模塊,用于根據(jù)所述列表頁(yè)所屬網(wǎng)站的標(biāo)準(zhǔn)更新率,確定的所述列表頁(yè)當(dāng)前的頁(yè)面更新率,及當(dāng)前的信息采集時(shí)間間隔,確定針對(duì)所述列表頁(yè)當(dāng)前數(shù)據(jù)信息采集與下一次數(shù)據(jù)信息采集的時(shí)間間隔,并在等待該確定的時(shí)間間隔來(lái)后,進(jìn)行數(shù)據(jù)信息采集。該裝置基本解決現(xiàn)有技術(shù)中搜索引擎在進(jìn)行信息采集時(shí),造成的資源浪費(fèi)及信息采集不準(zhǔn)確的問(wèn)題。但是在數(shù)據(jù)的儲(chǔ)存過(guò)程中,由于儲(chǔ)存設(shè)備(計(jì)算機(jī)、移動(dòng)磁盤(pán)等)的存儲(chǔ)空間有限,數(shù)據(jù)不斷在存儲(chǔ)設(shè)備中累積,當(dāng)儲(chǔ)存設(shè)備存儲(chǔ)數(shù)據(jù)趨于飽和時(shí),會(huì)導(dǎo)致采集數(shù)據(jù)的分析處理速度變得緩慢。
技術(shù)實(shí)現(xiàn)要素:
本實(shí)用新型意在提供一種網(wǎng)頁(yè)數(shù)據(jù)采集裝置,以解決現(xiàn)有技術(shù)中的數(shù)據(jù)采集系統(tǒng)因存儲(chǔ)設(shè)備容量不足及噪音數(shù)據(jù)不能及時(shí)刪除而導(dǎo)致運(yùn)行速度緩慢的問(wèn)題。
本方案中的網(wǎng)頁(yè)數(shù)據(jù)采集裝置,包括殼體,殼體內(nèi)設(shè)有電子芯片,電子芯片包括端口模塊、抽取模塊、虛擬模塊和存儲(chǔ)模塊;端口模塊包括連接單元、輸入單元和輸出單元;虛擬模塊包括虛擬發(fā)生子模塊和虛擬空間子模塊;虛擬空間子模塊包括第一確定單元、第二確定單元、刪減單元和確定采集單元;存儲(chǔ)模塊包括存儲(chǔ)單元和壓縮單元;連接單元與輸入單元間通過(guò)電信號(hào)雙向連接,輸入單元與抽取模塊間通過(guò)電信號(hào)雙向連接,抽取模塊通過(guò)電信號(hào)單向連接第一確定單元,第一確定單元通過(guò)電信號(hào)單向連接第二確定單元,第二確定單元與刪減單元間通過(guò)電信號(hào)雙向連接,第二確定單元通過(guò)電信號(hào)單向連接存儲(chǔ)單元,存儲(chǔ)單元與壓縮單元間通過(guò)電信號(hào)雙向連接,存儲(chǔ)單元通過(guò)電信號(hào)雙向連接輸出單元和單向連接第一確定單元;
抽取模塊,用于根據(jù)采集到的列表頁(yè)對(duì)應(yīng)網(wǎng)頁(yè)的內(nèi)容,抽取每個(gè)內(nèi)容所在的內(nèi)容頁(yè)的統(tǒng)一資源定位符信息;
連接單元,用于與計(jì)算機(jī)進(jìn)行連接;
輸入單元,用于將網(wǎng)頁(yè)傳輸?shù)匠槿∧K;
輸出單元,用于將標(biāo)識(shí)信息傳輸至網(wǎng)絡(luò);
虛擬發(fā)生子模塊,用于產(chǎn)生大容量虛擬空間;
第一確定單元,用于根據(jù)抽取的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息,確定每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)標(biāo)識(shí)信息;
第二確定單元,用于針對(duì)確定的每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)的標(biāo)識(shí)信息,判斷是否存在該確定的標(biāo)識(shí)信息;
刪減單元,用于刪除篩分單元中重復(fù)多余的重復(fù)信息與已存在的標(biāo)識(shí)信息;
確定采集單元,用于根據(jù)列表頁(yè)所屬網(wǎng)頁(yè)的標(biāo)準(zhǔn)更新率,確定針對(duì)列表頁(yè)當(dāng)前數(shù)據(jù)信息采集與下一次數(shù)據(jù)信息采集的時(shí)間間隔;
存儲(chǔ)單元,用于存放標(biāo)識(shí)信息;
壓縮單元,用于壓縮所述存儲(chǔ)單元內(nèi)的標(biāo)識(shí)信息。
本實(shí)用新型的工作原理:包括殼體,殼體內(nèi)設(shè)有電子芯片,電子芯片包括端口模塊、抽取模塊、虛擬模塊和存儲(chǔ)模塊;端口模塊包括連接單元、輸入單元和輸出單元;將網(wǎng)頁(yè)數(shù)據(jù)采集裝置插入計(jì)算機(jī)USB插口,網(wǎng)頁(yè)數(shù)據(jù)采集裝置通過(guò)連接單元連接計(jì)算機(jī),通過(guò)計(jì)算機(jī)輸入需要采集信息的關(guān)鍵字,計(jì)算機(jī)網(wǎng)頁(yè)搜索到的內(nèi)容通過(guò)輸入端口以電信號(hào)方式傳輸給抽取模塊,抽取模塊根據(jù)采集到的列表頁(yè)對(duì)應(yīng)網(wǎng)頁(yè)的內(nèi)容,抽取每個(gè)內(nèi)容所在的內(nèi)容頁(yè)的統(tǒng)一資源定位符信息。虛擬模塊包括虛擬發(fā)生子模塊和虛擬空間子模塊;虛擬空間子模塊包括第一確定單元、第二確定單元、刪減單元和確定采集單元;虛擬發(fā)生子模塊通過(guò)預(yù)先設(shè)置的程序產(chǎn)生大容量的虛擬空間用以處理相關(guān)數(shù)據(jù)信息;抽取模塊將抽取到的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息通過(guò)電信號(hào)傳輸給第一確定單元,第一確定單元根據(jù)抽取的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息,確定每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)標(biāo)識(shí)信息,然后以電信號(hào)的方式傳輸?shù)降诙_定單元,第二確定單元針對(duì)確定的每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)的標(biāo)識(shí)信息,判斷是否存在該確定的標(biāo)識(shí)信息;第二確定單元將確認(rèn)的標(biāo)識(shí)信息傳輸給確定采集單元,確定采集單元根據(jù)列表頁(yè)所屬網(wǎng)頁(yè)的標(biāo)準(zhǔn)更新率,確定針對(duì)列表頁(yè)當(dāng)前數(shù)據(jù)信息采集與下一次數(shù)據(jù)信息采集的時(shí)間間隔,并將該時(shí)間間隔以電信號(hào)方式反饋給抽取模塊。與此同時(shí),第二確定單元將確認(rèn)的標(biāo)識(shí)信息傳輸給刪減單元,刪減單元根據(jù)第二確定單元提供的信息,發(fā)出指令刪除第二確定單元中重復(fù)的信息,保留最新信息。存儲(chǔ)模塊包括存儲(chǔ)單元和壓縮單元;第二確定單元將確認(rèn)的標(biāo)識(shí)信息通過(guò)電信號(hào)單向傳輸給存儲(chǔ)單元,存儲(chǔ)單元將新的標(biāo)識(shí)信息進(jìn)行儲(chǔ)存,然后通過(guò)電信號(hào)將標(biāo)識(shí)數(shù)據(jù)傳輸給壓縮單元,壓縮單元通過(guò)接受到到表示數(shù)據(jù)信息查看是否存在更新,存在更新即向存儲(chǔ)單元發(fā)出指令進(jìn)行壓縮;存儲(chǔ)單元存在更新后將更新后的標(biāo)識(shí)信息反饋給第一確定單元。當(dāng)需要查看具體數(shù)據(jù)信息時(shí),通過(guò)輸出單元向存儲(chǔ)單元發(fā)出指令,存儲(chǔ)單元的數(shù)據(jù)通過(guò)輸出單元傳輸?shù)接?jì)算機(jī),并通過(guò)計(jì)算機(jī)屏幕顯示出來(lái)。
本實(shí)用新型的有益效果:1、設(shè)置有虛擬發(fā)生子模塊,通過(guò)虛擬發(fā)生子模塊可以產(chǎn)生大容量的虛擬空間,當(dāng)采集的數(shù)據(jù)進(jìn)入虛擬空間內(nèi)進(jìn)行處理時(shí),由于虛擬空間具有極大的儲(chǔ)存空間,可以大大提高其運(yùn)行速度,同時(shí)不必?fù)?dān)心待處理數(shù)據(jù)占滿(mǎn)處理空間。2、設(shè)有確定采集單元,確定采集單元能根據(jù)列表頁(yè)所屬網(wǎng)頁(yè)的標(biāo)準(zhǔn)更新率,確定針對(duì)列表頁(yè)當(dāng)前數(shù)據(jù)信息采集與下一次數(shù)據(jù)信息采集的時(shí)間間隔,并將其時(shí)間間隔反饋給抽取模塊,避免抽取模塊抽取速度過(guò)快或過(guò)慢對(duì)數(shù)據(jù)信息的采集效率造成不良影響。3、設(shè)有刪減單元,通過(guò)刪減單元可以將重復(fù)無(wú)用的數(shù)據(jù)及時(shí)刪除,通過(guò)對(duì)無(wú)用信息數(shù)據(jù)的刪除,及時(shí)釋放內(nèi)存空間,有利于進(jìn)一步提升其運(yùn)行速度。在刪除數(shù)據(jù)的同時(shí)保留最新的數(shù)據(jù)信息,便于確定采集單元對(duì)網(wǎng)頁(yè)標(biāo)識(shí)信息的標(biāo)準(zhǔn)更新率。4、設(shè)置有壓縮單元,壓縮單元能訪問(wèn)存儲(chǔ)單元,根據(jù)存儲(chǔ)單元的更新信息,及時(shí)對(duì)存儲(chǔ)單元內(nèi)的數(shù)據(jù)進(jìn)行壓縮,釋放儲(chǔ)存空間,有利于提高運(yùn)行速度,提高效率。
進(jìn)一步,所述虛擬空間子模塊上還設(shè)有篩分單元;篩分單元與所述刪減單元間通過(guò)電信號(hào)雙向連接,抽取模塊通過(guò)電信號(hào)單向連接篩分單元,篩分單元通過(guò)電信號(hào)單向連接第一確定單元;篩分單元用于篩分出網(wǎng)頁(yè)信息中重復(fù)信息。第一確定單元對(duì)抽取模塊中的數(shù)據(jù)進(jìn)行確定標(biāo)識(shí)信息時(shí),由于抽取模塊中存在較多重復(fù)的數(shù)據(jù),導(dǎo)致第一確定單元的工作量增加,使得數(shù)據(jù)的采集速度降低。通過(guò)設(shè)置篩分單元,篩分單元能對(duì)抽取模塊傳輸過(guò)來(lái)的信息進(jìn)行初步篩選,并篩選出具有重復(fù)的信息,通過(guò)將篩分單元連接刪減單元,刪減單元經(jīng)多余的數(shù)據(jù)刪除,多條重復(fù)的信息只保留一條,然后再將經(jīng)過(guò)篩選的數(shù)據(jù)信息傳輸給第一確定單元,從而降低了第一確定單元的工作量;而篩分單元和第一確定單元同時(shí)進(jìn)行,有利于降低數(shù)據(jù)采集時(shí)間。
進(jìn)一步,所述存儲(chǔ)模塊上還設(shè)有備份單元,存儲(chǔ)單元通過(guò)電信號(hào)雙向連接備份單元,備份單元通過(guò)電信號(hào)雙向連接輸出單元;備份單元用于備份最新的標(biāo)識(shí)數(shù)據(jù)。在數(shù)據(jù)的采集過(guò)程中,容易出現(xiàn)斷電或者網(wǎng)絡(luò)故障問(wèn)題,當(dāng)該類(lèi)問(wèn)題發(fā)生時(shí),由于沒(méi)有進(jìn)行數(shù)據(jù)備份,數(shù)據(jù)丟失,需要對(duì)故障發(fā)生前采集到的數(shù)據(jù)進(jìn)行重新采集,造成數(shù)據(jù)采集過(guò)慢。設(shè)置備份模塊,備份模塊可以將儲(chǔ)存單元中更新的標(biāo)識(shí)數(shù)據(jù)及時(shí)進(jìn)行備份,防止網(wǎng)絡(luò)故障時(shí)數(shù)據(jù)的丟失;同時(shí),備份模塊可以將最新檢索的關(guān)鍵詞、起始采集位置、最后采集位置進(jìn)行備份,當(dāng)故障消除后,輸入關(guān)鍵詞,數(shù)據(jù)的采集將直接從最后采集位置繼續(xù)進(jìn)行,避免了重復(fù)采集,降低了采集量,節(jié)約了時(shí)間。
附圖說(shuō)明
圖1為本實(shí)用新型網(wǎng)頁(yè)數(shù)據(jù)采集裝置的結(jié)構(gòu)示意圖;
圖2為本實(shí)用新型網(wǎng)頁(yè)數(shù)據(jù)采集裝置的流程圖。
具體實(shí)施方式
下面通過(guò)具體實(shí)施方式對(duì)本實(shí)用新型作進(jìn)一步詳細(xì)的說(shuō)明:
說(shuō)明書(shū)附圖中的附圖標(biāo)記包括:殼體1、虛擬發(fā)生子模塊2、虛擬空間子模塊3、存儲(chǔ)模塊4、端口模塊5、連接單元51、輸入單元52、輸出單元53。
如附圖1和圖2所示的網(wǎng)頁(yè)數(shù)據(jù)采集裝置,包括殼體1,殼體1內(nèi)設(shè)有電子芯片,電子芯片包括端口模塊5、抽取模塊、虛擬模塊和存儲(chǔ)模塊4;端口模塊5包括連接單元51、輸入單元52和輸出單元53;虛擬模塊包括虛擬發(fā)生子模塊2和虛擬空間子模塊3;虛擬空間子模塊3包括篩分單元、第一確定單元、第二確定單元、刪減單元和確定采集單元;存儲(chǔ)模塊4包括存儲(chǔ)單元、壓縮單元和備份單元;連接單元51與輸入單元52間通過(guò)電信號(hào)雙向連接,輸入單元52與抽取模塊間通過(guò)電信號(hào)雙向連接,抽取模塊通過(guò)電信號(hào)單向連接第一確定單元,篩分單元與刪減單元間通過(guò)電信號(hào)雙向連接,抽取模塊通過(guò)電信號(hào)單向連接篩分單元,篩分單元通過(guò)電信號(hào)單向連接第一確定單元,第一確定單元通過(guò)電信號(hào)單向連接第二確定單元,第二確定單元與刪減單元間通過(guò)電信號(hào)雙向連接,第二確定單元通過(guò)電信號(hào)單向連接存儲(chǔ)單元,存儲(chǔ)單元與壓縮單元間通過(guò)電信號(hào)雙向連接,存儲(chǔ)單元通過(guò)電信號(hào)雙向連接輸出單元53和單向連接第一確定單元;存儲(chǔ)單元通過(guò)電信號(hào)雙向連接備份單元,備份單元通過(guò)電信號(hào)雙向連接輸出單元53;
抽取模塊,用于根據(jù)采集到的列表頁(yè)對(duì)應(yīng)網(wǎng)頁(yè)的內(nèi)容,抽取每個(gè)內(nèi)容所在的內(nèi)容頁(yè)的統(tǒng)一資源定位符信息;
連接單元51,用于與計(jì)算機(jī)進(jìn)行連接;
輸入單元52,用于將網(wǎng)頁(yè)傳輸?shù)匠槿∧K;
輸出單元53,用于將標(biāo)識(shí)信息傳輸至網(wǎng)絡(luò);
虛擬發(fā)生子模塊2,用于產(chǎn)生大容量虛擬空間;
篩分單元,用于篩分出網(wǎng)頁(yè)信息中重復(fù)信息
第一確定單元,用于根據(jù)抽取的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息,確定每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)標(biāo)識(shí)信息;
第二確定單元,用于針對(duì)確定的每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)的標(biāo)識(shí)信息,判斷是否存在該確定的標(biāo)識(shí)信息;
刪減單元,用于刪除篩分單元中重復(fù)多余的重復(fù)信息與已存在的標(biāo)識(shí)信息;
確定采集單元,用于根據(jù)列表頁(yè)所屬網(wǎng)頁(yè)的標(biāo)準(zhǔn)更新率,確定針對(duì)列表頁(yè)當(dāng)前數(shù)據(jù)信息采集與下一次數(shù)據(jù)信息采集的時(shí)間間隔;
存儲(chǔ)單元,用于存放標(biāo)識(shí)信息;
壓縮單元,用于壓縮所述存儲(chǔ)單元內(nèi)的標(biāo)識(shí)信息;
備份單元,用于備份最新的標(biāo)識(shí)數(shù)據(jù)。
采集數(shù)據(jù)時(shí),將網(wǎng)頁(yè)數(shù)據(jù)采集裝置插入計(jì)算機(jī)USB插口,網(wǎng)頁(yè)數(shù)據(jù)采集裝置通過(guò)連接單元51連接計(jì)算機(jī),通過(guò)計(jì)算機(jī)輸入需要采集信息的關(guān)鍵字,計(jì)算機(jī)網(wǎng)頁(yè)搜索到的內(nèi)容通過(guò)輸入端口以電信號(hào)方式傳輸給抽取模塊,抽取模塊根據(jù)采集到的列表頁(yè)對(duì)應(yīng)網(wǎng)頁(yè)的內(nèi)容,抽取每個(gè)內(nèi)容所在的內(nèi)容頁(yè)的統(tǒng)一資源定位符信息。虛擬發(fā)生子模塊2通過(guò)預(yù)先設(shè)置的程序產(chǎn)生大容量的虛擬空間用以處理相關(guān)數(shù)據(jù)信息;抽取模塊將抽取到的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息通過(guò)電信號(hào)傳輸給篩分單元,刪減單元將篩分單元中重復(fù)的信息篩除,篩分單元將經(jīng)過(guò)篩選的數(shù)據(jù)信息傳輸給第一確定單元,第一確定單元根據(jù)抽取的每個(gè)內(nèi)容頁(yè)的統(tǒng)一資源定位符信息,確定每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)標(biāo)識(shí)信息,然后以電信號(hào)的方式傳輸?shù)降诙_定單元,第二確定單元針對(duì)確定的每個(gè)統(tǒng)一資源定位符信息對(duì)應(yīng)的標(biāo)識(shí)信息,判斷是否存在該確定的標(biāo)識(shí)信息;第二確定單元將確認(rèn)的標(biāo)識(shí)信息傳輸給確定采集單元,確定采集單元根據(jù)列表頁(yè)所屬網(wǎng)頁(yè)的標(biāo)準(zhǔn)更新率,確定針對(duì)列表頁(yè)當(dāng)前數(shù)據(jù)信息采集與下一次數(shù)據(jù)信息采集的時(shí)間間隔,并將該時(shí)間間隔以電信號(hào)方式反饋給抽取模塊。與此同時(shí),第二確定單元將確認(rèn)的標(biāo)識(shí)信息傳輸給刪減單元,刪減單元根據(jù)第二確定單元提供的信息,發(fā)出指令刪除第二確定單元中重復(fù)的信息,保留最新信息。第二確定單元將確認(rèn)的標(biāo)識(shí)信息通過(guò)電信號(hào)單向傳輸給存儲(chǔ)單元,存儲(chǔ)單元將新的標(biāo)識(shí)信息進(jìn)行儲(chǔ)存,然后通過(guò)電信號(hào)將標(biāo)識(shí)數(shù)據(jù)傳輸給壓縮單元,壓縮單元通過(guò)接受到到表示數(shù)據(jù)信息查看是否存在更新,存在更新即向存儲(chǔ)單元發(fā)出指令進(jìn)行壓縮;存儲(chǔ)單元存在更新時(shí),反饋到備份單元進(jìn)行備份,備份單元將更新后的標(biāo)識(shí)信息反饋給第一確定單元。當(dāng)需要查看具體數(shù)據(jù)信息時(shí),通過(guò)輸出單元53向存儲(chǔ)單元發(fā)出指令,存儲(chǔ)單元的數(shù)據(jù)通過(guò)輸出單元53傳輸?shù)接?jì)算機(jī),并通過(guò)計(jì)算機(jī)屏幕顯示出來(lái)。
以上所述的僅是本實(shí)用新型的實(shí)施例,方案中公知的具體結(jié)構(gòu)及特性等常識(shí)在此未作過(guò)多描述。應(yīng)當(dāng)指出,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),在不脫離本實(shí)用新型結(jié)構(gòu)的前提下,還可以作出若干變形和改進(jìn),這些也應(yīng)該視為本實(shí)用新型的保護(hù)范圍,這些都不會(huì)影響本實(shí)用新型實(shí)施的效果和專(zhuān)利的實(shí)用性。本申請(qǐng)要求的保護(hù)范圍應(yīng)當(dāng)以其權(quán)利要求的內(nèi)容為準(zhǔn),說(shuō)明書(shū)中的具體實(shí)施方式等記載可以用于解釋權(quán)利要求的內(nèi)容。