亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法和裝置的制作方法

文檔序號(hào):6400726閱讀:544來源:國(guó)知局
專利名稱:對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域,具體涉及一種對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法和裝置。
背景技術(shù)
在現(xiàn)有網(wǎng)絡(luò)中,大多數(shù)網(wǎng)頁(yè)中的內(nèi)容,除文字信息之外的部分多為廣告圖片、非文章內(nèi)容等無(wú)用信息。因此,現(xiàn)有技術(shù)中采用網(wǎng)頁(yè)提取方案,將網(wǎng)頁(yè)的標(biāo)題、文章內(nèi)容等的文字提取出來,然后在設(shè)置過的閱讀網(wǎng)頁(yè)里展示提取的內(nèi)容給用戶,以提供沒有無(wú)用信息干擾的潔凈的網(wǎng)頁(yè)內(nèi)容。例如,在現(xiàn)有技術(shù)中當(dāng)用戶加載完網(wǎng)頁(yè)之后,將網(wǎng)址與設(shè)置的規(guī)則匹配,如果網(wǎng)址命中規(guī)則,則按照規(guī)則將網(wǎng)頁(yè)中的內(nèi)容進(jìn)行拆分。具體地,可以按照代碼中的標(biāo)簽確定定位,并抽取出所需要的字段文字。字段文字可以包括標(biāo)題、正文內(nèi)容等。然后,將提取的字段文字交由閱讀模式網(wǎng)頁(yè)進(jìn)行展示。由此,用戶便可以看到經(jīng)過篩選的網(wǎng)頁(yè),更加方便和專注的閱讀。采用現(xiàn)有技術(shù)中提取網(wǎng)頁(yè)文本內(nèi)容的方案,需要在每次提取時(shí),針對(duì)待提取的網(wǎng)頁(yè),匹配出該網(wǎng)頁(yè)對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,根據(jù)該網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行網(wǎng)頁(yè)內(nèi)容提取。該匹配過程需要將網(wǎng)頁(yè)文本內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行全部比對(duì),耗費(fèi)大量時(shí)間和資源,導(dǎo)致了網(wǎng)頁(yè)提取效率低下,以及網(wǎng)頁(yè)顯示的等待時(shí)延過長(zhǎng)的問題。

發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法和裝置。依據(jù)本發(fā)明的一個(gè)方面,提供了一種對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法,包括:在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置;在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載;將所述網(wǎng)頁(yè)內(nèi)容分別與所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功;利用與所述網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè);將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存??蛇x的,所述將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存具體包括:在瀏覽器側(cè)接收到在當(dāng)前頁(yè)面中用戶輸入的保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令后,提取當(dāng)前網(wǎng)址,將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。
可選的,所述配置文件為單獨(dú)保存所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的配置文件;或者所述配置文件為存儲(chǔ)所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的文件的一部分??蛇x的,所述將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中之后還包括:提取當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到所述本地配置文件中??蛇x的,所述將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存之后還包括:在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷所述下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)??蛇x的,所述將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到所述本地配置文件中之后還包括:在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),匹配下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,利用匹配出的所述下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)??蛇x的,所述自動(dòng)進(jìn)入閱讀模式后還包括:提示是否使所述下載網(wǎng)頁(yè)所在書籍自動(dòng)進(jìn)入閱讀模式,接收到確定的指令后,從網(wǎng)站獲得該書籍的各個(gè)網(wǎng)頁(yè)的網(wǎng)址,將獲得的網(wǎng)址對(duì)應(yīng)于所述下載網(wǎng)頁(yè)的網(wǎng)址匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到配置文件中。可選的,所述在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置包括:建立一匹配設(shè)置文件并將所述至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在所述匹配設(shè)置文件中;其中,所述匹配設(shè)置文件中包括至少一個(gè)網(wǎng)站節(jié)點(diǎn),每個(gè)網(wǎng)站節(jié)點(diǎn)中包括至少一種網(wǎng)頁(yè)節(jié)點(diǎn),至少部分所述網(wǎng)頁(yè)節(jié)點(diǎn)中設(shè)有兩個(gè)以上的匹配設(shè)置描述節(jié)點(diǎn),每個(gè)匹配設(shè)置描述節(jié)點(diǎn)對(duì)應(yīng)一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,至少兩個(gè)所述網(wǎng)頁(yè)文本內(nèi)容的匹配設(shè)置中分別包括對(duì)相同類型文本內(nèi)容的不同匹配設(shè)置項(xiàng)??蛇x的,所述在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí)包括:接收到瀏覽器NavigateComplete事件時(shí)??蛇x的,所述建立一匹配設(shè)置文件并將所述至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在所述匹配設(shè)置文件中包括:為每種類型的網(wǎng)站建立一個(gè)網(wǎng)站節(jié)點(diǎn);在一個(gè)網(wǎng)站節(jié)點(diǎn)下,為該網(wǎng)站節(jié)點(diǎn)相應(yīng)的網(wǎng)站下每種類型的網(wǎng)頁(yè)建立一個(gè)網(wǎng)頁(yè)節(jié)占.
根據(jù)網(wǎng)頁(yè)的內(nèi)容建立每個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng),其中在網(wǎng)頁(yè)節(jié)點(diǎn)的第一匹配設(shè)置描述節(jié)點(diǎn)中,為該網(wǎng)頁(yè)節(jié)點(diǎn)相應(yīng)的網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立至少一條匹配設(shè)置項(xiàng);以及
對(duì)于網(wǎng)頁(yè)中相同類型的文本內(nèi)容,在所述第一匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)和在該網(wǎng)頁(yè)節(jié)點(diǎn)中除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)各不相同。可選的,所述在網(wǎng)頁(yè)節(jié)點(diǎn)的第一匹配設(shè)置描述節(jié)點(diǎn)中,為該網(wǎng)頁(yè)節(jié)點(diǎn)相應(yīng)的網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立至少一條匹配設(shè)置項(xiàng)包括:在第一匹配設(shè)置描述節(jié)點(diǎn)中為網(wǎng)頁(yè)中每種類型的文本內(nèi)容在網(wǎng)頁(yè)內(nèi)容中的超文本標(biāo)記語(yǔ)言HTML元素建立至少一條匹配設(shè)置項(xiàng);所述為HTML元素建立的匹配設(shè)置項(xiàng)包括一次定位匹配設(shè)置項(xiàng),所述一次定位匹配設(shè)置項(xiàng)至少包括:基點(diǎn)查找設(shè)置項(xiàng):指示基點(diǎn)查找的方式,所述方式包括查找標(biāo)識(shí)、查找名稱、查找類名、查找內(nèi)容、查找表達(dá)式;和/或,標(biāo)識(shí)定位設(shè)置項(xiàng):定位與HTML元素的標(biāo)識(shí)相匹配的元素;和/或,名稱定位設(shè)置項(xiàng):定位與HTML元素的名稱相匹配的元素;和/或,類名定位設(shè)置項(xiàng):定位與HTML元素的類名稱相匹配的元素;和/或,內(nèi)容定位設(shè)置項(xiàng):定位與HTML元素的內(nèi)容相匹配的元素;和/或,表達(dá)式定位設(shè)置項(xiàng):定位與HTML元素中的表達(dá)式相匹配的元素;和/ 或,標(biāo)簽設(shè)置項(xiàng):指示利用所述標(biāo)識(shí)定位設(shè)置項(xiàng)、名稱定位設(shè)置項(xiàng)、類名定位設(shè)置項(xiàng)、內(nèi)容定位設(shè)置項(xiàng)或表達(dá)式定位設(shè)置項(xiàng)對(duì)元素定位時(shí),所定位元素的類型和/或?qū)傩???蛇x的,所述為HTML元素建立的匹配設(shè)置項(xiàng)還包括:元素刪除匹配設(shè)置項(xiàng),所述元素刪除匹配設(shè)置項(xiàng)至少包括:刪除由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容;和/或改變由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容。根據(jù)本發(fā)明的另一個(gè)方面,公開了一種對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置,該裝置包括:設(shè)置模塊,適于在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置;下載模塊,適于在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載;匹配模塊,適于將所述網(wǎng)頁(yè)內(nèi)容分別與所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功;提取模塊,適于利用與所述網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè);保存模塊,適于將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存??蛇x的,所述保存模塊,具體適于在瀏覽器側(cè)接收到在當(dāng)前頁(yè)面中用戶輸入的保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令后,提取當(dāng)前網(wǎng)址,將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。可選的,所述配置文件為單獨(dú)保存所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的配置文件;或者
所述配置文件為存儲(chǔ)所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的文件的一部分??蛇x的,所述保存模塊,還適于提取當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到所述本地配置文件中??蛇x的,所述匹配模塊,還適于當(dāng)所述下載模塊在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷所述下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,指示所述提取模塊利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。可選的,所述匹配模塊,還適于當(dāng)所述下載模塊在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),匹配下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,指示所述提取模塊利用匹配出的所述下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)??蛇x的,所述裝置還包括提示模塊和指令接收模塊,所述提示模塊,適于在自動(dòng)進(jìn)入閱讀模式后,提示是否使所述下載網(wǎng)頁(yè)所在書籍自動(dòng)進(jìn)入閱讀模式,所述指令接收模塊,適于在接收到確定的指令后,從網(wǎng)站獲得該書籍的各個(gè)網(wǎng)頁(yè)的網(wǎng)址,指示所述保存模塊將獲得的網(wǎng)址對(duì)應(yīng)于所述下載網(wǎng)頁(yè)的網(wǎng)址匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到配置文件中??蛇x的,所述設(shè)置模塊,具體適于建立一匹配設(shè)置文件并將所述至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在所述匹配設(shè)置文件中;其中,所述匹配設(shè)置文件中包括至少一個(gè)網(wǎng)站節(jié)點(diǎn),每個(gè)網(wǎng)站節(jié)點(diǎn)中包括至少一種網(wǎng)頁(yè)節(jié)點(diǎn),至少部分所述網(wǎng)頁(yè)節(jié)點(diǎn)中設(shè)有兩個(gè)以上的匹配設(shè)置描述節(jié)點(diǎn),每個(gè)匹配設(shè)置描述節(jié)點(diǎn)對(duì)應(yīng)一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,至少兩個(gè)所述網(wǎng)頁(yè)文本內(nèi)容的匹配設(shè)置中分別包括對(duì)相同類型文本內(nèi)容的不同匹配設(shè)置項(xiàng)??蛇x的,所述下載模塊,具體適于接收到瀏覽器NavigateComplete事件??蛇x的,所述設(shè)置模塊,具體適于為每種類型的網(wǎng)站建立一個(gè)網(wǎng)站節(jié)點(diǎn);在一個(gè)網(wǎng)站節(jié)點(diǎn)下,為該網(wǎng)站節(jié)點(diǎn)相應(yīng)的網(wǎng)站下每種類型的網(wǎng)頁(yè)建立一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn);根據(jù)網(wǎng)頁(yè)的內(nèi)容建立每個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng),其中在網(wǎng)頁(yè)節(jié)點(diǎn)的第一匹配設(shè)置描述節(jié)點(diǎn)中,為該網(wǎng)頁(yè)節(jié)點(diǎn)相應(yīng)的網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立至少一條匹配設(shè)置項(xiàng);以及,對(duì)于網(wǎng)頁(yè)中相同類型的文本內(nèi)容,在所述第一匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)和在該網(wǎng)頁(yè)節(jié)點(diǎn)中除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)各不相同??蛇x的,所述設(shè)置模塊,具體適于在第一匹配設(shè)置描述節(jié)點(diǎn)中為網(wǎng)頁(yè)中每種類型的文本內(nèi)容在網(wǎng)頁(yè)內(nèi)容中的超文本標(biāo)記語(yǔ)言HTML元素建立至少一條匹配設(shè)置項(xiàng);所述為HTML元素建立的匹配設(shè)置項(xiàng)包括一次定位匹配設(shè)置項(xiàng),所述一次定位匹配設(shè)置項(xiàng)至少包括:基點(diǎn)查找設(shè)置項(xiàng):指示基點(diǎn)查找的方式,所述方式包括查找標(biāo)識(shí)、查找名稱、查找類名、查找內(nèi)容、查找表達(dá)式;和/或,
標(biāo)識(shí)定位設(shè)置項(xiàng):定位與HTML元素的標(biāo)識(shí)相匹配的元素;和/或,名稱定位設(shè)置項(xiàng):定位與HTML元素的名稱相匹配的元素;和/或,類名定位設(shè)置項(xiàng):定位與HTML元素的類名稱相匹配的元素;和/或,內(nèi)容定位設(shè)置項(xiàng):定位與HTML元素的內(nèi)容相匹配的元素;和/或,表達(dá)式定位設(shè)置項(xiàng):定位與HTML元素中的表達(dá)式相匹配的元素;和/ 或,標(biāo)簽設(shè)置項(xiàng):指示利用所述標(biāo)識(shí)定位設(shè)置項(xiàng)、名稱定位設(shè)置項(xiàng)、類名定位設(shè)置項(xiàng)、內(nèi)容定位設(shè)置項(xiàng)或表達(dá)式定位設(shè)置項(xiàng)對(duì)元素定位時(shí),所定位元素的類型和/或?qū)傩???蛇x的,所述設(shè)置模塊為HTML元素建立的匹配設(shè)置項(xiàng)還包括:元素刪除匹配設(shè)置項(xiàng),所述元素刪除匹配設(shè)置項(xiàng)至少包括:刪除由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容;和/或改變由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容。根據(jù)本發(fā)明的技術(shù)方案,在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置;在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載;將下載的網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至網(wǎng)頁(yè)內(nèi)容匹配成功;利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè);將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。通過將下載的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,并將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存,能夠在下次訪問該網(wǎng)址時(shí),提供該網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,進(jìn)而在下次訪問該網(wǎng)址時(shí),無(wú)需再將該網(wǎng)址的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,可以直接使用保存的該網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行提取??梢姡景l(fā)明解決了需要將網(wǎng)頁(yè)文本內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行全部比對(duì),耗費(fèi)大量時(shí)間和資源,導(dǎo)致網(wǎng)頁(yè)提取效率低下,以及網(wǎng)頁(yè)顯示的等待時(shí)延過長(zhǎng)的問題;取得了在網(wǎng)頁(yè)內(nèi)容提取時(shí)節(jié)約處理時(shí)間和資源,提聞網(wǎng)頁(yè)提取效率,加快網(wǎng)頁(yè)顯不的有益效果。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式
。


通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置的結(jié)構(gòu)圖;圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置的結(jié)構(gòu)圖;圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法的流程圖;圖4示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法的流程圖;以及圖5示出了根據(jù)本發(fā)明又一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法的流程圖。
具體實(shí)施例方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。參見圖1,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置的結(jié)構(gòu)圖。該裝置包括:設(shè)置模塊100、下載模塊200、匹配模塊300、提取模塊400和保存模塊500。設(shè)置模塊100,適于在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。具體的,設(shè)置模塊100適于建立一匹配設(shè)置文件并將至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在匹配設(shè)置文件中;其中,該匹配設(shè)置文件中包括至少一個(gè)網(wǎng)站節(jié)點(diǎn),每個(gè)網(wǎng)站節(jié)點(diǎn)中包括至少一種網(wǎng)頁(yè)節(jié)點(diǎn),至少部分網(wǎng)頁(yè)節(jié)點(diǎn)中設(shè)有兩個(gè)以上的匹配設(shè)置描述節(jié)點(diǎn),每個(gè)匹配設(shè)置描述節(jié)點(diǎn)對(duì)應(yīng)一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。匹配設(shè)置描述節(jié)點(diǎn)中可以包括一個(gè)或多個(gè)匹配設(shè)置項(xiàng),至少兩個(gè)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置中分別包括對(duì)相同類型文本內(nèi)容的不同匹配設(shè)置項(xiàng)。設(shè)置模塊100為每種類型的網(wǎng)站建立一個(gè)網(wǎng)站節(jié)點(diǎn),即一個(gè)網(wǎng)站節(jié)點(diǎn)對(duì)應(yīng)一種類型的網(wǎng)站;在一個(gè)網(wǎng)站節(jié)點(diǎn)下,為該網(wǎng)站節(jié)點(diǎn)相應(yīng)的網(wǎng)站下每種類型的網(wǎng)頁(yè)建立一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn),即一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)對(duì)應(yīng)一種類型的網(wǎng)頁(yè)。設(shè)置模塊100根據(jù)網(wǎng)頁(yè)的內(nèi)容建立每個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng)。不同的網(wǎng)頁(yè),其中包含的內(nèi)容不同,則相應(yīng)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng)也不同。在一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)下包括多個(gè)匹配設(shè)置描述節(jié)點(diǎn),由于通常網(wǎng)頁(yè)中會(huì)存在一些不會(huì)經(jīng)常變化的固定信息和一些易于發(fā)生變化的可變信息,設(shè)置模塊100在網(wǎng)頁(yè)節(jié)點(diǎn)下的匹配設(shè)置描述節(jié)點(diǎn)中確定一個(gè)匹配設(shè)置描述節(jié)點(diǎn)作為第一匹配設(shè)置描述節(jié)點(diǎn),該第一匹配設(shè)置描述節(jié)點(diǎn)中包括的匹配設(shè)置項(xiàng)最全面,包括了為網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立的至少一條匹配設(shè)置項(xiàng)。而在除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中,可以僅針對(duì)網(wǎng)頁(yè)中的可變信息建立匹配設(shè)置項(xiàng),并且在該網(wǎng)頁(yè)節(jié)點(diǎn)中除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)各不相同。這種處理方式,一方面簡(jiǎn)化了網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的結(jié)構(gòu),避免不同匹配設(shè)置中有重復(fù)的部分,減少了所需存儲(chǔ)的匹配設(shè)置的數(shù)據(jù)量,從而提高了資源利用率;另一方面也避免了對(duì)相同的網(wǎng)頁(yè)內(nèi)容進(jìn)行重復(fù)匹配操作,提高了匹配效率。下面結(jié)合一段代碼的示例對(duì)匹配設(shè)置文件進(jìn)行具體說明。< xml version="!.0n encoding=HGB2312u >
-<websites>/產(chǎn)指示一個(gè)匹配設(shè)置文件
-<website domain=nwww.feiku.coml!> //*指示對(duì)應(yīng)的網(wǎng)站節(jié)點(diǎn) -ebook down1admode=nlH elementfilter="15"> /產(chǎn)指示網(wǎng)頁(yè)節(jié)點(diǎn) book -<profi!e>//*指示匹配設(shè)置描述節(jié)點(diǎn)
<url match=ΜΛhttp://www.feiku.com/Book/ !l@index.htmr' trans="11 tabtitle=”*'.bookid^ http://www.feiku.com/Book/*/M booksep="!! />
〈title el=!I4fI id="" name=f"! Classna me="page_body_left paneLborder11 value=""regular="" tag="div,! childrensel8ct="ciiv:0IdIv^l|div:0|span^0H />
<cataioguri el = n4" id = lifI narne=nii classname="info_item_paneI IineJterrT value=冊(cè) regular="11 tag = ndiv" chiidrenselect="a-href:On />
clastchapter el=!!l" id=MreadVM name=M!! dassname=!m vaiue=nH regjiar=.".tag=Tmbenchm3rkselect=Mdiv:0|h3:0|a:0jfont:0" />
<lastchapterur! el=Mln id=!ireadVn name=1"1 dassname=HT! value="11 regular=1"1 order="2" tag=iin benchmarkselect=nclivi0Ih3:0|a:0|font:0n parentselect-^a-hrefiO'1 /> </profile>
-<profi!e>//*指示E配設(shè)置描述節(jié)點(diǎn)
clastchapter ei = ”!." ifreadP..name=”” classname=…,value="11 regular=■…Iau =benchInarkseIect=nCliviOIh3:01a:0" />
<lastchapterurl el = Nl" id = !,readP" name="" classname=,,M value=",1 regular= tag=mi order=”r! benchmarkselect="div:0|h3:0Ia:0!! benchtag = "a-hrefn />
</profile>
</book>
-<catalog downloadmode=,fl,f elementfilter="15n> //*指網(wǎng)頁(yè)節(jié)點(diǎn) catalog<url match=MAhttp://www_feiku.com/html/book/| j@List.shtm ' trans=."1tabtitle=”*." bookid =丨 http://www.feiku_com/html/book/*/List_shtm !
booksep = "/:!" />
<chapteriist el = ,l4u id = ",T name=”" ciassname=”iist" value="" regular=,,n tag=^div" ChiIdrenseIeCt=llCliv:1" />
<title ei=H4!' id="n name=,", classname=Hsitenav" value=”11 regular=1"1 tag二Hdiv” c;hildrenselect=_,a:3” /> <returnbook el = "4" id="" name="n ClaSSname=llSitenavt' value=,,..regular= tag=Ma-hrefn chiIdrenselect="a-href;3M />
</catalog>

-〈chapter downioadmode=11!" eIementfilter=H15"> //*指小M : : chapter-<profile>//*指示匹配設(shè)置描述節(jié)點(diǎn)
<url
match = n/vhttp://www.feiku.com//html/book/1 j !index.html j | !index.htmi| | !List.shtm” trans="'1 tabtitle="*n bookid="http://www_feiku_com//html/book/*_shtm"
booksep=/>
〈title el = !,ln id = lChapterContent" name="" classname=關(guān) value="11 regular=11"tag= 'div" childrenselect^^div^" />
<text el = "l" id=nchcontentn name=N” dassname=腳 value=1"' regular="" tag = MdivHchiidrenselect=胃 />
<next el = N8" id="" name=,Mi dassname=li,T value="下一頁(yè)一"regular="" tag=”a-href_.chiidrenselect="u />
<prev el="8H id=”" name="” classname="" value=..—上一頁(yè) regular=.." tag=na-href"chiidrenselect="" />
<returncataiog el = !!8” id=N" name='." c!assname=!!" value="返回目錄頁(yè)M regular=""tag=”a-hrefH childrenselect='." />
<returnbook e! = n8" id=”" name=!m classname="..value="返回書頁(yè)11 regular=."1tag="a-hrefn childrenselect='"1 />
</profile>
-<profiie>
curl match = ΠΛhttp://www.feikuxom/html/book/11 !index.html} \ !List.shtm,ftrans-n,! tabtitle='1*" bookid = !!http://www.feikiKCom/litml/book/*.shtm!'booksep=M/:l"/>
</profile>
</chapter>
</website> </websites>下面結(jié)合上述代碼中的各節(jié)點(diǎn)對(duì)匹配設(shè)置文件具體說明如下:1.〈websites〉總網(wǎng)站節(jié)點(diǎn):該節(jié)點(diǎn)是最大的父節(jié)點(diǎn),該節(jié)點(diǎn)對(duì)應(yīng)于一個(gè)匹配設(shè)置文件,該節(jié)點(diǎn)由數(shù)個(gè)網(wǎng)站(website)節(jié)點(diǎn)構(gòu)成。2.〈website〉節(jié)點(diǎn):每個(gè)網(wǎng)站節(jié)點(diǎn)代表一種支持的網(wǎng)站,一個(gè)網(wǎng)站節(jié)點(diǎn)中設(shè)置一個(gè)或多個(gè)網(wǎng)頁(yè)節(jié)點(diǎn),如在網(wǎng)站節(jié)點(diǎn)www.feiku.com下設(shè)置有書籍(book)網(wǎng)頁(yè)節(jié)點(diǎn)、目錄(catalog)網(wǎng)頁(yè)節(jié)點(diǎn)和章節(jié)(chapter)網(wǎng)頁(yè)節(jié)點(diǎn)。在網(wǎng)頁(yè)節(jié)點(diǎn)中還設(shè)置有下載模式(downloadmode)屬性和兀素過濾(elementfilter)屬性。3.〈book〉網(wǎng)頁(yè)節(jié)點(diǎn):描述小說主頁(yè)信息,該網(wǎng)頁(yè)節(jié)點(diǎn)下設(shè)置兩個(gè)匹配設(shè)置描述節(jié)點(diǎn)〈profile〉。在作為第一匹配設(shè)置描述節(jié)點(diǎn)的〈profile〉中配置多個(gè)匹配設(shè)置項(xiàng),如URL(Uniform/Universal Resource Locator,統(tǒng)一資源定位符)匹配設(shè)置項(xiàng)描述相關(guān)URL匹配和獲取bookid (網(wǎng)頁(yè)標(biāo)識(shí))信息;title (標(biāo)題)匹配設(shè)置項(xiàng),描述如何取得小說首頁(yè)title的信息;catalogurl (目錄URL)匹配設(shè)置項(xiàng)描述該小說的目錄URL ;Iasterchapter (最新章節(jié))匹配設(shè)置項(xiàng)描述最新章節(jié)的描述;Iasterchapterurl (最新章節(jié)URL)匹配設(shè)置項(xiàng)描述最新章節(jié)的URL。4.〈catalog〉網(wǎng)頁(yè)節(jié)點(diǎn):描述小說目錄頁(yè)信息,該網(wǎng)頁(yè)節(jié)點(diǎn)下僅設(shè)置一個(gè)匹配設(shè)置描述節(jié)點(diǎn),在匹配設(shè)置描述節(jié)點(diǎn)下包括:URL匹配設(shè)置項(xiàng)描述相關(guān)URL匹配和獲取bookid信息;chapterlist匹配設(shè)置項(xiàng),描述目錄頁(yè)的相關(guān)內(nèi)容;returnbook描述小說首頁(yè)的URL地址。5.〈chapter〉網(wǎng)頁(yè)節(jié)點(diǎn):描述小說章節(jié)頁(yè)信息,該網(wǎng)頁(yè)節(jié)點(diǎn)下設(shè)置兩個(gè)〈profile〉。在作為第一匹配設(shè)置描述節(jié)點(diǎn)的〈profile〉中配置有:URL匹配設(shè)置項(xiàng),描述相關(guān)URL匹配和獲取bookid信息;title匹配設(shè)置項(xiàng),描述如何取得小說首頁(yè)title的信息;text (文本)匹配設(shè)置項(xiàng),描述小說的正文內(nèi)容;next匹配設(shè)置項(xiàng),描述下一章節(jié)小說頁(yè)URL ;prev匹配設(shè)置項(xiàng),描述小說上一章節(jié)URL ;returncatalog (返回目錄)匹配設(shè)置項(xiàng),描述章節(jié)頁(yè)保存的小說目錄頁(yè)URL ;returnbook (返回書籍)匹配設(shè)置項(xiàng),描述小說章節(jié)頁(yè)保存的小說首頁(yè)。6.<profile>匹配設(shè)置描述節(jié)點(diǎn):當(dāng)一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)下設(shè)置多個(gè)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置時(shí),會(huì)配置匹配設(shè)置描述節(jié)點(diǎn)〈profile〉,每個(gè)〈profile〉對(duì)應(yīng)一個(gè)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置?!磒rofile〉位于具體的網(wǎng)頁(yè)節(jié)點(diǎn)之下,例如,位于上述book網(wǎng)頁(yè)節(jié)點(diǎn)和chapter網(wǎng)頁(yè)節(jié)點(diǎn)下面,將匹配設(shè)置項(xiàng)設(shè)置在〈profile〉中。此外,設(shè)置模塊100在第一匹配設(shè)置描述節(jié)點(diǎn)中為網(wǎng)頁(yè)中每種類型的文本內(nèi)容在網(wǎng)頁(yè)內(nèi)容中的超文本標(biāo)記語(yǔ)言HTML元素建立至少一條匹配設(shè)置項(xiàng)。所述為HTML元素建立的匹配設(shè)置項(xiàng)包括一次定位匹配設(shè)置項(xiàng),所述一次定位匹配設(shè)置項(xiàng)至少包括:基點(diǎn)查找設(shè)置項(xiàng):指示基點(diǎn)查找的方式,所述方式包括查找標(biāo)識(shí)、查找名稱、查找類名、查找內(nèi)容、查找表達(dá)式;和/或,標(biāo)識(shí)定位設(shè)置項(xiàng):定位與HTML元素的標(biāo)識(shí)相匹配的元素;和/或,名稱定位設(shè)置項(xiàng):定位與HTML元素的名稱相匹配的元素;和/或,類名定位設(shè)置項(xiàng):定位與HTML元素的類名稱相匹配的元素;和/或,內(nèi)容定位設(shè)置項(xiàng):定位與HTML元素的內(nèi)容相匹配的元素;和/或,表達(dá)式定位設(shè)置項(xiàng):定位與HTML元素中的表達(dá)式相匹配的元素;和/ 或,標(biāo)簽設(shè)置項(xiàng):指示利用所述標(biāo)識(shí)定位設(shè)置項(xiàng)、名稱定位設(shè)置項(xiàng)、類名定位設(shè)置項(xiàng)、內(nèi)容定位設(shè)置項(xiàng)或表達(dá)式定位設(shè)置項(xiàng)對(duì)元素定位時(shí),所定位元素的類型和/或?qū)傩?。設(shè)置模塊100為HTML元素建立的匹配設(shè)置項(xiàng)還包括:元素刪除匹配設(shè)置項(xiàng),所述元素刪除匹配設(shè)置項(xiàng)至少包括:刪除由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容;和/或改變由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容。
下載模塊200,適于在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載。匹配模塊300,適于將下載的網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功。舉例而言,下載模塊200下載完網(wǎng)頁(yè)內(nèi)容后,接收到DocumentComplete (文檔完成)事件,指示匹配模塊300將下載的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功。提取模塊400,適于利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè)。保存模塊500,適于將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。具體的,保存模塊500在瀏覽器側(cè)接收到在當(dāng)前頁(yè)面中用戶輸入的保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令后,提取當(dāng)前網(wǎng)址,將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。其中,該配置文件可以為單獨(dú)保存當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的配置文件;也可以為存儲(chǔ)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的文件的一部分。舉例而言,在瀏覽器側(cè)顯示的網(wǎng)頁(yè)文本內(nèi)容中添加按鈕,該按鈕被點(diǎn)擊后,接收到保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令,提取當(dāng)前網(wǎng)址,將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。進(jìn)一步地,匹配模塊300,還適于當(dāng)下載模塊200在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,指示提取模塊400利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。舉例而言,上述配置文件保存到內(nèi)存的向量vector中。用戶瀏覽網(wǎng)站時(shí),下載模塊200進(jìn)行下載,接收到瀏覽器NavigateComplete (導(dǎo)航完成)事件,指示匹配模塊300進(jìn)行匹配。匹配模塊300利用NavigateComplete事件,獲取下載網(wǎng)頁(yè)的網(wǎng)址URL,提取出該URL,遍歷內(nèi)存vector,查看該URL是否與vector的配置文件中網(wǎng)址匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,指示提取模塊400利用與該URL匹配的網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。在本實(shí)施例中,通過將下載的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,并將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存,能夠在下次訪問該網(wǎng)址時(shí),提供該網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,進(jìn)而在下次訪問該網(wǎng)址時(shí),無(wú)需再將該網(wǎng)址的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,可以直接使用保存的該網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行提取。可見,本實(shí)施例解決了需要將網(wǎng)頁(yè)文本內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行全部比對(duì),耗費(fèi)大量時(shí)間和資源,導(dǎo)致網(wǎng)頁(yè)提取效率低下,以及網(wǎng)頁(yè)顯示的等待時(shí)延過長(zhǎng)的問題;取得了在網(wǎng)頁(yè)內(nèi)容提取時(shí)節(jié)約處理時(shí)間和資源,提高網(wǎng)頁(yè)提取效率,加快網(wǎng)頁(yè)顯示的有益效果。根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置,該裝置包括:設(shè)置模塊100、下載模塊200、匹配模塊300、提取模塊400和保存模塊500。設(shè)置模塊100,適于在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。
下載模塊200,適于在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載。匹配模塊300,適于將網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至網(wǎng)頁(yè)內(nèi)容匹配成功。提取模塊400,適于利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè)。保存模塊500,適于提取當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到本地配置文件中。匹配模塊300,還適于當(dāng)下載模塊200在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),匹配下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,指示提取模塊400利用匹配出的下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取該下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。舉例而言,當(dāng)前網(wǎng)址為http://www.qidian.com/BookReader/2466955, 42049743.aspx,匹配出當(dāng)前網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置后,保存模塊500提取出該網(wǎng)址的上一級(jí)網(wǎng)址 http://www.qidian.com 或同一級(jí)網(wǎng)址 http://www.qidian.com/BookReader,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到本地配置文件中。匹配模塊300當(dāng)下載模塊200在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),將下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址與配置文件中上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址進(jìn)行匹配比較,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,指示提取模塊400利用匹配到的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取該下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。例如,當(dāng)訪問網(wǎng)址http://www.qidian.com/BookReader/42049743.aspx 時(shí),在配置文件中,匹配到網(wǎng)址 http://www.qidian.com/BookReader 或網(wǎng)址 http://www.qidian.com,得到匹配到的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,指示提取模塊400利用該網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置提取該下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。由上可見,在本實(shí)施例中,可以將配置文件中的當(dāng)前網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置擴(kuò)展應(yīng)用到當(dāng)前網(wǎng)址所在網(wǎng)站的同一級(jí)或上一級(jí)目錄下的各個(gè)網(wǎng)頁(yè),在訪問當(dāng)前網(wǎng)址所在網(wǎng)站的同一級(jí)或上一級(jí)目錄下網(wǎng)頁(yè)時(shí),能夠避免進(jìn)行耗費(fèi)時(shí)間和資源的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的匹配操作,從而進(jìn)一步提高了網(wǎng)頁(yè)提取效率。參見圖2,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置的結(jié)構(gòu)圖。該裝置包括:設(shè)置模塊100、下載模塊200、匹配模塊300、提取模塊400、保存模塊500、提示模塊600和指令接收模塊700。設(shè)置模塊100,適于在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。下載模塊200,適于在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載。匹配模塊300,適于將網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至網(wǎng)頁(yè)內(nèi)容匹配成功。提取模塊400,適于利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè)。保存模塊500,適于將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。匹配模塊300,還適于當(dāng)下載模塊200在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,指示提取模塊400利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。提示模塊600,適于在自動(dòng)進(jìn)入閱讀模式后,提示是否使該下載網(wǎng)頁(yè)所在書籍自動(dòng)進(jìn)入閱讀模式。指令接收模塊700,適于在接收到確定的指令后,從網(wǎng)站獲得該書籍的各個(gè)網(wǎng)頁(yè)的網(wǎng)址,指示所述保存模塊500將獲得的網(wǎng)址對(duì)應(yīng)于下載網(wǎng)頁(yè)的網(wǎng)址匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到配置文件中。由上可見,在本實(shí)施例中,可以將配置文件中下載網(wǎng)頁(yè)所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置擴(kuò)展應(yīng)用到當(dāng)前網(wǎng)頁(yè)所在書籍下的各個(gè)網(wǎng)頁(yè),在訪問該書籍下的各個(gè)網(wǎng)頁(yè)時(shí),能夠避免進(jìn)行耗費(fèi)時(shí)間和資源的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的匹配操作,從而進(jìn)一步提聞了網(wǎng)頁(yè)提取效率。參見圖3,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法的流程圖。該流程圖包括如下步驟。步驟S310,在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。具體的,在步驟S310中,建立一匹配設(shè)置文件并將至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在匹配設(shè)置文件中;其中,該匹配設(shè)置文件中包括至少一個(gè)網(wǎng)站節(jié)點(diǎn),每個(gè)網(wǎng)站節(jié)點(diǎn)中包括至少一種網(wǎng)頁(yè)節(jié)點(diǎn),至少部分網(wǎng)頁(yè)節(jié)點(diǎn)中設(shè)有兩個(gè)以上的匹配設(shè)置描述節(jié)點(diǎn),每個(gè)匹配設(shè)置描述節(jié)點(diǎn)對(duì)應(yīng)一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。匹配設(shè)置描述節(jié)點(diǎn)中可以包括一個(gè)或多個(gè)匹配設(shè)置項(xiàng),至少兩個(gè)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置中分別包括對(duì)相同類型文本內(nèi)容的不同匹配設(shè)置項(xiàng)。其中,為每種類型的網(wǎng)站建立一個(gè)網(wǎng)站節(jié)點(diǎn),即一個(gè)網(wǎng)站節(jié)點(diǎn)對(duì)應(yīng)一種類型的網(wǎng)站;在一個(gè)網(wǎng)站節(jié)點(diǎn)下,為該網(wǎng)站節(jié)點(diǎn)相應(yīng)的網(wǎng)站下每種類型的網(wǎng)頁(yè)建立一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn),即一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)對(duì)應(yīng)一種類型的網(wǎng)頁(yè)。其中,根據(jù)網(wǎng)頁(yè)的內(nèi)容建立每個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng)。不同的網(wǎng)頁(yè),其中包含的內(nèi)容不同,則相應(yīng)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng)也不同。在一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)下包括多個(gè)匹配設(shè)置描述節(jié)點(diǎn),由于通常網(wǎng)頁(yè)中會(huì)存在一些不會(huì)經(jīng)常變化的固定信息和一些易于發(fā)生變化的可變信息,在網(wǎng)頁(yè)節(jié)點(diǎn)下的匹配設(shè)置描述節(jié)點(diǎn)中確定一個(gè)匹配設(shè)置描述節(jié)點(diǎn)作為第一匹配設(shè)置描述節(jié)點(diǎn),該第一匹配設(shè)置描述節(jié)點(diǎn)中包括的匹配設(shè)置項(xiàng)最全面,包括了為網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立的至少一條匹配設(shè)置項(xiàng)。而在除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中,可以僅針對(duì)網(wǎng)頁(yè)中的可變信息建立匹配設(shè)置項(xiàng),并且在該網(wǎng)頁(yè)節(jié)點(diǎn)中除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)各不相同。這種處理方式,一方面簡(jiǎn)化了網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的結(jié)構(gòu),避免不同匹配設(shè)置中有重復(fù)的部分,減少了所需存儲(chǔ)的匹配設(shè)置的數(shù)據(jù)量,從而提高了資源利用率;另一方面也避免了對(duì)相同的網(wǎng)頁(yè)內(nèi)容進(jìn)行重復(fù)匹配操作,提高了匹配效率。此外,在第一匹配設(shè)置描述節(jié)點(diǎn)中為網(wǎng)頁(yè)中每種類型的文本內(nèi)容在網(wǎng)頁(yè)內(nèi)容中的超文本標(biāo)記語(yǔ)言HTML元素建立至少一條匹配設(shè)置項(xiàng)。所述為HTML元素建立的匹配設(shè)置項(xiàng)包括一次定位匹配設(shè)置項(xiàng),所述一次定位匹配設(shè)置項(xiàng)至少包括:基點(diǎn)查找設(shè)置項(xiàng):指示基點(diǎn)查找的方式,所述方式包括查找標(biāo)識(shí)、查找名稱、查找類名、查找內(nèi)容、查找表達(dá)式;和/或,標(biāo)識(shí)定位設(shè)置項(xiàng):定位與HTML元素的標(biāo)識(shí)相匹配的元素;和/或,名稱定位設(shè)置項(xiàng):定位與HTML元素的名稱相匹配的元素;和/或,類名定位設(shè)置項(xiàng):定位與HTML元素的類名稱相匹配的元素;和/或,內(nèi)容定位設(shè)置項(xiàng):定位與HTML元素的內(nèi)容相匹配的元素;和/或,表達(dá)式定位設(shè)置項(xiàng):定位與HTML元素中的表達(dá)式相匹配的元素;和/ 或,標(biāo)簽設(shè)置項(xiàng):指示利用所述標(biāo)識(shí)定位設(shè)置項(xiàng)、名稱定位設(shè)置項(xiàng)、類名定位設(shè)置項(xiàng)、內(nèi)容定位設(shè)置項(xiàng)或表達(dá)式定位設(shè)置項(xiàng)對(duì)元素定位時(shí),所定位元素的類型和/或?qū)傩?。所述為HTML元素建立的匹配設(shè)置項(xiàng)還包括:元素刪除匹配設(shè)置項(xiàng),所述元素刪除匹配設(shè)置項(xiàng)至少包括:刪除由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容;和/或改變由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容。步驟S320,在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載。步驟S330,將下載的網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功。舉例而言,在下載完網(wǎng)頁(yè)內(nèi)容后,接收到DocumentComplete事件,將下載的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功。步驟S340,利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè)。步驟S350,將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。具體的,在步驟S350中,在瀏覽器側(cè)接收到在當(dāng)前頁(yè)面中用戶輸入的保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令后,提取當(dāng)前網(wǎng)址,將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。其中,該配置文件可以為單獨(dú)保存所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的配置文件;也可以為存儲(chǔ)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的文件的一部分。舉例而言,在瀏覽器側(cè)顯示的網(wǎng)頁(yè)文本內(nèi)容中添加按鈕,該按鈕被點(diǎn)擊后,接收到保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令,提取當(dāng)前網(wǎng)址,將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。進(jìn)一步地,所述步驟S350后還包括:在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷所述下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。舉例而言,上述配置文件保存到內(nèi)存的向量vector中。用戶瀏覽網(wǎng)站時(shí),在下載完成后,接收到瀏覽器NavigateComplete事件,利用NavigateComplete事件,獲取下載網(wǎng)頁(yè)的網(wǎng)址URL,提取出該URL,遍歷內(nèi)存vector,查看該URL是否與vector的配置文件中網(wǎng)址匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,利用與該URL匹配的網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。在本實(shí)施例中,通過將下載的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,并將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存,能夠在下次訪問該網(wǎng)址時(shí),提供該網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,進(jìn)而在下次訪問該網(wǎng)址時(shí),無(wú)需再將該網(wǎng)址的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,可以直接使用保存的該網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行提取??梢?,本實(shí)施例解決了需要將網(wǎng)頁(yè)文本內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行全部比對(duì),耗費(fèi)大量時(shí)間和資源,導(dǎo)致網(wǎng)頁(yè)提取效率低下,以及網(wǎng)頁(yè)顯示的等待時(shí)延過長(zhǎng)的問題;取得了在網(wǎng)頁(yè)內(nèi)容提取時(shí)節(jié)約處理時(shí)間和資源,提高網(wǎng)頁(yè)提取效率,加快網(wǎng)頁(yè)顯示的有益效果。參見圖4,示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法的流程圖。該流程圖包括如下步驟。步驟S410,在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。步驟S420,在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載。步驟S430,將網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至網(wǎng)頁(yè)內(nèi)容匹配成功。步驟S440,利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè)。步驟S450,提取當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到本地配置文件中。步驟S460,接收到網(wǎng)頁(yè)下載指示,在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載。步驟S470,匹配下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,執(zhí)行步驟S480,否則,執(zhí)行步驟S430。步驟S480,利用匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取該下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。舉例而言,在步驟S450中,匹配得到當(dāng)前網(wǎng)址http://www.qidian.com/BookReader/2466955, 42049743.aspx對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置后,提取出該網(wǎng)址的上一級(jí)網(wǎng)址 http://www.qidian.com 或同一級(jí)網(wǎng)址 http://www.qidian.com/BookReader,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到本地配置文件中。在步驟S470中,將下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址與配置文件中上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址進(jìn)行匹配比較,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,執(zhí)行步驟S480。在步驟S480中,利用匹配到的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取該下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。例如,當(dāng)訪問網(wǎng)址http://www.qidian.com/BookReader/42049743.aspx 時(shí),在配置文件中,匹配到網(wǎng)址 http://www.qidian.com/BookReader 或網(wǎng)址 http://www.qidian.com,得到匹配到的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,利用該網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置提取該下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。由上可見,在本實(shí)施例中,可以將配置文件中的當(dāng)前網(wǎng)頁(yè)所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置擴(kuò)展應(yīng)用到當(dāng)前網(wǎng)址所在網(wǎng)站的同一級(jí)或上一級(jí)目錄下的各個(gè)網(wǎng)頁(yè),在訪問當(dāng)前網(wǎng)址所在網(wǎng)站的同一級(jí)或上一級(jí)目錄下網(wǎng)頁(yè)時(shí),能夠避免進(jìn)行耗費(fèi)時(shí)間和資源的網(wǎng)頁(yè)內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的匹配操作,從而進(jìn)一步提高了網(wǎng)頁(yè)提取效率。參見圖5,示出了根據(jù)本發(fā)明又一個(gè)實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法的流程圖。該流程圖包括如下步驟。步驟S5010,在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置。步驟S5020,在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載。步驟S5030,將網(wǎng)頁(yè)內(nèi)容分別與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至網(wǎng)頁(yè)內(nèi)容匹配成功。步驟S5040,利用與網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè)。步驟S5050,將當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。步驟S5060,接收到網(wǎng)頁(yè)下載指示,在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載。步驟S5070,判斷下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則執(zhí)行步驟S5080,否則,執(zhí)行步驟S5030。步驟S5080,自動(dòng)進(jìn)入閱讀模式,利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。步驟S5090,在自動(dòng)進(jìn)入閱讀模式后,提示是否使該下載網(wǎng)頁(yè)所在書籍自動(dòng)進(jìn)入閱讀模式。步驟S5100,在接收到確定的指令后,從網(wǎng)站獲得該書籍的各個(gè)網(wǎng)頁(yè)的網(wǎng)址,將獲得的網(wǎng)址對(duì)應(yīng)于下載網(wǎng)頁(yè)的網(wǎng)址匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到配置文件中。由上可見,在本實(shí)施例中,可以將配置文件中的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置擴(kuò)展應(yīng)用到當(dāng)前網(wǎng)頁(yè)所在書籍下的各個(gè)網(wǎng)頁(yè),在訪問該書籍下的各個(gè)網(wǎng)頁(yè)時(shí),能夠避免進(jìn)行耗費(fèi)時(shí)間和資源的全匹配操作,從而進(jìn)一步提高了網(wǎng)頁(yè)提取效率。在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式
的權(quán)利要求書由此明確地并入該具體實(shí)施方式
,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP )來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
權(quán)利要求
1.一種對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法,包括: 在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置; 在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載; 將所述網(wǎng)頁(yè)內(nèi)容分別與所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功; 利用與所述網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè); 將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存具體包括: 在瀏覽器側(cè)接收到在當(dāng)前頁(yè)面中用戶輸入的保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令后,提取當(dāng)前網(wǎng)址,將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述配置文件為單獨(dú)保存所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的配置文件;或者 所述配置文件為存儲(chǔ)所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的文件的一部分。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于, 所述將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中之后還包括: 提取當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到所述本地配置文件中。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于, 所述將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存之后還包括: 在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷所述下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到所述本地配置文件中之后還包括: 在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),匹配下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,利用匹配出的所述下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。
7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于, 所述自動(dòng)進(jìn)入閱讀模式后還包括: 提示是否使所述下載網(wǎng)頁(yè)所在書籍自動(dòng)進(jìn)入閱讀模式,接收到確定的指令后,從網(wǎng)站獲得該書籍的各個(gè)網(wǎng)頁(yè)的網(wǎng)址,將獲得的網(wǎng)址對(duì)應(yīng)于所述下載網(wǎng)頁(yè)的網(wǎng)址匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到配置文件中。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置包括: 建立一匹配設(shè)置文件并將所述至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在所述匹配設(shè)置文件中; 其中,所述匹配設(shè)置文件中包括至少一個(gè)網(wǎng)站節(jié)點(diǎn),每個(gè)網(wǎng)站節(jié)點(diǎn)中包括至少一種網(wǎng)頁(yè)節(jié)點(diǎn),至少部分所述網(wǎng)頁(yè)節(jié)點(diǎn)中設(shè)有兩個(gè)以上的匹配設(shè)置描述節(jié)點(diǎn),每個(gè)匹配設(shè)置描述節(jié)點(diǎn)對(duì)應(yīng)一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,至少兩個(gè)所述網(wǎng)頁(yè)文本內(nèi)容的匹配設(shè)置中分別包括對(duì)相同類型文本內(nèi)容的不同匹配設(shè)置項(xiàng)。
9.根據(jù)權(quán)利要求5或6所述的方法,其特征在于, 所述在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí)包括: 接收到瀏覽器NavigateComplete事件時(shí)。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于, 所述建立一匹配設(shè)置文件并將所述至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在所述匹配設(shè)置文件中包括: 為每種類型的網(wǎng)站建立一個(gè)網(wǎng)站節(jié)點(diǎn); 在一個(gè)網(wǎng)站節(jié)點(diǎn)下,為該網(wǎng)站節(jié)`點(diǎn)相應(yīng)的網(wǎng)站下每種類型的網(wǎng)頁(yè)建立一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn);根據(jù)網(wǎng)頁(yè)的內(nèi)容建立每個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng),其中在網(wǎng)頁(yè)節(jié)點(diǎn)的第一匹配設(shè)置描述節(jié)點(diǎn)中,為該網(wǎng)頁(yè)節(jié)點(diǎn)相應(yīng)的網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立至少一條匹配設(shè)置項(xiàng);以及 對(duì)于網(wǎng)頁(yè)中相同類型的文本內(nèi)容,在所述第一匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)和在該網(wǎng)頁(yè)節(jié)點(diǎn)中除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)各不相同。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于, 所述在網(wǎng)頁(yè)節(jié)點(diǎn)的第一匹配設(shè)置描述節(jié)點(diǎn)中,為該網(wǎng)頁(yè)節(jié)點(diǎn)相應(yīng)的網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立至少一條匹配設(shè)置項(xiàng)包括: 在第一匹配設(shè)置描述節(jié)點(diǎn)中為網(wǎng)頁(yè)中每種類型的文本內(nèi)容在網(wǎng)頁(yè)內(nèi)容中的超文本標(biāo)記語(yǔ)言HTML元素建立至少一條匹配設(shè)置項(xiàng); 所述為HTML元素建立的匹配設(shè)置項(xiàng)包括一次定位匹配設(shè)置項(xiàng),所述一次定位匹配設(shè)置項(xiàng)至少包括: 基點(diǎn)查找設(shè)置項(xiàng):指示基點(diǎn)查找的方式,所述方式包括查找標(biāo)識(shí)、查找名稱、查找類名、查找內(nèi)容、查找表達(dá)式;和/或, 標(biāo)識(shí)定位設(shè)置項(xiàng):定位與HTML元素的標(biāo)識(shí)相匹配的元素;和/或, 名稱定位設(shè)置項(xiàng):定位與HTML元素的名稱相匹配的元素;和/或, 類名定位設(shè)置項(xiàng):定位與HTML元素的類名稱相匹配的元素;和/或, 內(nèi)容定位設(shè)置項(xiàng):定位與HTML元素的內(nèi)容相匹配的元素;和/或, 表達(dá)式定位設(shè)置項(xiàng):定位與HTML元素中的表達(dá)式相匹配的元素; 和/或,標(biāo)簽設(shè)置項(xiàng):指示利用所述標(biāo)識(shí)定位設(shè)置項(xiàng)、名稱定位設(shè)置項(xiàng)、類名定位設(shè)置項(xiàng)、內(nèi)容定位設(shè)置項(xiàng)或表達(dá)式定位設(shè)置項(xiàng)對(duì)元素定位時(shí),所定位元素的類型和/或?qū)傩浴?br> 12.根據(jù)權(quán)利要求11所述的方法,其特征在于, 所述為HTML元素建立的匹配設(shè)置項(xiàng)還包括:元素刪除匹配設(shè)置項(xiàng),所述元素刪除匹配設(shè)置項(xiàng)至少包括: 刪除由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容;和/或 改變由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容。
13.一種對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的裝置,該裝置包括: 設(shè)置模塊,適于在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置; 下載模塊,適于在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載; 匹配模塊,適于將所述網(wǎng)頁(yè)內(nèi)容分別與所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功; 提取模塊,適于利用與所述網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè); 保存模塊,適于將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于, 所述保存模塊,具體適于在瀏覽器側(cè)接收到在當(dāng)前頁(yè)面中用戶輸入的保存網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置指令后,提取當(dāng)前網(wǎng)址,將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置相對(duì)應(yīng)地保存到本地配置文件中。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于, 所述配置文件為單獨(dú)保存所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的配置文件;或者 所述配置文件為存儲(chǔ)所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置的文件的一部分。
16.根據(jù)權(quán)利要求14或15所述的裝置,其特征在于, 所述保存模塊,還適于提取當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址,將當(dāng)前網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址對(duì)應(yīng)于當(dāng)前網(wǎng)址匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到所述本地配置文件中。
17.根據(jù)權(quán)利要求14或15所述的裝置,其特征在于, 所述匹配模塊,還適于當(dāng)所述下載模塊在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),判斷所述下載網(wǎng)頁(yè)的網(wǎng)址與配置文件中網(wǎng)址是否匹配,如果匹配,則自動(dòng)進(jìn)入閱讀模式,指示所述提取模塊利用與匹配的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。
18.根據(jù)權(quán)利要求16所述的裝置,其特征在于, 所述匹配模塊,還適于當(dāng)所述下載模塊在瀏覽器側(cè)進(jìn)行網(wǎng)頁(yè)內(nèi)容的下載時(shí),匹配下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,如果匹配成功,則自動(dòng)進(jìn)入閱讀模式,指示所述提取模塊利用匹配出的所述下載網(wǎng)頁(yè)的網(wǎng)址的上一級(jí)網(wǎng)址或同一級(jí)網(wǎng)址所對(duì)應(yīng)的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述下載網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容,并顯示在瀏覽器側(cè)。
19.根據(jù)權(quán)利要求17或18所述的裝置,其特征在于, 所述裝置還包括提示模塊和指令接收模塊, 所述提示模塊,適于在自動(dòng)進(jìn)入閱讀模式后,提示是否使所述下載網(wǎng)頁(yè)所在書籍自動(dòng)進(jìn)入閱讀模式, 所述指令接收模塊,適于在接收到確定的指令后,從網(wǎng)站獲得該書籍的各個(gè)網(wǎng)頁(yè)的網(wǎng)址,指示所述保存模塊將獲得的網(wǎng)址對(duì)應(yīng)于所述下載網(wǎng)頁(yè)的網(wǎng)址匹配出的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存到配置文件中。
20.根據(jù)權(quán)利要求13所述的裝置,其特征在于, 所述設(shè)置模塊,具體適于建立一匹配設(shè)置文件并將所述至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置保存在所述匹配設(shè)置文件中; 其中,所述匹配設(shè)置文件中包括至少一個(gè)網(wǎng)站節(jié)點(diǎn),每個(gè)網(wǎng)站節(jié)點(diǎn)中包括至少一種網(wǎng)頁(yè)節(jié)點(diǎn),至少部分所述網(wǎng)頁(yè)節(jié)點(diǎn)中設(shè)有兩個(gè)以上的匹配設(shè)置描述節(jié)點(diǎn),每個(gè)匹配設(shè)置描述節(jié)點(diǎn)對(duì)應(yīng)一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,至少兩個(gè)所述網(wǎng)頁(yè)文本內(nèi)容的匹配設(shè)置中分別包括對(duì)相同類型文本內(nèi)容的不同匹配設(shè)置項(xiàng)。
21.根據(jù)權(quán)利要求17或18所述的裝置,其特征在于, 所述下載模塊,具體適于接收到瀏覽器NavigateComplete事件。
22.根據(jù)權(quán)利要求20所述的裝置,其特征在于, 所述設(shè)置模塊,具體適于為每種類型的網(wǎng)站建立一個(gè)網(wǎng)站節(jié)點(diǎn);在一個(gè)網(wǎng)站節(jié)點(diǎn)下,為該網(wǎng)站節(jié)點(diǎn)相應(yīng)的網(wǎng)站下 每種類型的網(wǎng)頁(yè)建立一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn);根據(jù)網(wǎng)頁(yè)的內(nèi)容建立每個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)的匹配設(shè)置描述節(jié)點(diǎn)中的匹配設(shè)置項(xiàng),其中在網(wǎng)頁(yè)節(jié)點(diǎn)的第一匹配設(shè)置描述節(jié)點(diǎn)中,為該網(wǎng)頁(yè)節(jié)點(diǎn)相應(yīng)的網(wǎng)頁(yè)中每種類型的文本內(nèi)容建立至少一條匹配設(shè)置項(xiàng);以及,對(duì)于網(wǎng)頁(yè)中相同類型的文本內(nèi)容,在所述第一匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)和在該網(wǎng)頁(yè)節(jié)點(diǎn)中除第一匹配設(shè)置描述節(jié)點(diǎn)之外的匹配設(shè)置描述節(jié)點(diǎn)中建立的匹配設(shè)置項(xiàng)各不相同。
23.根據(jù)權(quán)利要求22所述的裝置,其特征在于, 所述設(shè)置模塊,具體適于在第一匹配設(shè)置描述節(jié)點(diǎn)中為網(wǎng)頁(yè)中每種類型的文本內(nèi)容在網(wǎng)頁(yè)內(nèi)容中的超文本標(biāo)記語(yǔ)言HTML元素建立至少一條匹配設(shè)置項(xiàng); 所述為HTML元素建立的匹配設(shè)置項(xiàng)包括一次定位匹配設(shè)置項(xiàng),所述一次定位匹配設(shè)置項(xiàng)至少包括: 基點(diǎn)查找設(shè)置項(xiàng):指示基點(diǎn)查找的方式,所述方式包括查找標(biāo)識(shí)、查找名稱、查找類名、查找內(nèi)容、查找表達(dá)式;和/或, 標(biāo)識(shí)定位設(shè)置項(xiàng):定位與HTML元素的標(biāo)識(shí)相匹配的元素;和/或, 名稱定位設(shè)置項(xiàng):定位與HTML元素的名稱相匹配的元素;和/或, 類名定位設(shè)置項(xiàng):定位與HTML元素的類名稱相匹配的元素;和/或, 內(nèi)容定位設(shè)置項(xiàng):定位與HTML元素的內(nèi)容相匹配的元素;和/或, 表達(dá)式定位設(shè)置項(xiàng):定位與HTML元素中的表達(dá)式相匹配的元素; 和/或, 標(biāo)簽設(shè)置項(xiàng):指示利用所述標(biāo)識(shí)定位設(shè)置項(xiàng)、名稱定位設(shè)置項(xiàng)、類名定位設(shè)置項(xiàng)、內(nèi)容定位設(shè)置項(xiàng)或表達(dá)式定位設(shè)置項(xiàng)對(duì)元素定位時(shí),所定位元素的類型和/或?qū)傩浴?br> 24.根據(jù)權(quán)利要求23所述的裝置,其特征在于, 所述設(shè)置模塊為HTML元素建立的匹配設(shè)置項(xiàng)還包括:元素刪除匹配設(shè)置項(xiàng),所述元素刪除匹配設(shè)置項(xiàng)至少包括: 刪除由一次定位匹配設(shè)置項(xiàng)或二次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容;和/或 改變由一次定位匹配設(shè)置項(xiàng)或二 次定位匹配設(shè)置項(xiàng)定位出的元素中的預(yù)定內(nèi)容。
全文摘要
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域,公開了一種對(duì)網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行處理的方法和裝置,方法包括在瀏覽器側(cè)預(yù)設(shè)至少一網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置;在瀏覽器側(cè)進(jìn)行當(dāng)前網(wǎng)頁(yè)內(nèi)容的下載;將所述網(wǎng)頁(yè)內(nèi)容分別與所述網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行匹配,直至所述網(wǎng)頁(yè)內(nèi)容匹配成功;利用與所述網(wǎng)頁(yè)內(nèi)容匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置,提取所述當(dāng)前網(wǎng)頁(yè)內(nèi)容中的網(wǎng)頁(yè)文本內(nèi)容并顯示在瀏覽器側(cè);將所述當(dāng)前網(wǎng)址和其匹配成功的網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行對(duì)應(yīng)的保存。本發(fā)明能夠解決匹配過程需要將網(wǎng)頁(yè)文本內(nèi)容與網(wǎng)頁(yè)文本內(nèi)容匹配設(shè)置進(jìn)行全部比對(duì),耗費(fèi)大量時(shí)間和資源,導(dǎo)致了網(wǎng)頁(yè)提取效率低下,以及網(wǎng)頁(yè)顯示的等待時(shí)延過長(zhǎng)的問題。
文檔編號(hào)G06F17/30GK103150389SQ20131009252
公開日2013年6月12日 申請(qǐng)日期2013年3月21日 優(yōu)先權(quán)日2013年3月21日
發(fā)明者糜裕峰, 謝洲為, 任寰 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1