一種網(wǎng)頁書簽的生成方法和裝置制造方法
【專利摘要】本發(fā)明適用于網(wǎng)頁書簽領(lǐng)域,提供了一種網(wǎng)頁書簽的生成方法和裝置,該方法包括:在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息;根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要信息;根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。由于用戶可以根據(jù)網(wǎng)頁的接要信息和網(wǎng)頁的摘要圖片快速的瀏覽到網(wǎng)頁的內(nèi)容概要信息,可免于為查找網(wǎng)頁數(shù)據(jù)而逐個(gè)進(jìn)行打開查找的麻煩,而且所生面的網(wǎng)頁書簽中包括網(wǎng)頁中的圖片信息,能夠更為直觀的呈現(xiàn)出網(wǎng)頁的數(shù)據(jù)信息,方便用戶快速查找,提高用戶的訪問效率。
【專利說明】一種網(wǎng)頁書簽的生成方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于網(wǎng)頁書簽領(lǐng)域,尤其涉及一種在IOS中生成離線網(wǎng)頁書簽的方法和裝置。
【背景技術(shù)】
[0002]在移動(dòng)終端如手機(jī)、PAD等設(shè)備中,一般都具有WIFI和移動(dòng)網(wǎng)絡(luò),如GPRS上網(wǎng)或者3G上網(wǎng)功能。WIFI —般具有速度快,下載數(shù)據(jù)的流量不受限制、流量免費(fèi)的特點(diǎn),而使用GRPS上網(wǎng)或者使用3G上網(wǎng)一般都會(huì)有流量的限制,超過規(guī)定的流量就會(huì)產(chǎn)生額外的數(shù)據(jù)費(fèi)用。因此,更多的用戶選擇在有WIFI的環(huán)境下下載數(shù)據(jù),從而使得在沒有WIFI的情況下也能方便的使用已下載的數(shù)據(jù)。
[0003]現(xiàn)有的手機(jī)QQ瀏覽器就具有離線閱讀的功能,其能夠在有網(wǎng)絡(luò),尤其是有WIFI或者連接電腦網(wǎng)絡(luò)的情況下,把網(wǎng)頁包括的資源(包括圖片、CSS、Javascript等等)全部下載到本地保存起來,從而可以離線的閱讀下載的數(shù)據(jù)文件。
[0004]但是,在下載的網(wǎng)頁條數(shù)較多的情況下,用戶在查找想要瀏覽的網(wǎng)頁信息時(shí),查找較為麻煩,不利于用戶快速查找到所需要訪問的網(wǎng)頁的信息。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例的目的在于提供一種網(wǎng)頁書簽的生成方法和裝置,以解決現(xiàn)有技術(shù)因下載的網(wǎng)頁內(nèi)容條數(shù)較多,不能快速有效的找到需要訪問的網(wǎng)頁的問題,從而提高用戶訪問頁面的效率。
[0006]本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種網(wǎng)頁書簽的生成方法,所述方法包括下述步驟:
[0007]在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息;
[0008]根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要信息;
[0009]根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。
[0010]本發(fā)明實(shí)施例的另一目的在于提供一種網(wǎng)頁書簽的生成裝置,所述裝置包括:
[0011]載入單元,用于在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息;
[0012]提取單元,用于根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要
信息;
[0013]生成單元,用于根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。
[0014]在本發(fā)明實(shí)施例中,通過在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息,通過載入的網(wǎng)頁數(shù)據(jù)信息,提取到網(wǎng)頁的文字摘要信息和網(wǎng)頁的摘要圖片,根據(jù)網(wǎng)頁的文字摘要信息和網(wǎng)頁的圖片,生成網(wǎng)頁書簽,由于用戶可以根據(jù)網(wǎng)頁的接要信息和網(wǎng)頁的摘要圖片快速的瀏覽到網(wǎng)頁的內(nèi)容概要信息,可免于為查找網(wǎng)頁數(shù)據(jù)而逐個(gè)進(jìn)行打開查找的麻煩,而且所生面的網(wǎng)頁書簽中包括網(wǎng)頁中的圖片信息,能夠更為直觀的呈現(xiàn)出網(wǎng)頁的數(shù)據(jù)信息,方便用戶快速查找,提高用戶的訪問效率。【專利附圖】
【附圖說明】
[0015]圖1是本發(fā)明第一實(shí)施例提供的生成網(wǎng)頁書簽的實(shí)現(xiàn)流程圖;
[0016]圖2是本發(fā)明第一實(shí)施例提供的獲取網(wǎng)頁的摘要圖片的實(shí)現(xiàn)流程圖;
[0017]圖3是本發(fā)明實(shí)施例提供的待顯示的網(wǎng)頁效果示意圖;
[0018]圖4為本發(fā)明實(shí)施例提供的經(jīng)過本發(fā)明所述網(wǎng)頁書簽的生成方法處理后的效果示意圖;
[0019]圖5為本發(fā)明第二實(shí)施例提供的網(wǎng)頁書簽的生成裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0020]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0021]在本發(fā)明實(shí)施例中,通過將網(wǎng)頁數(shù)據(jù)信息載入到瀏覽器中,通過執(zhí)行相應(yīng)的JS代碼后,可以獲取到網(wǎng)頁數(shù)據(jù)信息中包括的網(wǎng)頁的文字摘要信息和網(wǎng)頁的摘要圖片,通過所述摘要圖片和文字摘要信息形成網(wǎng)頁書簽進(jìn)行,可方便用戶進(jìn)行網(wǎng)頁的快速查找,并且根據(jù)網(wǎng)頁中的摘要圖片信息,更加直觀的顯示網(wǎng)頁的數(shù)據(jù)信息,方便用戶快速查找定位。
[0022]實(shí)施例一:
[0023]圖1示出了本發(fā)明實(shí)施例一所述的生成網(wǎng)頁書簽的實(shí)現(xiàn)流程,詳述如下:
[0024]在步驟SlOl中,在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息。
[0025]在本實(shí)施例中,載入網(wǎng)頁的數(shù)據(jù)信息包括兩種情況,一種是已經(jīng)下載好的離線的本地網(wǎng)頁數(shù)據(jù)信息,另一種是直接載入網(wǎng)頁地址,直接通過網(wǎng)絡(luò)在線載入網(wǎng)頁數(shù)據(jù)。下面以蘋果操作系統(tǒng)IOS下的瀏覽器nWEBVIEW為例分別進(jìn)行介紹:
[0026]在第一種情況下,需要先進(jìn)行網(wǎng)頁數(shù)據(jù)的下載,在網(wǎng)絡(luò)通暢的環(huán)境下,可由IOS下的普通的瀏覽器發(fā)送網(wǎng)頁訪問請(qǐng)求,在得到數(shù)據(jù)應(yīng)答后,可以通過應(yīng)用程序,如手機(jī)QQ瀏覽器或者通過手動(dòng)將網(wǎng)頁數(shù)據(jù)文件下載到本地。對(duì)于下載的網(wǎng)頁數(shù)據(jù),包括網(wǎng)頁的源代碼、圖片等網(wǎng)頁的所有相關(guān)資源,對(duì)于多個(gè)網(wǎng)頁的數(shù)據(jù)文件,可以將其合并存儲(chǔ)為一個(gè)文件夾中,由nWEBVIEW瀏覽器統(tǒng)一進(jìn)行載入其中的數(shù)據(jù)信息。
[0027]在第二種情況下,用戶直接在瀏覽器nWEBVIEW中輸入相應(yīng)的訪問的網(wǎng)址信息,即可通過網(wǎng)絡(luò)訪問到相應(yīng)的服務(wù)器,讀取到相應(yīng)的數(shù)據(jù)返回后載入到本地瀏覽器。
[0028]在得到載入本地文件或者載入網(wǎng)址獲取網(wǎng)頁數(shù)據(jù)完成的通知后,即可進(jìn)行下一步的操作。
[0029]在步驟S102中,根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要信息。
[0030]在該步驟中,需要提取出網(wǎng)頁的摘要圖片與網(wǎng)頁的文字摘要信息,下面分別進(jìn)行描述:
[0031]1、摘要圖片:
[0032]在同一網(wǎng)頁中,常常會(huì)包括多張圖片,隨著現(xiàn)在網(wǎng)頁內(nèi)容的多樣化,包括的圖片的內(nèi)容更加繁多,如各種廣告信息的圖片等。由于廣告圖片并非本發(fā)明實(shí)施例中所需要的摘要圖片,為此,需要對(duì)其進(jìn)行過濾操作。為此,設(shè)定一個(gè)過濾廣告圖片的方案,包括如如圖2所示的下述步驟:
[0033]在步驟S201中,將網(wǎng)頁中的圖片與預(yù)設(shè)的目標(biāo)圖片進(jìn)行大小比較。
[0034]具體的,目標(biāo)圖片與網(wǎng)頁中的圖片進(jìn)行比較,一般是指的矩形圖片的比較,根據(jù)網(wǎng)頁圖片與預(yù)設(shè)的目標(biāo)圖片的大小進(jìn)行比較,可以得到三種情況:a、網(wǎng)頁中的圖片的兩條邊都大于預(yù)設(shè)的目標(biāo)圖片對(duì)應(yīng)的邊;b、網(wǎng)頁中的圖片的其中一條邊大于預(yù)設(shè)的目標(biāo)圖片對(duì)應(yīng)的邊,網(wǎng)頁中的圖片的另一條邊小于預(yù)設(shè)的目標(biāo)圖片對(duì)應(yīng)的邊;C、網(wǎng)頁中的圖片的兩條邊都小于預(yù)設(shè)的目標(biāo)圖片對(duì)應(yīng)的邊。根據(jù)實(shí)際情況,可以定義查找到屬于a、b條件的網(wǎng)頁的圖片為符合要求的圖片,當(dāng)然也可以定義僅為符合a條件的網(wǎng)頁的圖片為符合要求的圖片,或者,也可以定義,網(wǎng)頁中的圖片的寬大于預(yù)設(shè)的目標(biāo)圖片的寬的圖片為符合條件的圖片或者,網(wǎng)頁中的圖片的高大于預(yù)設(shè)的目標(biāo)圖片的高的圖片為符合條件的圖片。
[0035]在步驟S202中,當(dāng)網(wǎng)頁中的圖片大于預(yù)設(shè)的目標(biāo)圖片時(shí),記錄所述網(wǎng)頁中的圖片為網(wǎng)頁的摘要圖片。
[0036]其中,預(yù)設(shè)的目標(biāo)圖片可以為在網(wǎng)頁書簽中需要展示的圖片,也可以是在獲取摘要圖片過程中設(shè)定的一個(gè)經(jīng)驗(yàn)尺寸大小的圖片,該目標(biāo)圖片的尺寸可以根據(jù)網(wǎng)頁的類型進(jìn)行靈活的調(diào)整,以達(dá)到能較好的過濾噪聲信息(即廣告圖片等非重要信息)的目的。
[0037]在查找摘要圖片過程中,可按照網(wǎng)頁中圖片的排列順序的先后依次進(jìn)行查找,直到查找得到符合要求的圖片。
[0038]為使得網(wǎng)頁中查找的圖片更加符合展示的要求和體現(xiàn)展示的效果,在查找到摘要圖片后,還包括步驟S203,對(duì)網(wǎng)頁的摘要圖片按原始比例進(jìn)行縮放,使所述網(wǎng)頁的摘要圖片的其中一邊等于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊,所述網(wǎng)頁的摘要圖片的另外一邊大于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊。
[0039]在步驟S204中,對(duì)網(wǎng)頁的摘要圖片居中截取。
[0040]具體的,為保證摘要圖片中信息的完整性,步驟S203中對(duì)圖片進(jìn)行縮放過程中,使網(wǎng)頁的摘要圖片的一邊與預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊相等,另一邊大于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊,這樣可以盡最大可能的對(duì)網(wǎng)頁的摘要圖片中信息的保留,而且不會(huì)出現(xiàn)空白,按照?qǐng)D片的原始比例進(jìn)行縮放,也不會(huì)導(dǎo)致圖片的失真。在對(duì)縮放后的圖片進(jìn)行居中的截取,可以在多數(shù)情況下,盡可能的保留較為豐富的圖片信息,使信息更加完整。
[0041]2、文字摘要信息
[0042]所述文字摘要信息包括網(wǎng)頁的標(biāo)題和網(wǎng)頁的正文概要信息,其中獲取網(wǎng)頁的標(biāo)題可以通過查找網(wǎng)頁源代碼中的title標(biāo)簽的方法快捷的進(jìn)行查找,獲取網(wǎng)頁正文的概要信息可以包括但不局限于以下三種方式:
[0043]2.1、根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁正文的首段文字,并記錄為網(wǎng)頁的正文概要信
肩、O
[0044]具體的,對(duì)于一些網(wǎng)頁信息中,重要的信息一般會(huì)在首段中進(jìn)行描述的情況,可通過直接獲取網(wǎng)頁正文的首段文字,并記錄其為網(wǎng)頁的正文概要信息。獲取網(wǎng)頁正文的首段可以通過網(wǎng)頁源代碼中的正文標(biāo)簽和段落標(biāo)簽相結(jié)合進(jìn)行查找,對(duì)于正文首段的字?jǐn)?shù)過多或者過少的情況,一般可適當(dāng)截取或者從下一段中截取適當(dāng)文字的方式獲取字?jǐn)?shù)適當(dāng)?shù)膬?nèi)容信息,一般取兩百字左右為宜??稍O(shè)定一個(gè)區(qū)間范圍,在滿足設(shè)定的區(qū)間的字?jǐn)?shù)時(shí)即可,在不滿足指定的區(qū)間的字?jǐn)?shù)時(shí),通過截取或者增加文字,以獲取200字左右的文字內(nèi)容為適中。
[0045]2.2、根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁的正文中出現(xiàn)頻率最高的詞,查找所述詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息。
[0046]具體的,在網(wǎng)頁源文件中采用網(wǎng)頁標(biāo)識(shí)獲取網(wǎng)頁的正文內(nèi)容后,通過對(duì)正文中內(nèi)容進(jìn)行詞的出現(xiàn)頻率的統(tǒng)計(jì),得到出現(xiàn)頻率高的詞后,查找所述詞在各段中出現(xiàn)的次數(shù),取出現(xiàn)次數(shù)最多的一段為網(wǎng)頁的正文概要信息,考慮到文字部分內(nèi)容的限制,對(duì)于段內(nèi)字?jǐn)?shù)較多的情況,適應(yīng)進(jìn)行截取,以從段落開始到大概兩百字左右為宜。
[0047]2.3、根據(jù)預(yù)設(shè)的關(guān)鍵詞庫,查找所述關(guān)鍵詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息。
[0048]具體的,所述預(yù)設(shè)的關(guān)鍵詞庫,可以為網(wǎng)上搜集的一些常用的熱門關(guān)鍵字,優(yōu)選的一種方式為搜集與網(wǎng)頁信息相近的一些關(guān)鍵字,通過查找所述關(guān)鍵詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息,由指定關(guān)鍵字信息,可以使網(wǎng)頁查找重要信息時(shí)目的更為直接,查找效率更高。相應(yīng)的,考慮到文字部分內(nèi)容的限制,對(duì)于段內(nèi)字?jǐn)?shù)較多的情況,適應(yīng)進(jìn)行截取,以從段落開始到大概兩百字左右為宜。
[0049]在步驟S103中,根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。
[0050]根據(jù)步驟S102中得到的摘要圖片和文字摘要信息,生成網(wǎng)頁書簽。對(duì)于載入有多個(gè)網(wǎng)頁信息的瀏覽器,可以在瀏覽器nWEBVIEW中直接顯示生成的各個(gè)網(wǎng)頁的書簽信息,便于用戶直觀的進(jìn)行操作。為符合用戶的瀏覽習(xí)慣,一般在書簽的左側(cè)設(shè)置摘要圖片,在書簽的右部設(shè)置網(wǎng)頁的文字摘要信息。
[0051]如圖3為本發(fā)明實(shí)施例所述的網(wǎng)頁原始效果示意圖,圖4為經(jīng)過本發(fā)明實(shí)施例所述的網(wǎng)頁書簽的生成方法處理后,得到的效果示意圖,其中右部的文字信息為網(wǎng)頁的正文的首段的文字內(nèi)容。其中的標(biāo)題文字以加黑顯示,更加醒目,左側(cè)的圖片寬高比值與預(yù)設(shè)的目標(biāo)圖片的寬高比值相同,不需要進(jìn)行裁切,直接經(jīng)過縮小后得到。
[0052]對(duì)于某些特殊的網(wǎng)頁,可能僅存在文字信息(如一些小說或者文學(xué)類的網(wǎng)頁),或者僅存在圖片信息(如一些圖片賞析類的網(wǎng)頁等),對(duì)于純文字的網(wǎng)頁,可以在圖片的位置或者文字的位置相應(yīng)的補(bǔ)充文字內(nèi)容或者圖片內(nèi)容,使其信息更加完整。
[0053]對(duì)于生成的網(wǎng)頁書簽,直接在瀏覽器中顯示,符合用戶的操作習(xí)慣,提高用戶操作的便利性。
[0054]本發(fā)明實(shí)施例,通過將網(wǎng)頁中的摘要圖片與網(wǎng)頁中的文字摘要信息,使得網(wǎng)頁信息可以快捷的展示給用戶,提高用戶使用的便利性。而通過預(yù)設(shè)關(guān)鍵字或者根據(jù)出現(xiàn)頻率高的詞來查找網(wǎng)頁的正文概要信息所在的位置,可以更為準(zhǔn)確的查找到網(wǎng)頁正文中概要信息所在的段落,使信息顯示的準(zhǔn)確度更高。通過對(duì)網(wǎng)頁中的圖片的大小進(jìn)行比較,可以過濾掉一些與網(wǎng)頁主題無關(guān)的圖片,并對(duì)圖片進(jìn)行相應(yīng)的縮放后截取,使獲取的摘要圖片的信息更加準(zhǔn)確,圖片的內(nèi)容的重要信息更加完整。
[0055]實(shí)施例二:
[0056]圖5示出了本發(fā)明第二實(shí)施例提供的網(wǎng)頁書簽的生成裝置的結(jié)構(gòu)示意圖,詳述如下:
[0057]本發(fā)明實(shí)施例所述的網(wǎng)頁書簽的生成裝置,包括載入單元501、提取單元502和生成單元503,其中:
[0058]所述載入單元501,用于在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息;
[0059]所述提取單元502,用于根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要信息,其中,所述網(wǎng)頁的文字摘要信息包括網(wǎng)頁標(biāo)題與網(wǎng)頁的正文概要信息。
[0060]所述生成單元503,用于根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。
[0061]其中,所述提取單元502包括:
[0062]第一查找記錄子單元5021,用于根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁正文的首段文字,并記錄為網(wǎng)頁的正文概要信息;或者
[0063]第二查找記錄子單元5022,用于根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁的正文中出現(xiàn)頻率最高的詞,查找所述詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息;或者
[0064]第三查找記錄子單元5023,用于根據(jù)預(yù)設(shè)的關(guān)鍵詞庫,查找所述關(guān)鍵詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息。
[0065]所述提取單元502還包括:
[0066]比較子單元5024,用于將網(wǎng)頁中的圖片與預(yù)設(shè)的目標(biāo)圖片進(jìn)行大小比較;
[0067]記錄子單元5025,用于當(dāng)網(wǎng)頁中的圖片大于預(yù)設(shè)的目標(biāo)圖片時(shí),記錄所述網(wǎng)頁中的圖片為網(wǎng)頁的摘要圖片。
[0068]縮放子單元5026,用于對(duì)網(wǎng)頁的摘要圖片按原始比例進(jìn)行縮放,使所述網(wǎng)頁的摘要圖片的其中一邊等于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊,所述網(wǎng)頁的摘要圖片的另外一邊大于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊。
[0069]截取子單元5027,對(duì)網(wǎng)頁的摘要圖片居中截取。
[0070]通過載放單元501在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息,根據(jù)載入的網(wǎng)頁數(shù)據(jù)信息,由提取單元502提取到網(wǎng)頁的文字摘要信息和網(wǎng)頁的摘要圖片,根據(jù)網(wǎng)頁的文字摘要信息和網(wǎng)頁的圖片,由生成單元503生成網(wǎng)頁書簽,由于用戶可以根據(jù)網(wǎng)頁的接要信息和網(wǎng)頁的摘要圖片快速的瀏覽到網(wǎng)頁的內(nèi)容概要信息,可免于為查找網(wǎng)頁數(shù)據(jù)而逐個(gè)進(jìn)行打開查找的麻煩,而且所生面的網(wǎng)頁書簽中包括網(wǎng)頁中的圖片信息,能夠更為直觀的呈現(xiàn)出網(wǎng)頁的數(shù)據(jù)信息,方便用戶快速查找,提高用戶的訪問效率。
[0071]值得注意的是,上述裝置和系統(tǒng)實(shí)施例中,所包括的各個(gè)單元只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
[0072]另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各實(shí)施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,相應(yīng)的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),如R0M/RAM、磁盤或光盤等。
[0073]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種網(wǎng)頁書簽的生成方法,其特征在于,所述方法包括: 在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息; 根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要信息; 根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述網(wǎng)頁的文字摘要信息包括網(wǎng)頁標(biāo)題與網(wǎng)頁的正文概要信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟提取網(wǎng)頁的文字摘要信息包括: 根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁正文的首段文字,并記錄為網(wǎng)頁的正文概要信息;或者 根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁的正文中出現(xiàn)頻率最高的詞,查找所述詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息;或者 根據(jù)預(yù)設(shè)的關(guān)鍵詞庫,查找所述關(guān)鍵詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟提取網(wǎng)的圖片包括: 將網(wǎng)頁中的圖片與預(yù)設(shè)的目標(biāo)圖片進(jìn)行大小比較; 當(dāng)網(wǎng)頁中的圖片大于預(yù)設(shè)的目標(biāo)圖片時(shí),記錄所述網(wǎng)頁中的圖片為網(wǎng)頁的摘要圖片。
5.根據(jù)權(quán)利要求4 所述的方法,其特征在于,所述方法還包括: 對(duì)網(wǎng)頁的摘要圖片按原始比例進(jìn)行縮放,使所述網(wǎng)頁的摘要圖片的其中一邊等于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊,所述網(wǎng)頁的摘要圖片的另外一邊大于預(yù)設(shè)的目標(biāo)圖片的對(duì)應(yīng)邊對(duì)網(wǎng)頁的摘要圖片居中截取。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述步驟在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息具體為: 在瀏覽器中載入網(wǎng)頁的網(wǎng)址或者在瀏覽器中載入離線的本地網(wǎng)頁數(shù)據(jù)信息。
7.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述網(wǎng)頁書簽在瀏覽器頁面進(jìn)行顯示。
8.—種網(wǎng)頁書簽的生成裝置,其特征在于,所述裝置包括: 載入單元,用于在瀏覽器中載入網(wǎng)頁數(shù)據(jù)信息; 提取單元,用于根據(jù)所述網(wǎng)頁數(shù)據(jù)信息,提取網(wǎng)頁的摘要圖片和網(wǎng)頁的文字摘要信息; 生成單元,用于根據(jù)所提取的摘要圖片與文字摘要信息,生成網(wǎng)頁書簽。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述網(wǎng)頁的文字摘要信息包括網(wǎng)頁標(biāo)題與網(wǎng)頁的正文概要信息。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述提取單元包括: 第一查找記錄子單元,用于根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁正文的首段文字,并記錄為網(wǎng)頁的正文概要信息;或者 第二查找記錄子單元,用于根據(jù)網(wǎng)頁數(shù)據(jù)信息查找網(wǎng)頁的正文中出現(xiàn)頻率最高的詞,查找所述詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息;或者 第三查找記錄子單元,用于根據(jù)預(yù)設(shè)的關(guān)鍵詞庫,查找所述關(guān)鍵詞在正文中出現(xiàn)次數(shù)較多的段記錄為網(wǎng)頁的正文概要信息。
11.權(quán)利要求8所述的裝置,其特征在于,所述提取單元還包括:比較子單元,用于將網(wǎng)頁中的圖片與預(yù)設(shè)的目標(biāo)圖片進(jìn)行大小比較; 記錄子單元,用于當(dāng)網(wǎng)頁中的圖片大于預(yù)設(shè)的目標(biāo)圖片時(shí),記錄所述網(wǎng)頁中的圖片為網(wǎng)頁的 摘要圖片。
【文檔編號(hào)】G06F17/30GK103885959SQ201210558471
【公開日】2014年6月25日 申請(qǐng)日期:2012年12月20日 優(yōu)先權(quán)日:2012年12月20日
【發(fā)明者】楊欣, 楊木文 申請(qǐng)人:騰訊科技(深圳)有限公司