信息收集方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種信息收集方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,瀏覽網(wǎng)頁逐漸成為人們獲取信息的主要手段。如何從大量的網(wǎng)絡(luò)信息中檢索感興趣的內(nèi)容,并及時(shí)保存相應(yīng)的檢索結(jié)果以方便用戶隨時(shí)的訪問是網(wǎng)絡(luò)瀏覽的一個(gè)重要的應(yīng)用。
[0003]目前常規(guī)的檢索方法是使用以關(guān)鍵字檢索為主的搜索引擎,配合瀏覽器提供的收藏夾功能,實(shí)現(xiàn)檢索結(jié)果的保存。然而這樣的實(shí)現(xiàn)方式缺乏主動(dòng)性,在數(shù)據(jù)的自動(dòng)更新和篩選上過于依賴用戶的參與。
【發(fā)明內(nèi)容】
[0004]鑒于上述檢索結(jié)果的保存過于依賴用戶的參與缺乏主動(dòng)性的問題,提出了本發(fā)明以便提供一種信息收集方法及裝置。
[0005]本發(fā)明提供一種信息收集方法,包括:獲取網(wǎng)絡(luò)瀏覽信息;對(duì)網(wǎng)絡(luò)瀏覽信息進(jìn)行評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果對(duì)網(wǎng)絡(luò)瀏覽信息進(jìn)行排序,并根據(jù)排序結(jié)果生成或更新網(wǎng)絡(luò)檢索列表。
[0006]優(yōu)選地,通過搜索引擎搜索與網(wǎng)絡(luò)檢索列表相匹配的網(wǎng)絡(luò)站點(diǎn),并將搜索到的網(wǎng)絡(luò)站點(diǎn)按照網(wǎng)絡(luò)檢索列表的排序進(jìn)行推送。
[0007]優(yōu)選地,網(wǎng)絡(luò)瀏覽信息包括以下至少之一:用戶通過客戶端向網(wǎng)絡(luò)服務(wù)器發(fā)送的站點(diǎn)地址信息、訪問的文本內(nèi)容、用戶單次訪問時(shí)長、同一網(wǎng)站用戶訪問次數(shù)。
[0008]優(yōu)選地,上述方法進(jìn)一步包括:將生成或更新的網(wǎng)絡(luò)檢索列表保存在用戶數(shù)據(jù)服務(wù)器對(duì)應(yīng)的賬戶中。
[0009]優(yōu)選地,對(duì)網(wǎng)絡(luò)瀏覽信息進(jìn)行評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果對(duì)網(wǎng)絡(luò)瀏覽信息進(jìn)行排序,并根據(jù)排序結(jié)果生成或更新網(wǎng)絡(luò)檢索列表具體包括:從獲取的網(wǎng)絡(luò)瀏覽信息中提取出用于分值評(píng)定的評(píng)價(jià)數(shù)據(jù);根據(jù)預(yù)定算法對(duì)提取出的評(píng)價(jià)數(shù)據(jù)進(jìn)行分值計(jì)算;判斷是否存在網(wǎng)絡(luò)檢索列表,在不存在網(wǎng)絡(luò)檢索列表的情況下,生成一個(gè)新的網(wǎng)絡(luò)檢索列表,并將網(wǎng)絡(luò)瀏覽信息和計(jì)算的分值添加到網(wǎng)絡(luò)檢索列表中,并將網(wǎng)絡(luò)瀏覽信息的排序設(shè)置為最高級(jí);在網(wǎng)絡(luò)檢索列表存在的情況下,根據(jù)計(jì)算的分值與已存儲(chǔ)在網(wǎng)絡(luò)檢索列表中的分值進(jìn)行比較排序,并根據(jù)排序結(jié)果更新網(wǎng)絡(luò)檢索列表;將網(wǎng)絡(luò)瀏覽信息中的文本內(nèi)容存儲(chǔ)在網(wǎng)絡(luò)檢索列表對(duì)應(yīng)的條目中。
[0010]優(yōu)選地,通過搜索引擎搜索與網(wǎng)絡(luò)檢索列表相匹配的網(wǎng)絡(luò)站點(diǎn)具體包括:根據(jù)網(wǎng)絡(luò)檢索列表的條目中存儲(chǔ)的文本內(nèi)容,通過搜索引擎搜索與網(wǎng)絡(luò)檢索列表中該條目相匹配的網(wǎng)絡(luò)站點(diǎn)。
[0011]優(yōu)選地,根據(jù)預(yù)定算法對(duì)提取出的評(píng)價(jià)數(shù)據(jù)進(jìn)行分值計(jì)算具體包括:假設(shè)網(wǎng)絡(luò)檢索列表有N條記錄,將提取的評(píng)價(jià)數(shù)據(jù)與網(wǎng)絡(luò)檢索列表中已有評(píng)價(jià)數(shù)據(jù)分別進(jìn)行比較,在相似度大于或等于第一預(yù)定閾值的情況下,權(quán)值取1,在相似度小于等于第二預(yù)定閾值的情況下,權(quán)值取O,在相似度小于第一預(yù)定閾值且大于第二預(yù)定閾值的情況下,權(quán)值取1/N的整數(shù)倍,將各權(quán)值相加得到M,其中,N>0,0〈1/N〈1,M< N ;假設(shè)用戶訪問了 X次該條記錄,每次訪問的時(shí)長依次為Tl、T2、…Tx,則平均每次訪問時(shí)間T= (Τ1+Τ2+…+Τχ) /X ;計(jì)算分值Q= (Μ/Ν)*Τ。
[0012]優(yōu)選地,根據(jù)計(jì)算的分值與已存儲(chǔ)在網(wǎng)絡(luò)檢索列表中的分值進(jìn)行比較排序,并根據(jù)排序結(jié)果更新網(wǎng)絡(luò)檢索列表具體包括:依次將分值Q與網(wǎng)絡(luò)檢索列表中的N個(gè)條目的分值進(jìn)行比較,若Q小于第i個(gè)條目的分值Qi,且大于第i+Ι個(gè)條目的分值Qi+Ι,則將本次訪問的文本內(nèi)容和分值Q記錄到網(wǎng)絡(luò)檢索列表,序號(hào)記錄為i+Ι,并將i+Ι以后的條目的序號(hào)依次加I ;若分值Q與網(wǎng)絡(luò)檢索列表中的第i個(gè)條目的分值相同,則將本次訪問的文本內(nèi)容和分值Q記錄到網(wǎng)絡(luò)檢索列表的第i條記錄,網(wǎng)絡(luò)檢索列表的其他記錄保持不變;若分值Q小于網(wǎng)絡(luò)檢索列表中所有條目的分值,則將本次訪問的文本內(nèi)容和分值Q記錄在網(wǎng)絡(luò)檢索列表中,其序號(hào)設(shè)置為N+1。
[0013]本發(fā)明還提供了一種信息收集裝置,包括:獲取模塊,用于獲取網(wǎng)絡(luò)瀏覽信息;處理模塊,用于對(duì)網(wǎng)絡(luò)瀏覽信息進(jìn)行評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果對(duì)網(wǎng)絡(luò)瀏覽信息進(jìn)行排序,并根據(jù)排序結(jié)果生成或更新網(wǎng)絡(luò)檢索列表。
[0014]優(yōu)選地,上述裝置還包括:推送模塊,用于通過搜索引擎搜索與網(wǎng)絡(luò)檢索列表相匹配的網(wǎng)絡(luò)站點(diǎn),并將搜索到的網(wǎng)絡(luò)站點(diǎn)按照網(wǎng)絡(luò)檢索列表的排序進(jìn)行推。
[0015]優(yōu)選地,網(wǎng)絡(luò)瀏覽信息包括以下至少之一:用戶通過客戶端向網(wǎng)絡(luò)服務(wù)器發(fā)送的站點(diǎn)地址信息、訪問的文本內(nèi)容、用戶單次訪問時(shí)長、同一網(wǎng)站用戶訪問次數(shù)。
[0016]優(yōu)選地,處理模塊模塊進(jìn)一步用于:將生成或更新的網(wǎng)絡(luò)檢索列表保存在用戶數(shù)據(jù)服務(wù)器對(duì)應(yīng)的賬戶中。
[0017]優(yōu)選地,處理模塊具體用于:從獲取的網(wǎng)絡(luò)瀏覽信息中提取出用于分值評(píng)定的評(píng)價(jià)數(shù)據(jù);根據(jù)預(yù)定算法對(duì)提取出的評(píng)價(jià)數(shù)據(jù)進(jìn)行分值計(jì)算;判斷是否存在網(wǎng)絡(luò)檢索列表,在不存在網(wǎng)絡(luò)檢索列表的情況下,生成一個(gè)新的網(wǎng)絡(luò)檢索列表,并將網(wǎng)絡(luò)瀏覽信息和計(jì)算的分值添加到網(wǎng)絡(luò)檢索列表中,并將網(wǎng)絡(luò)瀏覽信息的排序設(shè)置為最高級(jí);在網(wǎng)絡(luò)檢索列表存在的情況下,根據(jù)計(jì)算的分值與已存儲(chǔ)在網(wǎng)絡(luò)檢索列表中的分值進(jìn)行比較排序,并根據(jù)排序結(jié)果更新網(wǎng)絡(luò)檢索列表;將網(wǎng)絡(luò)瀏覽信息中的文本內(nèi)容存儲(chǔ)在網(wǎng)絡(luò)檢索列表對(duì)應(yīng)的條目中。
[0018]優(yōu)選地,推送模塊具體用于:根據(jù)網(wǎng)絡(luò)檢索列表的條目中存儲(chǔ)的文本內(nèi)容,通過搜索引擎搜索與網(wǎng)絡(luò)檢索列表中該條目相匹配的網(wǎng)絡(luò)站點(diǎn)。
[0019]優(yōu)選地,處理模塊模塊具體用于:假設(shè)網(wǎng)絡(luò)檢索列表有N條記錄,將提取的評(píng)價(jià)數(shù)據(jù)與網(wǎng)絡(luò)檢索列表中已有評(píng)價(jià)數(shù)據(jù)分別進(jìn)行比較,在相似度大于或等于第一預(yù)定閾值的情況下,權(quán)值取1,在相似度小于等于第二預(yù)定閾值的情況下,權(quán)值取0,在相似度小于第一預(yù)定閾值且大于第二預(yù)定閾值的情況下,權(quán)值取1/N的整數(shù)倍,將各權(quán)值相加得到M,其中,N>0,0〈1/N〈1,M彡N;假設(shè)用戶訪問了 X次該條記錄,每次訪問的時(shí)長依次為T1、T2、-Tx,則平均每次訪問時(shí)間T= (Τ1+Τ2+…+Τχ) /X ;計(jì)算分值Q= (Μ/Ν) *Τ。
[0020]優(yōu)選地,處理模塊具體用于:依次將分值Q與網(wǎng)絡(luò)檢索列表中的N個(gè)條目的分值進(jìn)行比較,若Q小于第i個(gè)條目的分值Qi,且大于第i+Ι個(gè)條目的分值Qi+Ι,則將本次訪問的文本內(nèi)容和分值Q記錄到網(wǎng)絡(luò)檢索列表,序號(hào)記錄為i+Ι,并將i+Ι以后的條目的序號(hào)依次加I ;若分值Q與網(wǎng)絡(luò)檢索列表中的第i個(gè)條目的分值相同,則將本次訪問的文本內(nèi)容和分值Q記錄到網(wǎng)絡(luò)檢索列表的第i條記錄,網(wǎng)絡(luò)檢索列表的其他記錄保持不變;若分值Q小于網(wǎng)絡(luò)檢索列表中所有條目的分值,則將本次訪問的文本內(nèi)容和分值Q記錄在網(wǎng)絡(luò)檢索列表中,其序號(hào)設(shè)置為N+1。
[0021]優(yōu)選地,上述裝置進(jìn)一步包括:開關(guān)模塊,用于根據(jù)用戶的操作關(guān)閉或開啟搜索服務(wù)推送裝置。
[0022]優(yōu)選地,信息收集裝置設(shè)置于用戶數(shù)據(jù)服務(wù)器中。
[0023]本發(fā)明有益效果如下:
[0024]通過采集用戶的網(wǎng)絡(luò)瀏覽信息,通過一定的評(píng)分判斷準(zhǔn)則,歸納用戶的網(wǎng)絡(luò)瀏覽習(xí)慣,生成并及時(shí)更新相應(yīng)的檢索列表,解決了現(xiàn)有技術(shù)中檢索結(jié)果的保存過于依賴用戶的參與缺乏主動(dòng)性的問題,能夠根據(jù)用戶的瀏覽習(xí)慣快速反饋其感興趣的相關(guān)網(wǎng)站檢索結(jié)果,提升用戶的網(wǎng)絡(luò)體驗(yàn)。
[0025]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說明】
[0026]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0027]圖1是本發(fā)明實(shí)施例的信息收集方法的流程圖;
[0028]圖2是本發(fā)明實(shí)施例的信息收集系統(tǒng)配置的系統(tǒng)框圖;
[0029]圖3是本發(fā)明實(shí)施例的生成和更新網(wǎng)絡(luò)檢索列表的過程流程圖;
[0030]圖4是本發(fā)明實(shí)施例的文本內(nèi)容提取的示意圖;
[0031]圖5是本發(fā)明實(shí)施例的文本內(nèi)容提取的流程圖;
[0032]圖6是本發(fā)明實(shí)施例的用戶進(jìn)行網(wǎng)絡(luò)瀏覽過程的流程圖;
[0033]圖7是本發(fā)明實(shí)施例的生成的檢索列表反饋給用戶的示意圖;
[0034]圖8是本發(fā)明實(shí)施例的信息收集裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0035]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。