亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種移動搜索引擎優(yōu)化方法

文檔序號:6491819閱讀:286來源:國知局
一種移動搜索引擎優(yōu)化方法【專利摘要】本發(fā)明提出了一種移動搜索引擎優(yōu)化方法。包括以下步驟:設(shè)計移動搜索引擎框架;建立URL列表;編輯翻譯器;設(shè)計WAP接口.由于本發(fā)明針對移動搜索引擎的現(xiàn)狀,在現(xiàn)有互聯(lián)網(wǎng)搜索引擎的框架上加入移動模塊,提出一種利用HTML資源建立移動搜索引擎的方式,該方式通過集中處理網(wǎng)絡(luò)蜘蛛抓取的HTML網(wǎng)頁,將HTML網(wǎng)頁進行主題信息提取,再將主題信息轉(zhuǎn)化成手機可以識別的WML頁面,并存入WML的快照庫中,當用戶點擊條記錄察看具體網(wǎng)頁時,系統(tǒng)不會直接鏈接互聯(lián)網(wǎng)上的該網(wǎng)頁,而是鏈接該網(wǎng)頁相對應(yīng)的WML網(wǎng)頁快照,滿足用戶的移動搜索需求。在實際應(yīng)用中,使用這種方式成功的建立了一個面向生活服務(wù)領(lǐng)域的移動搜索引擎,覆蓋全國近四十個城市的餐飲、娛樂和黃頁信息。【專利說明】一種移動搜索引擎優(yōu)化方法【
技術(shù)領(lǐng)域
】[0001]本發(fā)明涉及移動互聯(lián)網(wǎng)技術(shù),特別是一種移動搜索引擎的優(yōu)化方法?!?br>背景技術(shù)
】[0002]搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。當今,隨著無線通訊技術(shù)的創(chuàng)新和手機的普及,移動上網(wǎng)漸漸成為發(fā)展趨勢,為了滿足用戶隨時隨地查詢衣食住行信息的需求,如何建立移動搜索引擎,成為移動網(wǎng)絡(luò)應(yīng)用的熱點。移動上網(wǎng)受手機終端和傳輸帶寬的限制,純HTML文本只有少數(shù)智能機型可以支持,大多數(shù)手機只識別WAP協(xié)議標記的語言,如WML或xHTML。但是,網(wǎng)絡(luò)信息主要以HTML語言表達,WAP的資源有限,單純以爬取WAP頁面作為信息來源的移動搜索引擎無法提供足夠的信息。因此,如何能突破限制,使手機客戶也能搜索到來源于HTML的海量信息,成為移動搜索的主要問題之一。對于使用手機瀏覽HTML頁面,一般的方法是加入一個WAP網(wǎng)關(guān),當手機發(fā)出瀏覽HTML網(wǎng)頁的請求時,由網(wǎng)關(guān)首先讀取該網(wǎng)頁,并將其轉(zhuǎn)化成相應(yīng)的WML,再發(fā)送到手機。這種方式也是當前將通用搜索引擎擴展為移動搜索引擎的流行方式。但是這種實時翻譯的方式,顯然對網(wǎng)關(guān)的性能和帶寬要求較高。[0003]本發(fā)明針對移動搜索引擎的現(xiàn)狀,在現(xiàn)有互聯(lián)網(wǎng)搜索引擎的框架上加入移動模塊,提出一種利用HTML資源建立移動搜索引擎的方式,該方式通過集中處理網(wǎng)絡(luò)蜘蛛抓取的HTML網(wǎng)頁,對網(wǎng)絡(luò)蜘蛛抓取的HTML網(wǎng)頁進行翻譯處理,將其翻譯成WML形式的網(wǎng)頁快照,生成WML語言的網(wǎng)頁快照,滿足用戶的移動搜索需求。以該技術(shù)建立的移動搜索引擎,不需要實時翻譯網(wǎng)關(guān)的支持,可以方便的擴展已有的搜索引擎系統(tǒng)。在實際應(yīng)用中,使用這種方式成功的建立了一個面向生活服務(wù)領(lǐng)域的移動搜索引擎,覆蓋全國近四十個城市的餐飲、娛樂和黃頁信息?!?br/>發(fā)明內(nèi)容】[0004]根據(jù)移動搜索引擎的現(xiàn)狀,提出一種移動搜索引擎優(yōu)化方法,包括以下步驟:[0005]A、設(shè)計移動搜索引擎框架[0006]包括以下步驟:本搜索引擎框架也是由搜索器、索引器、檢索器、用戶接口四個部分組成,還具有移動模塊,作為移動搜索引擎,[0007]它包括三個部分:[0008]翻譯器,將蜘蛛抓取的HTML頁轉(zhuǎn)化為WML頁;[0009]WML網(wǎng)頁快照庫,保存轉(zhuǎn)化后的WML頁;[0010]WAP接口,用手機訪問的用戶界面;[0011]B、建立URL列表[0012]將抓取到的網(wǎng)頁存入網(wǎng)頁庫,并將網(wǎng)頁上的所有超鏈接存入到URL列表中;[0013]C、編輯翻譯器[0014]翻譯器具有網(wǎng)頁過濾、主題信息過濾和翻譯三個部分;[0015]C.1網(wǎng)頁過濾[0016]首先將目錄頁面過濾,不予翻譯,根據(jù)網(wǎng)頁的文本節(jié)點數(shù)與鏈接數(shù)的比例,來劃分頁面的性質(zhì),存入索引庫;[0017]C.2主題信息過濾[0018]提取網(wǎng)頁的主題相關(guān)部分,選擇不依賴于信息源的STU-DOM的樹模型,[0019]將網(wǎng)頁的table、tr、div和tbody標簽結(jié)點作為分塊結(jié)點,對于一個塊的取舍用局部相關(guān)度LocalCorrelativity)和上下文相關(guān)度ContextualCorrelativity來衡量;局部相關(guān)度由塊內(nèi)鏈接和內(nèi)容決定,其計算公式可以表達為:[0020]【權(quán)利要求】1.一種移動搜索引擎優(yōu)化方法,其特征在于:包括以下步驟:A、設(shè)計移動搜索引擎框架包括以下步驟:本搜索引擎框架也是由搜索器、索引器、檢索器、用戶接口四個部分組成,還具有移動模塊,作為移動搜索引擎,它包括三個部分:翻譯器,將蜘蛛抓取的HTML頁轉(zhuǎn)化為WML頁;WML網(wǎng)頁快照庫,保存轉(zhuǎn)化后的WML頁;WAP接口,用手機訪問的用戶界面;B、建立URL列表將抓取到的網(wǎng)頁存入網(wǎng)頁庫,并將網(wǎng)頁上的所有超鏈接存入到URL列表中;C、編輯翻譯器翻譯器具有網(wǎng)頁過濾、主題信息過濾和翻譯三個部分;C.1網(wǎng)頁過濾首先將目錄頁面過濾,不予翻譯,根據(jù)網(wǎng)頁的文本節(jié)點數(shù)與鏈接數(shù)的比例,來劃分頁面的性質(zhì),存入索引庫;C.2主題信息過濾提取網(wǎng)頁的主題相關(guān)部分,選擇不依賴于信息源的STU-DOM的樹模型,將網(wǎng)頁的table、tr、div和tbody標簽結(jié)點作為分塊結(jié)點,對于一個塊的取舍用局部相關(guān)度LocalCorrelativity)和上下文相關(guān)度ContextualCorrelativity來衡量;局部相關(guān)度由塊內(nèi)鏈接和內(nèi)容決定,其計算公式可以表達為:【文檔編號】G06F17/30GK103838797SQ201210491498【公開日】2014年6月4日申請日期:2012年11月27日優(yōu)先權(quán)日:2012年11月27日【發(fā)明者】李勇,鄭世超申請人:大連靈動科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1