一種網(wǎng)頁內容轉換彩信的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種網(wǎng)頁內容轉換彩信的方法及裝置,其中,該裝置包括:分析提取模塊,用于對網(wǎng)頁內容進行語義分析,根據(jù)語義分析結果提取網(wǎng)頁內容;內容填入模塊,用于對網(wǎng)頁內容中的多媒體內容進行處理,將網(wǎng)頁內容填入彩信模板的相應格式中;插入生成模塊,用于將已填入彩信模板的相應格式中的網(wǎng)頁內容插入彩信幀,生成彩信。本發(fā)明網(wǎng)頁內容轉換彩信的方法和裝置,通過源代碼語義分析,對所瀏覽的網(wǎng)頁內容進行抽取、圖片壓縮和版式定制等,按照彩信格式協(xié)議生成彩信后,通過發(fā)送彩信,將網(wǎng)頁內容發(fā)到好友的手機上,完成與好友的網(wǎng)頁內容分享。
【專利說明】一種網(wǎng)頁內容轉換彩信的方法和裝置
【技術領域】
[0001]本發(fā)明涉及通信領域中互聯(lián)網(wǎng)【技術領域】,具體地,涉及的方法及裝置。
【背景技術】
[0002]互聯(lián)網(wǎng)已成為人們獲取信息的主要來源之一,海量的信息主要通過網(wǎng)頁形式來呈現(xiàn)。
[0003]目前,網(wǎng)頁內容分享方式主要有兩大類:1)基于業(yè)務登陸賬號的分享:通過微博、即時消息軟件(飛信、MSN)等各種賬號,將內容(或者內容摘要、網(wǎng)絡鏈接)發(fā)布到自己的網(wǎng)絡空間(網(wǎng)站)與好友分享,好友可以通過訪問相關網(wǎng)頁地址來查看分享的內容。2)通過短信方式分享內容:將網(wǎng)頁內容標題、內容簡短摘要或網(wǎng)頁鏈接,通過短信方式,發(fā)給好友,好友可以通過點擊鏈接來查看網(wǎng)頁內容。
[0004]在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術中至少存在如下問題:
[0005]對于第一類方案,即通過微博、即時消息軟件(飛信、MSN)等各種賬號,將內容(或者內容摘要、網(wǎng)絡鏈接)發(fā)布到自己的網(wǎng)絡空間(網(wǎng)站)與好友分享,好友可以通過訪問相關網(wǎng)頁地址來查看分享的內容。需要啟動相關軟件或者登陸特定網(wǎng)站才能查看到分享的內容。
[0006]對于第二類方案,通過短信方式分享內容:將網(wǎng)頁內容標題、內容簡短摘要或網(wǎng)頁鏈接,通過短信方式,發(fā)給好友,好友可以通過點擊鏈接來查看網(wǎng)頁內容。由于短信字數(shù)(140個字符,70個漢字)限制、以及只能承載文本信息,而不能承載圖片,因此,一般只能分享標題、內容簡略介紹及網(wǎng)頁鏈接,而無法承載完成的網(wǎng)頁內容。
[0007]彩信能力是移動終端的基礎能力,能承載多媒體內容(文本、圖片、音頻等),接收免費等特點,使得如果能通過彩信方式分享網(wǎng)頁內容,用戶將可以隨時隨地收到并查看網(wǎng)頁全文內容,給用戶帶來更加便捷的體驗。
[0008]如果將原文的內容通過彩信的方式到達用戶的手機客戶端,則可彌補以上的不足,畢竟彩信承載的信息量多而全面,同時也可以讓用戶可以隨時隨地的接收與查看分享的信息,讓信息的分享更為便利與快捷。
【發(fā)明內容】
[0009]本發(fā)明是為了克服現(xiàn)有技術中網(wǎng)頁內容與他人分享不方便的缺陷,根據(jù)本發(fā)明的一個方面,提出一種網(wǎng)頁內容轉換彩信的方法。
[0010]根據(jù)本發(fā)明實施例的網(wǎng)頁內容轉換彩信的方法,包括:
[0011]對網(wǎng)頁內容進行語義分析,根據(jù)語義分析結果提取網(wǎng)頁內容;
[0012]經(jīng)過對網(wǎng)頁內容中的多媒體內容進行處理后,將網(wǎng)頁內容填入彩信模板的相應格式中;
[0013]將已填入彩信模板的相應格式中的網(wǎng)頁內容插入彩信幀,生成彩信。
[0014]本發(fā)明是為了克服現(xiàn)有技術中網(wǎng)頁內容與他人分享不方便的缺陷,根據(jù)本發(fā)明的另一個方面,提出一種網(wǎng)頁內容轉換彩信的裝置。
[0015]根據(jù)本發(fā)明實施例的網(wǎng)頁內容轉換彩信的裝置,包括:
[0016]分析提取模塊,用于對網(wǎng)頁內容進行語義分析,根據(jù)語義分析結果提取網(wǎng)頁內容;
[0017]內容填入模塊,用于對網(wǎng)頁內容中的多媒體內容進行處理,將網(wǎng)頁內容填入彩信模板的相應格式中;
[0018]插入生成模塊,用于將已填入彩信模板的相應格式中的所述網(wǎng)頁內容插入彩信中貞,生成彩信。
[0019]本發(fā)明網(wǎng)頁內容轉換彩信的方法和裝置,通過源代碼語義分析,對所瀏覽的網(wǎng)頁內容進行抽取、圖片壓縮和版式定制等,按照彩信格式協(xié)議生成彩信后,通過發(fā)送彩信,將網(wǎng)頁內容發(fā)到好友的手機上,完成與好友的網(wǎng)頁內容分享。
[0020]本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現(xiàn)和獲得。
[0021]下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。
【專利附圖】
【附圖說明】
[0022]附圖用來提供對本發(fā)明的進一步理解,并且構成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構成對本發(fā)明的限制。在附圖中:
[0023]圖1為現(xiàn)有技術中彩信結構示意圖;
[0024]圖2為本發(fā)明網(wǎng)頁內容轉換彩信的裝置結構示意圖。
【具體實施方式】
[0025]下面結合附圖,對本發(fā)明的【具體實施方式】進行詳細描述,但應當理解本發(fā)明的保護范圍并不受【具體實施方式】的限制。
[0026]網(wǎng)頁內容一般采用HTML腳本語言開發(fā),網(wǎng)頁內容的發(fā)布一般基于一定的網(wǎng)頁模板,該網(wǎng)頁模板對網(wǎng)頁的標題、作者、發(fā)文時間、插圖、主要內容等采用一定的標簽來標識,可以分析源代碼的標簽語義來進行內容抽取,再根據(jù)抽取的內容來生成彩信。
[0027]本發(fā)明的網(wǎng)頁內容轉換彩信的方法包括:
[0028]步驟102:新建彩信包,對網(wǎng)頁內容進行提?。?br>
[0029]一般門戶網(wǎng)站都有自己的網(wǎng)頁模板,分析網(wǎng)站的網(wǎng)頁內容的源代碼標簽,根據(jù)源代碼標簽的語義提取網(wǎng)頁內容進行說明:
[0030]步驟1022:提取標題信息;
[0031]新聞標題:id= “artibodyTitle”,在該關鍵字第一個“〉”之后,“〈”之前內容為標題息。
[0032]新聞出處:id=“art_source,,,
[0033]新聞發(fā)布時間:id=“pub_date”,
[0034]新聞作者:id=“media_name”,
[0035]正文部分:id=“artibody” ;
[0036]步驟1024:提取圖片;
[0037]關鍵字:img_wrapper,關鍵字之后的src= “…”為圖片地址,title= “…”為圖片標題,class= “img_deScr”>之后、“〈”之前的內容為圖片的描述,根據(jù)圖片地址提取圖片;
[0038]步驟1026:提取視頻/音頻;
[0039]關鍵字:flash player begin,關鍵字之后的href^‘…”中如果帶有“video, sina.com.cn”字符串,則該地址為視頻/音頻地址,之后的“視頻/音頻:...”為視頻/標題,“來源:…”為視頻/音頻內容來源。
[0040]步驟1028:提取正文:
[0041]
與</p>之間的內容為正文內容,其中一組
〈/p>代表一個段落。
[0042]步驟104:對網(wǎng)頁內容中的多媒體內容進行處理,包括:
[0043]步驟1042:圖片處理;
[0044]a、修改圖片分辨率,例如圖片寬度改為320像素,高度等比縮放;
[0045]b、壓縮圖片大小,例如將圖片大小壓縮到30k以下;
[0046]步驟1044:音頻處理;
[0047]a.音頻格式轉換:例如可將音頻轉換成amr等彩信支持的格式;
[0048]b.壓縮音頻大小:將音頻大小壓縮到30k以下;
[0049]如果音頻文件太大,例如大于3MB,記錄音頻文件的鏈接地址、標題信息和描述信息,將鏈接地址、標題信息和描述信息作為彩信正文內容處理。
[0050]步驟1046:視頻處理;
[0051]記錄視頻文件的鏈接地址、標題信息和描述信息,將鏈接地址、標題信息和描述信息作為彩信正文內容處理。
[0052]步驟106:將網(wǎng)頁內容填入彩信模板的相應格式中;
[0053]如圖1所示,現(xiàn)有的彩信結構包括彩信頭(MMS headers)和彩信體(MMS body)兩大部分,其最大特點在于支持多媒體功能,能夠傳遞功能全面的內容和信息,包括文字、圖像、聲音和數(shù)據(jù)等各種格式的信息。
[0054]在步驟106中,將步驟102中提取的標題、圖片、音頻、視頻和正文等信息分別填入相應格式中。
[0055]步驟108:將已填入彩信模板的相應格式中的網(wǎng)頁內容插入彩信幀,生成彩信向用戶下發(fā)。
[0056]如果是正文內容,插入彩信中文字幀,如果是插圖,插入彩信圖片幀,如果是音頻,插入彩信音頻幀,如果是視頻,插入彩信視頻幀。
[0057]彩信大小一般要求在300KB以內,超過300KB,可拆分成若干條彩信,標題等基本信息不變。
[0058]本發(fā)明網(wǎng)頁內容轉換彩信的方法,通過源代碼語義分析,對所瀏覽的網(wǎng)頁內容進行抽取、圖片壓縮和版式定制等,按照彩信格式協(xié)議生成彩信后,通過發(fā)送彩信,將網(wǎng)頁內容發(fā)到好友的手機上,完成與好友的網(wǎng)頁內容分享。
[0059]如圖2所示,本發(fā)明公開了一種網(wǎng)頁內容轉換彩信的裝置,包括:
[0060]分析提取模塊10,用于對網(wǎng)頁內容進行語義分析,根據(jù)語義分析結果提取網(wǎng)頁內容;[0061 ] 內容填入模塊20,用于對網(wǎng)頁內容中的多媒體內容進行處理,將網(wǎng)頁內容填入彩信模板的相應格式中;
[0062]插入生成模塊30,用于將已填入彩信模板的相應格式中的網(wǎng)頁內容插入彩信幀,生成彩信。
[0063]其中:分析提取模塊10包括:
[0064]標簽分析子模塊11,用于分析網(wǎng)頁內容的源代碼標簽;
[0065]內容提取子模塊12,用于根據(jù)標簽的語義提取網(wǎng)頁內容。
[0066]其中:內容填入模塊20包括:
[0067]圖片處理子模塊21,用于修改圖片分辨率和壓縮圖片大?。?br>
[0068]音頻處理子模塊22,用于轉換音頻格式和壓縮音頻大??;
[0069]視頻處理子模塊23,用于記錄視頻的鏈接地址、標題信息和描述信息,將鏈接地址、標題信息和描述信息作為彩信正文內容處理。
[0070]其中:
[0071]音頻處理子模塊22,具體用于如果音頻文件大小大于設定數(shù)值,記錄音頻文件的鏈接地址、標題信息和描述信息,將所述鏈接地址、標題信息和描述信息作為彩信正文內容處理。
[0072]其中:
[0073]內容提取子模塊12,具體用于根據(jù)新聞標題、新聞出處、新聞發(fā)布時間和新聞作者提取標題息;
[0074]內容提取子模塊12,具體用于根據(jù)關鍵字、圖片地址、圖片標題和圖片描述信息提取圖片。
[0075]本發(fā)明網(wǎng)頁內容轉換彩信的裝置,通過源代碼語義分析,對所瀏覽的網(wǎng)頁內容進行抽取、圖片壓縮和版式定制等,按照彩信格式協(xié)議生成彩信后,通過發(fā)送彩信,將網(wǎng)頁內容發(fā)到好友的手機上,完成與好友的網(wǎng)頁內容分享。
[0076]本發(fā)明能有多種不同形式的【具體實施方式】,上面以圖1-圖2為例結合附圖對本發(fā)明的技術方案作舉例說明,這并不意味著本發(fā)明所應用的具體實例只能局限在特定的流程或實施例結構中,本領域的普通技術人員應當了解,上文所提供的具體實施方案只是多種優(yōu)選用法中的一些示例,任何體現(xiàn)本發(fā)明權利要求的實施方式均應在本發(fā)明技術方案所要求保護的范圍之內。
[0077]最后應說明的是:以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,盡管參照前述實施例對本發(fā)明進行了詳細的說明,對于本領域的技術人員來說,其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換。凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。
【權利要求】
1.一種網(wǎng)頁內容轉換彩信的方法,其特征在于,包括: 對網(wǎng)頁內容進行語義分析,根據(jù)所述語義分析結果提取網(wǎng)頁內容; 經(jīng)過對所述網(wǎng)頁內容中的多媒體內容進行處理后,將所述網(wǎng)頁內容填入彩信模板的相應格式中; 將已填入彩信模板的相應格式中的所述網(wǎng)頁內容插入彩信幀,生成彩信。
2.根據(jù)權利要求1所述的方法,其特征在于,所述對網(wǎng)頁內容進行語義分析,根據(jù)所述語義分析結果提取網(wǎng)頁內容的步驟包括: 分析所述網(wǎng)頁內容的源代碼標簽,根據(jù)所述標簽的語義提取網(wǎng)頁內容; 所述網(wǎng)頁內容包括:標題信息、圖片信息、音視頻信息和正文信息。
3.根據(jù)權利要求1或2所述的方法,其特征在于,所述多媒體內容的處理步驟包括:圖片處理、音頻處理和視頻處理; 所述圖片處理包括:修改圖片分辨率和壓縮圖片大小; 所述音頻處理包括:轉換音頻格式和壓縮音頻大??; 所述視頻處理包括:記錄視頻的鏈接地址、標題信息和描述信息,將所述鏈接地址、標題信息和描述信息作為彩信正文內容處理。
4.根據(jù)權利要求3所述的方法,其特征在于,如果所述音頻文件大小大于設定數(shù)值,記錄音頻文件的鏈接地址、標題信息和描述信息,將所述鏈接地址、標題信息和描述信息作為彩信正文內容處理。
5.根據(jù)權利要求2所述的方法,其特征在于,所述標題信息提取的步驟包括:根據(jù)新聞標題、新聞出處、新聞發(fā)布時間和新聞作者提取標題信息; 所述圖片提取的步驟包括:根據(jù)關鍵字、圖片地址、圖片標題和圖片描述信息提取圖片。
6.一種網(wǎng)頁內容轉換彩信的裝置,其特征在于,包括: 分析提取模塊,用于對網(wǎng)頁內容進行語義分析,根據(jù)所述語義分析結果提取網(wǎng)頁內容; 內容填入模塊,用于對所述網(wǎng)頁內容中的多媒體內容進行處理,將所述網(wǎng)頁內容填入彩信模板的相應格式中; 插入生成模塊,用于將已填入彩信模板的相應格式中的所述網(wǎng)頁內容插入彩信幀,生成彩信。
7.根據(jù)權利要求6所述的裝置,其特征在于,所述分析提取模塊包括: 標簽分析子模塊,用于分析所述網(wǎng)頁內容的源代碼標簽; 內容提取子模塊,用于根據(jù)所述標簽的語義提取網(wǎng)頁內容。
8.根據(jù)權利要求6或7所述的裝置,其特征在于,所述內容填入模塊包括: 圖片處理子模塊,用于修改圖片分辨率和壓縮圖片大?。? 音頻處理子模塊, 用于轉換音頻格式和壓縮音頻大?。? 視頻處理子模塊,用于記錄視頻的鏈接地址、標題信息和描述信息,將所述鏈接地址、標題信息和描述信息作為彩信正文內容處理。
9.根據(jù)權利要求8所述的裝置,其特征在于, 所述音頻處理子模塊,具體用于如果所述音頻文件大小大于設定數(shù)值,記錄音頻文件的鏈接地址、標題信息和描述信息,將所述鏈接地址、標題信息和描述信息作為彩信正文內容處理。
10.根據(jù)權利要求7所述的裝置,其特征在于, 所述內容提取子模塊,具體用于根據(jù)新聞標題、新聞出處、新聞發(fā)布時間和新聞作者提取標題息; 所述內容提取子模塊,具體用于根據(jù)關鍵字、圖片地址、圖片標題和圖片描述信息提取 圖片。
【文檔編號】G06F17/30GK104077323SQ201310108973
【公開日】2014年10月1日 申請日期:2013年3月29日 優(yōu)先權日:2013年3月29日
【發(fā)明者】程寶平 申請人:中國移動通信集團公司