專利名稱:多層錨點(diǎn)提取方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及手機(jī)領(lǐng)域,尤其涉及手機(jī)短信的多層錨點(diǎn)提取技術(shù)。
技術(shù)背景當(dāng)前,大多數(shù)的手機(jī)用戶都會(huì)使用手機(jī)來發(fā)送短信息,手機(jī)的 短信息服務(wù)傳遞及時(shí),方便靈活,即可傳情達(dá)意,也能聯(lián)絡(luò)通知, 還能對(duì)重要信息保存?zhèn)浒?,因而深受人們的喜愛。?xí)慣用短信息的 人都知道,能夠輕松地將信息發(fā)送者的手機(jī)號(hào)碼以及短信息中包含 的電話號(hào)碼保存到自己話機(jī)的通訊錄中,方便地保存短信中包含的Email地址或者向其發(fā)送Email,甚至對(duì)短信內(nèi)容中包含的URL地 址進(jìn)行快速連接和保存書簽等操作。通常,基于錨點(diǎn)提取的提取電話號(hào)碼、Email地址、URL地址 可以分為三部分內(nèi)容提取、聚焦高亮顯示和使用聚焦項(xiàng)。內(nèi)容提取作為錨點(diǎn)提取的核心部分,主要是通過掃描整個(gè)短信 字符,結(jié)合RFC規(guī)范(規(guī)定電子郵件的標(biāo)準(zhǔn)格式的RFC 822 -Standard for the format of ARPA Internet text messages,以及規(guī)定統(tǒng)一 資源才示i口、才尋的RFC 2396 - Uniform Resource Identifiers (URI): Generic Syntax.)中相應(yīng)的(電i舌號(hào)碼、Email和URL地址)_浯法 規(guī)則對(duì)其中的有效字符串進(jìn)行提取,并以某種方式存儲(chǔ)提取結(jié)果。聚焦高亮顯示則根據(jù)讀取到的提取結(jié)果,在手機(jī)閱讀接收短信界面中,判斷相應(yīng)的內(nèi)容(電話號(hào)碼、Email地址和URL地址)的 起始和終點(diǎn)位置,對(duì)該部分內(nèi)容聚焦并高亮顯示,〗吏用戶可以選擇 是否對(duì)該內(nèi)容進(jìn)行操作以及如何操作。同時(shí)要實(shí)現(xiàn)在多項(xiàng)可選內(nèi)容 之間切換,如短信內(nèi)容中包含多個(gè)電話號(hào)碼以及Email地址和URL 地址,則用戶可對(duì)每條內(nèi)容進(jìn)行操作, 一般由方向鍵按照順序?qū)崿F(xiàn) 前后切換。使用聚焦項(xiàng)是指手機(jī)通過平臺(tái)的菜單功能對(duì)用戶按鍵觸發(fā)的事 件做出反應(yīng),實(shí)現(xiàn)對(duì)聚焦內(nèi)容的具體操作。用戶通過功能鍵調(diào)用可 選的操作項(xiàng),通過方向鍵選擇要進(jìn)行的操作,如對(duì)電話號(hào)碼進(jìn)行呼 叫、保存、發(fā)送短信、發(fā)送彩信等操作,對(duì)Email地址進(jìn)行保存和 發(fā)送mail等操作,對(duì)URL地址進(jìn)行連接和保存書簽等操作。目前大多數(shù)手機(jī)都實(shí)現(xiàn)了錨點(diǎn)提取的功能。然而效果并不盡人 意,究其原因主要是對(duì)提取規(guī)則理解單一、沒有容錯(cuò)機(jī)制和智能化 程度不夠。短信內(nèi)容是由用戶編輯的,在編輯過程中每個(gè)人習(xí)慣又 有所不同。尤其在短信中同時(shí)包含電話號(hào)碼、Email地址和URL地 址時(shí),三者之間、甚至是同一類型的兩條提取內(nèi)容之間都有可能存 在著重疊交叉的現(xiàn)象。比如URL中包含類似電話號(hào)碼的數(shù)字串、 Email地址中包含類似URL地址的后綴等等。因此,需要一種多層錨點(diǎn)提取的解決方案,能夠解決上述相關(guān) 技術(shù)中的問題。發(fā)明內(nèi)容本發(fā)明旨在在錨點(diǎn)提取的基礎(chǔ)上,實(shí)現(xiàn)容錯(cuò)機(jī)制,對(duì)出現(xiàn)交叉 提取的內(nèi)容進(jìn)行智能判斷,盡可能多的提取內(nèi)容供用戶選擇使用。根據(jù)本發(fā)明的一個(gè)方面,提供了一種多層錨點(diǎn)提取方法,包括以下步驟步驟一,掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信息; 步驟二,根據(jù)提取的信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表,并將信息存 儲(chǔ)到一個(gè)或多個(gè)鏈表中;以及步驟三,判斷信息之間是否有重疊部 分,并根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整 合為至少一個(gè)鏈表。步驟三包括以下步驟如果判斷出信息之間沒有重疊,則根據(jù) 預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表,否則,根 據(jù)預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整合為多于一個(gè)鏈表。步驟三還包括以下步驟將具有彼此相互重疊部分的信息分別 存儲(chǔ)到多于 一個(gè)鏈表中的不同鏈表中;以及根據(jù)預(yù)定的算法確定提 取的信息是否為非法提取信息,如果是,則將其刪除。上述方法還包4舌以下步-驟確定至少一個(gè)鏈表的顯示順序;以 及按照確定的順序顯示存儲(chǔ)在至少 一個(gè)鏈表中的所提取的信息。預(yù)定的提取規(guī)則包括容錯(cuò)機(jī)制,信息包括地址信息,以及地址 4言息的類型包4舌電i舌號(hào)石馬、Email i也址、和URL ;也址。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種多層錨點(diǎn)提取裝置,包 括提取模塊,用于掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信息; 鏈表創(chuàng)建及存儲(chǔ)模塊,根據(jù)提取的信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表, 并將信息存儲(chǔ)到 一個(gè)或多個(gè)鏈表中;以及判斷整合模塊,判斷信息 之間是否有重疊部分,并根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則將 一個(gè)或多個(gè)鏈表整合為至少 一 個(gè)鏈表。鏈表創(chuàng)建及存儲(chǔ)模塊包括鏈表創(chuàng)建單元,用于根據(jù)提取的信 息的類型創(chuàng)建一個(gè)或多個(gè)鏈表;以及存儲(chǔ)單元,用于將提取的信息 存儲(chǔ)到一個(gè)或多個(gè)鏈表中。7判斷整合模塊包括判斷單元,用于判斷信息之間是否有重疊 部分;以及整合單元,用于根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則 將一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表。本發(fā)明為簡(jiǎn)單、快速、全面、靈活地提取短信內(nèi)容中的電話號(hào) 碼、Email地址和URL地址l是供了 一種有效的途徑。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的i兌明書中闡述,并且,部 分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā) 明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附 圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
此處所說明的附圖用來4是供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申 請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并 不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的多層錨點(diǎn)提取方法的流程圖;圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的多層錨點(diǎn)提取裝置的框圖;以及圖3示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的多層錨點(diǎn)提取方法的流 程圖。
具體實(shí)施方式
下面將結(jié)合附圖來詳細(xì)說明本發(fā)明的實(shí)施例。圖1示出了根據(jù)本發(fā)明實(shí)施例的多層錨點(diǎn)提取方法的流程圖。參照?qǐng)D1,根據(jù)本發(fā)明實(shí)施例的多層錨點(diǎn)提取方法包括以下步驟 步驟S102,掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信息;步驟S104, 根據(jù)提取的信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表,并將信息存儲(chǔ)到一個(gè) 或多個(gè)鏈表中;以及步驟S106,判斷信息之間是否有重疊部分,并 根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整合為至 少一個(gè)鏈表。步驟S106包括以下步驟如果判斷出信息之間沒有重疊,則 根據(jù)預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整合為至少 一個(gè)鏈表,否則, 根據(jù)預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整合為多于一個(gè)鏈表。步驟S106還包括以下步驟將具有彼此相互重疊部分的信息 分別存儲(chǔ)到多于一個(gè)鏈表中的不同鏈表中;以及根據(jù)預(yù)定的算法確 定提取的信息是否為非法提取信息,如果是,則將其刪除。上述方法還包4舌以下步駛《確定至少一個(gè)鏈表的顯示順序;以 及按照確定的順序顯示存儲(chǔ)在至少 一個(gè)鏈表中的所提取的信息。預(yù)定的提取規(guī)則包括容錯(cuò)機(jī)制,信息包括地址信息,以及地址 信息的類型包括電話號(hào)碼、Email地址、和URL地址。圖2示出了根據(jù)本發(fā)明實(shí)施例的多層錨點(diǎn)提取裝置的框圖。參 照?qǐng)D2,根據(jù)本發(fā)明實(shí)施例的多層錨點(diǎn)提取裝置200包括提取模 塊202,用于掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信息;鏈表創(chuàng) 建及存儲(chǔ)模塊204,根據(jù)提取的信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表, 并將信息存儲(chǔ)到一個(gè)或多個(gè)鏈表中;以及判斷整合模塊206,判斷 信息之間是否有重疊部分,并根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī) 則將一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表。鏈表創(chuàng)建及存儲(chǔ)模塊204包括鏈表創(chuàng)建單元,用于根據(jù)提取 的信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表;以及存儲(chǔ)單元,用于將提取的 信息存儲(chǔ)到一個(gè)或多個(gè)鏈表中。判斷整合才莫塊206包括判斷單元,用于判斷信息之間是否有 重疊部分;以及整合單元,用于根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合 頭見則將一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表。下面參照?qǐng)D3來詳細(xì)描述本發(fā)明的另一個(gè)實(shí)施例。本實(shí)施例的多層錨點(diǎn)提取的方法包括以下步驟步驟S302,定義電話號(hào)碼、Email地址和URL地址的提取規(guī)則, 有效字符及字符段(參考前文所述的RFC規(guī)范);步驟S304,分別才艮據(jù)電話號(hào)碼、Email地址和URL地址的語法 掃描整個(gè)短信文本,提取相應(yīng)內(nèi)容,生成對(duì)應(yīng)的鏈表;步驟S306,整合生成的三個(gè)鏈表,4艮據(jù)整合頭見則刪除可確定的 非法提耳又;步驟S308, 一艮據(jù)鏈表的交叉結(jié)構(gòu),確定并組合分層顯示結(jié)構(gòu);以及步驟S310,對(duì)菜單中use highlight的管理和控制。實(shí)施例的主要包含兩部分, 一是提耳又電話號(hào)碼、Email地址和 URL地址并生成對(duì)應(yīng)的鏈表;二是對(duì)鏈表進(jìn)行整合,使之合理的組 合并顯示給用戶。在該實(shí)施例中,對(duì)提取內(nèi)容按照單鏈表的方式存儲(chǔ),而三種不 同內(nèi)容是分別提取的。提取的過程主要是逐字符掃描,按照對(duì)應(yīng)的語法進(jìn)行判別。如果確定一個(gè)字符串是要提取的內(nèi)容,則在鏈表中 創(chuàng)建一個(gè)新的節(jié)點(diǎn),節(jié)點(diǎn)包含類型、起點(diǎn)、長(zhǎng)度、內(nèi)容等信息。鏈 表頭節(jié)點(diǎn)則包含整個(gè)鏈表中節(jié)點(diǎn)個(gè)數(shù)、起始節(jié)點(diǎn)、終止節(jié)點(diǎn)等信息。 鏈表中各個(gè)節(jié)點(diǎn)按照其起點(diǎn)在短信中出現(xiàn)的順序進(jìn)行排序,以便鏈 表整合以及用戶根據(jù)方向鍵順序聚焦顯示。鏈表的整合主要是針對(duì)不同鏈表或者同一鏈表中內(nèi)容的交叉情況而設(shè)計(jì)的,也就是說經(jīng)過提取,電話號(hào)碼跟URL地址可能是有重 疊部分的,同樣電話號(hào)碼跟Email地址之間、Email地址跟URL地 址之間也可能存在著重疊部分。舉例而言,比如說一個(gè)長(zhǎng)8位的數(shù)字串出現(xiàn)在一個(gè)URL地址中,在電話號(hào)碼沖是取時(shí)這8位的數(shù)字串作 為一個(gè)電話號(hào)碼提取出來,而在URL提取使包含這8位數(shù)字串的整 個(gè)字符串又作為 一個(gè)URL地址提取出來,于是生成的電話號(hào)碼鏈表 跟URL鏈表就有重疊部分。目前大多數(shù)手機(jī)都是按照某個(gè)優(yōu)先級(jí)進(jìn) 行取舍,比如默認(rèn)URL的提取級(jí)別高于電話號(hào)碼,則這8位的數(shù)字 串就不作為電話號(hào)碼使用,僅僅是當(dāng)作URL的一部分。然而這種才是 取顯然并不能滿足用戶的要求,因?yàn)橛脩艨赡苄枰@8位字符串作 為一個(gè)電話號(hào)碼存4諸起來的。本系統(tǒng)采用的鏈表整合方式既按照設(shè) 計(jì)好的整合規(guī)則,對(duì)三個(gè)提取鏈表進(jìn)行整合,根據(jù)鏈表結(jié)構(gòu)的特點(diǎn) 最終生成一條或者兩條鏈表,包含所有對(duì)用戶來說可能是有用信息 的提取內(nèi)容,并且每個(gè)鏈表中沒有節(jié)點(diǎn)在位置上的重疊交叉。菜單中use highlight選項(xiàng)需要根據(jù)最終生成的鏈表個(gè)數(shù)增加相 應(yīng)的菜單項(xiàng)。對(duì)于一條鏈表的情況,按照鏈表中內(nèi)容的先后順序高 亮顯示對(duì)應(yīng)的內(nèi)容,方向4建控制向前或向后選4奪,用戶可以對(duì)某個(gè) 需要使用的內(nèi)容進(jìn)行use highlight操作。對(duì)于兩條鏈表的情況,首 先4姿照連表中內(nèi)容的先后順序高亮顯示對(duì)應(yīng)內(nèi)容,當(dāng)用戶通過方向 鍵瀏覽整個(gè)短信文本沒有發(fā)現(xiàn)自己想要聚焦的內(nèi)容時(shí),可以通過菜 單選擇第二條鏈表進(jìn)行瀏覽,如同第一條鏈表一樣,按照順序進(jìn)行高亮顯示,方向鍵控制向前或向后瀏覽,遇到需要使用的內(nèi)容即可做use highlight操作。綜上所述,本實(shí)施例主要分為兩大塊提取內(nèi)容生成鏈表,整 合鏈表。其中才是取內(nèi)容采用RFO見范并通過掃描短信內(nèi)容對(duì)電話號(hào) 碼、Email地址、URL地址進(jìn)行提取,整合鏈表則是對(duì)提取出的內(nèi) 容進(jìn)行準(zhǔn)確的容錯(cuò)處理以及重疊內(nèi)容的完整顯示。通過采用以上的 才支術(shù),本發(fā)明實(shí)現(xiàn)對(duì)短信中電話號(hào)碼、Email地址和URL地址的快 速、全面、靈活提取,并在閱讀短信的用戶界面合理地顯示所有提 取到的內(nèi)容,極大地方便了用戶對(duì)提取內(nèi)容的操作。本發(fā)明為簡(jiǎn)單、快速、全面、靈活地提取短信內(nèi)容中的電話號(hào) 碼、Email地址和URL地址提供了一種有效的途徑。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明, 對(duì)于本領(lǐng)域的才支術(shù)人員來i兌,本發(fā)明可以有各種更改和變化。凡在 本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等, 均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種多層錨點(diǎn)提取方法,其特征在于,包括以下步驟步驟一,掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信息;步驟二,根據(jù)提取的所述信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表,并將所述信息存儲(chǔ)到所述一個(gè)或多個(gè)鏈表中;以及步驟三,判斷所述信息之間是否有重疊部分,并根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則將所述一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟三包括以 下步驟如果判斷出所述信息之間沒有重疊,則根據(jù)所述預(yù)定的整 合規(guī)則將所述一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表,否則,才艮 據(jù)所述預(yù)定的整合夫見則將所述一個(gè)或多個(gè)《連表整合為多于一 個(gè)鏈表。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟三還包括 以下步驟將具有^:此相互重疊部分的所述信息分別存儲(chǔ)到所述多 于一個(gè)鏈表中的不同鏈表中。
4. 才艮據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟三還包括 以下步驟根據(jù)預(yù)定的算法確定提取的所述信息是否為非法提取信 息,如果是,則將其刪除。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括以下步驟確定所述至少一個(gè)鏈表的顯示順序;以及按照確定的順序顯示存儲(chǔ)在所述至少一個(gè)4連表中的所4是 取的信息。
6. 根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其特征在于,所述 預(yù)定的提取規(guī)則包括容錯(cuò)機(jī)制。
7. 才艮據(jù)斥又利要求1至5中任一項(xiàng)所述的方法,其特征在于,所述 信息包括地址信息。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述地址信息的類 型包括電話號(hào)碼、Email地址、和URL地址。
9. 一種多層錨點(diǎn)提取裝置,其特征在于,包括提取模塊,用于掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信自、'鏈表創(chuàng)建及存儲(chǔ)模塊,根據(jù)提取的所述信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表,并將所述信息存儲(chǔ)到所述一個(gè)或多個(gè)鏈表中; 以及判斷整合模塊,判斷所述信息之間是否有重疊部分,并根 據(jù)判斷結(jié)果以及才艮據(jù)預(yù)定的整合^L則將所述一個(gè)或多個(gè)鏈表 整合為至少一個(gè)鏈表。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述鏈表創(chuàng)建及存 儲(chǔ)模塊包括鏈表創(chuàng)建單元,用于根據(jù)提取的所述信息的類型創(chuàng)建一個(gè) 或多個(gè)鏈表;以及存儲(chǔ)單元,用于將提取的所述信息存儲(chǔ)到所述一個(gè)或多個(gè) 鏈表中。
11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述判斷整合模塊包括判斷單元,用于判斷所述信息之間是否有重疊部分;以及整合單元,用于根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則將 所述一個(gè)或多個(gè)鏈表整合為至少 一個(gè)鏈表。
全文摘要
本發(fā)明公開了多層錨點(diǎn)提取方法及裝置,該方法包括以下步驟步驟一,掃描短消息文本并根據(jù)預(yù)定的規(guī)則提取信息;步驟二,根據(jù)提取的信息的類型創(chuàng)建一個(gè)或多個(gè)鏈表,并將信息存儲(chǔ)到一個(gè)或多個(gè)鏈表中;以及步驟三,判斷信息之間是否有重疊部分,并根據(jù)判斷結(jié)果以及根據(jù)預(yù)定的整合規(guī)則將一個(gè)或多個(gè)鏈表整合為至少一個(gè)鏈表。本發(fā)明為簡(jiǎn)單、快速、全面、靈活地提取短信內(nèi)容中的電話號(hào)碼、Email地址和URL地址提供了一種有效的途徑。
文檔編號(hào)H04Q7/22GK101247603SQ20081008409
公開日2008年8月20日 申請(qǐng)日期2008年3月26日 優(yōu)先權(quán)日2008年3月26日
發(fā)明者敏 蔣, 丹 薛, 斌 陳 申請(qǐng)人:中興通訊股份有限公司