電話號碼串中包含指定的分隔符,則按照該分隔符切分原始待識別 電話號碼串,得到切分后的至少兩個目標待識別電話號碼串。
[0184] 在本發(fā)明一實施例中,指定的分隔符包括下列至少之一:頓號、逗號、分號、斜杜、 反斜杠、豎桿。
[0185] 在本發(fā)明一實施例中,預處理單元還適于:
[0186] 在得到切分后的至少兩個目標待識別電話號碼串之后,對于各個目標待識別電話 號碼串,確定該目標待識別電話號碼串的頭部是否具有國家區(qū)號;
[0187] 若是,則去除該目標待識別電話號碼串頭部的國家區(qū)號。
[0188] 在本發(fā)明一實施例中,預處理單元還適于:
[0189] 在去除該目標待識別電話號碼串頭部的國家區(qū)號之后,分析去除了國家區(qū)號之后 的目標待識別電話號碼串;
[0190] 若目標待識別電話號碼串的頭部具有地區(qū)區(qū)號且該地區(qū)區(qū)號不完整,則補充該地 區(qū)區(qū)號使其完整;
[0191] 若目標待識別電話號碼串的頭部具有地區(qū)區(qū)號且該地區(qū)區(qū)號重復,則對該地區(qū)區(qū) 號進行去重處理。
[0192] 在本發(fā)明一實施例中,如圖4所示,圖3展示的裝置還可以包括獲取模塊360,與劃 分模塊310相耦合,適于通過以下步驟獲取目標待識別電話號碼串:
[0193] 從網(wǎng)頁中獲取興趣點Ρ0Ι信息;
[0194] 從Ρ0Ι信息中提取目標待識別電話號碼串。
[0195] 在本發(fā)明一實施例中,如圖4所示,圖3展示的裝置還可以包括:
[0196] 遞歸模塊370,與補全模塊350相耦合,適于若存在剩余的待識別電話號碼串,則 觸發(fā)預處理單元再次執(zhí)行預處理操作、劃分模塊再次執(zhí)行劃分操作、判斷模塊再次執(zhí)行判 斷操作、確定模塊再次執(zhí)行確定操作、切分模塊再次執(zhí)行切分操作以及補全模塊再次執(zhí)行 補全操作,直至剩余的待識別電話號碼串被全部識別完。
[0197] 根據(jù)上述任意一個優(yōu)選實施例或多個優(yōu)選實施例的組合,本發(fā)明實施例能夠達到 如下有益效果:
[0198] 在本發(fā)明實施例中,從初始位置起,根據(jù)符合電話號碼格式的劃分規(guī)則對目標待 識別電話號碼串進行劃分,即結(jié)合不同類別的電話號碼(如固定電話或移動電話等)具有 的特征,采用不同類別的電話號碼對應的電話號碼格式的劃分規(guī)則對目標待識別電話號碼 串進行劃分,根據(jù)劃分得到的第一指定位數(shù)的號碼串識別出其對應的電話號碼的類別,實 現(xiàn)對不同類別的電話號碼的有效識別。進一步,本發(fā)明實施例結(jié)合同一個電話單元中的兩 個固定電話或移動電話有很大的相似性的特點,根據(jù)第一類別電話號碼的屬性特征,確定 至少兩個探測位數(shù),隨后采用后向探測位數(shù)判定的方案,對目標待識別電話號碼串進行探 測、識別,進一步提高了電話號碼識別的準確性。
[0199] 另外,本發(fā)明實施例在根據(jù)符合電話號碼格式的劃分規(guī)則對目標待識別電話號碼 串進行劃分之前,還可以對目標待識別電話號碼串進行與電話號碼格式相關(guān)的預處理操 作,使得預處理操作后的目標待識別電話號碼串與電話號碼格式一致,以便于后續(xù)基于預 處理操作后的目標待識別電話號碼串進行電話號碼的識別,提高電話號碼的識別率。
[0200] 在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施 例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu) 和技術(shù),以便不模糊對本說明書的理解。
[0201] 類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在 上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施 例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保 護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面 的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此, 遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身 都作為本發(fā)明的單獨實施例。
[0202] 本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應性地 改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中。可以把實施例中的模塊或單 元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或 子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任 何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開 的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴 隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代 特征來代替。
[0203] 此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例 中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的 范圍之內(nèi)并且形成不同的實施例。例如,在權(quán)利要求書中,所要求保護的實施例的任意之一 都可以以任意的組合方式來使用。
[0204] 本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行 的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應當理解,可以在實踐中使用 微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的電話號碼的識別裝置中 的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方 法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣 的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形 式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形 式提供。
[0205] 應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng) 域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中, 不應將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞"包含"不排除存在 未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞"一"或"一個"不排除存在多個這 樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來 實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件 項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為 名稱。
[0206] 至此,本領(lǐng)域技術(shù)人員應認識到,雖然本文已詳盡示出和描述了本發(fā)明的多個示 例性實施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接 確定或推導出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應被理解和認 定為覆蓋了所有這些其他變型或修改。
[0207] 本發(fā)明實施例還公開了:A1、一種電話號碼的識別方法,包括:
[0208] 從初始位置起,根據(jù)符合電話號碼格式的劃分規(guī)則對目標待識別電話號碼串進行 劃分,得到第一指定位數(shù)的號碼串;
[0209] 判斷所述第一指定位數(shù)的號碼串是否符合第一類別電話號碼的屬性特征;
[0210] 若是,則根據(jù)所述第一類別電話號碼的屬性特征,確定至少兩個探測位數(shù);
[0211] 分別采用各個探測位數(shù)對所述目標待識別電話號碼串進行切分,得到切分結(jié)果;
[0212] 根據(jù)所述切分結(jié)果,從所述至少兩個探測位數(shù)中選取最優(yōu)探測位數(shù)對所述第一指 定位數(shù)的號碼串進行補全。
[0213] A2、根據(jù)A1所述的方法,其中,所述分別采用各個探測位數(shù)對所述目標待識別電 話號碼串進行切分,得到切分結(jié)果,包括:
[0214] 對于各個探測位數(shù),利用該探測位數(shù)對所述目標待識別電話號碼串的、所述第一 指定位數(shù)的號碼串之后的電話號碼串進行切分,得到第一切分號碼和第二切分號碼;
[0215] 比較所述第一切分號碼和所述第二切分號碼,確定兩者對應位置上號碼相同的位 數(shù),作為該探測位數(shù)對應的切分結(jié)果。
[0216] A3、根據(jù)A1或A2所述的方法,其中,根據(jù)所述切分結(jié)果,從所述至少兩個探測位數(shù) 中選取最優(yōu)探測位數(shù)對所述第一指定位數(shù)的號碼串進行補全,包括:
[0217] 比較所述各個探測位數(shù)對應的號碼相同的位數(shù);
[0218] 從所述各個探測位數(shù)中,選取對應號碼相同的位數(shù)最大的作為最優(yōu)探測位數(shù);
[0219] 對所述第一指定位數(shù)的號碼串補全所述最優(yōu)探測位數(shù)。
[0220] A4、根據(jù)A1-A3任一項所述的方法,其中,在判斷所述第一指定位數(shù)的號碼串是否 符合第一類別電話號碼的屬性特征之后,還包括:
[0221] 若所述第一指定位數(shù)的號碼串不符合第一類別電話號碼的屬性特征,則選取新的 符合電話號碼格式的劃分規(guī)則對所述目標待識別電話號碼串重新進行劃分,得到第二指定 位數(shù)的號碼串;
[0222] 判斷所述第二指定位數(shù)的號碼串是否符合第二類別電話號碼的屬性特征;
[0223] 若是,則根據(jù)所述第二類別電話號碼的屬性特征,對所述第二指定位數(shù)的號碼串 進行補全。
[0224] A5、根據(jù)A1-A4任一項所述的方法,其中,從初始位置起,根據(jù)符合電話號碼格式 的劃分規(guī)則對目標待識別電話號碼串進行劃分,包括:
[0225] 對所述目標待識別電話號碼串進行與電話號碼格式相關(guān)的預處理操作,得到處理 后的目標待識別電話號碼串;
[0226] 從初始位置起,根據(jù)符合電話號碼格式的劃分規(guī)則對所述處理后的目標待識別電 話號碼串進行劃分。
[0227] A6、根據(jù)A1-A5任一項所述的方法,其中,對所述目標待識別電話號碼串進行與電 話號碼格式相關(guān)的預處理操作,得到處理后的目標待識別電話號碼串,包括:
[0228] 確定所述目標待識別電話號碼串中是否包含指定的分隔符;
[0229] 若所述目標待識別電話號碼串中包含指定的分隔符,則按照該分隔符切分所述目 標待識別電話號碼串,得到切分后的至少兩個目標待識別電話號碼串。
[0230] A7、根據(jù)A1-A6任一項所述的方法,其中,所述指定的分隔符包括下列至少之一: 頓號、逗號、分號、斜杜、反斜杜、豎桿。
[0231] A8、根據(jù)A1-A7任一項所述的方法,其中,在得到切分后的至少兩個目標待識別電 話號碼串之后,還包括:
[0232] 對于各個目標待識別電話號碼串,確定該目標待識別電話號碼串的頭部是否具有 國家區(qū)號;
[0233] 若是,則去除該目標待識別電話號碼串頭部的國家區(qū)號。
[0234] A9、根據(jù)A1-A8任一項所述的方法,其中,在去除該目標待識別電話號碼串頭部的 國家區(qū)號之后,還包括:
[0235] 分析去除了國家區(qū)號之后的所述目標待識別電話號碼串;
[0236] 若所述目標待識別電話號碼串的頭部具有地區(qū)區(qū)號且該地區(qū)區(qū)號不完整,則補充 該地區(qū)區(qū)號使其完整;
[0237] 若所述目標待識別電話號碼串的頭部具有地區(qū)區(qū)號且該地區(qū)區(qū)號重復,則對該地 區(qū)區(qū)號進行去