一種字符編碼識(shí)別結(jié)果的顯示方法和裝置的制造方法
【專利摘要】本發(fā)明實(shí)施例公開(kāi)了一種字符編碼識(shí)別結(jié)果的顯示方法和裝置,可以選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集,采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。與現(xiàn)有方式下的需要用戶進(jìn)行很多次選擇,用戶每選擇一次就進(jìn)行一次識(shí)別的方式相比,本發(fā)明的優(yōu)點(diǎn)在于一次性地實(shí)現(xiàn)識(shí)別并顯示給用戶,從而使用戶可以較快地獲得理想的文檔識(shí)別結(jié)果。
【專利說(shuō)明】
一種字符編碼識(shí)別結(jié)果的顯示方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及辦公軟件領(lǐng)域,特別是涉及一種字符編碼識(shí)別結(jié)果的顯示方法和裝置。
【背景技術(shù)】
[0002]隨著科技的發(fā)展,用戶越來(lái)越多地使用辦公軟件進(jìn)行辦公。當(dāng)人們需要用辦公軟件打開(kāi)一個(gè)純文本文件,卻不知道該文本文件所用的字符編碼格式的時(shí)候,可能遇到打開(kāi)的結(jié)果中包含亂碼的現(xiàn)象?;蛘?,當(dāng)人們打開(kāi)一個(gè)文檔,但該文檔中的所記錄的字符編碼格式信息有誤的時(shí)候,也可能遇到打開(kāi)的結(jié)果中包含亂碼的現(xiàn)象。
[0003]上述出現(xiàn)亂碼的情況下,現(xiàn)有方案往往提供給用戶一個(gè)列表,列表中列出了許多字符編碼格式供用戶選擇。用戶每選擇一次,現(xiàn)有方案就給出一個(gè)識(shí)別結(jié)果;如果用戶對(duì)該識(shí)別結(jié)果不滿意,就必須先選擇其他編碼格式,然后觀察識(shí)別結(jié)果。這一過(guò)程需要用戶不斷循環(huán)動(dòng)作,直到找到滿意的識(shí)別效果為止。而事實(shí)上,現(xiàn)存的可供選擇的編碼格式多達(dá)上百種。不難想象,用戶采用這種逐一選擇嘗試的方式,為找到滿意的字符編碼格式,往往需要進(jìn)行很多次選擇操作,花費(fèi)很多的時(shí)間,使用體驗(yàn)不佳。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例的目的在于提供一種字符編碼識(shí)別結(jié)果的顯示方法和裝置,以減少用戶的操作次數(shù),使用戶更方便地瀏覽不同字符編碼格式的識(shí)別結(jié)果。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例公開(kāi)了一種字符編碼識(shí)別結(jié)果的顯示方法和裝置,技術(shù)方案如下:
[0006]一種字符編碼識(shí)別結(jié)果的顯示方法,包括:
[0007]選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集;
[0008]采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,其中,每一個(gè)識(shí)別結(jié)果由采用一種字符編碼格式所進(jìn)行的識(shí)別獲得;
[0009]將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0010]較佳的,所述字符編碼識(shí)別結(jié)果的顯示方法還包括:
[0011]接收用戶對(duì)第一識(shí)別結(jié)果的選擇指令;
[0012]使用用戶選擇的第一識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式,對(duì)目標(biāo)文檔中的全部字符內(nèi)容進(jìn)行識(shí)別,獲得整體識(shí)別結(jié)果;
[0013]將所述整體識(shí)別結(jié)果顯示在所述目標(biāo)文檔的正文顯示區(qū)域。
[0014]較佳的,所述選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集,包括:
[0015]從目標(biāo)文檔全部?jī)?nèi)容中的第一個(gè)字符開(kāi)始,選取第一數(shù)目的字符作為第一字符子集。
[0016]較佳的,所述將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示,包括:
[0017]按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的名稱的順序,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示;或者,
[0018]按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的通用程度的高低,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。
[0019]較佳的,所述將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示,包括:
[0020]將所獲得的各識(shí)別結(jié)果及各識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式名稱在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0021]—種字符編碼識(shí)別結(jié)果的顯示裝置,包括:
[0022]選取內(nèi)容子集單元,用于選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集;
[0023]識(shí)別單元,用于采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,其中,每一個(gè)識(shí)別結(jié)果由采用一種字符編碼格式所進(jìn)行的識(shí)別獲得;
[0024]顯示單元,用于將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0025]較佳的,所述字符編碼識(shí)別結(jié)果的顯示裝置還包括:
[0026]用戶選擇指令接收單元,用于在所述顯示單元將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示之后,接收用戶對(duì)第一識(shí)別結(jié)果的選擇指令;
[0027]整體內(nèi)容識(shí)別單元,用于使用用戶選擇的第一識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式,對(duì)目標(biāo)文檔中的全部字符內(nèi)容進(jìn)行識(shí)別,獲得整體識(shí)別結(jié)果;
[0028]整體內(nèi)容顯示單元,用于將所述整體識(shí)別結(jié)果顯示在所述目標(biāo)文檔的正文顯示區(qū)域。
[0029]較佳的,所述選取內(nèi)容子集單元,具體用于:
[0030]從目標(biāo)文檔全部?jī)?nèi)容中的第一個(gè)字符開(kāi)始,選取第一數(shù)目的字符作為第一字符子集。
[0031]較佳的,所述顯示單元,包括第一顯示子單元和/或第二顯示子單元,
[0032]所述第一顯示子單元,用于按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的名稱的順序,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示;
[0033]所述第二顯示子單元,用于按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的通用程度的高低,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。
[0034]較佳的,所述顯示單元,具體用于:
[0035]將所獲得的各識(shí)別結(jié)果及各識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式名稱在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0036]本發(fā)明實(shí)施例提供的一種字符編碼識(shí)別結(jié)果的顯示方法和裝置,可以在獲得許多不同字符編碼格式的識(shí)別結(jié)果后,一次性的在目標(biāo)文檔的特定顯示區(qū)域顯示給用戶。由于本發(fā)明不像現(xiàn)有技術(shù)那樣需要用戶進(jìn)行反復(fù)操作,因此本發(fā)明便于用戶對(duì)不同字符編碼格式的識(shí)別結(jié)果進(jìn)行查看對(duì)比,減少了用戶操作,節(jié)省了用戶時(shí)間。
【附圖說(shuō)明】
[0037]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038]圖1為本發(fā)明實(shí)施例的一種字符編碼識(shí)別結(jié)果的顯示方法的流程示意圖;
[0039]圖2為本發(fā)明實(shí)施例的一種字符編碼識(shí)別結(jié)果的顯示裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0040]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0041]參見(jiàn)圖1,圖1所示為本發(fā)明實(shí)施例的一種字符編碼識(shí)別結(jié)果的顯示方法的流程示意圖,可以包括以下步驟:
[0042]S101,選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集;
[0043]要判斷一種字符編碼格式是否為正確的字符編碼格式,很多時(shí)候只需要對(duì)目標(biāo)文檔中的部分內(nèi)容進(jìn)行識(shí)別就可以進(jìn)行判斷了。如果選擇了正確的字符編碼格式,則所識(shí)別出的內(nèi)容不會(huì)包含亂碼;如果選擇的字符編碼格式不正確,則所識(shí)別出的結(jié)果會(huì)基本由亂碼組成。所以,為了減少運(yùn)算量,提高效率,在本步驟中,除了目標(biāo)文檔非常短的情況下可以選擇全部?jī)?nèi)容作為第一字符子集外,一般的,可以首先選取目標(biāo)文檔的部分內(nèi)容并在后續(xù)步驟中進(jìn)行識(shí)別。
[0044]本步驟的一個(gè)優(yōu)選具體執(zhí)行方式為:從目標(biāo)文檔全部?jī)?nèi)容中的第一個(gè)字符開(kāi)始,選取第一數(shù)目的字符作為第一子集。
[0045]選取文檔的部分內(nèi)容,一般地從文檔的開(kāi)頭第一個(gè)字符開(kāi)始,選取一定數(shù)目的字符,比如100個(gè)字符。所選取的字符不宜過(guò)多,除了是出于減少運(yùn)算量和提高效率的考慮夕卜,還因?yàn)樵谶x取內(nèi)容過(guò)多的情況下,每個(gè)識(shí)別結(jié)果也自然地變得很長(zhǎng),則將幾十種識(shí)別效果集中顯示,整個(gè)識(shí)別結(jié)果也會(huì)變得很長(zhǎng),反而不利于用戶瀏覽和選擇。
[0046]偶爾,也會(huì)出現(xiàn)幾種近似的字符編碼格式,由于它們所包含的字符集基本相同,于是會(huì)出現(xiàn)當(dāng)其中一種字符編碼格式能夠識(shí)別出第一字符子集中絕大部分或全部的字符時(shí),其他幾種近似的字符編碼格式也能如此的情況。為了便于用戶方便地處理這種情況,可以向用戶提供指令按鈕,使用戶能夠快捷地增大第一數(shù)目的值,從而在近似的字符編碼格式中作出最佳選擇。
[0047]S102,采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,其中,每一個(gè)識(shí)別結(jié)果由采用一種字符編碼格式所進(jìn)行的識(shí)別獲得;
[0048]在SlOl已經(jīng)選取了目標(biāo)文檔的部分內(nèi)容之后,就要用各種備選的字符編碼格式對(duì)選取內(nèi)容進(jìn)行識(shí)別。由于多種語(yǔ)言和多種編碼方法的存在,現(xiàn)存的常用編碼格式有上百種。采取每一種字符編碼格式,都會(huì)獲得一種識(shí)別結(jié)果,其中必然的,絕大部分的字符編碼格式所獲得的識(shí)別結(jié)果將會(huì)是亂碼。將這些識(shí)別結(jié)果以連續(xù)的識(shí)別結(jié)果塊的形式顯示給用戶,可以使用戶快速地進(jìn)行查看和選擇。
[0049]S103,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0050]每一個(gè)字符編碼格式對(duì)應(yīng)地獲得一種識(shí)別結(jié)果,因此經(jīng)過(guò)步驟S102,將獲得很多、有可能多達(dá)幾十種的識(shí)別結(jié)果。將這些識(shí)別結(jié)果以連續(xù)而又相互之間可區(qū)別的方式,在不同于目標(biāo)文檔正文顯示區(qū)域的某一個(gè)區(qū)域,集中顯示出來(lái),供用戶選擇。用戶可人為地挑選識(shí)別結(jié)果中不包含亂碼或者包含亂碼較少的識(shí)別結(jié)果。集中顯示的方式可以為一個(gè)窗口,該窗口的側(cè)邊配置有滾動(dòng)條,用戶可以通過(guò)鼠標(biāo)或鍵盤(pán)操作方便地瀏覽這些連續(xù)排列的識(shí)別結(jié)果。而且,連續(xù)顯示的兩個(gè)識(shí)別結(jié)果可以采用不同的顯示顏色,且它們之間應(yīng)有一定的空隙和/或分界線,以使用戶在滾動(dòng)瀏覽的過(guò)程中依然可以清晰地區(qū)分不同的識(shí)別結(jié)果顯示塊。
[0051]而且,本方法實(shí)施例中S103的一種具體執(zhí)行方式可以為:將所獲得的各識(shí)別結(jié)果及各識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式名稱在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0052]進(jìn)一步,這種方式可以具體為:在每個(gè)識(shí)別結(jié)果的顯示塊的上方以粗體方式顯示該識(shí)別結(jié)果對(duì)應(yīng)的字符編碼名稱。這樣不僅使用戶在瀏覽各識(shí)別結(jié)果時(shí),可以即時(shí)獲知該識(shí)別結(jié)果是由哪種字符編碼格式識(shí)別出來(lái)的,而且,如果用戶發(fā)現(xiàn)該識(shí)別結(jié)果較理想(不包含或基本不包含亂碼),則可以即時(shí)知道其所要識(shí)別的目標(biāo)文檔的正確編碼格式為哪種。
[0053]一旦用戶認(rèn)為在眾多識(shí)別結(jié)果中找到了理想的或比較理想的識(shí)別結(jié)果,在圖1所示實(shí)施例基礎(chǔ)上,本方法實(shí)施例還可以包括:
[0054]接收用戶對(duì)第一識(shí)別結(jié)果的選擇指令;
[0055]使用用戶選擇的第一識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式,對(duì)目標(biāo)文檔中的全部字符內(nèi)容進(jìn)行識(shí)別,獲得整體識(shí)別結(jié)果;
[0056]將所述整體識(shí)別結(jié)果顯示在所述目標(biāo)文檔的正文顯示區(qū)域。
[0057]本實(shí)現(xiàn)方式為,用戶在瀏覽各識(shí)別結(jié)果的過(guò)程中,可以點(diǎn)擊某識(shí)別結(jié)果或與識(shí)別結(jié)果對(duì)應(yīng)顯示的字符編碼格式名稱,則本方法實(shí)施例接受用戶的點(diǎn)擊指令,并使用用戶指令所對(duì)應(yīng)的字符編碼格式對(duì)目標(biāo)文檔的全部?jī)?nèi)容進(jìn)行識(shí)別,并把對(duì)全部?jī)?nèi)容的識(shí)別結(jié)果作為整體識(shí)別結(jié)果,在目標(biāo)文檔的正文顯示區(qū)域內(nèi)顯示。
[0058]用戶此后可以轉(zhuǎn)而瀏覽查看目標(biāo)文檔的整體識(shí)別結(jié)果,如果感到滿意,就可以關(guān)閉識(shí)別結(jié)果的顯示窗口,則本次對(duì)目標(biāo)文檔的識(shí)別結(jié)束。如果用戶對(duì)整體識(shí)別結(jié)果經(jīng)過(guò)查看覺(jué)得依然不滿意,則可以繼續(xù)在識(shí)別結(jié)果的顯示窗口瀏覽查看,直到挑選出正確的字符編碼格式并獲得理想的整體識(shí)別結(jié)果為止。
[0059]因?yàn)樽址幋a格式的數(shù)目眾多,為了使識(shí)別結(jié)果的顯示符合一般用戶習(xí)慣,可以將識(shí)別結(jié)果按照合適的順序進(jìn)行顯示。字符編碼格式多達(dá)上百種,為便于舉例,在此僅以“簡(jiǎn)體中文”、“阿拉伯語(yǔ)”、“日文”和“繁體中文”四種字符編碼格式為例,說(shuō)明不同字符編碼格式的識(shí)別結(jié)果的排列顯示方式。
[0060]圖1所示實(shí)施例中S103可以具體包括:
[0061]按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的名稱的順序,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。
[0062]因?yàn)閺臐h語(yǔ)拼音的順序來(lái)說(shuō),四種字符編碼格式的名稱順序?yàn)?“阿拉伯語(yǔ)”、“繁體中文”、“簡(jiǎn)體中文”、“日文”,所以識(shí)別結(jié)果的顯示順序應(yīng)為:
[0063]用“阿拉伯語(yǔ)”所獲得的識(shí)別結(jié)果;緊接著顯示用“繁體中文”所獲得的識(shí)別結(jié)果;緊接著顯示用“簡(jiǎn)體中文”所獲得的識(shí)別結(jié)果;緊接著顯示用“日文”所獲得的識(shí)別結(jié)果。
[0064]或者,為了提高用戶查看并作出理想選擇的效率,節(jié)省用戶時(shí)間,本方法實(shí)施例可以在顯示各識(shí)別結(jié)果時(shí),按照一定的優(yōu)選順序?qū)Ω髯R(shí)別結(jié)果進(jìn)行顯示,比如,圖1所示實(shí)施例中S103可以具體包括:
[0065]按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的通用程度的高低,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。
[0066]—種字符編碼格式的通用程度的高低可以有多種判斷方法,比如按照產(chǎn)品的應(yīng)用地區(qū)做出判斷,或者按照該字符編碼格式在各種產(chǎn)品中的使用率的高低做出判斷,也可以在步驟S102的執(zhí)行過(guò)程中,對(duì)該字符編碼格式的識(shí)別率進(jìn)行判斷。因?yàn)檫@些判斷方法屬于公知技術(shù),在此不做詳述。
[0067]以按照產(chǎn)品的應(yīng)用地區(qū)做出判斷為例,假如本方法實(shí)施例的應(yīng)用地區(qū)為中國(guó)大陸,則識(shí)別結(jié)果的顯示順序可以為:
[0068]用“簡(jiǎn)體中文”所獲得的識(shí)別結(jié)果;緊接著顯示用“繁體中文”所獲得的識(shí)別結(jié)果;緊接著顯示用“阿拉伯語(yǔ)”或者“日文,,所獲得的識(shí)別結(jié)果。
[0069]而且,為了便于用戶在查看不同識(shí)別結(jié)果的時(shí)候,更容易將幾種包含亂碼較少的識(shí)別結(jié)果彼此對(duì)比并從中做出最優(yōu)選擇,在上述任何一種顯示方式下,還可以向用戶提供以拖動(dòng)等方式任意改變某一識(shí)別結(jié)果的顯示次序的功能。
[0070]比如,如果用戶在瀏覽過(guò)程中,發(fā)現(xiàn)“簡(jiǎn)體中文”和“繁體中文”的識(shí)別結(jié)果中的亂碼都較少,于是希望在二者中進(jìn)行對(duì)比挑選,但二者的默認(rèn)顯示位置相距較遠(yuǎn),不便于進(jìn)行比較,則可以通過(guò)鼠標(biāo)或鍵盤(pán)操作,將“繁體中文”的識(shí)別結(jié)果拖動(dòng)到“簡(jiǎn)體中文”之后。這一功能和前文所述的增加識(shí)別結(jié)果中所包含的字符個(gè)數(shù)的功能相結(jié)合,將使用戶的查看選擇過(guò)程變得更加便利。
[0071]由圖1所示的實(shí)施例可見(jiàn),本發(fā)明實(shí)施例選取所要識(shí)別文檔的部分內(nèi)容,然后用所有可支持的字符編碼格式,對(duì)所選取的部分內(nèi)容進(jìn)行識(shí)別,并將所有識(shí)別結(jié)果在所要識(shí)別文檔的某一顯示區(qū)域內(nèi),按照某種次序連續(xù)地顯示。由于不像現(xiàn)有方式那樣需要用戶需要用戶進(jìn)行很多次選擇操作,本發(fā)明實(shí)施例便于用戶對(duì)不同字符編碼格式的識(shí)別結(jié)果進(jìn)行查看對(duì)比,減少了用戶操作,節(jié)省了用戶時(shí)間。
[0072]相應(yīng)于上面的方法實(shí)施例,本發(fā)明還提供了一種字符編碼識(shí)別結(jié)果的顯示裝置。
[0073]參見(jiàn)圖2,圖2所示為本發(fā)明實(shí)施例提供的一種字符編碼識(shí)別結(jié)果的顯示裝置的結(jié)構(gòu)示意圖。該裝置可以包括:選取內(nèi)容子集單元201、識(shí)別單元202和顯示單元203。
[0074]選取內(nèi)容子集單元201,用于選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集;
[0075]要判斷一種字符編碼格式是否為正確的字符編碼格式,很多時(shí)候只需要對(duì)目標(biāo)文檔中的部分內(nèi)容進(jìn)行識(shí)別就可以進(jìn)行判斷了。除了目標(biāo)文檔非常短的情況下選擇全部?jī)?nèi)容作為第一字符子集外,一般的,首先選取目標(biāo)文檔的部分內(nèi)容并在后續(xù)步驟中進(jìn)行識(shí)別。
[0076]在一個(gè)較佳的實(shí)施例中,選取內(nèi)容子集單元201可以具體用于從目標(biāo)文檔全部?jī)?nèi)容中的第一個(gè)字符開(kāi)始,選取第一數(shù)目的字符作為第一字符子集。
[0077]選取文檔的部分內(nèi)容,一般地從文檔的開(kāi)頭第一個(gè)字符開(kāi)始,選取一定數(shù)目的字符,比如100個(gè)字符。所選取的字符不宜過(guò)多,除了是出于減少運(yùn)算量和提高效率的考慮夕卜,還因?yàn)樵谶x取內(nèi)容過(guò)多的情況下,每個(gè)識(shí)別結(jié)果也自然地變得很長(zhǎng),則將幾十種識(shí)別效果集中顯示,整個(gè)識(shí)別結(jié)果也會(huì)變得很長(zhǎng),反而不利于用戶瀏覽和選擇。
[0078]為了便于用戶方便地處理這種情況,可以向用戶提供指令按鈕,使用戶能夠快捷地增大所選取內(nèi)容的長(zhǎng)度,從而在近似的字符編碼格式中作出最佳選擇。
[0079]識(shí)別單元202,用于采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,其中,每一個(gè)識(shí)別結(jié)果由采用一種字符編碼格式所進(jìn)行的識(shí)別獲得;
[0080]顯示單元203,用于將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0081]顯示的方式可以為一個(gè)窗口,該窗口的側(cè)邊配置有滾動(dòng)條,用戶可以通過(guò)鼠標(biāo)或鍵盤(pán)操作方便地瀏覽這些連續(xù)排列的識(shí)別結(jié)果。而且,連續(xù)顯示的兩個(gè)識(shí)別結(jié)果可以采用不同的顯示顏色,且它們之間應(yīng)有一定的空隙和/或分界線,以使用戶在滾動(dòng)瀏覽的過(guò)程中依然可以清晰地區(qū)分不同的識(shí)別結(jié)果顯示塊。
[0082]圖2所示實(shí)施例中顯示單元203可以具體用于:將所獲得的各識(shí)別結(jié)果及各識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式名稱在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
[0083]這種技術(shù)實(shí)現(xiàn)方式可以為:在每個(gè)識(shí)別結(jié)果的顯示塊的上方以粗體方式顯示該識(shí)別結(jié)果對(duì)應(yīng)的字符編碼名稱。這樣不僅使用戶在瀏覽各識(shí)別結(jié)果時(shí),可以即時(shí)獲知該識(shí)別結(jié)果是由哪種字符編碼格式識(shí)別出來(lái)的,而且,如果用戶發(fā)現(xiàn)該識(shí)別結(jié)果較理想(不包含或基本不包含亂碼),則可以即時(shí)知道其所要識(shí)別的目標(biāo)文檔的正確編碼格式為哪種。
[0084]—旦用戶認(rèn)為在眾多識(shí)別結(jié)果中找到了理想的或比較理想的識(shí)別結(jié)果,本實(shí)施例還可以包括:
[0085]用戶選擇指令接收單元,用于在顯示單元201將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示顯示之后,接收用戶對(duì)第一識(shí)別結(jié)果的選擇指令;
[0086]整體內(nèi)容識(shí)別單元,用于使用用戶選擇的第一識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式,對(duì)目標(biāo)文檔中的全部字符內(nèi)容進(jìn)行識(shí)別,獲得整體識(shí)別結(jié)果;
[0087]整體內(nèi)容顯示單元,用于將所述整體識(shí)別結(jié)果顯示在所述目標(biāo)文檔的正文顯示區(qū)域。
[0088]用戶在瀏覽各識(shí)別結(jié)果的過(guò)程中,可以點(diǎn)擊某識(shí)別結(jié)果或與識(shí)別結(jié)果對(duì)應(yīng)顯示的字符編碼格式名稱,則圖2所示實(shí)施例接受用戶的點(diǎn)擊指令,并使用用戶指令所對(duì)應(yīng)的字符編碼格式對(duì)目標(biāo)文檔的全部?jī)?nèi)容進(jìn)行識(shí)別,并把對(duì)全部?jī)?nèi)容的識(shí)別結(jié)果作為整體識(shí)別結(jié)果,在目標(biāo)文檔的正文顯示區(qū)域內(nèi)顯示。
[0089]用戶此后可以轉(zhuǎn)而瀏覽查看目標(biāo)文檔的整體識(shí)別結(jié)果,如果感到滿意,就可以關(guān)閉識(shí)別結(jié)果的顯示窗口,則本次對(duì)目標(biāo)文檔的識(shí)別結(jié)束。如果用戶對(duì)整體識(shí)別結(jié)果經(jīng)過(guò)查看覺(jué)得依然不滿意,則可以繼續(xù)在識(shí)別結(jié)果的顯示窗口瀏覽查看,直到挑選出正確的字符編碼格式并獲得理想的整體識(shí)別結(jié)果為止。
[0090]因?yàn)樽址幋a格式的數(shù)目眾多,為了使識(shí)別結(jié)果的顯示符合一般用戶習(xí)慣,可以將識(shí)別結(jié)果按照合適的順序進(jìn)行顯示。
[0091]其中,顯示單元203,可以包括第一顯示子單元和/或第二顯示子單元,
[0092]所述第一顯示子單元,用于按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的名稱的順序,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示;
[0093]所述第二顯示子單元,用于按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的通用程度的高低,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。
[0094]而且,為了便于用戶在查看不同識(shí)別結(jié)果的時(shí)候,更容易將幾種包含亂碼較少的識(shí)別結(jié)果彼此對(duì)比并從中做出最優(yōu)選擇,在上述任何一種顯示方式下,還可以向用戶提供以拖動(dòng)等方式任意改變某一識(shí)別結(jié)果的顯示次序的功能。這一功能和前文所述的增加識(shí)別結(jié)果中所包含的字符個(gè)數(shù)的功能相結(jié)合,將使用戶的查看選擇過(guò)程變得更加便利。
[0095]由圖2所示的實(shí)施例可見(jiàn),本發(fā)明實(shí)施例選取所要識(shí)別文檔的部分內(nèi)容,然后用所有可支持的字符編碼格式,對(duì)所選取的部分內(nèi)容進(jìn)行識(shí)別,并將所有識(shí)別結(jié)果在所要識(shí)別文檔的某一顯示區(qū)域內(nèi),按照某種次序連續(xù)地顯示。由于不像現(xiàn)有方式那樣需要用戶需要用戶進(jìn)行很多次選擇操作,本發(fā)明實(shí)施例便于用戶對(duì)不同字符編碼格式的識(shí)別結(jié)果進(jìn)行查看對(duì)比,減少了用戶操作,節(jié)省了用戶時(shí)間。
[0096]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的裝置和模塊的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程描述,因此,在本裝置說(shuō)明中,敘述較簡(jiǎn),只對(duì)若干重點(diǎn)技術(shù)要點(diǎn)進(jìn)行了描述。
[0097]需要說(shuō)明的是,在本文中,諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0098]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
[0099]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,這里所稱得的存儲(chǔ)介質(zhì),如:R0M/RAM、磁碟、光盤(pán)等。
[0100]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種字符編碼識(shí)別結(jié)果的顯示方法,其特征在于,包括: 選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集; 采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,其中,每一個(gè)識(shí)別結(jié)果由采用一種字符編碼格式所進(jìn)行的識(shí)別獲得; 將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 接收用戶對(duì)第一識(shí)別結(jié)果的選擇指令; 使用用戶選擇的第一識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式,對(duì)目標(biāo)文檔中的全部字符內(nèi)容進(jìn)行識(shí)別,獲得整體識(shí)別結(jié)果; 將所述整體識(shí)別結(jié)果顯示在所述目標(biāo)文檔的正文顯示區(qū)域。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集,包括: 從目標(biāo)文檔全部?jī)?nèi)容中的第一個(gè)字符開(kāi)始,選取第一數(shù)目的字符作為第一字符子集。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示,包括: 按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的名稱的順序,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示;或者, 按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的通用程度的高低,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。5.根據(jù)權(quán)利要求1到4中任一項(xiàng)所述的方法,其特征在于,所述將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示,包括: 將所獲得的各識(shí)別結(jié)果及各識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式名稱在所述目標(biāo)文檔的第一顯示區(qū)域顯示。6.一種字符編碼識(shí)別結(jié)果的顯示裝置,其特征在于,包括: 選取內(nèi)容子集單元,用于選取目標(biāo)文檔全部字符內(nèi)容的第一字符子集; 識(shí)別單元,用于采用多種字符編碼格式,對(duì)所選取的第一字符子集進(jìn)行識(shí)別,獲得多個(gè)識(shí)別結(jié)果,其中,每一個(gè)識(shí)別結(jié)果由采用一種字符編碼格式所進(jìn)行的識(shí)別獲得; 顯示單元,用于將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 用戶選擇指令接收單元,用于在所述顯示單元將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域顯示之后,接收用戶對(duì)第一識(shí)別結(jié)果的選擇指令; 整體內(nèi)容識(shí)別單元,用于使用用戶選擇的第一識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式,對(duì)目標(biāo)文檔中的全部字符內(nèi)容進(jìn)行識(shí)別,獲得整體識(shí)別結(jié)果; 整體內(nèi)容顯示單元,用于將所述整體識(shí)別結(jié)果顯示在所述目標(biāo)文檔的正文顯示區(qū)域。8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述選取內(nèi)容子集單元,具體用于: 從目標(biāo)文檔全部?jī)?nèi)容中的第一個(gè)字符開(kāi)始,選取第一數(shù)目的字符作為第一字符子集。9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述顯示單元,包括第一顯示子單元和/或第二顯示子單元, 所述第一顯示子單元,用于按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的名稱的順序,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示; 所述第二顯示子單元,用于按照識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式的通用程度的高低,將所獲得的各識(shí)別結(jié)果在所述目標(biāo)文檔的第一顯示區(qū)域進(jìn)行排序顯示。10.根據(jù)權(quán)利要求6到9中任一項(xiàng)所述的裝置,其特征在于,所述顯示單元,具體用于:將所獲得的各識(shí)別結(jié)果及各識(shí)別結(jié)果所對(duì)應(yīng)的字符編碼格式名稱在所述目標(biāo)文檔的第一顯示區(qū)域顯示。
【文檔編號(hào)】G06F17/22GK105988977SQ201510085437
【公開(kāi)日】2016年10月5日
【申請(qǐng)日】2015年2月16日
【發(fā)明人】王暉, 黃祖瑩
【申請(qǐng)人】珠海金山辦公軟件有限公司, 北京金山辦公軟件有限公司, 廣州金山移動(dòng)科技有限公司