亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

應(yīng)用程序中的文字檢測(cè)方法和裝置制造方法

文檔序號(hào):6493648閱讀:199來(lái)源:國(guó)知局
應(yīng)用程序中的文字檢測(cè)方法和裝置制造方法
【專利摘要】本發(fā)明實(shí)施例提供了一種應(yīng)用程序中的文字檢測(cè)方法和裝置。所述方法包括:從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將所述資源文件轉(zhuǎn)換為文本文件;按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件;根據(jù)語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具;通過(guò)語(yǔ)言檢測(cè)工具檢測(cè)語(yǔ)言文本文件得到可疑字符信息。所述裝置包括:文件處理模塊,用于從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將所述資源文件轉(zhuǎn)換為文本文件;拆分模塊,用于按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件;工具調(diào)用模塊,用于根據(jù)語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具;文本檢測(cè)模塊,用于通過(guò)語(yǔ)言檢測(cè)工具檢測(cè)語(yǔ)言文本文件得到可疑字符信息。采用本發(fā)明能提高應(yīng)用程序中文字檢測(cè)的效率。
【專利說(shuō)明】應(yīng)用程序中的文字檢測(cè)方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及軟件調(diào)試技術(shù),特別是涉及一種應(yīng)用程序中的文字檢測(cè)方法和裝置?!颈尘凹夹g(shù)】
[0002]隨著各種應(yīng)用程序的普遍使用,每一應(yīng)用程序所面向的用戶類型也越來(lái)越多,應(yīng)用程序用戶使用的語(yǔ)言并不僅限于單一種類的語(yǔ)言文字,例如中文,而是越來(lái)越多的用戶使用英文、馬來(lái)西亞文等各種不同的語(yǔ)言文字,因此,為適應(yīng)各種不同用戶的需求,多語(yǔ)言應(yīng)用程序根據(jù)用戶的選擇提供了各種不同語(yǔ)言版本。
[0003]相應(yīng)的,在應(yīng)用程序中的文字檢測(cè)中也應(yīng)當(dāng)對(duì)交互界面的語(yǔ)言文字進(jìn)行檢測(cè),應(yīng)用程序中的文字檢測(cè)方式包括切換不同的語(yǔ)言版本進(jìn)行檢測(cè)和提取多語(yǔ)言應(yīng)用程序的資源文件進(jìn)行人工檢測(cè)。其中,在切換不同的語(yǔ)言版本進(jìn)行檢測(cè)的過(guò)程中,首先將多語(yǔ)言應(yīng)用程序安裝于終端設(shè)備,并運(yùn)行,切換各種不同的語(yǔ)言版本,檢查該語(yǔ)言版本下所有交互界面的語(yǔ)言文字,但是,這一檢測(cè)方式難以確保遍歷檢查到每一語(yǔ)言版本下所有的交互界面,并且在檢測(cè)過(guò)程中還需配合多語(yǔ)言應(yīng)用程序的操作進(jìn)行,效率較低。
[0004]而提取資源文件進(jìn)行人工檢測(cè)的方式需要交由不同語(yǔ)言的專業(yè)人士負(fù)責(zé),例如,英文版本的應(yīng)用程序需由英語(yǔ)專業(yè)人員進(jìn)行檢測(cè),印度語(yǔ)版本的應(yīng)用程序需由印度語(yǔ)專業(yè)人員進(jìn)行檢測(cè),效率更為低下。

【發(fā)明內(nèi)容】

[0005]基于此,有必要針對(duì)檢測(cè)效率低的問(wèn)題,提供一種能提高效率的應(yīng)用程序中的文字檢測(cè)方法。
[0006]此外,還有必要提供一種能提高效率的應(yīng)用程序中的文字檢測(cè)裝置。
[0007]一種應(yīng)用程序中的文字檢測(cè)方法,包括如下步驟:
[0008]從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將所述資源文件轉(zhuǎn)換為文本文件;
[0009]按照語(yǔ)言版本對(duì)所述文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件;
[0010]根據(jù)所述語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具;
[0011]通過(guò)所述語(yǔ)言檢測(cè)工具檢測(cè)所述語(yǔ)言文本文件得到可疑字符信息。
[0012]一種應(yīng)用程序中的文字檢測(cè)裝置,包括:
[0013]文件處理模塊,用于從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將所述資源文件轉(zhuǎn)換為文本文件;
[0014]拆分模塊,用于按照語(yǔ)言版本對(duì)所述文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件;
[0015]工具調(diào)用模塊,用于根據(jù)所述語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具;
[0016]文本檢測(cè)模塊,用于通過(guò)所述語(yǔ)言檢測(cè)工具檢測(cè)所述語(yǔ)言文本文件得到可疑字符信息。上述應(yīng)用程序中的文字檢測(cè)方法和裝置,提取資源文件,并自動(dòng)將提取的資源文件轉(zhuǎn)換為適于進(jìn)行檢測(cè)的文本文件,進(jìn)而根據(jù)不同的語(yǔ)言版本將文本文件拆分為相應(yīng)的語(yǔ)言文本文件,逐一對(duì)每一語(yǔ)言版本所對(duì)應(yīng)的語(yǔ)言文本文件進(jìn)行正確性檢測(cè),不需要配合多語(yǔ)言應(yīng)用程序的操作以及專業(yè)人員的人工檢測(cè)即可完成,大大地提高了效率。
【專利附圖】

【附圖說(shuō)明】
[0017]圖1為一個(gè)實(shí)施例中應(yīng)用程序中的文字檢測(cè)方法的流程圖;
[0018]圖2為圖1中按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件的方法流程圖;
[0019]圖3為另一個(gè)實(shí)施例中應(yīng)用程序中的文字檢測(cè)方法的流程圖;
[0020]圖4為另一個(gè)實(shí)施例中應(yīng)用程序中的文字檢測(cè)方法的流程圖;
[0021]圖5為另一個(gè)實(shí)施例中檢測(cè)語(yǔ)言文本文件的方法流程圖;
[0022]圖6為一個(gè)實(shí)施例中應(yīng)用程序中的文字檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0023]圖7為圖7中拆分模塊的結(jié)構(gòu)示意圖;
[0024]圖8為另一個(gè)實(shí)施例中應(yīng)用程序中的文字檢測(cè)裝置的結(jié)構(gòu)示意圖;
[0025]圖9為另一個(gè)實(shí)施例中檢測(cè)模塊的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0026]如圖1所示,在一個(gè)實(shí)施例中,一種應(yīng)用程序中的文字檢測(cè)方法,包括如下步驟:
[0027]步驟S110,從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將資源文件轉(zhuǎn)換為文本文件。
[0028]本實(shí)施例中,資源文件用于在應(yīng)用程序中不需要重新編輯代碼即可為用戶提供各種交互界面以及交互界面中的文字、圖像。資源文件包括了交互界面所對(duì)應(yīng)的位圖、字符以及其它數(shù)據(jù),每一應(yīng)用程序?qū)?yīng)了一個(gè)資源文件,并根據(jù)提供的語(yǔ)言版本在資源文件中存儲(chǔ)了相應(yīng)語(yǔ)言版本的字符。
[0029]從應(yīng)用程序的多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,將提取到的資源文件轉(zhuǎn)換為文本格式,得到該資源文件對(duì)應(yīng)的文本文件,以適用于資源文件中字符的檢測(cè)。
[0030]具體的,應(yīng)用程序的多語(yǔ)言應(yīng)用程序安裝包為運(yùn)行于終端設(shè)備,并安裝應(yīng)用程序的可執(zhí)行文件,例如,在移動(dòng)終端的Android操作系統(tǒng)中,應(yīng)用程序的多語(yǔ)言應(yīng)用程序安裝包是后綴名為.apk的文件。
[0031]步驟S130,按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件。
[0032]本實(shí)施例中,資源文件為運(yùn)行于終端設(shè)備中的應(yīng)用程序提供了至少一個(gè)語(yǔ)言版本的交互界面,并且資源文件的文本文件中,字符是根據(jù)相應(yīng)的語(yǔ)言版本進(jìn)行有序存儲(chǔ)的,例如,文本文件的每一列對(duì)應(yīng)了一個(gè)語(yǔ)言版本。按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到每一語(yǔ)言版本對(duì)應(yīng)的語(yǔ)言文本文件,將包含了多語(yǔ)言字符的文本文件分成多個(gè)單語(yǔ)言字符的文本文件,即每一語(yǔ)言版本所對(duì)應(yīng)的語(yǔ)言文本文件。
[0033]如圖2所示,在一個(gè)實(shí)施例中,上述步驟S130的具體過(guò)程為:
[0034]步驟S131,根據(jù)語(yǔ)言版本從文本文件中提取對(duì)應(yīng)的字符。
[0035]本實(shí)施例中,根據(jù)語(yǔ)言版本逐一在文本文件中提取該語(yǔ)言版本所對(duì)應(yīng)的字符。
[0036]步驟S133,將字符保存為語(yǔ)言文本文件,并根據(jù)語(yǔ)言版本命名保存的語(yǔ)言文本文件。[0037]本實(shí)施例中,將根據(jù)語(yǔ)言版本提取到的字符保存為文本格式得到該語(yǔ)言版本所對(duì)應(yīng)的語(yǔ)言文本文件,并將該語(yǔ)言版本對(duì)應(yīng)的語(yǔ)言名稱使用語(yǔ)言文本文件的文件名。
[0038]步驟S150,根據(jù)語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具。
[0039]本實(shí)施例中,為測(cè)試應(yīng)用程序交互界面中文字是否正確,需逐一對(duì)每一語(yǔ)言版本的語(yǔ)言文本文件中的字符進(jìn)行檢測(cè),以判斷語(yǔ)言文本文件中用于形成交互界面文字的字符正確性。
[0040]語(yǔ)言檢測(cè)工具用于進(jìn)行文字檢測(cè),不同的語(yǔ)言檢測(cè)工具對(duì)應(yīng)了不同的語(yǔ)言版本,并對(duì)文本格式的文件進(jìn)行檢測(cè)。根據(jù)語(yǔ)言版本得到語(yǔ)言文本文件的語(yǔ)種,進(jìn)而調(diào)用該語(yǔ)種所對(duì)應(yīng)的語(yǔ)言檢測(cè)工具。語(yǔ)言檢測(cè)工具所進(jìn)行的文字檢測(cè)包括拼寫檢測(cè)以及語(yǔ)法檢測(cè),但并不僅限于此。
[0041]步驟S170,通過(guò)語(yǔ)言檢測(cè)工具檢測(cè)語(yǔ)言文本文件得到可疑字符信息。
[0042]本實(shí)施例中,應(yīng)用語(yǔ)言檢測(cè)工具對(duì)語(yǔ)言文本文件中的字符進(jìn)行檢測(cè)得到可疑字符信息,可疑字符信息包括了可疑字符、所在位置以及修改建議等信息,語(yǔ)言文本文件中得到的可疑字符信息形成列表的形式顯示。
[0043]如圖3所示,在另一個(gè)實(shí)施例中,上述應(yīng)用程序中的文字檢測(cè)方法還包括如下步驟:
[0044]步驟S210,從可疑字符信息中提取出誤判的可疑字符信息。
[0045]本實(shí)施例中,由語(yǔ)言檢測(cè)工具進(jìn)行檢測(cè)得到的可疑字符信息可能包含了實(shí)質(zhì)為正確的可疑字符信息,即誤判的字符信息,因此還需對(duì)得到的可疑字符信息進(jìn)行篩選以提取出誤判的可疑字符信息。
[0046]如圖4所示,在另一個(gè)實(shí)施例中,上述步驟S210之前還包括如下步驟:
[0047]步驟S310,判斷可疑字符信息中是否存在誤判的可疑字符信息,若是,則進(jìn)入上述步驟S210,若否,則進(jìn)入步驟S330。
[0048]本實(shí)施例中,獲取人工篩選得到的誤判的可疑字符信息,并以此為依據(jù)判斷語(yǔ)言檢測(cè)工具檢測(cè)得到的可疑字符信息是否被誤判,若是,則提取誤判的可疑字符信息,若否,則直接輸出語(yǔ)言檢測(cè)工具檢測(cè)得到的可疑字符信息,以方便修正語(yǔ)言文本文件中的字符。
[0049]步驟S330,輸出可疑字符信息。
[0050]步驟S230,記錄誤判的可疑字符信息。
[0051]本實(shí)施例中,將誤判的可疑字符信息記錄到字典,字典為語(yǔ)言檢測(cè)工具所附帶的詞庫(kù),記錄了正確的字符,在語(yǔ)言文本文件和字典的比對(duì)中若語(yǔ)言文本文件的字符與字典記錄的字符相一致,則判定語(yǔ)言文本文件的字符為正確的,若不相一致,則判定語(yǔ)言文本文件的字符為可疑字符。
[0052]在一個(gè)實(shí)施例中,上述應(yīng)用程序中的文字檢測(cè)方法還包括:根據(jù)記錄的誤判的可疑字符信息去除檢測(cè)得到的可疑字符信息中誤判的可疑字符信息的步驟。
[0053]本實(shí)施例中,在對(duì)語(yǔ)言文本文件進(jìn)行檢測(cè),并記錄了語(yǔ)言文本文件中誤判的可疑字符信息之后,還將根據(jù)記錄的誤判的可疑字符再次進(jìn)行檢測(cè),去除可疑字符信息中誤判的可疑字符信息,重新得到更為準(zhǔn)確的文字檢測(cè)結(jié)果。
[0054]如圖5所示,在另一個(gè)實(shí)施例中,上述應(yīng)用程序中的文字檢測(cè)方法還包括:
[0055]步驟S410,獲取終端設(shè)備的分辨率信息。[0056]本實(shí)施例中,獲取運(yùn)行應(yīng)用程序的終端設(shè)備屏幕的分辨率信息。分辨率信息用于通過(guò)水平和垂直像素來(lái)衡量終端設(shè)備屏幕每一行或列中顯示文字的數(shù)量。
[0057]步驟S430,判斷語(yǔ)言文本文件中字符的斷行是否與分辨率信息相匹配,若否,則進(jìn)入步驟S450,若是,則結(jié)束。
[0058]本實(shí)施例中,上述判斷語(yǔ)言文本文件中字符的斷行是否與分辨率信息相匹配的具體過(guò)程為:根據(jù)語(yǔ)言文本文件得到對(duì)應(yīng)的語(yǔ)種并獲取應(yīng)用程序交互界面顯示的字號(hào),根據(jù)語(yǔ)種和顯示的字號(hào)計(jì)算得到字符所占據(jù)的寬度,該寬度是通過(guò)像素表示的,根據(jù)分辨率信息計(jì)算終端設(shè)備屏幕得到每行所包含的像素點(diǎn)數(shù)量,進(jìn)而將每行所包含的像素點(diǎn)數(shù)量和寬相除得到每行容納字?jǐn)?shù),根據(jù)每行容納字?jǐn)?shù)判斷語(yǔ)言文本文件中字符的斷行是否正確,若不正確,則生成相應(yīng)的可疑字符信息,以通過(guò)可疑字符信息標(biāo)識(shí)斷行錯(cuò)誤的字符。
[0059]此外,上述步驟S430也可通過(guò)判斷語(yǔ)言文本文件中同一行的字符長(zhǎng)度所占據(jù)的像素值是否與屏幕中每行所包含的像素點(diǎn)數(shù)量相匹配來(lái)識(shí)別斷行錯(cuò)誤的字符,判斷到同一行的字符長(zhǎng)度所占據(jù)的像素值超出了屏幕中每行所包含的像素點(diǎn)數(shù)量,則說(shuō)明出現(xiàn)了斷行錯(cuò)誤。
[0060]步驟S450,生成字符對(duì)應(yīng)的可疑字符信息。
[0061]本實(shí)施例中,該可疑字符信息包括了斷行出錯(cuò)的字符、所處位置以及修改建議等信息。
[0062]如圖6所示,在一個(gè)實(shí)施例中,一種應(yīng)用程序中的文字檢測(cè)裝置,包括文件處理模塊110、拆分模塊130、工具調(diào)用模塊150和文本檢測(cè)模塊170。
[0063]文件處理模塊110,用于從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將資源文件轉(zhuǎn)換為文本文件。
[0064]本實(shí)施例中,資源文件用于在應(yīng)用程序中不需要重新編輯代碼即可為用戶提供各種交互界面以及交互界面中的文字、圖像。資源文件包括了交互界面所對(duì)應(yīng)的位圖、字符以及其它數(shù)據(jù),每一應(yīng)用程序?qū)?yīng)了一個(gè)資源文件,并根據(jù)提供的語(yǔ)言版本在資源文件中存儲(chǔ)了相應(yīng)語(yǔ)言版本的字符。
[0065]文件處理模塊110從應(yīng)用程序的多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,將提取到的資源文件轉(zhuǎn)換為文本格式,得到該資源文件對(duì)應(yīng)的文本文件,以適用于資源文件中字符的檢測(cè)。
[0066]具體的,應(yīng)用程序的多語(yǔ)言應(yīng)用程序安裝包為運(yùn)行于終端設(shè)備,并安裝應(yīng)用程序的可執(zhí)行文件,例如,在移動(dòng)終端的Android操作系統(tǒng)中,應(yīng)用程序的多語(yǔ)言應(yīng)用程序安裝包是后綴名為.apk的文件。
[0067]拆分模塊130,用于按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件。
[0068]本實(shí)施例中,資源文件為運(yùn)行于終端設(shè)備中的應(yīng)用程序提供了至少一個(gè)語(yǔ)言版本的交互界面,并且資源文件的文本文件中,字符是根據(jù)相應(yīng)的語(yǔ)言版本進(jìn)行有序存儲(chǔ)的,例如,文本文件的每一列對(duì)應(yīng)了一個(gè)語(yǔ)言版本。拆分模塊130按照語(yǔ)言版本對(duì)文本文件進(jìn)行拆分得到每一語(yǔ)言版本對(duì)應(yīng)的語(yǔ)言文本文件,將包含了多語(yǔ)言字符的文本文件分成多個(gè)單語(yǔ)言字符的文本文件,即每一語(yǔ)言版本所對(duì)應(yīng)的語(yǔ)言文本文件。
[0069]如圖7所示,在一個(gè)實(shí)施例中,拆分模塊130包括字符提取單元131以及存儲(chǔ)單元133。[0070]字符提取單元131,用于根據(jù)語(yǔ)言版本從文本文件中提取對(duì)應(yīng)的字符。
[0071]本實(shí)施例中,字符提取單元131根據(jù)語(yǔ)言版本逐一在文本文件中提取該語(yǔ)言版本所對(duì)應(yīng)的字符。
[0072]存儲(chǔ)單元133,用于將字符保存為語(yǔ)言文本文件,并根據(jù)語(yǔ)言版本命名保存的語(yǔ)言文本文件。
[0073]本實(shí)施例中,存儲(chǔ)單元133將根據(jù)語(yǔ)言版本提取到的字符保存為文本格式得到該語(yǔ)言版本所對(duì)應(yīng)的語(yǔ)言文本文件,并將該語(yǔ)言版本對(duì)應(yīng)的語(yǔ)言名稱使用語(yǔ)言文本文件的文件名。
[0074]工具調(diào)用模塊150,用于根據(jù)語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具。
[0075]本實(shí)施例中,為測(cè)試應(yīng)用程序交互界面中文字是否正確,需逐一對(duì)每一語(yǔ)言版本的語(yǔ)言文本文件中的字符進(jìn)行檢測(cè),以判斷語(yǔ)言文本文件中用于形成交互界面文字的字符正確性。
[0076]語(yǔ)言檢測(cè)工具用于進(jìn)行文字檢測(cè),不同的語(yǔ)言檢測(cè)工具對(duì)應(yīng)了不同的語(yǔ)言版本,并對(duì)文本格式的文件進(jìn)行檢測(cè)。工具調(diào)用模塊150根據(jù)語(yǔ)言版本得到語(yǔ)言文本文件的語(yǔ)種,進(jìn)而調(diào)用該語(yǔ)種所對(duì)應(yīng)的語(yǔ)言檢測(cè)工具。語(yǔ)言檢測(cè)工具所進(jìn)行的文字檢測(cè)包括拼寫檢測(cè)以及語(yǔ)法檢測(cè),但并不僅限于此。
[0077]文本檢測(cè)模塊170,用于通過(guò)語(yǔ)言檢測(cè)工具檢測(cè)語(yǔ)言文本文件得到可疑字符信息。
[0078]本實(shí)施例中,文本檢測(cè)模塊170應(yīng)用語(yǔ)言檢測(cè)工具對(duì)語(yǔ)言文本文件中的字符進(jìn)行檢測(cè)得到可疑字符信息,可疑字符信息包括了可疑字符、所在位置以及修改建議等信息,語(yǔ)言文本文件中得到的可疑字符信息形成列表的形式顯示。
[0079]如圖8所示,在另一個(gè)實(shí)施例中,上述應(yīng)用程序中的文字檢測(cè)裝置還包括誤判信息提取模塊210以及記錄模塊230。
[0080]誤判信息提取模塊210,用于從可疑字符信息提取出誤判的可疑字符信息。
[0081]本實(shí)施例中,由語(yǔ)言檢測(cè)工具進(jìn)行檢測(cè)得到的可疑字符信息可能包含了實(shí)質(zhì)為正確的可疑字符信息,即誤判的字符信息,因此還需誤判信息提取模塊210對(duì)得到的可疑字符信息進(jìn)行篩選以提取出誤判的可疑字符信息。
[0082]在另一個(gè)實(shí)施使你中,上述應(yīng)用程序中文字檢測(cè)裝置還包括誤判信息識(shí)別模塊,該誤判信息識(shí)別模塊用于判斷可疑字符信息中是否存在誤判的可疑字符信息,若是,則通知上述誤判信息提取模塊210,若否,則輸出可疑字符信息。
[0083]本實(shí)施例中,誤判信息識(shí)別模塊獲取人工篩選得到的誤判的可疑字符信息,并以此為依據(jù)判斷語(yǔ)言檢測(cè)工具檢測(cè)得到的可疑字符信息是否被誤判,若是,則提取誤判的可疑字符信息,若否,則直接輸出語(yǔ)言檢測(cè)工具檢測(cè)得到的可疑字符信息,以方便修正語(yǔ)言文本文件中的字符。
[0084]記錄模塊230,用于記錄誤判的可疑字符信息。
[0085]本實(shí)施例中,記錄模塊230將誤判的可疑字符信息記錄到字典,字典為語(yǔ)言檢測(cè)工具所附帶的詞庫(kù),記錄了正確的字符,在語(yǔ)言文本文件和字典的比對(duì)中若語(yǔ)言文本文件的字符與字典記錄的字符相一致,則判定語(yǔ)言文本文件的字符為正確的,若不相一致,則判定語(yǔ)言文本文件的字符為可疑字符。
[0086]上述文本檢測(cè)模塊170還用于根據(jù)記錄的誤判的可疑字符信息去除檢測(cè)得到的可疑字符信息中誤判的可疑字符信息。
[0087]本實(shí)施例中,在對(duì)語(yǔ)言文本文件進(jìn)行檢測(cè),并記錄了語(yǔ)言文本文件中誤判的可疑字符信息之后,文本檢測(cè)模塊170還將根據(jù)記錄的誤判的可疑字符再次進(jìn)行檢測(cè),去除可疑字符信息中誤判的可疑字符信息,重新得到更為準(zhǔn)確的文字檢測(cè)結(jié)果。
[0088]如圖9所示,在另一個(gè)實(shí)施例中,上述應(yīng)用程序中的文字檢測(cè)裝置還包括獲取模塊310以及斷行檢測(cè)模塊330。
[0089]獲取模塊310,用于獲取終端設(shè)備的分辨率信息。
[0090]本實(shí)施例中,獲取模塊310獲取運(yùn)行應(yīng)用程序的終端設(shè)備屏幕的分辨率信息。分辨率信息用于通過(guò)水平和垂直像素來(lái)衡量終端設(shè)備屏幕每一行或列中顯示文字的數(shù)量。
[0091]斷行檢測(cè)模塊330,用于判斷語(yǔ)言文本文件中字符的斷行是否與分辨率信息相匹配,若否,則生成該字符對(duì)應(yīng)的可疑字符信息,若是,則停止執(zhí)行。
[0092]本實(shí)施例中,斷行檢測(cè)模塊330根據(jù)語(yǔ)言文本文件得到對(duì)應(yīng)的語(yǔ)種并獲取應(yīng)用程序交互界面顯示的字號(hào),根據(jù)語(yǔ)種和顯示的字號(hào)計(jì)算得到字符所占據(jù)的寬度,該寬度是通過(guò)像素表示的,根據(jù)分辨率信息計(jì)算終端設(shè)備屏幕得到每行所包含的像素點(diǎn)數(shù)量,進(jìn)而將每行所包含的像素點(diǎn)數(shù)量和寬相除得到每行容納字?jǐn)?shù),根據(jù)每行容納字?jǐn)?shù)判斷語(yǔ)言文本文件中字符的斷行是否正確,若不正確,則生成相應(yīng)的可疑字符信息,以通過(guò)可疑字符信息標(biāo)識(shí)斷行錯(cuò)誤的字符。
[0093]此外,斷行檢測(cè)模塊330也可通過(guò)判斷語(yǔ)言文本文件中同一行的字符長(zhǎng)度所占據(jù)的像素值是否與屏幕中每行所包含的像素點(diǎn)數(shù)量相匹配來(lái)識(shí)別斷行錯(cuò)誤的字符,判斷到同一行的字符長(zhǎng)度所占據(jù)的像素值超出了屏幕中每行所包含的像素點(diǎn)數(shù)量,則說(shuō)明出現(xiàn)了斷行錯(cuò)誤??梢勺址畔藬嘈谐鲥e(cuò)的字符、所處位置以及修改建議等信息。
[0094]上述應(yīng)用程序中的文字檢測(cè)方法和裝置,提取資源文件,并自動(dòng)將提取的資源文件轉(zhuǎn)換為適于進(jìn)行檢測(cè)的文本文件,進(jìn)而根據(jù)不同的語(yǔ)言版本將文本文件拆分為相應(yīng)的語(yǔ)言文本文件,逐一對(duì)每一語(yǔ)言版本所對(duì)應(yīng)的語(yǔ)言文本文件進(jìn)行正確性檢測(cè),不需要配合多語(yǔ)言應(yīng)用程序的操作以及專業(yè)人員的人工檢測(cè)即可完成,大大地提高了效率。
[0095]以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
【權(quán)利要求】
1.一種應(yīng)用程序中的文字檢測(cè)方法,包括如下步驟: 從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將所述資源文件轉(zhuǎn)換為文本文件; 按照語(yǔ)言版本對(duì)所述文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件; 根據(jù)所述語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具; 通過(guò)所述語(yǔ)言檢測(cè)工具檢測(cè)所述語(yǔ)言文本文件得到可疑字符信息。
2.根據(jù)權(quán)利要求1所述的應(yīng)用程序中的文字檢測(cè)方法,其特征在于,所述按照語(yǔ)言版本對(duì)所述文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件的步驟為: 根據(jù)語(yǔ)言版本從所述文本文件中提取對(duì)應(yīng)的字符; 將所述字符保存為語(yǔ)言文本文件,并根據(jù)所述語(yǔ)言版本命名所述保存的語(yǔ)言文本文件。
3.根據(jù)權(quán)利要求1所述的應(yīng)用程序中的文字檢測(cè)方法,其特征在于,還包括: 獲取終端設(shè)備的分辨率信息; 判斷所述語(yǔ)言文本文件中字符的斷行是否與所述分辨率信息相匹配,若否,則生成所述字符對(duì)應(yīng)的可疑字符信息。
4.根據(jù)權(quán)利要求1所述的應(yīng)用程序中的文字檢測(cè)方法,其特征在于,還包括: 從所述可疑字符信息提取出誤判的可疑字符信息; 記錄所述誤判的可疑字符信息; 根據(jù)所述記錄的誤判的可疑字符信息去除所述檢測(cè)得到的可疑字符信息中誤判的可疑字符信息。
5.根據(jù)權(quán)利要求4所述的應(yīng)用程序中的文字檢測(cè)方法,其特征在于,所述從所述可疑字符信息提取出誤判的可疑字符信息的步驟之前還包括: 判斷所述可疑字符信息中是否存在誤判的可疑字符信息,若是,則進(jìn)入所述從所述可疑字符信息提取出誤判的可疑字符信息的步驟; 若否,則輸出所述可疑字符信息。
6.一種應(yīng)用程序中的文字檢測(cè)裝置,其特征在于,包括: 文件處理模塊,用于從多語(yǔ)言應(yīng)用程序安裝包中提取資源文件,并將所述資源文件轉(zhuǎn)換為文本文件; 拆分模塊,用于按照語(yǔ)言版本對(duì)所述文本文件進(jìn)行拆分得到對(duì)應(yīng)的語(yǔ)言文本文件; 工具調(diào)用模塊,用于根據(jù)所述語(yǔ)言版本調(diào)用語(yǔ)言檢測(cè)工具; 文本檢測(cè)模塊,用于通過(guò)所述語(yǔ)言檢測(cè)工具檢測(cè)所述語(yǔ)言文本文件得到可疑字符信肩、O
7.根據(jù)權(quán)利要求6所述的應(yīng)用程序中的文字檢測(cè)裝置,其特征在于,所述拆分模塊包括: 字符提取單元,用于根據(jù)語(yǔ)言版本從所述文本文件中提取對(duì)應(yīng)的字符; 存儲(chǔ)單元,用于將所述字符保存為語(yǔ)言文本文件,并根據(jù)所述語(yǔ)言版本命名所述保存的語(yǔ)言文本文件。
8.根據(jù)權(quán)利要求6所述的應(yīng)用程序中的文字檢測(cè)裝置,其特征在于,還包括: 獲取模塊,用于獲取終端設(shè)備的分辨率信息; 斷行檢測(cè)模塊,用于判斷所述語(yǔ)言文本文件中字符的斷行是否與所述分辨率信息相匹配,若否,則生成所述字符對(duì)應(yīng)的可疑字符信息。
9.根據(jù)權(quán)利要求6所述的應(yīng)用程序中的文字檢測(cè)裝置,其特征在于,還包括: 誤判信息提取模塊,用于從所述可疑字符信息提取出誤判的可疑字符信息; 記錄模塊,用于記錄所述誤判的可疑字符信息; 所述文本檢測(cè)模塊還用于根據(jù)所述記錄的誤判的可疑字符信息去除所述檢測(cè)得到的可疑字符信息中誤判的可疑字符信息。
10.根據(jù)權(quán)利要求9所述的應(yīng)用程序中的文字檢測(cè)裝置,其特征在于,還包括: 誤判信息識(shí)別模塊,用于判斷所述可疑字符信息中是否存在誤判的可疑字符信息,若是,則通知所述誤判信息提 取模塊,若否,則輸出所述可疑字符信息。
【文檔編號(hào)】G06F11/36GK103902440SQ201210572578
【公開日】2014年7月2日 申請(qǐng)日期:2012年12月25日 優(yōu)先權(quán)日:2012年12月25日
【發(fā)明者】丁如敏, 霍舉振, 高苡新 申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1