一種圖像識別方法及用戶終端的制作方法
【專利摘要】本發(fā)明實施例公開了一種圖像識別方法及用戶終端,本發(fā)明實施例方法包括:用戶終端檢測用戶在圖像上進行標記的操作,然后確定用戶在圖像上的標記的區(qū)域,用戶終端識別標記的區(qū)域的標記內(nèi)容,然后放大顯示標記內(nèi)容,能夠?qū)τ脩舾信d趣的內(nèi)容進行放大顯示。
【專利說明】一種圖像識別方法及用戶終端
【技術領域】
[0001]本發(fā)明涉及通信領域,尤其涉及一種圖像識別方法及用戶終端。
【背景技術】
[0002]通常,人們在看書、報紙或者大街上的廣告語的時候,看見自己感興趣的內(nèi)容會想要存儲下來,特別是在室外時,沒有紙筆無法記錄下來。
[0003]現(xiàn)有的光學字符識別(OCR, Optical Character Recognit1n)技術,可以將文本內(nèi)容透過光學儀器,如影像掃描儀、傳真機或任何攝影器材,將影像轉(zhuǎn)入計算機、手機等終端,然后對文本內(nèi)容進行識別進而顯示在計算機、手機等終端中,然而,由于終端設備的屏幕較小,所需顯示的一頁內(nèi)容又較多,無法清晰查看用戶較為關注的內(nèi)容。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種圖像識別方法及用戶終端,能夠解決用戶無法清晰查看較為關注的內(nèi)容。
[0005]第一方面,提供了一種圖像識別方法,包括:
[0006]所述用戶終端檢測所述用戶在所述圖像上進行標記的操作;
[0007]所述用戶終端確定所述用戶在所述圖像上的標記的區(qū)域;
[0008]所述用戶終端識別所述標記的區(qū)域的標記內(nèi)容;
[0009]所述用戶終端放大顯示所述標記內(nèi)容。
[0010]結(jié)合第一方面,在第一方面的第一種實施方式中,所述用戶終端確定用戶在所述圖像上的標記的區(qū)域的具體步驟包括:
[0011]所述用戶終端通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域。
[0012]結(jié)合第一方面的第一種實施方式,在第一方面的第二種實施方式中,所述用戶終端通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域的具體步驟包括:
[0013]若所述標記的軌跡為封閉軌跡,所述用戶終端確定封閉軌跡內(nèi)的區(qū)域為所述標記的區(qū)域。
[0014]結(jié)合第一方面的第一種實施方式,在第一方面的第三種實施方式中,所述用戶終端通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域的具體步驟包括:
[0015]若所述標記的軌跡為封閉軌跡,所述用戶終端確定封閉軌跡內(nèi)的區(qū)域為所述標記的區(qū)域。
[0016]第二方面,提供了一種用戶終端,所述用戶終端包括:
[0017]檢測單元,用于檢測所述用戶在所述圖像上進行標記的操作;
[0018]確定單元,用于確定所述用戶在所述圖像上的標記的區(qū)域;
[0019]識別單元,用于識別所述標記的區(qū)域的標記內(nèi)容;
[0020]顯示控制單元,用于控制顯示器放大顯示所述標記內(nèi)容。
[0021]結(jié)合第二方面,在第二方面的第一種實施方式中,包括:
[0022]所述確定單元,用于通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域。
[0023]結(jié)合第二方面的第一種實施方式,在第二方面的第二種實施方式中,包括:
[0024]所述確定單元,用于所述標記的軌跡為封閉軌跡,所述用戶終端確定封閉軌跡內(nèi)的區(qū)域為所述標記的區(qū)域。
[0025]結(jié)合第二方面的第一種實施方式,在第二方面的第三種實施方式中,包括:
[0026]所述確定單元,用于所述標記的軌跡為非封閉軌跡,所述用戶終端確定非封閉軌跡的上方為所述標記的區(qū)域。
[0027]結(jié)合第二方面,或第二方面的第一種實施方式,或第二方面的第二種實施方式,或第二方面的第三種實施方式,在第二方面的第四種實施方式中,所述顯示控制單元包括:
[0028]摘取模塊,用于將識別得到的所述標記內(nèi)容進行摘取;
[0029]處理模塊,用于對摘取到的所述標記內(nèi)容進行處理,并保存處理后的所述標記內(nèi)容;
[0030]顯示控制模塊,用于控制所述顯示器對處理后的所述標記內(nèi)容進行放大顯示。
[0031]從以上技術方案可以看出,本發(fā)明實施例具有以下優(yōu)點:
[0032]本發(fā)明實施例中,用戶終端檢測用戶在圖像上進行標記的操作,然后確定用戶在圖像上所做的標記的區(qū)域,用戶終端對標記的區(qū)域中的標記內(nèi)容進行識別,然后對識別后的標記內(nèi)容進行放大顯示,能夠?qū)τ脩舾信d趣的內(nèi)容進行放大顯示。
【專利附圖】
【附圖說明】
[0033]圖1為本發(fā)明實施例中圖像識別方法一個實施例示意圖;
[0034]圖2為本發(fā)明實施例中圖像識別方法另一實施例示意圖;
[0035]圖3為本發(fā)明實施例中用戶終端一個實施例結(jié)構(gòu)參考圖;
[0036]圖4為本發(fā)明實施例中用戶終端另一實施例示意圖;
[0037]圖5為本發(fā)明實施例中用戶終端的另一實施例示意圖。
【具體實施方式】
[0038]本發(fā)明實施例提供一種圖像識別方法及用戶終端,能夠?qū)崿F(xiàn)用戶終端只對標記的區(qū)域內(nèi)的標記內(nèi)容放大顯示。
[0039]請參照圖1,本發(fā)明實施例中圖像識別方法一個實施例包括:
[0040]101、用戶終端檢測用戶在圖像上進行標記的操作;
[0041]本實施例中,用戶終端可以檢測用戶在圖像上進行標記的操作,用戶可以通過手指在圖像上做標記,也可以通過手寫筆在圖像上做標記,此處不做限定,該圖像的獲取方式不做限定,可以是用戶終端通過攝像頭拍攝后生產(chǎn)的圖像,也可以為用戶終端從其它電子設備下載的圖像。
[0042]102、用戶終端確定用戶在圖像上標記的區(qū)域;
[0043]本實施例中,在步驟101檢測用戶在圖像上進行標記之后,用戶終端可以確定用戶在圖像上所做的標記的區(qū)域。
[0044]103、用戶終端識別標記的區(qū)域的標記內(nèi)容;
[0045]本實施例中,用戶終端在確定標記的區(qū)域后,可以識別標記的區(qū)域的標記內(nèi)容,使得用戶可以通過用戶終端的屏幕查看識別得到的標記內(nèi)容。
[0046]104、用戶終端放大顯示標記內(nèi)容。
[0047]本實施例中,用戶終端可以對在步驟103中識別后的標記內(nèi)容放大顯示在用戶終端的屏幕上。
[0048]本實施例中,用戶終端檢測用戶在圖像上進行標記,然后確定用戶在圖像上所做的標記的區(qū)域,用戶終端識別標記的區(qū)域的標記內(nèi)容,然后放大顯示識別后的標記內(nèi)容,實現(xiàn)了用戶終端只對標記的區(qū)域中的標記內(nèi)容進行識別,進而能夠?qū)τ脩舾信d趣的內(nèi)容進行放大顯示。
[0049]為了便于理解,下面以一具體實例對本發(fā)明實施例中的圖像識別方法進行描述,請參閱圖2,本發(fā)明實施例中圖像識別方法另一實施例包括:
[0050]201、用戶終端檢測用戶在圖像上進行標記的操作;
[0051]本實施例中,用戶終端檢測用戶在圖像上進行標記,圖像的獲取方式可以為用戶終端通過攝像頭拍攝后生產(chǎn)的圖像,也可以為用戶終端從其它電子設備下載的圖像,例如,當用戶在讀書、報紙或者在室外看到廣告標語的時候,看到自己感興趣的文字內(nèi)容或圖案,用戶可以向用戶終端發(fā)出指令,用戶終端根據(jù)用戶的指令進行拍照,并在拍照后生成圖像,用戶的指令為指示用戶終端拍攝用戶感興趣的文字內(nèi)容或圖案,拍照后生成的圖像中包含用戶感興趣的文字內(nèi)容或圖案,用戶終端可以先將圖像顯示在用戶終端的屏幕上,用戶可以在圖像上標記出感興趣的內(nèi)容,用戶在圖像上的標記方式不做限定,用戶可以通過手指在圖像上做標記,也可以通過手寫筆在圖像上做標記,當然本領域技術人員還可以根據(jù)手指和手寫筆兩種標記方式所顯而易見其它標記方式,本實施例中以對文字內(nèi)容進行標記為例進行說明。
[0052]在實際應用中,用戶終端可以開啟預設的標記界面來供用戶在圖像上進行標記,當用戶標記完成后,用戶可以通過點擊“完成”虛擬按鍵的方式來告知用戶終端完成標記,用戶也可以通過語音命令來告知用戶終端完成標記,此處告知用戶終端完成標記的方式不做限定,當然用戶終端可以預先設定閾值A,當用戶在圖像上標記的時間大于或等于該閾值A時,用戶終端可以發(fā)出提示信息來詢問用戶是否完成標記。
[0053]202、用戶終端通過標記的軌跡坐標確定圖像中的標記的區(qū)域;
[0054]本實施例中,用戶在圖像上所做的標記不做限定,可以為直線、或曲線、或橢圓形、或矩形、或圓形,在實際應用中,用戶終端識別標記的軌跡為現(xiàn)有技術,由于用戶對用戶終端的屏幕中的圖像進行標記,用戶終端可以檢測到用戶在屏幕上的觸摸點,識別出觸摸點的軌跡坐標,用戶終端通過標記的軌跡坐標確定圖像中的標記的區(qū)域,若標記的軌跡為封閉軌跡(如,橢圓形、矩形或圓形),用戶終端可以預先設定封閉軌跡內(nèi)的區(qū)域為標記的區(qū)域,若標記的軌跡為非封閉軌跡(如,直線或曲線),用戶終端可以預先設定非封閉軌跡上方為標記的區(qū)域,在實際應用中,用戶終端可以預先設定最靠近非封閉軌跡上方N行的文字區(qū)域作為標記的區(qū)域,若圖像中包括圖案(如,人物、物體)時,用戶終端可以提示用戶選擇封閉軌跡進行標記,當然還可以根據(jù)用戶的習慣自行設定標記的區(qū)域,例如,非封閉軌跡的下方為標記的區(qū)域。
[0055]203、用戶終端識別標記的區(qū)域的標記內(nèi)容;
[0056]本實施例中,以標記內(nèi)容為文字為例,用戶終端可以通過OCR僅識別標記的區(qū)域的標記內(nèi)容,OCR技術是通過檢查紙上打印的字符,并檢測暗、亮的模式確定字符的形狀,然后用字符識別方法將形狀翻譯成計算機文字的技術,OCR具體的實現(xiàn)方式為公知技術,此處不做詳述。
[0057]204、用戶終端將識別得到的標記內(nèi)容進行摘??;
[0058]205、用戶終端對摘取到的標記內(nèi)容進行處理,并保存處理后的標記內(nèi)容;
[0059]206、用戶終端放大顯示標記內(nèi)容。
[0060]本實施例中,用戶終端對步驟203中得到的標記內(nèi)容進行摘取,若標記內(nèi)容為文字,則對摘取到的標記內(nèi)容進行重新排版,將重新排版后的標記內(nèi)容進行保存并向用戶進行顯示,若標記內(nèi)容為圖案,則對該圖案的大小、色調(diào)等參數(shù)進行處理,然后用戶終端放大顯示處理后的標記內(nèi)容,在實際應用中,用戶可以將保存在用戶終端中的標記內(nèi)容分享給其它用戶。
[0061]本實施例中,用戶終端檢測用戶在圖像上進行標記的操作,用戶終端通過標記的軌跡坐標確定圖像中的標記的區(qū)域,用戶終端識別標記的區(qū)域的標記內(nèi)容,用戶終端將識別得到的標記內(nèi)容進行摘取,用戶終端對摘取到的標記內(nèi)容進行處理,并保存處理后的標記內(nèi)容,用戶終端對處理后的標記內(nèi)容進行顯示,實現(xiàn)了用戶終端只對標記的區(qū)域內(nèi)的標記內(nèi)容放大顯示,進而方便用戶查看感興趣的內(nèi)容,而且用戶終端將摘取到的標記內(nèi)容進行保存可以有效的節(jié)省了存儲的空間,進而使用戶隨時都可以查找自己感興趣的內(nèi)容并分享給其它用戶。
[0062]下面對用于執(zhí)行上述圖像識別方法的本發(fā)明實施例的用戶終端進行說明,其基本邏輯結(jié)構(gòu)參考圖3,本發(fā)明實施例中用戶終端一個實施例包括:
[0063]檢測單元301、確定單元302、識別單元303和顯示控制單元304 ;
[0064]檢測單元301,用于檢測用戶在圖像上進行標記的操作;
[0065]確定單元302,用于確定用戶在圖像上的標記的區(qū)域;
[0066]識別單元303,用于識別標記的區(qū)域的標記內(nèi)容;
[0067]顯示控制單元304,用于控制顯示器放大顯示識別后的標記內(nèi)容。
[0068]本實施例中,檢測單元301檢測用戶在圖像上進行標記的操作,確定單元302確定用戶在圖像上標記的區(qū)域,識別單元303識別標記的區(qū)域的標記內(nèi)容,顯示控制單元304控制顯示器放大顯示識別單元303識別后的標記內(nèi)容,實現(xiàn)了用戶終端只對標記的區(qū)域的標記內(nèi)容進行識別,進而能夠?qū)τ脩舾信d趣的內(nèi)容進行放大顯示。
[0069]為了更好的理解上述的實施例,下面以具體實施例對用戶終端中包括的各個模塊及單元間的交互對用戶終端中的數(shù)據(jù)交互方式進行說明,請參閱圖4,本發(fā)明實施例中用戶終端的另一實施例包括:
[0070]檢測單元401、確定單元402、識別單元403、顯示控制單元404 ;
[0071]其中顯示控制單元404包括:摘取模塊4041、處理模塊4042和顯示控制模塊4043 ;
[0072]檢測單元401檢測用戶在圖像上進行標記,在實際應用中,圖像的獲取方式可以為通過攝像頭拍攝后生產(chǎn)的圖像,也可以為用戶終端從其它電子設備下載的圖像,例如,當用戶在讀書、報紙或者在室外看到廣告標語的時候,看到自己感興趣的文字內(nèi)容或圖案,用戶可以向用戶終端發(fā)出指令,用戶終端根據(jù)用戶的指令進行拍照,并在拍照后生成圖像,用戶的指令為指示用戶終端拍攝用戶感興趣的文字內(nèi)容或圖案,拍照后生成的圖像中包含用戶感興趣的文字內(nèi)容或圖案,用戶終端可以先將圖像顯示在用戶終端的屏幕上,用戶可以在圖像上標記出感興趣的文字內(nèi)容,用戶在圖像上的標記方式不做限定,用戶可以通過手指在圖像上做標記,也可以通過手寫筆在圖像上做標記,當然本領域技術人員還可以根據(jù)手指和手寫筆兩種標記方式所顯而易見其它標記方式,檢測單元401可以告知確定單元402檢測完畢,并將圖像發(fā)送至確定單元402 ;
[0073]確定單元402通過標記的軌跡坐標確定圖像的標記的區(qū)域,其中用戶在圖像上的標記不做限定,可以為直線、或曲線、或橢圓形、或矩形、或圓形,在實際應用中,標記的區(qū)域識別標記的軌跡為現(xiàn)有技術,由于用戶對用戶終端的屏幕中的圖像進行標記,確定單元402可以檢測到用戶的觸摸點,識別出觸摸點的軌跡坐標,然后確定單元402通過標記的軌跡坐標確定圖像中的標記的區(qū)域,若標記的軌跡為封閉軌跡(如,橢圓形、矩形或圓形),確定單元402確定封閉軌跡內(nèi)的區(qū)域為標記的區(qū)域,若標記的軌跡為非封閉軌跡(如,直線或曲線),確定單元402確定非封閉軌跡上方為標記的區(qū)域,在實際應用中,確定單元402確定最靠近非封閉軌跡上方N行的文字區(qū)域作為標記的區(qū)域,若圖像中包括圖案(如,人物、物體)時,可以提示用戶選擇封閉軌跡進行標記,當然還可以根據(jù)用戶的習慣自行設定標記的區(qū)域,例如,非封閉軌跡的下方為標記的區(qū)域,確定單元402將確定后的圖像發(fā)送至識別單元403,并告知識別單元403圖像中的標記的區(qū)域;
[0074]識別單元403識別標記的區(qū)域的標記內(nèi)容,若標記內(nèi)容為文字時,可以通過OCR僅識別標記的區(qū)域的標記內(nèi)容,OCR技術是通過檢查紙上打印的字符,并檢測暗、亮的模式確定字符的形狀,然后用字符識別方法將形狀翻譯成計算機文字的技術,OCR具體的實現(xiàn)方式為公知技術,此處不做詳述,識別單元403發(fā)送圖像至摘取模塊4041,并將識別出的標記內(nèi)容告知摘取模塊4041 ;
[0075]摘取模塊4041對圖像中的標記的區(qū)域中的標記內(nèi)容進行摘取,并將摘取到的標記內(nèi)容發(fā)送至處理模塊4042 ;
[0076]若標記內(nèi)容為文字,處理模塊4042對摘取到的標記內(nèi)容進行重新排版,將重新排版后的標記內(nèi)容進行保存并向用戶進行顯示,若標記內(nèi)容為圖案,處理模塊4042對該圖案的大小、色調(diào)等參數(shù)進行處理,處理模塊4042保存處理后的標記內(nèi)容,在實際應用中,用戶可以將保存在用戶終端中的標記內(nèi)容分享給其它用戶,處理模塊4042將處理后的標記內(nèi)容發(fā)送至顯示控制模塊4043 ;
[0077]顯示控制模塊4043控制顯示器放大顯示處理后的標記內(nèi)容。
[0078]本實施例中,檢測單元401檢測用戶在圖像上進行標記的操作,確定單元402通過標記的軌跡坐標確定圖像的標記的區(qū)域,識別單元403識別標記的區(qū)域的標記內(nèi)容,摘取模塊4041將識別得到的標記內(nèi)容進行摘取,處理模塊4042對摘取到的標記內(nèi)容進行處理,并保存處理后的標記內(nèi)容,顯示控制模塊4043控制顯示器放大顯示處理后的標記內(nèi)容,實現(xiàn)了用戶終端只對標記的區(qū)域內(nèi)的標記內(nèi)容放大顯示,進而方便用戶查看感興趣的內(nèi)容,而且用戶終端通過處理模塊4042將摘取到的標記內(nèi)容進行保存可以有效的節(jié)省了存儲的空間,進而使用戶隨時都可以查找自己感興趣的內(nèi)容并分享給其它用戶。
[0079]下面對本發(fā)明實施例中用戶終端的進一步說明,請參閱圖5,本發(fā)明實施例中用戶終端另一實施例包括:處理器501、用于生產(chǎn)圖像的攝像頭502、顯示器503以及用于存儲圖像的存儲器504。
[0080]處理器501檢測用戶在圖像上進行標記的操作,確定用戶在圖像上的標記的區(qū)域,然后識別標記的區(qū)域的標記內(nèi)容;
[0081]顯示器503放大顯示標記內(nèi)容。
[0082]所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0083]以上所述,以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換,而這些修改或者替換,并不使相應技術方案的本質(zhì)脫離本發(fā)明各實施例技術方案的精神和范圍。
【權利要求】
1.一種圖像識別方法,其特征在于,包括: 所述用戶終端檢測所述用戶在所述圖像上進行標記的操作; 所述用戶終端確定所述用戶在所述圖像上的標記的區(qū)域; 所述用戶終端識別所述標記的區(qū)域的標記內(nèi)容; 所述用戶終端放大顯示所述標記內(nèi)容。
2.根據(jù)權利要求1所述的方法,其特征在于,所述用戶終端確定用戶在所述圖像上的標記的區(qū)域的具體步驟包括: 所述用戶終端通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域。
3.根據(jù)權利要求2所述的方法,其特征在于,所述用戶終端通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域的具體步驟包括: 若所述標記的軌跡為封閉軌跡,所述用戶終端確定封閉軌跡內(nèi)的區(qū)域為所述標記的區(qū)域。
4.根據(jù)權利要求2所述的方法,其特征在于,所述用戶終端通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域的具體步驟包括: 若所述標記的軌跡為非封閉軌跡,所述用戶終端確定非封閉軌跡的上方為所述標記的區(qū)域。
5.一種用戶終端,其特征在于,所述用戶終端包括: 檢測單元,用于檢測所述用戶在所述圖像上進行標記的操作; 確定單元,用于確定所述用戶在所述圖像上的標記的區(qū)域; 識別單元,用于識別所述標記的區(qū)域的標記內(nèi)容; 顯示控制單元,用于控制顯示器放大顯示所述標記內(nèi)容。
6.根據(jù)權利要求5所述的用戶終端,其特征在于, 所述確定單元,用于通過所述標記的軌跡坐標確定所述圖像的所述標記的區(qū)域。
7.根據(jù)權利要求6所述的用戶終端,其特征在于, 所述確定單元,用于所述標記的軌跡為封閉軌跡,所述用戶終端確定封閉軌跡內(nèi)的區(qū)域為所述標記的區(qū)域。
8.根據(jù)權利要求6所述的用戶終端,其特征在于, 所述確定單元,用于所述標記的軌跡為非封閉軌跡,所述用戶終端確定非封閉軌跡的上方為所述標記的區(qū)域。
9.根據(jù)權利要求5-8任一項所述的用戶終端,其特征在于,所述顯示控制單元包括: 摘取模塊,用于將識別得到的所述標記內(nèi)容進行摘?。? 處理模塊,用于對摘取到的所述標記內(nèi)容進行處理,并保存處理后的所述標記內(nèi)容; 顯示控制模塊,用于控制所述顯示器對處理后的所述標記內(nèi)容進行放大顯示。
【文檔編號】G06K9/00GK104424472SQ201310400604
【公開日】2015年3月18日 申請日期:2013年9月5日 優(yōu)先權日:2013年9月5日
【發(fā)明者】徐丹華, 汪運斌, 龍志明 申請人:華為終端有限公司