專利名稱:助視器和智能標記方法
技術(shù)領(lǐng)域:
本申請涉及一種助視器和智能標記方法。
背景技術(shù):
對于高度近視者或者其他由于眼部疾病導(dǎo)致視力極度低下的人群而言,正常大小的圖文閱讀起來非常困難。針對這類人群,已有一種助視器,其可以將圖文放大,并顯示到顯示器上。由于放大倍數(shù)較大,而顯示裝置的寬度有限,助視器很難完整的顯示圖文中某一整行的內(nèi)容,在閱讀中,需要使用者不斷的移動圖文,從而連續(xù)閱讀所需要的內(nèi)容。為了方便使用者在需要不斷移動圖文的閱讀過程中對連續(xù)閱讀內(nèi)容進行定位,現(xiàn)有的助視器在其顯示器的中部設(shè)置了一條水平參考線。閱讀時,使用者可以將正在閱讀的行置于緊貼參考線的上方。這樣一來,當需要移動圖文時,可使移動操作更加準確,避免跳行、串行等狀況發(fā)生,進而提高閱讀效率。另外使用者可以通過手動操作來移動參考線在顯示器中的位置。然而,現(xiàn)有的助視器存在以下技術(shù)缺陷助視器不能自動識別文字行,需要通過使用者手動調(diào)整參考線在助視器的顯示器中的位置,才能使參考線對準需要閱讀的文字。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中存在的上述技術(shù)問題,本發(fā)明提供了一種助視器和智能標記方法,其可在顯示器上靈活的設(shè)置標記,從而方便使用者閱讀。根據(jù)本發(fā)明的一方面,一種助視器,包括圖像采集裝置和標記生成器;其中,圖像采集裝置用于采集并放大包含文字的圖像;標記生成器用于識別所述圖像中的一個或多個文字行,并生成用于標示所述文字行的標記。可選地,標記生成器通過識別所述圖像中的空白條來識別文字行??蛇x地,標記生成器還通過識別顯示在顯示裝置上的圖像的移動來判斷是否換行,并在判斷換行時將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行??蛇x地,標記生成器通過識別文字行中的特征點的移動來識別所述顯示在顯示裝置上的圖像的移動??蛇x地,標記生成器在顯示在顯示裝置上的圖像先沿著文字行中文字的閱讀方向的反方向移動時,然后沿著文字行中文字的閱讀方向移動,判斷為換行。可選地,助視器還包括輸入裝置,用于從外部接收換行指令,所述輸入裝置接收到換行指令后將該換行指令發(fā)送給所述標記生成器,所述標記生成器將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。可選地,標記生成器通過識別所述圖像中的滿足以下條件的圖像條來識別所述空白條在該圖像條中,具有同一顏色的像素的數(shù)量與總像素數(shù)量的比例大于或等于預(yù)定閾值??蛇x地,助視器還包括顯示裝置,用于顯示圖像采集裝置采集并放大的所述圖像和標記生成器生成的標記。根據(jù)本發(fā)明的另一方面,一種智能標記方法包括如下步驟用圖像采集裝置采集并放大包含文字的圖像;標記生成器識別所述圖像中的一個或多個文字行,并生成用于標示所述文字行的標記。可選地,在標記生成器識別所述圖像中的一個或多個文字行的步驟中,所述標記生成器通過識別所述圖像中的空白條來識別所述圖像中的文字行??蛇x地,標記生成器還通過識別所述圖像的移動來判斷是否換行,并在判斷換行時將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行??蛇x地,標記生成器通過識別文字行中的特征點的移動來識別所述圖像的移動。可選地,標記生成器在所述圖像先沿著文字行中文字的閱讀方向的反方向移動時,然后沿著文字行中文字的閱讀方向移動,判斷換行??蛇x地,智能標記方法還包括用輸入裝置從外部接收換行指令,所述輸入裝置接收到換行指令后將該換行指令發(fā)送給所述標記生成器,所述標記生成器將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行??蛇x地,標記生成器通過識別所述圖像中的滿足以下條件的圖像條來識別所述空白條在該圖像條中,具有同一顏色的像素的數(shù)量與總像素數(shù)量的比例大于或等于預(yù)定閾值。可選地,智能標記方法還包括顯示裝置顯示圖像采集裝置采集并放大的所述圖像和標記生成器生成的標記。采用本發(fā)明的助視器和智能標記方法,可以靈活的設(shè)置標記,跟蹤使用者當前閱讀內(nèi)容,從而方便使用者進行閱讀并提高閱讀效率。
參照下面結(jié)合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點和優(yōu)點。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標記來表示。圖1為本發(fā)明的助視器一種實施方式的結(jié)構(gòu)圖;圖2為本發(fā)明的智能標記方法的一種實施方式的流程圖;圖3為圖1中的標記生成器對顯示圖像中的文字行進行識別的一種實施方式的流程圖。其中,I——圖像采集裝置;2——顯示裝置;
3——標記生成器。
具體實施例方式下面參照附圖來說明本發(fā)明的實施例。在本發(fā)明的一個附圖或一種實施方式中描述的元素和特征可以與一個或多個其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。應(yīng)當注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。參見圖1所示為本發(fā)明的助視器一種實施方式的結(jié)構(gòu)圖。該助視器包括圖像采集裝置I以及標記生成器3。其中,圖像采集裝置I用于采集并放大包含文字的圖像。圖像采集裝置I可采用光學(xué)放大(例如采用光學(xué)鏡頭)和/或電路放大(如采用印刷電路版等)的方式,來對所采集的包含文字的圖像進行放大。標記生成器3用于識別圖像中的一個或多個文字行,并生成用于標示所述文字行的標記。當使用者移動需要放大顯示的圖文(例如,紙制書)時,標記仍會跟隨所標示的文字行一起移動,從而可以準確定位當前所閱讀的一個或幾個文字行。所標示的文字行的數(shù)量可以預(yù)先設(shè)置或者可以由使用者根據(jù)自己的喜好來設(shè)置。由于相鄰的兩行文字之間具有一定的行間距,在該行間距的范圍內(nèi),沒有任何顯示內(nèi)容,在一個實例中,標記生成器3可以通過識別圖像中代表兩相鄰行之間行間距范圍內(nèi)的空白條來識別文字行。在一個實例中,標記生成器3可以識別圖像中顯示在顯示裝置2的中間位置或者起始位置的一個或多個文字行,并生成用于標示所述一個或者多個文字行的一條或多條標記。在該實例中,標記標示在中間位置或者起始位置的一個或多個文字行,在其他實例中,也可以標示在別的位置的文字行。標記生成器3還通過識別圖像的移動來判斷是否換行,并在判斷換行時將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。在一個實例中,助視器可以包含顯示裝置2,以將圖像采集裝置I采集并放大的圖像顯示到顯示裝置2中,同時,將標記生成器3生成的標記也一起顯示到顯示裝置2中。在一個實例中,助視器也可以不包含顯示裝置。當助視器不包含顯示裝置時,可以將助視器與其他能夠用于顯示的設(shè)備(如電視機、電腦顯示器等)相連接,用該設(shè)備來顯示助視器中的圖像采集裝置I采集并放大的圖像以及標記生成器3生成的標記。在一個實例中,標記生成器3通過識別文字中的特征點的移動來識別所述圖像的改變。例如,提取一個文字行中的多個像素作為特征點,記錄每個特征點的位置坐標以及例如顏色的特征,當圖像移動時,各特征點也隨之移動。特征點可以選取文字行中多個連續(xù)的像素,也可以選取文字行中多個離散的像素。在一個實例中,當判斷圖像沿著文字行中文字的閱讀方向的反方向移動時,認為使用者仍在閱讀當前行,標記生成器3仍然對當前所標記的文字行進行標記。例如,當文字行是橫排且閱讀方向是從左到右時,當判斷圖像向左移動時,標記生成器3仍然對當前所標記的文字行進行標記。當圖像先沿著文字行中文字的閱讀方向的反方向移動,然后沿著文字行中文字的閱讀方向移動時,認為使用者完成當前文字行的閱讀,轉(zhuǎn)而閱讀相鄰的文字行。此時標記生成器3可以在相鄰的文字行(或者當前被標示的每一文字行相隔一個或多個文字行的文字行)重新生成新的標記,以達到跟蹤使用者閱讀內(nèi)容的目的。由于助視器放大倍數(shù)較大,當圖像中的文字為橫向排版時,一般無法完整顯示一整行的內(nèi)容,當使用者在閱讀一行的后半部分時,需要將圖文載體向左移動,以將一行的后半部分內(nèi)容顯示到顯示裝置2或外接的用于顯示的設(shè)備中。當使用者完成當前行的后半部分閱讀轉(zhuǎn)而進行下一行的閱讀時,需要將圖文載體向右移動,以將下一行的前半部分內(nèi)容顯示到顯示裝置2或外接的用于顯示的設(shè)備中。此時,就需要將標記從當前閱讀行移動到下一行以跟蹤使用者的閱讀進度。因而,在一個實施例中,標記生成器3通過識別圖像連續(xù)的先左后右的移動來識別使用者在閱讀中的換行。作為一種方案,標記生成器3識別圖像連續(xù)的先左后右的移動的方法分為以下幾個步驟步驟一提取一個文字行中的多個像素作為特征點;步驟二 比較移動后圖像的特征點與移動前圖像的特征點之間的相對位置關(guān)系來判斷圖像的移動方向;步驟三如果判斷出此次移動的方向為左,那么記錄此次移動,否則不記錄;步驟四判斷第二次移動的方向,如果第二次移動的方向為向右移動,則標記生成器3在下一文字行生成標記,否則標記生成器記錄此次移動并在當前行重新生成標記。以上的標記生成器3識別換行的方法針對的是圖文中的文字排版方式為橫向排版的情況。類似的方法可應(yīng)用于圖文中的文字排版方式為縱向排版的情況,只需使標記生成器3識別圖像連續(xù)的一上一下的移動來識別使用者在閱讀中的換行(列)。在一個實施例中,圖像采集裝置I還可以包括輸入裝置(圖中未示出)。當使用者閱讀完當前被標示的文字行時或者其他使用者認為需要的情況下,可以通過輸入裝置輸入換行指令,輸入裝置接收到換行指令后將該換行指令發(fā)送給標記生成器3,標記生成器3將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。顯示裝置2更新顯示新的標記。輸入裝置可以包括向下或者向上的按鈕。當使用者按下向下的按鈕時,標記向下移動,當使用者按下向上的按鈕時,標記向上移動。每次標記移動的行數(shù)可以預(yù)先設(shè)定或者根據(jù)由使用者根據(jù)自己的喜好來設(shè)置。作為一種實施方式,標記生成器3通過識述圖像中的具有相同顏色的像素的圖像條來識別所述空白條。真實情況中,圖像都存在噪點,在空白條的判斷時,不能做到當前行的所有像素顏色均相同。在實際操作時,可以將滿足相同顏色的像素占當前行所有像素的比例大于一設(shè)定值這一條件的行認定為空白行。設(shè)定值例如可以是99%。參見圖2所示為本發(fā)明的智能標記方法的一種實施方式的流程圖。在該實施方式中,智能標記方法分為以下步驟S1:用圖像采集裝置采集并放大包含文字的圖像;S2:標記生成器識別所述圖像中的一個或多個文字行,并生成用于標示所述文字行的標記。下面以文字行為水平方向,且對起始位置的文字行進行標示的情況為例介紹本發(fā)明的一個實施方式。參見圖3所示為標記生成器對顯示圖像中的文字行進行識別的一種實施方式的流程圖。該實施方式分為以下幾個步驟
S21 :標記生成器從顯示裝置任意水平行的最左端開始,對顯示內(nèi)容進行水平掃描,掃描完一行后移動至下一行繼續(xù)掃描,直至當前掃描行出現(xiàn)至少兩種顏色的像素,記當前行為第0行,即N = 0 ;S22 :對第N行進行水平掃描;S23:判斷當前行的所有像素是否為具有相同顏色的像素,如果判斷結(jié)果為否,則自動跳轉(zhuǎn)到下一行,即N = N+1,繼續(xù)進行掃描;S24:如果當前行的所有像素均具有相同的顏色,則確定當前行的上方為文字行并在當前行生成標記。由于真實情況中,圖像都存在噪點,在空白條的判斷時,不能做到當前行的所有像素顏色均相同。在實際執(zhí)行S23時,可以將滿足相同顏色的像素占當前行所有像素的比例大于一設(shè)定值這一條件的行認定為空白行。設(shè)定值例如可以是99%。以上為標記生成器3對顯示文本進行識別的一種實施方式。本領(lǐng)域技術(shù)人員可以根據(jù)需要對該實施方式進行任意變形,例如執(zhí)行完步驟S24后,可以繼續(xù)進行識別,直至出現(xiàn)第二個、第三個等等滿足“上一行存在至少兩種顏色的像素且當前行所有像素顏色相同”這一條件的行,在當前行生成標記并進行顯示。也即是說,標記生成器3可以在顯示裝置上所顯示的每行文本之間,生成一條標記。另外,上述的對顯示圖像中的文字行進行識別的方法針對的是圖文中的文字行的排版方式為水平排版方式。以上的方法也可以類似地應(yīng)用于文字行為垂直排版方式的情況下。在文字行傾斜的情況下,利用以上的方法,有可能無法找到,這時可以在步驟S21中,對顯示內(nèi)容進行具有一定傾斜角度的掃描,通過調(diào)整掃描的傾斜角度,可以最終識別出文字行。本發(fā)明的實施例中的標記可以是參考線,例如設(shè)置在文字行下方的參考線,也可以是例如文字行的底色。標記可以設(shè)置成任意便于使用者識別、且不影響顯示文本本身內(nèi)容的顏色和樣式。采用本發(fā)明的助視器和智能標記方法,可以根據(jù)放大的圖文來設(shè)置標記的位置,在閱讀過程中,標記能夠跟蹤使用者的閱讀進度,從而更充分的發(fā)揮標記的作用,幫助視力低下的人提聞其閱讀效率。在本發(fā)明的裝置和方法中,顯然,各部件或各步驟是可以分解、組合和/或分解后重新組合的。這些分解和/或重新組合應(yīng)視為本發(fā)明的等效方案。應(yīng)該強調(diào),術(shù)語“包括/包含”在本文使用時指特征、要素、步驟或組件的存在,但并不排除一個或更多個其它特征、要素、步驟或組件的存在或附加。雖然已經(jīng)詳細說明了本發(fā)明及其優(yōu)點,但是應(yīng)當理解在不超出由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進行各種改變、替代和變換。而且,本申請的范圍不僅限于說明書所描述的過程、設(shè)備、手段、方法和步驟的具體實施例。本領(lǐng)域內(nèi)的普通技術(shù)人員從本發(fā)明的公開內(nèi)容將容易理解,根據(jù)本發(fā)明可以使用執(zhí)行與在此所述的相應(yīng)實施例基本相同的功能或者獲得與其基本相同的結(jié)果的、現(xiàn)有和將來要被開發(fā)的過程、設(shè)備、手段、方法或者步驟。因此,所附的權(quán)利要求旨在在它們的范圍內(nèi)包括這樣的過程、設(shè)備、手段、方法或者步驟。
權(quán)利要求
1.一種助視器,包括圖像采集裝置,其特征在于還包括標記生成器;其中, 所述圖像采集裝置用于采集并放大包含文字的圖像; 所述標記生成器用于識別所述圖像中的一個或多個文字行,并生成用于標示所述文字行的標記。
2.根據(jù)權(quán)利要求1所述的助視器,其特征在于所述標記生成器通過識別所述圖像中的空白條來識別文字行。
3.根據(jù)權(quán)利要求1所述的助視器,其特征在于所述標記生成器還通過識別所述圖像的移動來判斷是否換行,并在判斷換行時將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。
4.根據(jù)權(quán)利要求3所述的助視器,其特征在于所述標記生成器通過識別文字行中的特征點的移動來識別所述的圖像的移動。
5.根據(jù)權(quán)利要求3或4所述的助視器,其特征在于所述標記生成器在所述圖像先沿著文字行中文字的閱讀方向的反方向移動,然后沿著文字行中文字的閱讀方向移動時,判斷為換行。
6.根據(jù)權(quán)利要求1-4任意一項所述的助視器,其特征在于還包括輸入裝置,用于從外部接收換行指令;所述輸入裝置接收到換行指令后將該換行指令發(fā)送給所述標記生成器,所述標記生成器將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。
7.根據(jù)權(quán)利要求2所述的助視器,其特征在于所述標記生成器通過識別所述圖像中的滿足以下條件的圖像條來識別所述空白條在該圖像條中,具有同一顏色的像素的數(shù)量與總像素數(shù)量的比例大于或等于預(yù)定閾值。
8.根據(jù)權(quán)利要求1所述的助視器,其特征在于還包括顯示裝置,所述顯示裝置用于顯示所述圖像采集裝置采集并放大的所述圖像和所述標記生成器生成的標記。
9.一種智能標記方法,其特征在于包括如下步驟 圖像采集裝置采集并放大包含文字的圖像; 標記生成器識別所述圖像中的一個或多個文字行,并生成用于標示所述文字行的標記。
10.根據(jù)權(quán)利要求9所述的智能標記方法,其特征在于在所述標記生成器識別所述圖像中的一個或多個文字行的步驟中,所述標記生成器通過識別所述圖像中的空白條來識別所述圖像中的文字行。
11.根據(jù)權(quán)利要求9所述的智能標記方法,其特征在于還包括所述標記生成器還通過識別所述圖像的移動來判斷是否換行,并在判斷換行時將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。
12.根據(jù)權(quán)利要求11所述的智能標記方法,其中,所述標記生成器通過識別文字行中的特征點的移動來識別所述圖像的移動。
13.根據(jù)權(quán)利要求11或12所述的智能標記方法,其中,所述標記生成器在所述圖像先沿著文字行中文字的閱讀方向的反方向移動,然后沿著文字行中文字的閱讀方向移動時,判斷為換行。
14.根據(jù)權(quán)利要求9-12任意一項所述的智能標記方法,其特征在于還包括,用輸入裝置從外部接收換行指令;所述輸入裝置接收到換行指令后將該換行指令發(fā)送給所述標記生成器,所述標記生成器將標記移到當前被標示的每一文字行的相鄰文字行,或者與當前被標示的每一文字行相隔一個或多個文字行的文字行。
15.根據(jù)權(quán)利要求10所述的智能標記方法,其中,所述標記生成器通過識別所述圖像中的滿足以下條件的圖像條來識別所述空白條在該圖像條中,具有同一顏色的像素的數(shù)量與總像素數(shù)量的比例大于或等于預(yù)定閾值。
16.根據(jù)權(quán)利要求9所述的智能標記方法,其特征在于,還包括顯示裝置顯示所述圖像采集裝置采集并放大的所述圖像和所述標記生成器生成的標記。
全文摘要
本申請涉及一種助視器和智能標記方法。助視器包括圖像采集裝置和標記生成器。其中,圖像采集裝置用于采集包含文字的圖像;標記生成器用于識別所述圖像中的一個或者多個文字行,并生成用于標示所述文字行的標記。采用本發(fā)明的助視器和智能標記方法,可以根據(jù)圖文來設(shè)置與文字行相應(yīng)的標記的位置,從而幫助視力低下的人提高其閱讀效率。
文檔編號G06K9/72GK103065521SQ20111031929
公開日2013年4月24日 申請日期2011年10月19日 優(yōu)先權(quán)日2011年10月19日
發(fā)明者鄧曉波, 高鐵塔 申請人:北京奧美達科技有限公司