專利名稱:文件掃描方法、文件掃描裝置及便攜式電子裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種文件掃描方法、文件掃描裝置及便攜式電子裝置,尤其涉及一種可根據(jù)圖像特征點(diǎn),合并不同圖像,以提供文件掃描功能的文件掃描方法、文件掃描裝置及便攜式電子裝置。
背景技術(shù):
便攜式電子裝置,如筆記型計(jì)算機(jī)、平版計(jì)算機(jī)、智能手機(jī)等,有著體積小、重量輕、攜帶方便等特性,能夠讓使用者隨時(shí)隨地都能擁有強(qiáng)大的計(jì)算能力與文書處理功能,因此已成為商務(wù)人士必備的工具之一。在此情形下,如何提升便攜式電子裝置的功能,以應(yīng)付各式需求,也就成為業(yè)界所努力的目標(biāo)之一。舉例來說,商務(wù)人士在外出時(shí)通常會(huì)攜帶筆記型計(jì)算機(jī),用以展示產(chǎn)品資訊或記 錄會(huì)議數(shù)據(jù)等。然而,當(dāng)臨時(shí)遇到需要將紙本文件掃描成電子文檔的情況時(shí),由于一般使用筆記型計(jì)算機(jī)的情況下不會(huì)隨身攜帶掃描器,因此,使用者往往需到附近的便利商店或回公司后再掃描,不但耗費(fèi)金錢與時(shí)間,甚至錯(cuò)失此份數(shù)據(jù)的即時(shí)性。因此,如果筆記型計(jì)算機(jī)擁有掃描文件的功能就會(huì)方便許多。
發(fā)明內(nèi)容
因此,本發(fā)明主要提供一種文件掃描方法、文件掃描裝置及便攜式電子裝置。本發(fā)明公開一種文件掃描方法,包含有由一圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像;根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像;判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。本發(fā)明還公開一種文件掃描裝置,包含有一圖像擷取裝置;一測距單元;一處理器;以及一存儲(chǔ)單元,該存儲(chǔ)單元用來存儲(chǔ)一程序代碼,該程序代碼指示該處理器執(zhí)行以下步驟控制該圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像;控制該測距單元測量該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離;根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像;判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。本發(fā)明還公開一種便攜式電子裝置,包含有一處理器;一存儲(chǔ)單元;一圖像擷取裝置;以及一文件掃描裝置,包含有一測距單元;一程序代碼,存儲(chǔ)于該存儲(chǔ)單元中,該程序代碼指示該處理器執(zhí)行以下步驟控制該圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像;控制該測距單元測量該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離;根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像;判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。
圖I為本發(fā)明實(shí)施例一文件掃描裝置的示意圖。圖2為本發(fā)明實(shí)施例海斯行列式矩陣的示意圖。圖3為本發(fā)明實(shí)施例一文件掃描流程的示意圖。主要元件符號說明10 文件掃描裝置
100 圖像擷取裝置102 測距單元104 處理模塊106 處理器108 存儲(chǔ)單元110文件掃描程序代碼112文件114提示單元BLK_1 BLK_n區(qū)塊IMG_1 MG_n圖像DT_1 DT_n距離SCN掃描結(jié)果X特征點(diǎn)30文件掃描流程300、302、304、306、308、310、312 步驟
具體實(shí)施例方式筆記型計(jì)算機(jī)、平版計(jì)算機(jī)、智能手機(jī)等便攜式電子裝置通常配備有照像機(jī),用以提供照相、攝影、視頻電話等圖像擷取功能。在此情形下,本發(fā)明利用便攜式電子裝置的圖像擷取功能實(shí)現(xiàn)掃描功能,并搭配一系列演算流程,有效將同一文件的不同圖像部分結(jié)合為完整文件或圖像數(shù)據(jù)。請參考圖1,圖I為本發(fā)明實(shí)施例一文件掃描裝置10的示意圖。文件掃描裝置10可設(shè)置于筆記型計(jì)算機(jī)、平版計(jì)算機(jī)、智能手機(jī)等便攜式電子裝置,其由一圖像擷取裝置100、一測距單元102、一提示單元114及一處理模塊104所組成。圖像擷取裝置100可以是便攜式電子裝置原始設(shè)置的照相機(jī)、視頻設(shè)備等,用來擷取圖像。測距單元102利用紅外線、超聲波等測距原理,測量圖像擷取裝置100擷取圖像時(shí)與該圖像的實(shí)際距離。提示單元114可顯示測距單元102的測距結(jié)果,其可以是燈號、聲響或是顯示在一屏幕的訊息等。處理模塊104由一處理器106及一存儲(chǔ)單元108所組成,存儲(chǔ)單元108中存儲(chǔ)有一文件掃描程序代碼110,用以指示處理器106執(zhí)行文件掃描功能。
當(dāng)要進(jìn)行文件掃描功能時(shí),文件掃描裝置10利用圖像擷取裝置100擷取一待掃描文件112的區(qū)塊BLK_1 BLK_n的圖像IMG_1 IMG_n,而在圖像擷取裝置100擷取圖像IMG_1 IMG_n時(shí),測距單元102會(huì)測量圖像擷取裝置100與區(qū)塊BLK_1 BLK_n的距離DT_1 DT_n,并通過提示單元114顯示對應(yīng)的測量結(jié)果。處理模塊104則根據(jù)距離DT_1 DT_n,先調(diào)整圖像IMG_1 IMG_n的特性,再判斷其中的特征點(diǎn)及特征向量,最后據(jù)以結(jié)合調(diào)整后的圖像,以產(chǎn)生文件112的掃描結(jié)果SCN。關(guān)于處理模塊104的運(yùn)作原理,以下分不同步驟詳細(xì)說明。一、圖像調(diào)整如前所述,圖像擷取裝置100可以是便攜式電子裝置原始設(shè)置的照相機(jī)等,也可以是額外新增的設(shè)備,由于便攜式電子裝置的空間較小,且為維持圖像擷取品質(zhì),因此文件掃描裝置10是將文件112依不同區(qū)塊BLK_1 BLK_n依次擷取。其中,需注意的是,區(qū)塊 BLK_1 BLK_n中相鄰區(qū)塊間需部分重疊,始可進(jìn)行圖像合并,而關(guān)于如何組合圖像及當(dāng)無法組合時(shí)的處理方式,在后詳述。此外,在擷取區(qū)塊BLK_1 BLK_n的圖像IMG_1 IMG_η時(shí),優(yōu)選地由使用者手動(dòng)平移,但不限于此,而為確保使用者的平移方式符合系統(tǒng)要求,提示單元114可將最佳距離告知使用者,以避免大小不一的情況。由此可知,在進(jìn)行掃描文件112時(shí),使用者拿著待掃描的文件112在圖像擷取裝置100前移動(dòng),由圖像擷取裝置100連續(xù)拍下文件112的區(qū)塊BLK_1 BLK_n的圖像IMG_1 IMG_n。由于手持方式拿著文件112進(jìn)行平移,移動(dòng)過程中會(huì)因?yàn)橥庠诃h(huán)境因素等造成拍攝出來的圖像MG_1 頂6_11距離遠(yuǎn)近不一致,使得圖像IMG_1 IMG_n的大小會(huì)有所不同,可能造成接合后的文件圖像內(nèi)容中會(huì)有明顯的區(qū)塊差異或段差。因此,文件112與圖像擷取裝置100之間的垂直距離就顯得相當(dāng)重要,太遠(yuǎn)或太近都會(huì)影響到所拍攝出來的文字內(nèi)容的清晰度。在此情形下,當(dāng)使用者進(jìn)行掃描的時(shí)候,測距單元102可將文件112的各區(qū)塊與圖像擷取裝置100之間最佳拍攝距離的值,通過提示單元114告知使用者。此外,圖像擷取裝置100拍攝圖像MG_1 MG_n的同時(shí),測距單元102也會(huì)同步記錄每次拍攝時(shí)區(qū)塊BLK_1 BLK_n與圖像擷取裝置100間的垂直距離DT_1 DT_n。而所記錄下來的距離DT_1 DT_n,將成為接下來接合區(qū)塊BLK_1 BLK_n的圖像IMG_1 頂6_11時(shí),進(jìn)行每一圖像縮小或放大、銳化、對比度調(diào)整等后處理微調(diào)的重要參考的依據(jù)。同時(shí),如果處理模塊104檢測出文件112某一區(qū)塊的圖像拍攝效果不佳或無法使用,則可建議使用者只針對此區(qū)塊進(jìn)行重新拍攝的動(dòng)作,如此一來最后所接合出來的圖像內(nèi)容將更趨一致,掃描出成品的品質(zhì)也較為良好。因此,處理模塊104在取得圖像MG_1 MG_n時(shí),皆會(huì)記錄下對應(yīng)區(qū)塊BLK_1 BLK_n與圖像擷取裝置100之間的距離DT_1 DT_n,以做為縮放、調(diào)整圖像IMG_1 IMG_η的依據(jù)。調(diào)整圖像IMG_1 IMG_n的方式有許多種,舉例來說,可以拍攝第偶數(shù)個(gè)區(qū)塊(BLK_2、BLK_4...)時(shí)的距離(DT_2、DT_4...)加以平均后的數(shù)值做為基準(zhǔn)點(diǎn),做為縮放基準(zhǔn)。例如,如果總共拍攝四個(gè)區(qū)塊BLK_1 BLK_4的圖像IMG_1 IMG_4,而第二張圖像IMG_2拍攝距離DT_2為2公分,第四張圖像IMG_4拍攝距離DT_4為3公分,將兩者的平均2. 5公分做為縮放基準(zhǔn);因此,第二張圖像IMG_2需放大2/2. 5 = 0.8倍,而第四張圖像IMG_4則需放大3/2. 5 = I. 2倍。另外,更進(jìn)一步地,可使用雙線性內(nèi)插法做為縮放處理的算法。在所有被拍攝的圖像都被縮放調(diào)整至同一基準(zhǔn)后,才進(jìn)行文件各區(qū)塊圖像接合的處理。二、圖像合并圖像合并的基本概念是先尋找出相鄰圖像中相同的圖像內(nèi)容,藉此合倂圖像。為了判斷圖像內(nèi)容,需先選取具代表性的特征點(diǎn),而通常圖像的特征有很多種型式,諸如紋理、顏色、形狀、輪廓等,而本發(fā)明是在圖像中尋找具代表性的角點(diǎn)(corner point)特征。(a)尋找特征點(diǎn)為了判斷角點(diǎn)特征,首先使用積分圖像(integral image)技術(shù)以加快運(yùn)算的速度,并使用量化后的高斯函數(shù)二階偏微分,來計(jì)算圖像的海斯矩陣(Hessian matrix)行列式值,最后利用不同的變異數(shù)σ來產(chǎn)生不同的海斯行列式矩陣,以此尋找特征點(diǎn)。詳細(xì)來說,如果I (X,y)表示一圖像I中坐標(biāo)(x,y)的像素,則此點(diǎn)的海斯矩陣在
L(x, γ,σ) Σ(χ,γ,σ)
變異數(shù)為σ的前提下,其表示式為/ζ(χ,凡幻=廣^ /,其中h(x,y,o)為
ILxy (χ, γ,σ) Zjy (υ,σ)」
像素I (X,Y)所對應(yīng)的海斯矩陣;Lxx(X,y, σ )為像素I (X,y)與高斯函數(shù)g( σ )在X軸方向的二階導(dǎo)數(shù)^g(CT)的卷積值;而Lxy (X, y,σ )與Lyy (X, y, σ )則分別為像素I (x, y)與
進(jìn)行卷積的值,而g( σ )為高斯函數(shù)。每一元素H(x,y, σ )為圖像I在坐
oxy oy
標(biāo)(x,y)的海斯矩陣的行列式值,貝1J可寫成 H(x,y, σ) = Lxx (x,y, o)*Lyy(x,y, σ )-(Lxy(x,y,σ))2,可稱H為圖像I對應(yīng)于σ值的海斯行列式矩陣。使用不同的σ值可得到不同的海斯行列式矩陣H,例如若選取O1 = 1.2、σ2 = 2、σ3 = 2. 8,可得到不同尺度空間下的Hi、H2、H3。當(dāng)圖像I其數(shù)個(gè)對應(yīng)于不同σ值的海斯行列式矩陣產(chǎn)生后,接著便從這些海斯行列式矩陣中尋找特征點(diǎn)。假設(shè)有一像素點(diǎn)其坐標(biāo)為(X,y),為圖2中的X點(diǎn),H1,H2,H3分別為圖2中對應(yīng)至σ I、σ 2、σ 3的海斯行列式矩陣,則X點(diǎn)其26個(gè)鄰近像素(上、下尺度各九個(gè)鄰近點(diǎn)與本身尺度的八個(gè)鄰近點(diǎn))即如圖2中的圓點(diǎn)所示。如果X點(diǎn)在其26個(gè)鄰近相素中,具有最大的海斯行列式值,則稱X點(diǎn)為特征點(diǎn)。(b)決定特征向量找出特征點(diǎn)后,由于單一特征點(diǎn)無法確切描述特征點(diǎn)周圍區(qū)域的數(shù)據(jù),故需要在特征點(diǎn)附近劃出一塊鄰近區(qū)域,并利用此鄰近區(qū)域,來產(chǎn)生代表此特征點(diǎn)的特征向量。首先,在計(jì)算描述一特征點(diǎn)X的特征向量前,為了使特征向量對旋轉(zhuǎn)具有抵抗力,也就是圖像旋轉(zhuǎn)后,仍能有效找出兩張圖像吻合的特征點(diǎn),因此需要找出特征點(diǎn)X的主要方向。因此,可將特征點(diǎn)X為中心的鄰近正方區(qū)域(如20*20)像素劃出一個(gè)區(qū)域?yàn)镽,將區(qū)域R分別與哈爾(Haar)水平、垂直方向?yàn)V波器做卷積,并以dx(x, y)與dy(x, y)代表完成卷積后的結(jié)果,而dx(x, y)、dy (X, y)為與區(qū)域R相同大小的矩陣(如20*20)。因此,對區(qū)域R中每一像素點(diǎn),在dx(x,y)與dy(x,y)中都有對應(yīng)的值。接著,可以特征點(diǎn)X為中心,將O至60度為一個(gè)區(qū)域,計(jì)算此區(qū)域中所有像素dx(x, y)與dy(x, y)的總和,即可得到一個(gè)序?qū)?order pair),也就是(Σ dx (x, y),
Σ dy (χ, y)),以此序?qū)ψ鰹橐粋€(gè)向量,計(jì)算該向量的長度1 =+(Σ辦(x,J))2 ,
此即是以特征點(diǎn)X為中心O至60度區(qū)域的長度。接下來,分別計(jì)算60度至120度、120度至180、180度至240度、240至300度、300度至360度的長度。假設(shè)經(jīng)過統(tǒng)計(jì)之后其在60至120間具有最高長度,則可將特征點(diǎn)X的主要方向設(shè)定為90度(因?yàn)?120+60)/2)。在此例中,是以每60度為一個(gè)區(qū)間對區(qū)域R中所有像素做統(tǒng)計(jì),但在實(shí)際應(yīng)用上可用較小的區(qū)間對區(qū)域R中像素進(jìn)行統(tǒng)計(jì),以找出較正確的方向。換句話說,角度范圍的取舍,會(huì)影響到是否能精確找出特征點(diǎn)主要方向的能力。在得到特征點(diǎn)X的主要方向后,以特征點(diǎn)X的主要方向?yàn)橹鳎瑢D像旋轉(zhuǎn)至X的主要方向?yàn)檎狈?,劃定一個(gè)新的區(qū)域R’,其中區(qū)域R’也是以特征點(diǎn)X為中心的區(qū)域(如20*20的正方區(qū)域),目的是為了能產(chǎn)生具旋轉(zhuǎn)不變的特征向量,其結(jié)果分別以dx' (x, y) > dy; (x, y)表示,其中dx' (x, y) > dy; (χ,y)同樣為與區(qū)域R’的大小相同的矩陣。接著,將區(qū)域R’分割成多個(gè)子區(qū)塊,如4*4個(gè),則每個(gè)子區(qū)塊大小為5*5,并利用dx' (x, y)與dy' (x, y)對每個(gè)子區(qū)塊計(jì)算下列四個(gè)分量,(Σ dx' (x, y), Σ dy' (χ,γ),Σ Idxi (x,y) |,Σ Idyi (x,y) I),并以此四個(gè)分量代表一個(gè)子區(qū)塊。在此例中,由于區(qū)域R’有4*4個(gè)區(qū)塊,每個(gè)子區(qū)塊有四個(gè)分量,故能以特征點(diǎn)X的主要方向?yàn)榛鶞?zhǔn),由左至 右、由上至下分別將代表各子區(qū)域的4個(gè)分量串接起來,形成一個(gè)64維的特征向量,并以此特征向量用來代表特征點(diǎn)X。(C)圖像比對與合并當(dāng)進(jìn)行兩張圖像比對時(shí),首先將所有自兩張圖像中找出的特征點(diǎn),經(jīng)上述(b)方式產(chǎn)生每個(gè)特征點(diǎn)的特征向量后,利用這些特征點(diǎn)的特征向量互相進(jìn)行比對并找出最吻合的特征點(diǎn)。其比對方式如下,如果X為一特征點(diǎn),在特征點(diǎn)的比對過程中,利用特征點(diǎn)X的特征向量與其他特征點(diǎn)的特征向量計(jì)算兩者間的歐氏距尚。假設(shè)特征點(diǎn)Xl與X2分別為與X最接近與次接近的特征點(diǎn),且其距離分別為dl與d2,如果dl < r*d2則認(rèn)定Xl與X最為吻合,其中r為自訂的系數(shù),如O. 5。最后,將兩個(gè)最接近的特征點(diǎn)加以迭合,即完成兩張圖像的合并,這也是為何需確保相鄰兩張圖像有部分重疊的原因。(d)色彩轉(zhuǎn)換在開始判斷特征點(diǎn)前,本發(fā)明另可對每一區(qū)塊圖像做前置處理,讓圖像中相似的顏色利用量化歸類成同一種顏色,以便更有效的提取全域特征,主要目的是要讓相似度較大的圖像內(nèi)容,能被歸類至同一類,以減少圖像合并時(shí),兩個(gè)圖像具有相似內(nèi)容,卻因光線少許差異而造成兩者內(nèi)容被判斷為不同的情況。色彩轉(zhuǎn)換的方式有許多種,例如可先將圖像從RGB色彩空間轉(zhuǎn)換至CIELW色彩空間,再對圖像CIELW中,a' b*兩個(gè)子頻做量化,最后將圖像從CIELWn轉(zhuǎn)換回RGB色彩空間。色彩量化的目的是希望量化完后,讓圖像色彩的差異降低,也就是說差異不大的顏色都被正規(guī)化為同一種顏色。為了讓使用者在掃描文件時(shí),有理想的正確率與效率,特征的挑選上必須講求特征提取時(shí)的穩(wěn)定性或是符合處理速度上的要求,因此挑選特征的原則是當(dāng)區(qū)塊圖像之間差異較大時(shí),可明確表示出各特征之間的差異,反之,當(dāng)區(qū)塊圖像僅有些微的差異時(shí),則忽略或使其不明顯。在此情形下,單純使用前述(a)的角點(diǎn)特征無法提供較準(zhǔn)確的鑒別力,因此需要另外加入更多描述圖像細(xì)節(jié)的特征,來與上述特征結(jié)合成代表圖像的特征向量,例如可利用索貝爾(sobel)邊緣特征、不變矩(invariant moment)、RGB色彩的標(biāo)準(zhǔn)差與均值特征等,與前述的角點(diǎn)特征組合成一個(gè)特征向量,而每一張圖像的每個(gè)特征點(diǎn)所產(chǎn)生的特征向量長度皆相同,做為合并圖像時(shí)的依據(jù)。換句話說,本發(fā)明可利用前述(a)的方法所找出特征點(diǎn),以該特征點(diǎn)位置為中心圖選出一方形區(qū)域(如15*15),分別就此方形區(qū)域算出該區(qū)域的索貝爾特征(225維)、7個(gè)不變矩特征(7維),及RGB色彩特征(6維),最后取得維度為238維的特征向量。加入色彩轉(zhuǎn)換的處理后,相關(guān)圖像比對與合并的運(yùn)作方式仍是依照前述(C)的方法,在此不贅述。(e)除錯(cuò)如果在處理合并的計(jì)算過程中,有任何其中一張圖像發(fā)生該圖像的特征點(diǎn)無法與其他圖像的特征點(diǎn)進(jìn)行合并的情形,或是相符的特征點(diǎn)少于一設(shè)定值(如20個(gè)),則本發(fā)明的文件掃描裝置10可通過提示單元114發(fā)出警告,讓使用者針對文件112上的對應(yīng)的區(qū)塊進(jìn)行重新拍攝,接著再找出重拍圖像的所有特征點(diǎn)與特征向量,并與其他之前已經(jīng)合并好 的部分進(jìn)行合并。因此,由上述說明可知,本發(fā)明的文件掃描裝置10可將文件112分為區(qū)塊BLK_1 BLK_n進(jìn)行拍攝,最后再通過一系列算法合并為掃描結(jié)果SCN。同時(shí),在進(jìn)行合并時(shí),如果發(fā)生合并失敗的情形時(shí),可有效進(jìn)行除錯(cuò),以確保掃描結(jié)果SCN的正確性。上述關(guān)于文件掃描裝置10的運(yùn)作方式可進(jìn)一步歸納為一文件掃描流程30,如圖3所示。文件掃描流程30包含以下步驟步驟300:開始。步驟302 圖像擷取裝置100擷取文件112的區(qū)塊BLK_1 BLK_n的圖像MG_1 MG_n。步驟304 :測距單元102測量圖像擷取裝置100擷取圖像MG_1 MG_n時(shí)與區(qū)塊 BLK_1 BLK_n 的距離 DT_1 DT_n。步驟306 :處理模塊104根據(jù)距離DT_1 DT_n,調(diào)整圖像MG_1 MG_n的特性。步驟308 :處理模塊104判斷每一調(diào)整后的圖像MG_1 MG_n的特征點(diǎn)及對應(yīng)的特征向量。步驟310 :處理模塊104根據(jù)調(diào)整后的圖像MG_1 MG_n的特征向量,結(jié)合調(diào)整后的圖像MG_1 MG_n,以產(chǎn)生文件112的掃描結(jié)果SCN。步驟312:結(jié)束。文件掃描流程30為文件掃描裝置10的運(yùn)作方式的歸納,詳細(xì)運(yùn)作及變化方式,如判斷特征點(diǎn)及特征向量的方法、除錯(cuò)機(jī)制等,可參考前述。此外,在文件掃描裝置10中,所有運(yùn)作邏輯被編譯為文件掃描程序代碼110,此應(yīng)是本領(lǐng)域技術(shù)人員實(shí)現(xiàn)計(jì)算機(jī)軟件的固有知識。然而,需注意的是,文件掃描程序代碼110不限于任何程序語言,凡能由處理器106執(zhí)行而達(dá)成對應(yīng)功能的程序語言皆可用于本發(fā)明。再者,文件掃描裝置10中各元件為實(shí)現(xiàn)本發(fā)明的最基本元件。然而,根據(jù)不同系統(tǒng)需求,各元件可能為系統(tǒng)原有的配備,經(jīng)轉(zhuǎn)用而實(shí)現(xiàn)本發(fā)明。例如,筆記型計(jì)算機(jī)、智能手機(jī)等便攜式電子裝置中原配備有中央處理器、存儲(chǔ)器、照相機(jī)等,其即可用來實(shí)現(xiàn)文件掃描裝置10的處理器106、存儲(chǔ)單元108、圖像擷取裝置100 ;同理,測距單元102也可由接近感應(yīng)器(PiOximity Sensor)所實(shí)現(xiàn),而提示單元114則可由屏幕上的訊息窗、喇叭發(fā)出的聲響等實(shí)現(xiàn)。換句話說,當(dāng)文件掃描裝置10應(yīng)用于便攜式電子裝置時(shí),可能僅需增加文件掃描程序代碼110即可實(shí)現(xiàn)對應(yīng)的功能,如此一來,可有效提升使用者采用的意愿。
在已知技術(shù)中,當(dāng)臨時(shí)遇到需要將紙本文件掃描成電子文檔的情況時(shí),由于一般使用筆記型計(jì)算機(jī)的情況下不會(huì)隨身攜帶掃描器,因此,使用者往往需到附近的便利商店或回公司后再掃描,不但耗費(fèi)金錢與時(shí)間,甚至錯(cuò)失此份數(shù)據(jù)的即時(shí)性。在此情形下,本發(fā)明可在便攜式電子裝置中提供文件掃描功能,因而可有效提升便利性。綜上所述,本發(fā)明根據(jù)圖像特征點(diǎn),合并不同圖像,因而可在一便攜式電子裝置中提供文件掃描功能,以提升便攜式電子裝置的功能性及便利性。 以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,凡依本發(fā)明權(quán)利要求書所做的均等變化與修飾,皆應(yīng)屬本發(fā)明的涵蓋范圍。
權(quán)利要求
1.一種文件掃描方法,包含有 由一圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像; 根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像; 判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及 根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。
2.如權(quán)利要求I所述的文件掃描方法,其中該多個(gè)圖像的特性選自放大倍率、銳利度、對比度及彩度。
3.如權(quán)利要求I所述的文件掃描方法,其中判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量的步驟,包含有 計(jì)算每一調(diào)整后圖像的每一像素對應(yīng)于多個(gè)變異數(shù)的多個(gè)海斯矩陣(Hessianmatrix); 根據(jù)每一調(diào)整后圖像的多個(gè)像素的海斯矩陣,由該多個(gè)像素中選取該多個(gè)特征點(diǎn); 計(jì)算該多個(gè)特征點(diǎn)的每一特征點(diǎn)的多個(gè)鄰近像素的哈爾(Haar)運(yùn)算結(jié)果;以及 根據(jù)該多個(gè)特征點(diǎn)的每一特征點(diǎn)的該多個(gè)鄰近像素的哈爾算結(jié)果,判斷該多個(gè)特征向量。
4.如權(quán)利要求I所述的文件掃描方法,其中根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的該掃描結(jié)果的步驟,包含有 比較該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,以判斷該多個(gè)調(diào)整后圖像中相似的特征點(diǎn);以及 以該多個(gè)調(diào)整后圖像中相似的特征點(diǎn)為基準(zhǔn),依序結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的該掃描結(jié)果。
5.如權(quán)利要求4所述的文件掃描方法,其還包含于該多個(gè)調(diào)整后圖像中一調(diào)整后圖像與其他調(diào)整后圖像間無相似的特征點(diǎn)時(shí),重新擷取該調(diào)整后圖像所對應(yīng)的一區(qū)塊的圖像。
6.一種文件掃描裝置,包含有 一圖像擷取裝置; 一測距單元; 一處理器;以及 一存儲(chǔ)單元,該存儲(chǔ)單元用來存儲(chǔ)一程序代碼,該程序代碼指示該處理器執(zhí)行以下步驟 控制該圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像; 控制該測距單元測量該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離; 根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像; 判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及 根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。
7.如權(quán)利要求6所述的文件掃描裝置,其中該多個(gè)圖像的特性選自放大倍率、銳利度、對比度及彩度。
8.如權(quán)利要求6所述的文件掃描裝置,其中判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量的步驟,包含有 計(jì)算每一調(diào)整后圖像的每一像素對應(yīng)于多個(gè)變異數(shù)的多個(gè)海斯矩陣(Hessianmatrix); 根據(jù)每一調(diào)整后圖像的多個(gè)像素的海斯矩陣,由該多個(gè)像素中選取該多個(gè)特征點(diǎn); 計(jì)算該多個(gè)特征點(diǎn)的每一特征點(diǎn)的多個(gè)鄰近像素的哈爾(Haar)運(yùn)算結(jié)果;以及 根據(jù)該多個(gè)特征點(diǎn)的每一特征點(diǎn)的該多個(gè)鄰近像素的哈爾算結(jié)果,判斷該多個(gè)特征向量。
9.如權(quán)利要求6所述的文件掃描裝置,其中根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的該掃描結(jié)果的步驟,包含有 比較該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,以判斷該多個(gè)調(diào)整后圖像中相似的特征點(diǎn);以及 以該多個(gè)調(diào)整后圖像中相似的特征點(diǎn)為基準(zhǔn),依序結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的該掃描結(jié)果。
10.如權(quán)利要求9所述的文件掃描裝置,其還包含于該多個(gè)調(diào)整后圖像中一調(diào)整后圖像與其他調(diào)整后圖像間無相似的特征點(diǎn)時(shí),重新擷取該調(diào)整后圖像所對應(yīng)的一區(qū)塊的圖像。
11.如權(quán)利要求6所述的文件掃描裝置,其還包含一提示單元,該程序代碼另指示該處理器通過該提示單元指示一使用者平移該文件,使該圖像擷取裝置依序擷取該多個(gè)區(qū)塊的該多個(gè)圖像。
12.一種便攜式電子裝置,包含有 一處理器; 一存儲(chǔ)單元; 一圖像擷取裝置;以及 一文件掃描裝置,包含有 一測距單元; 一程序代碼,存儲(chǔ)于該存儲(chǔ)單元中,該程序代碼指示該處理器執(zhí)行以下步驟 控制該圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像; 控制該測距單元測量該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離; 根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像; 判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及 根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。
13.如權(quán)利要求12所述的便攜式電子裝置,其中該多個(gè)圖像的特性選自放大倍率、銳利度、對比度及彩度。
14.如權(quán)利要求12所述的便攜式電子裝置,其中判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量的步驟,包含有 計(jì)算每一調(diào)整后圖像的每一像素對應(yīng)于多個(gè)變異數(shù)的多個(gè)海斯矩陣(Hessianmatrix); 根據(jù)每一調(diào)整后圖像的多個(gè)像素的海斯矩陣,由該多個(gè)像素中選取該多個(gè)特征點(diǎn); 計(jì)算該多個(gè)特征點(diǎn)的每一特征點(diǎn)的多個(gè)鄰近像素的哈爾(Haar)運(yùn)算結(jié)果;以及 根據(jù)該多個(gè)特征點(diǎn)的每一特征點(diǎn)的該多個(gè)鄰近像素的哈爾算結(jié)果,判斷該多個(gè)特征向量。
15.如權(quán)利要求12所述的便攜式電子裝置,其中根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的該掃描結(jié)果的步驟,包含有 比較該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,以判斷該多個(gè)調(diào)整后圖像中相似的特征點(diǎn);以及 以該多個(gè)調(diào)整后圖像中相似的特征點(diǎn)為基準(zhǔn),依序結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的該掃描結(jié)果。
16.如權(quán)利要求15所述的便攜式電子裝置,其還包含于該多個(gè)調(diào)整后圖像中一調(diào)整后圖像與其他調(diào)整后圖像間無相似的特征點(diǎn)時(shí),重新擷取該調(diào)整后圖像所對應(yīng)的一區(qū)塊的圖像。
17.如權(quán)利要求12所述的便攜式電子裝置,其還包含一提示單元,該程序代碼另指示該處理器通過該提示單元指示一使用者平移該文件,使該圖像擷取裝置依序擷取該多個(gè)區(qū)塊的該多個(gè)圖像。
全文摘要
一種文件掃描方法、文件掃描裝置及便攜式電子裝置。該文件掃描方法包含有由一圖像擷取裝置擷取一文件的多個(gè)區(qū)塊的多個(gè)圖像;根據(jù)該圖像擷取裝置擷取該多個(gè)圖像時(shí)與該多個(gè)區(qū)塊的距離,調(diào)整該多個(gè)圖像的特性,以產(chǎn)生多個(gè)調(diào)整后圖像;判斷該多個(gè)調(diào)整后圖像中每一調(diào)整后圖像的多個(gè)特征點(diǎn)及該多個(gè)特征點(diǎn)的多個(gè)特征向量;以及根據(jù)該多個(gè)調(diào)整后圖像的每一調(diào)整后圖像的該多個(gè)特征向量,結(jié)合該多個(gè)調(diào)整后圖像,以產(chǎn)生該文件的一掃描結(jié)果。
文檔編號H04N1/028GK102843479SQ20111019265
公開日2012年12月26日 申請日期2011年7月11日 優(yōu)先權(quán)日2011年6月24日
發(fā)明者李昌明, 林楷宸, 陳建安 申請人:緯創(chuàng)資通股份有限公司