亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

<code id="dzukr"><label id="dzukr"></label></code>
  • 對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置與流程

    文檔序號(hào):11655325閱讀:321來源:國(guó)知局
    對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置與流程

    本發(fā)明涉及圖像處理領(lǐng)域,更具體地涉及一種用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置。



    背景技術(shù):

    近來,攝像裝置已經(jīng)成為非常普遍的裝置。手機(jī)、個(gè)人電腦和平板電腦都集成有攝像裝置。人們經(jīng)常通過他們的攝像裝置捕獲大量的紙質(zhì)文檔來幫助他們記錄信息。由于拍攝角度等原因,拍攝到的文檔會(huì)發(fā)生透視變換,這樣文檔圖像中的信息不容易由人類讀取,并且更難以由計(jì)算機(jī)讀取。出于這樣的原因,文檔圖像的透視校正已經(jīng)受到更多的關(guān)注。

    目前存在一些可以將捕獲的文檔校正成矩形的方法。然而,這些方法無法基于一幅捕獲的文檔圖像來恢復(fù)原始文檔圖像的高寬比。

    期望提供一種能夠方便地對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置。



    技術(shù)實(shí)現(xiàn)要素:

    在下文中給出關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。

    本發(fā)明的一個(gè)主要目的在于,提供了一種對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法,包括:確定文檔圖像的四個(gè)頂點(diǎn)的世界坐標(biāo);基于四個(gè)頂點(diǎn)的世界坐標(biāo)與四個(gè)頂點(diǎn)在射影空間的射影坐標(biāo)的對(duì)應(yīng)關(guān)系以及攝像裝置的內(nèi)參矩陣和攝像裝置的外參矩陣的特性來計(jì)算文檔圖像的原始的寬高比;基于四個(gè)頂點(diǎn)的世界坐標(biāo)和寬高比來確定射影變換矩陣;以及基于所確定的射影變換矩陣和文檔圖像來獲得校正的文檔圖像。

    根據(jù)本發(fā)明的一個(gè)方面,提供一種對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置,包括:頂點(diǎn)坐標(biāo)確定單元,被配置為確定文檔圖像的四個(gè)頂點(diǎn)的世界坐標(biāo);寬高比計(jì)算單元,被配置為基于四個(gè)頂點(diǎn)的世界坐標(biāo)與四個(gè)頂點(diǎn)在射影空間的射影坐標(biāo)的對(duì)應(yīng)關(guān)系、攝像裝置的內(nèi)參矩陣和攝像裝置的外參矩陣的特性來計(jì)算文檔圖像的原始的寬高比;射影變換矩陣確定單元,被配置為基于四個(gè)頂點(diǎn)的世界坐標(biāo)和寬高比來確定射影變換矩陣;以及校正單元,被配置為基于所確定的射影變換矩陣和文檔圖像來獲得校正的文檔圖像。

    另外,本發(fā)明的實(shí)施例還提供了用于實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序。

    此外,本發(fā)明的實(shí)施例還提供了至少計(jì)算機(jī)可讀介質(zhì)形式的計(jì)算機(jī)程序產(chǎn)品,其上記錄有用于實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序代碼。

    通過以下結(jié)合附圖對(duì)本發(fā)明的最佳實(shí)施例的詳細(xì)說明,本發(fā)明的這些以及其他優(yōu)點(diǎn)將更加明顯。

    附圖說明

    參照下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例的說明,會(huì)更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。

    圖1a示出了攝像裝置拍攝的一張文檔圖像;

    圖1b示出了校正后的文檔圖像;

    圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法200的示例性過程的流程圖;

    圖3是示出圖2中的步驟s202的一種示例性過程的流程圖;

    圖4a示出了攝像裝置拍攝的文檔圖像的四個(gè)頂點(diǎn)的坐標(biāo);

    圖4b示出了原始文檔圖像的四個(gè)頂點(diǎn)的坐標(biāo);

    圖5是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置500的示例性配置的框圖;

    圖6是示出圖5中的頂點(diǎn)坐標(biāo)確定單元502的一種示例性配置的框圖;

    圖7是示出可以用于實(shí)施本發(fā)明的用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置的計(jì)算設(shè)備的示例性結(jié)構(gòu)圖。

    具體實(shí)施方式

    在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡(jiǎn)明起見,在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。

    在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的設(shè)備結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。

    本發(fā)明提出了一種可以僅通過一幅捕獲的圖像來校正透視變換并按照原始寬高比恢復(fù)原始圖像的方法。

    在本發(fā)明的方法中,輸入為一張拍攝的矩形的文檔(矩形文檔在同一平面內(nèi))的圖像,如圖1a所示,是用攝像裝置拍攝的一張文檔圖像??梢缘玫降妮敵鰹椋何臋n圖像的原始高寬比;以及校正后的圖像。通過本發(fā)明的方法對(duì)圖1a中的文檔圖像進(jìn)行校正,可以得到圖1b所示的圖像。

    下面結(jié)合附圖詳細(xì)說明根據(jù)本發(fā)明的實(shí)施例的對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置。下文中的描述按如下順序進(jìn)行:

    1.用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法

    2.用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置

    3.用以實(shí)施本申請(qǐng)的方法和裝置的計(jì)算設(shè)備

    [1.用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法]

    圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法200的示例性過程的流程圖。

    首先,在步驟s202中,確定攝像裝置所捕獲的文檔圖像的四個(gè)頂點(diǎn)在圖像中的位置(即世界坐標(biāo))。

    圖3是示出圖2中的步驟s202(即,確定攝像裝置所捕獲的文檔圖像的四個(gè)頂點(diǎn)在圖像中的位置)的一種示例性過程的流程圖。

    如圖3所示,在步驟s2022中,首先檢測(cè)文檔圖像的邊緣。例如,可以通過rgb梯度方法來進(jìn)行檢測(cè)。接著,在步驟s2024中,對(duì)檢測(cè)到的邊緣進(jìn)行二值化。最后,在步驟s2026中,基于二值化的邊緣來確定四個(gè)頂點(diǎn)的世界坐標(biāo)。

    在本發(fā)明的方法中,也可以將文檔圖像的四個(gè)頂點(diǎn)的世界坐標(biāo)作為已知參數(shù)預(yù)先輸入。

    接著,在步驟s204中,基于四個(gè)頂點(diǎn)的世界坐標(biāo)與四個(gè)頂點(diǎn)在射影空間的射影坐標(biāo)的對(duì)應(yīng)關(guān)系以及攝像裝置的內(nèi)參矩陣和攝像裝置的外參矩陣的特性來計(jì)算文檔圖像的原始的寬高比。

    具體地,圖4a示出了用攝像裝置拍攝的一幅文檔圖像,其四個(gè)頂點(diǎn)分別為m1、m2、m3、m4。四個(gè)頂點(diǎn)mi(i=1,2,3,4)的坐標(biāo)可以通過以上關(guān)于步驟s202所述的圖像處理方法來確定。假設(shè)mi中任意三點(diǎn)不共線。

    圖4b示出的原始文檔為矩形,設(shè)其高寬比為r,則可令其四個(gè)頂點(diǎn)xi(i=1,2,3,4)的坐標(biāo)分別為[0,0,1]t、[1,0,1]t、[1,r,1]t和[0,r,1]t,高寬比r被定義為x1x4:x1x2。

    假設(shè)從平面x1x2x3x4到平面m1m2m3m4的射影變換矩陣為h,則xi與mi滿足以下(1)式的關(guān)系:

    其中,h為3*3矩陣,xi和mi(i=1,2,3,4)是3*1向量,而si(i=1,2,3)為實(shí)數(shù)系數(shù)。

    通過(1)式,可以得到:

    當(dāng)原始文檔的高寬比r不為0時(shí),矩陣[x1,x2,x3]可逆,則

    再將(2)式代回(1)式,可以得到:

    由于

    所以

    令h=[h1h2h3],則由(2)式可以得到:

    從而可以得到h1和h2與寬高比r和世界坐標(biāo)mi的關(guān)系為:

    在(4)式中,因?yàn)閙i已知,si可以通過mi計(jì)算,因而在h1和h2中僅含未知數(shù)r。

    另一方面,從攝像裝置參數(shù)的角度來說,射影變換h滿足h=a·r,其中,a為攝像裝置的內(nèi)參矩陣,r為攝像裝置的旋轉(zhuǎn)矩陣(也稱為外參矩陣)。

    如果用ri表示旋轉(zhuǎn)矩陣r的第i列,則有

    h=a·r=a·[r1r2r3t](5)

    根據(jù)外參數(shù)的性質(zhì)和|r1|=|r2|,可以得到下面的公式(6)和公式(7)。

    當(dāng)內(nèi)參矩陣a已知時(shí),根據(jù)公式(4)和公式(7)可求得文檔高寬比r。

    攝像裝置的內(nèi)參矩陣a為

    其中fx,fy為攝像裝置以像素為單位的橫、縱坐標(biāo)軸上的焦距,(x0,y0)為主點(diǎn)的坐標(biāo)。依據(jù)exif(可交換圖像文件)信息,攝像裝置的焦距為f,分辨率為w*h,傳感器尺寸為a*b時(shí),則內(nèi)參矩陣a為:

    再令h1=(h11,h21,h31)t,h2=1/r(h12,h22,h32)t,根據(jù)公式(7)可以得到:

    這樣,就計(jì)算出了原始寬高比r。

    接著,在步驟s206中,基于四個(gè)頂點(diǎn)的世界坐標(biāo)和寬高比來確定射影變換矩陣。

    最后,在步驟s208中,基于所確定的射影變換矩陣和所捕獲的文檔圖像可以獲得校正的文檔圖像。

    根據(jù)本發(fā)明的方法在應(yīng)用于用手機(jī)攝像頭拍攝圖像時(shí)具有以下特殊情況。

    某些手機(jī)具有正方形模式。例如正常圖像的分辨率為3264*2448,而正方形模式下拍攝的圖片分辨率為2448*2448,即,對(duì)原始圖像進(jìn)行了裁剪。根據(jù)本發(fā)明的方法在應(yīng)用于以正方形模式拍攝的圖像時(shí),輸入裁剪前的圖片的分辨率即可,即w=3264,h=2448。

    此外,對(duì)于以變焦(zooming)模式拍攝的圖像,可以從exif中讀出手機(jī)的數(shù)字變焦,變焦后的焦距f為原始焦距foriginal乘以數(shù)字變焦(digitalzooming)。

    在本發(fā)明的方法中,基于攝像裝置的地理空間和算術(shù)特性,可以恢復(fù)原始文檔的寬高比。并且本發(fā)明的方法僅需要捕獲一幅圖像即可實(shí)現(xiàn)對(duì)文檔圖像的校正,這對(duì)于用戶來說非常方便。

    [2.用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置]

    圖5是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置500的示例性配置的框圖。

    如圖5所示,用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置500包括頂點(diǎn)坐標(biāo)確定單元502、寬高比計(jì)算單元504、射影變換矩陣確定單元506和校正單元508。

    其中,頂點(diǎn)坐標(biāo)確定單元502被配置為確定所述文檔圖像的四個(gè)頂點(diǎn)的世界坐標(biāo)。

    寬高比計(jì)算單元504被配置為基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)與所述四個(gè)頂點(diǎn)在射影空間的射影坐標(biāo)的對(duì)應(yīng)關(guān)系、所述攝像裝置的內(nèi)參矩陣和所述攝像裝置的外參矩陣的特性來計(jì)算所述文檔圖像的原始的寬高比。

    射影變換矩陣確定單元506被配置為基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)和所述寬高比來確定射影變換矩陣。

    校正單元508被配置為基于所確定的所述射影變換矩陣和所述文檔圖像來獲得校正的文檔圖像。

    圖6是示出圖5中的頂點(diǎn)坐標(biāo)確定單元502的一種示例性配置的框圖。頂點(diǎn)坐標(biāo)確定單元502包括:邊緣檢測(cè)子單元5022、二值化子單元5024和坐標(biāo)確定子單元5026。

    其中,邊緣檢測(cè)子單元5022被配置為檢測(cè)所述文檔圖像的邊緣。

    二值化子單元5024被配置為對(duì)檢測(cè)到的所述邊緣進(jìn)行二值化。

    坐標(biāo)確定子單元5026被配置為基于二值化的邊緣來確定所述四個(gè)頂點(diǎn)的世界坐標(biāo)。

    其中,射影變換矩陣h滿足:

    其中,h是3*3矩陣,mi和xi是3*1向量,mi是所述四個(gè)頂點(diǎn)的世界坐標(biāo),xi是所述四個(gè)頂點(diǎn)在射影空間下的射影坐標(biāo),si是取決于mi的實(shí)數(shù)系數(shù)。

    其中,令所述射影變換矩陣h=[h1h2h3],則h1和h2與所述寬高比r和所述世界坐標(biāo)mi的關(guān)系為:

    其中,所述攝像裝置的內(nèi)參矩陣a為:

    其中,f是攝像裝置的焦距,w和h是分辨率,a和b是傳感器尺寸。

    其中,所述攝像裝置的外參矩陣的特性為:如果將所述外參矩陣表示為r=[r1r2r3t],則r1t·r2=0且|r1|=|r2|。

    其中,基于所述攝像裝置的內(nèi)參矩陣a和所述攝像裝置的外參矩陣的特性得到h1和h2與所述內(nèi)參矩陣a的關(guān)系為:

    其中,基于h1和h2與所述寬高比r和所述世界坐標(biāo)mi的關(guān)系以及h1和h2與所述內(nèi)參矩陣a的關(guān)系來確定所述寬高比r。

    其中,基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)和所述寬高比來確定所述射影變換矩陣h為:

    關(guān)于用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置500的各個(gè)部分的操作和功能的細(xì)節(jié)可以參照結(jié)合圖1-4描述的本發(fā)明的用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法的實(shí)施例,這里不再詳細(xì)描述。

    在此需要說明的是,圖5-6所示的裝置及其組成單元的結(jié)構(gòu)僅僅是示例性的,本領(lǐng)域技術(shù)人員可以根據(jù)需要對(duì)圖5-6所示的結(jié)構(gòu)框圖進(jìn)行修改。

    本發(fā)明提出一種用于對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法和裝置。和傳統(tǒng)方法相比,本方法具有如下優(yōu)勢(shì):

    1、基于攝像裝置的地理空間和算術(shù)特性,可以恢復(fù)原始文檔的寬高比,這是現(xiàn)有方法例如officelens無法實(shí)現(xiàn)的;

    2、僅需要捕獲一幅圖像即可實(shí)現(xiàn)對(duì)文檔圖像的校正,這對(duì)于用戶來說非常方便。

    [3.用以實(shí)施本申請(qǐng)的方法和裝置的計(jì)算設(shè)備]

    以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理,但是,需要指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和裝置的全部或者任何步驟或者部件,可以在任何計(jì)算裝置(包括處理器、存儲(chǔ)介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。

    因此,本發(fā)明的目的還可以通過在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實(shí)現(xiàn)。也就是說,這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲(chǔ)有這樣的程序產(chǎn)品的存儲(chǔ)介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲(chǔ)介質(zhì)可以是任何公知的存儲(chǔ)介質(zhì)或者將來所開發(fā)出來的任何存儲(chǔ)介質(zhì)。

    在通過軟件和/或固件實(shí)現(xiàn)本發(fā)明的實(shí)施例的情況下,從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī),例如圖7所示的通用計(jì)算機(jī)700安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等等。

    在圖7中,中央處理單元(cpu)701根據(jù)只讀存儲(chǔ)器(rom)702中存儲(chǔ)的程序或從存儲(chǔ)部分708加載到隨機(jī)存取存儲(chǔ)器(ram)703的程序執(zhí)行各種處理。在ram703中,也根據(jù)需要存儲(chǔ)當(dāng)cpu701執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。cpu701、rom702和ram703經(jīng)由總線704彼此鏈路。輸入/輸出接口705也鏈路到總線704。

    下述部件鏈路到輸入/輸出接口705:輸入部分706(包括鍵盤、鼠標(biāo)等等)、輸出部分707(包括顯示器,比如陰極射線管(crt)、液晶顯示器(lcd)等,和揚(yáng)聲器等)、存儲(chǔ)部分708(包括硬盤等)、通信部分709(包括網(wǎng)絡(luò)接口卡比如lan卡、調(diào)制解調(diào)器等)。通信部分709經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器710也可鏈路到輸入/輸出接口705??刹鹦督橘|(zhì)711比如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等根據(jù)需要被安裝在驅(qū)動(dòng)器710上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲(chǔ)部分708中。

    在通過軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲(chǔ)介質(zhì)比如可拆卸介質(zhì)711安裝構(gòu)成軟件的程序。

    本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖7所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)711??刹鹦督橘|(zhì)711的例子包含磁盤(包含軟盤(注冊(cè)商標(biāo)))、光盤(包含光盤只讀存儲(chǔ)器(cd-rom)和數(shù)字通用盤(dvd))、磁光盤(包含迷你盤(md)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器?;蛘撸鎯?chǔ)介質(zhì)可以是rom702、存儲(chǔ)部分708中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。

    本發(fā)明還提出一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明實(shí)施例的方法。

    相應(yīng)地,用于承載上述存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品的存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。存儲(chǔ)介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲(chǔ)卡、存儲(chǔ)棒等。

    本領(lǐng)域的普通技術(shù)人員應(yīng)理解,在此所例舉的是示例性的,本發(fā)明并不局限于此。

    在本說明書中,“第一”、“第二”以及“第n個(gè)”等表述是為了將所描述的特征在文字上區(qū)分開,以清楚地描述本發(fā)明。因此,不應(yīng)將其視為具有任何限定性的含義。

    作為一個(gè)示例,上述方法的各個(gè)步驟以及上述設(shè)備的各個(gè)組成模塊和/或單元可以實(shí)施為軟件、固件、硬件或其組合,并作為相應(yīng)設(shè)備中的一部分。上述裝置中各個(gè)組成模塊、單元通過軟件、固件、硬件或其組合的方式進(jìn)行配置時(shí)可使用的具體手段或方式為本領(lǐng)域技術(shù)人員所熟知,在此不再贅述。

    作為一個(gè)示例,在通過軟件或固件實(shí)現(xiàn)的情況下,可以從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī)(例如圖7所示的通用計(jì)算機(jī)700)安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等。

    在上面對(duì)本發(fā)明具體實(shí)施例的描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其他實(shí)施方式中使用,與其他實(shí)施方式中的特征相組合,或替代其他實(shí)施方式中的特征。

    應(yīng)該強(qiáng)調(diào),術(shù)語“包括/包含”在本文使用時(shí)指特征、要素、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其他特征、要素、步驟或組件的存在或附加。

    此外,本發(fā)明的方法不限于按照說明書中描述的時(shí)間順序來執(zhí)行,也可以按照其他的時(shí)間順序地、并行地或獨(dú)立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。

    本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解在不超出由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進(jìn)行各種改變、替代和變換。而且,本發(fā)明的范圍不僅限于說明書所描述的過程、設(shè)備、手段、方法和步驟的具體實(shí)施例。本領(lǐng)域內(nèi)的普通技術(shù)人員從本發(fā)明的公開內(nèi)容將容易理解,根據(jù)本發(fā)明可以使用執(zhí)行與在此的相應(yīng)實(shí)施例基本相同的功能或者獲得與其基本相同的結(jié)果的、現(xiàn)有和將來要被開發(fā)的過程、設(shè)備、手段、方法或者步驟。因此,所附的權(quán)利要求旨在在它們的范圍內(nèi)包括這樣的過程、設(shè)備、手段、方法或者步驟。

    基于以上的說明,可知公開至少公開了以下技術(shù)方案:

    1、一種對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的方法,包括:

    確定所述文檔圖像的四個(gè)頂點(diǎn)的世界坐標(biāo);

    基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)與所述四個(gè)頂點(diǎn)在射影空間的射影坐標(biāo)的對(duì)應(yīng)關(guān)系以及所述攝像裝置的內(nèi)參矩陣和所述攝像裝置的外參矩陣的特性來計(jì)算所述文檔圖像的原始的寬高比;

    基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)和所述寬高比來確定射影變換矩陣;以及

    基于所確定的所述射影變換矩陣和所述文檔圖像來獲得校正的文檔圖像。

    2、根據(jù)權(quán)利要求1所述的方法,其中,確定所述文檔圖像的四個(gè)頂點(diǎn)包括:

    檢測(cè)所述文檔圖像的文檔邊緣;

    對(duì)檢測(cè)到的所述邊緣的灰度圖進(jìn)行二值化;以及

    基于二值化的所述邊緣的灰度圖來確定所述四個(gè)頂點(diǎn)的世界坐標(biāo)。

    3、根據(jù)權(quán)利要求1所述的方法,其中,所述射影變換矩陣h滿足:

    其中,h是3*3矩陣,mi和xi是3*1向量,mi是所述四個(gè)頂點(diǎn)的世界坐標(biāo),xi是所述四個(gè)頂點(diǎn)在射影空間下的射影坐標(biāo),si是取決于mi的實(shí)數(shù)系數(shù)。

    4、根據(jù)權(quán)利要求3所述的方法,其中,令所述射影變換矩陣h=[h1h2h3],則h1和h2與所述寬高比r和所述世界坐標(biāo)mi的關(guān)系為:

    5、根據(jù)權(quán)利要求4所述的方法,其中,所述攝像裝置的內(nèi)參矩陣a為:

    其中,f是攝像裝置的焦距,w和h是分辨率,a和b是傳感器尺寸。

    6、根據(jù)權(quán)利要求5所述的方法,其中,所述攝像裝置的外參矩陣的特性為:如果將所述外參矩陣表示為r=[r1r2r3t],則r1t·r2=0且|r1|=|r2|。

    7、根據(jù)權(quán)利要求6所述的方法,其中,基于所述攝像裝置的內(nèi)參矩陣a和所述攝像裝置的外參矩陣的特性得到h1和h2與所述內(nèi)參矩陣a的關(guān)系為:

    8.根據(jù)權(quán)利要求7所述的方法,其中,基于h1和h2與所述寬高比r和所述世界坐標(biāo)mi的關(guān)系以及h1和h2與所述內(nèi)參矩陣a的關(guān)系來確定所述寬高比r。

    9、根據(jù)權(quán)利要求8所述的方法,其中,基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)和所述寬高比來確定所述射影變換矩陣h為:

    10、一種對(duì)攝像裝置所捕獲的文檔圖像進(jìn)行校正的裝置,包括:

    頂點(diǎn)坐標(biāo)確定單元,被配置為確定所述文檔圖像的四個(gè)頂點(diǎn)的世界坐標(biāo);

    寬高比計(jì)算單元,被配置為基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)與所述四個(gè)頂點(diǎn)在射影空間的射影坐標(biāo)的對(duì)應(yīng)關(guān)系、所述攝像裝置的內(nèi)參矩陣和所述攝像裝置的外參矩陣的特性來計(jì)算所述文檔圖像的原始的寬高比;

    射影變換矩陣確定單元,被配置為基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)和所述寬高比來確定射影變換矩陣;以及

    校正單元,被配置為基于所確定的所述射影變換矩陣和所述文檔圖像來獲得校正的文檔圖像。

    11、根據(jù)權(quán)利要求10所述的裝置,其中,所述頂點(diǎn)坐標(biāo)確定單元包括:

    邊緣檢測(cè)子單元,被配置為檢測(cè)所述文檔圖像的文檔邊緣;

    二值化子單元,被配置為對(duì)檢測(cè)到的所述邊緣的灰度圖進(jìn)行二值化;以及

    坐標(biāo)確定子單元,被配置為基于二值化的所述邊緣的灰度圖來確定所述四個(gè)頂點(diǎn)的世界坐標(biāo)。

    12、根據(jù)權(quán)利要求10所述的裝置,其中,所述射影變換矩陣h滿足:

    其中,h是3*3矩陣,mi和xi是3*1向量,mi是所述四個(gè)頂點(diǎn)的世界坐標(biāo),xi是所述四個(gè)頂點(diǎn)在射影空間下的射影坐標(biāo),si是取決于mi的實(shí)數(shù)系數(shù)。

    13、根據(jù)權(quán)利要求12所述的裝置,其中,令所述射影變換矩陣h=[h1h2h3],則h1和h2與所述寬高比r和所述世界坐標(biāo)mi的關(guān)系為:

    14、根據(jù)權(quán)利要求13所述的裝置,其中,所述攝像裝置的內(nèi)參矩陣a為:

    其中,f是攝像裝置的焦距,w和h是分辨率,a和b是傳感器尺寸。

    15、根據(jù)權(quán)利要求14所述的裝置,其中,所述攝像裝置的外參矩陣的特性為:如果將所述外參矩陣表示為r=[r1r2r3t],則r1t·r2=0且|r1|=|r2|。

    16、根據(jù)權(quán)利要求15所述的裝置,其中,基于所述攝像裝置的內(nèi)參矩陣a和所述攝像裝置的外參矩陣的特性得到h1和h2與所述內(nèi)參矩陣a的關(guān)系為:

    17.根據(jù)權(quán)利要求16所述的裝置,其中,基于h1和h2與所述寬高比r和所述世界坐標(biāo)mi的關(guān)系以及h1和h2與所述內(nèi)參矩陣a的關(guān)系來確定所述寬高比r。

    18、根據(jù)權(quán)利要求17所述的裝置,其中,基于所述四個(gè)頂點(diǎn)的世界坐標(biāo)和所述寬高比來確定所述射影變換矩陣h為:

    當(dāng)前第1頁1 2 
    網(wǎng)友詢問留言 已有0條留言
    • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
    1