專利名稱:圖像編碼裝置、圖像譯碼裝置、文字核對裝置和數(shù)據(jù)存儲媒體的制作方法
技術領域:
本發(fā)明涉及圖像編碼裝置、圖像譯碼裝置和數(shù)據(jù)存儲媒體,特別是將利用掃描器等把文書圖像數(shù)據(jù)即文書圖像(包含文字的圖像)電子化而得到的2值的圖像數(shù)據(jù)有效地編碼并傳輸或存儲的編碼處理和與其對應的譯碼處理以及存儲使計算機進行這些處理的程序的數(shù)據(jù)存儲媒體。
另外,本發(fā)明涉及文字核對裝置和數(shù)據(jù)存儲媒體,特別是將作為檢索對象的文字圖像(表示文字的圖像)不對與其對應的編碼數(shù)據(jù)(文字圖像代碼)進行譯碼而與輸入的檢索數(shù)據(jù)進行核對的核對處理和存儲使計算機進行該核對處理的程序的數(shù)據(jù)存儲媒體。
迄今,已有了將包含文字及照片等的文書圖像的信息電子化而作為文書圖像數(shù)據(jù)進行登錄的文書文卷裝置,但是,近年來,由于登錄到這樣的文書文卷裝置中的文書圖像數(shù)據(jù)的增大,在登錄文書圖像時,輸入或更新用于檢索文書圖像的關鍵字或分類代碼的工作量大增。
因此,為了減輕在進行這樣的文書圖像的登錄時的檢索用數(shù)據(jù)的輸入或更新的工作量,在最近的文書文卷裝置中,存儲文書圖像數(shù)據(jù)的文書圖像存儲單元采用將利用掃描器等將文書圖像電子化而得到的文書圖像數(shù)據(jù)與將文書圖像進行文字識別后得到的文字數(shù)據(jù)組合而進行存儲的結構(參見特許公報第2560656號(特開平8-87528號))。
圖39是用于說明先有的文書文卷裝置的一例的框圖。
先有的文書文卷裝置3900具有使用MH(Modified Huffman)或MR(Modified Read)等方法、將從外部輸入的把文書圖像電子化而得到的2值圖像數(shù)據(jù)(文書圖像數(shù)據(jù))Di編碼、并輸出與上述文書圖像對應的編碼數(shù)據(jù)De的圖像編碼單元3902,和對上述文書圖像數(shù)據(jù)Di進行文字識別處理、并對包含在上述文書圖像中的各文字將多個候補文字的文字代碼Dco作為文字數(shù)據(jù)而輸出的文字識別單元3901。在該文字識別單元3901的文字識別處理中,使用OCR(Optical Character Reader)的圖形識別等方法。
另外,上述文書文卷裝置3900還具有使與各個文書圖像對應的編碼數(shù)據(jù)De和文字代碼(即與該文書圖像關聯(lián)的多個候補文字的文字代碼)Dco相關聯(lián)而進行存儲的文書圖像存儲單元3903。
此外,上述文書文卷裝置3900還具有根據(jù)從外部作為檢索數(shù)據(jù)Da而輸入的文字代碼、讀出上述文書圖像存儲單元3903存儲的與指定的文書圖像對應的編碼數(shù)據(jù)De的數(shù)據(jù)讀出單元3904,和將讀出的編碼數(shù)據(jù)De進行譯碼而復原為與指定的文書圖像對應的文書圖像數(shù)據(jù)Di的圖像譯碼單元3905。這里,上述數(shù)據(jù)讀出單元3904將作為上述檢索數(shù)據(jù)Da的文字代碼(檢索文字代碼)與文書圖像存儲單元3903存儲的文字代碼(存儲文字代碼)進行核對,輸出與和該檢索文字代碼一致的存儲文字代碼對應的文書圖像的編碼數(shù)據(jù)De。
在該文書文卷裝置3900中,將上述文字識別單元3901采用作為通過對各文字的文字識別處理而得到的文字數(shù)據(jù)而輸出多個候補文字的文字代碼Dco的結構,這樣,來減輕檢索中的文字識別錯誤的影響。
在這樣的結構的文書文卷裝置3900中,在輸入文書圖像數(shù)據(jù)Di時,由圖像編碼單元3902進行該文書圖像數(shù)據(jù)Di的編碼處理,輸出編碼數(shù)據(jù)De,由文字識別單元3901根據(jù)該文書圖像數(shù)據(jù)Di從文書圖像中抽出包含在其中的文字圖像,輸出與該文字圖像對應的多個候補文字的文字代碼Dco。
并且,使與1個文書圖像對應的編碼數(shù)據(jù)De與多個文字代碼Dco相關聯(lián)而存儲到文書圖像存儲單元3903中。
另外,在從外部輸入檢索數(shù)據(jù)Da時,由數(shù)據(jù)讀出單元3904根據(jù)作為該檢索數(shù)據(jù)Da的文字代碼讀出上述文書圖像存儲單元3903存儲的與指定的文書圖像對應的編碼數(shù)據(jù)De,由圖像譯碼單元3905對該編碼數(shù)據(jù)De進行譯碼處理后復原為文書圖像數(shù)據(jù)Di。
然而,在上述結構的先有的文書文卷裝置3900中,由圖像編碼單元3902進行的文書圖像數(shù)據(jù)Di的編碼處理與包含在文書圖像中的文字的種類無關,或者與包含在該文書圖像中的文字、圖、照片等文書圖像的構成要素的種類無關,都一樣地進行,所以,存在隨情況不同而編碼效率變壞的問題。
另外,在先有的文書文卷裝置3900的文字識別單元3901中,通過對包含在文書圖像中的各文字的文字識別處理,對包含在文書圖像中的各文字輸出多個候補文字的文字代碼,但是,通常在根據(jù)對1個文字的文字識別的結構而得到的多個候補文字中存在包含與文字形狀非常相似的文字對應的文字的傾向。換言之,如果知道了1個候補文字(通常為第1候補文字),則其他的候補文字便可類推,所以,如上所述,通過對各文字的文字識別,將導出多個候補文字代碼,從而通過文字識別而得到的文字數(shù)據(jù)將變得非常冗長,數(shù)據(jù)量大增。
本發(fā)明就是為了解決上述問題而提案,目的旨在提供不影響對包含在文書圖像中的文字圖像的檢索的容易性而可以實現(xiàn)對包含文字的文書圖像的數(shù)據(jù)有效地進行編碼的編碼處理的圖像編碼裝置、可以良好地進行與該編碼處理對應的譯碼處理的圖像譯碼裝置和存儲用于使計算機進行上述編碼處理和譯碼處理的程序的數(shù)據(jù)存儲媒體。
本發(fā)明的目的還在于提供對將與文字圖像(文書圖像的文字部分)對應的圖像數(shù)據(jù)進行編碼而得到的文字圖像代碼不進行譯碼而可以與輸入的文字數(shù)據(jù)比較進行核對的核對處理的文書核對裝置和存儲用于使計算機進行上述核對處理的程序的數(shù)據(jù)存儲媒體。
本發(fā)明(權利要求1)的圖像編碼裝置是將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與和該對象圖像類似的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)表示構成上述對象圖像的多個部分圖像的特征的圖像特征數(shù)據(jù)生成與和上述多個部分圖像類似的部分預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、根據(jù)與上述多個部分預測圖像對應的圖像數(shù)據(jù)和表示對象圖像的部分圖像的位置和大小的輔助數(shù)據(jù)合成上述多個部分預測圖像從而生成與上述預測圖像對應的圖像數(shù)據(jù)的圖像合成單元和利用上述對象圖像與預測圖像間的像素值相關對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,與該熵代碼一起輸出上述圖像特征數(shù)據(jù)和輔助數(shù)據(jù)。
在這種結構的權利要求1所述的圖像編碼裝置中,根據(jù)表示對象圖像的特征的圖像特征數(shù)據(jù)生成與對象圖像對應的預測圖像數(shù)據(jù),對與上述對象圖像對應的圖像數(shù)據(jù)進行參照上述預測圖像數(shù)據(jù)的熵編碼處理,所以,可以提高對上述對象圖像的圖像數(shù)據(jù)的熵編碼處理的編碼效率。另外,不會損失利用圖像特征數(shù)據(jù)對對象圖像的檢索的容易性。
本發(fā)明(權利要求2)在權利要求1所述的圖像編碼裝置中,具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)生成表示構成上述對象圖像的各部分圖像的特征的圖像特征數(shù)據(jù)和表示上述對象圖像的各部分圖像的位置和大小的輔助數(shù)據(jù)的圖像特征抽出單元。
在這種結構的權利要求2所述的圖像編碼裝置中,除了上述權利要求1所述的圖像編碼裝置的結構外,還具有從與上述對象圖像對應的圖像數(shù)據(jù)中抽出上述圖像特征數(shù)據(jù)的圖像特征抽出單元,所以,除了權利要求1所述的可以不損失利用圖像特征數(shù)據(jù)對對象圖像的檢索的容易性而提高編碼效率的效果外,可以自動地從對象圖像的圖像數(shù)據(jù)中抽出圖像特征數(shù)據(jù),從而可以得到作為傳真裝置等的圖像編碼單元而有用的圖像編碼裝置。
本發(fā)明(權利要求3)在權利要求2所述的圖像編碼裝置中,上述熵編碼單元具有與構成預測圖像的指定尺寸的預測塊對應地分割上述預測圖像的圖像數(shù)據(jù)并輸出與各預測塊對應的圖像數(shù)據(jù)的第1圖像塊化單元、與構成對象圖像的指定尺寸的對象塊對應地份上述對象圖像的圖像數(shù)據(jù)并輸出與各對象塊對應的圖像數(shù)據(jù)的第2圖像塊化單元,和根據(jù)各預測塊和對象塊間的像素值相關對與上述各對象塊對應的圖像數(shù)據(jù)進行熵編碼的塊預測編碼單元,上述塊預測編碼單元在上述對象塊與預測塊的差別在一定的基準值以上時,對與對象塊對應的圖像數(shù)據(jù)進行熵編碼,與對應的圖像編碼數(shù)據(jù)一起輸出編碼標志,在上述對象塊與預測塊的椎小于一定的基準值時,就不對對象塊進行熵編碼處理,而輸出非編碼標志。
在這種結構的權利要求3所述的圖像編碼裝置中,根據(jù)與對象圖像對應的預測圖像數(shù)據(jù)將該預測圖像分割為指定尺寸的預測塊,同時將上述對象圖像分割為指定尺寸的對象塊,將與各對象塊對應的圖像數(shù)據(jù)參照與對應的預測塊對應的圖像數(shù)據(jù)進行熵編碼,這時,僅對與預測塊間的像素值的差分大于指定值的對象塊發(fā)送對應的編碼數(shù)據(jù),所以,可以不計在塊單位的比較中小的差別,對視聽者不會有畫質(zhì)劣化的印象,可以大大提高編碼效率。
本發(fā)明(權利要求4)在權利要求2所述的圖像編碼裝置中,具有對上述預測圖像的圖像數(shù)據(jù)進行省略該預測圖像的細部的濾波處理并輸出預測圖像的濾波處理數(shù)據(jù)的圖像濾波處理單元,在上述熵編碼單元中,根據(jù)上述濾波處理數(shù)據(jù)對對象圖像的圖像數(shù)據(jù)進行熵編碼處理。
在這種結構的權利要求4所述的圖像編碼裝置中,對根據(jù)與對象圖像對應的圖像數(shù)據(jù)而得到的預測圖像數(shù)據(jù)進行濾波處理,參照進行了該濾波處理的預測圖像數(shù)據(jù)對上述對象圖像的圖像數(shù)據(jù)進行熵編碼處理,所以,通過上述濾波處理可以減小對對象圖像的預測圖像的預測誤差,從而可以進一步提高對上述對象圖像的圖像數(shù)據(jù)進行熵編碼處理的編碼效率。
本發(fā)明(權利要求5)的圖像譯碼裝置是將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)利用該對象圖像和與其類似的預測圖像間的像素值相關進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示構成上述對象圖像的多個部分圖像的特征的圖像特征數(shù)據(jù)生成與和上述多個部分圖像類似的部分預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、根據(jù)與上述多個部分預測圖像對應的圖像數(shù)據(jù)和表示上述對象圖像的部分圖像的位置和大小的輔助數(shù)據(jù)、合成上述多個部分預測圖像、從而生成與上述預測圖像對應的圖像數(shù)據(jù)的圖像合成單元,和根據(jù)與上述預測圖像對應的圖像數(shù)據(jù)、利用上述對象圖像與預測圖像間的像素值相關、對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理、從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
在這種結構的權利要求5所述的圖像譯碼裝置中,根據(jù)對象圖像的圖像特征生成與對象圖像對應的預測圖像數(shù)據(jù),參照上述預測圖像數(shù)據(jù)對與對象圖像對應的編碼數(shù)據(jù)進行熵譯碼,所以,可以實現(xiàn)與使用預測圖像數(shù)據(jù)的效率高的對象圖像數(shù)據(jù)的熵編碼處理對應的譯碼處理。
本發(fā)明(權利要求6)的圖像譯碼裝置是接收從權利要求3所述的圖像編碼裝置輸出的圖像編碼數(shù)據(jù)、編碼標志或非編碼標志、圖像特征數(shù)據(jù)和輔助數(shù)據(jù)而生成與對象圖像對應的圖像編碼數(shù)據(jù)的圖像譯碼裝置,其特征在于具有根據(jù)表示構成上述對象圖像的多個部分圖像的特征的圖像特征數(shù)據(jù)生成與和上述多個部分圖像類似的部分預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、根據(jù)與上述多個部分預測圖像對應的圖像數(shù)據(jù)和表示上述對象圖像的部分圖像的位置和大小的輔助數(shù)據(jù)合成上述多個部分預測圖像從而生成與上述預測圖像對應的圖像數(shù)據(jù)的圖像合成單元、與構成預測圖像的指定尺寸的預測塊對應地分割上述預測圖像的圖像數(shù)據(jù)并輸出與各預測塊對應的圖像數(shù)據(jù)的圖像塊化單元、根據(jù)與各預測塊對應的圖像數(shù)據(jù)流上述對象塊與預測塊間的像素值相關對與上述對象塊對應的圖像編碼數(shù)據(jù)進行熵譯碼處理從而生成與上述對象塊對應的圖像數(shù)據(jù)的塊預測譯碼單元,和接收與上述預測塊對應的圖像數(shù)據(jù)和與對象塊對應的圖像數(shù)據(jù)并根據(jù)上述編碼標志和非編碼標志使用對象塊和預測塊組裝上述對象圖像從而復原與該對象圖像對應的圖像數(shù)據(jù)的塊組裝單元。
在這種結構的權利要求6所述的圖像譯碼裝置中,根據(jù)從對象圖像中抽出的圖像特征預先作成預測圖像,將該預測圖像分割為指定尺寸的預測文書塊,生成與預測圖像塊對應的圖像數(shù)據(jù),參照預測圖像塊的圖像數(shù)據(jù)對與分割對象圖像而得到的指定尺寸的圖像塊對應的編碼數(shù)據(jù)進行熵譯碼,這時,對未進行編碼處理的預測誤差小的對象圖像的塊輸出對應的預測圖像的塊的圖像數(shù)據(jù),所以,可以實現(xiàn)與使用預測圖像數(shù)據(jù)的按指定尺寸的塊單位效率高的對象圖像的圖像數(shù)據(jù)的編碼處理對應的譯碼處理。
本發(fā)明(權利要求7)在權利要求5所述的圖像譯碼裝置中,具有對上述預測圖像的圖像數(shù)據(jù)進行省略該預測圖像的細部的濾波處理并輸出預測圖像的濾波處理數(shù)據(jù)的圖像濾波處理單元,在上述熵譯碼單元中,根據(jù)上述濾波處理數(shù)據(jù)對對象圖像的圖像編碼數(shù)據(jù)進行熵譯碼處理。
在這種結構的權利要求7所述的圖像譯碼裝置中,根據(jù)對象圖像的圖像特征預先生成與預測圖像對應的圖像數(shù)據(jù),對預測圖像數(shù)據(jù)進行省略該預測圖像的細部的濾波處理,參照進行了濾波處理的預測圖像數(shù)據(jù)對與對象圖像對應的編碼數(shù)據(jù)進行熵譯碼,所以,可以實現(xiàn)與使用進行了濾波處理的預測圖像數(shù)據(jù)的效率高的對象圖像數(shù)據(jù)的編碼處理對應的譯碼處理。
本發(fā)明(權利要求8)的圖像編碼裝置是對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與和對象圖像類似的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的特征的圖像特征數(shù)據(jù)生成與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元和利用上述對象圖像與預測圖像間的像素值相關對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,對上述對象圖像輸出熵代碼和圖像特征數(shù)據(jù)。
在這種結構的權利要求8所述的圖像編碼裝置中,根據(jù)與作為編碼處理的對象的對象圖像對應的圖像特征數(shù)據(jù)生成與上述對象圖像對應的預測圖像數(shù)據(jù)并根據(jù)該預測圖像數(shù)據(jù)對對象圖像數(shù)據(jù)進行熵編碼處理,所以,可以提高熵編碼處理的編碼效率。
另外,和與上述對象圖像數(shù)據(jù)對應的熵代碼(編碼數(shù)據(jù))一起輸出與對象圖像對應的圖像特征數(shù)據(jù),所以,也可以根據(jù)圖像特征數(shù)據(jù)檢索與對象圖像對應的編碼數(shù)據(jù)。
本發(fā)明(權利要求9)在權利要求8所述的圖像編碼裝置中,具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)從上述對象圖像中抽出其圖像特征并將圖像特征數(shù)據(jù)向上述預測圖像生成單元輸出的圖像特征抽出單元。
在這種結構的權利要求9所述的圖像編碼裝置中,具有從對象圖像數(shù)據(jù)中抽出與對象圖像對應的圖像特征數(shù)據(jù)的圖像特征抽出單元,所以,除了權利要求8的效果外,可以由圖像編碼裝置從對象圖像數(shù)據(jù)中抽出圖像特征數(shù)據(jù),從而可以得到適合于作為文書編檔裝置或傳真裝置中的圖像編碼單元的圖像編碼裝置。
本發(fā)明(權利要求10)在權利要求9所述的圖像編碼裝置中,上述圖像特征抽出單元由與分割對象圖像的指定尺寸的多個塊對應地分割與上述對象圖像對應的圖像數(shù)據(jù)從而生成與各塊對應的圖像數(shù)據(jù)的塊化單元、和將與上述各塊對應的圖像數(shù)據(jù)轉換為在各塊內(nèi)的各像素的像素值中出現(xiàn)頻度最高的最頻像素值并作為與上述對象圖像對應的圖像特征數(shù)據(jù)而輸出與由和上述各塊對應的最頻像素值組成的縮小圖像對應的圖像數(shù)據(jù)的塊平滑化單元構成,上述預測圖像生成單元生成與對上述指定尺寸的塊將上述縮小圖像的各像素放大而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù)。
在這種結構的權利要求10所述的圖像編碼裝置中,與分割對象圖像的指定尺寸的多個塊對應地分割與上述對象圖像對應的圖像數(shù)據(jù),將與上述各塊對應的圖像數(shù)據(jù)轉換為在各塊內(nèi)的各像素的像素值中出現(xiàn)頻度最高的最頻像素值,作為與上述對象圖像對應的圖像特征數(shù)據(jù),輸出與由和上述各塊對應的最頻像素值組成的縮小圖像對應的圖像數(shù)據(jù),所以,可以簡單地作成表示對象圖像的特征的圖像特征數(shù)據(jù)。
本發(fā)明(權利要求11)在權利要求9所述的圖像編碼裝置中,上述圖像特征抽出單元由根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)輸出表示與該對象圖像類似的類似圖像的特征的特征矢量的特征量抽出單元、和將對通過對上述特征矢量的量化處理而劃分定義了多個學習矢量的矢量空間的多個區(qū)域中的包含上述特征矢量的區(qū)域設定的標識符作為與上述對象圖像對應的圖像特征數(shù)據(jù)而輸出的矢量量化單元構成,上述預測圖像生成單元根據(jù)與設定了上述標識符的矢量空間的區(qū)域對應的代表特征矢量和最近的學習矢量生成與上述對象圖像對應的預測圖像的圖像數(shù)據(jù)。
在這種結構的權利要求11所述的圖像編碼裝置中,具有作為對象圖像的圖像特征抽出與和對象圖像類似的類似圖像對應的標識符的圖像特征抽出單元,根據(jù)上述標識符作為對象圖像的預測圖像,求上述類似圖像,參照該類似圖像對對象圖像數(shù)據(jù)進行熵編碼處理,所以,可以提高熵編碼處理的編碼效率,而且也可以使用上述標識符檢索對對象圖像的編碼數(shù)據(jù)。
另外,將與包含在對象圖像(文書圖像)中的各個文字圖像對應的特征矢量進行量化處理,根據(jù)與其對應的代表特征矢量生成與上述文字圖像對應的預測圖像數(shù)據(jù),所以,作為上述文書圖像的各文字圖像的圖像特征數(shù)據(jù),輸出1個代表特征矢量,可以避免與文書圖像對應的圖像特征數(shù)據(jù)變得冗長,而且可以減輕在利用圖像特征數(shù)據(jù)進行文書圖像的檢索時文字識別的錯誤(特征抽出的偏差)的影響。
本發(fā)明(權利要求12)的圖像譯碼裝置是將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)利用該對象圖像與和其類似的預測圖像間的像素值相關進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的圖像特征的圖像特征數(shù)據(jù)生成與和該對象圖像對應的預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、和根據(jù)與上述預測圖像對應的圖像數(shù)據(jù)利用上述對象圖像與預測圖像間的像素值相關對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
在這種結構的權利要求12所述的圖像譯碼裝置中,具有根據(jù)與對象圖像對應的圖像特征數(shù)據(jù)生成與對象圖像對應的預測圖像數(shù)據(jù)的預測圖像生成單元,參照預測圖像數(shù)據(jù)對該編碼數(shù)據(jù)進行算術譯碼處理,所以,可以實現(xiàn)將利用對象圖像與預測圖像的相關通過編碼效率高的算術編碼處理而得到的熵代碼正確地進行譯碼的圖像譯碼裝置。
本發(fā)明(權利要求13)在權利要求1、權利要求2、權利要求8和權利要求9中的任一權項所述的圖像編碼裝置中,上述圖像特征數(shù)據(jù)是與分割上述對象圖像的指定尺寸的塊對應地分割對象圖像的圖像數(shù)據(jù)并將與各塊對應的圖像數(shù)據(jù)置換為各塊內(nèi)的像素的像素值中出現(xiàn)頻度最高的最頻像素值而得到的與縮小圖像對應的圖像數(shù)據(jù),上述預測圖像生成單元生成與將上述縮小圖像的各像素對上述指定尺寸的塊放大而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù)。
在這種結構的權利要求13所述的圖像編碼裝置中,和上述權利要求10一樣,作為與上述對象圖像對應的圖像特征數(shù)據(jù),輸出由與上述各塊對應的最頻像素值構成的與縮小圖像對應的圖像數(shù)據(jù),所以,可以簡單地作成表示對象圖像的特征的圖像特征數(shù)據(jù)。
本發(fā)明(權利要求14)在權利要求5或權利要求12所述的圖像譯碼裝置中,上述圖像特征數(shù)據(jù)是與分割上述對象圖像的指定尺寸的塊對應地分割對象圖像的圖像數(shù)據(jù)并將與各塊對應的圖像數(shù)據(jù)置換為各塊內(nèi)的像素的像素值中出現(xiàn)頻度最高的最頻像素值而得到的與縮小圖像對應的圖像數(shù)據(jù),上述預測圖像生成單元生成與將上述縮小圖像的各像素對上述指定尺寸的塊放大而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù)。
在這種結構的權利要求14所述的圖像譯碼裝置中,將把與分割對象圖像的指定尺寸的塊對應的圖像數(shù)據(jù)置換為各塊內(nèi)的像素的像素值中出現(xiàn)頻度最高的最頻像素值而得到的與縮小圖像對應的圖像數(shù)據(jù)作為特征圖像數(shù)據(jù)接收,生成與將上述縮小圖像的各像素對上述指定尺寸的塊放大而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù),所以,可以實現(xiàn)與權利要求13所述的圖像編碼裝置對應的圖像譯碼裝置。
本發(fā)明(權利要求15)在權利要求1、權利要求2、權利要求8、權利要求9中的任一權項所述的圖像編碼裝置中,上述圖像特征數(shù)據(jù)是與從使用表示與該對象圖像類似的類似圖像的特征的特征矢量預先在矢量空間中定義的多個已存矢量中選擇的選擇矢量對應的標識符,上述預測圖像生成單元將由與上述標識符對應的選擇矢量所特定的圖像數(shù)據(jù)作為對上述對象圖像的預測圖像的圖像數(shù)據(jù)而輸出。
在這種結構的權利要求15所述的圖像編碼裝置中,作為對象圖像的圖像特征,使用與和對象圖像類似的類似圖像對應的標識符,根據(jù)上述標識符,作為對象圖像的預測圖像,求上述類似圖像,參照該類似圖像對對象圖像數(shù)據(jù)進行熵編碼處理,所以,可以提高熵編碼處理的編碼效率,而且也可以使用上述標識符檢索對對象圖像的編碼數(shù)據(jù)。
本發(fā)明(權利要求16)在權利要求5或權利要求12所述的圖像譯碼裝置中,上述圖像特征數(shù)據(jù)是與從使用表示與該對象圖像類似的類似圖像的特征的特征矢量預先在矢量空間中定義的多個已存矢量中選擇的選擇矢量對應的標識符,上述預測圖像生成單元將由與上述標識符對應的選擇矢量所特定的圖像數(shù)據(jù)作為對上述對象圖像的預測圖像的圖像數(shù)據(jù)而輸出。
在這種結構的權利要求16所述的圖像譯碼裝置中,作為圖像特征數(shù)據(jù)使用與和對象圖像類似的類似圖像對應的標識符,根據(jù)上述標識符作為對上述對象圖像的預測圖像數(shù)據(jù)而輸出,所以,可以實現(xiàn)利用與對象圖像的類似圖像對應的標識符和對象圖像與預測圖像的像素值相關通過編碼效率高的熵編碼處理而得到的熵代碼正確地進行譯碼的圖像譯碼裝置。
本發(fā)明(權利要求17)的圖像編碼裝置是將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有接收從外部輸入的與上述預測圖像對應的圖像數(shù)據(jù),并根據(jù)與上述預測圖像對應的圖像數(shù)據(jù),利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理,從而作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,與對上述對象圖像的熵代碼一起輸出與上述預測圖像對應的圖像數(shù)據(jù)。
在這種結構的權利要求17所述的圖像編碼裝置中,具有將對象圖像數(shù)據(jù)參照與其對應的預測圖像數(shù)據(jù)進行熵編碼處理的熵代碼單元,所以,在進行對象圖像數(shù)據(jù)的編碼處理時,通過指定與該對象圖像類似的類似圖像的數(shù)據(jù)并將該數(shù)據(jù)作為與對象圖像對應預測圖像數(shù)據(jù)而輸入,便可提高熵編碼處理的編碼效率。
本發(fā)明(權利要求18)在權利要求17所述的圖像編碼裝置中,具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)將與和該對象圖像類似的預測圖像對應的圖像數(shù)據(jù)向上述熵編碼單元輸出的圖像預測單元。
在這種結構的權利要求18所述的圖像編碼裝置中,根據(jù)對象圖像數(shù)據(jù)生成與其對應的預測圖像數(shù)據(jù),參照預測圖像數(shù)據(jù)將上述對象圖像數(shù)據(jù)進行熵編碼,所以,可以提高熵編碼處理的編碼效率,而且也可以使用上述標識符檢索對對象圖像的編碼數(shù)據(jù)。
本發(fā)明(權利要求19)在權利要求18所述的圖像編碼裝置中,上述圖像預測單元由根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)輸出表示與該對象圖像類似的類似圖像的圖像特征的特征矢量的特征量抽出單元、通過對上述特征矢量的量化處理將在劃分定義了多個學習矢量的矢量空間的多個區(qū)域中的上述特征矢量的區(qū)域中設定的標識符作為對上述對象圖像的圖像特征數(shù)據(jù)而輸出的矢量量化單元,和根據(jù)與設定上述標識符的矢量空間中的區(qū)域對應的代表特征矢量和最近的學習矢量生成與上述對象圖像對應的預測圖像的數(shù)據(jù)的預測圖像生成單元構成。
在這種結構的權利要求19所述的圖像編碼裝置中,具有根據(jù)對象圖像數(shù)據(jù)生成與其對應的預測圖像數(shù)據(jù)的預測圖像生成單元,將上述對象圖像數(shù)據(jù)參照預測圖像數(shù)據(jù)進行熵編碼,所以,和上述權利要求18一樣,可以提高熵編碼處理的編碼效率,而且也可以使用上述標識符檢索對對象圖像的編碼數(shù)據(jù)。
本發(fā)明(權利要求20)的圖像譯碼裝置是將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)利用該對象圖像和與其類似的預測圖像間的像素值相關進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)與和上述對象圖像對應的圖像編碼數(shù)據(jù)獨立地輸入的與預測圖像對應的圖像數(shù)據(jù)利用上述對象圖像與預測圖像間的像素值相關對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
在這種結構的權利要求20所述的圖像譯碼裝置中,參照與對象圖像對應的預測圖像數(shù)據(jù)對與對象圖像對應的編碼數(shù)據(jù)進行熵譯碼處理,所以,可以實現(xiàn)將通過利用對象圖像與預測圖像的相關的編碼效率高的熵編碼處理而得到的熵代碼正確地進行譯碼的圖像譯碼裝置。
本發(fā)明(權利要求21)的圖像編碼裝置是將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與該對象圖像的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)從上述對象圖像中抽出其圖像特征并輸出與對象圖像對應的圖像特征數(shù)據(jù)的圖像特征抽出單元、根據(jù)與上述對象圖像對應的圖像特征數(shù)據(jù)生成與和上述對象圖像類似的類似圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、使與編碼處理結束的對象圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)相關聯(lián)作為與處理過的圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)而存儲的預測圖像存儲單元、通過比較與對象圖像對應的圖像特征數(shù)據(jù)和預測圖像存儲單元存儲的與處理過的圖像對應的圖像特征數(shù)據(jù)、而將上述類似圖像或指定的處理過的圖像作為預測圖像而選擇的預測圖像選擇單元,和利用上述對象圖像與預測圖像間的像素值相關、對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理、并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,上述預測圖像選擇單元作為上述預測圖像在輸出表示選擇上述類似圖像和指定的處理過的圖像中的哪一個的標志的同時輸出與上述對象圖像對應的圖像特征數(shù)據(jù)。
在這種結構的權利要求21所述的圖像編碼裝置中,具有通過比較與對象圖像對應的圖像特征數(shù)據(jù)和預測圖像存儲單元存儲的與處理過的圖像對應的圖像特征數(shù)據(jù)選擇與該對象圖像對應的類似圖像和指定的處理過的圖像的一方的預測圖像選擇單元,由對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼的熵編碼單元在輸出表示選擇上述類似圖像和指定的處理過的圖像中的哪一個的標志的同時輸出與上述對象圖像對應的圖像特征數(shù)據(jù),所以,不僅可以提高熵編碼處理的編碼效率,而且在例如作為編碼處理的對象的文字圖像是和已進行了編碼處理的文字圖像相同時可以省略生成對對象圖像的預測圖像數(shù)據(jù)的處理,從而可以減輕使用預測圖像的編碼處理的運算負載。
本發(fā)明(權利要求22)在權利要求21所述的圖像編碼裝置中,上述圖像特征抽出單元由根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)作為與對象圖像對應的圖像特征數(shù)據(jù)生成第1特征矢量的特征量抽出單元和根據(jù)上述第1特征矢量進行對上述對象圖像的文字識別并生成與對象圖像對應的文字代碼的文字識別單元構成,上述預測圖像生成單元根據(jù)與上述對象圖像對應的文字代碼作為第1預測圖像數(shù)據(jù)而生成與該對象圖像的類似圖像對應的圖像數(shù)據(jù),上述預測圖像存儲單元將與結束了上述編碼處理的對象圖像對應的圖像數(shù)據(jù)、文字代碼和第1特征矢量相關聯(lián)地進行存儲,上述預測圖像選擇單元將和與對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的圖像數(shù)據(jù)和特征矢量作為第2預測圖像數(shù)據(jù)和第2特征矢量而讀出,根據(jù)上述第1和第2特征矢量的比較結果輸出上述第1和第2預測圖像數(shù)據(jù)中的一方。
在這種結構的權利要求22所述的圖像編碼裝置中,由上述預測圖像選擇單元通過比較與類似圖像對應的特征矢量和與處理過的圖像對應的特征矢量將上述類似圖像或處理過的圖像選擇為預測圖像,所以,可以通過對應的特征矢量的比較這樣簡單的處理進行類似圖像或處理過的圖像的選擇。
本發(fā)明(權利要求23)的圖像譯碼裝置是將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)利用該對象圖像和與其對應的預測圖像間的像素值相關進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的圖像特征的圖像特征數(shù)據(jù)生成與和該對象圖像類似的類似圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、將與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)相關聯(lián)作為與處理過的圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)而存儲的預測圖像存儲單元、作為在編碼處理時與對象圖像對應的預測圖像根據(jù)表示使用從對象圖像的圖像特征得到的類似圖像和編碼處理過的圖像中的哪一個的標志信息將上述類似圖像或指定的處理過的圖像選擇為預測圖像的預測圖像選擇單元,和根據(jù)與上述預測圖像對應的圖像數(shù)據(jù)利用上述對象圖像與預測圖像間的像素值相關對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
在這種結構的權利要求23所述的圖像譯碼裝置中,在從對象圖像的文字代碼得到的字體圖像(第1預測圖像)和過去進行了譯碼處理的文字圖像(第2預測圖像)中根據(jù)對象圖像選擇類似的作為預測圖像,參照所選擇的預測圖像數(shù)據(jù)對與對象圖像對應的熵代碼進行譯碼處理,所以,在熵編碼處理的編碼效率高而且作為編碼處理的對象的文字圖像和已進行了編碼處理的文字圖像相同時可以實現(xiàn)能夠省略對對象圖像的預測圖像數(shù)據(jù)的生成處理從而可以降低運算負載的與熵編碼處理對應的譯碼處理。
本發(fā)明(權利要求24)在權利要求23所述的圖像譯碼裝置中,上述預測圖像生成單元根據(jù)作為與對象圖像對應的圖像特征數(shù)據(jù)的文字代碼生成與上述對象圖像對應的第1預測圖像數(shù)據(jù),上述預測圖像存儲單元使與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和文字代碼相關聯(lián)作為與處理過的圖像對應的圖像數(shù)據(jù)和文字代碼進行存儲,上述預測圖像選擇單元將與和對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的圖像數(shù)據(jù)作為第2預測圖像數(shù)據(jù)從上述預測圖像存儲單元中讀出,并根據(jù)上述標志信息輸出上述第1和第2預測圖像數(shù)據(jù)中的一方的數(shù)據(jù)。
在這種結構的權利要求24所述的圖像譯碼裝置中,根據(jù)上述標志信息,在根據(jù)對象圖像的文字代碼得到的字體圖像(第1預測圖像)和過去進行了譯碼處理的文字圖像(第2預測圖像)中根據(jù)對象圖像選擇類似的作為預測圖像,所以,可以簡單地進行在譯碼側的預測圖像的選擇處理。
本發(fā)明(權利要求25)的圖像編碼裝置是將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與該對象圖像的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)從上述對象圖像中抽出其圖像特征并輸出與對象圖像對應的圖像特征數(shù)據(jù)的圖像特征抽出單元、根據(jù)與上述對象圖像對應的圖像特征數(shù)據(jù)生成與和上述對象圖像類似的類似圖像對應的圖像數(shù)據(jù)的預測圖像生成單元、將與編碼處理結束的對象圖像對應的圖像特征數(shù)據(jù)作為與處理過的圖像對應的圖像特征數(shù)據(jù)進行存儲的預測圖像存儲單元、通過比較與對象圖像對應的圖像特征數(shù)據(jù)和與預測圖像存儲單元存儲的處理過的圖像對應的圖像特征數(shù)據(jù)進行輸出與上述類似圖像對應的圖像數(shù)據(jù)、與對象圖像對應的圖像特征數(shù)據(jù)和表示進行編碼處理的編碼標志的第1數(shù)據(jù)輸出處理和輸出與對象圖像對應的圖像特征數(shù)據(jù)和表示不進行編碼處理的非編碼標志的第2數(shù)據(jù)輸出處理中的一方的數(shù)據(jù)輸出處理的數(shù)據(jù)輸出控制單元,和利用上述對象圖像和類似圖像間的像素值相關對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,該熵編碼單元接收到上述編碼標志時就進行上述熵編碼處理,在接收到上述非編碼標志時就不進行上述熵編碼處理,從而不輸出熵代碼。
在這種結構的權利要求25所述的圖像編碼裝置中,通過比較與對象圖像對應的圖像特征數(shù)據(jù)和與預測圖像存儲單元存儲的處理過的圖像對應的圖像特征數(shù)據(jù),進行輸出與上述類似圖像對應的圖像數(shù)據(jù)、與對象圖像對應的圖像特征數(shù)據(jù)和表示進行編碼處理的編碼標志的第1數(shù)據(jù)輸出處理和輸出與對象圖像對應的圖像特征數(shù)據(jù)和表示不進行編碼處理的非編碼標志的第2數(shù)據(jù)輸出處理中的一方的數(shù)據(jù)輸出處理,所以,不僅可以提高熵編碼處理的編碼效率,而且在例如作為編碼處理的對象的文字圖像與已進行了編碼處理的文字圖像相同時可以省略生成對對象圖像的預測圖像數(shù)據(jù)的處理和對對象圖像數(shù)據(jù)的熵編碼處理,從而可以減輕使用預測圖像的運算編碼處理的運算負載。
本發(fā)明(權利要求26)在權利要求25所述的圖像編碼裝置中,上述圖像特征抽出單元由根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)作為與對象圖像對應的圖像特征數(shù)據(jù)而生成第1特征矢量的特征量抽出單元、和根據(jù)上述第1特征矢量對上述對象圖像曬文字識別并生成與對象圖像對應的文字代碼的文字識別單元構成,上述預測圖像生成單元根據(jù)與上述對象圖像對應的文字代碼作為預測圖像數(shù)據(jù)生成與其類似圖像對應的圖像數(shù)據(jù),上述預測圖像存儲單元使與上述編碼處理結束的對象圖像對應的文字代碼與第1特征矢量相關聯(lián)而進行存儲,上述數(shù)據(jù)輸出控制單元將與和對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的特征矢量作為與預測圖像對應的第2特征矢量而讀出,進行輸出與上述類似圖像對應的圖像數(shù)據(jù)、與對象圖像對應的圖像特征數(shù)據(jù)和表示進行編碼處理的編碼標志的第1數(shù)據(jù)輸出處理和輸出與對象圖像對應的圖像特征數(shù)據(jù)和表示不進行編碼處理的非編碼標志的第2數(shù)據(jù)輸出處理中的一方的數(shù)據(jù)輸出處理。
在這種結構的權利要求26所述的圖像編碼裝置中,上述第1和第2數(shù)據(jù)處理都輸出作為編碼處理的對象的文字圖像的文字代碼,所以,可以使用上述文字代碼檢索對對象圖像的編碼數(shù)據(jù)。
本發(fā)明(權利要求27)的圖像譯碼裝置是將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、利用該對象圖像和與其對應的預測圖像間的像素值相關、進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的圖像特征的圖像特征數(shù)據(jù)生成與該對象圖像對應的第1預測圖像數(shù)據(jù)的預測圖像生成單元、與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)相關聯(lián)而作為與處理過的圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)進行存儲的預測圖像存儲單元、接收到表示進行了編碼處理的編碼標志時就進行輸出上述第1預測圖像數(shù)據(jù)和該編碼標志的第1數(shù)據(jù)輸出處理而在接收到表示未進行編碼處理的非編碼標志時就從上述預測圖像存儲單元這作為第2預測圖像數(shù)據(jù)讀出與譯碼處理過的圖像對應的圖像數(shù)據(jù)并進行輸出第2預測圖像數(shù)據(jù)和該非編碼標志的第2數(shù)據(jù)輸出處理的數(shù)據(jù)輸出控制單元、和在接收到上述編碼標志時根據(jù)第1預測圖像數(shù)據(jù)利用上述對象圖像和預測圖像間的像素值相關對與該對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理并生成與上述對象圖像對應的譯碼數(shù)據(jù)而在接收到上述非編碼標志時就將上述第2預測圖像數(shù)據(jù)作為與上述對象圖像對應的譯碼數(shù)據(jù)而輸出的熵譯碼單元。
在這種結構的權利要求27所述的圖像譯碼裝置中,在接收編碼標志時根據(jù)與對象圖像對應的預測圖像數(shù)據(jù)利用上述對象圖像和預測圖像間的像素值相關對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理,生成與上述對象圖像對應的譯碼數(shù)據(jù),而在接收到上述非編碼標志時,將與譯碼處理過的圖像對應的圖像數(shù)據(jù)作為與上述對象圖像對應的譯碼數(shù)據(jù)而輸出,所以,不僅可以提高算術編碼器的編碼效率,而且在例如作為編碼處理的對象的文字圖像和已進行了編碼處理的文字圖像相同時可以省略生成對對象圖像的預測圖像數(shù)據(jù)的處理和對對象圖像數(shù)據(jù)的算術編碼處理,從而可以實現(xiàn)可以降低運算負載的與算術編碼處理對應的算術譯碼處理。
本發(fā)明(權利要求28)在權利要求27所述的圖像譯碼裝置中,上述預測圖像生成單元根據(jù)作為與對象圖像對應的圖像特征數(shù)據(jù)的文字代碼生成與上述對象圖像對應的第1預測圖像數(shù)據(jù),上述預測圖像存儲單元將與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和文字代碼相關聯(lián)而作為與處理過的圖像對應的圖像數(shù)據(jù)和文字代碼進行存儲,上述數(shù)據(jù)輸出控制單元將與和對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的圖像數(shù)據(jù)作為第2預測圖像數(shù)據(jù)讀出,并根據(jù)上述標志信息輸出上述第1和第2預測圖像數(shù)據(jù)的中的一方的數(shù)據(jù)。
在這種結構的權利要求28所述的圖像譯碼裝置中,根據(jù)上述標志信息,在根據(jù)對象圖像的文字代碼而得到的字體圖像(第1預測圖像)和過去已進行了譯碼處理的文字圖像(第2預測圖像)中根據(jù)對象圖像選擇類似的作為預測圖像,所以,可以簡單地進行譯碼側的預測圖像的選擇處理。
本發(fā)明(權利要求29)在權利要求1、權利要求2、權利要求8、權利要求9、權利要求17、權利要求18、權利要求21、和權利要求25中的任一權項所述的圖像編碼裝置中,上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行切換構成對象圖像的各像素的像素值的發(fā)生概率的算術編碼處理而得到的算術代碼,上述熵編碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)切換各像素的像素值的發(fā)生概率。
在這種結構的權利要求29算術的圖像編碼裝置中,根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)以更高的編碼效率進行對對象圖像數(shù)據(jù)的算術編碼處理。
本發(fā)明(權利要求30)在權利要求5、權利要求12、權利要求20、權利要求23、和權利要求27中的任一權項算術的圖像譯碼裝置中,上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行切換構成對象圖像的各像素的像素值的發(fā)生概率的算術編碼處理而得到的算術代碼,上述熵譯碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的譯碼過的部分對應的圖像數(shù)據(jù)對與上述對象圖像對應的算術代碼進行切換各像素的像素值的發(fā)生概率的算術譯碼處理,再生與上述對象圖像對應的圖像數(shù)據(jù)。
在這種結構的權利要求30所述的圖像譯碼裝置中,根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)以更高的編碼效率進行對與對象圖像對應的編碼數(shù)據(jù)的算術譯碼處理。
本發(fā)明(權利要求31)在權利要求1、權利要求2、權利要求8、權利要求9、權利要求17、權利要求18、權利要求21、和權利要求25中的任一權項所述的圖像編碼裝置中,上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行切換構成對象圖像的各像素的霍夫曼編碼表的編碼處理而得到的霍夫曼代碼,上述熵編碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)切換各像素的霍夫曼編碼表。
在這種結構的權利要求31所述的圖像編碼裝置中,根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)以更高的編碼效率進行對對象圖像的霍夫曼編碼處理。
本發(fā)明(權利要求32)在權利要求5、權利要求12、權利要求20、權利要求23、和權利要求27中的任一權項算術的圖像譯碼裝置中,上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行對構成對象圖像的各像素切換霍夫曼編碼表的編碼處理而得到的霍夫曼代碼,上述熵譯碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的譯碼過的部分對應的圖像數(shù)據(jù)對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行對各像素切換霍夫曼編碼處理的譯碼處理,再生與上述對象圖像對應的圖像數(shù)據(jù)。
在這種結構的權利要求32所述的圖像譯碼裝置中,根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的譯碼過的部分對應的圖像數(shù)據(jù)可以以更高的編碼效率對與對象圖像對應的編碼數(shù)據(jù)進行霍夫曼譯碼處理。
本發(fā)明(權利要求33)在權利要求1、權利要求2、權利要求8、權利要求9、權利要求17、權利要求18、權利要求21、和權利要求25中的任一權項所述的圖像編碼裝置中,具有接收與上述對象圖像關聯(lián)的屬性信息并將上述屬性信息附加到與上述對象圖像對應的圖像編碼數(shù)據(jù)上而輸出的屬性信息附加單元。
在這種結構的權利要求33所述的圖像編碼裝置中,將關于對象圖像的屬性信息附加到與對象圖像對應的圖像編碼數(shù)據(jù)上而輸出,所以,不將例如作為圖像編碼數(shù)據(jù)的文字圖像代碼進行譯碼就可以知道文字圖像的屬性。
另外,在使用圖像特征數(shù)據(jù)進行文字圖像的檢索時,可以參照文字圖像的屬性信息進行快速檢索。
本發(fā)明(權利要求34)的圖像編碼裝置是將與作為編碼處理的對象的包含文字圖像的對象圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有接收與上述對象圖像對應的圖像數(shù)據(jù)對與包含在上述對象圖像中的文字圖像對應的圖像數(shù)據(jù)進行編碼并輸出文字圖像代碼的文字圖像編碼單元、將構成上述對象圖像中的上述文字圖像的配置部分的像素的像素值利用位于上述對象圖像中的上述文字圖像的配置部分的周邊的像素的像素值進行置換,生成與消去上述對象圖像的文字圖像的非文字圖像對應的圖像數(shù)據(jù)的文字圖像消去單元和將與上述非文字圖像對應的圖像數(shù)據(jù)進行編碼并輸出非文字圖像代碼的非文字圖像編碼單元,作為對上述對象圖像的編碼數(shù)據(jù),輸出上述文字圖像代碼和非文字圖像代碼。
在這種結構的權利要求34所述的圖像編碼裝置中,將文書圖像的數(shù)據(jù)分為文字圖像和非文字圖像進行編碼,所以,可以將文字圖像和非文字圖像用適用于它們的編碼效率高的編碼方法進行編碼。另外,可以利用與文字圖像對應的編碼數(shù)據(jù)(文字圖像代碼)進行文書檢索。
本發(fā)明(權利要求35)的圖像譯碼裝置是接收將與包含在對象圖像中的文字圖像對應的圖像數(shù)據(jù)編碼而得到的文字圖像代碼和將構成上述對象圖像中的上述文字圖像的配置部分的像素利用位于上述對象圖像中的上述文字圖像的配置部分的周邊的像素進行置換而得到的與非文字圖像對應的圖像數(shù)據(jù)并再生與包含上述文字圖像的對象圖像對應的圖像數(shù)據(jù)的圖像譯碼裝置,其特征在于具有將上述非文字圖像代碼進行譯碼并輸出與非文字圖像對應的圖像數(shù)據(jù)的非文字圖像譯碼單元,和將上述文字圖像代碼進行譯碼并輸出與文字圖像對應的圖像數(shù)據(jù)的文字圖像譯碼單元,和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù)和與非文字圖像對應的圖像數(shù)據(jù)將文字圖像與非文字圖像合成并輸出與包含上述文字圖像的對象圖像對應的圖像數(shù)據(jù)的圖像再構成單元。
在這種結構的權利要求35所述的圖像譯碼裝置中,作為與文書圖像對應的編碼數(shù)據(jù),分別接收文書圖像中的文字圖像的編碼數(shù)據(jù)和消去了文書圖像中的文字圖像的非文字圖像的編碼數(shù)據(jù),將各編碼數(shù)據(jù)分別進行譯碼而生成文字圖像數(shù)據(jù)和非文字圖像數(shù)據(jù),根據(jù)這些數(shù)據(jù)進行文書圖像的再構成從而生成文書圖像數(shù)據(jù),所以,可以實現(xiàn)正確將分別利用適合于文字圖像和非文字圖像的有效的編碼方法進行編碼的編碼數(shù)據(jù)進行譯碼的圖像譯碼裝置。
另外,可以利用與文字圖像對應的編碼數(shù)據(jù)(文字圖像代碼)進行文書圖像的檢索。
本發(fā)明(權利要求36)的文字核對裝置是將表示用于檢索文字圖像的檢索條件的檢索數(shù)據(jù)與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的文字圖像代碼進行核對的裝置,其特征在于具有將上述文字圖像代碼附加和與其對應的文字圖像關聯(lián)的屬性信息并根據(jù)附加到上述文字圖像代碼上的屬性信息是否滿足由上述檢索數(shù)據(jù)所示的檢索條件而進行上述檢索數(shù)據(jù)與文字圖像代碼的核對的文字屬性核對單元。
在這種結構的權利要求36所述的文字核對裝置中,具有通過附加到文字圖像代碼上的屬性信息與檢索條件的核對來判斷屬性信息是否滿足檢索條件的文字核對單元,所以,即使在文字圖像數(shù)據(jù)已進行了編碼的狀態(tài),也可以只抽出包含在文書圖像中的標題行中的大的文字或縱寫的文字串。
本發(fā)明(權利要求37)的文字核對裝置是將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了表示該文字圖像的圖像特征的圖像特征數(shù)據(jù)的文字圖像代碼進行核對的裝置,其特征在于具有從由上述文字代碼所特定的文字圖像中抽出表示該文字圖像的圖像特征的圖像特征并輸出圖像特征數(shù)據(jù)的圖像特征抽出單元,和通過附加到上述文字圖像代碼上的圖像特征數(shù)據(jù)與根據(jù)上述文字代碼得到的圖像特征數(shù)據(jù)的核對而進行上述文字圖像代碼與文字代碼是否一致的判斷的核對判斷單元。
在這種結構的權利要求37所述的文字核對裝置中,具有根據(jù)從外部輸入的文字代碼抽出由該文字代碼所特定的文字圖像的圖像特征并輸出圖像特征數(shù)據(jù)Vc的圖像特征抽出單元,所以,可以將包含在文字圖像代碼中的特征圖像數(shù)據(jù)和與文字代碼對應的文字圖像的圖像特征數(shù)據(jù)進行比較。因此,在由文字代碼所特定的文字圖像與和文字圖像代碼對應的文字圖像一致時,即使不將文字圖像譯碼也可以知道與文字圖像代碼對應的文字圖像,從而可以進行與文字圖像代碼D20對應的文字圖像與其他的文字圖像間的形狀比較。
本發(fā)明(權利要求38)在權利要求37所述的文字核對裝置中,上述附加到上述文字圖像代碼上的圖像特征數(shù)據(jù)是表示與文字圖像代碼對應的文字圖像的圖像特征的特征矢量,上述圖像特征抽出單元由根據(jù)上述文字代碼生成與由該文字代碼所特定的文字圖像對應的圖像數(shù)據(jù)的文字圖像生成單元和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù)抽出該文字圖像的圖像特征并輸出表示上述圖像特征的特征矢量的特征量抽出單元構成,上述核對單元具有計算附加到文字圖像代碼上的特征矢量與根據(jù)上述文字代碼得到的特征矢量的距離的距離計算單元,根據(jù)該距離是否大于指定的閾值來進行上述文字圖像代碼與文字代碼的一致判斷。
在這種結構的權利要求38所述的文字核對裝置中,根據(jù)附加到文字圖像代碼上的特征矢量與根據(jù)上述文字代碼得到的特征矢量的距離是否大于指定的閾值進行上述文字圖像代碼與文字代碼的一致判斷,所以,可以簡單地進行文字圖像代碼與文字代碼的核對。
本發(fā)明(權利要求39)的文字核對裝置是將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了與和該文字圖像類似的預測文字圖像對應的圖像數(shù)據(jù)的文字圖像代碼進行核對的裝置,其特征在于具有接收上述文字圖像代碼并根據(jù)與附加到該文字圖像代碼上的預測文字圖像對應的圖像數(shù)據(jù)從該預測文字圖像中抽出其圖像特征從而輸出第1圖像特征數(shù)據(jù)的第1圖像特征抽出單元、接收上述文字代碼并抽出由該文字代碼所特定的文字圖像的圖像特征從而輸出第2圖像特征數(shù)據(jù)的第2圖像特征抽出單元,和通過上述第1圖像特征數(shù)據(jù)與第2圖像特征數(shù)據(jù)的核對而進行上述文字圖像代碼與文字代碼是否一致的判斷的核對判斷單元。
在這種結構的權利要求39所述的文字核對裝置中,具有根據(jù)附加到文字圖像代碼上的預測文字圖像數(shù)據(jù)輸出與預測文字圖像對應的第1圖像特征數(shù)據(jù)的第1特征量抽出單元和根據(jù)從外部輸入的文字代碼抽出由該文字代碼所特定的文字圖像的圖像特征并輸出第2圖像特征數(shù)據(jù)的第2圖像特征抽出單元,所以,可以將與文字代碼對應的文字圖像的圖像特征數(shù)據(jù)與包含在文字圖像代碼中的預測文字圖像的特征圖像數(shù)據(jù)進行比較。因此,在判定由文字代碼特定的文字圖像與和文字圖像代碼對應的預測文字圖像一致時,即使不將文字圖像代碼進行譯碼也可以知道與文字圖像代碼對應的文字圖像,從而可以進行與文字圖像代碼對應的文字圖像與其他的文字圖像間的形狀比較。
本發(fā)明(權利要求40)在權利要求39所述的文字核對裝置中,上述第1圖像特征抽出單元作為上述第1圖像特征數(shù)據(jù)輸出第1特征矢量,上述第2圖像特征抽出單元由根據(jù)上述文字代碼生成與由該文字代碼所特定的文字圖像對應的圖像數(shù)據(jù)的文字圖像生成單元和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù)抽出該文字圖像的圖像特征并輸出表示上述圖像特征的第2特征矢量的特征量抽出單元構成,上述核對判斷單元具有計算上述第1特征矢量與第2特征矢量的距離的距離計算單元,根據(jù)該距離是否大于指定的閾值進行上述文字圖像代碼與文字代碼的一致判斷。
在這種結構的權利要求40所述的文字核對裝置中,根據(jù)附加到文字圖像代碼熵的特征矢量與根據(jù)上述文字代碼得到的特征矢量的距離是否大于指定的閾值來進行上述文字圖像代碼與文字代碼的一致判斷,所以,可以簡單地進行文字圖像代碼與文字代碼的核對。
本發(fā)明(權利要求41)的文字核對裝置是將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了表示與該文字圖像類似的預測文字圖像的標識符的文字圖像代碼進行核對的裝置,其特征在于具有存儲表示上述預測文字圖像的標識符和上述文字代碼與將它們作為變量而計算的距離信息的對應關系的文字間距離表的表存儲部、接收上述文字圖像代碼和文字代碼并參照上述文字間距離表求以附加到上述文字圖像代碼熵的預測文字圖像標示符和上述文字代碼為變量的距離信息的距離計算單元和根據(jù)上述距離信息判斷上述文字圖像代碼與上述文字代碼是否一致的核對判斷單元。
在這種結構的權利要求41所述的文字核對裝置中,具有存儲表示附加到文字圖像代碼上的預測文字圖像標示符和文字代碼與以它們?yōu)樽兞慷x的距離信息的對應關系的文字間距離表的表存儲部,上述預測文字圖像標識符是識別與和上述文字圖像代碼對應的文字圖像類似的預測文字圖像的符號,上述距離信息是根據(jù)上述文字代碼得到的特征矢量與根據(jù)預測文字圖像標識符得到的代表特征矢量間的歐幾里得距離,所以,可以進行與文字代碼對應的特征矢量和與包含在文字圖像代碼中的預測文字圖像標識符對應的特征矢量進行比較。因此,在判定由文字代碼特定的文字圖像與和文字圖像代碼對應的預測文字圖像一致時,即使不將文字圖像代碼進行譯碼,根據(jù)輸入的文字代碼也可以知道與文字圖像代碼對應的文字圖像,從而可以進行與文字圖像代碼對應的文字圖像與其他的文字圖像進行的形狀比較。
本發(fā)明(權利要求42)的文字核對裝置是將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了表示與該文字圖像類似的預測文字圖像的標識符的文字圖像代碼進行核對的裝置,其特征在于具有接收上述文字圖像代碼并根據(jù)附加到該文字圖像代碼上的表示預測文字圖像的標識符從預測文字圖像中抽出其圖像特征而輸出第1圖像特征數(shù)據(jù)的第1圖像特征抽出單元、接收上述文字代碼并抽出由該文字代碼特定的文字圖像的圖像特征而輸出第2圖像特征數(shù)據(jù)的第2圖像特征抽出單元和通過上述第1圖像特征數(shù)據(jù)與第2圖像特征數(shù)據(jù)的核對而進行上述文字圖像代碼與文字代碼是否一致的判斷的核對判斷單元。
在這種結構的權利要求42所述的文字核對裝置中,具有接收文字圖像代碼并根據(jù)附加到其上的預測文字圖像標識符輸出與預測文字圖像對應的第1圖像特征數(shù)據(jù)的第1特征量抽出單元和根據(jù)從外部輸入的文字代碼抽出由該文字代碼特定的文字圖像的圖像特征而輸出第2圖像特征數(shù)據(jù)的第2圖像特征抽出單元,所以,可以將與文字代碼對應的文字圖像的圖像特征數(shù)據(jù)與包含在文字圖像代碼中的預測文字圖像標識符對應的特征圖像數(shù)據(jù)進行比較。因此,在判定由文字代碼特定的文字圖像與和文字圖像代碼對應的預測文字圖像一致時,即使不將文字圖像代碼進行譯碼,根據(jù)輸入的文字代碼也可以知道與文字圖像代碼對應的文字圖像,從而可以進行與文字圖像代碼對應的文字圖像與其他的文字圖像進行的形狀比較。
本發(fā)明(權利要求43)的文字核對裝置在權利要求42所述的文字核對裝置中,上述第1圖像特征抽出單元作為上述第1圖像特征數(shù)據(jù)輸出第1特征矢量,上述第2圖像特征抽出單元由根據(jù)上述文字代碼生成與由該文字代碼所特定的文字圖像對應的圖像數(shù)據(jù)的文字圖像生成單元和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù)抽出該文字圖像的圖像特征并輸出表示上述圖像特征的第2特征矢量的特征量抽出單元構成,上述核對判斷單元具有計算上述第1特征矢量與第2特征矢量的距離的距離計算單元,根據(jù)該距離是否大于指定的閾值進行上述文字圖像代碼與文字代碼的一致判斷。
在這種結構的權利要求43所述的文字核對裝置中,根據(jù)附加到文字圖像代碼熵的特征矢量與根據(jù)上述文字代碼得到的特征矢量的距離是否大于指定的閾值來進行上述文字圖像代碼與文字代碼的一致判斷,所以,可以簡單地進行文字圖像代碼與文字代碼的核對。
本發(fā)明(權利要求44)的數(shù)據(jù)存儲媒體是存儲用于利用計算機進行圖像數(shù)據(jù)的處理的圖象處理程序的數(shù)據(jù)存儲媒體,其特征在于作為上述圖象處理程序,存儲用于利用計算機進行權利要求1~權利要求43中的任一權項所述的裝置的圖象處理的程序或利用計算機實現(xiàn)構成上述權利要求1~權利要求43中的任一權項所述的裝置的至少1個單元的功能的程序。
在這種結構的數(shù)據(jù)存儲媒體中,通過將上述程序安裝到計算機中,可以利用軟件實現(xiàn)權利要求1~權利要求43中的任一權項所述的裝置。
本發(fā)明(權利要求45)的傳真裝置具有將作為發(fā)信對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器、進行對象圖像數(shù)據(jù)的編碼處理并與編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置、給與上述對象圖像對應的編碼數(shù)據(jù)附加上與其對應的圖像特征數(shù)據(jù)并通過通信線路收發(fā)包含編碼數(shù)據(jù)和圖像特征數(shù)據(jù)的復合數(shù)據(jù)的收發(fā)裝置、接收包含在上述收發(fā)裝置接收的復合數(shù)據(jù)中的編碼數(shù)據(jù)和圖像特征數(shù)據(jù)并根據(jù)圖像特征數(shù)據(jù)將該編碼數(shù)據(jù)進行譯碼從而輸出對象圖像數(shù)據(jù)的圖像譯碼裝置,和根據(jù)上述對象圖像數(shù)據(jù)進行對象圖像的顯示或打印輸出的圖像輸出裝置,上述圖像編碼裝置采用和上述權利要求2、權利要求8、權利要求9、權利要求14、權利要求17、權利要求18和權利要求33中的任一權項所述的圖像編碼裝置相同的結構。
在這種結構的權利要求45所述的傳真裝置中,在進行對象圖像數(shù)據(jù)的編碼處理的圖像編碼裝置中進行和上述權利要求2、權利要求8、權利要求9、權利要求14、權利要求17、權利要求18和權利要求33中的任一權項所述的圖像編碼裝置相同的編碼處理,可以提高對對象圖像數(shù)據(jù)的編碼處理的編碼效率。
本發(fā)明(權利要求46)的傳真裝置具有將作為發(fā)信對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器、進行對象圖像數(shù)據(jù)的編碼處理并與和對象圖像對應編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置、給上述編碼數(shù)據(jù)附加上與其關聯(lián)的圖像特征數(shù)據(jù)并通過通信線路收發(fā)包含編碼數(shù)據(jù)和圖像特征數(shù)據(jù)的復合數(shù)據(jù)的收發(fā)裝置、接收包含在上述收發(fā)裝置接收的復合數(shù)據(jù)中的編碼數(shù)據(jù)和圖像特征數(shù)據(jù)并根據(jù)圖像特征數(shù)據(jù)將該編碼數(shù)據(jù)進行譯碼從而輸出對象圖像數(shù)據(jù)的圖像譯碼裝置,和根據(jù)上述對象圖像數(shù)據(jù)進行對象圖像的顯示或打印輸出的圖像輸出裝置,上述圖像譯碼裝置采用和上述權利要求5、權利要求12、和權利要求20的任一權項所述的圖像譯碼裝置相同的結構。
在這種結構的權利要求46所述的傳真裝置中,在進行對象圖像數(shù)據(jù)的編碼處理的圖像編碼裝置中進行和上述權利要求5、權利要求12、權利要求16、和權利要求20中的任一權項所述的圖像譯碼裝置相同的譯碼處理,可以實現(xiàn)與對對象圖像數(shù)據(jù)的效率高的編碼處理對應的譯碼處理。
本發(fā)明(權利要求47)的文書文卷編排裝置具有將作為傳真的對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器、進行對象圖像數(shù)據(jù)的編碼處理并與和上述對象圖像對應的編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置、使上述編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)相關聯(lián)而進行存儲的圖像存儲單元、將上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)與和其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元、使用上述圖像特征數(shù)據(jù)將該讀出的編碼數(shù)據(jù)進行譯碼而復原與指定的圖像對應的圖像數(shù)據(jù)的圖像譯碼單元和根據(jù)上述圖像數(shù)據(jù)進行上述指定的圖像的顯示或打印輸出的圖像輸出裝置,上述編碼裝置采用和上述權利要求2、權利要求8、權利要求9、權利要求14、權利要求17、權利要求18、和權利要求33中的任一權項所述的圖像編碼裝置相同的結構。
在這種結構的權利要求47所述的傳真裝置中,進行對象圖像數(shù)據(jù)的編碼處理的圖像編碼裝置中,進行和上述權利要求2、權利要求8、權利要求9、權利要求14、權利要求17、權利要求18、和權利要求33中的任一權項所述的圖像編碼裝置相同的編碼處理,可以提高對對象圖像數(shù)據(jù)的編碼處理的編碼效率。
本發(fā)明(權利要求48)的文書文卷編排裝置具有將作為傳真的對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器、進行對象圖像數(shù)據(jù)的編碼處理并與和上述對象圖像對應的編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置、使上述編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)相關聯(lián)而進行存儲的圖像存儲單元、將上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)與和其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元、使用上述圖像特征數(shù)據(jù)將該讀出的編碼數(shù)據(jù)進行譯碼而復原與指定的圖像對應的圖像數(shù)據(jù)的圖像譯碼單元和根據(jù)上述圖像數(shù)據(jù)進行上述指定的圖像的顯示或打印輸出的圖像輸出裝置,上述編碼裝置采用和上述權利要求5、權利要求12、權利要求16、和權利要求20中的任一權項所述的圖像編碼裝置相同的結構。
在這種結構的權利要求48所述的傳真裝置中,在進行對象圖像數(shù)據(jù)的編碼處理的圖像編碼裝置中進行和上述權利要求5、權利要求12、權利要求16、和權利要求20中的任一權項所述的圖像譯碼裝置相同的譯碼處理,可以實現(xiàn)與對對象圖像數(shù)據(jù)的效率高的編碼處理對應的譯碼處理。
本發(fā)明(權利要求49)的文書文卷編排裝置具有將作為傳真的對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器、進行對象圖像數(shù)據(jù)的編碼處理并與和上述對象圖像對應的編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置、使上述編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)相關聯(lián)而進行存儲的圖像存儲單元、將上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)與和其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元、使用上述圖像特征數(shù)據(jù)將該讀出的編碼數(shù)據(jù)進行譯碼而復原與指定的圖像對應的圖像數(shù)據(jù)的圖像譯碼單元和根據(jù)上述圖像數(shù)據(jù)進行上述指定的圖像的顯示或打印輸出的圖像輸出裝置,上述數(shù)據(jù)讀出單元采用包含上述權利要求36~權利要求43中的任一權項所述的文字核對裝置的結構。
在這種結構的權利要求49所述的傳真裝置中,根據(jù)作為檢索數(shù)據(jù)從外部輸入的文字代碼將與上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元采用包含上述權利要求36~權利要求43中的任一權項所述的文字核對裝置的結構,所以,在判定由文字代碼所特定的文字圖像與和文字圖像代碼對應的附加信息一致時,即使不將文字圖像代碼進行譯碼,根據(jù)輸入的文字代碼也可以知道與文字圖像代碼對應的文字圖像,從而可以進行與文字圖像代碼對應的文字圖像與其他的文字圖像間的形狀比較。
圖1是用于說明本發(fā)明實施例1的圖像編碼裝置的框圖。
圖2是用于說明本發(fā)明實施例2的圖像編碼裝置的框圖。
圖3是用于說明本發(fā)明實施例3的圖像譯碼裝置的框圖。
圖4是用于說明本發(fā)明實施例4的圖像編碼裝置的框圖。
圖5是用于說明本發(fā)明實施例5的圖像譯碼裝置的框圖。
圖6是用于說明本發(fā)明實施例6的圖像編碼裝置的框圖。
圖7是用于說明本發(fā)明實施例7的圖像譯碼裝置的框圖。
圖8是用于說明本發(fā)明實施例8的圖像編碼裝置的框圖。
圖9是用于說明本發(fā)明實施例9的圖像編碼裝置的框圖。
圖10是用于說明本發(fā)明實施例10的圖像譯碼裝置的框圖。
圖11是用于說明本發(fā)明實施例11的圖像編碼裝置的框圖。
圖12是用于說明本發(fā)明實施例12的圖像譯碼裝置的框圖。
圖13是用于說明本發(fā)明實施例13的圖像編碼裝置的框圖。
圖14是用于說明本發(fā)明實施例14的圖像編碼裝置的框圖。
圖15是用于說明本發(fā)明實施例15的圖像譯碼裝置的框圖。
圖16是用于說明本發(fā)明實施例16的圖像編碼裝置的框圖。
圖17是用于說明本發(fā)明實施例17的圖像編碼裝置的框圖。
圖18是用于說明本發(fā)明實施例18的圖像譯碼裝置的框圖。
圖19是用于說明本發(fā)明實施例19的文字核對裝置的框圖。
圖20是用于說明本發(fā)明實施例20的文字核對裝置的框圖。
圖21是用于說明本發(fā)明實施例21的文字核對裝置的框圖。
圖22是用于說明本發(fā)明實施例22的文字核對裝置的框圖。
圖23是用于說明本發(fā)明實施例23的文字核對裝置的框圖。
圖24(a)是表示與上述實施例1的文字圖像對應的XY坐標的圖,24(b)是表示與包含在該文書圖像中的文字串對應的數(shù)據(jù)的結構的圖。
圖25(a)是表示在上述實施例1的圖像編碼裝置的算術編碼處理中使用的發(fā)生概率模型的圖,圖25(b)是用于說明使用上述發(fā)生概率模型的算術編碼處理的模式圖,圖25(c)是表示通過上述算術編碼處理而得到的2進制小數(shù)的圖。
圖26是用于說明上述實施例1的圖像編碼裝置的算術編碼處理的流程的圖。
圖27是用于說明上述實施例1的預測文書圖像與文書圖像的對應關系的圖。
圖28是用于說明上述實施例4的塊預測編碼單元的處理的流程的圖。
圖29是用于說明由上述實施例4的塊預測編碼單元進行編碼的數(shù)據(jù)的模式圖。
圖30是用于說明上述實施例5的塊預測譯碼單元的處理的流程的圖。
圖31是用于說明上述實施例6的形態(tài)濾波器的動作的圖。
圖32是用于說明上述實施例8的網(wǎng)格特征的抽出方法的圖。
圖33是用于說明根據(jù)上述實施例8的網(wǎng)格特征生成預測圖像的圖。
圖34是用于說明上述實施例16的屬性信息的圖。
圖35(a)是表示上述實施例16的屬性信息的具體例的模式圖,圖35(b)是表示上述實施例19的檢索條件的具體例的模式圖。
圖36是用于具體地說明由本發(fā)明實施例17的圖像編碼裝置對文書圖像進行編碼的處理的一例的圖。
圖37是用于說明上述實施例22的文字間距離表的圖。
圖38是表示上述實施例2、4、6的圖像特征抽出單元的其他的結構例的框圖。
圖39是用于說明先有的文書傳真裝置的框圖。
圖40(a)、圖40(b)、圖40(c)是用于說明存儲利用軟件進行本發(fā)明各實施例的編碼處理、譯碼處理或核對處理的程序的數(shù)據(jù)存儲媒體的圖。
圖41(a)是用于說明具有上述實施例2的圖像編碼裝置和上述實施例3的圖像譯碼裝置的傳真裝置的框圖,圖41(b)是用于說明具有這些圖像編碼裝置和圖像譯碼裝置的文書傳真裝置的框圖。
圖42是用于說明本發(fā)明實施例24的圖像譯碼裝置的框圖。
圖43是用于說明本發(fā)明實施例25的圖像譯碼裝置的框圖。
圖44是表示構成上述實施例24的圖像編碼裝置的預測圖像選擇單元的動作流程的圖。
圖45是表示構成上述實施例25的圖像譯碼裝置的預測圖像選擇單元的動作流程的圖。
圖46是用于說明本發(fā)明實施例26的圖像編碼裝置的框圖。
圖47是用于說明本發(fā)明實施例27的圖像譯碼裝置的框圖。
圖48是表示構成上述實施例26的圖像編碼裝置的預測圖像選擇單元的動作流程的圖。
圖49是表示構成上述實施例27的圖像譯碼裝置的預測圖像選擇單元的動作流程的圖。
下面,參照
本發(fā)明的實施例。
(實施例1)圖1是表示本發(fā)明實施例1的圖像編碼裝置的結構的框圖。本實施例1與權利要求1的發(fā)明對應。
本實施例1的圖像編碼裝置100是接收由掃描器等將包含黑體文字的文書圖像101電子化而得到的文書圖像數(shù)據(jù)Di,并將該文書圖像數(shù)據(jù)Di進行編碼的裝置,例如,可以作為圖39所示的文書文卷編排裝置3900的圖像編碼單元3902使用。這里,在文書圖像中,作為其部分圖像,包含文字及記號、或由該文字及記號的一部分構成的文字圖像,使文字數(shù)據(jù)與各文字圖像對應。這里,之所以規(guī)定在上述文書圖像中包含由文字及記號的一部分構成的文字圖像,是因為有時1個文字或記號的各部分作為1個文字及記號來識別的。例如,在“仁”這個漢字文字中,其左偏旁部分和右偏旁部分有時分別被識別為片假名文字“亻”和漢字文字“二”。
本實施例1的圖像編碼裝置100具有接收與上述文書圖像101的各文字對應的文字代碼和包含表示各文字的大小和文書圖像的各文字的位置的輔助信息的文字數(shù)據(jù)Dc,并根據(jù)上述文字代碼利用明朝體的字體信息預測文書圖像的文字圖像并輸出預測文字圖像數(shù)據(jù)PDc的預測圖像生成單元103。
另外,上述圖像編碼裝置100還具有根據(jù)表示包含在上述Dc中的文字的位置和大小的輔助信息合成上述預測文字圖像數(shù)據(jù)PDc,從而生成與僅包含與上述文書圖像對應的文字的預測文書圖像105對應的預測文書圖像數(shù)據(jù)PDi的圖像合成單元104。
此外,上述圖像編碼裝置100還具有對上述文書圖像數(shù)據(jù)Di參照與其對應的預測文書圖像數(shù)據(jù)PDi進行算術編碼處理、并作為與文書圖像對應的編碼數(shù)據(jù)De而輸出代碼串107的熵編碼單元106,與和上述文書圖像對應的編碼數(shù)據(jù)De一起輸出與包含在文書圖像中的文字對應的文字數(shù)據(jù)Dc。圖1中表示出了包含在上述文字數(shù)據(jù)Dc中的與各文字代碼對應的文字的串。
上述文字數(shù)據(jù)Dc由例如圖39所示的先有的文書傳真裝置3900的文書識別單元3901從文書圖像數(shù)據(jù)Di中抽出,在該文字數(shù)據(jù)Dc中,包含表示與包含在文書圖像中的各文字對應的文字代碼、該文書圖像中的各文字的位置和各文字的大小的輔助信息。
圖24(a)是表示與上述文書圖像對應的XY坐標的圖,圖24(b)是用于說明輸入上述預測圖像生成單元103的文字數(shù)據(jù)Dc的數(shù)據(jù)結構的模式圖。這里,在上述文書圖像101中,包含由黑體的阿拉伯文字組成的“Panasonic Technical Reports”這樣的文字串,在上述文字數(shù)據(jù)Dc中,包含表示與構成該文字串的各文字對應的文字代碼、位置、大小的數(shù)據(jù)。
即,構成上述文字數(shù)據(jù)Dc的代碼串2400包含分別與明朝體的阿拉伯文字“P”、“a”、…、“s”對應的代碼串2410、2420、、2430。
具體而言,代碼串2410由與表示在以文書圖像的左上角為原點O的XY坐標中文字“P”的位置的X坐標、Y坐標對應的代碼2411a及2411b、表示上述文字“P”的大小的代碼2412和與上述文字“P”對應的文字代碼2413構成。另外,代碼串2420由與表示在上述XY坐標中文字“a”的位置的X坐標、Y坐標對應的代碼2421a及2421b、表示上述文字“a”的大小的代碼2422和與上述文字“a”對應的文字代碼2423構成。代碼串2430由與表示在上述XY坐標中文字“s”的位置的X坐標、Y坐標對應的代碼2431a及2431b、表示上述文字“s”的大小的代碼2432和與上述文字“s”對應的文字代碼2433構成。
下面,說明其動作。
與包含在上述文書圖像101中的文字圖像對應的文字數(shù)據(jù)Dc與利用掃描器等將文書圖像101電子化而得到的2值的圖像數(shù)據(jù)(文書圖像數(shù)據(jù))Di一起輸入本實施例1的圖像編碼裝置100時,在預測圖像生成單元103中,利用字體信息根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼生成與包含在上述文書圖像中的各文字對應的預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDc,并向圖像合成單元104輸出。
于是,在圖像合成單元104中,根據(jù)表示包含在上述文字數(shù)據(jù)Dc中的各文字的位置和大小的輔助信息合成各預測文字圖像,并向上述熵編碼單元106輸出與僅由上述預測文字圖像構成的預測文書圖像105對應的數(shù)據(jù)PDi。在該預測文書圖像105中,各預測文字圖像以指定的大小配置到根據(jù)上述輔助信息決定的指定的位置。
并且,在熵編碼單元106中,參照預測文書圖像數(shù)據(jù)PDi將文書圖像數(shù)據(jù)Di進行算術編碼,并作為與文書圖像101對應的編碼數(shù)據(jù)De輸出代碼串107。
下面,簡單地說明算術編碼處理。
關于算術編碼的詳細情況,在“多媒體編碼國際標準”(第3章算術符號化,安田浩(丸善株式會社))中有詳細的說明。
圖25(a)、圖25(b)、圖25(c)是用于說明算術編碼的原理的圖。
例如,在算術編碼原理中,對與由指定數(shù)的像素構成的像素串的各像素對應的像素值的組合,作為與由上述指定數(shù)的像素構成的被處理圖像對應的編碼數(shù)據(jù)求出1個2進制小數(shù)。
特別是在對2值的圖像數(shù)據(jù)的算術編碼處理中,如圖25(a)所示,使用“0”、“1”、“EOF”的3個符號和表示這些符號的發(fā)生概率的發(fā)生概率模型2504。這里,符號“0”是表示與具有像素值“0”的白像素對應的符號,符號“1”是表示與具有像素值“1”的黑像素對應的符號,符號“EOF”是表示上述像素串的最后的符號。另外,這里,在發(fā)生概率模型2504中,符號“EOF”的發(fā)生概率為x、符號“0”的發(fā)生概率為y、符號“1”的發(fā)生概率為z。其中,x、y、z是大于0小于1的實數(shù),滿足x+y+z=1。
下面,使用圖25(b)具體地說明對由2個白像素構成的被處理圖像的算術編碼處理。
這時,與實數(shù)像素串相當?shù)姆柎?505由符號“0”、“0”、“EOT”構成。
首先,向表示大于0小于1的范圍的數(shù)直線2501上分配與由發(fā)生概率模型2504所示的各符號的發(fā)生概率對應的范圍(概率范圍)。這時,上述符號串2505的最初的符號為符號“0”,所以,上述數(shù)直線2501上的限定范圍R1的發(fā)生概率y的部分可以作為限定范圍R1而求出。
接著,向數(shù)直線上的限定范圍R1分配與由發(fā)生概率模型2504所示的各符號的發(fā)生概率對應的概率范圍。這時,上述符號串2505的第2個符號為符號“0”,所以上述數(shù)直線2501的限定范圍R1的發(fā)生概率y的部分可以作為限定范圍R2求出。
最后,向數(shù)直線上的限定范圍R1分配與由發(fā)生概率模型2504所示的各符號的發(fā)生概率對應的概率范圍。這時,上述符號串2505的第3個符號是符號“EOF”,所以,上述數(shù)直線2501上的限定范圍R2的發(fā)生概率x的部分可以作為限定范圍R3而求出。
并且,作為表示上述數(shù)直線2501的實數(shù)限定范圍R3的范圍的2進制小數(shù)2503,求出例如圖25(c)所示的小數(shù)點以下10位的2進制小數(shù)“0.0010101011”,表示該值的數(shù)據(jù)作為與上述符號串2505對應的編碼數(shù)據(jù)而輸出。該2進制小數(shù)2503不論在其最后的位之后還多少位數(shù),都成為不偏離上述數(shù)直線上的限定范圍R3的更短位數(shù)的小數(shù)。
圖26表示對2值圖像數(shù)據(jù)的一般的算術編碼處理的流程。
在開始進行算術編碼時(步驟S2601),應用發(fā)生概率模型的數(shù)直線的應用范圍R(k)(k為自然數(shù))初始設定為0≤R(1)<1(步驟S2602)。并且,在輸入構成上述符號串2505的各符號時(步驟S2603),就向數(shù)直線上的現(xiàn)在的應用范圍R(k)分配與發(fā)生概率模型中的各符號的發(fā)生概率對應的概率范圍,與上述現(xiàn)在的應用范圍R(k)中輸入的符號的發(fā)生概率對應的概率范圍采用新的應用范圍R(k+1)(步驟S2604)。
此外,在步驟S2605,進行輸入符號是否為結束符號的判斷,如果是結束符號,就用2進制小數(shù)表示由結束符號的前1個符號限定的應用范圍,并輸出2進制小數(shù)(步驟S2606),從而結束算術編碼(步驟S2607)。
另一方面,在步驟S2605的判斷結果為輸入符號不是結束符號時,就輸入符號串的后續(xù)符號(步驟S2603)。但是,如果符號串的符號的個數(shù)已決定了,則可省略結束符號“EOF”。
對與符號串對應的編碼數(shù)據(jù)的算術譯碼,通過根據(jù)2進制小數(shù)決定符號串進行。
現(xiàn)在了解這樣的算術編碼處理具有符號串的符號的發(fā)生概率與由發(fā)生概率模型所示的各符號的發(fā)生概率的誤差越小、另外符號串的符號的發(fā)生概率越有偏離則與符號串對應的編碼數(shù)據(jù)的代碼量越減少的性質(zhì)。另外,在進行1個符號串的各符號的編碼處理的期間,即使變更發(fā)生概率模型,如果知道其變更的方式,就知道也可以進行與符號串對應的編碼數(shù)據(jù)的譯碼處理。
圖27是用于說明參照預測文書圖像105對表示文書圖像101的圖像數(shù)據(jù)Di進行算術編碼處理的具體的方法的圖。
這時,作為編碼的對象的符號串由將對文書圖像101的各像素的像素值從文書圖像101的左側向右側的橫向掃描從其上側到下側進行而得到的“0”或“1”的像素值構成。
并且,將由發(fā)生概率模型給定的各符號的發(fā)生概率的范圍向數(shù)直線上分配的分配處理對上述符號串中的所有的符號進行,這樣,表示與最終得到的數(shù)直線上的限定范圍對應的2進制小數(shù)的數(shù)據(jù)可以作為與上述文書圖像101對應的編碼數(shù)據(jù)而求出。
但是,在本實施例1中,對作為上述符號串中的分配處理的對象的對象符號,根據(jù)與右側文書圖像中的對象符號對應的對應像素的像素值切換發(fā)生概率模型。
下面,具體地說明上述發(fā)生概率模型的切換。
例如,作為與上述預測文書圖像中的對象符號對應的對應像素,使用3個像素,具體而言,就是在預測文書圖像中使用與文書圖像中對象圖像的位置相對地處于相同位置的同位置像素、位于該同位置像素前后的前像素和后像素。
該前像素和后像素在對預測文書圖像進行和對上述文書圖像的掃描相同的掃描而得到的像素串中位于上述同位置像素的前后。
并且,上述3個像素的像素值的組合有以下的8個方式,對白像素、黑像素和EOF設定概率的發(fā)生概率模型與各方式對應。
(第1方式)前像素、同位置像素、后像素都是白像素。
在與第1方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.95)、[0.95,1.0)。
(第2方式)前像素為黑像素,同位置像素和后像素為白像素。
在與第2方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.75)、[0.75,1.0)。
(第3方式)前像素和同位置像素為白像素,后像素為黑像素。
在與第3方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.7)、[0.7,1.0)。
(第4方式)前像素和后像素為白像素,同位置像素為黑像素。
在與第4方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.65)、[0.65,1.0)。
(第5方式)前像素和后像素為黑像素,同位置像素為白像素。
在與第5方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.45)、[0.45,1.0)。
(第6方式)前像素和同位置像素為黑像素,后像素為白像素。
在與第6方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.4)、[0.4,1.0)。
(第7方式)前像素為白像素,同位置像素和后像素為黑像素。
在與第7方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.35)、[0.35,1.0)。
(第8方式)
前像素、同位置像素、后像素都為黑像素。
在與第8方式對應的發(fā)生概率模型中,對EOF、白像素、黑像素的概率范圍分別設定為例如[0,0.05)、[0.05,0.15)、[0.15,1.0)。
例如,對于圖27所示的文書圖像101的對象圖像2701,在向數(shù)直線上分配發(fā)生概率的范圍的分配處理中,預測文書圖像的同位置像素2702是白像素,其前像素為黑像素,其后像素為白像素,所以,作為發(fā)生概率模型,可以使用在上述第2方式中設定的發(fā)生概率模型。這時,對象像素為白像素,所以,由現(xiàn)在的數(shù)直線上的限定范圍中的[0.05,0.75)所示的范圍就成為新的限定范圍。
這樣,對文書圖像的各像素,根據(jù)預測文書圖像中對應的像素的像素值切換發(fā)生概率模型,通過從文書圖像的開頭像素到EOF進行限定數(shù)直線上的概率范圍的處理,表示最終限定的概率范圍的2進制小數(shù)就作為與上述文書圖像對應的熵代碼(編碼數(shù)據(jù))而輸出。
這樣,在本實施例1中,就根據(jù)從文書圖像101的數(shù)據(jù)Di中抽出的文字數(shù)據(jù)Dc作成對應上述文書圖像101的預測文書圖像105,此外,對上述文書圖像數(shù)據(jù)Di參照上述預測文書圖像數(shù)據(jù)PDi進行切換發(fā)生概率模型的算術編碼處理,所以,由發(fā)生概率模型所示的白像素、黑像素的發(fā)生概率就與文書圖像中的白像素和黑像素的發(fā)生概率非常接近,從而具有可以提高算術編碼器對上述文書圖像數(shù)據(jù)的編碼效率。
另外,在文字數(shù)據(jù)Dc中,對于文書圖像的各文字,采用包含1個文字代碼的結構,所以,可以避免由對文書圖像的文字識別而得到的文字數(shù)據(jù)變得冗長。
(實施例2)圖2是表示本發(fā)明實施例2的圖像編碼裝置的結構的框圖。本實施例2與權利要求2對應。
本實施例2的圖像編碼裝置200可以作為進行圖像信息的存儲及收發(fā)的信息處理裝置使用,例如可以作為圖39所示的文書文卷編排裝置3900及傳真裝置等具有掃描器的電子儀器的圖像編碼單元使用。
本實施例2的圖像編碼裝置200具有接收文書圖像數(shù)據(jù)(由掃描器等將文書圖像201電子化而得到的2值圖像數(shù)據(jù))Di并從該文書圖像數(shù)據(jù)Di中抽出由圖24(b)所示的代碼串2400構成的文字數(shù)據(jù)Dc的圖像特征抽出單元202。該圖像特征抽出單元202是利用在OCR等中使用的一般的方法進行文字識別的文字識別裝置,上述文字數(shù)據(jù)Dc具有與文書圖像的文字串203的各文字圖像對應的文字代碼(圖像特征)和表示文書圖像的文字的位置和大小的輔助信息。
另外,上述圖像編碼裝置200和實施例1的圖像編碼裝置100一樣,還具有根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼預測與上述文書圖像中的各文字對應的文字圖像并輸出其數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDc的預測圖像生成單元204,和根據(jù)預測文字圖像數(shù)據(jù)PDc以及表示上述文字數(shù)據(jù)中的文字的位置和大小的輔助信息、將與各文字對應的預測文字圖像配置到指定的圖像空間上、合成包含與上述各文字對應的預測文字圖像的預測文書圖像206、并輸出其數(shù)據(jù)(預測文書圖像數(shù)據(jù))Pdi的圖像合成單元205。
此外,上述圖像編碼裝置200還具有利用上述預測文書圖像206和文書圖像201兩者的相關、參照預測文書圖像數(shù)據(jù)PDi對文書圖像數(shù)據(jù)Di進行算術編碼處理、而作為與文書圖像對應的編碼數(shù)據(jù)De輸出代碼串208的熵編碼單元207,輸出與上述文書圖像數(shù)據(jù)對應的編碼數(shù)據(jù)De和與包含在文書圖像中的文字對應的文字數(shù)據(jù)Dc。
上述實施例2的圖像編碼裝置200的預測圖像生成單元204、圖像合成單元205和熵編碼單元207分別與實施例1的圖像編碼裝置100的預測圖像生成單元103、圖像合成單元104和熵編碼單元106的結構完全相同。
下面,說明其動作。
作為編碼的對象的文書圖像數(shù)據(jù)Di和實施例1一樣是由掃描器等將文書圖像201電子化而得到的2值的圖像數(shù)據(jù),在上述文書圖像201中作為其部分圖像包含由文字及符號或其一部分構成的文字圖像。
在上述文書圖像數(shù)據(jù)Di輸入本實施例2的圖像編碼裝置200時,由圖像特征抽出單元202從文書圖像數(shù)據(jù)Di中抽出與文書圖像201內(nèi)的各文字對應的文字代碼和表示文書圖像的位置和大小的輔助信息,并向上述預測圖像生成單元204輸出包含該文字代碼和輔助信息的文字數(shù)據(jù)Dc。這里,上述文字數(shù)據(jù)Dc的結構和圖24(b)所示的結構相同。另外,圖像特征抽出單元202是文字識別裝置,利用在OCR等中使用的一般的方法進行包含在文書圖像中的文字的識別,這里,省略了具體的抽出方法。
由預測圖像生成單元204根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼利用字體信息生成與包含在上述文書圖像中的各文字對應的預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDc,并向圖像合成單元205輸出。于是,由圖像合成單元205根據(jù)包含在上述文字數(shù)據(jù)Dc中的輔助信息合成各預測文字圖像,并向上述熵編碼單元207輸出與預測文書圖像206對應的數(shù)據(jù)(預測文書圖像數(shù)據(jù))PDi。在上述預測文書圖像206中,各預測文字圖像以指定的大小配置到由上述輔助信息決定的指定的位置。
并且,在熵編碼單元207中,和實施例1的熵編碼單元106一樣,參照預測文書圖像數(shù)據(jù)PDi對文書圖像201的電子數(shù)據(jù)即文書圖像數(shù)據(jù)Di進行算術編碼,并作為編碼數(shù)據(jù)De輸出對應的代碼串208。
這樣,在本實施例2中,除了上述實施例1的圖像編碼裝置100的結構外,還具有從上述文書圖像數(shù)據(jù)Di中抽出文字數(shù)據(jù)Dc的圖像特征抽出單元202,所以,除了實施例1的不損失對文書圖像的檢索的容易性而可以提高編碼效率的效果外,可以自動地從文字圖像數(shù)據(jù)Di中進行文字數(shù)據(jù)Dc的抽出,從而可以得到作為傳真裝置等的圖像編碼單元而有用的圖像編碼裝置。
另外,在圖像特征抽出單元202中,對于文書圖像的各文字,抽出1個文字代碼作為文字數(shù)據(jù)Dc,所以,可以避免通過對文書圖像的文字識別而得到的文字數(shù)據(jù)變得冗長。
(實施例3)圖3是用于說明本發(fā)明實施例3的圖像譯碼裝置的框圖。本實施例3與權利要求5對應。
本實施例3的圖像譯碼裝置300是與上述實施例1或2的圖像編碼裝置100或200對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900或傳真裝置中的圖像譯碼單元使用。
即,該圖像譯碼裝置300接收從上述實施例1或2的圖像編碼裝置100或200輸出的編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc,根據(jù)文字數(shù)據(jù)Dc將該編碼數(shù)據(jù)De進行譯碼,將與文書圖像301對應的文書圖像數(shù)據(jù)Di復原為與文書圖像307對應的譯碼數(shù)據(jù)Dd。
下面,進行詳細的說明。本實施例3的圖像譯碼裝置300具有接收與文字串302的各個文字對應的文字數(shù)據(jù)Dc、并根據(jù)包含在該文字數(shù)據(jù)Dc中的文字代碼(圖像特征)利用字體信息預測文書圖像的文字圖像、從而輸出預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDc的預測圖像生成單元303,和根據(jù)表示包含在上述文字數(shù)據(jù)Dc中的各文字的位置和大小的輔助信息合成上述預測文字圖像數(shù)據(jù)PDc、從而生成與包含僅與上述文書圖像對應的文字的預測文書圖像305對應的預測文書圖像數(shù)據(jù)Pdi的圖像合成單元304。
另外,上述圖像譯碼裝置300還具有作為代碼串301接收利用預測文書圖像和文書圖像的兩者的相關通過算術編碼處理而得到的編碼數(shù)據(jù)De、并參照預測文書圖像數(shù)據(jù)PDi將該編碼數(shù)據(jù)De進行算術譯碼、從而輸出與文書圖像307對應的文書圖像數(shù)據(jù)Dd的熵譯碼單元306。
下面,說明其動作。
在編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc輸入本實施例3的圖像譯碼裝置300時,在預測圖像生成單元303中,根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼利用字體信息生成與包含在上述文書圖像中的各文字對應的預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDc,并向圖像合成單元304輸出。于是,在圖像合成單元304便根據(jù)包含在上述文字數(shù)據(jù)Dc中的輔助信息合成各預測文書圖像,并向上述熵編碼單元306輸出與預測文書圖像305對應的數(shù)據(jù)PDi。
并且,在熵譯碼單元306中,參照預測文書圖像數(shù)據(jù)PDi進行編碼數(shù)據(jù)De的算術譯碼處理,并輸出與文書圖像307對應的文書圖像數(shù)據(jù)Dd。
在該熵譯碼單元306中,和實施例1或2的熵編碼單元一樣,進行發(fā)生概率模型的切換,來進行從熵編碼器輸出的編碼數(shù)據(jù)的譯碼處理。
例如,在上述熵譯碼單元306中,在與對應像素對應的預測文書圖像的3個對應像素的像素值的組合是在實施例1中說明的第2方式時,可以使用與EOF、白像素、黑像素對應的概率范圍分別設定為[0,0.05)、[0.05,0.75)、[0.75,1.0)的發(fā)生概率模型。
這樣,在本實施例3的圖像譯碼裝置300中,就根據(jù)與包含在指定的文書圖像中的文字對應的文字數(shù)據(jù)Dc預測上述指定的文書圖像,生成與預測文字圖像對應的數(shù)據(jù)PDi,進而參照上述預測文書圖像數(shù)據(jù)PDi將與上述指定的文書圖像對應的編碼數(shù)據(jù)De進行算術譯碼,所以,可以實現(xiàn)與使用預測文書圖像數(shù)據(jù)PDi的效率高的文書圖像數(shù)據(jù)Di的算術編碼處理對應的譯碼處理。
另外,本實施例3的圖像譯碼裝置300可以和上述實施例2的圖像編碼裝置200一起應用于傳真裝置或文書文卷編排裝置。
下面,先簡單地說明具有上述實施例2的圖像編碼裝置和實施例3的圖像譯碼裝置的傳真裝置。
圖41(a)是用于說明上述傳真裝置10的框圖。
傳真裝置10具有讀取文書圖像201并輸出電子數(shù)據(jù)(文書圖像數(shù)據(jù))Di的掃描器11、進行該文書圖像數(shù)據(jù)Di的編碼處理并與編碼數(shù)據(jù)De一起輸出與包含在文書圖像中的文字對應的文字數(shù)據(jù)Dc的圖像編碼裝置200a、和給上述編碼數(shù)據(jù)De附加上與其關聯(lián)的文字數(shù)據(jù)Dc并通過電話線路15收發(fā)包含編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc的復合數(shù)據(jù)Dm的收發(fā)裝置12。這里,上述圖像編碼裝置200a的結構和上述實施例2的圖像編碼裝置200相同。
上述傳真裝置10具有接收包含在通過上述電話線路15由收發(fā)裝置12所接收的復合數(shù)據(jù)Dm中的編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc、并根據(jù)文字數(shù)據(jù)Dc將該編碼數(shù)據(jù)De進行譯碼、從而輸出文書圖像數(shù)據(jù)Dd的圖像譯碼裝置300a,和根據(jù)上述文書圖像數(shù)據(jù)Dd進行文書圖像的顯示或打印輸出的圖像輸出裝置13。這里,上述圖像譯碼裝置300a的結構和上述實施例3的圖像譯碼裝置300相同。
在這種結構的傳真裝置10中,可以由上述圖像編碼裝置200a使用與包含在文書圖像中的文字對應的文字數(shù)據(jù)高效率地將文書圖像201的電子數(shù)據(jù)(文書圖像數(shù)據(jù)Di)Di變換為編碼數(shù)據(jù),而且可以將從該圖像編碼裝置200a輸出的編碼數(shù)據(jù)De給其附加上文書圖像的檢索用數(shù)據(jù)Dc進行發(fā)信。
另外,在上述傳真裝置10中,在接收到包含使用文字數(shù)據(jù)Dc將文書圖像數(shù)據(jù)Di進行編碼而得到的編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc的復合數(shù)據(jù)時,可以使用文字數(shù)據(jù)Dc將上述編碼數(shù)據(jù)De正確地進行譯碼。
下面,簡單地說明具有上述實施例2的圖像編碼裝置和實施例3的圖像譯碼裝置的文書文卷編排裝置。
圖41(b)是用于說明上述文書文卷編排裝置20的框圖。
文書文卷編排裝置20具有讀取文書圖像201并輸出電子數(shù)據(jù)(文書圖像數(shù)據(jù))Di的掃描器21、進行該文書圖像數(shù)據(jù)Di的編碼處理并與編碼數(shù)據(jù)De一起輸出與包含在文書圖像中的文字對應的文字數(shù)據(jù)Dc的圖像編碼裝置200a、和使上述編碼數(shù)據(jù)De和與其對應的文字數(shù)據(jù)Dc關聯(lián)地進行存儲的文書圖像存儲單元22。這里,上述圖像編碼裝置200a的結構和上述實施例2的圖像編碼裝置200相同。
上述文書文卷編排裝置20具有根據(jù)作為檢索數(shù)據(jù)Da從外部輸入的文字代碼將與上述文書圖像存儲單元22存儲的指定的文書圖像對應的編碼數(shù)據(jù)De和與其對應的文字數(shù)據(jù)Dc一起讀出的數(shù)據(jù)讀出單元23、使用上述文字數(shù)據(jù)Dc將該讀出的編碼數(shù)據(jù)De進行譯碼從而復原為與指定的文書圖像對應的文書圖像數(shù)據(jù)Di的圖像譯碼單元300a、和根據(jù)上述文書圖像數(shù)據(jù)Dd進行文書圖像的顯示或打印輸出的圖像輸出裝置13。這里,上述圖像譯碼裝置300a的結構和上述實施例3的圖像譯碼裝置300相同。
在這種結構的文書文卷編排裝置20中,可以由上述圖像編碼裝置200a使用與包含在文書圖像中的文字對應的文字數(shù)據(jù)高效率地將文書圖像201的電子數(shù)據(jù)(文書圖像數(shù)據(jù)Di)Di變換為編碼數(shù)據(jù),而且可以將從該圖像編碼裝置200a輸出的編碼數(shù)據(jù)De給其附加上文書圖像的檢索用數(shù)據(jù)Dc進行存儲。
另外,在上述文書文卷編排裝置20中,通過從外部輸入的檢索數(shù)據(jù)與文字數(shù)據(jù)Dc的核對而簡單地從文書圖像存儲單元中讀出使用文字數(shù)據(jù)Dc將文書圖像數(shù)據(jù)Di進行編碼而得到的編碼數(shù)據(jù)De。
(實施例4)圖4是表示本發(fā)明實施例4的圖像編碼裝置的結構的框圖。本實施例4與權利要求3對應。
本實施例4的圖像編碼裝置400是進行圖像信息的存儲及收發(fā)的信息處理裝置,可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例4的圖像編碼裝置400具有接收文書圖像數(shù)據(jù)(由掃描器等將文書圖像401電子化而得到的2值圖像數(shù)據(jù))Di并從該文書圖像數(shù)據(jù)Di中抽出文字數(shù)據(jù)Dc的圖像特征抽出單元402、根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼輸出預測文字圖像數(shù)據(jù)PDc的預測圖像單元404、和根據(jù)預測文字圖像數(shù)據(jù)PDc和上述文字數(shù)據(jù)的輔助信息合成包含與上述各文字對應的預測文字圖像的預測文書圖像406并輸出其數(shù)據(jù)(預測文書圖像數(shù)據(jù))PDi的圖像合成單元405。
這里,上述圖像特征抽出單元402、預測圖像生成單元404和圖像合成單元405的結構和上述實施例2的圖像編碼裝置200中的對應的單元202、204、205完全相同。
并且,本實施例4的圖像編碼裝置400具有將上述預測文書圖像406分割為指定尺寸的圖像空間(預測文書圖像塊)并輸出與各塊對應的圖像數(shù)據(jù)(預測塊數(shù)據(jù))BPDi的第1圖像塊化單元408和將上述文書圖像401分割為指定尺寸的圖像空間(文書圖像塊)并輸出與各塊對應的圖像數(shù)據(jù)(塊數(shù)據(jù))BDi的第2圖像塊化單元407。這里,上述文書圖像塊和預測文書圖像塊分別為由16×16像素構成的圖像空間。
此外,本實施例4的圖像編碼裝置400具有塊預測編碼單元409,該塊預測編碼單元409根據(jù)上述預測塊數(shù)據(jù)BPDi和塊數(shù)據(jù)BDi在上述預測文書圖像塊與文書圖像塊間進行各像素值的比較,如果像素值的比較誤差大于指定值,就使用預測塊數(shù)據(jù)BPDi對塊數(shù)據(jù)BDi進行算術編碼處理,并與編碼數(shù)據(jù)BDe一起輸出編碼標志Fc1,在上述預測文書圖像塊與文書圖像塊間,如果各像素值的比較誤差小于指定值,就不對上述塊數(shù)據(jù)BDi進行算術編碼處理,并輸出非編碼標志Fc0。
下面,說明其動作。
作為編碼的對象的文書圖像數(shù)據(jù)Di是由掃描器等將文書圖像401電子化的2值圖像數(shù)據(jù),在上述文書圖像401中,作為部分圖像包含由文字及記號或前一部分構成的文字圖像。
在上述文書圖像數(shù)據(jù)Di輸入本實施例4的圖像編碼裝置400時,由圖像特征抽出單元402從文書圖像數(shù)據(jù)Di中抽出表示與文書圖像401內(nèi)的各文字對應的文字代碼在文書圖像中的位置和大小的輔助信息,并將包含該文字代碼和輔助信息的文字數(shù)據(jù)Dc向上述預測圖像生成單元404輸出。
由該預測圖像生成單元404根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼生成預測文字圖像數(shù)據(jù)PDc,并向圖像合成單元405輸出。于是,由圖像合成單元405根據(jù)上述輔助信息合成各預測文字圖像,并向第1圖像塊化單元408輸出與預測文書圖像406對應的數(shù)據(jù)(預測文書圖像數(shù)據(jù))PDi。
并且,由第1圖像塊化單元408根據(jù)預測文字圖像數(shù)據(jù)PDc將預測文書圖像分割為指定尺寸的塊,并向塊預測編碼單元409輸出與各塊對應的預測塊數(shù)據(jù)BPDi。
這時,上述文書圖像數(shù)據(jù)Di向第2圖像塊化單元407輸出,由第2圖像塊化單元407根據(jù)文字圖像數(shù)據(jù)Dc將文書圖像分割為指定尺寸的塊,并向塊預測編碼單元409輸出與各塊對應的塊數(shù)據(jù)PDi。
由上述各塊化單元將預測文書圖像和文書圖像分割為分別由16×16像素構成的塊。
并且,由上述塊預測編碼單元409根據(jù)上述預測塊數(shù)據(jù)BPDi和塊數(shù)據(jù)BDi使用預測塊數(shù)據(jù)BPDi對塊數(shù)據(jù)BDi進行算術編碼處理。
圖28是表示塊預測編碼單元409的編碼處理的流程的圖。
由上述塊預測編碼單元409讀入從第2塊化單元407輸出的文書圖像塊的數(shù)據(jù)BDi(步驟S2802),并讀入對應的預測文書圖像塊的數(shù)據(jù)BPDi(步驟S2803)。
其次,在讀入的兩塊間求出對應的像素的像素值的差分,并計算該差分的絕對值的總和(步驟S2804)。并且,如果該差分的絕對值在閾值以上(這里,閾值為7),就判定上述預測誤差大,如果小于閾值(這里,閾值為7),就判定上述預測誤差小(步驟S2805)。
此外,上述判斷的結果為預測誤差在閾值以上時,就從上述塊預測編碼單元409輸出具有值“1”的編碼標志Fc1(步驟S2806),并使用預測文書圖像塊的圖像數(shù)據(jù)將文書圖像塊的圖像數(shù)據(jù)進行算術編碼,并輸出與文書圖像塊對應的編碼數(shù)據(jù)De(步驟S2808)。
另一方面,在上述步驟S2805的判斷結果判定上述預測誤差小于上述閾值時,就從上述塊預測編碼單元409輸出具有值“0”的非編碼標志Fc0(步驟S2807)。
并且,進行作為塊預測編碼單元409的處理對象的對象塊是否為上述文書圖像的最后的文書圖像塊的判斷(步驟S2809),在上述對象塊是最后的文書圖像塊時,編碼處理即告結束(步驟S2810),如果上述對象塊不是最后的文書圖像塊,就對后續(xù)的塊進行上述步驟S2802~步驟S2809的處理。
圖29表示從上述塊預測編碼單元409輸出的包含與各圖像塊對應的編碼數(shù)據(jù)BDe和標志Fc1、Fc0的復合數(shù)據(jù)MDe。
該復合數(shù)據(jù)MDe包括與上述文書圖像的第1、第2、第3、第4、第5、第n個各圖像塊對應的代碼串B(1)、B(2)、B(3)、B(4)、B(5)、…、B(n)。
這里,代碼串(1)、B(3)、B(4)、…、B(n)由值“0”的非編碼標志Fc0構成,代碼串B(2)和B(5)由值“1”的編碼標志Fc1和與第2、第5個圖像塊的數(shù)據(jù)對應的算術代碼BDe構成。
這樣,在本實施例4中,根據(jù)與包含在文書圖像中的文字對應的文字數(shù)據(jù)合成預測文書圖像,并將該預測文書圖像分割為指定尺寸的預測文書塊,同時將上述文書圖像分割為指定尺寸的文書塊,參照與對應的預測文書塊對應的圖像數(shù)據(jù)將與各文書塊對應的圖像數(shù)據(jù)進行算術編碼,這時,僅對與預測文書塊間的像素值的差分大于指定值的文書塊發(fā)信對應的編碼數(shù)據(jù),所以,不計塊單位的比較中小的不同,從而可以大大提高編碼效率而不會給視聽者留下畫質(zhì)劣化的印象。
(實施例5)圖5是表示本發(fā)明實施例5的圖像譯碼裝置的結構的框圖。本實施例5與權利要求6對應。
本實施例5的圖像譯碼裝置500是與上述實施例4的圖像編碼裝置400對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即,圖像譯碼裝置500接收從上述實施例4的圖像編碼裝置400輸出的復合數(shù)據(jù)MDe和文字數(shù)據(jù)Dc并根據(jù)文字數(shù)據(jù)Dc和包含在復合數(shù)據(jù)MDe中的標志Fc1、Fc0將包含在該復合數(shù)據(jù)MDe中的編碼塊數(shù)據(jù)BDe進行譯碼從而復原為與文書圖像509對應的文書圖像數(shù)據(jù)Di。
下面,進行詳細的說明。本實施例5的圖像譯碼裝置500具有接收與文字串502中的各個文字對應的文字數(shù)據(jù)Dc、并根據(jù)包含在該文字數(shù)據(jù)Dc中的文字代碼(圖像特征)、利用字體信息、預測文書圖像中的文字圖像、從而輸出用于表示預測文字圖像的預測文字圖像數(shù)據(jù)PDc的預測圖像生成單元503,和根據(jù)包含在上述文字數(shù)據(jù)Dc中的表示各文字的位置和大小的輔助信息合成上述預測文字圖像數(shù)據(jù)PDc、從而生成與包含僅與上述文書圖像對應的文字的預測文書圖像505對應的預測文書圖像數(shù)據(jù)Pdi的圖像合成單元504。
另外,本實施例5的圖像編碼裝置500具有接收預測文書圖像數(shù)據(jù)PDi并將上述預測文書圖像505分割為指定尺寸的圖像空間(預測文書圖像塊)從而輸出與各塊對應的圖像數(shù)據(jù)(預測塊數(shù)據(jù))BPDi的圖像塊化單元506和將上述編碼塊數(shù)據(jù)BDe使用與其對應的預測文書塊數(shù)據(jù)BPDi進行算術譯碼從而輸出與復原文書塊對應的譯碼塊數(shù)據(jù)BDd的塊預測譯碼單元507。
此外,上述圖像譯碼裝置500具有接收上述譯碼塊數(shù)據(jù)BDd和預測塊數(shù)據(jù)BPDi并根據(jù)標志Fc1、Fc0組裝預測文書塊和復原文書塊從而輸出與文書圖像509對應的文書圖像數(shù)據(jù)Dd的圖像塊組裝單元508。
其中,上述文書塊、預測文書塊、復原文書塊分別為由16×16像素構成的圖像空間。
上述預測圖像生成單元503和圖像合成單元504的結構分別與實施例1的預測圖像生成單元103和圖像合成單元104相同,圖像塊化單元506的結構和實施例4的第1圖像塊化單元408相同。
下面,說明其動作。
在編碼數(shù)據(jù)MDe和文字數(shù)據(jù)Dc輸入本實施例5的圖像譯碼裝置500時,由預測圖像生成單元503根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼利用字體信息生成與包含在上述文書圖像中的各文字對應的預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDc,并向圖像合成單元504輸出。于是,由圖像合成單元504根據(jù)包含在上述文字數(shù)據(jù)Dc中的輔助信息合成各預測文字圖像,并向圖像塊化單元506輸出與預測文書圖像505對應的數(shù)據(jù)PDi。
由該圖像塊化單元506根據(jù)預測文字圖像數(shù)據(jù)PDc將預測文書圖像分割為指定尺寸的塊,并向塊預測譯碼單元507輸出與各塊對應的預測塊數(shù)據(jù)BPDi。
并且,由上述塊預測譯碼單元507根據(jù)上述預測塊數(shù)據(jù)BPDi和復合數(shù)據(jù)MDe使用預測塊數(shù)據(jù)BPDi對包含在該復合數(shù)據(jù)中的塊數(shù)據(jù)BDi進行算術譯碼處理,從而復原為對應的文書圖像塊的圖像數(shù)據(jù)BDd。
此外,由圖像塊組裝單元508輸入上述圖像數(shù)據(jù)BDd和與預測圖像塊對應的數(shù)據(jù)BPDi,根據(jù)與包含在上述復合數(shù)據(jù)MDe中的各塊對應的標志Fc1、Fc0進行預測圖像塊和復原圖像塊的組裝,從而復原為與文書圖像509對應的圖像數(shù)據(jù)Dd。
下面,詳細說明上述塊預測譯碼單元507的譯碼處理。
圖30表示塊預測譯碼單元507的譯碼處理的流程。
由上述塊預測譯碼單元507讀入與文書圖像的各塊對應的編碼數(shù)據(jù)BDe(步驟S3002),此外,讀入與從圖像塊化單元506輸出的預測文書圖像的各塊對應的數(shù)據(jù)BPDi(步驟S3003)。
接著,判斷包含在復合數(shù)據(jù)MDe中的標志是編碼標志Fc1還是非編碼標志Fc0(步驟S3004)。在該判斷結果為上述標志是編碼標志時,由上述譯碼單元507參照預測文書圖像塊的數(shù)據(jù)BPDi對上述編碼標志之后的算術編碼數(shù)據(jù)BDe進行譯碼處理(步驟S3005),并輸出譯碼塊的數(shù)據(jù)BDd(步驟S3006)。
另一方面,在上述步驟S3004的判斷結果為上述標志是非編碼標志時,就直接輸出預測文書圖像塊的數(shù)據(jù)BPDi(步驟S3007)。
并且,進行作為塊預測譯碼單元的處理對象的對象塊是否為上述文書圖像中的最后的圖像塊的判斷(步驟S3008),在上述對象塊是最后的圖像塊時,譯碼處理即告結束(步驟S3009),如果上述對象塊不是最后的圖像塊,就對后續(xù)的塊進行上述步驟S3002~步驟S3008的處理。
然后,如上所述,由圖像塊組裝單元508將按圖像塊單位輸入的圖像塊順序排列到指定的圖像空間上,從而復原為與文書圖像509對應的圖像數(shù)據(jù)Dd。
這樣,在本實施例5中,根據(jù)從文書圖像中抽出的文字信息預先作成預測文書圖像,將該預測文書圖像分割為指定尺寸的預測文書塊,生成與預測圖像塊對應的數(shù)據(jù)BPDi,參照預測圖像塊的數(shù)據(jù)BPDi將與分割文書圖像而得到的指定尺寸的圖像塊對應的編碼數(shù)據(jù)BDe進行算術譯碼,這時,不進行編碼處理,對于預測誤差小的文書圖像的塊輸出對應的預測文書圖像的塊的數(shù)據(jù),所以,可以實現(xiàn)與使用預測文書圖像數(shù)據(jù)PDi的按指定尺寸的塊單位的效率高的文書圖像數(shù)據(jù)Di的編碼處理對應的譯碼處理。
另外,具有上述實施例4的圖像編碼裝置400和實施例5的圖像譯碼裝置500的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置400和圖像譯碼裝置500而實現(xiàn)。
此外,具有上述實施例4的圖像編碼裝置400和實施例5的圖像譯碼裝置500的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置400和圖像譯碼裝置500而實現(xiàn)。
(實施例6)圖6是表示本發(fā)明實施例6的圖像編碼裝置的結構的框圖。本實施例6與權利要求4對應。
本實施例6的圖像編碼裝置600是進行圖像信息的存儲及收發(fā)的信息處理裝置,可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像不單元使用。
本實施例6的圖像編碼裝置600具有接收文書圖像數(shù)據(jù)(由掃描器等將文書圖像601電子化而得到的2值圖像數(shù)據(jù))Di并從該文書圖像數(shù)據(jù)Di中抽出文字數(shù)據(jù)Dc的圖像特征抽出單元602、根據(jù)包含在上述文字數(shù)據(jù)Dc中的文字代碼輸出預測文字圖像數(shù)據(jù)PDc的預測圖像單元604、和根據(jù)預測文字圖像數(shù)據(jù)PDc和上述文字數(shù)據(jù)的輔助信息合成包含與上述各文字對應的預測文字圖像的預測文書圖像606并輸出該數(shù)據(jù)(預測文書圖像數(shù)據(jù))PDi的圖像合成單元605。
并且,本實施例6的圖像編碼裝置600具有為了省略預測文書圖像606的細部而對上述預測文書圖像數(shù)據(jù)PDi進行形態(tài)濾波處理及平滑濾波處理的濾波處理并輸出濾波處理數(shù)據(jù)FPDi的圖像濾波處理單元607、和利用進行了濾波處理的預測文書圖像606與文書圖像601的兩者的相關參照該濾波處理數(shù)據(jù)FPDi對文書圖像數(shù)據(jù)Di進行算術編碼處理從而作為編碼數(shù)據(jù)De而輸出代碼串609的熵編碼單元608。
這里,上述圖像特征抽出單元602、預測圖像生成單元604、圖像合成單元605和熵編碼單元608的結構和上述實施例2的圖像編碼裝置200的對應的單元202、204、205、207完全相同。
下面,說明其動作。
作為編碼的對象的文書圖像數(shù)據(jù)Di是由掃描器等將文書圖像601電子化的2值圖像數(shù)據(jù),在上述文書圖像601中,作為部分圖像包含由文字及符號或其一部分構成的文字圖像。
在文書圖像數(shù)據(jù)Di輸入本實施例6的圖像編碼裝置600時,由上述圖像特征抽出單元602、預測圖像生成單元604和圖像合成單元605進行和實施例2的圖像特征抽出單元202、預測圖像生成單元204、圖像合成單元205完全相同的處理,并向圖像濾波處理單元607輸出與從上述圖像合成單元605輸出的預測文書圖像606對應的圖像數(shù)據(jù)(預測文書圖像數(shù)據(jù))PDi。
于是,由上述圖像濾波處理單元607對上述預測文書圖像數(shù)據(jù)PDi使用形態(tài)濾波器進行濾波處理,用以省略預測文書圖像606的細部。
圖31是用于說明上述形態(tài)濾波器的處理的模式圖。
由形態(tài)濾波器3102對構成預測文書圖像的各個像素順序在預測文書圖像上設定以作為濾波處理的對象的對象像素3101a為中心的指定尺寸的區(qū)域(3×3像素的掩碼)3102a,進行用掩碼內(nèi)像素的最大像素值置換對象像素3101a的像素值的濾波處理。3101b是在掩碼內(nèi)具有最大像素值的像素。
例如,設上述預測文書圖像為黑白圖像時,則上述濾波處理后的預測文書圖像3103如圖31所示的那樣,與上述濾波處理之前的預測文書圖像3101相比,省略了細部,黑色部分的區(qū)域擴張了。
并且,由熵編碼單元608參照進行了上述濾波處理的預測文書圖像數(shù)據(jù)FPDi對文書圖像601的數(shù)據(jù)Di進行算術編碼,并作為編碼數(shù)據(jù)De輸出對應的代碼串609。
這樣,在本實施例6中,根據(jù)從文書圖像數(shù)據(jù)中抽出的文字數(shù)據(jù)對上述文書圖像作成預測文書圖像,對該預測文書圖像的數(shù)據(jù)進行濾波處理,并參照進行了該濾波處理的預測文書圖像數(shù)據(jù)對上述文書圖像數(shù)據(jù)進行算術編碼處理,所以,通過上述濾波處理,可以減小預測文書圖像與文書圖像的預測誤差,從而可以進一步提高算術編碼器對上述文書圖像數(shù)據(jù)的編碼效率。
(實施例7)圖7是表示本發(fā)明實施例7的圖像譯碼裝置的結構的框圖。本實施例7與權利要求7對應。
本實施例7的圖像譯碼裝置700是與上述實施例6的圖像編碼裝置600對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900及傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即,圖像譯碼裝置700接收從上述實施例6的圖像編碼裝置600輸出的編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc,根據(jù)文字數(shù)據(jù)Dc將該編碼數(shù)據(jù)De進行譯碼,從而將與文書圖像701對應的文書圖像數(shù)據(jù)Di復原為與文書圖像708對應的譯碼數(shù)據(jù)Dd。
下面,進行詳細的說明。本實施例7的圖像譯碼裝置700具有接收與文字串的各個文字對應的文字數(shù)據(jù)Dc并根據(jù)包含在該文字數(shù)據(jù)Dc中的文字代碼(圖像特征)利用字體信息預測文字圖像從而輸出用于表示預測文字圖像的預測文字圖像數(shù)據(jù)PDc的預測圖像生成單元703、根據(jù)表示包含在上述文字數(shù)據(jù)Dc中的各文字的位置和大小的輔助信息合成上述預測文字圖像數(shù)據(jù)PDc從而生成與包含僅與上述文書圖像對應的文字的預測文書圖像705對應的預測文書圖像數(shù)據(jù)PDi的圖像合成單元704。
另外,圖像譯碼裝置700具有為了省略預測文書圖像705的細部而對上述預測文書圖像數(shù)據(jù)PDi進行形態(tài)濾波處理及平滑濾波處理等濾波處理從而輸出濾波處理數(shù)據(jù)FPDi的圖像濾波處理單元706和接收利用預測文書圖像與文書圖像的兩者的相關進行算術編碼處理而得到的編碼數(shù)據(jù)De使用進行了濾波處理的預測文書圖像數(shù)據(jù)即濾波處理輸出FPDi將該編碼數(shù)據(jù)De進行算術譯碼從而輸出與文書圖像708對應的文書圖像數(shù)據(jù)(譯碼數(shù)據(jù))Dd的熵譯碼單元707。
其中,上述預測圖像生成單元703、圖像合成單元704和熵譯碼單元707的結構與上述實施例3的圖像編碼裝置300的對應的單元303、304、306完全相同。
下面,說明其動作。
在編碼數(shù)據(jù)De和文字數(shù)據(jù)Dc輸入本實施例7的圖像譯碼裝置700時,在上述預測圖像生成單元703和圖像合成單元704中分別進行與實施例3的預測圖像生成單元303和圖像合成單元304完全相同的處理,從上述圖像合成單元704輸出的與預測文書圖像705對應的圖像數(shù)據(jù)(預測文書圖像數(shù)據(jù))Pdi輸入圖像濾波處理單元706。
于是,由圖像濾波處理單元706對上述預測文書圖像數(shù)據(jù)PDi進行和實施例6的圖像編碼裝置600中的圖像濾波處理單元607相同的濾波處理,并輸出濾波處理數(shù)據(jù)(進行了濾波處理的預測文書圖像數(shù)據(jù))FPDi。
并且,由熵譯碼單元707參照進行了濾波處理的預測圖像數(shù)據(jù)FPDi進行編碼數(shù)據(jù)De的譯碼處理并輸出與文書圖像708對應的文書圖像數(shù)據(jù)Dd。
在熵譯碼單元707中,除了不直接使用預測文書圖像數(shù)據(jù)并參照在圖像濾波處理單元706中進行了濾波處理的預測文書圖像數(shù)據(jù)外進行和實施例3的熵譯碼單元306完全相同的處理。
這樣,在本實施例7中,根據(jù)預先從文書圖像中抽出的文字信息作成預測文書圖像,為了省略該文書圖像的細部對預測文書圖像數(shù)據(jù)進行濾波處理,參照進行了濾波處理的預測文書圖像數(shù)據(jù)FPDi將與文書圖像對應的編碼數(shù)據(jù)De進行算術譯碼,所以,可以實現(xiàn)與使用進行了濾波處理的預測文書圖像數(shù)據(jù)FPDi的效率高的文書圖像數(shù)據(jù)Di的編碼處理對應的譯碼處理。
另外,具有上述實施例6的圖像編碼裝置600和實施例7的圖像譯碼裝置700的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a置換為上述圖像編碼裝置600和圖像譯碼裝置700而實現(xiàn)。
此外,具有上述實施例6的圖像編碼裝置600和實施例7的圖像譯碼裝置700的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a置換為上述圖像編碼裝置600和圖像譯碼裝置700而實現(xiàn)。
(實施例8)圖8是表示本發(fā)明實施例8的圖像編碼裝置的結構的框圖。本實施例8與權利要求8對應。
本實施例8的圖像編碼裝置800可以作為例如圖39所示的文書文卷編排裝置3900等具有掃描器的電子儀器中的圖像編碼單元使用。
下面,進行詳細的說明。本實施例8的圖像編碼裝置800具有接收表示作為編碼的對象的對象圖像的圖像特征的數(shù)據(jù)(圖像特征數(shù)據(jù))Dic并根據(jù)該圖像特征數(shù)據(jù)Dic生成與上述對象圖像類似的預測圖像的數(shù)據(jù)(預測圖像數(shù)據(jù))PDic的預測圖像生成單元801、和接收上述對象圖像的數(shù)據(jù)(對象圖像數(shù)據(jù))Dit和預測圖像數(shù)據(jù)PDit并將對象圖像數(shù)據(jù)Dit參照與其對應的預測圖像數(shù)據(jù)PDit進行算術編碼處理從而輸出與上述對象圖像對應的熵代碼作為其編碼數(shù)據(jù)Die的熵編碼單元802。
圖32是用于說明上述圖像特征的模式圖。
設輸入的圖像是由白像素和黑像素構成的2值圖像。
圖像特征使用可以再生與對象2值圖像類似的2值圖像的特征。例如,在對象2值圖像為上述實施例的包含文字的文書圖像時,作為圖像特征,可以使用以下所述的網(wǎng)格特征等。此外,作為上述圖像特征,也可以使用文字代碼及文字識別中的所謂的特征矢量。
下面,說明這里所使用的圖像特征。
上述圖像特征按以下方式求出。
將對象2值圖像3200分割為一定尺寸的區(qū)域(例如8×8像素的塊)3201。將各塊內(nèi)像素的像素值置換為該塊內(nèi)像素的像素值中頻度最高的像素值。在2值圖像的情況時,就用上述塊內(nèi)的黑像素和白像素中在塊內(nèi)數(shù)量多的像素值置換。
結果,輸入2值圖像(例如64×64像素)的圖像特征就成為8像素×8像素的縮小2值圖像。以后,將該特征稱為網(wǎng)格特征。
下面,說明其動作。
在對象圖像數(shù)據(jù)Dit和圖像特征數(shù)據(jù)Dic輸入本實施例8的圖像編碼裝置800時,由預測圖像生成單元801根據(jù)表示上述縮小2值圖像3202的圖像特征數(shù)據(jù)生成與上述對象圖像對應的預測圖像并輸出其數(shù)據(jù)(預測圖像數(shù)據(jù))Pdit。
這里,通過放大上述縮小2值圖像而生成上述預測圖像。
圖33是用于說明上述縮小2值圖像的放大方法的模式圖。
例如,分別與縮小2值圖像3301的多個像素3301a對應地生成各像素具有相同像素值的8像素×8像素的塊。
例如,在上述放大處理中,縮小2值圖像3301的左上角的像素3301al變換為預測圖像3302的左上角的8×8像素的塊3302al。
并且,由熵編碼單元802參照上述預測圖像數(shù)據(jù)PDit對對象圖像數(shù)據(jù)Dit進行和實施例1的熵編碼單元106相同的編碼處理。
這樣,在本實施例8中,根據(jù)從作為編碼處理的對象的對象圖像中抽出的表示圖像特征的數(shù)據(jù)(圖像特征數(shù)據(jù))Dic生成與上述對象圖像對應的預測圖像的數(shù)據(jù)(預測圖像數(shù)據(jù))PDi,并根據(jù)該預測圖像數(shù)據(jù)PDit對對象圖像數(shù)據(jù)Dit進行所述編碼處理,所以,可以提高熵編碼器的編碼效率。
另外,與和上述對象圖像數(shù)據(jù)Dit對應的熵代碼(編碼數(shù)據(jù))Die一起輸出與對象圖像對應的圖像特征的數(shù)據(jù),所以,也可以利用圖像特征數(shù)據(jù)進行與對象圖像對應的編碼數(shù)據(jù)的檢索。
(實施例9)圖9是表示本發(fā)明實施例9的圖像編碼裝置的結構的框圖。本實施例9與權利要求9、權利要求10、權利要求13對應。
本實施例9的圖像編碼裝置900可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例9的圖像編碼裝置900除了上述實施例8的圖像編碼裝置800外,還具有從對象圖像數(shù)據(jù)Dit中抽出圖像特征數(shù)據(jù)Dic的圖像特征抽出單元901,將上述對象圖像數(shù)據(jù)Dit參照根據(jù)與其對應的圖像特征數(shù)據(jù)Dic得到的預測圖像數(shù)據(jù)PDit進行算術編碼處理。即,構成上述圖像編碼裝置900的預測圖像生成單元904和熵編碼單元905的結構分別與上述實施例8的圖像編碼裝置800中的預測圖像生成單元801和熵編碼單元802完全相同。
這里,上述圖像特征抽出單元901從作為編碼的對象的對象圖像中作為圖像特征抽出網(wǎng)格特征,由將對象圖像分割為塊(這里為由8×8像素構成的圖像空間)并輸出與各塊對應的塊數(shù)據(jù)BDit的塊化單元902和使塊內(nèi)像素(構成塊的像素)的像素值平滑的塊平滑單元903構成。由該塊平滑單元903具體地將塊內(nèi)像素的像素值用塊內(nèi)出現(xiàn)頻度最高的像素值進行置換。例如,在通過黑像素和白像素顯示的2值圖像中,出現(xiàn)頻度最高的像素值是塊內(nèi)的黑像素和白像素中數(shù)量多的像素的像素值。
下面,說明其動作。
設輸入本實施例9的圖像編碼裝置900的對象圖像數(shù)據(jù)是2值圖像數(shù)據(jù)。
Dit輸入上述圖像編碼裝置900時,由圖像特征抽出單元901從對象圖像數(shù)據(jù)Dit中抽出圖像特征數(shù)據(jù)Dic。
即,由圖像特征抽出單元901的塊化單元902將作為對象圖像的2值圖像分割為指定尺寸(8×8像素)的塊,并輸出與各塊對應的圖像數(shù)據(jù)BDit。其次,由塊平滑單元903對上述塊圖像數(shù)據(jù)BDit進行將塊內(nèi)的各像素的像素值順序置換為出現(xiàn)頻度最高的像素值的平滑處理,并輸出平滑處理后的塊圖像數(shù)據(jù)作為圖像特征數(shù)據(jù)Dic。
這里,由于對象圖像是2值圖像,所以,通過上述平滑處理,塊內(nèi)像素的像素值就置換為黑像素和白像素中在塊內(nèi)數(shù)量多的像素值。
該平滑處理的結果,在上述對象2值圖像是由64像素×64像素構成的圖像時,作為對上述對象2值圖像的圖像特征,可以得到由8像素×8像素構成的縮小2值圖像作為圖像特征(網(wǎng)格特征)。
并且,由預測圖像生成單元904根據(jù)上述圖像特征數(shù)據(jù)Dic生成與對象圖像對應的預測圖像的數(shù)據(jù)PDit,由熵編碼單元905對對象圖像數(shù)據(jù)Dit參照上述預測圖像數(shù)據(jù)PDit進行算術編碼處理,作為與對象圖像數(shù)據(jù)對應的編碼數(shù)據(jù)Die輸出熵代碼。
這樣,在本實施例9中,除了實施例8的結構外,具有從對象圖像數(shù)據(jù)Dit中抽出表示對象圖像的圖像特征的數(shù)據(jù)Dic的圖像特征抽出單元902,所以,除了實施例8的效果外,由圖像編碼裝置從對象圖像數(shù)據(jù)中抽出圖像特征數(shù)據(jù),可以得到作為文書文卷編排裝置及傳真裝置中的圖像編碼單元而應用的圖像編碼裝置。
另外,與分割對象圖像的指定尺寸的多個塊對應地分割與對象圖像對應的圖像數(shù)據(jù),將與上述各塊對應的圖像數(shù)據(jù)置換為各塊內(nèi)的各像素的像素值中出現(xiàn)頻度最高的最頻像素值,作為對上述對象圖像的圖像特征數(shù)據(jù),輸出與和上述各塊對應的最頻像素值構成的縮小圖像對應的圖像數(shù)據(jù),所以,可以簡單地作成表示對象圖像的特征的圖像特征數(shù)據(jù)。
(實施例10)圖10時表示本發(fā)明實施例10的圖像譯碼裝置的結構的框圖。本實施例10與權利要求12、權利要求14對應。
本實施例10的圖像譯碼裝置1000是與上述實施例8或9的圖像編碼裝置800或900對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即,圖像譯碼裝置1000接收從上述實施例8或9的圖像編碼裝置800或900輸出的熵代碼(編碼數(shù)據(jù))Die和圖像特征數(shù)據(jù)Dic,對該編碼數(shù)據(jù)Die參照根據(jù)圖像特征數(shù)據(jù)Dic生成的預測圖像數(shù)據(jù)Pdit進行算術譯碼處理。
具體而言,上述圖像譯碼裝置1000具有根據(jù)圖像特征數(shù)據(jù)Dic生成預測圖像數(shù)據(jù)PDit的預測圖像生成單元1001和參照上述預測圖像數(shù)據(jù)PDit對該編碼數(shù)據(jù)Die進行算術譯碼處理并輸出與對象圖像對應的譯碼圖像數(shù)據(jù)Did的熵譯碼單元1002。
這里,圖像特征是實施例8所示的縮小圖像(網(wǎng)格特征),對象圖像是2值圖像。另外,輸入的編碼數(shù)據(jù)Die是通過利用實施例8或9的圖像編碼裝置的對象圖像與預測圖像的相關的算術編碼處理而得到的熵代碼。
下面,說明其動作。
在編碼數(shù)據(jù)Die和圖像特征數(shù)據(jù)Dic輸入本實施例10的圖像譯碼裝置1000時,由預測圖像生成單元1001根據(jù)上述圖像特征數(shù)據(jù)Dic生成對應上述對象圖像的預測圖像的數(shù)據(jù)Pdit。
并且,由熵譯碼單元1002對與對象圖像對應的編碼數(shù)據(jù)Die參照上述預測圖像數(shù)據(jù)PDit進行算術譯碼處理,并輸出與對象圖像對應的譯碼圖像數(shù)據(jù)Did。
這樣,在本實施例10的圖像譯碼裝置1000中,具有根據(jù)與對象圖像對應的圖像特征數(shù)據(jù)Dic生成與對象圖像對應的預測圖像數(shù)據(jù)PDit的預測圖像生成單元1001,參照預測圖像數(shù)據(jù)PDit對該編碼數(shù)據(jù)Die進行算術譯碼處理,所以,可以實現(xiàn)將通過利用對象圖像與預測圖像的相關的編碼效率高的算術編碼處理而得到的熵代碼正確地進行譯碼的圖像譯碼裝置。
另外,具有上述實施例9的圖像編碼裝置900和實施例10的圖像譯碼裝置1000的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置900和圖像譯碼裝置1000而實現(xiàn)。
此外,具有上述實施例9的圖像編碼裝置900和實施例10的圖像譯碼裝置1000的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置900和圖像譯碼裝置1000而實現(xiàn)。
(實施例11)圖11是表示本發(fā)明實施例11的圖像編碼裝置的結構的框圖。本實施例11與權利要求9、權利要求11、權利要求15對應。
本實施例11的圖像編碼裝置1100可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例11的圖像編碼裝置1100除了上述實施例8的圖像編碼裝置800的結構外,還具有從對象圖像數(shù)據(jù)Dit中抽出與和對象圖像類似的類似圖像對應的標識符作為圖像特征數(shù)據(jù)Dic的圖像特征抽出單元1101,將上述對象圖像數(shù)據(jù)Dit參照根據(jù)與其對應的圖像特征數(shù)據(jù)Dic得到的預測圖像數(shù)據(jù)PDit進行算術編碼處理。即,構成上述圖像編碼裝置1100的預測圖像生成單元1104和熵編碼單元1105的結構分別與上述實施例8的圖像編碼裝置800的預測圖像生成單元801和熵編碼單元802完全相同。
這里,上述圖像特征抽出單元1101具有從作為編碼的對象的對象圖像中抽出表示該圖像的特征的特征矢量的特征量抽出單元1102和對與該對象圖像對應的特征矢量進行矢量量化處理并輸出類似圖像的標識符的矢量量化單元1103。另外,上述特征矢量是在文字的圖形識別等中使用的特征量的一種。該特征矢量只要是可以在文字識別等中利用的就行,不論是什么都可以,但是,特別是背景特征及輪廓方向特征等是有效的(參見“模式識別、電子情報通信學會、p.43”)。
例如,作為與表示平假名文字“あ”的2值圖像對應的特征矢量,可以舉出以將圖32所示的文字圖像“あ”3200的縮小圖像3202的各像素按指定的順序取白像素為“0”、黑像素為“1”進行掃描而得到的“0”和“1”的排列為要素的矢量。
另外,在矢量量化處理中,根據(jù)特征矢量使用VQ代碼薄導出上述標識符。在上述VQ代碼薄中,使代表特征矢量與標識符對應。上述代表特征矢量是將在矢量空間上定義的多個學習矢量設定在分為多個組時的各組中的矢量。
并且,在任意的矢量輸入上述矢量量化單元1103時,在上述矢量空間上檢索上述任意矢量與代表特征矢量間的距離成為最小的組,根據(jù)VQ代碼薄輸出與表示該組的代表特征矢量對應的標識符。VQ代碼薄的作成方法記載在“Linde,Buzo,Gray;An Algorithm forVector Quantizer Design,IEEE Trans.Commun.,COM-28-1,pp.84-95,1980”中。
在本實施例中,作為矢量,考慮從圖像得到的特征矢量。作為學習矢量,使用根據(jù)文字字體(2值文字圖像)求出的特征矢量,矢量間的距離使用歐幾里得距離。VQ代碼薄的要素由組的代表特征矢量和標識符的組合構成。
另外,構成上述圖像編碼裝置1100的預測圖像生成單元1104和熵編碼單元1105的結構分別與上述實施例8的圖像編碼裝置800的預測圖像生成單元801和熵編碼單元802完全相同。
下面,說明其動作。
設輸入本實施例11的圖像編碼裝置1100的對象圖像數(shù)據(jù)為2值圖像的數(shù)據(jù)。
在上述對象圖像數(shù)據(jù)Dit輸入上述圖像編碼裝置1100時,由圖像特征抽出單元1101從對象圖像數(shù)據(jù)Dit中抽出圖像特征數(shù)據(jù)Dic。
即,由圖像特征抽出單元1101的特征量抽出單元1102作為根據(jù)輸入圖像在文字識別等中利用的特征量輸出特征矢量Vc。于是,由矢量量化單元1103探索與所得到的特征矢量Vc最接近的代表特征矢量,求出并輸出與該代表特征矢量對應的標識符Dic。
并且,由預測圖像生成單元1104根據(jù)從矢量量化單元1103輸出的標識符(圖像特征數(shù)據(jù))Dic求出并輸出預測圖像數(shù)據(jù)PDit。這里,預測圖像是代表與標識符對應的矢量空間內(nèi)的組的圖像,是具有與該組對應的代表特征矢量和距離最近的特征矢量的文字圖像。預測圖像除了上述圖像以外,也可以采用將與屬于上述矢量圖像空間內(nèi)的各組的多個特征矢量對應的文字圖像平均化后的圖像。
最后,由熵編碼單元1105和上述實施例9一樣,根據(jù)從預測圖像生成單元1104輸出的預測圖像數(shù)據(jù)利用預測圖像與對象圖像的相關進行算術編碼處理。
這樣,在本實施例11的圖像編碼裝置1100中,具有作為圖像特征從對象圖像中抽出與和對象圖像類似的類似圖像對應的標識符的圖像特征抽出單元1101,根據(jù)上述標識符作為對象圖像的預測圖像求出上述類似圖像,并參照該類似圖像對對象圖像的數(shù)據(jù)進行算術編碼處理,所以,可以提高算術編碼器的編碼效率,而且可以使用上述標識符檢索對象圖像的編碼數(shù)據(jù)De。
另外,將與包含在對象圖像(文書圖像)中的各個文字圖像對應的特征矢量Vc進行量化處理,并根據(jù)與其對應的代表特征矢量生成與上述文字圖像對應的預測圖像,所以,作為上述文書圖像的各文字的數(shù)據(jù)輸出1個代表特征矢量,可以避免與文書圖像對應的文字數(shù)據(jù)變得冗長,而且可以減輕進行文書圖像的文字設計的檢索時文字識別的錯誤(特征抽出的偏差)的影響。
(實施例12)圖12是表示本發(fā)明實施例12的圖像譯碼裝置的結構的框圖。本實施例12與權利要求16對應。
本實施例12的圖像譯碼裝置1200是與上述實施例11的圖像編碼裝置1100對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即,圖像譯碼裝置1200接收從上述實施例11的圖像編碼裝置1100輸出的熵代碼(編碼數(shù)據(jù))Die和圖像特征數(shù)據(jù)(預測圖像標識符)Dic并對該編碼數(shù)據(jù)Die參照根據(jù)圖像特征數(shù)據(jù)Dic生成的預測圖像數(shù)據(jù)PDit進行算術譯碼處理。
具體而言,上述圖像譯碼裝置1200具有根據(jù)圖像特征數(shù)據(jù)Dic生成預測圖像數(shù)據(jù)PDit的預測圖像生成單元1201和對該編碼數(shù)據(jù)Die參照上述預測圖像數(shù)據(jù)PDit進行算術譯碼處理并輸出與對象圖像對應的譯碼圖像數(shù)據(jù)Did的熵譯碼單元1202。
這里,圖像特征是表示實施例11中的類似圖像的標識符,對象圖像是2值圖像。另外,輸入的編碼數(shù)據(jù)Die是通過實施例11的圖像編碼裝置利用對象圖像與預測圖像(類似圖像)的相關的算術編碼處理而得到的熵代碼。
這里,假定上述標識符是與通過對上述特征矢量的矢量量化處理而得到的代表特征矢量對應的標識符。
下面,說明其動作。
在編碼數(shù)據(jù)Die和圖像特征數(shù)據(jù)(預測圖像標識符)Dic輸入本實施例12的圖像譯碼裝置1200時,由預測圖像生成單元1201根據(jù)上述預測圖像標識符Dic生成對上述對象圖像的類似圖像的數(shù)據(jù)(預測圖像數(shù)據(jù))PDit。
并且,由熵譯碼單元1202對與對象圖像對應的編碼數(shù)據(jù)Die參照上述預測圖像數(shù)據(jù)PDit進行算術譯碼處理,并輸出與對象圖像對應的譯碼圖像數(shù)據(jù)Did。
這樣,在本實施例12的圖像譯碼裝置1200中,具有根據(jù)與對象圖像對應的圖像特征數(shù)據(jù)(預測圖像標識符)Dic生成與對象圖像類似的類似圖像的數(shù)據(jù)PDit的預測圖像生成單元1201,參照預測圖像數(shù)據(jù)PDit對該編碼數(shù)據(jù)Die進行算術譯碼處理,所以,可以實現(xiàn)將通過利用對象圖像與預測圖像的相關的編碼效率高的熵編碼處理而得到的熵代碼正確地進行譯碼的圖像譯碼裝置。
另外,具有上述實施例11的圖像編碼裝置1100和實施例12的圖像譯碼裝置1200的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置1100和圖像譯碼裝置1200而實現(xiàn)。
此外,具有上述實施例11的圖像編碼裝置1100和實施例12的圖像譯碼裝置1200的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置1100和圖像譯碼裝置1200而實現(xiàn)。
(實施例13)圖13是表示本發(fā)明實施例13的圖像編碼裝置的結構的框圖。本實施例13與權利要求17對應。
本實施例13的圖像編碼裝置1300可以作為例如圖39所示的文書文卷編排裝置3900的圖像編碼單元使用。
下面,進行詳細的說明。本實施例13的圖像編碼裝置1300具有接收作為編碼的對象的對象圖像的數(shù)據(jù)(對象圖像數(shù)據(jù))Dit和與該對象圖像類似的預測圖像的數(shù)據(jù)(預測圖像數(shù)據(jù))PDit、并將對象圖像數(shù)據(jù)Dit參照與其對應的預測圖像數(shù)據(jù)PDit進行算術編碼處理、從而輸出與上述對象圖像對應的熵代碼作為其編碼數(shù)據(jù)Die的熵編碼單元1301。
下面,說明其作用效果。
在預測圖像數(shù)據(jù)PDit與對象圖像數(shù)據(jù)Dit一起輸入本實施例13的圖像編碼裝置1300時,由熵編碼單元1302參照上述預測圖像數(shù)據(jù)PDit對對象圖像數(shù)據(jù)Dit進行和實施例1的熵編碼單元106相同的算術編碼處理。
這樣,在本實施例13的圖像編碼裝置1300中,具有將對象圖像數(shù)據(jù)Dit參照與其對應的預測圖像數(shù)據(jù)PDit進行算術編碼處理的熵編碼單元1301,所以,在進行對象圖像數(shù)據(jù)Dit的編碼處理時,通過指定與該對象圖像類似的類似圖像的數(shù)據(jù)并將該數(shù)據(jù)PDit作為與對象圖像對應的預測圖像數(shù)據(jù)而輸入,便可提高算術編碼器的編碼效率。
(實施例14)圖14是表示本發(fā)明實施例14的圖像編碼裝置的結構的框圖。本實施例14與權利要求18、權利要求19對應。
本實施例14的圖像編碼裝置1400可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例14的圖像編碼裝置1400具有根據(jù)對象圖像數(shù)據(jù)Dit生成與其對應的預測圖像數(shù)據(jù)PDit的圖像預測單元1401而取代上述實施例11的圖像編碼裝置11的圖像特征抽出單元1101和預測圖像生成單元1101,參照預測圖像數(shù)據(jù)PDit將上述對象圖像數(shù)據(jù)Dit進行算術編碼處理。即,構成上述圖像編碼裝置1400的熵編碼單元1405的結構與上述實施例11的圖像編碼裝置1100的熵編碼單元1105完全相同。
這里,上述圖像預測單元1401由從作為編碼的對象的對象圖像中抽出表示該圖像的特征的特征矢量Vc的特征量抽出單元1402、對與該對象圖像對應的特征矢量進行矢量量化處理并輸出類似圖像的標識符Dic的矢量量化單元1403、和根據(jù)上述標識符生成與對象圖像對應的預測圖像數(shù)據(jù)PDit的預測圖像生成單元1404構成。
這里,作為預測圖像數(shù)據(jù)的抽出處理的一例,利用矢量量化處理,上述特征量抽出單元1402、矢量量化單元1403和預測圖像生成單元1404的結構分別與實施例11的特征矢量抽出單元1101、矢量量化單元1103和預測圖像生成單元1104相同。
下面,說明其動作。
在上述對象圖像數(shù)據(jù)Dit輸入上述圖像編碼裝置1400時,由圖像預測單元1401根據(jù)對象圖像數(shù)據(jù)Dit生成預測圖像數(shù)據(jù)PDit。在上述圖像預測單元1401中,由上述特征量抽出單元1402、矢量量化單元1403和預測圖像生成單元1404分別進行和實施例11的對應的單元1101、1103、1104相同的處理,生成預測圖像數(shù)據(jù)。
并且,由熵編碼單元1405通過與實施例11的熵編碼單元1105相同的處理,利用上述預測圖像數(shù)據(jù)PDit與對象圖像數(shù)據(jù)Dit的相關對對象圖像數(shù)據(jù)Dit進行熵編碼處理。
這樣,在本實施例14的圖像編碼裝置1400中,具有根據(jù)對象圖像數(shù)據(jù)Dit生成與其對應的預測圖像數(shù)據(jù)PDit的圖像預測單元1401,參照預測圖像數(shù)據(jù)PDit將上述對象圖像數(shù)據(jù)Dit進行熵編碼,所以,可以提高算術編碼器的編碼效率,而且可以利用上述預測圖像數(shù)據(jù)PDit檢索對對象圖像的編碼數(shù)據(jù)De。
(實施例15)圖15是表示本發(fā)明實施例15的圖像譯碼裝置的結構的框圖。本實施例15與權利要求20對應。
本實施例15的圖像譯碼裝置1500是與上述實施例14的圖像編碼裝置1400對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即,圖像譯碼裝置1500接收從上述實施例14的圖像編碼裝置1400輸出的熵代碼(編碼數(shù)據(jù))Die和預測圖像數(shù)據(jù)PDit,對該編碼數(shù)據(jù)Die參照預測圖像數(shù)據(jù)PDit進行算術譯碼處理。
下面,說明其動作。
在編碼數(shù)據(jù)Die輸入本實施例15的圖像譯碼裝置1500時,由熵譯碼單元1501對與對象圖像對應的編碼數(shù)據(jù)Die參照上述預測圖像數(shù)據(jù)PDit進行算術譯碼處理,輸出與對象圖像對應的譯碼圖像數(shù)據(jù)Did。
這樣在本實施例15的圖像譯碼裝置1500中,參照與對象圖像對應的預測圖像數(shù)據(jù)PDit將與對象圖像對應的編碼數(shù)據(jù)Die進行熵譯碼處理,所以,可以實現(xiàn)將通過利用對象圖像與預測圖像的相關的編碼效率高的熵編碼處理而得到的熵代碼正確地進行譯碼的圖像譯碼裝置。
具有上述實施例13或14的圖像編碼裝置1300或1400和實施例15的圖像譯碼裝置1500的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置1300或1400和圖像譯碼裝置1500而實現(xiàn)。
此外,具有上述實施例13或14的圖像編碼裝置1300或1400和實施例15的圖像譯碼裝置1500的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置1300或1400和圖像譯碼裝置1500而實現(xiàn)。
(實施例16)圖16是表示本發(fā)明實施例16的圖像編碼裝置的結構的框圖。本實施例16與權利要求33對應。
本實施例16的圖像編碼裝置1600可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例16的圖像編碼裝置1600具有將對象圖像數(shù)據(jù)Dit進行編碼并輸出編碼數(shù)據(jù)Die的圖像編碼單元1601,和將關于對象圖像的屬性信息Dai與和上述對象圖像對應的編碼數(shù)據(jù)Die一起接收并將上述屬性信息Dai附加到編碼數(shù)據(jù)Die上從而輸出屬性附加編碼數(shù)據(jù)Daie的屬性信息附加單元1602。
這里,上述圖像編碼單元1601的結構和實施例9的圖像編碼裝置900相同。上述圖像編碼裝置1601不限于由實施例9的圖像編碼裝置900構成,也可以由實施例8、11、13和14中的任意一個圖像編碼裝置構成。另外,作為上述對象圖像,有包含文字的文書圖像或表示文字本身的文字圖像等,這里假定上述對象圖像為文字圖像,屬性信息表示關于文字圖像的屬性。因此,上述圖像編碼單元1601,作為編碼數(shù)據(jù)Die輸出與文字圖像對應的文字圖像代碼。
圖34是用于說明關于上述文字圖像的屬性信息的模式圖。
在屬性信息中,包含作為對象的文字圖像配置在文書圖像中的位置、文書圖像中的文字圖像區(qū)域的高度和寬度、相對于文書圖像中的文字圖像區(qū)域的縱寫、橫寫的區(qū)別等多個屬性項目。這里,文字圖像在文書圖像中的位置通過與文字圖像外接的矩形(長方形)的左上頂點的坐標(外接矩形的左上坐標)來表示。另外,上述文字圖像區(qū)域的高度是文字圖像的縱方向的尺寸。
另外,如圖34所示,上述屬性信息的各屬性項目通過用于識別屬性項目的標識符(屬性標識符)A(i)〔i=0,l,2,…,n〕和在數(shù)量上表示屬性項目的屬性值M(i)〔i=0,1,2,…,n〕的組(通常為矢量)來表述,代碼串的1個屬性信息的最終位置利用稱為EOT(End Of Table)的特殊的屬性標識符來表示。
例如,屬性標識符A(0)表示作為屬性項目的外接矩形的左上坐標,屬性標識符A(0)具有值“0”,屬性值M(0)是上述外接矩形的左上坐標的值。屬性標識符A(1)表示作為屬性項目的文字圖像區(qū)域的高度,屬性標識符A(1)具有值“1”,屬性值M(1)是上述文字圖像區(qū)域的高度的數(shù)值。屬性標識符A(2)表示作為屬性項目的文字圖像區(qū)域的寬度,屬性標識符A(2)具有值“2”,屬性值M(2)是上述文字圖像區(qū)域的寬度的數(shù)值。屬性標識符A(3)表示作為屬性項目的文字圖像的縱寫(0)/橫寫(1)的區(qū)別,屬性標識符A(3)具有值“3”,屬性值M(3)是表示上述縱寫(0)/橫寫(1)的區(qū)別的數(shù)值“0”或數(shù)值“1”。另外,屬性標識符A(i-1)表示第i個屬性項目,屬性標識符A(i-1)具有指定的值“i-1””,屬性值M(i-1)是表示上述第i個屬性項目的指定的數(shù)值。此外,屬性標識符A(n)表示沒有第n個屬性項目之后的屬性項目,屬性標識符A(n)具有符號“EOT”。
圖35(a)表示某一文字圖像的屬性信息具有外接矩形的坐標(104、23)、文字圖像區(qū)域的寬度(53)、縱寫(0)這樣的3個屬性項目時的屬性附加編碼數(shù)據(jù)Daie的代碼串。
在該屬性附加編碼數(shù)據(jù)Daie中,在與文字圖像對應的編碼數(shù)據(jù)Die之前附加屬性信息Dai,在與該屬性信息Dai對應的代碼串中,分別成對地包含具有值“0”的屬性標識符A(0)和具有值(104,23)的屬性值M(0)、具有值“2”的屬性標識符A(2)和具有值(53)的屬性值M(2)、具有值“3”的屬性標識符A(3)和具有值(0)的屬性值M(3),在屬性值M(3)之后,配置具有符號“EOT”的屬性標識符A(n)。
下面,說明其動作。
在對象圖像(文字圖像)的數(shù)據(jù)Dit輸入本實施例16的圖像編碼裝置1600時,由圖像編碼單元1601和實施例9的圖像編碼裝置900一樣將該對象圖像數(shù)據(jù)Dit參照預測圖像數(shù)據(jù)PDit進行熵編碼處理,與圖像特征數(shù)據(jù)Dic一起輸出編碼數(shù)據(jù)(文字圖像編碼數(shù)據(jù))Die。
這時,在上述文字圖像編碼Die輸入屬性信息附加單元1602的同時,從外部輸入對象圖像(輸入文字圖像)的屬性信息Dai。于是,由屬性信息附加單元1602將其屬性信息Dai附加到文字圖像數(shù)據(jù)Die上,輸出屬性附加編碼數(shù)據(jù)Daie。
這樣,在本實施例16的圖像編碼裝置1600中,作為將文字圖像數(shù)據(jù)編碼并輸出編碼數(shù)據(jù)(文字圖像編碼數(shù)據(jù))Die的圖像編碼單元1601,具有和實施例9的圖像編碼裝置900相同的結構,給從該圖像編碼單元1601輸出的文字圖像編碼數(shù)據(jù)Die附加上其屬性信息Dai而輸出,所以,除了實施例9的效果外,不將文字圖像編碼數(shù)據(jù)進行譯碼就可以知道文字圖像的屬性。
另外,在使用圖像特征數(shù)據(jù)進行文字圖像的檢索時,可以參照文字圖像的屬性信息進行快速檢索。
(實施例17)圖17是表示本發(fā)明實施例17的圖像編碼裝置的結構的框圖。本實施例17與權利要求34對應。
本實施例17的圖像編碼裝置1700可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例17的圖像編碼裝置1700具有接收對象圖像的數(shù)據(jù)Dit將與包含在對象圖像中的文字圖像對應的圖像數(shù)據(jù)進行編碼并與和該文字圖像對應的編碼數(shù)據(jù)(文字圖像編碼數(shù)據(jù))De1一起輸出表示上述對象圖像中文字圖像的位置的位置數(shù)據(jù)Dcp的文字圖像編碼單元1701、接收對象圖像數(shù)據(jù)Dit和上述文字圖像的位置數(shù)據(jù)Dcp并輸出與從對象圖像中消去文字圖像而得到的非文字圖像對應的數(shù)據(jù)Dcd的文字圖像消去單元1702,和對非文字圖像數(shù)據(jù)Dcd進行編碼處理并輸出與非文字圖像對應的編碼數(shù)據(jù)(非文字圖像編碼數(shù)據(jù))De2的非文字圖像編碼單元1703。
這里,上述文書圖像編碼單元1701將根據(jù)文字圖像數(shù)據(jù)及其屬性信息進行文字圖像數(shù)據(jù)的編碼并輸出包含文字圖像的屬性信息Dai和文字圖像編碼數(shù)據(jù)Die的屬性附加編碼數(shù)據(jù)Daie的實施例16的圖像編碼裝置作為其一部分包含在其中。
下面,說明其動作。
在作為對象圖像數(shù)據(jù)Dit,2值文書圖像的數(shù)據(jù)輸入本實施例17的圖像編碼裝置1700時,由文字圖像編碼單元1701作為文字圖像順序抽出對象圖像的文字部分的圖像,對各文字圖像的數(shù)據(jù)進行編碼處理,作為與文字圖像對應的編碼數(shù)據(jù)輸出文字圖像編碼數(shù)據(jù)De1。這時,與文書圖像編碼數(shù)據(jù)De1一起也輸出文書圖像的屬性信息(圖中未示出)。
其次,由文字圖像消去單元1702從對象圖像(文書圖像)中消去文字部分(文字圖像),然后,構成對象圖像的消去部分的圖像的像素值利用位于該消去部分周邊的圖像所像素值進行內(nèi)插。在對象圖像為2值圖像時,消去部分由白像素所湮沒。這樣,就從上述文字圖像消去單元1702輸出非文字圖像的數(shù)據(jù)即與構成對象圖像的文字部分的像素的像素值用其周邊的像素的像素值置換后的圖像對應的數(shù)據(jù)Dcd。
最后,由非文字圖像編碼單元1703利用JBIG(Joint Bi-LevelImage Coding Experts Group)、MMR(Modified Modified Read)、JPEG(Joint Photographic Cording Experts Group)等壓縮編碼方法將非文字圖像數(shù)據(jù)Dcd進行編碼,作為非文字圖像編碼數(shù)據(jù)De2輸出與非文字圖像對應的編碼數(shù)據(jù)。
下面,具體說明上述圖像編碼裝置1700的編碼處理。
圖36是用于說明上述圖像編碼裝置1700的處理的圖。
例如,在作為使用表的文書的圖像的2值文書圖像3501與表示包含在該文書圖像中的文字圖像的位置和大小的屬性信息一起輸入上述圖像編碼裝置1700時,由文字圖像編碼單元1701抽出上述文書圖像的各文字圖像3603的數(shù)據(jù),對各文字圖像將該數(shù)據(jù)編碼。這樣,與各文字圖像對應的編碼數(shù)據(jù)就作為文字圖像編碼數(shù)據(jù)De1從上述文字圖像編碼單元1701順序輸出。
另外,由文字圖像消去單元1702根據(jù)表示包含在文書圖像中的文字圖像的位置和大小的屬性信息進行用白像素將文書圖像的各文字圖像的部分湮沒的像素置換處理,從而輸出消去了文書圖像的文字部分的非文字圖像3602的數(shù)據(jù)Dcd。
并且,由非文字圖像編碼單元1703利用JBIG、MMR、JPEG等壓縮編碼方法將非文字圖像3602的數(shù)據(jù)Dcd進行編碼,作為非文字圖像編碼數(shù)據(jù)De2輸出與非文字圖像對應的編碼數(shù)據(jù)。
這樣,在本實施例17的圖像編碼裝置1700中,具有接收與文書圖像對應的數(shù)據(jù)Dit并抽出包含在該文書圖像中的文字圖像從而將該文字圖像的數(shù)據(jù)進行編碼的文字圖像編碼單元1701、和接收與文書圖像對應的數(shù)據(jù)Dit并生成與消去包含在該文書圖像中的文字部分的非文字圖像對應的數(shù)據(jù)的文字圖像消去單元1702,將文書圖像的數(shù)據(jù)分為文字圖像和非文字圖像進行編碼,所以,可以將文字圖像和非文字圖像分別利用適合于它們的編碼效率高的編碼方法進行編碼。另外,可以利用與文字圖像對應的編碼數(shù)據(jù)(文字圖像編碼數(shù)據(jù))進行文書檢索。
(實施例18)圖18是表示本發(fā)明實施例18的圖像譯碼裝置的結構的框圖。本實施例18與權利要求35對應。
本實施例18的圖像譯碼裝置1800是與上述實施例17的圖像編碼裝置1700對應的譯碼裝置,可以作為例如圖39所示的完善文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
該實施例18的圖像譯碼裝置1800具有接收順序輸入的文字圖像編碼數(shù)據(jù)De1并將該文字圖像編碼數(shù)據(jù)De1進行譯碼從而生成文字圖像數(shù)據(jù)Dd1的文字圖像譯碼單元1801、接收非文字圖像編碼數(shù)據(jù)De2并將非文字圖像編碼數(shù)據(jù)進行譯碼從而生成非文字圖像數(shù)據(jù)Dd2的非文字圖像譯碼單元1802和接收上述非文字圖像數(shù)據(jù)和文字圖像數(shù)據(jù)并根據(jù)文書圖像的屬性信息(圖中未示出)進行將各文字圖像配置到上述非文字圖像上的指定位置的文書圖像的再構成從而生成作為對象圖像的文書圖像的數(shù)據(jù)Dd的圖像再構成單元1803。
下面,說明其動作。
在文字圖像編碼數(shù)據(jù)De1和非文字圖像編碼數(shù)據(jù)De2輸入本實施例18的圖像譯碼裝置1800時,由文字圖像譯碼單元1801對文字圖像編碼數(shù)據(jù)進行與在上述圖像編碼裝置1700中的文字圖像的編碼處理對應的譯碼處理,生成文字圖像數(shù)據(jù)Dd1。另外,這時,由非文字圖像譯碼單元1802對非文字圖像編碼數(shù)據(jù)De2進行與在上述圖像編碼裝置1700中的非文字圖像的編碼處理對應的譯碼處理,生成非文字圖像數(shù)據(jù)Dd2。
并且,由圖像再構成單元1803使用上述非文字圖像數(shù)據(jù)和文字圖像數(shù)據(jù)根據(jù)文書圖像的屬性信息(圖中未示出)進行文書圖像的再構成處理,生成各文字圖像配置到上述非文字圖像上的指定位置的文書圖像的數(shù)據(jù)Dd。
這樣,在本實施例18的圖像譯碼裝置1800中,作為與文書圖像對應的編碼數(shù)據(jù),分別接收文書圖像的文字圖像的編碼數(shù)據(jù)De1和消去了文書圖像的文字圖像的非文字圖像的編碼數(shù)據(jù)De2,分別將各編碼數(shù)據(jù)進行譯碼生成文字圖像數(shù)據(jù)Dd1和非文字圖像數(shù)據(jù)Dd2,根據(jù)這些數(shù)據(jù)Dd1和Dd2進行文書圖像的再構成,生成文書圖像數(shù)據(jù),所以,可以實現(xiàn)可以將利用分別符合于文字圖像和非文字圖像的有效的編碼方法進行編碼的編碼數(shù)據(jù)De1和De2正確地進行譯碼的圖像譯碼裝置。
另外,可以利用與文字圖像對應的編碼數(shù)據(jù)(文字圖像編碼數(shù)據(jù))進行文書圖像的檢索。
具有上述實施例16或17的圖像編碼裝置1600或1700和實施例18的圖像譯碼裝置1800的傳真裝置,可以通過分別將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a置換為上述圖像編碼裝置1600或1700和圖像譯碼裝置1800而實現(xiàn)。
此外,具有上述實施例16或17的圖像編碼裝置1600或1700和實施例18的圖像譯碼裝置1800的文書文卷編排裝置,可以通過分別將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a置換為上述圖像編碼裝置1600或1700和圖像譯碼裝置1800而實現(xiàn)。
(實施例19)圖19是表示本發(fā)明實施例19的文字核對裝置的結構的框圖。本實施例19與權利要求36對應。
本實施例19的文字核對裝置1900可以作為例如圖39所示的文書文卷編排裝置3900等電子儀器中的信息檢索裝置的一部分使用。
上述文字核對裝置1900具有接收附加了屬性信息Dai的文字圖像編碼數(shù)據(jù)D19根據(jù)從外部輸入的檢索條件的數(shù)據(jù)Sd輸出表示上述文字圖像編碼數(shù)據(jù)D19是否滿足檢索條件的核對結果的數(shù)據(jù)Sr的文字屬性核對單元1901。
這里,附加了屬性信息Dai的文字圖像編碼數(shù)據(jù)D19的數(shù)據(jù)結構和從實施例16的圖像編碼裝置1600輸出的屬性附加編碼數(shù)據(jù)Daie相同。
如圖34所示,該屬性信息包含與各個屬性對應的屬性標識符A(i)和屬性值M(i),由與各屬性項目對應的屬性標識符和屬性值的組(通常為矢量)的集合構成。
另外,上述檢索條件數(shù)據(jù)Sd包含多個屬性區(qū)別條件,各屬性區(qū)別條件由屬性標識符和以其屬性值為變量的條件式的組來表述。如果上述文字圖像編碼數(shù)據(jù)D19的特定屬性的屬性值滿足上述檢索條件中對應的屬性區(qū)別條件的屬性值的條件式,該屬性區(qū)別條件即為真,如果上述特定屬性的屬性值不滿足屬性區(qū)別條件的屬性值的條件式,檢索條件的該屬性區(qū)別條件就為偽。
并且,如果檢索條件的所有的屬性區(qū)別條件都是真,就判定作為檢索的對象的文字圖像編碼數(shù)據(jù)滿足檢索條件。
例如,假定文字圖像編碼數(shù)據(jù)D19具有圖35(a)的屬性信息。即,表示屬性標識符A(0)的屬性(外接矩形的左上的坐標)的屬性值M(0)為(104,23)、表示屬性標識符A(2)的屬性(區(qū)域的寬度)的屬性值M(2)為53,表示屬性標識符A(3)的屬性(縱寫和橫寫的區(qū)別)的屬性值M(3)為0(縱寫)。
另外,如圖35(b)所示,檢索條件包含2個屬性區(qū)別條件3501和3502。上述屬性區(qū)別條件3501包含屬性標識符SA(2)和關于表示它的屬性(區(qū)域的寬度)的屬性值的條件式SM(2),該屬性值的條件式SA(2)成為X>30,表示區(qū)域的寬度大于30。另外,上述屬性區(qū)別條件3502包含屬性標識符SA(3)和關于表示它的屬性(縱寫、橫寫的區(qū)別)的屬性值SM(3),屬性值SM(3)成為X=0,表示是縱寫。
這時,具有圖35(a)所示的屬性信息Dai的文字圖像編碼數(shù)據(jù)D19滿足上述檢索條件3500的2個屬性區(qū)別條件3601、3502,所以,文字圖像編碼數(shù)據(jù)D19滿足檢索條件3500。
下面,說明其動作。
在表示文字圖像編碼數(shù)據(jù)D19和表示檢索條件3500的數(shù)據(jù)Sd輸入上述實施例19的文字核對裝置1900時,由文字屬性核對單元1901對上述檢索條件3500的各屬性區(qū)別條件判斷上述文字圖像編碼數(shù)據(jù)D19是否滿足屬性區(qū)別條件。
即,如圖35(b)所示,檢索條件3500包含由屬性標識符SA(2)和屬性值SM(2)構成的屬性區(qū)別條件3501和由屬性標識符SA(3)和屬性值SM(3)構成的屬性區(qū)別條件3502,所以,滿足檢索條件的文字圖像為文字圖像的區(qū)域的寬度大于30、而文字圖像為縱寫的文字圖像。
與此相反,如圖35(a)所示,文字圖像編碼數(shù)據(jù)D19具有包含屬性標識符A(0)、A(2)、A(3)和屬性值M(0)、M(2)、M(3)的屬性信息,所以,可知該文字圖像是其外接矩形的左上坐標為(104,23)、文字圖像的區(qū)域的寬度為53、文字圖像是縱寫的文字圖像。
因此,由上述文字屬性核對單元1901判斷與上述文字圖像編碼數(shù)據(jù)D10對應的文字圖像滿足上述檢索條件3500的各屬性區(qū)別條件3501和3502,從而從上述文字核對裝置1900輸出包含在文書圖像的標題行中的大的文字和與縱寫的文字串對應的文字圖像編碼數(shù)據(jù)(文字圖像的編碼數(shù)據(jù))。
這樣,在本實施例19的文字核對裝置1900中,具有通過附加到文字圖像編碼數(shù)據(jù)上的屬性信息與檢索條件的核對來判斷屬性信息是否滿足檢索條件的文字核對單元1901,所以,文字圖像數(shù)據(jù)已編碼的狀態(tài)也可以只抽出包含在文書圖像的標題行中的大的文字及縱寫的文字串。
(實施例20)圖20是表示本發(fā)明實施例20的文字核對裝置的結構的框圖。本實施例20與權利要求37、權利要求38對應。
本實施例20的文字核對裝置2000可以作為例如圖39所示的文書文卷編排裝置3900等電子儀器中的信息檢索裝置的一部分使用。
文字核對裝置2000接收特定從外部輸入的文字圖像的文字代碼Dco并將與附加了圖像特征數(shù)據(jù)V20的文字圖像編碼數(shù)據(jù)D20對應的文字圖像與由上述文字代碼所特定的文字圖像進行核對,輸出表示核對結果的數(shù)據(jù)Sr。
即,文字核對裝置200具有抽出包含在由上述文字代碼所特定的文字圖像中的圖像特征的圖像特征抽出單元2001,該圖像特征抽出單元2001由根據(jù)文字代碼Dco生成由該文字代碼所特定的文字圖像的數(shù)據(jù)Di的文字圖像生成單元2002和接收上述文字圖像數(shù)據(jù)Di并抽出包含在由文字代碼所特定的文字圖像中的圖像特征從而輸出圖像特征數(shù)據(jù)Vc的特征量抽出單元2003構成。這里,上述圖像特征數(shù)據(jù)V20和圖像特征數(shù)據(jù)Vc利用和從實施例11的圖像編碼裝置1100的特征量抽出單元1102輸出的圖像特征數(shù)據(jù)相同的矢量表示。
另外,上述文字核對裝置2000具有求出文字圖像編碼數(shù)據(jù)D20所具有的圖像特征數(shù)據(jù)V20與從圖像特征抽出單元2001得到的圖像特征數(shù)據(jù)Vc的歐幾里得距離并輸出距離信息Cd的距離計算單元2005,和根據(jù)該距離信息Cd輸出表示與文字圖像編碼數(shù)據(jù)D20對應的文字圖像與由上述文字代碼所特定的文字圖像是否一致的核對結果的數(shù)據(jù)Sr的核對判斷單元2006。
在本實施例中,包含在文字圖像中的圖像特征采用圖32所示的縮小圖像(網(wǎng)格特征)3202,圖像特征數(shù)據(jù)為以例如掃描縮小圖像的各像素(網(wǎng)格)的像素值而得到的多個值為分量的矢量。
下面,說明其動作。
在文字圖像編碼數(shù)據(jù)D20和文字代碼Dco輸入上述實施例20的文字核對裝置2000時,由文字圖像生成單元2002根據(jù)計算機等所使用的文字字體信息生成由文字代碼Dco所特定的文字圖像的數(shù)據(jù)Di。
在該文字圖像數(shù)據(jù)Di輸入特征量抽出單元2003時,由該單元2003抽出文字圖像的圖像特征,生成表示該圖像特征的數(shù)據(jù)(矢量)Vc。該特征量抽出單元2003的處理和實施例9的特征量抽出單元901的處理相同。
作為上述圖像特征而得到的縮小圖像由8像素×8像素構成時,縮小圖像可以考慮64維的歐幾里得空間上的矢量(特征矢量)。
并且,由距離計算單元2004根據(jù)附加到文字圖像編碼數(shù)據(jù)D20上的圖像特征數(shù)據(jù)V20和從上述圖像特征抽出單元2001輸出的圖像特征數(shù)據(jù)Vc求出表示這些數(shù)據(jù)的2個特征矢量間的歐幾里得距離并輸出距離信息Cd。
于是,在核對判斷單元2005中,根據(jù)該距離信息Cd,如果上述歐幾里得距離小于某一閾值,就判定與文字圖像編碼數(shù)據(jù)D20對應的文字圖像與由文字代碼Dco所特定的文字圖像一致,如果上述歐幾里得距離大于閾值,就判定上述兩文字圖像不一致。
這樣,在本實施例20的文字核對裝置2000中,具有根據(jù)從外部輸入的文字代碼Dco抽出由該文字代碼所特定的文字圖像的圖像特征并輸出圖像特征數(shù)據(jù)Vc的圖像特征抽出單元2001,所以,將包含在文字圖像編碼數(shù)據(jù)D20中的特征圖像數(shù)據(jù)V20與和文字代碼Dco對應的文字圖像的圖像特征數(shù)據(jù)Vc進行比較。
因此,在附加了圖像特征數(shù)據(jù)V20的文字圖像編碼數(shù)據(jù)D20與文字代碼Dco之間可以進行對應的文字圖像的核對。
于是,在由文字代碼Dco所特定的文字圖像與和文字圖像編碼數(shù)據(jù)D20對應的文字圖像一致時,不將文字圖像編碼數(shù)據(jù)D20進行譯碼也可以知道與文字圖像編碼數(shù)據(jù)D20對應的文字圖像,從而可以進行與文字圖像編碼數(shù)據(jù)D20對應的文字圖像和其他的文字圖像之間的形狀比較。
(實施例21)圖21是表示本發(fā)明實施例21的文字核對裝置的結構的框圖。本實施例21與權利要求39、權利要求40對應。
本實施例21的文字核對裝置2100可以作為例如圖39所示的文書文卷編排裝置3900等電子儀器中的信息檢索裝置的一部分使用。
文字核對裝置2100接收從外部輸入的特定文字圖像的文字代碼Dco,將與附加了和上述文字圖像類似的預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDi的文字圖像編碼數(shù)據(jù)D21對應的文字圖像與由上述文字代碼所特定的文字圖像進行核對,并輸出表示核對結果的數(shù)據(jù)Sr。
即,文字核對裝置2100具有接收上述文字圖像編碼數(shù)據(jù)D21并根據(jù)附加到其上的預測文字圖像數(shù)據(jù)PDi從預測文字圖像中抽出其圖像特征從而輸出第1圖像特征數(shù)據(jù)Vc1的第1特征量抽出單元2101,和接收上述文字代碼Dco并抽出由該文字代碼所特定的文字圖像的圖像特征從而輸出第2圖像特征數(shù)據(jù)Vc2的第2圖像特征抽出單元2102。
該第2圖像特征抽出單元2102由根據(jù)文字代碼Dco生成由該文字代碼所特定的文字圖像的數(shù)據(jù)Di的文字圖像生成單元2103和根據(jù)上述文字圖像數(shù)據(jù)Di輸出上述第2圖像特征數(shù)據(jù)Vc2的特征量抽出單元2104構成。這里,上述文字圖像生成單元2103的結構和實施例20的文字圖像生成單元2002相同,上述特征量抽出單元2104和第1圖像特征抽出單元2101的結構分別和實施例11的特征量抽出單元1102相同。因此,上述第1、第2圖像特征數(shù)據(jù)Vc1、Vc2和從實施例11的圖像編碼裝置1100的特征量抽出單元1102輸出的圖像特征數(shù)據(jù)一樣,利用在實施例11的文字識別等中使用的特征矢量來表述。
另外,上述文字核對裝置2100具有計算從上述第1圖像特征抽出單元2101輸出的第1圖像特征數(shù)據(jù)Vc1和從第2圖像特征抽出單元2103輸出的第2圖像特征數(shù)據(jù)Vc2的歐幾里得距離并輸出距離信息Cd的距離計算單元2105和根據(jù)該距離信息Cd輸出表示與文字圖像編碼數(shù)據(jù)D21對應的文字圖像和由上述文字代碼所特定的文字圖像是否一致的核對結果的數(shù)據(jù)Sr的核對判斷單元2106。
下面,說明其動作。
在文字圖像編碼數(shù)據(jù)D21和文字代碼Dco輸入上述實施例21的文字核對裝置2100時,由上述文字圖像生成單元2103根據(jù)文字代碼Dco進行和實施例20的文字圖像生成單元2002相同的處理,并由特征量抽出單元2104和第1圖像特征抽出單元2101進行和實施例11的特征量抽出單元1102相同的圖像特征的抽出處理。這樣,就從第1圖像特征抽出單元2101輸出第1圖像特征數(shù)據(jù)(特征矢量)Vc1,從特征量抽出單元2104輸出第2圖像特征數(shù)據(jù)(特征矢量)Vc2。
其次,由距離計算單元2105根據(jù)上述第1、第2圖像特征數(shù)據(jù)Vc1、Vc2計算這2個特征矢量間的歐幾里得距離,并輸出距離信息Cd。
于是,在核對判斷單元2106中,如果該歐幾里得距離小于某一閾值時,就判定與文字圖像編碼數(shù)據(jù)D21對應的文字圖像與由文字代碼Dco所特定的文字圖像一致,如果上述歐幾里得距離大于閾值,就判定上述兩文字圖像不一致。
這樣,在本實施例21的文字核對裝置2100中,具有接收文字圖像編碼數(shù)據(jù)D21并根據(jù)附加到其上的預測文字圖像數(shù)據(jù)PDi輸出與預測文字圖像對應的第1圖像特征數(shù)據(jù)Vc1的第1特征量抽出單元2101,和根據(jù)從外部輸入的文字代碼Dco抽出由該文字代碼所特定的文字圖像的圖像特征并輸出第2圖像特征數(shù)據(jù)Vc2的第2圖像特征抽出單元2102,所以,與文字代碼Dco對應的文字圖像的圖像特征數(shù)據(jù)Vc2與包含在文字圖像編碼數(shù)據(jù)D21中的預測文字圖像的特征圖像數(shù)據(jù)Vc1進行比較。
因此,在附加了預測文字圖像數(shù)據(jù)PDi的文字圖像編碼數(shù)據(jù)D21與文字代碼Dco之間可以進行對應的文字圖像的核對。
于是,在由文字代碼Dco所特定的文字圖像與和文字圖像編碼數(shù)據(jù)D20對應的預測文字圖像一致時,不將文字圖像編碼數(shù)據(jù)D20進行譯碼也可以知道與文字圖像編碼數(shù)據(jù)D20對應的文字圖像,從而可以進行與文字圖像編碼數(shù)據(jù)D20對應的文字圖像和其他的文字圖像之間的形狀比較。
(實施例22)圖22是表示本發(fā)明實施例22的文字核對裝置的結構的框圖。本實施例22與權利要求41對應。
本實施例22的文字核對裝置2200可以作為例如圖39所示的文書文卷編排裝置3900等電子儀器中的信息檢索裝置的一部分使用。
文字核對裝置2200接收從外部輸入的特定文字圖像的文字代碼Dco并將與附加了預測文字圖像標識符Pid的文字圖像編碼數(shù)據(jù)D22對應的文字圖像與由上述文字代碼所特定的文字圖像進行核對從而輸出表示核對結果的數(shù)據(jù)Sr。這里,上述預測文字圖像標識符Pid是用于識別與由上述文字代碼Dco所特定的文字圖像類似的預測文字圖像的標識符。
即,文字核對裝置2200具有存儲表示上述預測文字圖像標識符Pid和文字代碼Dco與以它們?yōu)樽兞坑嬎愕木嚯x信息的對應關系的文字間距離表3701的表存儲部2201、接收文字圖像編碼數(shù)據(jù)D22和文字代碼Dco并參照上述文字間距離表計算以附加到文字圖像編碼數(shù)據(jù)D22上的預測文字圖像標識符Pid和文字代碼Dco為變量的距離信息Cd的距離計算單元2202、和輸出表示與文字圖像編碼數(shù)據(jù)D22對應的文字圖像與由上述文字代碼Dco所特定的文字圖像是否一致的核對結果的數(shù)據(jù)Sr的核對判斷單元2203。
圖37是用于說明文字間距離表3701的圖。
上述預測文字圖像標識符Pid是與利用實施例11的矢量量化單元1103將特征矢量進行量化處理而得到的各代表特征矢量對應的標識符。
在上述文字間距離表3701中,利用預測文字圖像標識符Pid的值P(j)(j=0~n-1)和文字代碼Dco的值S(i)(i=0~m-1)定義了以它們?yōu)樽兞康木嚯x信息Cd的值Dij。
下面,簡單地說明上述距離信息Cd。
根據(jù)VQ代碼薄,上述各預測文字圖像標識符的值P(j)與代表特征矢量V(j)一一對應。另外,文字代碼的值S(i)與通過和上述實施例20的圖像特征抽出單元2001的處理相同的對上述文字代碼的圖像特征抽出處理而求出的特征矢量W(i)對應。
并且,上述文字間距離表的要素(距離信息的值)Dij就成為上述特征矢量W(i)與代表特征矢量V(j)之間的歐幾里得距離。
文字間距離表的要素(距離信息的值)Dij通過預先與閾值T進行比較,如果小于閾值T就取為1,如果在上述閾值T以上就取為0,可以壓縮表的大小,從而可以進行高速的核對處理。這時,如果距離為1,核對判斷單元2203就判定文字圖像編碼數(shù)據(jù)與文字代碼一致,如果為0就判定不一致。
下面,說明其動作。
在上述文字圖像編碼數(shù)據(jù)D22和文字代碼Dco輸入上述實施例22的文字核對裝置2200時,首先由上述距離計算單元2202參照文字間距離表2201計算附加到文字圖像編碼數(shù)據(jù)D22上的預測文字圖像標識符Pid和由文字代碼Dco定義的距離信息Cd。該距離信息Cd的值Dij是根據(jù)上述文字代碼Dco的值S(i)得到的特征矢量W(i)與根據(jù)預測文字圖像標識符Pid的值P(j)得到的代表特征矢量V(j)之間的歐幾里得距離。
于是,在核對判斷單元2203中,如果該距離信息的值Dij小于指定的閾值T,就判定文字圖像編碼數(shù)據(jù)D22與文字代碼Dco一致,如果該距離信息的值Dij大于指定的閾值T,就判定文字圖像編碼數(shù)據(jù)D22與文字代碼Dco不一致。
這樣,在本實施例22的文字核對裝置2200中,具有存儲表示附加到文字圖像編碼數(shù)據(jù)D22上的預測文字圖像標識符Pid和文字代碼Dco與以它們?yōu)樽兞慷x的距離信息Cd的對應關系的文字間距離表3701的表存儲部2201,將上述預測文字圖像標識符Pid用于識別與和上述文字圖像編碼數(shù)據(jù)D22對應的文字圖像類似的預測文字圖像,將上述距離信息Cd的值Dij作為根據(jù)上述文字代碼Dco的值S(i)得到的特征矢量W(i)與根據(jù)預測文字圖像標識符Pid的值P(j)得到的代表特征矢量V(j)間的歐幾里得距離,所以,將與文字代碼Dco對應的特征矢量與和包含在文字圖像編碼數(shù)據(jù)D22中的預測文字圖像標識符對應的特征矢量進行比較。
因此,可以進行附加了預測文字圖像標識符Pid的文字圖像編碼數(shù)據(jù)D22與文字代碼Dco間的對應的文字圖像的核對。
于是,在判定由文字代碼Dco所特定的文字圖像由和文字圖像編碼數(shù)據(jù)D22對應的預測文字圖像一致時,不將文字圖像編碼數(shù)據(jù)D22進行譯碼,根據(jù)輸入的文字代碼Dco也可以知道與文字圖像編碼數(shù)據(jù)D22對應的文字圖像,從而可以進行與文字圖像編碼數(shù)據(jù)D22對應的文字圖像與其他的文字圖像之間的形狀比較。
(實施例23)圖23是表示本發(fā)明實施例23的文字核對裝置的結構的框圖。本實施例23與權利要求42、權利要求43對應。
本實施例23的文字核對裝置2300可以作為例如圖39所示的文書文卷編排裝置3900等電子儀器中的信息檢索裝置的一部分使用。
文字核對裝置2300接收從外部輸入的特定文字圖像的文字代碼Dco,將與附加了和上述文字圖像類似的預測文字圖像的數(shù)據(jù)(預測文字圖像數(shù)據(jù))PDi的文字圖像編碼數(shù)據(jù)D23對應的文字圖像與由上述文字代碼Dco所特定的文字圖像進行核對,并輸出表示核對結果的數(shù)據(jù)Sr。
即,文字核對裝置2300具有接收上述文字圖像編碼數(shù)據(jù)D23并根據(jù)附加到其上的預測文字圖像標識符Pid從該標識符表示的預測文字圖像中抽出其圖像特征從而輸出第1圖像特征數(shù)據(jù)Vc1的第1特征量抽出單元2301和接收上述文字代碼Dco抽出由該文字代碼所特定的文字圖像的圖像特征并輸出第2圖像特征數(shù)據(jù)Vc2的第2圖像特征抽出單元2302。
第2圖像特征抽出單元2302由根據(jù)文字代碼Dco生成由該文字代碼所特定的文字圖像的數(shù)據(jù)Di的文字圖像生成單元2303和根據(jù)上述文字圖像數(shù)據(jù)Di輸出上述第2圖像特征數(shù)據(jù)Vc2的特征量抽出單元2304構成。這里,上述文字圖像生成單元2303的結構和實施例20的文字圖像生成單元2002相同,上述特征量抽出單元2304的結構和實施例11的特征量抽出單元1102相同。另外,第2圖像特征抽出單元2302的結構和圖像特征抽出單元2001相同。另外,上述第1、第2圖像特征數(shù)據(jù)Vc1、Vc2和從實施例11的圖像編碼裝置1100的特征量抽出單元1102輸出的圖像特征數(shù)據(jù)一樣,利用在實施例11的文字識別等中使用的特征矢量來表述。
另外,上述文字核對裝置2300具有計算從上述第1圖像特征抽出單元2301輸出的第1圖像特征數(shù)據(jù)Vc1與從第2圖像特征抽出單元2302輸出的第2圖像特征數(shù)據(jù)Vc2的歐幾里得距離并輸出距離信息Cd的距離計算單元2305和根據(jù)該距離信息Cd輸出表示與文字圖像編碼數(shù)據(jù)D23對應的文字圖像與由上述文字代碼Dco所特定的文字圖像是否一致的核對結果的數(shù)據(jù)Sr的核對判斷單元2306。
上述預測圖像標識符假定是通過例如實施例11的矢量量化處理而得到的標識符。
下面,說明其動作。
在附加了預測文字圖像標識符Pid的文字圖像編碼數(shù)據(jù)D23和文字代碼Dco輸入上述實施例23的文字核對裝置2300時,由第1圖像特征抽出單元2301根據(jù)預測文字圖像標識符Pid從該標識符表示的預測文字圖像中抽出其圖像特征,并輸出第1圖像特征數(shù)據(jù)Vc1。
另外,由上述文字圖像生成單元2303根據(jù)文字代碼Dco進行和實施例20的文字圖像生成單元2002相同的處理,由特征量抽出單元2304進行和實施例11的特征量抽出單元1102相同的圖像特征的抽出處理,并輸出第2圖像特征數(shù)據(jù)(特征矢量)Vc2。
其次,由距離計算單元2305根據(jù)上述第1、第2圖像特征數(shù)據(jù)Vc1、Vc2計算這2個特征矢量間的歐幾里得距離,并輸出距離信息Cd。
于是,在核對判斷單元2306中,如果該歐幾里得距離小于某一閾值,就判定與文字圖像編碼數(shù)據(jù)D23對應的文字圖像與由文字代碼Dco所特定的文字下面一致,如果上述歐幾里得距離大于閾值,就判定上述兩文字圖像不一致。
如果預測文字圖像標識符Pid是作為對文字圖像進行文字識別的結果的文字代碼,則第1特征量抽出單元2301的結構就與實施例20的特征量抽出單元2001相同。
這樣,在本實施例23的文字核對裝置2300中,具有接收文字圖像編碼數(shù)據(jù)D23并根據(jù)附加到其上的預測文字圖像標識符Pid輸出與預測文字圖像對應的第1圖像特征數(shù)據(jù)Vc1的第1特征量抽出單元2301和根據(jù)從外部輸入的文字代碼Dco抽出由該文字代碼所特定的文字圖像的圖像特征并輸出第2圖像特征數(shù)據(jù)Vc2的第2圖像特征抽出單元2102,所以,進行與文字代碼Dco對應的文字圖像的圖像特征數(shù)據(jù)Vc2和與包含在文字圖像編碼數(shù)據(jù)D23中的預測文字圖像標識符對應的特征圖像數(shù)據(jù)Vc1進行比較。
因此,可以進行附加了預測文字圖像標識符Pid的文字圖像編碼數(shù)據(jù)D23與文字代碼Dco之間的對應的文字圖像的核對。
于是,在判定由文字代碼Dco所特定的文字圖像與和文字圖像編碼數(shù)據(jù)D23對應的預測文字圖像一致時,不將文字圖像編碼數(shù)據(jù)D23進行譯碼,根據(jù)輸入的文字代碼Dco也可以知道與文字圖像編碼數(shù)據(jù)D23對應的文字圖像,從而可以進行與文字圖像編碼數(shù)據(jù)D23對應的文字圖像與其他的文字圖像之間的形狀比較。
通過作成記錄用于使計算機執(zhí)行構成上述各實施例中某一個實施例的裝置的多個單元的全部或一部分單元的功能的程序的磁記錄媒體或光記錄媒體并使用它們使計算機執(zhí)行上述動作,也可以得到和上述相同的效果。
另外,在本發(fā)明的實施例1~7中,作為圖像特征,使用從文字識別裝置得到的文字代碼,但是,也可以使用可以再生實施例8用網(wǎng)格特征所示的圖像形狀的特征量。這時,圖1~圖7所示的各裝置的預測圖像生成單元的結構和預測圖像生成單元801相同。
這種結構的裝置,不僅可以應用于文書圖像的編碼,而且也可以應用于一般的圖像的編碼。
另外,在本發(fā)明的實施例1~7中,作為圖像特征,使用從文字識別裝置得到的文字代碼,但是,也可以利用在實施例11中使用的矢量量化處理,使用預測圖像標識符.這時,圖1~圖7的裝置中的預測圖像生成單元的結構和圖11的預測圖像生成單元1104相同。
另外,實施例2、4、6的圖像特征抽出單元(參見圖2、圖4、圖6)也可以作為圖38所示的圖像特征抽出單元3801使用.該圖像特征抽出單元3801由根據(jù)圖像數(shù)據(jù)Di從圖像中抽出其部分圖像并輸出部分圖像數(shù)據(jù)Dbi的區(qū)域分割單元3802、根據(jù)各部分圖像數(shù)據(jù)Dbi抽出與部分圖像對應的特征矢量Vbi的特征量抽出單元3803、和根據(jù)得到的特征矢量Vbi求出與代表特征矢量對應的預測圖像標識符Dbip的矢量量化單元3804構成。
這樣,在將上述實施例2、4、6的圖像特征抽出單元置換為上述圖像特征抽出單元3801的圖像編碼裝置中,輸出將文字數(shù)據(jù)Dc的文字代碼置換為預測圖像標識符的部分圖像特征數(shù)據(jù)Dbid。
上述區(qū)域分割單元3802與作為對象的圖像的種類有關,在是文書圖像時,可以使用例如“遷分離檢出法文書畫像構造解析、信學論、Vol.J74-D-Ⅱ、No.4、pp.491-499”等中所述的方法。
另外,在本發(fā)明的實施例11、12中,使用矢量量化處理求出與圖像類似的預測圖像的標識符,但是,在作為對象的圖像限定為文字時,也可以使用文字識別裝置。
即,在圖11所示的圖像編碼裝置中,具有文字識別裝置取代圖像特征抽出單元1101,并輸出文字代碼取代預測文字圖像標識符。這時,圖11和圖12的預測圖像生成單元必須采用和圖1的預測圖像生成單元103相同的結構。
另外,在本發(fā)明的實施例1~15中,熵編碼單元、熵譯碼單元、塊預測編碼單元和塊預測譯碼單元進行算術編碼處理和與其對應的算術譯碼處理,但是,編碼處理和譯碼處理也可以使用霍夫曼編碼處理和與其對應的譯碼處理。
(實施例24)圖42是表示本發(fā)明實施例24的圖像編碼裝置的結構的框圖。本實施例24與權利要求21、權利要求22對應。
本實施例24的圖像編碼裝置4200可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例24的圖像編碼裝置4200,對于作為編碼處理的對象的對象圖像數(shù)據(jù)Dit,接收與文字對應的文字圖像的數(shù)據(jù),參照其預測圖像對上述對象圖像數(shù)據(jù)Dit進行熵編碼處理,并作為與上述對象圖像對應的編碼數(shù)據(jù)輸出熵代碼Die。
即,上述圖像編碼裝置4200具有通過對上述對象圖像的文字識別而輸出與上述對象圖像對應的文字代碼Dco和表示該對象圖像的特征的第1特征矢量Vc1的圖像特征抽出單元4201。
該圖像特征抽出單元4201由從上述對象圖像中抽出其圖像特征并輸出特征矢量Vc1的特征量抽出單元4202和使用該特征矢量Vc1對上述對象圖像進行文字識別并輸出與上述對象圖像對應的文字代碼Dco的文字識別單元4203構成。
另外,上述圖像編碼裝置4200具有接收對象圖像數(shù)據(jù)Dit和從對象圖像數(shù)據(jù)Dit得到的文字代碼Dco及特征矢量Vc1并根據(jù)與作為現(xiàn)在處理對象的文字圖像(對象圖像)對應的文字代碼Dco選擇預測的第2預測圖像數(shù)據(jù)PDit1和與已處理過的文字圖像對應的圖像數(shù)據(jù)(第2預測圖像數(shù)據(jù)PDit2)中的哪一個的預測圖像選擇單元4205。該預測圖像選擇單元4205與上述選擇的預測圖像數(shù)據(jù)PDit1或PDit2一起輸出表示選擇上述第1、第2預測圖像數(shù)據(jù)PDit1、PDit2的哪一個的標志Fc0或Fc1和與上述對象圖像對應的文字代碼Dco。
此外,上述圖像編碼裝置4200具有通過預測圖像選擇單元4205接收與上述對象圖像對應的文字代碼Dco并根據(jù)與上述對象圖像的文字代碼Dco對應的字體圖像生成第1預測圖像數(shù)據(jù)PDit1的預測圖像生成單元4206,和使上述對象圖像數(shù)據(jù)Dit與和其對應的文字代碼Dco及第1特征矢量Vc1關聯(lián)而作為與1個項目對應的1組數(shù)據(jù)進行存儲的預測圖像存儲單元4207。這里,上述預測圖像生成單元4206的結構和實施例1的圖像編碼裝置100的預測圖像生成單元103相同。另外,上述預測圖像生成單元4207接收上述預測圖像選擇單元4205的要求即與對象圖像對應的文字代碼Dco而將與該文字代碼Dco對應的文字圖像數(shù)據(jù)和特征矢量分別作為第2預測圖像數(shù)據(jù)PDit2和第2特征矢量Vc2而輸出。
并且,上述圖像編碼裝置4200具有參照從上述預測圖像選擇單元4205輸出的第1預測圖像數(shù)據(jù)PDit1或第2預測圖像數(shù)據(jù)PDit2對上述對象圖像數(shù)據(jù)Dit進行算術編碼處理并輸出與上述對象圖像對應的熵代碼Die的熵編碼單元4208。
下面,說明其動作。
在作為編碼處理的對象的文字圖像(對象圖像)的圖像數(shù)據(jù)Dit輸入本實施例24的圖像編碼裝置4200時,由圖像特征抽出單元4201生成與上述對象圖像數(shù)據(jù)Dit對應的文字代碼Dco和第1特征矢量Vc1。
即,由特征量抽出單元4202從上述對象圖像中抽出在文字識別等中利用的特征量,并輸出與其對應的第1特征矢量Vc1。于是,由文字識別裝置4203探索具有與上述第1特征矢量Vc1最接近的圖像特征的文字,并輸出與該文字對應的文字代碼Dco。該單元4203的文字識別的方法在“模式識別、電子情報通信學會”等中有詳細的介紹,所以,這里省略詳細的說明。
然后,由預測圖像選擇單元4205根據(jù)上述文字代碼Dco和第1特征矢量Vc1選擇由預測圖像生成單元4206生成的第1預測圖像數(shù)據(jù)PDit1和預測圖像存儲單元4207存儲的第2預測圖像數(shù)據(jù)PDit2中的一方。并且,與所選擇的預測圖像數(shù)據(jù)一起輸出表示選擇哪一個預測圖像數(shù)據(jù)的標志Fc0、Fc1和文字代碼Dco。
由熵編碼單元4208根據(jù)由上述預測圖像選擇單元4205選擇的預測圖像數(shù)據(jù)PDit1或PDit2對對象圖像數(shù)據(jù)Dit進行算術編碼處理,并輸出熵代碼Die作為與上述對象圖像對應的編碼數(shù)據(jù)。
下面,詳細說明上述預測圖像選擇單元4205的處理。
圖44表示上述預測圖像選擇單元4205的動作流程。
首先,由上述預測圖像選擇單元4205開始進行處理時(步驟S4401),順序讀入對象圖像數(shù)據(jù)Dit、從圖像特征抽出單元4201輸出的文字代碼Dco和第1特征矢量Vc1(步驟S4402~S4404)。
其次,判斷在預測圖像存儲單元4207上是否有上述對象圖像的文字代碼Dco的項目(步驟S4405)。判斷的結果,如果有與上述對象圖像的文字代碼對應的項目,就從該預測圖像存儲單元4207讀入與該文字代碼Dco對應的特征量(第2特征矢量)(步驟S4406)。
于是,就計算上述第1特征矢量Vc1與第2特征矢量Vc2之間的歐幾里得距離(步驟S4407),并判斷該距離是否比指定的閾值大(步驟S4408)。該判斷的結果,在上述距離比指定的閾值大時,由上述預測圖像生成單元4206生成的對對象圖像的第1預測圖像數(shù)據(jù)PDit1就從上述預測圖像選擇單元4205向熵編碼單元4208輸出(步驟S4409),同時,與上述對象圖像的文字代碼Dco一起輸出表示選擇了上述第1預測圖像數(shù)據(jù)的標志Fc0(步驟S4410)。
另一方面,在上述步驟S4408的判斷結果是上述歐幾里得距離小于指定的閾值時,預測圖像存儲單元4207存儲的與上述文字代碼Dco對應的文字圖像數(shù)據(jù)就作為對上述對象圖像的第2預測圖像數(shù)據(jù)PDit2從上述預測圖像選擇單元5205向熵編碼單元4208輸出(步驟S4411),同時,與上述對象圖像的文字代碼Dco一起輸出表示選擇了上述第2預測圖像數(shù)據(jù)PDit2的標志Fc1(步驟S4412)。
最后,通過上述步驟S4402~S4404的數(shù)據(jù)讀入處理讀入上述預測圖像選擇單元4205的對象圖像數(shù)據(jù)Dit、文字代碼Dco和特征量(第1特征矢量)Vc1就作為與新的項目對應的1組數(shù)據(jù)而存儲到預測圖像存儲單元4207中(步驟S4413)。
與和對象圖像的文字代碼對應的新的項目對應的數(shù)據(jù)向上述預測圖像存儲單元4207中存儲時,與同一文字代碼Dco對應的項目已存儲到上述存儲單元4207中時,就進行將與已有的項目對應的老的特征量和對象圖像數(shù)據(jù)改寫為與新的項目對應的特征量和對象圖像數(shù)據(jù)的改寫處理,或將與對象圖像的文字代碼對應的特征量和對象圖像數(shù)據(jù)在新的項目與已有的項目之間求平均從而將與已有的項目對應的老的特征量和對象圖像數(shù)據(jù)改寫為平均的特征量和平均的對象圖像數(shù)據(jù)的平均化處理。
這樣,在本實施例24的圖像編碼裝置4200中,具有根據(jù)對象圖像的文字代碼Dco生成作為與對象圖像的文字代碼對應的字體圖像的數(shù)據(jù)的第1預測圖像數(shù)據(jù)PDit1的預測圖像生成單元4206,和使對象圖像數(shù)據(jù)Dit和與其對應的文字代碼Dco及第1特征矢量Vc1相關聯(lián)而進行存儲的預測圖像存儲單元4207,將根據(jù)對象圖像的文字代碼得到的字體圖像(第1預測圖像)和過去已編碼的文字圖像(第2預測圖像)中與對象圖像類似的一方選擇為預測圖像,根據(jù)所選擇的預測圖像數(shù)據(jù)切換發(fā)生概率模型,對對象圖像數(shù)據(jù)進行算術編碼處理,所以,不僅可以提高算術編碼器的編碼效率,而且在作為編碼處理的對象的文字圖像和已進行了編碼處理的文字圖像相同時,可以省略對對象圖像生成預測圖像數(shù)據(jù)的表,從而可以減輕使用預測圖像的算術編碼處理的運算負擔。
另外,將與對象圖像對應的文字代碼Dco和與對象圖像對應的熵代碼Die一起輸出,所以,也可以使用上述文字代碼進行對對象圖像的編碼數(shù)據(jù)Die的檢索。
(實施例25)圖43是表示本發(fā)明實施例25的圖像譯碼裝置的結構的框圖。本實施例25與權利要求23、權利要求24對應。
本實施例25的圖像譯碼裝置4300是與上述實施例24的圖像編碼裝置4200對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即,圖像譯碼裝置4300接收從上述實施例24的圖像編碼裝置4200輸出的熵代碼(編碼數(shù)據(jù))Die、文字代碼Dco和標志Fc0及Fc1,并參照根據(jù)文字代碼Dco和標志Fc0及Fc1而生成的預測圖像數(shù)據(jù)PDit對該編碼數(shù)據(jù)Die進行算術譯碼處理,從而復原對象圖像數(shù)據(jù)Did。
具體而言,上述圖像譯碼裝置4300具有根據(jù)輸入的對象圖像的文字代碼Dco使用字體信息等輸出對對象圖像的第1預測圖像數(shù)據(jù)PDit1的預測圖像生成單元4302和使上述對象圖像數(shù)據(jù)Dit和與其對應的文字代碼Dco關聯(lián)從而作為與1個項目對應的1組數(shù)據(jù)進行存儲的預測圖像存儲單元4303。這里,上述預測圖像生成單元4302的結構和實施例1的圖像編碼裝置100的預測圖像生成單元103相同。另外,上述預測圖像存儲單元4303接收與對象圖像對應的文字代碼Dco并將與該文字代碼Dco對應的文字圖像數(shù)據(jù)作為第2預測圖像數(shù)據(jù)Pdit2而輸出。
另外,上述圖像譯碼裝置4300具有根據(jù)與作為譯碼的對象的熵代碼Die對應的文字代碼Dco和標志Fc0及Fc1選擇并輸出從上述預測圖像生成單元4302得到的第1預測圖像數(shù)據(jù)PDit1和從預測圖像存儲單元4303得到的第2預測圖像數(shù)據(jù)PDit2中的某一個的預測圖像選擇單元4301。
此外,上述圖像譯碼裝置4300具有參照從預測圖像選擇單元4302輸出的第1預測圖像數(shù)據(jù)PDit1或第2預測圖像數(shù)據(jù)PDit2對上述熵代碼Die進行算術譯碼處理并將上述譯碼數(shù)據(jù)作為對象圖像數(shù)據(jù)Did而輸出的熵譯碼單元4304。該熵譯碼單元4304的結構和實施例3的圖像譯碼裝置300的熵譯碼單元306相同。
下面,說明其動作。
在與作為編碼處理的對象的文字圖像(對象圖像)對應的文字代碼Dco、標志Fc0或Fc1和熵代碼Die從上述實施例24的圖像編碼裝置4200輸入本實施例25的圖像譯碼裝置4300時,由預測圖像選擇單元4301根據(jù)上述文字代碼Dco和標志Fc0、Fc1選擇由預測圖像生成單元4302生成的第1預測圖像數(shù)據(jù)PDit1和預測圖像存儲單元4303存儲的第2預測圖像數(shù)據(jù)PDit2中的一方。并且,將所選擇的預測圖像數(shù)據(jù)PDit1或PDit2和與其對應的標志Fc0、Fc1一起向上述熵譯碼單元4304輸出。
由該熵譯碼單元4304根據(jù)由上述預測圖像選擇單元4301選擇的預測圖像數(shù)據(jù)PDit1或PDit2對熵代碼Die進行算術譯碼處理,并作為與上述對象圖像對應的譯碼數(shù)據(jù)而輸出對象圖像數(shù)據(jù)Did。
下面,詳細說明上述預測圖像選擇單元4301的處理。
圖45表示上述預測圖像選擇單元4301的動作流程。
首先,由上述預測圖像選擇單元4301開始進行處理時(步驟S4501),從上述圖像編碼裝置4200順序讀入與對象圖像對應的文字代碼Dco和標志Fc0或Fc1(步驟S4502、S4503)。
并且,進行該標志是表示在熵代碼的譯碼處理中使用由預測圖像生成單元4302生成的第1預測圖像數(shù)據(jù)PDit1的標志Fc0和表示使用預測圖像存儲單元4303存儲的第2預測圖像數(shù)據(jù)PDit2的標志Fc1中的哪一個的判斷(步驟S4504)。
上述判斷的結果,在輸入的標志是標志Fc1時,就從預測圖像存儲單元4303讀入與其存儲的上述文字代碼Dco對應的文字圖像數(shù)據(jù)(第2預測圖像數(shù)據(jù))(步驟S4505)。
另一方面,在輸入的標志是標志Fc0時,就讀入由預測圖像生成單元4302根據(jù)文字代碼Dco生成的第1預測圖像數(shù)據(jù)PDit1(步驟S4506)。
并且,使用由上述預測圖像選擇單元4301選擇的預測圖像數(shù)據(jù)PDit1或PDit2對熵代碼進行算術譯碼處理而得到的譯碼數(shù)據(jù)(對象圖像數(shù)據(jù))Did和與其對應的文字代碼Dco一起作為與新的項目對應的1組數(shù)據(jù)記錄到預測圖像存儲單元4303中(步驟S4507)。
在與和對象圖像的文字代碼對應的新的項目對應的數(shù)據(jù)向上述預測圖像存儲單元4303中存儲時,與同一文字代碼Dco對應的項目已存儲到上述存儲單元4303中時,就進行將與已有的項目對應的老的特征量和對象圖像數(shù)據(jù)置換為與新的項目對應的特征量和對象圖像數(shù)據(jù)的置換處理,或將與對象圖像的文字代碼對應的特征量和對象圖像數(shù)據(jù)在新的項目與已有的項目之間求平均從而將與已有的項目對應的老的特征量和對象圖像數(shù)據(jù)置換為平均的特征量和平均的對象圖像數(shù)據(jù)的平均化處理。
這樣,在本實施例25的圖像譯碼裝置4300中,具有根據(jù)對象圖像的文字代碼Dco生成作為與對象圖像的文字代碼對應的字體圖像的數(shù)據(jù)的第1預測圖像數(shù)據(jù)PDit1的預測圖像生成單元4302和使對象圖像數(shù)據(jù)Dit和與其對應的文字代碼Dco相關聯(lián)而進行存儲的預測圖像存儲單元4303,將根據(jù)對象圖像的文字代碼得到的字體圖像(第1預測圖像)和過去進行了譯碼處理的文字圖像(第2預測圖像)中與對象圖像類似的一方選擇為預測圖像,根據(jù)選擇的預測圖像數(shù)據(jù)切換發(fā)生概率模型,對與對象圖像對應的熵代碼進行算術譯碼處理,所以,在算術編碼器的編碼效率高、而且作為編碼處理的對象的文字圖像和已進行了編碼處理的文字圖像相同時,就可以實現(xiàn)與可以省略對對象圖像的預測圖像數(shù)據(jù)的生成處理從而可以降低運算負擔的算術編碼處理單元的算術譯碼處理。
另外,在本實施例25的圖像譯碼裝置4300中,與和對象圖像對應的熵代碼Die一起接收與對象圖像對應的文字代碼Dco,所以,使用上述文字代碼也可以進行對對象圖像的編碼數(shù)據(jù)De的檢索。
在上述實施例24中,作為熵編碼裝置,是進行算術編碼處理,但是,也可以進行霍夫曼編碼處理。
另外,在上述實施例25中,作為熵譯碼裝置,是進行算術譯碼處理,但是,也可以進行霍夫曼譯碼處理。
另外,具有上述實施例24的圖像編碼裝置4200和實施例25的圖像譯碼裝置4300的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置4200和圖像譯碼裝置4300而實現(xiàn)。
此外,具有上述實施例24的圖像編碼裝置4200和實施例25的圖像譯碼裝置4300的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置4200和圖像譯碼裝置4300而實現(xiàn)。
(實施例26)圖46是表示本發(fā)明實施例26的圖像編碼裝置的結構的框圖。本實施例26與權利要求25、權利要求26對應。本實施例26的圖像編碼裝置6400可以作為例如圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像編碼單元使用。
本實施例26的圖像編碼裝置6400對于作為編碼處理的對象的對象圖像數(shù)據(jù)Dit接收與文字對應的文字圖像的數(shù)據(jù),根據(jù)表示該文字圖像的圖像特征的特征量對上述對象圖像數(shù)據(jù)Dit進行熵編碼處理,作為與上述對象圖像對應的編碼數(shù)據(jù)輸出熵代碼Die,同時輸出與上述文字圖像對應的文字代碼Dco和關于上述熵編碼處理的信息。
即,上述圖像編碼裝置6400具有通過對上述對象圖像的文字識別輸出與上述對象圖像對應的文字代碼Dco和表示該對象圖像的特征的特征矢量(第1特征矢量)Vc1的圖像特征抽出單元4601。該圖像特征抽出單元4601由從上述對象圖像中抽出其圖像特征并輸出上述第1特征矢量Vc1的特征量抽出單元4602和使用該第1特征矢量Vc1對上述對象圖像進行文字識別并輸出與上述對象圖像對應的文字代碼Dco的文字識別單元4603構成。
另外,上述圖像編碼裝置4600具有根據(jù)從對象圖像數(shù)據(jù)Dit得到的文字代碼Dco和第1特征矢量Vc1進行第1和第2數(shù)據(jù)輸出處理中的一方的處理的預測圖像選擇單元(數(shù)據(jù)輸出控制單元)4604。這里,在上述第1數(shù)據(jù)輸出處理中,輸出與作為現(xiàn)在處理對象的文字圖像(對象圖像)對應的文字代碼Dco、預測圖像數(shù)據(jù)PDit1和標志Fc0,在第2數(shù)據(jù)輸出處理中,輸出上述對象圖像的文字代碼Dc0和標志Fc1。
此外,上述圖像編碼裝置4600具有通過預測圖像選擇單元4604接收與上述對象圖像對應的文字代碼Dco并將與上述對象圖像的文字代碼Dco對應的字體圖像的圖像數(shù)據(jù)作為第1預測圖像數(shù)據(jù)PDit1而輸出的預測圖像生成單元4605和使與上述對象圖像數(shù)據(jù)Dit對應的文字代碼Dco和特征矢量(第1特征矢量)Vc1關聯(lián)而作為與1個項目對應的1組數(shù)據(jù)進行存儲的預測圖像存儲單元4606。
這里,上述圖像特征抽出單元4601的結構和上述實施例24的圖像特征抽出單元4201相同,上述預測圖像生成單元4605的結構和實施例1的圖像編碼裝置100的預測圖像生成單元103相同。另外,上述預測圖像存儲單元接收上述預測圖像選擇單元4603的要求即與對象圖像對應的文字代碼Dco,輸出表示由該文字代碼Dco所特定的處理過的文字圖像的圖像特征的特征矢量(第2特征矢量)Vc2。
并且,上述圖像編碼裝置4600具有在接收到上述標志Fc0時就參照對象圖像的預測圖像數(shù)據(jù)PDit1對對象圖像數(shù)據(jù)Dit利用對象圖像與預測圖像的像素值相關進行算術編碼處理并作為與對象圖像對應的編碼數(shù)據(jù)而輸出熵代碼Die、而在接收到上述標志Fc1時就不對對象圖像數(shù)據(jù)Dit進行算術編碼處理從而不輸出編碼數(shù)據(jù)的熵編碼單元4607。
下面,說明其動作。
在作為編碼處理的對象的文字圖像(對象圖像)的圖像數(shù)據(jù)Dit輸入本實施例26的圖像編碼裝置4600時,由圖像特征抽出單元4601生成與上述對象圖像數(shù)據(jù)Dit對應的文字代碼Dco和特征矢量(第1特征矢量)Vc1。
即,由特征量抽出單元4602從上述對象圖像中抽出在文字識別等中利用的特征量,并輸出與其對應的上述第1特征矢量Vc1。于是,由文字識別單元4603探索具有與由上述第1特征矢量Vc1所示的圖像特征最接近的圖像特征的文字,并輸出與該文字對應的文字代碼Dco。該單元4603的文字識別的方法在“模式識別、電子情報通信學會”等中有詳細的介紹,所以,這里省略詳細的說明。
然后,由預測圖像選擇單元4604根據(jù)上述文字代碼Dco和第2特征矢量Vc1選擇上述第1和第2數(shù)據(jù)輸出處理中的一方的處理。在選擇了第1數(shù)據(jù)輸出處理時,就輸出與作為現(xiàn)在處理對象的文字圖像(對象圖像)對應的文字代碼Dco、預測圖像數(shù)據(jù)PDit1和標志Fc0,在選擇了第2數(shù)據(jù)輸出處理時,就輸出上述對象圖像的文字代碼Dco和標志Fc1。
并且,與熵編碼單元4607在接收到上述標志Fc0時參照對象圖像的預測圖像數(shù)據(jù)PDit1對對象圖像數(shù)據(jù)Dit進行算術編碼處理,作為與對象圖像對應的編碼數(shù)據(jù)輸出熵代碼Die。另一方面,在接收到標志Fc1時,就不對對象圖像數(shù)據(jù)Dit進行算術編碼處理,從而也不輸出編碼數(shù)據(jù)。
下面,詳細說明上述預測圖像選擇單元4604的處理。
圖48表示上述預測圖像選擇單元4604的動作流程。
首先,由上述預測圖像選擇單元4604開始進行處理時(步驟S4801),從圖像特征抽出單元4601順序讀入文字代碼Dco和第1特征矢量Vc1(步驟S4802、S4803)。
其次,判斷在預測圖像存儲單元4606中是否有上述對象圖像的文字代碼Dco的項目(步驟S4804)。該判斷的結果,如果有與上述對象圖像的文字代碼對應的項目,就從該預測圖像存儲單元4605讀入與該文字代碼Dco對應的特征量(第2特征矢量)Vc2(步驟S4805)。
然后,計算上述第1特征矢量Vc1與第2特征矢量Vc2之間的歐幾里得距離(步驟S4806),并判斷該距離是否大于指定的閾值(步驟S4807)。該判斷的結果,在上述距離大于指定的閾值時,就從上述預測圖像選擇單元4604向熵編碼單元4607輸出由上述預測圖像生成單元4605生成的與對象圖像對應的第1預測圖像數(shù)據(jù)PDit1(步驟S4808),同時上述標志Fc0與上述對象圖像的文字代碼Dco一起輸出(步驟S4809)。
另一方面,在上述步驟S4807的判斷結果為上述歐幾里得距離小于指定的閾值時,上述標志Fc1就與上述對象圖像的文字代碼Dco一起輸出(步驟S4810)。
最后,通過在上述步驟S4802、S4803的數(shù)據(jù)讀入處理讀入上述預測圖像選擇單元4604的文字代碼Dco和特征量(第1特征矢量)Vc1作為與新的項目對應的1組數(shù)據(jù)存儲到預測圖像存儲單元4606中(步驟S4812)。
向上述預測圖像存儲單元4606中存儲與新的項目對應的數(shù)據(jù)時,在上述存儲單元4606中已存儲了與同一文字代碼Dco對應的項目時,就進行將與已有的項目對應的老的特征量改寫為與新的項目對應的特征量的改寫處理或將特征量在新的項目與已有的項目之間求平均從而將與已有的項目對應的老的特征量改寫為平均的特征量的平均化處理。
這樣,在本實施例26的圖像編碼裝置4600中,具有根據(jù)對象圖像的文字代碼Dco生成作為與對象圖像的文字代碼對應的字體圖像的數(shù)據(jù)的第1預測圖像數(shù)據(jù)PDit1的預測圖像生成單元4605和使與對象圖像數(shù)據(jù)Dit對應的文字代碼Dco和第1特征矢量Vc1關聯(lián)而進行存儲的預測圖像存儲單元4606,根據(jù)作為處理的對象的文字圖像的特征矢量(第1特征矢量)Vc1與和處理過的文字圖像對應的特征矢量(第2特征矢量)Vc2的比較結果,將上述字體圖像作為預測圖像,對對象圖像進行算術編碼處理,從而進行輸出熵代碼Die、文字代碼Dco和標志Fc1的第數(shù)據(jù)輸出處理或僅輸出文字代碼Dco和標志Fc1的第數(shù)據(jù)輸出處理,所以,不僅可以提高算術編碼器的編碼效率,而且在作為編碼處理的對象的文字圖像和已進行了編碼處理的文字圖像相同時可以省略生成與對象圖像對應的預測圖像數(shù)據(jù)的處理和對對象圖像數(shù)據(jù)的算術編碼處理,從而可以減輕使用預測圖像的算術編碼處理的運算負擔。
另外,在上述圖像編碼裝置4600中,不論上述第1和第2數(shù)據(jù)輸出處理任何,都輸出作為編碼處理的對象的文字圖像的文字代碼Dco,所以,使用上述文字代碼也可以進行對對象圖像的編碼數(shù)據(jù)De的檢索。
(實施例27)圖47是表示本發(fā)明實施例27的圖像譯碼裝置的結構的框圖。本實施例27與權利要求27、權利要求28對應。
本實施例27的圖像譯碼裝置4700是與上述實施例26的圖像編碼裝置4600對應的譯碼裝置,可以作為圖39所示的文書文卷編排裝置3900、傳真裝置等具有掃描器的電子儀器中的圖像譯碼單元使用。
即圖像譯碼裝置4700接收從上述實施例26的圖像編碼裝置4600輸出的熵代碼(編碼數(shù)據(jù))Die、文字代碼Dco和標志Fc0、Fc1,根據(jù)文字代碼Dco和標志Fc0、Fc1對該編碼數(shù)據(jù)Die進行算術譯碼處理,從而復原對象圖像數(shù)據(jù)Did。
具體而言,上述圖像譯碼裝置4700具有根據(jù)輸入的對象圖像的文字代碼Dco使用字體信息等而輸出與對象圖像對應的第1預測圖像數(shù)據(jù)PDit1的預測圖像生成單元4702和使上述復原的對象圖像數(shù)據(jù)Did和與其對應的文字代碼Dco關聯(lián)而作為與1個項目對應的1組數(shù)據(jù)進行存儲的預測圖像存儲單元4703。這里,上述預測圖像生成單元4702的結構和實施例1的圖像編碼裝置100的預測圖像生成單元103相同。另外,上述預測圖像存儲單元4703接收與對象圖像對應的文字代碼Dco并將與文字代碼Dco對應地存儲的文字圖像數(shù)據(jù)作為第2預測圖像數(shù)據(jù)PDit2而輸出。
另外,上述圖像譯碼裝置4700具有根據(jù)與作為譯碼的對象的熵代碼Die對應的文字代碼Dco和標志Fco、Fc1選擇從上述預測圖像生成單元4702得到的第1預測圖像數(shù)據(jù)PDit1和從預測圖像存儲單元4703得到的第2預測圖像數(shù)據(jù)PDit2中的某一個并與對應的標志Fc0、Fc1一起輸出的預測圖像選擇單元4701。
此外,上述圖像譯碼裝置4700具有參照從預測圖像選擇單元4702輸出的第1預測圖像數(shù)據(jù)PDit1對上述熵代碼Die進行算術譯碼處理并根據(jù)上述標志Fc0或標志Fc1進行將上述譯碼數(shù)據(jù)作為對象圖像數(shù)據(jù)Did而輸出的第1數(shù)據(jù)輸出處理和直接輸出上述第2預測圖像數(shù)據(jù)PDit2的第2數(shù)據(jù)輸出處理的熵譯碼單元4704。
這里,標志Fc0表示應參照從預測圖像生成單元4702得到的第1預測圖像數(shù)據(jù)PDit1進行算術譯碼處理,標志Fc1表示應將從預測圖像存儲單元4703得到的第2預測圖像數(shù)據(jù)PDit2直接作為譯碼數(shù)據(jù)而輸出。
下面,說明其動作。
在與作為編碼處理的對象的文字圖像(對象圖像)對應的文字代碼Dco、標志Fc0或標志Fc1和熵代碼Die輸入本實施例27的圖像譯碼裝置4700時,由預測圖像選擇單元4701根據(jù)上述文字代碼Dco和標志Fc0、Fc1選擇由預測圖像生成單元4702生成的第1預測圖像數(shù)據(jù)PDit1和預測圖像存儲單元4703存儲的第2預測圖像數(shù)據(jù)PDit2中的一方的數(shù)據(jù)。并且,與選擇的預測圖像數(shù)據(jù)PDit1或PDit2一起將和其對應的標志Fc0、Fc1向上述熵譯碼單元4704輸出。
由該熵譯碼單元4704進行通過使用由上述預測圖像選擇單元4701選擇的預測圖像數(shù)據(jù)PDit1對熵代碼Die的算術譯碼處理而復原對象圖像數(shù)據(jù)Did的第1數(shù)據(jù)輸出處理和將由上述預測圖像選擇單元4701選擇的預測圖像數(shù)據(jù)PDit2直接作為譯碼數(shù)據(jù)而輸出的第2數(shù)據(jù)輸出處理中的某一處理。
下面,詳細說明上述預測圖像選擇單元4701的處理。
圖47表示上述預測圖像選擇單元4701的動作流程。
首先,由上述預測圖像選擇單元4701開始進行處理時(步驟S4701),從上述圖像編碼裝置4600順序讀入與對象圖像對應的文字代碼Dco和標志Fc0、Fc1(步驟S4702、S4703)。
并且,進行該標志是表示在熵代碼的譯碼處理中使用由預測圖像生成單元4702生成的第1預測圖像數(shù)據(jù)PDit1的標志Fc0和表示使用預測圖像存儲單元4703存儲的第2預測圖像數(shù)據(jù)PDit2的標志Fc1中的哪一個的判斷(步驟S4704)。
上述判斷的結果,在輸入的標志是標志Fc1時,就從預測圖像存儲單元4703讀入與其存儲的上述文字代碼Dco對應的文字圖像數(shù)據(jù)(第2預測圖像數(shù)據(jù))(步驟S4705)。
另一方面,在輸入的標志是標志Fc0時,就讀入由預測圖像生成單元4702根據(jù)文字代碼Dco生成的第1預測圖像數(shù)據(jù)PDit1(步驟S4706)。
并且,使用由上述預測圖像選擇單元4701選擇的預測圖像數(shù)據(jù)PDit1或PDit2對熵代碼的譯碼數(shù)據(jù)(對象圖像數(shù)據(jù))Did和與其對應的文字代碼Dco一起作為與新的項目對應的1組數(shù)據(jù)記錄到預測圖像存儲單元4703中。
在與和對象圖像的文字代碼對應的新的項目對應的數(shù)據(jù)向上述預測圖像存儲單元4703中存儲時,與同一文字代碼Dco對應的項目已存儲到上述存儲單元4703中時,就進行將與已有的項目對應的老的對象圖像數(shù)據(jù)改寫為與新的項目對應的對象圖像數(shù)據(jù)的改寫處理,或將與對象圖像的文字代碼對應的對象圖像數(shù)據(jù)在新的項目與已有的項目之間求平均從而將與已有的項目對應的老的對象圖像數(shù)據(jù)改寫為平均的對象圖像數(shù)據(jù)的平均化處理。
這樣,在本實施例27的圖像譯碼裝置4700中,具有根據(jù)對象圖像的文字代碼Dco將與對象圖像的文字代碼對應的字體圖像的數(shù)據(jù)作為第1預測圖像數(shù)據(jù)PDit1而輸出的預測圖像生成單元4702和使對象圖像數(shù)據(jù)Did和與其對應的文字代碼Dco關聯(lián)而進行存儲的預測圖像存儲單元4703,選擇根據(jù)對象圖像的文字代碼得到的字體圖像(第1預測圖像)和過去進行了譯碼處理的文字圖像(第2預測圖像)中與對象圖像類似的一方,根據(jù)第1預測圖像數(shù)據(jù)切換發(fā)生概率模型,對與對象圖像對應的熵代碼進行算術譯碼處理,從而進行生成譯碼數(shù)據(jù)的第1數(shù)據(jù)輸出處理和直接輸出第2預測圖像數(shù)據(jù)的第2數(shù)據(jù)輸出處理中的一方的處理,所以,不僅可以提高算術編碼器的編碼效率,而且在作為編碼處理的對象的文字圖像和已進行了編碼處理的文字圖像相同時,可以實現(xiàn)與可以省略生成與對象圖像對應的預測圖像數(shù)據(jù)的處理和對對象圖像數(shù)據(jù)的算術編碼處理從而可以降低運算負擔的算術編碼處理對應的算術譯碼處理。
另外,在本實施例27的圖像譯碼裝置4700中,與和對象圖像對應的熵代碼Die一起接收與對象圖像對應的文字代碼Dco,所以,使用上述文字代碼也可以進行對對象圖像的編碼數(shù)據(jù)De的檢索。
在上述實施例26中,作為熵編碼裝置,是進行算術編碼處理,但是,也可以進行霍夫曼編碼處理。
另外,在上述實施例27中,作為熵譯碼裝置,是進行算術譯碼處理,但是,也可以進行霍夫曼譯碼處理。
另外,具有上述實施例26的圖像編碼裝置4600和實施例27的圖像譯碼裝置4700的傳真裝置,可以通過將圖41(a)的傳真裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置4600和圖像譯碼裝置4700而實現(xiàn)。
此外,具有上述實施例26的圖像編碼裝置4600和實施例27的圖像譯碼裝置4700的文書文卷編排裝置,可以通過將圖41(b)的文書文卷編排裝置中的圖像編碼裝置200a和圖像譯碼裝置300a分別置換為上述圖像編碼裝置4600和圖像譯碼裝置4700而實現(xiàn)。
此外,通過將用于使計算機進行上述各實施例所示的裝置的圖像編碼處理、圖像譯碼處理或文字核對處理的程序記錄到軟盤等數(shù)據(jù)存儲媒體熵,可以在獨立的計算機系統(tǒng)中簡單地進行上述各實施例所示的處理。
圖40(a)、圖40(b)、圖40(c)是用于說明由計算機系統(tǒng)使用存儲上述程序的軟盤進行上述實施例所示的處理時的圖。
圖40(b)表示從軟盤的正面看的外觀、剖面結構和軟盤,圖40(a)表示作為存儲媒體本身的軟盤的物理格式的例子。軟盤FD內(nèi)藏在盤殼F內(nèi),在該盤的表面以同心圓狀從外周向內(nèi)周形成多個磁道Tr,各磁道沿角度方向分割為16各扇區(qū)Se。因此,在存儲上述程序的軟盤上,作為上述程序的數(shù)據(jù)記錄到在上述軟盤FD上分配的區(qū)域中。
另外,圖40(c)表示用于對軟盤FD進行上述程序的記錄再生的結構。在將上述程序記錄到軟盤FD上時,從計算機系統(tǒng)通過軟盤驅動器FDD將作為上述程序的數(shù)據(jù)寫入。另外,在利用軟盤內(nèi)的程序將上述圖像編碼裝置、圖像譯碼裝置或文字核對裝置構筑到計算機系統(tǒng)中時,利用軟盤驅動器FDD從軟盤中讀出程序,向計算機系統(tǒng)傳輸。
在上述說明中,作為數(shù)據(jù)記錄媒體,是使用軟盤進行說明的,但是,使用光盤同樣也可以進行。另外,記錄媒體不只限于此,同樣也可以使用IC卡、ROM存儲器等,只要是可以記錄程序的就行。
如上所述,本發(fā)明的圖像編碼裝置、圖像譯碼裝置、文字核對裝置和數(shù)據(jù)存儲媒體可以提高圖像編碼的效率。特別是這些裝置對于傳輸文書圖像的傳真裝置及可以檢索文書圖像而進行存儲的文書文卷編排裝置是非常有用的。
權利要求
1.一種將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與和該對象圖像類似的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)表示構成上述對象圖像的多個部分圖像的特征的圖像特征數(shù)據(jù),生成與和上述多個部分圖像類似的部分預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;根據(jù)與上述多個部分預測圖像對應的圖像數(shù)據(jù)和表示對象圖像的部分圖像的位置和大小的輔助數(shù)據(jù),合成上述多個部分預測圖像,從而生成與上述預測圖像對應的圖像數(shù)據(jù)的圖像合成單元;和利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理,并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,與該熵代碼一起輸出上述圖像特征數(shù)據(jù)和輔助數(shù)據(jù)。
2.按權利要求1所述的圖像編碼裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),生成表示構成上述對象圖像的各部分圖像的特征的圖像特征數(shù)據(jù)和表示上述對象圖像的各部分圖像的位置和大小的輔助數(shù)據(jù)的圖像特征抽出單元。
3.按權利要求2所述的圖像編碼裝置,其特征在于上述熵編碼單元具有與構成預測圖像的指定尺寸的預測塊對應地分割上述預測圖像的圖像數(shù)據(jù),并輸出與各預測塊對應的圖像數(shù)據(jù)的第1圖像塊化單元;與構成該對象圖像的指定尺寸的對象塊對應地分割上述對象圖像的圖像數(shù)據(jù),并輸出與各對象塊對應的圖像數(shù)據(jù)的第2圖像塊化單元;和根據(jù)各預測塊和對象塊間的像素值相關,對與上述各對象塊對應的圖像數(shù)據(jù)進行熵編碼的塊預測編碼單元;上述塊預測編碼單元在上述對象塊與預測塊的差別在一定的基準值以上時,對與對象塊對應的圖像數(shù)據(jù)進行熵編碼,與對應的圖像編碼數(shù)據(jù)一起輸出編碼標志,在上述對象塊與預測塊的差別小于一定的基準值時,就不對對象塊進行熵編碼處理,而輸出非編碼標志。
4.按權利要求2所述的圖像編碼裝置,其特征在于具有對上述預測圖像的圖像數(shù)據(jù)進行省略該預測圖像的細部的濾波處理并輸出預測圖像的濾波處理數(shù)據(jù)的圖像濾波處理單元,在上述熵編碼單元中,根據(jù)上述濾波處理數(shù)據(jù),對對象圖像的圖像數(shù)據(jù)進行熵編碼處理。
5.一種將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、利用該對象圖像和與其類似的預測圖像間的像素值相關進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示構成上述對象圖像的多個部分圖像的特征的圖像特征數(shù)據(jù),生成與和上述多個部分圖像類似的部分預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;根據(jù)與上述多個部分預測圖像對應的圖像數(shù)據(jù)和表示上述對象圖像的部分圖像的位置和大小的輔助數(shù)據(jù),合成上述多個部分預測圖像從而生成與上述預測圖像對應的圖像數(shù)據(jù)的圖像合成單元;和根據(jù)與上述預測圖像對應的圖像數(shù)據(jù),利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理,從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
6.一種接收從權利要求3所述的圖像編碼裝置輸出的圖像編碼數(shù)據(jù)、編碼標志或非編碼標志、圖像特征數(shù)據(jù)和輔助數(shù)據(jù)而生成與對象圖像對應的圖像編碼數(shù)據(jù)的圖像譯碼裝置,其特征在于具有根據(jù)表示構成上述對象圖像的多個部分圖像的特征的圖像特征數(shù)據(jù),生成與和上述多個部分圖像類似的部分預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;根據(jù)與上述多個部分預測圖像對應的圖像數(shù)據(jù)和表示上述對象圖像的部分圖像的位置和大小的輔助數(shù)據(jù),合成上述多個部分預測圖像,從而生成與上述預測圖像對應的圖像數(shù)據(jù)的圖像合成單元;與構成預測圖像的指定尺寸的預測塊對應地分割上述預測圖像的圖像數(shù)據(jù),并輸出與各預測塊對應的圖像數(shù)據(jù)的圖像塊化單元;根據(jù)與各預測塊對應的圖像數(shù)據(jù),利用上述對象塊與預測塊間的像素值相關,對與上述對象塊對應的圖像編碼數(shù)據(jù)進行熵譯碼處理,從而生成與上述對象塊對應的圖像數(shù)據(jù)的塊預測譯碼單元;和接收與上述預測塊對應的圖像數(shù)據(jù)和與對象塊對應的圖像數(shù)據(jù),并根據(jù)上述編碼標志和非編碼標志,使用對象塊和預測塊,組裝上述對象圖像,從而復原與該對象圖像對應的圖像數(shù)據(jù)的塊組裝單元。
7.按權利要求5所述的圖像譯碼裝置,其特征在于具有對上述預測圖像的圖像數(shù)據(jù),進行省略該預測圖像的細部的濾波處理,并輸出預測圖像的濾波處理數(shù)據(jù)的圖像濾波處理單元,在上述熵譯碼單元中,根據(jù)上述濾波處理數(shù)據(jù),對對象圖像的圖像編碼數(shù)據(jù)進行熵譯碼處理。
8.一種對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與和對象圖像類似的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的特征的圖像特征數(shù)據(jù),生成與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元,和利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理,并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,對上述對象圖像輸出熵代碼和圖像特征數(shù)據(jù)。
9.按權利要求8所述的圖像編碼裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),從上述對象圖像中抽出其圖像特征,并將圖像特征數(shù)據(jù)向上述預測圖像生成單元輸出的圖像特征抽出單元。
10.按權利要求9所述的圖像編碼裝置,其特征在于上述圖像特征抽出單元包括與分割對象圖像的指定尺寸的多個塊對應地分割與上述對象圖像對應的圖像數(shù)據(jù),從而生成與各塊對應的圖像數(shù)據(jù)的塊化單元;和將與上述各塊對應的圖像數(shù)據(jù)轉換為在各塊內(nèi)的各像素的像素值中出現(xiàn)頻度最高的最頻像素值,并作為與上述對象圖像對應的圖像特征數(shù)據(jù)而輸出與由和上述各塊對應的最頻像素值組成的縮小圖像對應的圖像數(shù)據(jù)的塊平滑化單元,上述預測圖像生成單元生成與對上述指定尺寸的塊將上述縮小圖像的各像素放大而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù)。
11.按權利要求9所述的圖像編碼裝置,其特征在于上述圖像特征抽出單元包括根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),輸出表示與該對象圖像類似的類似圖像的特征的特征矢量的特征量抽出單元;和將對通過對上述特征矢量的量化處理而劃分定義了多個學習矢量的矢量空間的多個區(qū)域中的、包含上述特征矢量的區(qū)域設定的標識符、作為與上述對象圖像對應的圖像特征數(shù)據(jù)而輸出的矢量量化單元,上述預測圖像生成單元根據(jù)與設定了上述標識符的矢量空間的區(qū)域對應的代表特征矢量和最近的學習矢量,生成與上述對象圖像對應的預測圖像的圖像數(shù)據(jù)。
12.一種將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、利用該對象圖像與和其類似的預測圖像間的像素值相關、進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的圖像特征的圖像特征數(shù)據(jù),生成與和該對象圖像對應的預測圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;和根據(jù)與上述預測圖像對應的圖像數(shù)據(jù),利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理,從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
13.按權利要求1、2、8和9的任一權項所述的圖像編碼裝置,其特征在于上述圖像特征數(shù)據(jù)是與分割上述對象圖像的指定尺寸的塊對應地分割對象圖像的圖像數(shù)據(jù),并將與各塊對應的圖像數(shù)據(jù)置換為各塊內(nèi)的像素的像素值中出現(xiàn)頻度最高的最頻像素值而得到的與縮小圖像對應的圖像數(shù)據(jù),上述預測圖像生成單元生成與將上述縮小圖像的各像素對上述指定尺寸的塊放大而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù)。
14.按權利要求5或權利要求12所述的圖像譯碼裝置,其特征在于上述圖像特征數(shù)據(jù)是與分割上述對象圖像的指定尺寸的塊對應地分割對象圖像的圖像數(shù)據(jù),并將與各塊對應的圖像數(shù)據(jù)置換為各塊內(nèi)的像素的像素值中出現(xiàn)頻度最高的最頻像素值而得到的與縮小圖像對應的圖像數(shù)據(jù),上述預測圖像生成單元生成與將上述縮小圖像的各像素放大為上述指定尺寸的塊而成的應構成各塊的像素成為與上述對象塊對應的最頻像素值的預測圖像對應的圖像數(shù)據(jù)。
15.按權利要求1、2、8、9的任一權項所述的圖像編碼裝置,其特征在于上述圖像特征數(shù)據(jù)是與從使用表示與該對象圖像類似的類似圖像的特征的特征矢量、預先在矢量空間中定義的多個已存矢量中選擇的選擇矢量對應的標識符,上述預測圖像生成單元將由與上述標識符對應的選擇矢量所特定的圖像數(shù)據(jù)作為對上述對象圖像的預測圖像的圖像數(shù)據(jù)而輸出。
16.按權利要求5或12所述的圖像譯碼裝置,其特征在于上述圖像特征數(shù)據(jù)是與從使用表示與該對象圖像類似的類似圖像的特征的特征矢量,預先在矢量空間中定義的多個已存矢量中選擇的選擇矢量對應的標識符,上述預測圖像生成單元將由與上述標識符對應的選擇矢量所特定的圖像數(shù)據(jù)作為對上述對象圖像的預測圖像的圖像數(shù)據(jù)而輸出。
17.一種將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有接收從外部輸入的與上述預測圖像對應的圖像數(shù)據(jù),并根據(jù)與上述預測圖像對應的圖像數(shù)據(jù),利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理,從而作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,與對上述對象圖像的熵代碼一起輸出與上述預測圖像對應的圖像數(shù)據(jù)。
18.按權利要求17所述的圖像編碼裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù)將與和該對象圖像類似的預測圖像對應的圖像數(shù)據(jù)向上述熵編碼單元輸出的圖像預測單元。
19.按權利要求18所述的圖像編碼裝置,其特征在于上述圖像預測單元包括根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),輸出表示與該對象圖像類似的類似圖像的圖像特征的特征矢量的特征量抽出單元;通過對上述特征矢量的量化處理,將在劃分定義了多個學習矢量的矢量空間的多個區(qū)域中的上述特征矢量的區(qū)域中設定的標識符,作為對上述對象圖像的圖像特征數(shù)據(jù)而輸出的矢量量化單元;和根據(jù)與設定上述標識符的矢量空間中的區(qū)域對應的代表特征矢量和最近的學習矢量,生成與上述對象圖像對應的預測圖像的數(shù)據(jù)的預測圖像生成單元。
20.一種將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、利用該對象圖像和與其類似的預測圖像間的像素值相關、進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)與和上述對象圖像對應的圖像編碼數(shù)據(jù)獨立地輸入的與預測圖像對應的圖像數(shù)據(jù),利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
21.一種將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)根據(jù)與該對象圖像的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),從上述對象圖像中抽出其圖像特征,并輸出與對象圖像對應的圖像特征數(shù)據(jù)的圖像特征抽出單元;根據(jù)與上述對象圖像對應的圖像特征數(shù)據(jù),生成與和上述對象圖像類似的類似圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;使與編碼處理結束的對象圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)相關聯(lián),作為與處理過的圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)而存儲的預測圖像存儲單元;通過比較與對象圖像對應的圖像特征數(shù)據(jù)和預測圖像存儲單元存儲的與處理過的圖像對應的圖像特征數(shù)據(jù),而將上述類似圖像或指定的處理過的圖像作為預測圖像而選擇的預測圖像選擇單元;和利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理,并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,上述預測圖像選擇單元,作為上述預測圖像在輸出表示選擇上述類似圖像和指定的處理過的圖像中的哪一個的標志的同時,還輸出與上述對象圖像對應的圖像特征數(shù)據(jù)。
22.按權利要求21所述的圖像編碼裝置,其特征在于上述圖像特征抽出單元包括根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),作為與對象圖像對應的圖像特征數(shù)據(jù)生成第1特征矢量的特征量抽出單元;和根據(jù)上述第1特征矢量,進行對上述對象圖像的文字識別,并生成與對象圖像對應的文字代碼的文字識別單元,上述預測圖像生成單元根據(jù)與上述對象圖像對應的文字代碼,作為第1預測圖像數(shù)據(jù)而生成與該對象圖像的類似圖像對應的圖像數(shù)據(jù),上述預測圖像存儲單元將與結束了上述編碼處理的對象圖像對應的圖像數(shù)據(jù)、文字代碼和第1特征矢量相關聯(lián)地進行存儲,上述預測圖像選擇單元將和與對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的圖像數(shù)據(jù)和特征矢量作為第2預測圖像數(shù)據(jù)和第2特征矢量而讀出,根據(jù)上述第1和第2特征矢量的比較結果輸出上述第1和第2預測圖像數(shù)據(jù)中的一方。
23.一種將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、利用該對象圖像和與其對應的預測圖像間的像素值相關、進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的圖像特征的圖像特征數(shù)據(jù),生成與和該對象圖像類似的類似圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;將與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)相關聯(lián),作為與處理過的圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)而存儲的預測圖像存儲單元;作為在編碼處理時與對象圖像對應的預測圖像,根據(jù)表示使用從對象圖像的圖像特征得到的類似圖像和編碼處理過的圖像中的哪一個的標志信息,將上述類似圖像或指定的處理過的圖像選擇為預測圖像的預測圖像選擇單元;和根據(jù)與上述預測圖像對應的圖像數(shù)據(jù),利用上述對象圖像與預測圖像間的像素值相關,對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理,從而生成與上述對象圖像對應的圖像數(shù)據(jù)的熵譯碼單元。
24.按權利要求23所述的圖像譯碼裝置,其特征在于上述預測圖像生成單元,根據(jù)作為與對象圖像對應的圖像特征數(shù)據(jù)的文字代碼,生成與上述對象圖像對應的第1預測圖像數(shù)據(jù),上述預測圖像存儲單元,使與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和文字代碼相關聯(lián),作為與處理過的圖像對應的圖像數(shù)據(jù)和文字代碼進行存儲,上述預測圖像選擇單元將與和對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的圖像數(shù)據(jù),作為第2預測圖像數(shù)據(jù)從上述預測圖像存儲單元中讀出,并根據(jù)上述標志信息輸出上述第1和第2預測圖像數(shù)據(jù)中的一方的數(shù)據(jù)。
25.一種將與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、根據(jù)與該對象圖像的預測圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),從上述對象圖像中抽出其圖像特征,并輸出與對象圖像對應的圖像特征數(shù)據(jù)的圖像特征抽出單元;根據(jù)與上述對象圖像對應的圖像特征數(shù)據(jù),生成與和上述對象圖像類似的類似圖像對應的圖像數(shù)據(jù)的預測圖像生成單元;將與編碼處理結束的對象圖像對應的圖像特征數(shù)據(jù)作為與處理過的圖像對應的圖像特征數(shù)據(jù),進行存儲的預測圖像存儲單元、通過比較與對象圖像對應的圖像特征數(shù)據(jù)和與預測圖像存儲單元存儲的處理過的圖像對應的圖像特征數(shù)據(jù)進行輸出與上述類似圖像對應的圖像數(shù)據(jù)、與對象圖像對應的圖像特征數(shù)據(jù)和表示進行編碼處理的編碼標志的第1數(shù)據(jù)輸出處理;和輸出與對象圖像對應的圖像特征數(shù)據(jù)和表示不進行編碼處理的非編碼標志的第2數(shù)據(jù)輸出處理中的一方的數(shù)據(jù)輸出處理的數(shù)據(jù)輸出控制單元;和利用上述對象圖像和類似圖像間的像素值相關,對與上述對象圖像對應的圖像數(shù)據(jù)進行熵編碼處理,并作為與上述對象圖像對應的圖像編碼數(shù)據(jù)而輸出熵代碼的熵編碼單元,該熵編碼單元接收到上述編碼標志時就進行上述熵編碼處理,在接收到上述非編碼標志時就不進行上述熵編碼處理,從而不輸出熵代碼。
26.按權利要求25所述的圖像編碼裝置,其特征在于上述圖像特征抽出單元包括根據(jù)與上述對象圖像對應的圖像數(shù)據(jù),作為與對象圖像對應的圖像特征數(shù)據(jù)而生成第1特征矢量的特征量抽出單元;和根據(jù)上述第1特征矢量,對上述對象圖像進行文字識別,并生成與對象圖像對應的文字代碼的文字識別單元,上述預測圖像生成單元根據(jù)與上述對象圖像對應的文字代碼,作為預測圖像數(shù)據(jù)生成與其類似圖像對應的圖像數(shù)據(jù),上述預測圖像存儲單元使與上述編碼處理結束的對象圖像對應的文字代碼與第1特征矢量相關聯(lián)而進行存儲,上述數(shù)據(jù)輸出控制單元,將與和對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的特征矢量,作為與預測圖像對應的第2特征矢量而讀出,進行輸出與上述類似圖像對應的圖像數(shù)據(jù)、與對象圖像對應的圖像特征數(shù)據(jù)和表示進行編碼處理的編碼標志的第1數(shù)據(jù)輸出處理、和輸出與對象圖像對應的圖像特征數(shù)據(jù)和表示不進行編碼處理的非編碼標志的第2數(shù)據(jù)輸出處理中的一方的數(shù)據(jù)輸出處理。
27.一種將對與作為編碼處理的對象的對象圖像對應的圖像數(shù)據(jù)、利用該對象圖像和與其對應的預測圖像間的像素值相關、進行熵編碼處理而得到的與對象圖像對應的圖像編碼數(shù)據(jù)進行譯碼的裝置,其特征在于具有根據(jù)表示上述對象圖像的圖像特征的圖像特征數(shù)據(jù),生成與該對象圖像對應的第1預測圖像數(shù)據(jù)的預測圖像生成單元;與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)相關聯(lián),而作為與處理過的圖像對應的圖像數(shù)據(jù)和圖像特征數(shù)據(jù)進行存儲的預測圖像存儲單元;接收到表示進行了編碼處理的編碼標志時就進行輸出上述第1預測圖像數(shù)據(jù)和該編碼標志的第1數(shù)據(jù)輸出處理,而在接收到表示未進行編碼處理的非編碼標志時就從上述預測圖像存儲單元作為第2預測圖像數(shù)據(jù)讀出與譯碼處理過的圖像對應的圖像數(shù)據(jù),并進行輸出第2預測圖像數(shù)據(jù)和該非編碼標志的第2數(shù)據(jù)輸出處理的數(shù)據(jù)輸出控制單元;和在接收到上述編碼標志時,根據(jù)第1預測圖像數(shù)據(jù),利用上述對象圖像和預測圖像間的像素值相關,對與該對象圖像對應的圖像編碼數(shù)據(jù)進行熵譯碼處理,并生成與上述對象圖像對應的譯碼數(shù)據(jù),而在接收到上述非編碼標志時,就將上述第2預測圖像數(shù)據(jù)作為與上述對象圖像對應的譯碼數(shù)據(jù)而輸出的熵譯碼單元。
28.按權利要求27所述的圖像譯碼裝置,其特征在于上述預測圖像生成單元根據(jù)作為與對象圖像對應的圖像特征數(shù)據(jù)的文字代碼生成與上述對象圖像對應的第1預測圖像數(shù)據(jù),上述預測圖像存儲單元將與譯碼處理結束的對象圖像對應的圖像數(shù)據(jù)和文字代碼相關聯(lián),而作為與處理過的圖像對應的圖像數(shù)據(jù)和文字代碼進行存儲,上述數(shù)據(jù)輸出控制單元將與和對象圖像對應的文字代碼一致的文字代碼相關聯(lián)的圖像數(shù)據(jù)作為第2預測圖像數(shù)據(jù)讀出,并根據(jù)上述標志信息輸出上述第1和第2預測圖像數(shù)據(jù)的中的一方的數(shù)據(jù)。
29.按權利要求1、2、8、9、17、18、21和25的任一權項所述的圖像編碼裝置,其特征在于上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行切換構成對象圖像的各像素的像素值的發(fā)生概率的算術編碼處理而得到的算術代碼,上述熵編碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)切換各像素的像素值的發(fā)生概率。
30.按權利要求5、12、20、23、和27的任一權項所述的圖像譯碼裝置,其特征在于上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行切換構成對象圖像的各像素的像素值的發(fā)生概率的算術編碼處理而得到的算術代碼,上述熵譯碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的譯碼過的部分對應的圖像數(shù)據(jù),對與上述對象圖像對應的算術代碼進行切換各像素的像素值的發(fā)生概率的算術譯碼處理,再生與上述對象圖像對應的圖像數(shù)據(jù)。
31.按權利要求1、2、8、9、17、18、21、和25的任一權項所述的圖像編碼裝置,其特征在于上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行切換構成對象圖像的各像素的霍夫曼編碼表的編碼處理而得到的霍夫曼代碼,上述熵編碼單元根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的編碼過的部分對應的圖像數(shù)據(jù)切換各像素的霍夫曼編碼表。
32.按權利要求5、12、20、23、和27的任一權項所述的圖像譯碼裝置,其特征在于上述熵代碼是對與上述對象圖像對應的圖像數(shù)據(jù)進行對構成對象圖像的各像素切換霍夫曼編碼表的編碼處理而得到的霍夫曼代碼,上述熵譯碼單元,根據(jù)與和上述對象圖像類似的預測圖像對應的圖像數(shù)據(jù)和與上述對象圖像的譯碼過的部分對應的圖像數(shù)據(jù),對與上述對象圖像對應的圖像編碼數(shù)據(jù)進行對各像素切換霍夫曼編碼處理的譯碼處理,再生與上述對象圖像對應的圖像數(shù)據(jù)。
33.按權利要求1、2、8、9、17、18、21和25的任一權項所述的圖像編碼裝置,其特征在于具有接收與上述對象圖像關聯(lián)的屬性信息、并將上述屬性信息附加到與上述對象圖像對應的圖像編碼數(shù)據(jù)上而輸出的屬性信息附加單元。
34.一種將與作為編碼處理的對象的包含文字圖像的對象圖像對應的圖像數(shù)據(jù)進行編碼的裝置,其特征在于具有接收與上述對象圖像對應的圖像數(shù)據(jù),對與包含在上述對象圖像中的文字圖像對應的圖像數(shù)據(jù)進行編碼,并輸出文字圖像代碼的文字圖像編碼單元;將構成上述對象圖像中的上述文字圖像的配置部分的像素的像素值,利用位于上述對象圖像中的上述文字圖像的配置部分的周邊的像素的像素值進行置換,生成與消去上述對象圖像的文字圖像的非文字圖像對應的圖像數(shù)據(jù)的文字圖像消去單元;和將與上述非文字圖像對應的圖像數(shù)據(jù)進行編碼并輸出非文字圖像代碼的非文字圖像編碼單元,作為對上述對象圖像的編碼數(shù)據(jù),輸出上述文字圖像代碼和非文字圖像代碼。
35.一種接收將與包含在對象圖像中的文字圖像對應的圖像數(shù)據(jù)編碼而得到的文字圖像代碼和將構成上述對象圖像中的上述文字圖像的配置部分的像素、利用位于上述對象圖像中的上述文字圖像的配置部分的周邊的像素、進行置換而得到的與非文字圖像對應的圖像數(shù)據(jù)、并再生與包含上述文字圖像的對象圖像對應的圖像數(shù)據(jù)的圖像譯碼裝置,其特征在于具有將上述非文字圖像代碼進行譯碼,并輸出與非文字圖像對應的圖像數(shù)據(jù)的非文字圖像譯碼單元;和將上述文字圖像代碼進行譯碼,并輸出與文字圖像對應的圖像數(shù)據(jù)的文字圖像譯碼單元;和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù)和與非文字圖像對應的圖像數(shù)據(jù),將文字圖像與非文字圖像合成,并輸出與包含上述文字圖像的對象圖像對應的圖像數(shù)據(jù)的圖像再構成單元。
36.一種將表示用于檢索文字圖像的檢索條件的檢索數(shù)據(jù)與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的文字圖像代碼進行核對的裝置,其特征在于具有將上述文字圖像代碼附加和與其對應的文字圖像關聯(lián)的屬性信息,并根據(jù)附加到上述文字圖像代碼上的屬性信息是否滿足由上述檢索數(shù)據(jù)所示的檢索條件而進行上述檢索數(shù)據(jù)與文字圖像代碼的核對的文字屬性核對單元。
37.一種將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了表示該文字圖像的圖像特征的圖像特征數(shù)據(jù)的文字圖像代碼進行核對的裝置,其特征在于具有從由上述文字代碼所特定的文字圖像中抽出表示該文字圖像的圖像特征的圖像特征,并輸出圖像特征數(shù)據(jù)的圖像特征抽出單元;和通過附加到上述文字圖像代碼上的圖像特征數(shù)據(jù)與根據(jù)上述文字代碼得到的圖像特征數(shù)據(jù)的核對,進行上述文字圖像代碼與文字代碼是否一致的判斷的核對判斷單元。
38.按權利要求37所述的文字核對裝置,其特征在于上述附加到上述文字圖像代碼上的圖像特征數(shù)據(jù)是表示與文字圖像代碼對應的文字圖像的圖像特征的特征矢量,上述圖像特征抽出單元包括根據(jù)上述文字代碼生成與由該文字代碼所特定的文字圖像對應的圖像數(shù)據(jù)的文字圖像生成單元;和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù),抽出該文字圖像的圖像特征,并輸出表示上述圖像特征的特征矢量的特征量抽出單元,上述核對單元具有計算附加到文字圖像代碼上的特征矢量與根據(jù)上述文字代碼得到的特征矢量的距離的距離計算單元,根據(jù)該距離是否大于指定的閾值來進行上述文字圖像代碼與文字代碼的一致判斷。
39.一種將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了與和該文字圖像類似的預測文字圖像對應的圖像數(shù)據(jù)的文字圖像代碼進行核對的裝置,其特征在于具有接收上述文字圖像代碼,并根據(jù)與附加到該文字圖像代碼上的預測文字圖像對應的圖像數(shù)據(jù),從該預測文字圖像中抽出其圖像特征,從而輸出第1圖像特征數(shù)據(jù)的第1圖像特征抽出單元;接收上述文字代碼,并抽出由該文字代碼所特定的文字圖像的圖像特征,從而輸出第2圖像特征數(shù)據(jù)的第2圖像特征抽出單元;和通過上述第1圖像特征數(shù)據(jù)與第2圖像特征數(shù)據(jù)的核對而進行上述文字圖像代碼與文字代碼是否一致的判斷的核對判斷單元。
40.按權利要求39所述的文字核對裝置,其特征在于上述第1圖像特征抽出單元作為上述第1圖像特征數(shù)據(jù)輸出第1特征矢量,上述第2圖像特征抽出單元包括根據(jù)上述文字代碼,生成與由該文字代碼所特定的文字圖像對應的圖像數(shù)據(jù)的文字圖像生成單元;和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù),抽出該文字圖像的圖像特征,并輸出表示上述圖像特征的第2特征矢量的特征量抽出單元,上述核對判斷單元具有計算上述第1特征矢量與第2特征矢量的距離的距離計算單元,根據(jù)該距離是否大于指定的閾值進行上述文字圖像代碼與文字代碼的一致判斷。
41.一種將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了表示與該文字圖像類似的預測文字圖像的標識符的文字圖像代碼進行核對的裝置,其特征在于具有存儲表示上述預測文字圖像的標識符和上述文字代碼與將它們作為變量而計算的距離信息的對應關系的文字間距離表的表存儲部;接收上述文字圖像代碼和文字代碼,并參照上述文字間距離表求出以附加到上述文字圖像代碼熵的預測文字圖像標示符和上述文字代碼為變量的距離信息的距離計算單元,和根據(jù)上述距離信息判斷上述文字圖像代碼與上述文字代碼是否一致的核對判斷單元。
42.一種將特定應檢索的文字圖像的文字代碼與將和文字圖像對應的圖像數(shù)據(jù)進行編碼而得到的附加了表示與該文字圖像類似的預測文字圖像的標識符的文字圖像代碼進行核對的裝置,其特征在于具有接收上述文字圖像代碼,并根據(jù)附加到該文字圖像代碼上的表示預測文字圖像的標識符,從預測文字圖像中抽出其圖像特征而輸出第1圖像特征數(shù)據(jù)的第1圖像特征抽出單元;接收上述文字代碼,并抽出由該文字代碼特定的文字圖像的圖像特征而輸出第2圖像特征數(shù)據(jù)的第2圖像特征抽出單元;和通過上述第1圖像特征數(shù)據(jù)與第2圖像特征數(shù)據(jù)的核對而進行上述文字圖像代碼與文字代碼是否一致的判斷的核對判斷單元。
43.按權利要求42所述的文字核對裝置,其特征在于上述第1圖像特征抽出單元作為上述第1圖像特征數(shù)據(jù)輸出第1特征矢量,上述第2圖像特征抽出單元包括根據(jù)上述文字代碼生成與由該文字代碼所特定的文字圖像對應的圖像數(shù)據(jù)的文字圖像生成單元;和根據(jù)與上述文字圖像對應的圖像數(shù)據(jù),抽出該文字圖像的圖像特征,并輸出表示上述圖像特征的第2特征矢量的特征量抽出單元,上述核對判斷單元具有計算上述第1特征矢量與第2特征矢量的距離的距離計算單元,根據(jù)該距離是否大于指定的閾值進行上述文字圖像代碼與文字代碼的一致判斷。
44.一種存儲用于利用計算機進行圖像數(shù)據(jù)的處理的圖象處理程序的數(shù)據(jù)存儲媒體,其特征在于作為上述圖象處理程序,存儲用于利用計算機進行權利要求1~權利要求43中的任一權項所述的裝置的圖象處理的程序或利用計算機實現(xiàn)構成上述權利要求1~權利要求43中的任一權項所述的裝置的至少1個單元的功能的程序。
45.一種傳真裝置,其特征在于具有將作為發(fā)信對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器;進行對象圖像數(shù)據(jù)的編碼處理并與編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置;給與上述對象圖像對應的編碼數(shù)據(jù)附加上與其對應的圖像特征數(shù)據(jù),并通過通信線路收發(fā)包含編碼數(shù)據(jù)和圖像特征數(shù)據(jù)的復合數(shù)據(jù)的收發(fā)裝置;接收包含在上述收發(fā)裝置接收的復合數(shù)據(jù)中的編碼數(shù)據(jù)和圖像特征數(shù)據(jù),并根據(jù)圖像特征數(shù)據(jù)將該編碼數(shù)據(jù)進行譯碼,從而輸出對象圖像數(shù)據(jù)的圖像譯碼裝置;和根據(jù)上述對象圖像數(shù)據(jù)進行對象圖像的顯示或打印輸出的圖像輸出裝置,上述圖像編碼裝置采用和上述權利要求2、權利要求8、權利要求9、權利要求14、權利要求17、權利要求18和權利要求33中的任一權項所述的圖像編碼裝置相同的結構。
46.一種傳真裝置,其特征在于具有將作為發(fā)信對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器;進行對象圖像數(shù)據(jù)的編碼處理并與和對象圖像對應編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置;給上述編碼數(shù)據(jù)附加上與其關聯(lián)的圖像特征數(shù)據(jù),并通過通信線路收發(fā)包含編碼數(shù)據(jù)和圖像特征數(shù)據(jù)的復合數(shù)據(jù)的收發(fā)裝置;接收包含在上述收發(fā)裝置接收的復合數(shù)據(jù)中的編碼數(shù)據(jù)和圖像特征數(shù)據(jù),并根據(jù)圖像特征數(shù)據(jù)將該編碼數(shù)據(jù)進行譯碼,從而輸出對象圖像數(shù)據(jù)的圖像譯碼裝置;和根據(jù)上述對象圖像數(shù)據(jù)進行對象圖像的顯示或打印輸出的圖像輸出裝置,上述圖像譯碼裝置采用和上述權利要求5、權利要求12、和權利要求20的任一權項所述的圖像譯碼裝置相同的結構。
47.一種文書文卷編排裝置,其特征在于具有將作為傳真的對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器;進行對象圖像數(shù)據(jù)的編碼處理并與和上述對象圖像對應的編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置;使上述編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)相關聯(lián)而進行存儲的圖像存儲單元;將上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)與和其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元;使用上述圖像特征數(shù)據(jù)將該讀出的編碼數(shù)據(jù)進行譯碼而復原與指定的圖像對應的圖像數(shù)據(jù)的圖像譯碼單元;和根據(jù)上述圖像數(shù)據(jù)進行上述指定的圖像的顯示或打印輸出的圖像輸出裝置,上述編碼裝置采用和上述權利要求2、權利要求8、權利要求9、權利要求14、權利要求17、權利要求18、和權利要求33中的任一權項所述的圖像編碼裝置相同的結構。
48.一種文書文卷編排裝置,其特征在于具有將作為傳真的對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器;進行對象圖像數(shù)據(jù)的編碼處理并與和上述對象圖像對應的編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置;使上述編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)相關聯(lián)而進行存儲的圖像存儲單元;將上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)與和其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元;使用上述圖像特征數(shù)據(jù)將該讀出的編碼數(shù)據(jù)進行譯碼而復原與指定的圖像對應的圖像數(shù)據(jù)的圖像譯碼單元;和根據(jù)上述圖像數(shù)據(jù)進行上述指定的圖像的顯示或打印輸出的圖像輸出裝置,上述編碼裝置采用和上述權利要求5、權利要求12、權利要求16、和權利要求20中的任一權項所述的圖像編碼裝置相同的結構。
49.一種文書文卷編排裝置,其特征在于具有將作為傳真的對象的對象圖像變換為電子數(shù)據(jù)而輸出對象圖像數(shù)據(jù)的掃描器;進行對象圖像數(shù)據(jù)的編碼處理并與和上述對象圖像對應的編碼數(shù)據(jù)一起輸出表示對象圖像的特征的圖像特征數(shù)據(jù)的圖像編碼裝置;使上述編碼數(shù)據(jù)和與其對應的圖像特征數(shù)據(jù)相關聯(lián)而進行存儲的圖像存儲單元;將上述圖像存儲單元存儲的與指定的圖像對應的編碼數(shù)據(jù)與和其對應的圖像特征數(shù)據(jù)一起讀出的數(shù)據(jù)讀出單元;使用上述圖像特征數(shù)據(jù)將該讀出的編碼數(shù)據(jù)進行譯碼而復原與指定的圖像對應的圖像數(shù)據(jù)的圖像譯碼單元;和根據(jù)上述圖像數(shù)據(jù)進行上述指定的圖像的顯示或打印輸出的圖像輸出裝置,上述數(shù)據(jù)讀出單元采用包含上述權利要求36~權利要求43中的任一權項所述的文字核對裝置的結構。
全文摘要
一種圖像編碼裝置,如圖所示,具有根據(jù)表示文書圖像(201)的圖像數(shù)據(jù)Di生成與包含在文書圖像中的文字圖像對應的文字代碼和包含表示文書圖像中各文字圖像的大小和位置的輔助信息的文字數(shù)據(jù)Dc的圖像特征抽出單元(202)。根據(jù)上述文字數(shù)據(jù)Dc作成與上述文書圖像(201)對應的預測文書圖像(205),對上述文書圖像數(shù)據(jù)Di參照上述預測文書圖像數(shù)據(jù)PDi進行切換發(fā)生概率模型的所述編碼處理。從而由發(fā)生概率模型所示的白像素、黑像素的發(fā)生概率與文書圖像中的白像素和黑像素的發(fā)生概率非常接近,可以提高算術編碼器對上述文書圖像數(shù)據(jù)的編碼效率。
文檔編號H04N1/417GK1311951SQ99809407
公開日2001年9月5日 申請日期1999年6月9日 優(yōu)先權日1998年6月9日
發(fā)明者松川善彥, 今川太郎, 目片強司, 畑幸一, 榮藤稔 申請人:松下電器產(chǎn)業(yè)株式會社