專利名稱:硬拷貝信息處理系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種硬拷貝信息處理系統(tǒng)和方法,特別是涉及一種通 過移動(dòng)終端收集和共享硬拷貝信息的系統(tǒng)和方法。
背景技術(shù):
互聯(lián)網(wǎng)發(fā)展到web2.0時(shí)代,對(duì)于用戶而言,既是互聯(lián)網(wǎng)的讀者, 也應(yīng)該是互聯(lián)網(wǎng)的作者,也就是說,在web 2.0時(shí)代,用戶是重要的 內(nèi)容提供者。但是,用戶需要有一個(gè)方便的方式來提供這些內(nèi)容,否 則他們會(huì)不情愿這樣做。
為了提供這樣一種方便的內(nèi)容提供方式,非專利文獻(xiàn)l: UStream + GPS = Seero( http:〃news.cnet.com/8301-17939—109-9899202-2.html) 利用了視頻+ GPS定位來提供服務(wù)的方式,在通過攝像得到視頻的同 時(shí),利用GPS記錄位置信息,目的是在播放視頻的同時(shí)提供地理信息, 以方便觀眾。
另外,在互聯(lián)網(wǎng)上,出現(xiàn)了收集和提供促銷和打折信息的服務(wù)。 如果每個(gè)銷售商都能夠在互聯(lián)網(wǎng)上發(fā)布這樣的信息,那么這一服務(wù)可 以很容易地提供。但是,很多銷售商僅在其銷售現(xiàn)場(chǎng)以促銷海報(bào)等硬 拷貝(當(dāng)資料經(jīng)由打印機(jī)等輸出至紙上時(shí)稱為硬拷貝,若資料顯示在 屏幕等上則稱為軟拷貝)的形式發(fā)布這樣的信息,并且這一情況還很 有可能持續(xù)若干年。究其原因, 一是技術(shù)原因不成熟的IT基礎(chǔ)設(shè)施, 特別是在中小型企業(yè)中;二是商業(yè)原因鼓勵(lì)顧客去銷售商的銷售現(xiàn) 場(chǎng),以激發(fā)顧客的購買熱情和方便顧客的購買。
在這種情況下,用戶需要與朋友共享此類促銷信息,交易網(wǎng)站也 需要收集該促銷信息以提供給需要該信息的訂閱者。但關(guān)于這一 問題 的解決方式,目前還沒有公開任何技術(shù)。
發(fā)明內(nèi)容
本發(fā)明為解決上述問題而作出,其目的在于提供一種使用戶可以 方便地對(duì)硬拷貝信息進(jìn)行處理的系統(tǒng)和方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明的一個(gè)方面提供一種硬拷貝信息處理
系統(tǒng),包括圖像和經(jīng)綿度信息取得單元,取得硬拷貝信息的圖像和 該硬拷貝信息所在位置的經(jīng)綿度信息;地圖信息存儲(chǔ)單元,存儲(chǔ)地圖 信息;機(jī)構(gòu)判定單元,根據(jù)所述地圖信息存儲(chǔ)單元中存儲(chǔ)的地圖信息 來判定與所述圖像和經(jīng)煒度信息取得單元,得的經(jīng)綷度信息對(duì)應(yīng)的機(jī) 構(gòu);先驗(yàn)知識(shí)存儲(chǔ)單元,存儲(chǔ)各種先驗(yàn)知識(shí);轉(zhuǎn)換單元,對(duì)由所述圖 像和經(jīng)綿度信息取得單元取得的圖像進(jìn)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文 本,并且利用所述先驗(yàn)知識(shí)存儲(chǔ)單元中存儲(chǔ)的、與所述機(jī)構(gòu)判定單元 判定的機(jī)構(gòu)對(duì)應(yīng)的先驗(yàn)知識(shí),對(duì)所述圖像或所述一次轉(zhuǎn)換文本進(jìn)行二 次轉(zhuǎn)換,得到二次轉(zhuǎn)換文本;和組合信息生成單元,將所述二次轉(zhuǎn)換 文本與所述機(jī)構(gòu)判定單元判定的機(jī)構(gòu)的信息相組合,得到組合信息。
本發(fā)明的另一個(gè)方面提供一種硬拷貝信息處理方法,包括以下步 驟圖像和經(jīng)綷度信息取得步驟,取得硬拷貝信息的圖像和該硬拷貝 信息所在位置的經(jīng)紼度信息; 一次轉(zhuǎn)換步驟,對(duì)在所述圖像和經(jīng)綷度 信息取得步驟中取得的圖像進(jìn)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本;機(jī)構(gòu) 判定步驟,根據(jù)在所述圖像和經(jīng)煒度信息取得步驟中取得的經(jīng)煒度信 息,利用相關(guān)的地圖信息判定與該經(jīng)綿度信息對(duì)應(yīng)的機(jī)構(gòu);二次轉(zhuǎn)換 步驟,根據(jù)在所述機(jī)構(gòu)判定步驟中判定的機(jī)構(gòu),利用與該機(jī)構(gòu)對(duì)應(yīng)的 先驗(yàn)知識(shí),對(duì)在所述圖像和經(jīng)煒度信息取得步驟中取得的圖像或在所 述一次轉(zhuǎn)換步驟中得到的所述一次轉(zhuǎn)換文本進(jìn)行二次轉(zhuǎn)換,得到二次 轉(zhuǎn)換文本;以及組合步驟,將所述二次轉(zhuǎn)換文本與所述機(jī)構(gòu)判定步驟 中判定的機(jī)構(gòu)的信息相組合,得到組合信息。
根據(jù)本發(fā)明,通過攝像得到圖像,對(duì)該圖像進(jìn)行轉(zhuǎn)換得到文本信 息,并且通過定位得到經(jīng)煒度信息,通過該經(jīng)蟀度信息得到機(jī)構(gòu)信息, 使該文本信息與機(jī)構(gòu)信息密切交互,同時(shí)實(shí)現(xiàn)圖像-文本轉(zhuǎn)換精度和 位置識(shí)別精度的提高,并且,數(shù)字化的信息可以容易地在以后處理和應(yīng)用。
圖l是本發(fā)明第一實(shí)施方式的硬拷貝信息處理系統(tǒng)的框圖。
圖2是本發(fā)明第一實(shí)施方式的硬拷貝信息處理系統(tǒng)的處理過程的 流程圖。
圖3是本發(fā)明第二實(shí)施方式的硬拷貝信息處理系統(tǒng)的框圖。 圖4是本發(fā)明第三實(shí)施方式的硬拷貝信息處理系統(tǒng)的框圖。 圖5是本發(fā)明第三實(shí)施方式的硬拷貝信息處理系統(tǒng)的處理過程的 流程圖。
圖6是本發(fā)明第四實(shí)施方式的硬拷貝信息處理系統(tǒng)的框圖。
具體實(shí)施例方式
以下參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行說明。 (第一實(shí)施方式)
圖1是示出本發(fā)明第一實(shí)施方式的硬拷貝信息處理系統(tǒng)100的框圖。
如圖1所示,硬拷貝信息處理系統(tǒng)100包括移動(dòng)終端101、轉(zhuǎn)換 單元121、先驗(yàn)知識(shí)存儲(chǔ)單元122、地圖信息存儲(chǔ)單元131、機(jī)構(gòu)判定 單元132和唯一機(jī)構(gòu)判定單元133。
移動(dòng)終端101與轉(zhuǎn)換單元121、機(jī)構(gòu)判定單元132之間可以通過 網(wǎng)絡(luò)進(jìn)行通信。該網(wǎng)絡(luò)可以是互聯(lián)網(wǎng)、GPRS ( General Packet Radio Service,通用無線分組業(yè)務(wù))等任意網(wǎng)絡(luò),只要能夠進(jìn)行上述三者之 間的通信即可。
移動(dòng)終端101包括對(duì)硬拷貝信息進(jìn)行拍攝而得到硬拷貝信息的圖 像的攝像單元111、取得移動(dòng)終端101所在位置的經(jīng)絆度信息的定位 單元112和如后所述將二次轉(zhuǎn)換文本和機(jī)構(gòu)信息組合、生成組合信息 的組合信息生成單元113。
移動(dòng)終端101可以是移動(dòng)電話、PDA (personal digital assistant,個(gè)人數(shù)字助理)等。攝像單元111可以是移動(dòng)終端101中設(shè)置的相機(jī)、 攝像頭等。而定位單元112可以是移動(dòng)終端101中的GPS定位單元等。 作為移動(dòng)終端101的典型代表,目前,越來越多的移動(dòng)電話配備了可 以進(jìn)行拍才聶的相機(jī)和基于GPS ( global positioning system,全球定位 系統(tǒng))或GSM ( global system for mobile communication, 全球通) 的定位功能。定位單元112例如通過GPS或GSM取得移動(dòng)終端101 所在位置的經(jīng)綷度信息。
轉(zhuǎn)換單元121用于將移動(dòng)終端101的攝像單元111拍攝的硬拷貝 信息的圖像轉(zhuǎn)換成文本。關(guān)于該轉(zhuǎn)換技術(shù)本身,可以使用現(xiàn)有的OCR (optical character recognition, 光學(xué)字符"i只另'J ) 4支術(shù)。
轉(zhuǎn)換單元121對(duì)從移動(dòng)終端101接收到的、由攝像單元111拍攝 的圖像執(zhí)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本。
并且,轉(zhuǎn)換單元121進(jìn)一步根據(jù)從移動(dòng)終端101接收到的機(jī)構(gòu)信 息,利用后述的先驗(yàn)知識(shí)存儲(chǔ)單元122存儲(chǔ)的、對(duì)應(yīng)于該機(jī)構(gòu)的先驗(yàn) 知識(shí),進(jìn)行二次轉(zhuǎn)換。該二次轉(zhuǎn)換可以針對(duì)一次轉(zhuǎn)換后的一次轉(zhuǎn)換文 本進(jìn)行,也可以針對(duì)從移動(dòng)終端101接收到的、由攝像單元lll拍攝 的圖像進(jìn)行轉(zhuǎn)換,得到二次轉(zhuǎn)換文本。
先驗(yàn)知識(shí)存儲(chǔ)單元122存儲(chǔ)各種先驗(yàn)知識(shí),例如各種機(jī)構(gòu)在宣傳 時(shí)常用的圖文排列方式、顏色、字體等排版格式以及常用詞匯等。
地圖信息存儲(chǔ)單元131存儲(chǔ)常規(guī)的地圖信息,例如與經(jīng)緯度信息 對(duì)應(yīng)地存儲(chǔ)機(jī)構(gòu)名稱等。
機(jī)構(gòu)判定單元132用于判定移動(dòng)終端101所在的具體機(jī)構(gòu),根據(jù) 從移動(dòng)終端101接收到的、由定位單元112得到的經(jīng)緯度信息,對(duì)地 圖信息存儲(chǔ)單元131進(jìn)行檢索,判定與該經(jīng)緯度信息相對(duì)應(yīng)的機(jī)構(gòu)。
當(dāng)機(jī)構(gòu)判定單元132判定的機(jī)構(gòu)有多個(gè)時(shí),唯一機(jī)構(gòu)判定單元133 根據(jù)轉(zhuǎn)換單元121得到的一次轉(zhuǎn)換文本,從多個(gè)機(jī)構(gòu)中確定唯一的機(jī) 構(gòu)。
以下通過圖2的流程圖詳細(xì)說明第一實(shí)施方式的硬拷貝信息處理 系統(tǒng)100的處理流程。中,移動(dòng)終端101的攝像單元lll對(duì)硬拷貝信 息進(jìn)行拍攝,得到硬拷貝信息的圖像。在步驟S12中,通過移動(dòng)終端 101的定位單元112得到移動(dòng)終端101所在位置的經(jīng)絆度信息。步驟 Sll與步驟S12的順序可以不分先后。
由攝像單元lll得到的圖像被發(fā)送給轉(zhuǎn)換單元121,轉(zhuǎn)換單元121 在步驟S13中進(jìn)行圖像的第一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本。在該一次 轉(zhuǎn)換文本中會(huì)出現(xiàn)亂碼、誤轉(zhuǎn)換等。得到的一次轉(zhuǎn)換文本被發(fā)送給移 動(dòng)終端101。
移動(dòng)終端101將通過定位單元112得到的經(jīng)緯度信息和從轉(zhuǎn)換單 元121接收到的一次轉(zhuǎn)換文本發(fā)送給機(jī)構(gòu)判定單元132。在步驟S14 中,機(jī)構(gòu)判定單元132根據(jù)該經(jīng)緯度信息,對(duì)地圖信息存儲(chǔ)單元131 進(jìn)行檢索,判定與該經(jīng)綷度信息相對(duì)應(yīng)的機(jī)構(gòu)。然后將該機(jī)構(gòu)的有關(guān) 信息發(fā)送給移動(dòng)終端101。移動(dòng)終端101將該機(jī)構(gòu)的信息發(fā)送給轉(zhuǎn)換 單元121。上述機(jī)構(gòu)的信息例如是機(jī)構(gòu)的名稱、性質(zhì)、營業(yè)范圍等。
在步驟S15中,轉(zhuǎn)換單元121根據(jù)先驗(yàn)知識(shí)存儲(chǔ)單元122中存儲(chǔ) 的、對(duì)應(yīng)于所接收到的機(jī)構(gòu)信息的先驗(yàn)知識(shí),進(jìn)行第二次轉(zhuǎn)換,得到 精度大大提高的二次轉(zhuǎn)換文本,并將該二次轉(zhuǎn)換文本發(fā)送給移動(dòng)終端 101。
在步驟S16中,移動(dòng)終端101的組合信息生成單元113將二次轉(zhuǎn) 換文本和機(jī)構(gòu)信息組合,發(fā)送給其它移動(dòng)終端或服務(wù)器。服務(wù)器進(jìn)而 可以將該組合信息配送給訂閱者。
另外,如果機(jī)構(gòu)判定單元132在步驟S14中得到多個(gè)機(jī)構(gòu),則將 該多個(gè)機(jī)構(gòu)和從移動(dòng)終端101接收到的一次轉(zhuǎn)換文本發(fā)送給唯一機(jī)構(gòu) 判定單元133。唯一機(jī)構(gòu)判定單元133根據(jù)在該一次轉(zhuǎn)換文本中出現(xiàn) 的有關(guān)信息,例如相關(guān)的詞匯等,從該多個(gè)機(jī)構(gòu)中選擇出唯一的機(jī)構(gòu), 然后將該唯一的機(jī)構(gòu)信息發(fā)送給機(jī)構(gòu)判定單元132,由機(jī)構(gòu)判定單元 132發(fā)送給移動(dòng)終端101。
根據(jù)第一實(shí)施方式,通過定位單元得到的經(jīng)緯度信息與通過轉(zhuǎn)換 單元得到的文本信息相互作用,利用文本信息來進(jìn)一步確定對(duì)應(yīng)于該經(jīng)綷度信息的具體機(jī)構(gòu),從而提高位置識(shí)別精度,反過來利用通過定位信息得到的機(jī)構(gòu)的信息來提高文本轉(zhuǎn)換精度。并且最終得到的文本信息與圖像信息相比,有利于信息的共享和文件的處理。(第二實(shí)施方式)
在上述第一實(shí)施方式的硬拷貝信息處理系統(tǒng)100中,如果機(jī)構(gòu)判定單元132得到多個(gè)機(jī)構(gòu),則對(duì)唯一機(jī)構(gòu)的選擇由唯一機(jī)構(gòu)判定單元133進(jìn)行,而在本實(shí)施方式的硬拷貝信息處理系統(tǒng)200中,如圖3所示,代替唯一機(jī)構(gòu)判定單元133,在移動(dòng)終端101中設(shè)置用戶選擇單元114,由用戶通過該用戶選擇單元114從多個(gè)機(jī)構(gòu)中進(jìn)行選擇,得到唯一的機(jī)構(gòu)的信息。其它構(gòu)成要素與第一實(shí)施方式相同。
這樣,如果機(jī)構(gòu)判定單元132在步驟S14中得到多個(gè)機(jī)構(gòu),則將該多個(gè)機(jī)構(gòu)發(fā)送給移動(dòng)終端101。
用戶通過移動(dòng)終端101的用戶選擇單元114對(duì)接收到的多個(gè)機(jī)構(gòu)進(jìn)行選擇,將選擇出的唯一機(jī)構(gòu)發(fā)送給轉(zhuǎn)換單元121。該選擇可以通過顯示機(jī)構(gòu)候選列表,由用戶從該列表中通過點(diǎn)擊來進(jìn)行。
其它步驟的處理與上述第一實(shí)施方式相同。
根據(jù)該第二實(shí)施方式,除了可以實(shí)現(xiàn)上述第一實(shí)施方式的效果外,還可以由用戶在移動(dòng)終端處進(jìn)行機(jī)構(gòu)的選擇。(第三實(shí)施方式)
在第一實(shí)施方式的硬拷貝信息處理系統(tǒng)100和第二實(shí)施方式的硬拷貝信息處理系統(tǒng)200中,包括移動(dòng)終端101,而本實(shí)施方式的硬拷貝信息處理系統(tǒng)300如圖4所示,包括圖像和經(jīng)煒度信息取得單元301、轉(zhuǎn)換單元321、先驗(yàn)知識(shí)存儲(chǔ)單元322、地圖信息存儲(chǔ)單元331、機(jī)構(gòu)判定單元332、唯一機(jī)構(gòu)判定單元333和組合信息生成單元304,而移動(dòng)終端101設(shè)置在該硬拷貝信息處理系統(tǒng)300之外。
轉(zhuǎn)換單元321、先驗(yàn)知識(shí)存儲(chǔ)單元322、地圖信息存儲(chǔ)單元331、機(jī)構(gòu)判定單元332和唯一機(jī)構(gòu)判定單元333的結(jié)構(gòu)與功能分別與上述第一實(shí)施方式中的轉(zhuǎn)換單元121、先驗(yàn)知識(shí)存儲(chǔ)單元122、地圖信息存儲(chǔ)單元131、機(jī)構(gòu)判定單元132和唯一機(jī)構(gòu)判定單元133基本相同。圖像和經(jīng)綷度信息取得單元301用于取得硬拷貝信息的圖像和該硬拷貝信息所在位置的經(jīng)煒度信息,如圖4所示,可以從移動(dòng)終端101取得所述圖像和所述經(jīng)煒度信息,并且該圖像是利用移動(dòng)終端的攝像功能對(duì)硬拷貝信息進(jìn)行拍攝而得到的,而該經(jīng)煒度信息是利用移動(dòng)終端的定位功能取得的。但圖像和經(jīng)絆度信息取得單元301不限于從移動(dòng)終端101取得所述圖像和所述經(jīng)綿度信息,可以從任意的外部設(shè)備取得。
組合信息生成單元304將轉(zhuǎn)換文本和才幾構(gòu)信息組合,形成組合信息并發(fā)送給移動(dòng)終端101。但組合信息生成單元304不限于將組合信息發(fā)送給移動(dòng)終端101,也可以發(fā)送給移動(dòng)終端101以外的移動(dòng)終端或者服務(wù)器。服務(wù)器進(jìn)而可以將該組合信息配送給訂閱者。
本實(shí)施方式的硬拷貝信息處理系統(tǒng)300從移動(dòng)終端101或其它任意外部設(shè)備取得硬拷貝信息的圖像和該硬拷貝信息所在位置的經(jīng)煒度信息,并將最終的轉(zhuǎn)換文本和機(jī)構(gòu)的信息組合,得到組合信息并發(fā)送。
以下通過圖5的流程圖詳細(xì)說明第三實(shí)施方式的硬拷貝信息處理系統(tǒng)300的處理流程。
在步驟S31中,圖像和經(jīng)絆度信息取得單元301取得硬拷貝信息的圖像和該硬拷貝信息所在位置的經(jīng)綿度信息。
在步驟S32中,轉(zhuǎn)換單元321對(duì)圖像和經(jīng)煒度信息取得單元301取得的硬拷貝信息的圖像進(jìn)行第一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本。
在步驟S33中,機(jī)構(gòu)判定單元332根據(jù)在步驟S31中取得的經(jīng)緯度信息,對(duì)地圖信息存儲(chǔ)單元331進(jìn)行檢索,判定與該經(jīng)綿度信息相對(duì)應(yīng)的機(jī)構(gòu)。
在步驟S34中,轉(zhuǎn)換單元321根據(jù)先驗(yàn)知識(shí)存儲(chǔ)單元322中存儲(chǔ)的、對(duì)應(yīng)于在步驟S33中判定的機(jī)構(gòu)的先驗(yàn)知識(shí),進(jìn)行第二次轉(zhuǎn)換,得到精度大大提高的二次轉(zhuǎn)換文本。
在步驟S35中,組合信息生成單元304將二次轉(zhuǎn)換文本和機(jī)構(gòu)信息組合,得到組合信息。
另外,如果機(jī)構(gòu)判定單元332在步驟S33中得到多個(gè)機(jī)構(gòu),則唯一機(jī)構(gòu)判定單元333根據(jù)在步驟S32中得到的一次轉(zhuǎn)換文本中出現(xiàn)的有關(guān)信息,例如相關(guān)的詞匯等,選擇出唯一的機(jī)構(gòu),由組合信息生成單元304將二次轉(zhuǎn)換文本和該唯一的機(jī)構(gòu)的信息組合,形成組合信息。
根據(jù)該第三實(shí)施方式,除了上述第一、第二實(shí)施方式的效果外,進(jìn)一步簡(jiǎn)化了在移動(dòng)終端中進(jìn)行的處理。(第四實(shí)施方式)
在上述第三實(shí)施方式的基礎(chǔ)上,進(jìn)而也可以如圖6所示,將上述硬拷貝信息處理系統(tǒng)100中的轉(zhuǎn)換單元121、先驗(yàn)知識(shí)存儲(chǔ)單元122、地圖信息存儲(chǔ)單元131、機(jī)構(gòu)判定單元132和唯一機(jī)構(gòu)判定單元133都組合在移動(dòng)終端101中,形成硬拷貝信息處理系統(tǒng)400,從而在移動(dòng)終端101中進(jìn)行所有的處理。
根據(jù)該第四實(shí)施方式,除了上述第一、第二實(shí)施方式的效果外,不需要通過網(wǎng)絡(luò)進(jìn)行信息的收發(fā),可以在移動(dòng)終端內(nèi)進(jìn)行所有處理。(實(shí)施例)
為了更容易地理解本發(fā)明,以下說明本發(fā)明的一個(gè)更具體的實(shí)施例。
假設(shè)現(xiàn)在到某銷售現(xiàn)場(chǎng),看到墻上張貼的促銷海報(bào)。為了與不在該銷售現(xiàn)場(chǎng)的人們共享硬拷貝促銷信息,利用移動(dòng)電話的相機(jī)進(jìn)行拍攝,得到該海報(bào)的圖像。并且,利用移動(dòng)電話的GPS/GSM定位功能得到移動(dòng)電話所在位置的經(jīng)煒度信息。該經(jīng)緯度信息假設(shè)是40。02'55.70〃N和1鵬6'48.65〃E。
利用存儲(chǔ)了經(jīng)煒度信息與建筑物對(duì)應(yīng)關(guān)系的地圖數(shù)據(jù)庫,假設(shè)得知上述經(jīng)煒度信息對(duì)應(yīng)某購物中心,而且可知駐扎在該購物中心的眾多商家,但是無法知道具體是哪個(gè)商家。例如可能包括A電器商場(chǎng)、B服裝專賣店、C服裝專賣店、D影城等,將它們作為商家候選。
利用OCR對(duì)拍攝到的促銷海報(bào)的圖像進(jìn)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本,利用該一次轉(zhuǎn)換文本中出現(xiàn)的相關(guān)詞匯,從商家候選中選擇唯一的商家。
例如,如果存在有關(guān)服裝的信息,則可以確定不是A電器商場(chǎng)和D影城等,因?yàn)锳電器商場(chǎng)銷售電器等,而D影城的宣傳一般只會(huì)涉及影片,可能的商家是B服裝專賣店、C服裝專賣店等,進(jìn)一步,如果出現(xiàn)"A"、 "B"等相關(guān)字樣,則可確定究竟是B服裝專賣店還是C服裝專賣店,由此可以將位置識(shí)別精度提高到與該經(jīng)絆度信息對(duì)應(yīng)的具體商家。
假定所確定的唯一商家是B服裝專賣店,則利用OCR轉(zhuǎn)換單元進(jìn)行二次轉(zhuǎn)換,得到二次轉(zhuǎn)換文本。
對(duì)于一些圖文混排的原稿,掃描成一幅圖像進(jìn)行識(shí)別會(huì)嚴(yán)重影響OCR軟件的識(shí)別率。而在如上確定商家后,對(duì)先驗(yàn)知識(shí)數(shù)據(jù)庫進(jìn)行參照,在該先驗(yàn)知識(shí)數(shù)據(jù)庫中存儲(chǔ)各商家的固有信息,例如各商家在促銷宣傳時(shí)經(jīng)常使用的排版方式(例如圖片與文字的位置關(guān)系、顏色、字體)、常用的詞匯等。根據(jù)上述確定的B服裝專賣店經(jīng)常使用的排版方式、常用的詞匯等,將掃描后的版面切分成多個(gè)區(qū)域后再識(shí)別,切分區(qū)域的原則可以是將圖形、圖像排除在區(qū)域之外,盡量把文字字體、字號(hào)一致的劃在一個(gè)區(qū)域內(nèi)。并且,在出現(xiàn)亂碼或錯(cuò)誤的轉(zhuǎn)換時(shí),根據(jù)常用的詞匯來推定該錯(cuò)誤應(yīng)該如何糾正。由此可以利用位置信息來提高OCR轉(zhuǎn)換的精度,得到精度大大提高的二次轉(zhuǎn)換文本。
然后,移動(dòng)電話將二次轉(zhuǎn)換文本和商家信息組合,經(jīng)由SMS( shortmessage system,短消息系統(tǒng))發(fā)送給其它移動(dòng)終端或服務(wù)器。服務(wù)器進(jìn)而可以將該組合信息配送給訂閱者。
如上所述,利用本發(fā)明,可以實(shí)現(xiàn)通過相機(jī)拍攝的信息與GPS定位信息的密切交互,同時(shí)實(shí)現(xiàn)兩者精度的提高,并且,數(shù)字化的信息可以容易地在以后處理和應(yīng)用。
另外,本發(fā)明的硬拷貝信息并不限于促銷海報(bào)等,可以是包括宣傳廣告、招聘信息等各種硬拷貝信息。并且,上述的實(shí)施方式僅僅是例示,本發(fā)明并不僅限定于上述實(shí)施方式。
權(quán)利要求
1.一種硬拷貝信息處理系統(tǒng),包括圖像和經(jīng)緯度信息取得單元,取得硬拷貝信息的圖像和該硬拷貝信息所在位置的經(jīng)緯度信息;地圖信息存儲(chǔ)單元,存儲(chǔ)地圖信息;機(jī)構(gòu)判定單元,根據(jù)所述地圖信息存儲(chǔ)單元中存儲(chǔ)的地圖信息來判定與所述圖像和經(jīng)緯度信息取得單元取得的經(jīng)緯度信息對(duì)應(yīng)的機(jī)構(gòu);先驗(yàn)知識(shí)存儲(chǔ)單元,存儲(chǔ)各種先驗(yàn)知識(shí);轉(zhuǎn)換單元,對(duì)由所述圖像和經(jīng)緯度信息取得單元取得的圖像進(jìn)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本,并且利用所述先驗(yàn)知識(shí)存儲(chǔ)單元中存儲(chǔ)的、與所述機(jī)構(gòu)判定單元判定的機(jī)構(gòu)對(duì)應(yīng)的先驗(yàn)知識(shí),對(duì)所述圖像或所述一次轉(zhuǎn)換文本進(jìn)行二次轉(zhuǎn)換,得到二次轉(zhuǎn)換文本;和組合信息生成單元,將所述二次轉(zhuǎn)換文本與所述機(jī)構(gòu)判定單元判定的機(jī)構(gòu)的信息相組合,得到組合信息。
2. 如權(quán)利要求l所述的硬拷貝信息處理系統(tǒng),還包括 唯一機(jī)構(gòu)判定單元,當(dāng)所述機(jī)構(gòu)判定單元判定的機(jī)構(gòu)有多個(gè)時(shí),根據(jù)所述一次轉(zhuǎn)換文本,從所述多個(gè)機(jī)構(gòu)中選擇唯一的機(jī)構(gòu)。
3. 如權(quán)利要求l所述的硬拷貝信息處理系統(tǒng),其中, 所述圖像和經(jīng)綿度信息取得單元從移動(dòng)終端取得所述圖像和所述經(jīng)綷度信息,所述圖像是利用所述移動(dòng)終端的攝像功能對(duì)硬拷貝信息 進(jìn)行拍攝而得到的,所述經(jīng)綿度信息是利用所述移動(dòng)終端的定位功能 取得的。
4. 如權(quán)利要求3所述的硬拷貝信息處理系統(tǒng),其中,所述組合信息生成單元將所述組合信息經(jīng)由網(wǎng)絡(luò)發(fā)送給所述移動(dòng) 終端。
5. 如權(quán)利要求4所述的硬拷貝信息處理系統(tǒng),其中, 所述移動(dòng)終端具有用戶選擇單元,當(dāng)所述機(jī)構(gòu)判定單元判定的機(jī)構(gòu)有多個(gè)時(shí),由用戶通過該用戶選擇單元從所述組合信息生成單元發(fā) 送的組合信息中的機(jī)構(gòu)的信息中選擇唯一 的機(jī)構(gòu)的信息。
6. 如權(quán)利要求3所述的硬拷貝信息處理系統(tǒng),其中, 所述移動(dòng)終端是移動(dòng)電話或個(gè)人數(shù)字助理。
7. 如權(quán)利要求3所述的硬拷貝信息處理系統(tǒng),其中,所述組合信息生成單元將所述組合信息經(jīng)由網(wǎng)絡(luò)發(fā)送給所述移動(dòng) 終端以外的移動(dòng)終端或服務(wù)器。
8. 如權(quán)利要求7所述的硬拷貝信息處理系統(tǒng),其中, 所述服務(wù)器將所述組合信息配送給訂閱者。
9. 如權(quán)利要求3所述的硬拷貝信息處理系統(tǒng),其中, 所述移動(dòng)終端包含在所述硬拷貝信息處理系統(tǒng)中。
10. —種硬拷貝信息處理方法,包括以下步驟圖像和經(jīng)綿度信息取得步驟,取得硬拷貝信息的圖像和該硬拷貝 信息所在位置的經(jīng)綷度信息;一次轉(zhuǎn)換步驟,對(duì)在所述圖像和經(jīng)煒度信息取得步驟中取得的圖 像進(jìn)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本;機(jī)構(gòu)判定步驟,根據(jù)在所述圖像和經(jīng)綿度信息取得步驟中取得的 經(jīng)煒度信息,利用相關(guān)的地圖信息判定與該經(jīng)綷度信息對(duì)應(yīng)的機(jī)構(gòu);二次轉(zhuǎn)換步驟,根據(jù)在所述機(jī)構(gòu)判定步驟中判定的機(jī)構(gòu),利用與 該機(jī)構(gòu)對(duì)應(yīng)的先驗(yàn)知識(shí),對(duì)在所述圖像和經(jīng)綷度信息取得步驟中取得 的圖像或在所述一次轉(zhuǎn)換步驟中得到的所述一次轉(zhuǎn)換文本進(jìn)行二次轉(zhuǎn) 換,得到二次轉(zhuǎn)換文本;以及組合步驟,將所述二次轉(zhuǎn)換文本與所述機(jī)構(gòu)判定步驟中判定的機(jī) 構(gòu)的信息相組合,得到組合信息。
11. 如權(quán)利要求10所述的硬拷貝信息處理方法,還包括以下步驟 唯一機(jī)構(gòu)判定步驟,當(dāng)在所述機(jī)構(gòu)判定步驟中判定的機(jī)構(gòu)有多個(gè)時(shí),根據(jù)在所述一次轉(zhuǎn)換步驟中得到的所述一次轉(zhuǎn)換文本、或者根據(jù) 用戶的選擇,從所述多個(gè)機(jī)構(gòu)中選擇唯一的機(jī)構(gòu)。
12. 如權(quán)利要求10所述的硬拷貝信息處理方法,其中,在所述圖像和經(jīng)綽度信息取得步驟中,從移動(dòng)終端取得所述圖像 和所述經(jīng)綽度信息,所述圖像是利用所述移動(dòng)終端的攝像功能對(duì)硬拷 貝信息進(jìn)行拍攝而得到的,所述經(jīng)綿度信息是利用所述移動(dòng)終端的定 位功能取得的。
13. 如權(quán)利要求12所述的硬拷貝信息處理方法,其中,所述組合信息生成步驟還包括將所述組合信息經(jīng)由網(wǎng)絡(luò)發(fā)送給所 述移動(dòng)終端的步驟。
14. 如權(quán)利要求13所述的硬拷貝信息處理方法,其中, 所述移動(dòng)終端是移動(dòng)電話或個(gè)人數(shù)字助理。
15. 如權(quán)利要求12所述的硬拷貝信息處理方法,其中, 所述組合信息生成步驟還包括將所述組合信息經(jīng)由網(wǎng)絡(luò)發(fā)送給所述移動(dòng)終端以外的移動(dòng)終端或服務(wù)器的步驟。
全文摘要
本發(fā)明提供一種硬拷貝信息處理系統(tǒng)和方法,該硬拷貝信息處理系統(tǒng)包括圖像和經(jīng)緯度信息取得單元,取得硬拷貝信息的圖像和該硬拷貝信息所在位置的經(jīng)緯度信息;地圖信息存儲(chǔ)單元,存儲(chǔ)地圖信息;機(jī)構(gòu)判定單元,根據(jù)所述地圖信息來判定與圖像和經(jīng)緯度信息取得單元取得的經(jīng)緯度信息對(duì)應(yīng)的機(jī)構(gòu);先驗(yàn)知識(shí)存儲(chǔ)單元,存儲(chǔ)各種先驗(yàn)知識(shí);轉(zhuǎn)換單元,對(duì)由圖像和經(jīng)緯度信息取得單元取得的圖像進(jìn)行一次轉(zhuǎn)換,得到一次轉(zhuǎn)換文本,并且利用先驗(yàn)知識(shí)存儲(chǔ)單元中存儲(chǔ)的、與機(jī)構(gòu)判定單元判定的機(jī)構(gòu)對(duì)應(yīng)的先驗(yàn)知識(shí),對(duì)圖像或一次轉(zhuǎn)換文本進(jìn)行二次轉(zhuǎn)換,得到二次轉(zhuǎn)換文本;和組合信息生成單元,將二次轉(zhuǎn)換文本與機(jī)構(gòu)判定單元判定的機(jī)構(gòu)的信息相組合,得到組合信息。
文檔編號(hào)G06Q30/00GK101639917SQ20081013116
公開日2010年2月3日 申請(qǐng)日期2008年7月30日 優(yōu)先權(quán)日2008年7月30日
發(fā)明者哲 向, 李雪丹, 昱 袁, 趙邑新 申請(qǐng)人:國際商業(yè)機(jī)器公司