亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于提供用戶圖像捕捉反饋以便進(jìn)行改良的機(jī)器語言翻譯的技術(shù)的制作方法

文檔序號:11450761閱讀:224來源:國知局
用于提供用戶圖像捕捉反饋以便進(jìn)行改良的機(jī)器語言翻譯的技術(shù)的制造方法與工藝

相關(guān)申請的交叉引用

本申請要求于2015年01月12日提交的美國發(fā)明申請no.14/594238的優(yōu)先權(quán)。以上申請的全部公開內(nèi)容通過引用合并于此。

本公開總體上涉及移動計算設(shè)備,尤其涉及用于向用戶提供圖像捕捉反饋以便進(jìn)行改良的機(jī)器語言翻譯的技術(shù)。



背景技術(shù):

本文中所提供的背景描述是出于在整體上呈現(xiàn)本公開的場境的目的。就該背景技術(shù)部分中所描述的范圍而言,當(dāng)前署名發(fā)明人的工作以及該描述中在提交時并未以其它方式構(gòu)成現(xiàn)有技術(shù)的多個方面既非明確也非隱含地認(rèn)可其相對于本公開構(gòu)成現(xiàn)有技術(shù)。

光學(xué)字符識別(ocr)涉及使用例如移動電話的計算設(shè)備檢測圖像中的文本。更具體地,ocr涉及獲得圖像中的文本的機(jī)器編碼表示(“ocr文本”)。與用戶所進(jìn)行的文本的手動輸入相反,ocr可以在用戶設(shè)備處提供一種獲得所述數(shù)字形式的ocr文本的更快方式。在獲得ocr文本之后,ocr文本可以以各種方式被加以利用。例如,ocr文本可以由計算設(shè)備進(jìn)行處理、被存儲在存儲器中,和/或被傳送至另一個計算設(shè)備。處理ocr文本的一個示例是執(zhí)行機(jī)器語言翻譯,這涉及到使用諸如服務(wù)器的計算設(shè)備將ocr文本從源語言翻譯為不同的目標(biāo)語言。



技術(shù)實現(xiàn)要素:

一種計算機(jī)實現(xiàn)的技術(shù),所述技術(shù)包括在具有一個或多個處理器的計算系統(tǒng)處接收包括源語言的文本的對象的第一圖像,所述第一圖像由與所述計算系統(tǒng)進(jìn)行通信的相機(jī)所捕捉,由所述計算系統(tǒng)對所述第一圖像執(zhí)行光學(xué)字符識別(ocr)以獲得作為所述文本的機(jī)器編碼文本表示的ocr文本,由所述計算系統(tǒng)獲得第一翻譯ocr文本以及翻譯分?jǐn)?shù),所述翻譯分?jǐn)?shù)指示所述第一翻譯ocr文本是所述ocr文本到目標(biāo)語言的適當(dāng)翻譯的可能性程度,以及在所述翻譯分?jǐn)?shù)低于指示可接受的可能性程度的翻譯分?jǐn)?shù)閾值時:由所述計算設(shè)備輸出使用相機(jī)捕捉所述對象的至少一部分的第二圖像集合的用戶指令,在所述計算系統(tǒng)處接收第二圖像集合,由所述計算系統(tǒng)對所述第二圖像集合中的至少一個圖像執(zhí)行ocr以獲得與所述文本相對應(yīng)的修改ocr文本,響應(yīng)于獲得所述修改ocr文本,由所述計算系統(tǒng)獲得表示所述修改ocr文本從源語言到目標(biāo)語言的翻譯的第二翻譯ocr文本,并且由所述計算系統(tǒng)輸出所述第二翻譯ocr文本。

還提出了一種具有被配置為執(zhí)行操作(例如,所述技術(shù))的一個或多個處理器的計算系統(tǒng)。所述操作可以包括:接收包括源語言的文本的對象的第一圖像,所述第一圖像由與所述計算系統(tǒng)進(jìn)行通信的相機(jī)所捕捉,對所述第一圖像執(zhí)行光學(xué)字符識別(ocr)以獲得作為所述文本的機(jī)器編碼文本表示的ocr文本,獲得第一翻譯ocr文本以及翻譯分?jǐn)?shù),所述翻譯分?jǐn)?shù)指示所述第一翻譯ocr文本是所述ocr文本到目標(biāo)語言的適當(dāng)翻譯的可能性程度,并且在所述翻譯分?jǐn)?shù)低于指示可接受的可能性程度的翻譯分?jǐn)?shù)閾值時:輸出使用相機(jī)捕捉所述對象的至少一部分的第二圖像集合的用戶指令,接收第二圖像集合,對所述第二圖像集合中的至少一個圖像執(zhí)行ocr以獲得與所述文本相對應(yīng)的修改ocr文本,響應(yīng)于獲得所述修改ocr文本,獲得表示所述修改ocr文本從源語言到目標(biāo)語言的翻譯的第二翻譯ocr文本,并且輸出所述第二翻譯ocr文本。

在一些實施例中,所述技術(shù)進(jìn)一步包括由所述計算系統(tǒng)使用相機(jī)捕捉第一圖像和第二圖像集合。在一些實施例中,所述技術(shù)進(jìn)一步包括在翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,由所述計算系統(tǒng)在捕捉第二圖像集合的同時調(diào)節(jié)與相機(jī)相關(guān)聯(lián)的光源的強(qiáng)度,所述光源與所述計算系統(tǒng)進(jìn)行通信。在一些實施例中,所述技術(shù)進(jìn)一步包括在翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,由所述計算系統(tǒng)在捕捉第二圖像集合的同時調(diào)節(jié)與相機(jī)相關(guān)聯(lián)的光源的閃光數(shù)目,所述光源與所述計算系統(tǒng)進(jìn)行通信。

在一些實施例中,所述技術(shù)進(jìn)一步包括在翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,由所述計算設(shè)備識別第一圖像中導(dǎo)致ocr文本和相對應(yīng)的第一翻譯ocr文本的翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值的部分,其中所述用戶指令是關(guān)于第一圖像中的所識別部分來捕捉第二圖像集合。在一些實施例中,對第二圖像集合中的至少一個圖像執(zhí)行ocr以獲得與所述文本相對應(yīng)的修改ocr文本包括:將第一圖像和第二圖像集合中的至少兩個圖像的部分進(jìn)行組合從而獲得組合圖像,以及對所述組合圖像執(zhí)行ocr以獲得所述修改ocr文本。

在一些實施例中,對所述第一圖像執(zhí)行ocr以獲得ocr文本包括:由所述計算系統(tǒng)對所述第一圖像執(zhí)行ocr以獲得可能ocr文本的集合,其中每個可能ocr文本具有指示所述可能ocr文本作為文本的可能性程度的相對應(yīng)ocr分?jǐn)?shù),并且由所述計算系統(tǒng)選擇相對于其它可能ocr文本的ocr分?jǐn)?shù)具有最高的相對應(yīng)ocr分?jǐn)?shù)的可能ocr文本。在一些實施例中,所述技術(shù)進(jìn)一步包括在翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,由所述計算系統(tǒng)選擇另一個可能ocr文本以獲得所述修改ocr文本。在一些實施例中,所述另一個可能ocr文本相對于其它可能ocr文本的ocr分?jǐn)?shù)具有第二高的相對應(yīng)ocr分?jǐn)?shù)。

所述提出了另一種計算機(jī)實現(xiàn)的技術(shù)。所述技術(shù)可以包括在具有一個或多個處理器的計算系統(tǒng)處接收包括源語言的文本的對象的第一圖像,所述第一圖像由與所述計算系統(tǒng)進(jìn)行通信的相機(jī)所捕捉,由所述計算系統(tǒng)對所述第一圖像執(zhí)行ocr以獲得可能ocr文本的集合,其中每個可能ocr文本具有指示所述可能ocr文本作為文本的可能性程度的相對應(yīng)ocr分?jǐn)?shù),由所述計算系統(tǒng)選擇相對于其它可能ocr文本的ocr分?jǐn)?shù)具有最高的相對應(yīng)ocr分?jǐn)?shù)的可能ocr文本以獲得ocr文本,以及在所述ocr文本的ocr分?jǐn)?shù)低于指示可接受的可能性程度的ocr分?jǐn)?shù)閾值時:由所述計算設(shè)備輸出使用相機(jī)捕捉所述對象的至少一部分的第二圖像集合的用戶指令,在所述計算系統(tǒng)處接收第二圖像集合,由所述計算系統(tǒng)對所述第二圖像集合中的至少一個圖像執(zhí)行ocr以獲得與所述文本相對應(yīng)的修改ocr文本,并且由所述計算系統(tǒng)輸出所述修改ocr文本。

還提出了另一種具有被配置為執(zhí)行操作(例如,所述技術(shù))的一個或多個處理器的計算系統(tǒng)。所述操作可以包括接收包括源語言的文本的對象的第一圖像,所述第一圖像由與所述計算系統(tǒng)進(jìn)行通信的相機(jī)所捕捉,對所述第一圖像執(zhí)行ocr以獲得可能ocr文本的集合,其中每個可能ocr文本具有指示所述可能ocr文本作為文本的可能性程度的相對應(yīng)ocr分?jǐn)?shù),選擇相對于其它可能ocr文本的ocr分?jǐn)?shù)具有最高的相對應(yīng)ocr分?jǐn)?shù)的可能ocr文本以獲得ocr文本,以及在所述ocr文本的ocr分?jǐn)?shù)低于指示可接受的可能性程度的ocr分?jǐn)?shù)閾值時:輸出使用相機(jī)捕捉所述對象的至少一部分的第二圖像集合的用戶指令,接收第二圖像集合,對所述第二圖像集合中的至少一個圖像執(zhí)行ocr以獲得與所述文本相對應(yīng)的修改ocr文本,以及輸出所述修改ocr文本。

在一些實施例中,所述技術(shù)進(jìn)一步包括由所述計算系統(tǒng)使用相機(jī)捕捉所述第一圖像和第二圖像集合。在一些實施例中,所述技術(shù)進(jìn)一步包括在ocr分?jǐn)?shù)低于ocr分?jǐn)?shù)閾值時,由所述計算系統(tǒng)在捕捉第二圖像集合的同時調(diào)節(jié)與相機(jī)相關(guān)聯(lián)的光源的強(qiáng)度,所述光源與所述計算系統(tǒng)進(jìn)行通信。在一些實施例中,所述技術(shù)進(jìn)一步包括在ocr分?jǐn)?shù)低于ocr分?jǐn)?shù)閾值時,由所述計算系統(tǒng)在捕捉第二圖像集合的同時調(diào)節(jié)與相機(jī)相關(guān)聯(lián)的光源的閃光數(shù)目,所述光源與所述計算系統(tǒng)進(jìn)行通信。

在一些實施例中,所述技術(shù)進(jìn)一步包括在翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,由所述計算系統(tǒng)識別第一圖像中導(dǎo)致ocr分?jǐn)?shù)低于ocr分?jǐn)?shù)閾值的部分,其中所述用戶指令是關(guān)于第一圖像中的所識別部分來捕捉第二圖像集合。在一些實施例中,對第二圖像集合中的至少一個圖像執(zhí)行ocr以獲得與所述文本相對應(yīng)的修改ocr文本包括:將第一圖像和第二圖像集合中的至少兩個圖像的部分進(jìn)行組合從而獲得組合圖像,以及對所述組合圖像執(zhí)行ocr以獲得所述修改ocr文本。

在一些實施例中,所述技術(shù)進(jìn)一步包括在ocr分?jǐn)?shù)低于ocr分?jǐn)?shù)閾值時,由所述計算系統(tǒng)選擇另一個可能ocr文本以獲得所述修改ocr文本。在一些實施例中,所述另一個可能ocr文本相對于其它可能ocr文本的ocr分?jǐn)?shù)具有第二高的相對應(yīng)ocr分?jǐn)?shù)。

在一些實施例中,所述技術(shù)進(jìn)一步包括由所述計算系統(tǒng)獲得第一翻譯ocr文本以及翻譯分?jǐn)?shù),所述翻譯分?jǐn)?shù)指示所述第一翻譯ocr文本是所述ocr文本到目標(biāo)語言的適當(dāng)翻譯的可能性程度,并且在所述翻譯分?jǐn)?shù)低于指示可接受的可能性程度的翻譯分?jǐn)?shù)閾值時,由所述計算設(shè)備輸出使用相機(jī)捕捉所述對象的至少一部分的第二圖像集合的用戶指令。

本公開另外的可應(yīng)用領(lǐng)域?qū)⒂捎陔S后所提供的詳細(xì)描述而變得顯而易見。應(yīng)當(dāng)理解的是,所述詳細(xì)描述以及具體示例僅是出于說明的目的而并非意在對本公開的范圍加以限制。

附圖說明

將由于詳細(xì)描述和附圖而使本公開得到更為全面地理解,其中:

圖1是包括根據(jù)本公開一些實施方式的示例移動計算設(shè)備的計算網(wǎng)絡(luò)的功能框圖;

圖2是圖1的示例移動計算設(shè)備的功能框圖;以及

圖3是根據(jù)本公開一些實施方式的用于向用戶提供圖像捕捉反饋以便進(jìn)行改良的機(jī)器語言翻譯的示例技術(shù)的流程圖。

具體實施方式

如之前所討論的,光學(xué)字符識別(ocr)涉及獲得圖像中的文本的機(jī)器編碼表示(“ocr文本”)。然而,諸如圖像捕捉角度和照明的條件會影響到通過對圖像執(zhí)行ocr所獲得的ocr文本。僅作為示例,一些字符可能具有不充分的照明,并且因此ocr文本可能包括不正確的字符或者文本中缺失的字符。ocr文本中的錯誤可能難以被確定,并且這些錯誤會傳播至后續(xù)的機(jī)器語言翻譯操作并對其有所影響??梢垣@得不同圖像捕捉角度和/或不同照明下的附加圖像從而對ocr文本中的錯誤進(jìn)行糾正。然而,用戶需要與如何捕捉這些附加圖像有關(guān)的具體指令。附加地或替選地,機(jī)器語言翻譯結(jié)果能夠被反饋至ocr過程之中從而糾正ocr文本中的錯誤。因此,提出了用于用戶圖像捕捉反饋以便進(jìn)行改良的機(jī)器語言翻譯的技術(shù)。

當(dāng)從初始圖像所獲得的ocr文本的機(jī)器語言翻譯作為適當(dāng)翻譯時的可能性程度低時,這些技術(shù)提供用戶圖像捕獲反饋以獲得附加圖像從而獲得修改ocr文本,這可以導(dǎo)致改良的機(jī)器語言翻譯結(jié)果。不同于用戶圖像捕獲反饋,這些技術(shù)可以通過從初始o(jì)cr操作中選擇另一個可能的ocr文本來獲得修改ocr文本。在一些實施方式中,所述技術(shù)涉及在所述附加圖像捕獲期間調(diào)節(jié)光源的操作,諸如通過調(diào)節(jié)光源強(qiáng)度和/或光源閃光的量/數(shù)目。在一些實施方式中,這些附加圖像(以及在一些情況下的初始圖像的一部分)的部分可以被組合以創(chuàng)建在其上執(zhí)行ocr的組合圖像。在獲得修改ocr文本之后,可以獲得另一個機(jī)器語言翻譯,并且它在具有足夠高的可能性程度的情況下就可以被輸出給用戶。

現(xiàn)在參考圖1,圖示了計算網(wǎng)絡(luò)100。計算網(wǎng)絡(luò)100可以包括服務(wù)器設(shè)備104a和104b(統(tǒng)稱為“服務(wù)器設(shè)備104”)。僅作為示例,服務(wù)器設(shè)備104a可以是ocr服務(wù)器設(shè)備,而服務(wù)器設(shè)備104b則可以是機(jī)器語言翻譯服務(wù)器設(shè)備。然而,應(yīng)當(dāng)意識到的是,如本文中所使用的術(shù)語“服務(wù)器設(shè)備”可以是指單個硬件計算機(jī)服務(wù)器設(shè)備以及在并行或分布式架構(gòu)中進(jìn)行操作的多個類似服務(wù)器設(shè)備。在一些實施方式中,移動計算設(shè)備108能夠被配置為在本地執(zhí)行一些或全部的ocr和/或機(jī)器語言翻譯。僅作為示例,移動計算設(shè)備108可以在本地執(zhí)行ocr,并且服務(wù)器設(shè)備104之一可以執(zhí)行ocr文本的至少一部分機(jī)器語言翻譯。因此,術(shù)語“計算系統(tǒng)120”可以包括一些或全部服務(wù)器設(shè)備104與移動計算設(shè)備108的任意組合。

移動計算設(shè)備108被配置為經(jīng)由網(wǎng)絡(luò)112與服務(wù)器設(shè)備104進(jìn)行通信。移動計算設(shè)備108的示例包括膝上型計算機(jī)、平板計算機(jī)、移動電話和可穿戴技術(shù),諸如整合有計算設(shè)備的智能手表、眼鏡或其它可穿戴物品。然而,應(yīng)當(dāng)意識到的是,本公開的技術(shù)能夠在具有顯示器和相機(jī)的任何計算設(shè)備(例如臺式計算機(jī))處實現(xiàn)。網(wǎng)絡(luò)112可以包括局域網(wǎng)(lan)、廣域網(wǎng)(wan)—例如互聯(lián)網(wǎng),或者它們的組合。移動計算設(shè)備108能夠與用戶116相關(guān)聯(lián)。例如,用戶116可以經(jīng)由顯示器124—例如觸摸顯示器—與移動計算設(shè)備108進(jìn)行交互。

用戶116可以使用移動計算設(shè)備108與其上具有文本132的對象128進(jìn)行交互。對象128可以是適于顯示文本132的任意對象,包括但不限于文檔、標(biāo)志、廣告和菜單。例如,用戶116可以命令移動計算設(shè)備108使用與移動計算設(shè)備108相關(guān)聯(lián)的相機(jī)212和光源216(參見圖2)來捕捉對象128及其文本132的圖像。能夠?qū)λ鰣D像執(zhí)行ocr以獲得ocr文本。在獲得ocr文本之后,所述ocr文本隨后能夠從其源語言被翻譯為目標(biāo)語言,諸如用戶116所理解/講的語言。

現(xiàn)在參考圖2,圖示了示例移動計算設(shè)備108的功能框圖。移動計算設(shè)備108可以包括顯示器124、通信設(shè)備200、處理器204、存儲器208、相機(jī)212和光源216。應(yīng)當(dāng)意識到的是,移動計算設(shè)備108還可以包括其它適當(dāng)組件,諸如物理按鈕、麥克風(fēng)和揚聲器。通信設(shè)備200可以包括被配置為經(jīng)由網(wǎng)絡(luò)112而與例如服務(wù)器設(shè)備104的其它設(shè)備進(jìn)行通信的任意適當(dāng)組件(諸如收發(fā)器)。存儲器208可以是被配置為在移動計算設(shè)備108處存儲信息的任意適當(dāng)存儲介質(zhì)(閃存、硬盤等)。

處理器204能夠控制移動計算設(shè)備108的操作。處理器204所執(zhí)行的示例功能包括但并不局限于經(jīng)由通信設(shè)備200對信息的傳輸/接收進(jìn)行控制,以及對存儲器208處的讀/寫操作進(jìn)行控制。在一些實施方式中,存儲器208能夠存儲指令集合,其在被處理器204執(zhí)行時使得處理器204執(zhí)行本公開的至少一部分操作。處理器204還能夠?qū)南鄼C(jī)212所接收的信息進(jìn)行處理并且向顯示器124輸出信息。

相機(jī)212可以是被配置為捕捉對象128及其文本132的圖像的任意適當(dāng)?shù)南鄼C(jī)(電荷耦合設(shè)備(ccd)、互補金屬氧化物半導(dǎo)體(cmos)等)。光源216可以是被配置為在圖像捕捉期間提供單次閃光或多次閃光,以及改變光照強(qiáng)度和/或顏色的能力的任意適當(dāng)光源。在一種實施方式中,顯示器124是被配置為接收來自用戶116的輸入的觸摸顯示器。處理器204還能夠被配置為執(zhí)行本公開的至少一部分技術(shù),現(xiàn)在對其進(jìn)行更為詳細(xì)地討論。

處理器204能夠從相機(jī)212接收對象128及其文本132的圖像。所述圖像能夠通過用戶116將相機(jī)212進(jìn)行定位并且提供用于捕捉圖像的輸入而由相機(jī)212所捕捉,上述輸入可以包括激活光源216。激活/控制光源216的示例可以包括但并不局限于調(diào)節(jié)光源216的閃光量/數(shù)目(單次閃光或多次閃光),光源216所輸出光照的強(qiáng)度或亮度,以及光源216所輸出光照的顏色。所述光源控制能夠結(jié)合相機(jī)控制來執(zhí)行,由此提供了質(zhì)量有所變化的圖像捕捉。

雖然本公開的技術(shù)可能僅由移動計算設(shè)備108來實現(xiàn),但是所述技術(shù)現(xiàn)在將關(guān)于計算系統(tǒng)120更為詳細(xì)地進(jìn)行討論。計算系統(tǒng)120最初能夠接收具有文本132的對象128的第一圖像。所述第一圖像可以由移動計算設(shè)備108的相機(jī)212來捕捉,但是能夠使用與計算系統(tǒng)120相關(guān)聯(lián)的另一個相機(jī)。如本文中所討論的每個所捕捉圖像能夠包括單個圖像或者不同質(zhì)量的多個圖像。例如,每個捕捉圖像能夠包括低質(zhì)量和高質(zhì)量圖像。在可能時能夠使用低質(zhì)量圖像以節(jié)約處理吞吐量和/或網(wǎng)絡(luò)帶寬,并且在低質(zhì)量圖像對于本公開的技術(shù)而言并不充分時(例如,無法獲得ocr文本)能夠使用高質(zhì)量圖像。計算系統(tǒng)120能夠?qū)Φ谝粓D像執(zhí)行ocr以獲得ocr文本,所述ocr文本是文本132的第一機(jī)器編碼表示。所述ocr操作可以本地執(zhí)行、(在服務(wù)器設(shè)備104處)遠(yuǎn)程執(zhí)行,或者它們的組合,并且所述ocr操作能夠響應(yīng)于接收到第一圖像或者響應(yīng)于用戶116的請求而自動執(zhí)行。一個示例請求是將對象128上的文本132從其源語言翻譯為目標(biāo)語言。根據(jù)第一圖像的質(zhì)量,ocr文本可能包含錯誤并且因此可能不同于文本132。

計算系統(tǒng)120能夠獲得作為從ocr文本從源語言到目標(biāo)語言的翻譯的第一翻譯ocr文本。所述機(jī)器語言翻譯本地執(zhí)行、(在服務(wù)器設(shè)備104處)遠(yuǎn)程執(zhí)行,或者它們的組合,并且可以響應(yīng)于獲得ocr文本而自動執(zhí)行。所述第一翻譯ocr文本還可以具有與之相關(guān)聯(lián)的翻譯分?jǐn)?shù),其能夠表示所述第一翻譯ocr文本是ocr文本到目標(biāo)語言的適當(dāng)翻譯的可能性程度。例如,在機(jī)器元翻譯期間,可能有多個可能的第一翻譯ocr文本,并且可以選擇具有最高的相對翻譯分?jǐn)?shù)的一個。僅作為示例,對于可能地第一翻譯ocr文本“friend”和“frend”而言,可能的第一ocr文本“friend”能夠由于其具有從英語到諸如法語(“ami”)的另一種語言的較高相對翻譯分?jǐn)?shù)而被選擇。當(dāng)ocr文本包含錯誤時,所述翻譯分?jǐn)?shù)可能相對低。因此,計算系統(tǒng)120能夠?qū)⒎g分?jǐn)?shù)與指示可接受的可能性程度的翻譯分?jǐn)?shù)閾值進(jìn)行比較。雖然總體上對翻譯分?jǐn)?shù)進(jìn)行了討論,但是可能存在針對每個單詞的翻譯分?jǐn)?shù)以及針對整個短語分塊的翻譯分?jǐn)?shù)。本公開的技術(shù)能夠利用單詞翻譯分?jǐn)?shù)、短語分塊翻譯分?jǐn)?shù),或者它們的組合。

當(dāng)翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,計算系統(tǒng)120能夠獲得修改ocr文本。在一些實施方式中,計算系統(tǒng)120能夠通過選擇來自初始o(jì)cr操作的另一個可能ocr文本而獲得修改ocr文本。更具體地,在初始o(jì)cr操作期間,計算系統(tǒng)120可能已經(jīng)獲得了可能ocr文本的集合,每個可能ocr文本具有指示所述可能ocr文本為文本的可能性程度的相對應(yīng)ocr分?jǐn)?shù)。為了獲得ocr文本,計算系統(tǒng)120可能已經(jīng)選擇了具有相對于其它可能ocr文本的ocr分?jǐn)?shù)的最高相對應(yīng)ocr分?jǐn)?shù)的可能ocr文本。當(dāng)翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,計算系統(tǒng)120能夠選擇另一個可能ocr文本以獲得修改ocr文本。在一些實施方式中,所述修改ocr文本具有相對于其它可能ocr文本的ocr分?jǐn)?shù)的第二高相對應(yīng)ocr分?jǐn)?shù)。應(yīng)當(dāng)意識到的是,還能夠基于其它反饋、其它可能的第一翻譯ocr文本的這樣的翻譯分?jǐn)?shù)而獲得修改ocr文本。雖然總體上討論了ocr分?jǐn)?shù),但是可以存在針對單個字符的ocr分?jǐn)?shù)以及針對整個單詞的ocr分?jǐn)?shù)。本公開的技術(shù)能夠利用字符ocr分?jǐn)?shù)、單詞ocr分?jǐn)?shù),或者它們的一些組合。

還能夠通過向用戶116提供與如何捕捉附加圖像有關(guān)的反饋而獲得經(jīng)修改ocr文本。所述反饋也被稱作用戶指令,并且能夠諸如經(jīng)由移動計算設(shè)備108的顯示器124而包括視覺信息(文本、圖像,或者它們的組合),和/或包括音頻信息。示例用戶指令可以包括對象128中用于捕捉附加圖像或其它指示性指示符的區(qū)域,以及所要捕捉的多個附加圖像。在一些實施方式中,計算系統(tǒng)120能夠識別第一圖像中使得ocr文本不正確的部分,并且所述用戶指令是關(guān)于第一圖像中的所識別部分來捕捉第二圖像集合。由于人經(jīng)常能夠確定哪個區(qū)域可能以低質(zhì)量被捕捉并且因此在ocr文本中導(dǎo)致錯誤,所以所述用戶指令可能不需要是過于具體的(例如,重新捕捉右上角)。在一些實施方式中,用戶116能夠提供指示第一圖像中他/她認(rèn)為具有低質(zhì)量的部分的輸入(例如,在顯示器124上敲擊),這能夠被計算系統(tǒng)120在做出其確定時被使用。

除了用戶指令之外,計算系統(tǒng)120能夠可選地調(diào)節(jié)與相機(jī)相關(guān)聯(lián)的光源的激活/控制,上述光源諸如與移動計算設(shè)備108的相機(jī)212相關(guān)聯(lián)的光源216。光源控制的示例包括調(diào)節(jié)光源強(qiáng)度或亮度,調(diào)節(jié)光源閃光數(shù)目(單次閃光、雙次閃光、三次閃光),以及調(diào)節(jié)光源顏色。一種具體的示例光源控制是在圖像捕捉周期的期間從無強(qiáng)度或低強(qiáng)度逐漸增大至高強(qiáng)度。在用戶定位和可選的光源激活控制期間,計算系統(tǒng)120能夠接收第二圖像集合。所述第二圖像集合可以包括對象128及其文本132的至少一部分的一個或多個圖像。在一些實施方式中,相機(jī)(例如,相機(jī)212)能夠在用戶116將其進(jìn)行定位以獲得第二圖像集合時捕捉多個圖像,并且所述第二圖像集合中的一些圖像可以具有相同的定位但照明有所不同。用戶指令能夠在第一圖像被捕捉之后且用戶116不再捕捉圖像之后被提供(事實之后),或者在用戶116仍然在捕捉圖像(例如,使用相機(jī)212)時實時地被提供。

在一些實施方式中,響應(yīng)于接收到第二圖像集合,計算系統(tǒng)120能夠?qū)⒌谝粓D像以及第二圖像集合中的至少兩個的部分進(jìn)行組合或者“縫合在一起”以獲得組合圖像。例如,第一圖像可以具有非常低的質(zhì)量,并且計算系統(tǒng)120可以對第二圖像集合中的兩個或更多的部分進(jìn)行組合從而獲得具有比第一圖像質(zhì)量更高質(zhì)量的組合圖像。替選地,例如,第一圖像中可能僅有一部分具有低質(zhì)量,并且因此計算系統(tǒng)120可以將第一圖像中較高質(zhì)量的部分與第二圖像集合中的一個或多個的部分進(jìn)行組合從而獲得具有比第一圖像更高的整體質(zhì)量的組合圖像。在這樣的情況下,計算系統(tǒng)120能夠?qū)λ鼋M合圖像執(zhí)行ocr從而獲得修改ocr文本。替選地,計算系統(tǒng)120能夠?qū)Φ诙D像集合之一執(zhí)行ocr以獲得修改ocr文本。

計算系統(tǒng)120能夠獲得作為修改ocr文本從源語言到目標(biāo)語言的翻譯的第二翻譯ocr文本。類似于上文,所述機(jī)器語言翻譯能夠本地執(zhí)行、(在服務(wù)器設(shè)備104處)遠(yuǎn)程執(zhí)行,或者它們的組合,并且可以響應(yīng)于獲得修改ocr文本而自動執(zhí)行。第二翻譯ocr文本也能夠具有與之相關(guān)聯(lián)的翻譯分?jǐn)?shù),其能夠表示第二翻譯ocr文本是修改ocr文本到目標(biāo)語言的適當(dāng)翻譯的可能性程度。計算系統(tǒng)120隨后能夠諸如在顯示器124處為用戶116輸出第二翻譯ocr文本。在一些實施方式中,計算系統(tǒng)120能夠?qū)⒌诙gocr文本的翻譯分?jǐn)?shù)與翻譯分?jǐn)?shù)閾值進(jìn)行比較。當(dāng)所述翻譯分?jǐn)?shù)仍然低于翻譯分?jǐn)?shù)閾值時,如以上所討論的,所述過程能夠被重復(fù)并且能夠獲得另一個修改ocr文本。在這樣的情況下,一旦翻譯ocr文本的翻譯分?jǐn)?shù)最終達(dá)到或超過了翻譯分?jǐn)?shù)閾值,則翻譯ocr文本能夠被輸出給用戶116。

現(xiàn)在參考圖3,圖示了用于用戶圖像捕捉反饋以便進(jìn)行改良的機(jī)器語言翻譯的示例技術(shù)300的流程圖。在304,計算系統(tǒng)120能夠接收包括源語言的文本132的對象128的第一圖像。在一些實施方式中,所述第一圖像由與計算系統(tǒng)120進(jìn)行通信的相機(jī)所捕捉,諸如移動計算設(shè)備108的相機(jī)212。在308,計算系統(tǒng)120能夠?qū)λ龅谝粓D像執(zhí)行ocr以獲得ocr文本,其是文本132的機(jī)器編碼文本表示。在一些實施方式中,所述ocr在移動計算設(shè)備108處本地執(zhí)行。

在312,計算系統(tǒng)120能夠獲得第一翻譯ocr文本和翻譯分?jǐn)?shù),后者指示所述第一翻譯ocr文本是所述ocr文本到目標(biāo)語言的適當(dāng)翻譯的可能性程度。所述翻譯能夠在服務(wù)器設(shè)備104之一執(zhí)行,在計算設(shè)備108或者它們的一些組合處執(zhí)行。在316,計算系統(tǒng)120能夠?qū)⒎g分?jǐn)?shù)與翻譯分?jǐn)?shù)閾值進(jìn)行比較,后者指示第一翻譯ocr文本是ocr文本到目標(biāo)語言的適當(dāng)翻譯的可接受的可能性程度。當(dāng)翻譯分?jǐn)?shù)大于或等于翻譯分?jǐn)?shù)閾值時,技術(shù)300能夠繼續(xù)進(jìn)行至340。

當(dāng)翻譯分?jǐn)?shù)低于翻譯分?jǐn)?shù)閾值時,技術(shù)300能夠繼續(xù)進(jìn)行至320。在320,計算系統(tǒng)120能夠輸出用戶指令以使用與計算系統(tǒng)120相關(guān)聯(lián)的相機(jī)來捕捉對象128的至少一部分的第二圖像集合,上述相機(jī)諸如移動計算設(shè)備108的相機(jī)212。在324,計算系統(tǒng)120能夠可選地調(diào)節(jié)與相機(jī)相關(guān)聯(lián)的光源的閃光量/數(shù)目和/或強(qiáng)度,上述光源諸如與移動計算設(shè)備108的相機(jī)212相關(guān)聯(lián)的光源216。這可以有助于改善第二圖像集合的質(zhì)量,這會使得ocr和機(jī)器語言翻譯的準(zhǔn)確性有所提高。在328,計算系統(tǒng)120能夠接收第二圖像集合。

在332,計算系統(tǒng)120能夠?qū)Φ诙D像集合中的至少一個圖像執(zhí)行ocr以獲得修改ocr文本,其是文本132的另一種機(jī)器編碼表示。在336,響應(yīng)于獲得修改ocr文本,計算系統(tǒng)120能夠獲得第二翻譯ocr文本,其表示所述修改ocr文本從源語言到目標(biāo)語言的翻譯。在一些實施方式中,第二翻譯ocr文本的翻譯分?jǐn)?shù)可能低于翻譯分?jǐn)?shù)閾值,并且技術(shù)300能夠返回至320。在34036,計算系統(tǒng)120能夠根據(jù)技術(shù)300中去往340的路徑而輸出第一或第二翻譯ocr文本。技術(shù)300隨后能夠結(jié)束并返回至304。

示例實施例被提供而使得本公開將是全面的,并且將向本領(lǐng)域人員完全傳達(dá)所述范圍。給出例如諸如具體組件、設(shè)備和方法的示例的許多具體細(xì)節(jié)從而提供對本公開實施例的全面理解。對于本領(lǐng)域技術(shù)人員將會顯而易見的是,具體細(xì)節(jié)并非需要被采用,示例實施例可以以許多不同形式來體現(xiàn),并且它們都不應(yīng)當(dāng)被理解為對本公開的范圍有所限制。在一些示例實施例中,并未對公知過程、公知設(shè)備結(jié)構(gòu)以及公知技術(shù)進(jìn)行詳細(xì)描述。

本文中所使用的術(shù)語僅是為了描述特定示例實施例而并非意在作為限制。如本文中所使用的,除非上下文明確另外指出,否則單數(shù)形式“一個”(“a”、“an”和“the”)意在也包括復(fù)數(shù)形式。術(shù)語“和/或”包含一個或多個相關(guān)聯(lián)的列舉項的任意且所有的可能組合。術(shù)語“包括”、“包括了”、“包含”和“具有”是包含性的,并且因此指定存在所提到的特征、整數(shù)、步驟、操作、元素和/或組件,但是并不排除存在或添加一個或多個其它特征、整數(shù)、步驟、操作、元素、組件和/或其群組。除非特別標(biāo)示為執(zhí)行的順序,否則本文中所描述的方法步驟、過程和操作并非要被理解為必要要求它們以所討論或圖示的特定順序來執(zhí)行。還要理解的是,可以采用附加或替選的步驟。

雖然術(shù)語第一、第二、第三等在本文中可以被用來描述各種元素、組件、區(qū)域、分層和/或分區(qū),但是這些元素、組件、區(qū)域、分層和/或分區(qū)并不應(yīng)當(dāng)被這些術(shù)語所限制。這些術(shù)語可以僅被用來將一個元素、組件、區(qū)域、分層或分區(qū)與另一個區(qū)域、分層或分區(qū)加以區(qū)分。當(dāng)在本文中被使用時,除非上下文明確有所指示,否則諸如“第一”、“第二”的術(shù)語以及其它數(shù)字術(shù)語并非暗示一種次序或順序。因此,以下所討論的第一元素、組件、區(qū)域、分層或分區(qū)可以被稱作第二元素、組件、區(qū)域、分層或分區(qū)而并不背離示例實施例的教導(dǎo)。

如本文中所使用的,術(shù)語模塊可以指代、作為其一部分或者包括:專用集成電路(asic);電子電路;組合邏輯電路;現(xiàn)場可編程門陣列(fpga);執(zhí)行代碼或過程的處理器或處理器的分布網(wǎng)絡(luò)(共享、專用或分組)以及聯(lián)網(wǎng)集群中的存儲或數(shù)據(jù)中心;提供所描述功能的其它適當(dāng)組件;或者以上的一些或全部的組合,諸如在片上系統(tǒng)中。術(shù)語模塊還可以包括存儲由一個或多個處理器所執(zhí)行的代碼的存儲器(共享、專用或分組)。

如以上所使用的,術(shù)語代碼可以包括軟件、固件和/或微代碼,并且可以是指程序、例程、函數(shù)、類和/或?qū)ο?。如以上所使用的,術(shù)語共享意味著來自多個模塊的一些或所有代碼可以使用單個(共享)處理器來執(zhí)行。此外,來自多個模塊的一些或所有代碼可以由單個(共享)存儲器進(jìn)行存儲。如以上所使用的,術(shù)語群組意味著來自單個模塊的一些或所有代碼可以使用處理器的群組來執(zhí)行。此外,來自單個模塊的一些或所有代碼可以使用存儲器的群組進(jìn)行存儲。

本文中所描述的技術(shù)可以由一個或多個處理器所執(zhí)行的一個或多個計算機(jī)程序來實現(xiàn)。計算機(jī)程序包括存儲在非暫時性的有形計算機(jī)可讀介質(zhì)上的處理器可執(zhí)行指令。計算機(jī)程序還可以包括所存儲的數(shù)據(jù)。非暫時性的有形計算機(jī)可讀介質(zhì)的非限制性示例是非易失性存儲器、磁性存儲和光學(xué)存儲。

以上描述的一些部分在算法和對信息所進(jìn)行的操作的符號表示的方面提供了本發(fā)明的特征。這些算法描述和表示是本領(lǐng)域技術(shù)人員向本領(lǐng)域的其它技術(shù)人員最為有效地傳遞其工作實質(zhì)的手段。雖然進(jìn)行了功能或邏輯地描述,但是這些操作被理解為由計算機(jī)程序來實現(xiàn)。此外,同樣已經(jīng)多次證明的是,將這些操作部署稱之為模塊或功能名稱是方便的而并不失其一般性。

除非另外特別指出為從本公開所顯而易見的,否則所要意識到的是,貫穿所述描述,利用諸如“處理”或“運算”或“計算”或“確定”或“顯示”等所進(jìn)行的討論是指計算機(jī)系統(tǒng)或類似電子計算設(shè)備的動作和處理,其對計算機(jī)系統(tǒng)存儲器或寄存器或者其它這樣的信息存儲、傳輸或顯示設(shè)備內(nèi)表示為物理(電子)量的數(shù)據(jù)進(jìn)行操控或變換。

所描述技術(shù)的某些方面包括本文中以算法形式所描述的處理步驟和指令。應(yīng)當(dāng)注意的是,本發(fā)明的處理步驟和指令能夠以軟件、固件或硬件來體現(xiàn),并且當(dāng)以軟件體現(xiàn)時其能夠被下載到實時網(wǎng)絡(luò)操作系統(tǒng)所使用的不同平臺駐留于其上并且從那里進(jìn)行操作。

本公開還涉及一種用于執(zhí)行本文中的操作的裝置。所述裝置出于所要求的目的而被特別構(gòu)造,或者其可以包括有選擇地由存儲在可由計算機(jī)訪問的計算機(jī)可讀介質(zhì)上的計算機(jī)程序所激活或重新配置的通用計算機(jī)。這樣的計算機(jī)程序可以存儲在有形計算機(jī)可讀存儲介質(zhì)中,諸如但并不局限于包括以下的軟盤類型:軟盤、光盤、cd-rom、磁光盤、只讀存儲器(rom)、隨機(jī)訪問存儲器(ram)、eprom、eeprom、磁卡或光卡、專用集成電路(asic)、或適用于存儲電子指令的任何類型的介質(zhì)、以及被耦合至計算機(jī)系統(tǒng)總線的每一個。此外,說明書中所提及的計算機(jī)可以包括單個處理器或者可以是為了計算能力有所提高而采用多處理器設(shè)計的架構(gòu)。

本文中所給出的算法和操作并非固有地涉及任意特定計算機(jī)或其它裝置。也可以隨依據(jù)本文中的教導(dǎo)的程序使用各種通用系統(tǒng),或者可以證明的是,構(gòu)建更為專用的裝置以執(zhí)行所要求的方面步驟會是便利的。針對各種這些系統(tǒng)的所要求結(jié)構(gòu)以及等價變形將從以上描述而有所顯現(xiàn)。此外,本公開并非參考任何特定編程語言進(jìn)行描述。所意識到的是,可以使用各種編程語言來實現(xiàn)如本文中所描述的本公開的教導(dǎo),并且為了公開本發(fā)明的實施例和最佳模式而提供了對具體語言的引用。

本公開適用于多種拓?fù)涞母鞣N計算機(jī)網(wǎng)絡(luò)系統(tǒng)。在所述領(lǐng)域內(nèi),大型網(wǎng)絡(luò)的配置和管理包括存儲設(shè)備和計算機(jī),它們通過諸如互聯(lián)網(wǎng)的網(wǎng)絡(luò)通信耦合至不同計算機(jī)和存儲設(shè)備。

已經(jīng)出于說明和描述的目的而提供了以上對實施例的描述。其并非意在是窮舉的或者對本發(fā)明進(jìn)行限制。特定實施例的個體元素或特征通常并不局限于所述特定實施例,而是在可應(yīng)用的情況下能夠進(jìn)行互換并且能夠在所選擇實施例中使用,即使沒有特別示出或描述。同樣還可能以許多方式進(jìn)行變化。這樣的變化并不被看作背離本發(fā)明,而且所有這樣的修改都意在包括在本發(fā)明的范圍之內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1