技術編號:12468585
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及一種光學字符識別(OCR)訓練樣本生成方法,更具體的,涉及一種快速生成OCR訓練樣本的自適應方法及系統(tǒng)。背景技術OCR(OpticalCharacterRecognition,光學字符識別)是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程?,F(xiàn)有技術中基于統(tǒng)計的機器學習方法,在OCR任務中,需要百萬量級的訓練樣本,來提取字符的有效特征,因此樣本的真實性和有效性在OCR任務中占據(jù)重要地位。在樣本生成上,國...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。