一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法
【專利摘要】本發(fā)明提供一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法。其基本原理是:首先,利用深度學(xué)習(xí)技術(shù),由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí),建立唇形模型庫;完成唇形模型庫建立后,基于該唇形模型庫,由計算機(jī)對攝像機(jī)拍攝的目標(biāo)人員唇部圖像進(jìn)行自動分析,提取唇形的特征值,再將提取的特征值與唇形模型庫中的唇形模型進(jìn)行匹配,然后由計算機(jī)根據(jù)匹配的唇形模型對應(yīng)的文字完成文字的輸入。該技術(shù)方案為生產(chǎn)車間現(xiàn)場口頭生產(chǎn)指令的傳遞,提供了一種有效的解決方案。
【專利說明】一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人機(jī)交互【技術(shù)領(lǐng)域】,具體涉及一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法。
【背景技術(shù)】
[0002]在很多生產(chǎn)車間,生產(chǎn)環(huán)境中存在較大噪音,這嚴(yán)重的阻礙了現(xiàn)場口頭生產(chǎn)指令的下達(dá)。
[0003]為解決上述問題,本發(fā)明提供一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法,用于提升生產(chǎn)現(xiàn)場口頭生產(chǎn)指令的下達(dá)效率。
【發(fā)明內(nèi)容】
[0004]針對上述問題,本發(fā)明首先利用深度學(xué)習(xí)技術(shù),通過深度學(xué)習(xí)方式建立唇形模型庫,再采集唇部視頻圖像并利用視頻處理技術(shù)對唇形特征值進(jìn)行自動測量、與唇形模型進(jìn)行匹配的方式,提供一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法,從而提升生產(chǎn)現(xiàn)場口頭生產(chǎn)指令的下達(dá)效率。
[0005]本發(fā)明提供的具體技術(shù)方案是:
[0006]一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法,其特征在于,該方法包括以下步驟:
[0007]唇形模型庫建立,利用深度學(xué)習(xí)技術(shù),由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí),建立唇形模型庫;
[0008]視頻圖像采集,通過攝像頭采集目標(biāo)人員的唇部視頻圖像;
[0009]視頻分析,由計算機(jī)根據(jù)圖像分析技術(shù)對所述唇部視頻圖像進(jìn)行分析,獲得唇形的特征值;
[0010]唇形模型匹配,將所述唇形的特征值與唇形模型庫中的唇形模型進(jìn)行匹配;
[0011]文字輸入,根據(jù)匹配的唇形模型,完成文字的輸入。
[0012]所述唇形模型庫中的每個唇形模型,分別對應(yīng)與之相應(yīng)的文字。
[0013]有益效果:本發(fā)明提供的一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法,首先利用深度學(xué)習(xí)技術(shù),由計算機(jī)利用深度學(xué)習(xí)技術(shù)建立唇形數(shù)據(jù)庫,再由計算機(jī)對拍攝的唇部圖像進(jìn)行自動分析、提取唇形的特征值、將唇形特征值與唇形模型進(jìn)行匹配、完成文字的輸入。該技術(shù)方案為生產(chǎn)車間現(xiàn)場口頭生產(chǎn)指令的傳遞,提供了一種有效的解決方案。
【專利附圖】
【附圖說明】
[0014]圖1所示是本發(fā)明工作流程圖。
【具體實施方式】
[0015]為了更為具體地描述本發(fā)明,下面結(jié)合附圖及【具體實施方式】對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。
[0016]如圖1所示,首先,利用深度學(xué)習(xí)技術(shù),由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí),建立唇形模型庫;用攝像機(jī)獲取目標(biāo)人員的唇部視頻圖像,然后由計算機(jī)唇部圖像進(jìn)行自動分析,提取唇形的特征值;再由計算機(jī)將提取的唇形特征值與唇形模型庫中的唇形模型進(jìn)行匹配。在唇形模型庫中,每個唇形分別對應(yīng)有相應(yīng)的文字。找到相匹配的唇形模型后,由計算機(jī)根據(jù)匹配的唇形模型對應(yīng)的文字完成文字的輸入。
[0017]作為對本實施例的進(jìn)一步優(yōu)化,電腦輸入的文字,在車間電子顯示屏上進(jìn)行顯示,以方便現(xiàn)場人員及時獲得相關(guān)生產(chǎn)指令。
[0018]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法,其特征在于,該方法包括以下步驟: 唇形模型庫建立,利用深度學(xué)習(xí)技術(shù),由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí),建立唇形模型庫; 視頻圖像采集,通過攝像頭采集目標(biāo)人員的唇部視頻圖像; 視頻分析,由計算機(jī)根據(jù)圖像分析技術(shù)對所述唇部視頻圖像進(jìn)行分析,獲得唇形的特征值; 唇形模型匹配,將所述唇形的特征值與唇形模型庫中的唇形模型進(jìn)行匹配; 文字輸入,根據(jù)匹配的唇形模型,完成文字的輸入。
2.如權(quán)利要求1所述的方法,其特征在于,所述唇形模型庫中的每個唇形模型,分別對應(yīng)與之相應(yīng)的文字。
【文檔編號】G06K9/66GK104484041SQ201410829184
【公開日】2015年4月1日 申請日期:2014年12月26日 優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】陳擁權(quán), 李建中, 鄭榮穩(wěn) 申請人:安徽寰智信息科技股份有限公司