一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法

文檔序號：6640221閱讀：213來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法
【專利摘要】本發(fā)明提供一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法。其基本原理是：首先，利用深度學(xué)習(xí)技術(shù)，由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí)，建立唇形模型庫；完成唇形模型庫建立后，基于該唇形模型庫，由計算機(jī)對攝像機(jī)拍攝的目標(biāo)人員唇部圖像進(jìn)行自動分析，提取唇形的特征值，再將提取的特征值與唇形模型庫中的唇形模型進(jìn)行匹配，然后由計算機(jī)根據(jù)匹配的唇形模型對應(yīng)的文字完成文字的輸入。該技術(shù)方案為生產(chǎn)車間現(xiàn)場口頭生產(chǎn)指令的傳遞，提供了一種有效的解決方案。
【專利說明】一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人機(jī)交互【技術(shù)領(lǐng)域】，具體涉及一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法。

【背景技術(shù)】
[0002]在很多生產(chǎn)車間，生產(chǎn)環(huán)境中存在較大噪音，這嚴(yán)重的阻礙了現(xiàn)場口頭生產(chǎn)指令的下達(dá)。
[0003]為解決上述問題，本發(fā)明提供一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法，用于提升生產(chǎn)現(xiàn)場口頭生產(chǎn)指令的下達(dá)效率。

【發(fā)明內(nèi)容】

[0004]針對上述問題，本發(fā)明首先利用深度學(xué)習(xí)技術(shù)，通過深度學(xué)習(xí)方式建立唇形模型庫，再采集唇部視頻圖像并利用視頻處理技術(shù)對唇形特征值進(jìn)行自動測量、與唇形模型進(jìn)行匹配的方式，提供一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法，從而提升生產(chǎn)現(xiàn)場口頭生產(chǎn)指令的下達(dá)效率。
[0005]本發(fā)明提供的具體技術(shù)方案是:
[0006]一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法，其特征在于，該方法包括以下步驟:
[0007]唇形模型庫建立，利用深度學(xué)習(xí)技術(shù)，由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí)，建立唇形模型庫；
[0008]視頻圖像采集，通過攝像頭采集目標(biāo)人員的唇部視頻圖像；
[0009]視頻分析，由計算機(jī)根據(jù)圖像分析技術(shù)對所述唇部視頻圖像進(jìn)行分析，獲得唇形的特征值；
[0010]唇形模型匹配，將所述唇形的特征值與唇形模型庫中的唇形模型進(jìn)行匹配；
[0011]文字輸入，根據(jù)匹配的唇形模型，完成文字的輸入。
[0012]所述唇形模型庫中的每個唇形模型，分別對應(yīng)與之相應(yīng)的文字。
[0013]有益效果:本發(fā)明提供的一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法，首先利用深度學(xué)習(xí)技術(shù)，由計算機(jī)利用深度學(xué)習(xí)技術(shù)建立唇形數(shù)據(jù)庫，再由計算機(jī)對拍攝的唇部圖像進(jìn)行自動分析、提取唇形的特征值、將唇形特征值與唇形模型進(jìn)行匹配、完成文字的輸入。該技術(shù)方案為生產(chǎn)車間現(xiàn)場口頭生產(chǎn)指令的傳遞，提供了一種有效的解決方案。

【專利附圖】

【附圖說明】
[0014]圖1所示是本發(fā)明工作流程圖。

【具體實施方式】
[0015]為了更為具體地描述本發(fā)明，下面結(jié)合附圖及【具體實施方式】對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。
[0016]如圖1所示，首先，利用深度學(xué)習(xí)技術(shù)，由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí)，建立唇形模型庫；用攝像機(jī)獲取目標(biāo)人員的唇部視頻圖像，然后由計算機(jī)唇部圖像進(jìn)行自動分析，提取唇形的特征值；再由計算機(jī)將提取的唇形特征值與唇形模型庫中的唇形模型進(jìn)行匹配。在唇形模型庫中，每個唇形分別對應(yīng)有相應(yīng)的文字。找到相匹配的唇形模型后，由計算機(jī)根據(jù)匹配的唇形模型對應(yīng)的文字完成文字的輸入。
[0017]作為對本實施例的進(jìn)一步優(yōu)化，電腦輸入的文字，在車間電子顯示屏上進(jìn)行顯示，以方便現(xiàn)場人員及時獲得相關(guān)生產(chǎn)指令。
[0018]以上所述僅為本發(fā)明的較佳實施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法，其特征在于，該方法包括以下步驟: 唇形模型庫建立，利用深度學(xué)習(xí)技術(shù)，由計算機(jī)根據(jù)大量唇部圖像及輸入的對應(yīng)文字結(jié)果進(jìn)行自學(xué)習(xí)，建立唇形模型庫；視頻圖像采集，通過攝像頭采集目標(biāo)人員的唇部視頻圖像；視頻分析，由計算機(jī)根據(jù)圖像分析技術(shù)對所述唇部視頻圖像進(jìn)行分析，獲得唇形的特征值；唇形模型匹配，將所述唇形的特征值與唇形模型庫中的唇形模型進(jìn)行匹配；文字輸入，根據(jù)匹配的唇形模型，完成文字的輸入。
2.如權(quán)利要求1所述的方法，其特征在于，所述唇形模型庫中的每個唇形模型，分別對應(yīng)與之相應(yīng)的文字。
【文檔編號】G06K9/66GK104484041SQ201410829184
【公開日】2015年4月1日申請日期:2014年12月26日優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】陳擁權(quán), 李建中, 鄭榮穩(wěn) 申請人:安徽寰智信息科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳擁權(quán);李建中;鄭榮穩(wěn);
技術(shù)所有人：安徽寰智信息科技股份有限公司;
我是此專利的發(fā)明人

上一篇：容器管理方法及裝置制造方法
上一篇：一種基于視頻交互技術(shù)的科普系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于深度學(xué)習(xí)的唇形圖像識別文字輸入方法