一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法

文檔序號(hào)：6638408閱讀：296來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法
【專利摘要】本發(fā)明提出一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，所述方法包括以下步驟：采集手語者的動(dòng)作視頻；在前景圖像中提取膚色塊；計(jì)算提取到的膚色塊的深度信息，并根據(jù)膚色塊的深度信息對(duì)臉部區(qū)域進(jìn)行定位；根據(jù)膚色塊的深度信息對(duì)手部進(jìn)行定位并提取關(guān)鍵幀并修補(bǔ)填充膚色塊；提取關(guān)鍵幀的一種或多種手型特征；根據(jù)提取的手型特征，使用單個(gè)分類器進(jìn)行分類或者使用多個(gè)分類器進(jìn)行投票表決，得到靜態(tài)手勢(shì)識(shí)別結(jié)果；對(duì)手勢(shì)的運(yùn)動(dòng)軌跡進(jìn)行識(shí)別，得到軌跡識(shí)別結(jié)果；對(duì)靜態(tài)手勢(shì)識(shí)別結(jié)果和軌跡識(shí)別結(jié)果進(jìn)行糾錯(cuò)與拼接，得到手語的識(shí)別翻譯結(jié)果。本發(fā)明具有識(shí)別率高、實(shí)時(shí)性強(qiáng)的優(yōu)點(diǎn)。
【專利說明】一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理、模式識(shí)別領(lǐng)域，更具體地，涉及一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法。

【背景技術(shù)】
[0002] 在日常生活中，打手勢(shì)、做手語是一種重要的交流方式。對(duì)于聾啞人們來說，手語更是必不可少。然而多數(shù)人對(duì)手語并不夠了解，所以為了讓人們能夠看懂手語，手語識(shí)別的研宄也隨之展開。最開始出現(xiàn)的手語翻譯系統(tǒng)是基于數(shù)據(jù)手套的，識(shí)別效果比較可觀，但造價(jià)昂貴，也不利于攜帶。人們便逐漸聚焦在基于視覺的手語翻譯系統(tǒng)的研宄中，但卻也面臨著系統(tǒng)識(shí)別率低、實(shí)時(shí)性差額、不便于攜帶和系統(tǒng)成本較高等問題，對(duì)手語翻譯系統(tǒng)的普及造成很大的困難。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明克服上述現(xiàn)有技術(shù)所述的系統(tǒng)識(shí)別率低、實(shí)時(shí)性差額、不便于攜帶和系統(tǒng) 成本較高的缺陷，提供一種識(shí)別率高、實(shí)時(shí)性強(qiáng)的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法。
[0004] 為解決上述技術(shù)問題，本發(fā)明的技術(shù)方案如下：
[0005] 一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，所述方法包括以下步驟：
[0006] Sl :采集手語者的動(dòng)作視頻，對(duì)視頻流建立背景，當(dāng)前幀與背景作差得到前景圖像；
[0007] S2 :在前景圖像中提取膚色塊；
[0008] S3:計(jì)算提取到的膚色塊的深度信息，并根據(jù)膚色塊的深度信息對(duì)臉部區(qū)域進(jìn)行定位；
[0009] S4 :根據(jù)膚色塊的深度信息對(duì)手部進(jìn)行定位并提取關(guān)鍵幀，并對(duì)關(guān)鍵幀的手部區(qū) 域膚色塊進(jìn)行修補(bǔ)填充，所述關(guān)鍵幀為手部在一個(gè)區(qū)域內(nèi)停留達(dá)到預(yù)設(shè)幀數(shù)的幀；
[0010] S5 :提取關(guān)鍵幀的一種或多種手型特征；
[0011] S6:根據(jù)提取的手型特征，使用單個(gè)分類器進(jìn)行分類或者使用多個(gè)分類器進(jìn)行投票表決，得到靜態(tài)手勢(shì)識(shí)別結(jié)果；
[0012] S7 :對(duì)手勢(shì)的運(yùn)動(dòng)軌跡進(jìn)行識(shí)別，得到軌跡識(shí)別結(jié)果；
[0013] S8:對(duì)靜態(tài)手勢(shì)識(shí)別結(jié)果和軌跡識(shí)別結(jié)果進(jìn)行糾錯(cuò)與拼接，得到手語的識(shí)別翻譯結(jié)果。
[0014] 在一種優(yōu)選的方案中，所述方法還包括：步驟Sl中，使用2個(gè)攝像頭同時(shí)采集手語者的動(dòng)作視頻，首先調(diào)整攝像頭使2個(gè)攝像頭水平，然后分別對(duì)2個(gè)攝像頭采集的視頻流建立背景，選取某一幀圖像作為初始的背景，當(dāng)前幀與背景作差得到前景圖像，使用均值漂移的方法對(duì)背景進(jìn)行更新。
[0015] 在一種優(yōu)選的方案中，所述方法還包括：步驟S2中，使用高斯膚色模型在前景圖像中提取膚色塊。
[0016] 在一種優(yōu)選的方案中，所述方法還包括：步驟S3中，2個(gè)攝像頭采集到的膚色塊的重心點(diǎn)相互對(duì)應(yīng)，計(jì)算這些相互對(duì)應(yīng)的重心點(diǎn)之間的歐氏距離，即可得到這些膚色塊的深度信息；
[0017] 相對(duì)應(yīng)的膚色塊的重心點(diǎn)距離越大，則該膚色塊離攝像頭越近，在準(zhǔn)備階段，臉部和手部與攝像頭的距離一樣，而使用者背后的膚色物體的深度信息明顯與臉部區(qū)域的不同，再根據(jù)雙手和臉部區(qū)域的相對(duì)位置，即可對(duì)臉部區(qū)域進(jìn)行定位。
[0018] 在一種優(yōu)選的方案中，所述方法還包括：步驟S4中，在做手語手勢(shì)時(shí)，離攝像頭最近的運(yùn)動(dòng)膚色塊為手部，而遠(yuǎn)的運(yùn)動(dòng)膚色塊為臉部或其他運(yùn)動(dòng)的膚色物體，根據(jù)這一特性對(duì)手部進(jìn)行定位，然后提取關(guān)鍵幀，并利用感知器算法對(duì)手部膚色塊進(jìn)行修補(bǔ)填充，所述關(guān) 鍵幀為手部在一個(gè)區(qū)域內(nèi)停留達(dá)到預(yù)設(shè)幀數(shù)的幀。
[0019] 在一種優(yōu)選的方案中，所述方法還包括：步驟S5中，提取關(guān)鍵幀的歸一化傅里葉描述子、手型骨架和指尖數(shù)目的特征，具體方法為：
[0020] 首先提取手型骨架特征：將手勢(shì)圖像用最小的矩形包圍住，把該矩形四等分，計(jì)算出各塊圖像的重心點(diǎn)，將四個(gè)重心點(diǎn)連接成一個(gè)四邊形，計(jì)算出該四邊形的各邊長、對(duì)角線長、矩形度、角度共同作為手型骨架的特征；
[0021] 然后提取歸一化傅里葉描述子特征；
[0022] 最后提取指尖數(shù)目特征，計(jì)算手勢(shì)輪廓的曲率，若某段輪廓的曲率大于預(yù)設(shè)的閾值則該段為指尖，判斷出該手勢(shì)伸出了多少根手指，即為指尖數(shù)目特征。
[0023] 在一種優(yōu)選的方案中，步驟S6中，投票表決的方法如下：
[0024] 先對(duì)每個(gè)分類器所能投的票數(shù)進(jìn)行初始化；統(tǒng)計(jì)各個(gè)先前訓(xùn)練好的分類器的識(shí)別結(jié)果，采用獎(jiǎng)懲方式調(diào)整各分類器所能投出的票數(shù)；根據(jù)各分類器所能投的票數(shù)，按手勢(shì)特征與分類器各類的相似程度進(jìn)行分散投票，最相似者票數(shù)最多，票數(shù)最多的一類作為為識(shí) 別結(jié)果。
[0025] 在一種優(yōu)選的方案中，步驟S7中，采用分層的軌跡識(shí)別方法對(duì)手勢(shì)的運(yùn)動(dòng)軌跡進(jìn) 行識(shí)別，其具體方法包括以下步驟：
[0026] (1)先進(jìn)行第一層的軌跡識(shí)別，以兩個(gè)關(guān)鍵幀之間的軌跡點(diǎn)坐標(biāo)，使用Freeman鏈碼對(duì)這些軌跡點(diǎn)進(jìn)行編碼，使其連成一個(gè)鏈碼序列用于短軌跡的識(shí)別；
[0027] (2)將軌跡點(diǎn)數(shù)分成4、8、12、16個(gè)點(diǎn)四種，對(duì)于實(shí)際的短軌跡段的長度則按這四種情況進(jìn)行軌跡點(diǎn)數(shù)的調(diào)整，即根據(jù)各坐標(biāo)點(diǎn)的間距，進(jìn)行補(bǔ)點(diǎn)或刪點(diǎn)，使長度達(dá)到四種點(diǎn)數(shù)的其中一種；
[0028] (3)設(shè)定多種基本情況的短軌跡類型，如向左、向上、向坐上等類型，使這些短軌跡能組成各種各樣的長軌跡，并根據(jù)短軌跡首末坐標(biāo)點(diǎn)進(jìn)行軌跡的移動(dòng)方向的分類；
[0029] (4)根據(jù)短軌跡的長度，將目標(biāo)短軌跡與事先訓(xùn)練好的有可能與之相匹配的短軌跡類型使用簡單的歐氏距離公式計(jì)算相似度，以完成短軌跡識(shí)別，得到短軌跡的識(shí)別結(jié)果編號(hào)，因?yàn)槎誊壽E的軌跡點(diǎn)少，所以短軌跡并不需要事先訓(xùn)練，只需要按Freeman鏈碼所設(shè) 定的方向編號(hào)自行設(shè)定短軌跡的類型即可；
[0030] (5)計(jì)算出短軌跡的長度，并將其起始點(diǎn)、終點(diǎn)的坐標(biāo)和短軌跡的長度保存下來；
[0031] (6)進(jìn)行第二層的長軌跡處理，將各個(gè)短軌跡的識(shí)別結(jié)果進(jìn)行續(xù)接排列起來作為 HMM的觀察序列O ;
[0032] (7)使用Viterbi算法對(duì)長軌跡進(jìn)行識(shí)別，將采集到的觀察序列O輸入到Viterbi 函數(shù)中，利用Viterbi算法計(jì)算出觀察序列O在各個(gè)事先訓(xùn)練好的長軌跡模型λ下的概率 P (〇 I λ )，并重復(fù)迭代直至收斂，將最接近的模型對(duì)應(yīng)的軌跡作為識(shí)別結(jié)果。
[0033] 在一種優(yōu)選的方案中，步驟S8中，首先使用Bigram(二元文法）模型對(duì)詞根序列進(jìn)行第一層糾錯(cuò)，然后使用Trie (字典樹）索引樹進(jìn)行第二層的糾錯(cuò)處理。
[0034] 與現(xiàn)有技術(shù)相比，本發(fā)明技術(shù)方案的有益效果是：本發(fā)明基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，采用達(dá)芬奇技術(shù)實(shí)現(xiàn)手語識(shí)別翻譯，達(dá)芬奇技術(shù)相比傳統(tǒng)的數(shù)據(jù)手套具有便于攜帶、低成本的優(yōu)點(diǎn)；本發(fā)明通過對(duì)深度信息的提取實(shí)現(xiàn)手部和臉部的定位，運(yùn)算量更少，定位更加快捷準(zhǔn)確；本發(fā)明使用感知器算法對(duì)手部膚色塊進(jìn)行修補(bǔ)填充，削弱了光照對(duì) 手部膚色提取的影響，使膚色提取更完整；本發(fā)明使用傅里葉描述子分類器、手型骨架分類器和指尖數(shù)目分類器進(jìn)行投票表決，將三個(gè)分類器組合起來共同對(duì)靜態(tài)手勢(shì)進(jìn)行識(shí)別的方法使得靜態(tài)手勢(shì)識(shí)別率大大提高；本發(fā)明使用Bigram模型和trie索引樹對(duì)詞根進(jìn)行雙層糾錯(cuò)處理，提高句子識(shí)別的正確率。

【專利附圖】

【附圖說明】
[0035] 圖1為本發(fā)明的硬件結(jié)構(gòu)圖。
[0036] 圖2為本發(fā)明的DM6446處理器的功能圖。
[0037] 圖3為本發(fā)明的方法原理圖。
[0038] 圖4為本發(fā)明的膚色塊（手部+臉部）提取的結(jié)果示例圖。
[0039] 圖5為本發(fā)明的膚色塊（手部）提取的結(jié)果示例圖。
[0040] 圖6為本發(fā)明的感知器膚色填充的結(jié)果示例圖。
[0041] 圖7為本發(fā)明的種子填充尋找最大連通域的結(jié)果示例圖。
[0042] 圖8為本發(fā)明的手型骨架特征提取的結(jié)果示例圖。
[0043] 圖9為本發(fā)明的輪廓檢測的結(jié)果示例圖。
[0044] 圖10為本發(fā)明的指尖數(shù)目特征提取的結(jié)果示例圖。
[0045] 圖11為本發(fā)明的軌跡識(shí)別算法對(duì)部分軌跡進(jìn)行統(tǒng)計(jì)識(shí)別率的檢測圖。

【具體實(shí)施方式】
[0046] 附圖僅用于示例性說明，不能理解為對(duì)本專利的限制；
[0047] 對(duì)于本領(lǐng)域技術(shù)人員來說，附圖中某些公知結(jié)構(gòu)及其說明可能省略是可以理解的。
[0048] 下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的說明。
[0049] 實(shí)施例1
[0050] 一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，所述達(dá)芬奇技術(shù)由達(dá)芬奇處理器、達(dá) 芬奇軟件、達(dá)芬奇開發(fā)工具和達(dá)芬奇技術(shù)支持系統(tǒng)等組件優(yōu)化構(gòu)成。
[0051] 如圖1所示，達(dá)芬奇處理器采用DM6446處理器，DM6446處理器就是一款利用達(dá)芬奇技術(shù)面向視頻和圖像處理的多功能高速芯片，具有高性能、低功耗、低成本等優(yōu)點(diǎn)，采用 ARM子系統(tǒng)+DSP子系統(tǒng)雙核架構(gòu)開放架構(gòu)，其中ARM子系統(tǒng)采用ARM926E-J內(nèi)核，工作主頻為297MHz，DSP子系統(tǒng)采用C64x+內(nèi)核并攜帶視頻加速器，工作主頻為594MHz。DM6446處理器還包括VPSS(視頻處理子系統(tǒng)）和外圍設(shè)備，VPSS輸入攝像頭采集的視頻圖像，輸出視頻圖像到顯示屏；外圍設(shè)備包括DDR SDRAM和SD卡；ARM子系統(tǒng)、DSP子系統(tǒng)、VPSS和外圍設(shè)備之間通過交換中央資源（SCR)進(jìn)行通信。
[0052] 如圖2所示，達(dá)芬奇軟件的框架共分為應(yīng)用層、信號(hào)處理層和I/O層三部分，其中信號(hào)處理層運(yùn)行在DSP端，實(shí)現(xiàn)接收雙攝像頭輸入的手語視頻、靜態(tài)手勢(shì)識(shí)別、軌跡識(shí)別以及詞根的糾錯(cuò)和拼接；而應(yīng)用層則運(yùn)行在ARM端，實(shí)現(xiàn)OSD圖像疊加、添加字幕。
[0053] 如圖3所示，所述手語識(shí)別翻譯方法包括以下步驟：
[0054] Sl:采用2個(gè)攝像頭分別采集手語者的動(dòng)作視頻，對(duì)視頻流建立背景，當(dāng)前幀與背景作差得到前景圖像。
[0055] 調(diào)整攝像頭位置：將兩型號(hào)相同的電視線為420的CXD攝像頭大致平行放在一起，連接好各攝像頭與DM6446之間的視頻輸入線。分別截取輸入到DM6446中的兩個(gè)視頻流中的同一幀圖像，忽略輸入視頻流中的Cb和Cr部分的數(shù)據(jù)，取一個(gè)較大的值，將視頻圖像閾值化。尋找一塊特征較明顯的像素塊，如一些角點(diǎn)。通過對(duì)這些像素塊的定位，對(duì)兩個(gè)攝像頭進(jìn)行位置的調(diào)整，使之接近完全平行，后將其相互固定下來，以后便可直接使用。其目的在于對(duì)于平行的攝像頭，在做深度圖像生成時(shí)只需要對(duì)目標(biāo)點(diǎn)進(jìn)行左右搜索即可，可減少運(yùn)算量、提高運(yùn)算速度。對(duì)于使用雙目攝像機(jī)的可省略此步，直接放平攝像機(jī)即可。
[0056] 在調(diào)整好攝像頭后，分別對(duì)兩個(gè)攝像頭傳到DM6446中的視頻流建立背景，為保留一定的緩沖時(shí)間，可將在第6幀的圖像存下作為背景圖像。而后，用當(dāng)前幀與背景的差值便可得到前景圖像，將判定為前景的部分用mask(x，y)表示，將dst(x，y)表示累計(jì)得到的背景圖像，src (X，y)表示當(dāng)前圖像，用常數(shù)a表示漂移程度，使用均值漂移的方法對(duì)背景進(jìn)行更新，在一定程度上減少光照影響，公式如下：
[0057] dst (x, y) = (l~a) · dst (x, y) +a · src (x, y) ifmask (x, y)辛 0
[0058] S2 :使用高斯膚色模型在前景圖像中提取膚色塊；
[0059] 在檢測到的運(yùn)動(dòng)前景的區(qū)域內(nèi)，使用高斯膚色模型進(jìn)行膚色的提取，提取運(yùn)動(dòng)膚色結(jié)果如圖4-5所示。而后面所要用到的頭部位置和手部位置則將會(huì)在這些膚色塊的某一部分中。
[0060] S3:計(jì)算提取到的膚色塊的深度信息，并根據(jù)膚色塊的深度信息對(duì)臉部區(qū)域進(jìn)行定位；
[0061] 計(jì)算面積較大或面積小但有多塊聚集在一起的膚色塊各自的重心點(diǎn)。因?yàn)閮蓚€(gè)攝像頭所拍攝的景物一致，光照相同，且使用的算法也一樣，所以得到的這些膚色塊重心點(diǎn)也各自相互對(duì)應(yīng)。由此，通過計(jì)算這些對(duì)應(yīng)的重心點(diǎn)的相對(duì)位置的歐氏距離，便可以知道這些膚色塊的深度信息。相對(duì)位置距離大者離攝像頭近，反之則遠(yuǎn)。
[0062] 在得到這些膚色塊的大致深度信息后，即可進(jìn)行臉部區(qū)域的定位。臉部的定位在開始做手語之前的準(zhǔn)備階段中進(jìn)行。在準(zhǔn)備階段，臉部和手部與攝像機(jī)的距離幾乎一樣，而正常情況下使用者與攝像機(jī)之間不會(huì)有物體擋住，而使用者背后的膚色物體的深度信息明顯與臉部區(qū)域的不同，再根據(jù)雙手和臉部區(qū)域的相對(duì)位置，可簡單準(zhǔn)確地對(duì)臉部區(qū)域進(jìn)行定位。
[0063] S4 :根據(jù)膚色塊的深度信息對(duì)手部進(jìn)行定位并提取關(guān)鍵幀，所述關(guān)鍵幀為手部在一個(gè)區(qū)域內(nèi)停留達(dá)到預(yù)設(shè)幀數(shù)的幀；
[0064] 在完成臉部定位后，進(jìn)行手語識(shí)別階段。根據(jù)實(shí)際情況，在做手語手勢(shì)時(shí)，離攝像頭最近的運(yùn)動(dòng)膚色塊為手部，而遠(yuǎn)的運(yùn)動(dòng)膚色塊為臉部或是一些運(yùn)動(dòng)的膚色物體。可根據(jù) 這一點(diǎn)對(duì)手部的大致位置進(jìn)行定位。
[0065] 在得到手部和臉部的位置坐標(biāo)后，可對(duì)兩個(gè)攝像頭的其中一個(gè)傳回來的視頻流進(jìn) 行后面識(shí)別操作。先分析手部的運(yùn)動(dòng)情況，當(dāng)手部停留在一個(gè)區(qū)域達(dá)到三幀以上，則可認(rèn)為該幀為關(guān)鍵幀。為了減少運(yùn)算量，簡化識(shí)別結(jié)果，僅需要對(duì)關(guān)鍵幀中的手勢(shì)部位進(jìn)行靜態(tài)手勢(shì)的識(shí)別處理。
[0066] 本發(fā)明中使用是基于YCbCr顏色空間的膚色提取，亮度Y會(huì)影響到膚色在該顏色空間的投影，不同光照下提取的效果也不同，會(huì)導(dǎo)致有部分亮度不太合適的膚色部分檢測不到，所以不能將提取到的手部的膚色圖像直接用作識(shí)別。
[0067] 為了解決這個(gè)問題，本發(fā)明使用感知器算法對(duì)檢測到的膚色圖像進(jìn)行填充。感知器是二類線性分類模型，令w為權(quán)向量，X為輸入，則其判別函數(shù)如下：
[0068] d (X) = W1X
[0069] 令Se是在訓(xùn)練時(shí)為被w錯(cuò)誤分類的樣本集合，而感知器準(zhǔn)則函數(shù)定義為：

【權(quán)利要求】
1. 一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，所述方法包括w下步驟： S1 ;采集手語者的動(dòng)作視頻，對(duì)視頻流建立背景，當(dāng)前帖與背景作差得到前景圖像； S2;在前景圖像中提取膚色塊； 53 ;計(jì)算提取到的膚色塊的深度信息，并根據(jù)膚色塊的深度信息對(duì)臉部區(qū)域進(jìn)行定位； 54 ;根據(jù)膚色塊的深度信息對(duì)手部進(jìn)行定位并提取關(guān)鍵帖，并對(duì)關(guān)鍵帖的手部區(qū)域膚色塊進(jìn)行修補(bǔ)填充，所述關(guān)鍵帖為手部在一個(gè)區(qū)域內(nèi)停留達(dá)到預(yù)設(shè)帖數(shù)的帖； 55 ;提取關(guān)鍵帖的一種或多種手型特征； 56 ;根據(jù)提取的手型特征，使用單個(gè)分類器進(jìn)行分類或者使用多個(gè)分類器進(jìn)行投票表決，得到靜態(tài)手勢(shì)識(shí)別結(jié)果； 57 ;對(duì)手勢(shì)的運(yùn)動(dòng)軌跡進(jìn)行識(shí)別，得到軌跡識(shí)別結(jié)果； 58 ;對(duì)靜態(tài)手勢(shì)識(shí)別結(jié)果和軌跡識(shí)別結(jié)果進(jìn)行糾錯(cuò)與拼接，得到手語的識(shí)別翻譯結(jié)果。
2. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，所述方法還包括；步驟S1中，使用2個(gè)攝像頭同時(shí)采集手語者的動(dòng)作視頻，首先調(diào)整攝像頭使2個(gè) 攝像頭水平，然后分別對(duì)2個(gè)攝像頭采集的視頻流建立背景，選取某一帖圖像作為初始的背景，當(dāng)前帖與背景作差得到前景圖像，使用均值漂移的方法對(duì)背景進(jìn)行更新。
3. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，所述方法還包括；步驟S2中，使用高斯膚色模型在前景圖像中提取膚色塊。
4. 根據(jù)權(quán)利要求2所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，所述方法還包括；步驟S3中，2個(gè)攝像頭采集到的膚色塊的重屯、點(diǎn)相互對(duì)應(yīng)，計(jì)算該些相互對(duì)應(yīng)的重屯、點(diǎn)之間的歐氏距離，即可得到該些膚色塊的深度信息；相對(duì)應(yīng)的膚色塊的重屯、點(diǎn)距離越大，則該膚色塊離攝像頭越近，在準(zhǔn)備階段，臉部和手部與攝像頭的距離一樣，而使用者背后的膚色物體的深度信息明顯與臉部區(qū)域的不同，再根據(jù)雙手和臉部區(qū)域的相對(duì)位置，即可對(duì)臉部區(qū)域進(jìn)行定位。
5. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，所述方法還包括；步驟S4中，在做手語手勢(shì)時(shí)，離攝像頭最近的運(yùn)動(dòng)膚色塊為手部，而遠(yuǎn)的運(yùn)動(dòng)膚色塊為臉部或其他運(yùn)動(dòng)的膚色物體，根據(jù)該一特性對(duì)手部進(jìn)行定位，然后提取關(guān)鍵帖，并使用感知器算法對(duì)手部區(qū)域膚色塊進(jìn)行修補(bǔ)填充，所述關(guān)鍵帖為手部在一個(gè)區(qū)域內(nèi)停留達(dá)到預(yù)設(shè)帖數(shù)的帖。
6. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，所述方法還包括；步驟S5中，提取關(guān)鍵帖的歸一化傅里葉描述子、手型骨架和指尖數(shù)目的特征，具體方法為：首先提取手型骨架特征；將手勢(shì)圖像用最小的矩形包圍住，把該矩形四等分，計(jì)算出各塊圖像的重屯、點(diǎn)，將四個(gè)重屯、點(diǎn)連接成一個(gè)四邊形，計(jì)算出該四邊形的各邊長、對(duì)角線長、矩形度、角度共同作為手型骨架的特征；然后提取歸一化傅里葉描述子特征；最后提取指尖數(shù)目特征，計(jì)算手勢(shì)輪廓的曲率，若某段輪廓的曲率大于預(yù)設(shè)的闊值則該段為指尖，判斷出該手勢(shì)伸出了多少根手指，即為指尖數(shù)目特征。
7. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，步驟S6 中，投票表決的方法如下：先對(duì)每個(gè)分類器所能投的票數(shù)進(jìn)行初始化；統(tǒng)計(jì)各個(gè)先前訓(xùn)練好的分類器的識(shí)別結(jié) 果，采用獎(jiǎng)懲方式調(diào)整各分類器所能投出的票數(shù)；根據(jù)各分類器所能投的票數(shù)，按手勢(shì)特征與分類器各類的相似程度進(jìn)行分散投票，最相似者票數(shù)最多，票數(shù)最多的一類作為為識(shí)別結(jié)果。
8. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，步驟S7 中，采用分層的軌跡識(shí)別方法對(duì)手勢(shì)的運(yùn)動(dòng)軌跡進(jìn)行識(shí)別，其具體方法包括W下步驟： (1) 先進(jìn)行第一層的軌跡識(shí)別，W兩個(gè)關(guān)鍵帖之間的軌跡點(diǎn)坐標(biāo)，使用化eeman鏈碼對(duì) 該些軌跡點(diǎn)進(jìn)行編碼，使其連成一個(gè)鏈碼序列用于短軌跡的識(shí)別； (2) 將軌跡點(diǎn)數(shù)分成4、8、12、16個(gè)點(diǎn)四種，對(duì)于實(shí)際的短軌跡段的長度則按該四種情況進(jìn)行軌跡點(diǎn)數(shù)的調(diào)整，即根據(jù)各坐標(biāo)點(diǎn)的間距，進(jìn)行補(bǔ)點(diǎn)或刪點(diǎn)，使長度達(dá)到四種點(diǎn)數(shù) 的其中一種. (3) 設(shè)定多種基本情況的短軌跡類型，如向左、向上、向坐上等類型，使該些短軌跡能組成各種各樣的長軌跡，并根據(jù)短軌跡首末坐標(biāo)點(diǎn)進(jìn)行軌跡的移動(dòng)方向的分類. (4) 根據(jù)短軌跡的長度，將目標(biāo)短軌跡與事先訓(xùn)練好的有可能與之相匹配的短軌跡類型使用簡單的歐氏距離公式計(jì)算相似度，W完成短軌跡識(shí)別，得到短軌跡的識(shí)別結(jié)果編號(hào)，因?yàn)槎誊壽E的軌跡點(diǎn)少，所W短軌跡并不需要事先訓(xùn)練，只需要按化eeman鏈碼所設(shè)定的方向編號(hào)自行設(shè)定短軌跡的類型即可； (5) 計(jì)算出短軌跡的長度，并將其起始點(diǎn)、終點(diǎn)的坐標(biāo)和短軌跡的長度保存下來； (6) 進(jìn)行第二層的長軌跡處理，將各個(gè)短軌跡的識(shí)別結(jié)果進(jìn)行續(xù)接排列起來作為HMM 的觀察序列0 ; (7) 使用Viterbi算法對(duì)長軌跡進(jìn)行識(shí)別，將采集到的觀察序列0輸入到Viterbi函數(shù)中，利用Viterbi算法計(jì)算出觀察序列0在各個(gè)事先訓(xùn)練好的長軌跡模型A下的概率 P (01 A )，并重復(fù)迭代直至收斂，將最接近的模型對(duì)應(yīng)的軌跡作為識(shí)別結(jié)果。
9. 根據(jù)權(quán)利要求1所述的基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法，其特征在于，步驟S8 中，首先使用Bigram模型對(duì)詞根序列進(jìn)行第一層糾錯(cuò)，然后使用Trie索引樹進(jìn)行第二層的糾錯(cuò)處理。
【文檔編號(hào)】G06K9/66GK104463250SQ201410764770
【公開日】2015年3月25日申請(qǐng)日期:2014年12月12日優(yōu)先權(quán)日:2014年12月12日
【發(fā)明者】陳健明, 周冬躍, 陳麗, 葉俊有申請(qǐng)人:廣東工業(yè)大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳健明;周冬躍;陳麗;葉俊有;
技術(shù)所有人：廣東工業(yè)大學(xué);
我是此專利的發(fā)明人

上一篇：一種智能終端菜單展示方法及智能終端的制作方法
上一篇：一種基于超度量距離矩陣的半監(jiān)督層次聚類方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于達(dá)芬奇技術(shù)的手語識(shí)別翻譯方法