一種基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備及自動(dòng)調(diào)節(jié)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人工交互自動(dòng)控制技術(shù)領(lǐng)域,尤其涉及一種基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備及自動(dòng)調(diào)節(jié)方法。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)是通過多個(gè)麥克同時(shí)采集聲音,通過聲音到每支麥克的時(shí)間來判斷說話人的位置,然后在調(diào)整拾音參數(shù)。并對(duì)這些數(shù)據(jù)進(jìn)行相關(guān)的處理。
[0003]技術(shù)缺點(diǎn)就是聲音的識(shí)別,只識(shí)別聲音,有時(shí)其它人在邊上說話會(huì)對(duì)整個(gè)系統(tǒng)進(jìn)行干擾??蛇吷系娜说穆曇舨⒉皇窍到y(tǒng)所想要采集的聲音。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備及自動(dòng)調(diào)節(jié)方法,從而解決現(xiàn)有技術(shù)中存在的前述問題。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0006]一種基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備,包括圖像采集裝置和由多支拾音單元組成的拾音器陣列,所述圖像采集裝置設(shè)置于拾音器的前方或后方或上方或下方,用于采集所述拾音器的使用者的圖像;還包括控制電路,所述控制電路與所述拾音器陣列電連接,還與所述圖像采集裝置電連接。
[0007]優(yōu)選的,所述控制電路與所述多支拾音器單元分別電連接。
[0008]優(yōu)選的,所述多支拾音器單元為三支以上的拾音器單元。
[0009]優(yōu)選的,所述控制電路包括:
[0010]數(shù)據(jù)處理器,用于處理所述圖像采集裝置獲取的圖像數(shù)據(jù),從中得出人臉方位數(shù)據(jù),并根據(jù)所述方位數(shù)據(jù)生成調(diào)節(jié)指令;
[0011]拾音器靈敏度獲取模塊,用于獲取所述拾音器陣列中每個(gè)拾音器單元的當(dāng)前靈敏度及當(dāng)前拾音音量;
[0012]拾音器靈敏度調(diào)節(jié)模塊用于根據(jù)所述調(diào)節(jié)指令,調(diào)節(jié)所述拾音器陣列中每個(gè)拾音器單元的靈敏度和/或拾音音量。
[0013]優(yōu)選的,所述數(shù)據(jù)處理器,包括:
[0014]圖像分析模塊,用于分析所述圖像采集裝置獲取得到的整個(gè)圖像,從中尋找人臉圖像,如果找到則提取所述人臉圖像;
[0015]人臉分析模塊,用于分析所述人臉圖像,得出人臉尺寸,并計(jì)算得出所述人臉圖像在所述整個(gè)圖像中的人臉坐標(biāo)位置;
[0016]距離分析模塊,用于根據(jù)所述人臉尺寸,獲得所述人臉距離所述拾音器陣列的距離;
[0017]調(diào)節(jié)指令生成模塊,用于根據(jù)所述坐標(biāo)位置、所述距離和所述每個(gè)拾音器單元的當(dāng)前靈敏度及當(dāng)前拾音音量,調(diào)節(jié)所述每個(gè)拾音器單元的靈敏度和/或拾音音量。
[0018]優(yōu)選的,所述圖像采集裝置為攝像頭,設(shè)置于所述拾音器陣列的中分線上。
[0019]所述的基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備的自動(dòng)調(diào)節(jié)方法,包括以下步驟:
[0020]SI,圖像采集裝置以預(yù)設(shè)頻率獲取拾音設(shè)備使用者的整個(gè)圖像;
[0021]S2,分析所述圖像采集裝置獲取得到的整個(gè)圖像,從中尋找人臉圖像,如果沒有找到則繼續(xù)在下一張所述整個(gè)圖像中尋找,如果找到則提取所述人臉圖像;
[0022]S3,分析所述人臉圖像,得出人臉尺寸,并計(jì)算得出所述人臉在所述整個(gè)圖像中的人臉坐標(biāo)位置XY ;
[0023]S4,根據(jù)所述人臉尺寸獲得所述人臉與所述拾音器陣列的距離;
[0024]S5,根據(jù)所述人臉坐標(biāo)位置中的位置坐標(biāo)XY值,獲得人臉相對(duì)于所述拾音器陣列的相對(duì)角度;
[0025]S6根據(jù)所述相對(duì)角度的值和所述距離,調(diào)節(jié)所述拾音器陣列中的相應(yīng)位置的拾音器單元的靈敏度和/或拾音音量。
[0026]優(yōu)選的,S4具體為根據(jù)人臉面積的大小尺寸計(jì)算出實(shí)際人臉與所述拾音器陣列的距離,和/或利用測(cè)試方法取得人臉面積所對(duì)應(yīng)的距離,和/或利用設(shè)置于所述圖像采集裝置旁邊的距離傳感器測(cè)得實(shí)際人臉與所述拾音器陣列的距離。
[0027]優(yōu)選的,S6具體為,根據(jù)所述相對(duì)角度,得到與拾音器使用者直線距離最近的一組拾音器單元做為主拾音區(qū)單元,進(jìn)而根據(jù)所述距離確定所述主拾音區(qū)單元的靈敏度,距離值越大靈敏度應(yīng)越大,距離值越小靈敏度應(yīng)越小,根據(jù)得出的應(yīng)達(dá)到的靈敏度值和當(dāng)前靈敏度值對(duì)所述主拾音區(qū)單元進(jìn)行調(diào)整;對(duì)于非主拾音區(qū)單元,則直接降低其靈敏度或直接將其關(guān)閉。
[0028]優(yōu)選的,根據(jù)所述圖像采集裝置獲取拾音設(shè)備使用者的整個(gè)圖像的預(yù)設(shè)頻率,重復(fù)執(zhí)行S2-S6,以實(shí)現(xiàn)實(shí)時(shí)自動(dòng)調(diào)節(jié)。
[0029]本發(fā)明的有益效果是:
[0030]本發(fā)明的基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備及自動(dòng)調(diào)節(jié)方法引入圖像采集裝置,對(duì)拾音器的使用者的人臉方位進(jìn)行辨別,再根據(jù)該方位對(duì)拾音器進(jìn)行相關(guān)調(diào)整,從而避免了僅通過聲音識(shí)別而控制調(diào)整拾音參數(shù)所帶來的不便。調(diào)整精度更高,操作更為智能。
【附圖說明】
[0031]圖1是本發(fā)明的結(jié)構(gòu)示意圖;
[0032]圖2是圖像采集裝置采集到的整個(gè)圖像的示意圖;
[0033]圖3是分析到人臉的整個(gè)圖像的示意圖;
[0034]圖4是取得人臉尺寸后的整個(gè)圖像的示意圖;
[0035]圖5是取得人臉尺寸及人臉坐標(biāo)值后的整個(gè)圖像的示意圖;
[0036]圖6是當(dāng)使用者正對(duì)拾音器陣列時(shí)劃分的主拾音區(qū)示意圖;
[0037]圖7是當(dāng)使用者斜對(duì)拾音器陣列時(shí)劃分的主拾音區(qū)示意圖;
[0038]其中:01--本發(fā)明的使用者;02-—拾音器陣列;03-—圖像采集裝置;04-—非主拾音區(qū)域;05-—主拾音區(qū)域;10-—圖像采集裝置采集到的整個(gè)圖像;11-一整個(gè)圖像中的人臉圖像;12-—人臉圖像中的人眼;14-一整個(gè)圖像中的人臉面積示意圖。
【具體實(shí)施方式】
[0039]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的【具體實(shí)施方式】?jī)H僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0040]如圖1-7所示,本發(fā)明公開了一種基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備及自動(dòng)調(diào)節(jié)方法,所述基于人臉識(shí)別的自動(dòng)調(diào)節(jié)拾音設(shè)備,包括圖像采集裝置和由多支拾音單元組成的拾音器陣列,所述圖像采集裝置設(shè)置于拾音器的前方或后方或上方或下方,用于采集所述拾音器的使用者的圖像;還包括控制電路,所述控制電路與所述拾音器陣列電連接,還與所述圖像采集裝置電連接。所述控制電路與所述多支拾音單元分別電連接。所述多支拾音單元為三支以上的拾音器單元。
[0041]所述控制電路包括:
[0042]數(shù)據(jù)處理器,用于處理所述圖像采集裝置獲取的圖像數(shù)據(jù),從中得出人臉方位數(shù)據(jù),并根據(jù)所述方位數(shù)據(jù)生成調(diào)節(jié)指令;
[0043]拾音器靈敏度獲取模塊,用于獲取所述拾音器陣列中每個(gè)拾音器單元的當(dāng)前靈敏度及當(dāng)前拾音音量;
[0044]拾音器靈敏度調(diào)節(jié)模塊用于根據(jù)所述調(diào)節(jié)指令,調(diào)節(jié)所述拾音器陣列中每個(gè)拾音器單元的靈敏度和/或拾音音量。
[0045]所述數(shù)據(jù)處理器,包括:
[0046]圖像分析模塊,用于分析所述圖像采集裝置獲取得到的整個(gè)圖像,從中尋找人臉圖像,如果找到則提取所述人臉圖像;
[0047]人臉分析模塊,用于分析所述人臉圖像,得出人臉尺寸,并計(jì)算得出所述眼睛在所述整個(gè)圖像中的人臉坐標(biāo)位置;
[0048]距離分析模塊,用于根據(jù)所述人臉尺寸,獲得所述人臉距離所述拾音器陣列的距離;
[0049]調(diào)節(jié)指令生