亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種音量調(diào)節(jié)方法、裝置和智能終端的制作方法

文檔序號(hào):10616437閱讀:655來源:國知局
一種音量調(diào)節(jié)方法、裝置和智能終端的制作方法
【專利摘要】本發(fā)明實(shí)施例提供了一種音量調(diào)節(jié)方法、裝置和智能終端,涉及電子技術(shù)領(lǐng)域,用以至少解決用戶在不同場景下智能終端無法自動(dòng)調(diào)節(jié)音量的問題,包括將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二攝像頭分別同時(shí)拍攝的圖像合成至少一張三維立體圖像;在預(yù)設(shè)時(shí)間內(nèi),對所述至少一張三維立體圖像進(jìn)行人體識(shí)別處理,獲取每個(gè)三維立體圖像包含的人體輪廓信息;根據(jù)每個(gè)三維立體圖像包含的人體輪廓信息以及用戶行為庫中包括的至少一張行為標(biāo)準(zhǔn)圖像,從用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖像;根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像以及預(yù)設(shè)音量適配庫中行為標(biāo)準(zhǔn)圖像與預(yù)設(shè)調(diào)整策略之間的對應(yīng)關(guān)系,對智能終端的音量進(jìn)行調(diào)整。本發(fā)明實(shí)施例用于智能終端中。
【專利說明】
-種音量調(diào)節(jié)方法、裝置和智能終端
技術(shù)領(lǐng)域
[0001] 本發(fā)明實(shí)施例設(shè)及電子技術(shù)領(lǐng)域,尤其設(shè)及一種音量調(diào)節(jié)方法、裝置和智能終端。
【背景技術(shù)】
[0002] 隨著智能電視發(fā)展趨勢,在對智能電視的操控方面,用戶體驗(yàn)已經(jīng)成為衡量智能 電視標(biāo)準(zhǔn)的重要依據(jù)。智能電視的音量自動(dòng)調(diào)節(jié)功能,作為用戶體驗(yàn)的一個(gè)關(guān)鍵體驗(yàn)點(diǎn),越 來越多的得到了智能電視用戶的期待。一般通過對智能電視用戶行為的判斷,實(shí)現(xiàn)智能電 視的音量自動(dòng)調(diào)節(jié)。
[0003] 現(xiàn)有技術(shù)中,一方面,智能電視的音量自動(dòng)調(diào)節(jié)功能,大多只能利用紅外檢測模 塊、圖像識(shí)別模塊檢測用戶與智能電視之間的距離。并根據(jù)用戶與智能電視之間的距離實(shí) 現(xiàn)智能電視的音量自動(dòng)調(diào)節(jié),例如,四川長虹電器股份有限公司采用紅外檢測的方式對智 能電視用戶的實(shí)時(shí)距離進(jìn)行檢測,并依此進(jìn)行音量的自動(dòng)調(diào)節(jié)青島歌爾聲學(xué)科技有限公司 申請的公開號(hào)為CN104378564A的申請文件公開了"智能電視自動(dòng)調(diào)節(jié)音量方法",該申請文 件首先系統(tǒng)檢測用戶與智能電視之間的用戶完成智能電視音量設(shè)置時(shí)的初始距離及用戶 與智能電視之間的實(shí)時(shí)距離,并將初始距離與實(shí)時(shí)距離進(jìn)行比較,當(dāng)實(shí)時(shí)距離大于初始距 離時(shí),系統(tǒng)自動(dòng)在初始音量的基礎(chǔ)上進(jìn)行音量遞增,當(dāng)實(shí)時(shí)距離小于初始距離時(shí),系統(tǒng)自動(dòng) 在初始音量的基礎(chǔ)上進(jìn)行音量遞減的音量自動(dòng)調(diào)節(jié)方法。
[0004] 但是,上述申請文件的音量自動(dòng)調(diào)節(jié)方法判斷的依據(jù)是根據(jù)用戶距離智能電視的 遠(yuǎn)近,由于人體恒定溫度一般在37度,會(huì)發(fā)出特定波長的紅外線,一般通過紅外檢測的方式 探測人體發(fā)射的紅外線,從而獲取用戶與智能電視之間的距離,但是紅外檢測的方式容易 受到各種熱源干擾且紅外穿透能力差,人體紅外福射容易被遮擋,不易被接收等問題。并且 上述申請文件中只有唯一的一個(gè)距離因素作為音量調(diào)節(jié)的依據(jù),無法在用戶距離不變的前 提條件下,其他條件發(fā)生變化后,比如,用戶當(dāng)前不在觀看智能電視,用戶在接聽電話等條 件下,幫助用戶自動(dòng)調(diào)節(jié)音量,滿足用戶在此應(yīng)用場景下需要自動(dòng)調(diào)節(jié)音量的需求。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的實(shí)施例提供一種音量調(diào)節(jié)方法、裝置和智能終端,用W至少解決用戶在 不同場景下智能終端無法自動(dòng)調(diào)節(jié)音量的問題。
[0006] 為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
[0007] 第一方面,本發(fā)明實(shí)施例提供一種音量調(diào)節(jié)方法,包括:
[000引將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二攝像頭分別同 時(shí)拍攝的包含用戶行為的圖像合成至少一張=維立體圖像;
[0009] 在預(yù)設(shè)時(shí)間內(nèi),對所述至少一張=維立體圖像進(jìn)行人體識(shí)別處理,獲取每個(gè)=維 立體圖像包含的人體輪廓信息;
[0010] 根據(jù)每個(gè)=維立體圖像包含的人體輪廓信息W及用戶行為庫中包括的至少一張 行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖像;
[0011] 根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像W及預(yù)設(shè)調(diào)整策略對智能終端的音量進(jìn)行調(diào)整。
[0012] 第二方面,本發(fā)明實(shí)施例提供一種音量調(diào)節(jié)裝置,包括:
[0013] 合成單元,用于將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二 攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成至少一張=維立體圖像;
[0014] 獲取單元,用于在預(yù)設(shè)時(shí)間內(nèi),對所述至少一張=維立體圖像進(jìn)行人體識(shí)別處理, 獲取每個(gè)=維立體圖像包含的人體輪廓信息;
[0015] 確定單元,用于根據(jù)每個(gè)=維立體圖像包含的人體輪廓信息W及用戶行為庫中包 括的至少一張行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn) 圖像;
[0016] 調(diào)整單元,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像W及預(yù)設(shè)調(diào)整策略對智能終端的音量 進(jìn)行調(diào)整。
[0017] 第=方面,本發(fā)明實(shí)施例提供一種智能終端,所述智能終端包括處理器、存儲(chǔ)器、 系統(tǒng)總線和通信接口、平行設(shè)置在所述智能終端上的第一攝像頭和第二攝像頭,運(yùn)行在所 述智能終端處理器上的音量調(diào)節(jié)裝置和聲音播放終端;
[0018] 其中,所述第一攝像頭和第二攝像頭處于同一水平線上;
[0019] 所述第一攝像頭和第二攝像頭,用于在預(yù)設(shè)時(shí)間拍攝至少一張包含用戶行為的圖 像;
[0020] 所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)執(zhí)行指令,所述處理器與所述存儲(chǔ)器通過所述系統(tǒng)總 線連接,當(dāng)所述智能終端運(yùn)行時(shí),所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的所述計(jì)算機(jī)執(zhí)行指令, W使所述智能終端執(zhí)行如本發(fā)明實(shí)施例第一方面所提到任何一種實(shí)現(xiàn)方式所述的音量調(diào) 節(jié)方法。
[0021] 本發(fā)明實(shí)施例提供一種音量調(diào)節(jié)方法,通過將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè) 拍攝時(shí)刻,第一攝像頭和第二攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成至少一張= 維立體圖像,并提取所述至少一張=維立體圖像中每個(gè)=維立體圖像包含的人體輪廓信 息,并根據(jù)每個(gè)=維立體圖像包含的人體輪廓信息從用戶行為庫中獲取目標(biāo)行為標(biāo)準(zhǔn)圖 像,由于每個(gè)行為標(biāo)準(zhǔn)圖像在用戶行為庫中對應(yīng)一個(gè)預(yù)設(shè)調(diào)整策略,故可W根據(jù)所述目標(biāo) 行為標(biāo)準(zhǔn)圖像從用戶行為庫中獲取與所述目標(biāo)行為標(biāo)準(zhǔn)圖像對應(yīng)的預(yù)設(shè)調(diào)整策略,對智能 終端的音量進(jìn)行調(diào)整,本發(fā)明實(shí)施例提供的方法可W根據(jù)用戶行為對智能終端的音量進(jìn)行 調(diào)整,該方法簡單,且通過=維立體圖像確定目標(biāo)行為標(biāo)準(zhǔn)圖像的方式精確度高。
【附圖說明】
[0022] 為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中 所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí) 施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W根據(jù)運(yùn)些附圖 獲得其他的附圖。
[0023] 圖Ia為本發(fā)明實(shí)施例提供的一種智能終端的結(jié)構(gòu)示意圖;
[0024] 圖化為本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)方法的流程示意圖一;
[0025] 圖2為本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)方法的流程示意圖二;
[0026] 圖3a為本發(fā)明實(shí)施例提供的第一圖像中任意一個(gè)像素點(diǎn)為中屯、像素點(diǎn)建立預(yù)設(shè) 窗口的不意圖;
[0027] 圖3b為本發(fā)明實(shí)施例提供的第一圖像中任意一個(gè)像素點(diǎn)為中屯、像素點(diǎn)建立預(yù)設(shè) 窗口與第二圖像進(jìn)行匹配的示意圖;
[0028] 圖3c為本發(fā)明實(shí)施例提供的第一圖像中任意一個(gè)像素點(diǎn)為中屯、像素點(diǎn)建立預(yù)設(shè) 窗口與第二圖像匹配結(jié)果示意圖;
[0029] 圖4為本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)方法的流程示意圖
[0030] 圖5為本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)裝置的結(jié)構(gòu)示意圖一;
[0031] 圖6為本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)裝置的結(jié)構(gòu)示意圖二;
[0032] 圖7為本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)裝置的結(jié)構(gòu)示意圖=。
【具體實(shí)施方式】
[0033] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0034] 本發(fā)明實(shí)施例提供的一種音量調(diào)節(jié)方法可W由智能終端來執(zhí)行,參見圖la,圖Ia 示出了一種智能終端的硬件示意圖。該智能終端包括一個(gè)或多個(gè)處理器40(圖中僅示出一 個(gè))、存儲(chǔ)器41、通信接口 43、通信總線42W及顯示屏44W及拍攝裝置(圖中未示出),該拍攝 裝置包括兩個(gè)攝像頭,分別為第一攝像頭和第二攝像頭。所述第一攝像頭和第二攝像頭平 行設(shè)置在所述智能終端。本領(lǐng)域普通技術(shù)人員可W理解,圖Ia所示的結(jié)構(gòu)僅為示意,其并不 對智能終端4的結(jié)構(gòu)造成限定。例如,智能終端4還可包括比圖Ia中所示更多或者更少的組 件,或者具有與圖Ia所示不同的配置。
[0035] 其中,所述第一攝像頭和第二攝像頭處于同一水平線上;
[0036] 所述第一攝像頭和第二攝像頭,用于在預(yù)設(shè)時(shí)間拍攝至少一張包含用戶行為的圖 像。
[0037] 通信總線42用于智能終端4中各組成部件之間的通信。通信接口 43用于插接外部 設(shè)備,例如鼠標(biāo)及鍵盤等,W接收用戶輸入的信息。
[0038] 顯示屏44用于顯示智能終端識(shí)別出的目標(biāo)手勢操作W及目標(biāo)手勢操作對應(yīng)的操 作界面W及操作界面中顯示出的音量調(diào)節(jié)菜單。
[0039] 存儲(chǔ)器41可用于存儲(chǔ)軟件程序W及模塊,數(shù)據(jù)庫,如本發(fā)明實(shí)施例中的用戶行為 庫、人臉特征庫W及預(yù)設(shè)音量適配庫W及對所述至少一張=維立體圖像進(jìn)行人體識(shí)別處理 W及對智能終端的音量進(jìn)行調(diào)整對應(yīng)的程序指令/模塊。存儲(chǔ)器41可包括高速隨機(jī)存儲(chǔ)器, 還可包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存 儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器41可進(jìn)一步包括相對于處理器40遠(yuǎn)程設(shè)置的存儲(chǔ)器,運(yùn)些遠(yuǎn)程 存儲(chǔ)器可W通過網(wǎng)絡(luò)連接至智能終端4。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部 網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。
[0040] 處理器40通過運(yùn)行存儲(chǔ)在存儲(chǔ)器41內(nèi)的軟件程序W及模塊,從而執(zhí)行各種功能應(yīng) 用W及數(shù)據(jù)處理,例如,處理器40通過調(diào)用存儲(chǔ)器41中的對智能終端的音量進(jìn)行調(diào)整的方 法的應(yīng)用程序,W實(shí)現(xiàn)快速而準(zhǔn)確的對智能終端的音量進(jìn)行調(diào)整。
[004"1] 該智能終端可W為平板電腦、筆記本電腦、UMPC(Ultra-mobile Personal Computer,超級(jí)移動(dòng)個(gè)人計(jì)算機(jī))、上網(wǎng)本、PDA(Personal Digital Assistant,個(gè)人數(shù)字助 理)W及智能電視等終端設(shè)備。
[0042] 本發(fā)明實(shí)施例提供一種音量調(diào)節(jié)方法,如圖化所示,包括:
[0043] S101、將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二攝像頭分 別同時(shí)拍攝的包含用戶行為的圖像合成至少一張=維立體圖像;
[0044] S102、在預(yù)設(shè)時(shí)間內(nèi),對所述至少一張=維立體圖像進(jìn)行人體識(shí)別處理,獲取每個(gè) =維立體圖像包含的人體輪廓信息;
[0045] S103、根據(jù)每個(gè)=維立體圖像包含的人體輪廓信息W及用戶行為庫中包括的至少 一張行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖像;所 述行為標(biāo)準(zhǔn)圖像包括用戶所處的場景W及用戶在所述場景下的動(dòng)作行為;
[0046] S104、根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像W及預(yù)設(shè)音量適配庫中行為標(biāo)準(zhǔn)圖像與預(yù)設(shè)調(diào) 整策略之間的對應(yīng)關(guān)系,對智能終端的音量進(jìn)行調(diào)整。
[0047] 本發(fā)明實(shí)施例提供一種音量調(diào)節(jié)方法,通過將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè) 拍攝時(shí)刻,第一攝像頭和第二攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成至少一張= 維立體圖像,并提取所述至少一張=維立體圖像中每個(gè)=維立體圖像包含的人體輪廓信 息,并根據(jù)每個(gè)=維立體圖像包含的人體輪廓信息從用戶行為庫中獲取目標(biāo)行為標(biāo)準(zhǔn)圖 像,由于每個(gè)行為標(biāo)準(zhǔn)圖像在用戶行為庫中對應(yīng)一個(gè)預(yù)設(shè)調(diào)整策略,故可W根據(jù)所述目標(biāo) 行為標(biāo)準(zhǔn)圖像從用戶行為庫中獲取與所述目標(biāo)行為標(biāo)準(zhǔn)圖像對應(yīng)的預(yù)設(shè)調(diào)整策略,對智能 終端的音量進(jìn)行調(diào)整,本發(fā)明實(shí)施例提供的方法可W根據(jù)用戶行為對智能終端的音量進(jìn)行 調(diào)整,該方法簡單,且通過=維立體圖像確定目標(biāo)行為標(biāo)準(zhǔn)圖像的方式精確度高。
[0048] 本發(fā)明實(shí)施例的一種音量調(diào)節(jié)方法的執(zhí)行主體為智能終端的處理器,該智能終端 可W為電視、電腦等,本發(fā)明實(shí)施例對此不作限定,該第一攝像頭和第二攝像頭用于獲取用 戶行為的圖像,該第一攝像頭和第二攝像頭可W是在智能終端上設(shè)置的攝像頭,也可W是 設(shè)置在智能終端外與所述智能終端的處理器相連的攝像頭。
[0049] 本發(fā)明實(shí)施例中,該第一攝像頭和第二攝像頭感應(yīng)用戶是否在終端前具有用戶行 為(例如,用戶是否在打電話、用戶是否不在智能終端附近),當(dāng)?shù)谝粩z像頭和第二攝像頭感 應(yīng)到用戶的用戶行為時(shí),獲取預(yù)設(shè)時(shí)間內(nèi)用戶產(chǎn)生用戶行為時(shí)的至少一張圖像,另外,也可 通過用戶手動(dòng)輸入用戶行為控制終端的開始信息,如用戶按下在終端遙控器中設(shè)置啟動(dòng)手 勢識(shí)別技術(shù)的啟動(dòng)按鍵,再獲取到所述啟動(dòng)按鍵觸發(fā)的啟動(dòng)指令后,處理器控制所述第一 攝像頭和第二攝像頭獲取用戶產(chǎn)生用戶行為時(shí)的至少一張圖像。
[0050] 其中,預(yù)設(shè)時(shí)間是指用戶完成一個(gè)用戶行為大概所需要的時(shí)間,可W是整個(gè)用戶 行為全部完成的時(shí)間,也可W是用戶行為的主要部分的完成時(shí)間等,預(yù)設(shè)時(shí)間可W提前設(shè) 定,如可將所述預(yù)設(shè)時(shí)間設(shè)置為200ms-500ms;具體可通過設(shè)置在所述處理器中的定時(shí)器W 實(shí)現(xiàn)。在200ms-500ms的時(shí)間段內(nèi),將獲取到的含用戶行為的圖像按獲取的先后順序緩存在 終端的存儲(chǔ)器中,在需要識(shí)別的時(shí)候,通過處理器從存儲(chǔ)器中獲取,由于第一攝像頭和第二 攝像頭在Is內(nèi)可W拍攝10~60個(gè)圖像帖,優(yōu)選的,是25~30個(gè)圖像帖,由于第一攝像頭和第 二攝像頭拍攝的用戶行為是一個(gè)動(dòng)態(tài)過程,故每一帖圖像帖是有差異的,故在選擇合成= 維立體圖像時(shí),通過選取第一攝像頭和第二攝像頭在同一時(shí)刻拍攝的一帖圖像,運(yùn)樣可W 避免形成的=維立體圖像與實(shí)際用戶行為之間的差異,提高了識(shí)別精確性。
[0051] 其中,根據(jù)攝像頭的拍攝性能,在預(yù)設(shè)時(shí)間內(nèi)總共包含L個(gè)拍攝時(shí)刻,每個(gè)拍攝時(shí) 刻第一攝像頭和第二攝像頭都拍攝有照片,可W選取N個(gè)拍攝時(shí)刻所述第一攝像頭和第二 攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成腳長=維立體圖像,也可W選取N個(gè)拍攝時(shí) 刻所述第一攝像頭和第二攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成腳長=維立體圖 像,其中,L〉N。
[0052] 圖像即為攝像頭拍攝的一張圖片,圖像帖則為固定時(shí)間內(nèi)連續(xù)拍攝的一系列圖 片,圖像帖序列由一系列圖像組成。
[0053] 當(dāng)然,在選擇合成=維立體圖像時(shí),可W選擇第一攝像頭連續(xù)拍攝的幾張圖像W 及第二攝像頭連續(xù)拍攝的幾張圖像中每一張圖像均合成=維立體圖像(其中,第二攝像頭 拍攝的每張圖像的時(shí)間均與第一攝像頭中在同一時(shí)刻拍攝的照片對應(yīng))。
[0054] 其中,對于將第一攝像頭和第二攝像頭在同一時(shí)刻分別拍攝的至少一張包含用戶 行為的圖像合成=維立體圖像的方式,本發(fā)明實(shí)施例對此不進(jìn)行限定,由于對于第一攝像 頭和第二攝像頭在預(yù)設(shè)時(shí)間內(nèi)拍攝的每張圖像合成=維立體圖像的方式和原理均相同,本 發(fā)明實(shí)施例僅W第一圖像和第二圖像為例進(jìn)行說明,其中,第一圖像和第二圖像分別為在 預(yù)設(shè)時(shí)間內(nèi)由第一攝像頭和第一攝像頭在同一時(shí)刻分別拍攝的圖像中的至少一張,并不具 有任何指示性含義。
[0055] 其中,本發(fā)明實(shí)施例對所述用戶行為不進(jìn)行限定,用于可W根據(jù)自己的習(xí)慣進(jìn)行 設(shè)置。例如,打電話;舉辦宴會(huì)等等。
[0056] 其中,本發(fā)明實(shí)施例中用戶行為庫包括的至少一張行為標(biāo)準(zhǔn)圖像,可W為智能終 端出廠時(shí)廠商存儲(chǔ)在智能終端用戶行為庫中的行為標(biāo)準(zhǔn)圖像,也可W是用戶自己根據(jù)自己 的習(xí)慣在用戶行為庫中利用第一攝像頭或者第二攝像頭基于特定場景下的用戶行為添加 的圖片。
[0057] 其中,本發(fā)明實(shí)施例中的人體輪廓信息包括人體輪廓的圖像信息,其它信息均不 包括,即輪廓的圖形。
[0058] 本發(fā)明實(shí)施例對預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二 攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成至少一張=維立體圖像的方式不進(jìn)行限 定,示例性的,如圖2所示,步驟SlOl可W通過W下方式實(shí)現(xiàn):
[0059] S1011、獲取所述第一圖像中的每個(gè)像素點(diǎn);
[0060] 其中,對于獲取第一圖像的每個(gè)像素點(diǎn)的具體方式,本發(fā)明實(shí)施例在此不再寶述, 可W通過現(xiàn)有技術(shù)來實(shí)現(xiàn),例如,粒子濾波。
[0061] 獲取到第一圖像的每個(gè)像素點(diǎn)W后,可W W所述第一圖像和第二圖像設(shè)置坐標(biāo) 系,則第一圖像和第二圖像上的每個(gè)像素點(diǎn)均可W用坐標(biāo)的形式表示,當(dāng)然還可W存在其 他方式用W唯一標(biāo)記第一圖像和第二圖像上相應(yīng)的像素點(diǎn),本發(fā)明實(shí)施例在此不再寶述。
[0062] 需要說明的是,在獲取=維立體圖像的時(shí)候,還可W先提取所述第一圖像的用戶 行為輪廓,在提取到用戶行為輪廓W后,獲取所述第一圖像的用戶行為輪廓中的每個(gè)像素 點(diǎn),基于每個(gè)所述用戶行為輪廓中的每個(gè)像素點(diǎn)執(zhí)行步驟S1012,運(yùn)樣可W進(jìn)一步提高識(shí)別 精度,避免在=維立體圖像中引入背景或者干擾。
[0063] S1012、W所述第一圖像的每個(gè)像素點(diǎn)為中屯、像素點(diǎn)建立預(yù)設(shè)窗口;其中,所述預(yù) 設(shè)窗口包含按照預(yù)設(shè)距離,W所述中屯、像素點(diǎn)為中屯、的M個(gè)像素點(diǎn);
[0064] 為了清楚的介紹像素點(diǎn)與預(yù)設(shè)窗口之間的關(guān)系,如圖3a所示,圖3a為本發(fā)明實(shí)施 例提供的一種W第一圖像中任意一個(gè)像素點(diǎn)為中屯、像素點(diǎn)建立預(yù)設(shè)窗口的示意圖,其預(yù)設(shè) 窗口可W通過W所述中屯、像素點(diǎn)為中屯、,在所述中屯、像素點(diǎn)四周化、下、左、由)各延長L個(gè) 長度單位所包含的區(qū)域,即所述預(yù)設(shè)距離為2L,則上述M個(gè)像素點(diǎn)即為W所述中屯、像素點(diǎn)四 周各延長L個(gè)長度單位所包含的區(qū)域內(nèi)的所有像素點(diǎn);本發(fā)明實(shí)施例對所述L的具體大小不 進(jìn)行限定,可W根據(jù)實(shí)際需要達(dá)到的精度進(jìn)行設(shè)定。
[0065] S1013、獲取所述預(yù)設(shè)窗口的像素值;
[0066] 由于預(yù)設(shè)窗口內(nèi)包含M個(gè)像素點(diǎn),故所述預(yù)設(shè)窗口的像素值為M個(gè)像素點(diǎn)像素值的 總和,對于計(jì)算每個(gè)像素值的具體方式本發(fā)明實(shí)施例在此不再寶述,例如,若所述預(yù)設(shè)窗口 為W任意一個(gè)像素點(diǎn)為中屯、像素點(diǎn)向左向右各一個(gè)像素點(diǎn),則該預(yù)設(shè)窗口內(nèi)包含5個(gè)像素 點(diǎn),該預(yù)設(shè)窗口的像素值為5個(gè)像素點(diǎn)像素值的總和。
[0067] S1014、根據(jù)所述預(yù)設(shè)窗口的像素值,從所述第=圖像中提取與所述預(yù)設(shè)窗口的像 素值差異值最小的區(qū)域?yàn)槟繕?biāo)區(qū)域。
[0068] 由于對于第一圖像中每個(gè)像素點(diǎn),W該像素點(diǎn)為中屯、像素點(diǎn)建立預(yù)設(shè)窗口,并根 據(jù)預(yù)設(shè)窗口的像素值從所述第二圖像中查到的目標(biāo)區(qū)域的方式和原理均相同,故本發(fā)明實(shí) 施例僅W第一像素點(diǎn)為中屯、像素點(diǎn)為例進(jìn)行說明,該第一像素點(diǎn)為第二圖像中的任意一個(gè) 像素點(diǎn),并不具有指示性含義。
[0069] 示例性的,如圖4所示,步驟S1014可W通過W下方式實(shí)現(xiàn):
[0070] S10141、確定所述第一像素點(diǎn)在所述第一圖像中的坐標(biāo),并W所述第一像素點(diǎn)為 中屯、像素點(diǎn)建立預(yù)設(shè)窗口。
[0071] 如圖3a所示;該圖3a中黑色實(shí)屯、方框?yàn)閃第一像素點(diǎn)為中屯、像素點(diǎn),在黑色實(shí)屯、 方框外的邊框(即圖3a中指示的預(yù)設(shè)窗口)為W該第一像素點(diǎn)為中屯、像素點(diǎn)建立的預(yù)設(shè)窗 口,其中,該預(yù)設(shè)窗口的大小可W根據(jù)實(shí)際需要達(dá)到的精度進(jìn)行設(shè)定,本發(fā)明實(shí)施例在此不 再寶述。
[0072] S10142、在保持所述第一像素點(diǎn)縱坐標(biāo)不變的情況下,從所述第二圖像中選取每 個(gè)候選區(qū)域,所述候選區(qū)域的窗口距離與所述第一預(yù)設(shè)窗口大小相同,且所述候選區(qū)域?yàn)?W所述第二圖像中任意一個(gè)像素點(diǎn)為中屯、像素點(diǎn)建立的,所述候選區(qū)域內(nèi)的每個(gè)像素點(diǎn)的 縱坐標(biāo)與所述第一像素點(diǎn)的縱坐標(biāo)相同;
[0073] 其中,所述候選區(qū)域的窗口距離是指候選區(qū)域內(nèi)任意一個(gè)中屯、像素點(diǎn),按照預(yù)設(shè) 距離化,W所述中屯、像素點(diǎn)為中屯、,在所述中屯、像素點(diǎn)四周(上、下、左、由)各延長L個(gè)長度 單位所包含的區(qū)域。
[0074] S10143、計(jì)算每個(gè)所述候選區(qū)域的像素值,所述像素值是指候選區(qū)域內(nèi)所有像素 點(diǎn)的灰度值之和;
[0075] S10144、將所述候選區(qū)域的像素值與所述預(yù)設(shè)窗口的像素值的差異值最小的候選 區(qū)域確定為目標(biāo)區(qū)域。
[0076] 其中,當(dāng)獲取到第一像素點(diǎn)的坐標(biāo)時(shí),可W將所述第一像素點(diǎn)從第二圖像指向第 一圖像的方向,保持縱坐標(biāo)不變的情況下,將第一像素點(diǎn)遍歷所述第二圖像中與所述第一 像素點(diǎn)縱坐標(biāo)相同,但橫坐標(biāo)不同的任何一個(gè)像素點(diǎn),即將第一像素點(diǎn)保持縱坐標(biāo)不變,將 第一像素點(diǎn)從橫軸沿第二圖像指向第一圖像的方向移動(dòng),并可W通過SAD( Sum of Absolute Difference)或SSD(Sum of Squared Difference)算法matching方式從第二圖 像中提取與所述預(yù)設(shè)窗口的像素值差異值最小的區(qū)域?yàn)槟繕?biāo)區(qū)域。
[0077] 示例性的,如圖3b所示,圖3b中示例出將第一像素點(diǎn)保持縱坐標(biāo)不變時(shí),從橫軸沿 第二圖像指向第一圖像的方向,將第一像素點(diǎn)移動(dòng)時(shí),第一像素點(diǎn)的像素值與第二圖像中 在與第一像素點(diǎn)縱坐標(biāo)相同的每個(gè)像素點(diǎn)為中屯、像素點(diǎn)構(gòu)成的預(yù)設(shè)窗口的像素值之間的 差異值,由圖3c可知,在d點(diǎn)所述第二圖像中的預(yù)設(shè)窗口的像素值與第一像素點(diǎn)的像素值之 間的差異值最小,故d點(diǎn)對應(yīng)的預(yù)設(shè)窗口則為本發(fā)明實(shí)施例中的目標(biāo)區(qū)域。
[0078] 當(dāng)然,為了減少計(jì)算量,在獲取到第一像素點(diǎn)的坐標(biāo)W后,可W從所述二圖像中與 所述第一像素點(diǎn)縱坐標(biāo)相同,大于等于橫坐標(biāo)的候選區(qū)域中選取目標(biāo)區(qū)域。
[0079] 當(dāng)然,本發(fā)明實(shí)施例也可W基于第二圖像,在第一圖像中選取與第二圖像中任意 一個(gè)像素點(diǎn)構(gòu)建的預(yù)設(shè)窗口的像素值差異最小的區(qū)域?yàn)槟繕?biāo)區(qū)域,此時(shí),應(yīng)按照第一圖像 指向第二圖像的方向,保持縱坐標(biāo)不變的情況下,將第二圖像中的每個(gè)像素點(diǎn)構(gòu)成的預(yù)設(shè) 窗口遍歷所述第一圖像的候選區(qū)域,W獲取目標(biāo)區(qū)域。
[0080] S1015、確定每個(gè)所述目標(biāo)區(qū)域的中屯、像素點(diǎn);
[0081] S1016、將每個(gè)所述第一圖像的中屯、像素點(diǎn)與所述目標(biāo)區(qū)域的中屯、像素點(diǎn)進(jìn)行匹 配,獲取與所述第一圖像對應(yīng)的=維立體圖像。
[0082] 優(yōu)選的,為了提高識(shí)別精度,需要提取出所述第一圖像中的用戶行為輪廓,在此用 戶行為輪廓的基礎(chǔ)上,獲取每一個(gè)像素點(diǎn)的像素信息,并從=維立體圖像中獲取與之對應(yīng) 的像素點(diǎn)距離信息,由于用戶的用戶行為應(yīng)處于同一平面,因而擁有相近的像素點(diǎn)距離信 息,故在識(shí)別之前,可W對=維立體圖像中用戶行為對應(yīng)的像素點(diǎn)距離進(jìn)行均值操作,W便 用戶行為輪廓內(nèi)的用戶行為與背景等干擾信息進(jìn)行分離,從而高精度的提取出用戶的用戶 行為。
[0083] 需要說明的是,本發(fā)明實(shí)施例中每個(gè)=維立體圖像的大小均和與合成所述=維立 體圖像的二維圖像的大小相同,所述第一圖像中的每個(gè)像素點(diǎn)對應(yīng)的最小差異值則為在= 維立體圖像各像素值。
[0084] 本發(fā)明實(shí)施例對步驟S103的具體實(shí)現(xiàn)方式不進(jìn)行限定。
[0085] 示例性的,一種實(shí)現(xiàn)方式中,步驟S103可W包括:
[0086] S1031A、將每個(gè)=維立體圖像包含的人體輪廓信息進(jìn)行調(diào)整,形成N個(gè)與標(biāo)準(zhǔn)圖像 大小相等的圖像,其中,所述圖像中包含人體輪廓信息;
[0087] 其中,本發(fā)明實(shí)施例對所述將每個(gè)=維立體圖像包含的人體輪廓信息進(jìn)行調(diào)整的 方式不進(jìn)行限定,例如,可W是按照人體的輪廓信息根據(jù)距離放縮后,形成和標(biāo)準(zhǔn)圖像相似 大小的圖像信息。
[0088] S1032A、在預(yù)設(shè)時(shí)間內(nèi),計(jì)算M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與 用戶行為庫中的至少一個(gè)行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度;其中,M《N;
[0089] 其中,所述M個(gè)目標(biāo)圖像為按照預(yù)設(shè)周期,在預(yù)設(shè)時(shí)間內(nèi)從所述N個(gè)圖像中選擇的。
[0090] 本發(fā)明實(shí)施例對所述預(yù)設(shè)周期不進(jìn)行限定,示例性的,該預(yù)設(shè)周期可W為0.5S。
[0091 ] S1033A、在預(yù)設(shè)時(shí)間內(nèi),若確定所述M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓 信息與第一行為標(biāo)準(zhǔn)圖像包含的人體特征信息之間的相似度均大于等于預(yù)設(shè)闊值,則將所 述第一行為標(biāo)準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。
[0092] 計(jì)算每個(gè)目標(biāo)圖像包含的人體輪廓信息與第一行為標(biāo)準(zhǔn)圖像包含的人體特征信 息之間的相似度時(shí),可W采用灰度識(shí)別或者特征值匹配等圖像識(shí)別算法。
[0093] 需要說明的是,在生成人體的輪廓信息時(shí)首先利用背景差分法和陰影消除技術(shù)在 =維立體圖像中提取運(yùn)動(dòng)或者靜止的人體輪廓,將時(shí)變的2D輪廓形狀轉(zhuǎn)換為對應(yīng)的ID距離 向量特征信息處理。
[0094] 通過上述實(shí)現(xiàn)方式,可W利用多組圖像的相似度比對,進(jìn)一步提高用戶的目標(biāo)行 為標(biāo)準(zhǔn)圖像的準(zhǔn)確度,進(jìn)一步增加用戶與智能電視的交互性,提高了音量調(diào)節(jié)的精度W及 用戶體驗(yàn)。另一種實(shí)現(xiàn)方式中,為了精確快速的從所述用戶行為庫中獲取目標(biāo)行為標(biāo)準(zhǔn)圖 像,在所述智能終端中還設(shè)置有人臉特征庫,所述人臉特征庫包括至少一張圖片,所述圖片 中包含人臉信息,所述用戶行為庫還包括所述人臉特征庫中包含的每張圖片對應(yīng)的至少一 張行為標(biāo)準(zhǔn)圖像。
[00巧]所述步驟S103可W包括:
[0096] S1031B、根據(jù)所述每個(gè)=維立體圖像包含的人體輪廓信息從人臉特征庫中獲取目 標(biāo)圖片W及所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像;所述目標(biāo)圖片為所述人臉特征庫 中包含的每個(gè)圖片所包含的人臉信息與每個(gè)=維立體圖像包含的人體輪廓信息匹配的圖 片;
[0097] S1032B、在預(yù)設(shè)時(shí)間內(nèi),計(jì)算M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與 所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度;
[0098] 采用灰度識(shí)別或者特征值匹配等圖像識(shí)別算法,計(jì)算M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖 像包含的人體輪廓信息和目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像中包含的人體特征信息 的相似度。
[0099] S1033B、若確定預(yù)設(shè)時(shí)間所述M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息 與第一行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度均大于等于預(yù)設(shè)闊值,則將所述 第一行為標(biāo)準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。
[0100] 通過該實(shí)現(xiàn)方式,可W通過處理器直接從人臉特征庫選擇出對智能終端進(jìn)行操控 的目標(biāo)用戶對應(yīng)的目標(biāo)圖片,由于目標(biāo)圖片對應(yīng)的行為標(biāo)準(zhǔn)圖像的數(shù)量小于用戶行為庫中 的數(shù)量,運(yùn)樣可W進(jìn)一步縮小計(jì)算每個(gè)=維立體圖像與用戶行為庫中每個(gè)行為標(biāo)準(zhǔn)圖像中 包含的人體特征信息之間的相似度的范圍,不僅縮小了獲取目標(biāo)行為標(biāo)識(shí)圖像的時(shí)間,而 且提高了智能電視音量調(diào)節(jié)的精度。
[0101] 本發(fā)明實(shí)施例對所述預(yù)設(shè)闊值不進(jìn)行限定,用戶可W根據(jù)需要進(jìn)行設(shè)置,示例性 的,本發(fā)明實(shí)施例中的預(yù)設(shè)闊值可W為90%或95%。
[0102] 進(jìn)一步可選的,本發(fā)明實(shí)施例還提供一種實(shí)現(xiàn)方式:
[0103] S1031C、在預(yù)設(shè)時(shí)間內(nèi),若確定所述M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓 信息在用戶行為庫中不存在匹配的目標(biāo)行為標(biāo)準(zhǔn)圖像,則將所述智能終端的音量調(diào)節(jié)至初 始值。
[0104] 其中,本發(fā)明實(shí)施例中的初始值是指自動(dòng)調(diào)整音量之前的音量值。
[0105] 其中,本發(fā)明實(shí)施例對所述預(yù)設(shè)音量適配庫中行為標(biāo)準(zhǔn)圖像與預(yù)設(shè)調(diào)整策略之間 的對應(yīng)關(guān)系不進(jìn)行限定。由于對于調(diào)節(jié)智能終端音量的方式存在多種預(yù)設(shè)調(diào)整策略,不同 的調(diào)整策略對應(yīng)不同的調(diào)整方式W及調(diào)整結(jié)果,本發(fā)明實(shí)施例對此不進(jìn)行限定,示例性的, 本發(fā)明實(shí)施例中的預(yù)設(shè)調(diào)整策略可W為行為標(biāo)準(zhǔn)圖像與目標(biāo)音量的對應(yīng)關(guān)系,也可W為每 個(gè)場景W及用戶在所述場景下的動(dòng)作行為與音量調(diào)整方式的對應(yīng)關(guān)系;或者可W為每個(gè)行 為標(biāo)準(zhǔn)圖像與音量調(diào)整方式之間的對應(yīng)關(guān)系,下面分別進(jìn)行說明。
[0106] 示例性的,第一方面,步驟S104可W通過W下方式實(shí)現(xiàn):
[0107] S1041A、根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像從預(yù)設(shè)音量適配庫中預(yù)設(shè)的行為標(biāo)準(zhǔn)圖像與 目標(biāo)音量的對應(yīng)關(guān)系中確定與所述目標(biāo)行為標(biāo)準(zhǔn)圖像對應(yīng)的目標(biāo)音量;
[0108] S1042A、根據(jù)所述目標(biāo)音量,將智能終端的音量調(diào)整至所述目標(biāo)音量。
[0109] 其中,本發(fā)明實(shí)施例對預(yù)設(shè)音量適配庫中預(yù)設(shè)的行為標(biāo)準(zhǔn)圖像與目標(biāo)音量的對應(yīng) 關(guān)系的存儲(chǔ)方式不進(jìn)行限定,可W是W表格形式存儲(chǔ),如表1所示,也可W是W其他方式進(jìn) 行存儲(chǔ)。
[0110] 表1預(yù)設(shè)音量適配庫中可W包含如下行為標(biāo)準(zhǔn)圖像: 「/"Hill
LQ112」其中,本發(fā)明實(shí)施例對所還行為標(biāo)準(zhǔn)閣像中具體包曾的用尸所處的場景必用尸 在所述場景下的動(dòng)作行為不進(jìn)行限定,用戶可W根據(jù)需要進(jìn)行設(shè)置。例如,該行為標(biāo)準(zhǔn)圖像 1-5可W包含的場景為用戶在打電話,此時(shí)可W將音量適配庫中該為行為標(biāo)準(zhǔn)圖像1-5對應(yīng) 的音量值設(shè)置為音量值5,該行為標(biāo)準(zhǔn)圖像1-1可W包含的場景為智能終端的攝像頭檢測范 圍內(nèi)沒有任何用戶,則可W將該行為標(biāo)準(zhǔn)圖像1-1對應(yīng)的音量值設(shè)置為音量值1。當(dāng)然所述 行為標(biāo)準(zhǔn)圖像1-2還可W包含的場景為用戶未打電話時(shí)的場景,運(yùn)樣當(dāng)智能終端的攝像頭 獲取的行為標(biāo)準(zhǔn)圖像為1-5時(shí),該智能終端的處理器將智能終端的音量調(diào)整為音量值5,當(dāng) 智能終端的攝像頭獲取的行為標(biāo)準(zhǔn)圖像為1-2時(shí),該智能終端的處理器將智能終端的音量 調(diào)整為音量值2。當(dāng)然具體的音量值可W根據(jù)用戶平時(shí)的習(xí)慣進(jìn)行設(shè)置,本發(fā)明實(shí)施例對此 不進(jìn)行限定,當(dāng)用戶在打電話時(shí),具體的音量值可W設(shè)置為不影響用戶打電話時(shí)的音量值, 或者靜音。當(dāng)用戶不接打電話時(shí),可W將具體的音量值設(shè)置為用戶可W聽到的值。
[0113] 當(dāng)然,表1所示的每種手勢對應(yīng)的操作指令可W由用戶進(jìn)行修改。
[0114] 示例性的,第二方面,步驟S104可W通過W下方式實(shí)現(xiàn):
[0115] S1041B、獲取所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景W及用戶在所述場景下的動(dòng)作 行為;
[0116] S1042B、根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景W及用戶在所述場景下的動(dòng)作 行為W及所述預(yù)設(shè)音量適配庫中每個(gè)場景W及用戶在所述場景下的動(dòng)作行為與音量調(diào)整 方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音量調(diào)整方式用于指示 增大或遞減智能終端的音量。
[0117]表2預(yù)設(shè)音量適配庫中可W包含如下行為標(biāo)準(zhǔn)圖像: 「01181
[0119] 其中,本發(fā)明實(shí)施例對所述獲取目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景W及用戶在所述 場景下的動(dòng)作行為的具體方式不進(jìn)行限定。由于用戶行為庫中預(yù)先存儲(chǔ)的每一張行為標(biāo)準(zhǔn) 圖像所指示的場景和動(dòng)作都可W通過用戶通過眼睛自己確定,故可W通過用戶自己確定的 每一張行為標(biāo)準(zhǔn)圖像所指示的場景和動(dòng)作所對應(yīng)的音量值或者調(diào)整方式。
[0120] 其中,本發(fā)明實(shí)施例對所述行為標(biāo)準(zhǔn)圖像中具體包含的用戶所處的場景W及用戶 在所述場景下的動(dòng)作行為不進(jìn)行限定,用戶可W根據(jù)需要進(jìn)行設(shè)置。例如,該行為標(biāo)準(zhǔn)圖像 2-5可W包含的場景為用戶在打電話,此時(shí)可W根據(jù)音量適配庫中該為行為標(biāo)準(zhǔn)圖像2-5對 應(yīng)的音量調(diào)整方式減小智能終端的音量,該行為標(biāo)準(zhǔn)圖像2-1可W包含的場景為智能終端 的攝像頭檢測范圍內(nèi)沒有任何用戶,則可將該行為標(biāo)準(zhǔn)圖像2-1對應(yīng)的音量調(diào)整方式設(shè)置 為音量增大,此時(shí)當(dāng)智能終端的攝像頭獲取的行為標(biāo)準(zhǔn)圖像中指示的用戶行為與所述行為 標(biāo)準(zhǔn)圖像2-1匹配,則可W根據(jù)音量適配庫中該為行為標(biāo)準(zhǔn)圖像2-1對應(yīng)的音量調(diào)整方式增 大智能終端的音量。
[0121] 示例性的,第=方面,步驟S104可W通過W下方式實(shí)現(xiàn):
[0122] S1041C、根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像W及所述預(yù)設(shè)音量適配庫中每個(gè)行為標(biāo)準(zhǔn)圖 像與音量調(diào)整方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音量調(diào)整 方式用于指示增大或遞減智能終端的音量。
[0123] 當(dāng)然,需要說明的是,本發(fā)明實(shí)施例中增大智能終端的音量和減小智能終端的音 量時(shí)還可W對每個(gè)調(diào)整方式設(shè)置一個(gè)最大目標(biāo)音量或最小目標(biāo)音量,即一個(gè)行為標(biāo)準(zhǔn)圖像 對應(yīng)的調(diào)整方式為增大音量,當(dāng)音量增大至最大目標(biāo)音量后,便停止增大,當(dāng)減小至最小目 標(biāo)音量后便停止減小。具體最大目標(biāo)音量或最小目標(biāo)音量的數(shù)值,用戶可W根據(jù)需要進(jìn)行 設(shè)置,本發(fā)明實(shí)施例對此不進(jìn)行限定。
[0124] 進(jìn)一步可選的,步驟S102可W通過W下步驟實(shí)現(xiàn),由于對于從每張=維立體圖像 中獲取=維立體圖像的人體輪廓信息的方式和原理均相同,故本發(fā)明實(shí)施例僅W第一=維 立體圖像為例進(jìn)行說明,所述第一=維立體圖像為所述至少一張=維立體圖像中的任意一 個(gè)=維立體圖像,并不具有任何指示性含義:
[0125] 本發(fā)明實(shí)施例對步驟S102的具體實(shí)現(xiàn)方式不進(jìn)行限定,僅是示例性的,步驟S102 可W通過W下方式實(shí)現(xiàn):
[01%] S1021、從所述第一=維立體圖像中提取人體的特征信息;
[0127] S1022、從所述人體的特征信息中提取人體輪廓;
[0128] S1023、將所述人體輪廓轉(zhuǎn)換為對應(yīng)的矩陣的特征向量,生成人體的人體輪廓信 息。
[0129] 如圖5所示,本發(fā)明實(shí)施例還提供一種音量調(diào)節(jié)裝置,如圖5所示,該音量調(diào)節(jié)裝置 中的各個(gè)功能單元與上述實(shí)施例中提供的一種音量調(diào)節(jié)方法相對應(yīng),具體可W參考本發(fā)明 的上述實(shí)施例中的描述,本發(fā)明實(shí)施例在此不再寶述。如圖5所示,該一種音量調(diào)節(jié)裝置50 包括:
[0130] 合成單元501,用于將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和 第二攝像頭分別同時(shí)拍攝的包含用戶行為的圖像合成至少一張=維立體圖像;
[0131] 獲取單元502,用于在預(yù)設(shè)時(shí)間內(nèi),對所述至少一張=維立體圖像進(jìn)行人體識(shí)別處 理,獲取每個(gè)=維立體圖像包含的人體輪廓信息;
[0132] 確定單元503,用于根據(jù)每個(gè)=維立體圖像包含的人體輪廓信息W及用戶行為庫 中包括的至少一張行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為 標(biāo)準(zhǔn)圖像;
[0133] 調(diào)整單元504,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像W及預(yù)設(shè)調(diào)整策略對智能終端的 音量進(jìn)行調(diào)整。
[0134] 進(jìn)一步可選的,如圖6所示,所述確定單元503,包括:
[0135] 調(diào)整模塊5031A,用于將每個(gè)=維立體圖像包含的人體輪廓信息進(jìn)行調(diào)整,形成N 個(gè)與標(biāo)準(zhǔn)圖像大小相等的圖像,其中,所述圖像中包含人體輪廓信息;
[0136] 第一計(jì)算模塊5032A,用于在預(yù)設(shè)時(shí)間內(nèi),計(jì)算M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含 的人體輪廓信息與用戶行為庫中的至少一個(gè)行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的 相似度;其中,所述M個(gè)目標(biāo)圖像為按照預(yù)設(shè)周期,在預(yù)設(shè)時(shí)間內(nèi)從所述N個(gè)圖像中選擇的;
[0137] 第一確定模塊5033A,用于在預(yù)設(shè)時(shí)間內(nèi),若確定所述M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖 像包含的人體輪廓信息與第一行為標(biāo)準(zhǔn)圖像包含的人體特征信息之間的相似度均大于等 于預(yù)設(shè)闊值,則將所述第一行為標(biāo)準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。
[0138] 進(jìn)一步可選的,所述智能終端還包括人臉特征庫,所述人臉特征庫包括至少一張 圖片,所述圖片中包含人臉信息,所述用戶行為庫還包括所述人臉特征庫中包含的每張圖 片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像;
[0139] 相應(yīng)的,如圖6所示,所述確定單元503,包括:
[0140] 第一獲取模塊5031B,用于根據(jù)所述每個(gè)=維立體圖像包含的人體輪廓信息從人 臉特征庫中獲取目標(biāo)圖片W及所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像;所述目標(biāo)圖片 為所述人臉特征庫中包含的每個(gè)圖片所包含的人臉信息與每個(gè)=維立體圖像包含的人體 輪廓信息匹配的圖片;
[0141] 第二計(jì)算模塊5032B,用于在預(yù)設(shè)時(shí)間內(nèi),計(jì)算M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含 的人體輪廓信息與所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之 間的相似度;
[0142] 第二確定模塊5033B,用于若確定預(yù)設(shè)時(shí)間所述M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含 的人體輪廓信息與第一行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度均大于等于預(yù) 設(shè)闊值,則將所述第一行為標(biāo)準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。
[0143] 進(jìn)一步可選的,所述音量調(diào)節(jié)裝置50還包括:
[0144] 調(diào)節(jié)單元505,用于在預(yù)設(shè)時(shí)間內(nèi),若確定所述M個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含 的人體輪廓信息在用戶行為庫中不存在匹配的目標(biāo)行為標(biāo)準(zhǔn)圖像,則將所述智能終端的音 量調(diào)節(jié)至初始值。
[0145] 進(jìn)一步優(yōu)選的,如圖7所示,所述調(diào)整單元504,包括:
[0146] 第=確定模塊5041A,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像從預(yù)設(shè)音量適配庫中預(yù)設(shè) 的行為標(biāo)準(zhǔn)圖像與目標(biāo)音量的對應(yīng)關(guān)系中確定與所述目標(biāo)行為標(biāo)準(zhǔn)圖像對應(yīng)的目標(biāo)音量;
[0147] 第一調(diào)整模塊5042A,用于根據(jù)所述目標(biāo)音量,將智能終端的音量調(diào)整至所述目標(biāo) 音量;或,
[0148] 第二獲取模塊5041B,用于獲取所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景W及用戶在 所述場景下的動(dòng)作行為;
[0149] 第一調(diào)節(jié)模塊5042B,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景W及用戶在 所述場景下的動(dòng)作行為W及所述預(yù)設(shè)音量適配庫中每個(gè)場景W及用戶在所述場景下的動(dòng) 作行為與音量調(diào)整方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音量 調(diào)整方式用于指示增大或遞減智能終端的音量;或;
[0150] 第二調(diào)節(jié)模塊5041C,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像W及所述預(yù)設(shè)音量適配庫 中每個(gè)行為標(biāo)準(zhǔn)圖像與音量調(diào)整方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào) 整,所述音量調(diào)整方式用于指示增大或遞減智能終端的音量。
[0151] 進(jìn)一步可選的,對于第一=維立體圖像,所述第一=維立體圖像為所述至少一張 =維立體圖像中的任意一個(gè)=維立體圖像;
[0152] 相應(yīng)的,所述獲取單元具體用于:
[0153] 從所述第一=維立體圖像中提取人體的特征信息;
[0154] 從所述人體的特征信息中提取人體輪廓;
[0155] 將所述人體輪廓轉(zhuǎn)換為對應(yīng)的矩陣的特征向量,生成人體的人體輪廓信息。
[0156] 在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所掲露的系統(tǒng),裝置和方法,可W 通過其它的方式實(shí)現(xiàn)。例如,W上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可W有另外的劃分方式,例如多個(gè)單元或組件 可W結(jié)合或者可W集成到另一個(gè)系統(tǒng),或一些特征可W忽略,或不執(zhí)行。另一點(diǎn),所顯示或 討論的相互之間的禪合或直接禪合或通信連接可W是通過一些接口,裝置或單元的間接禪 合或通信連接,可W是電性,機(jī)械或其它的形式。
[0157] 所述作為分離部件說明的單元可W是或者也可W不是物理上分開的,作為單元顯 示的部件可W是或者也可W不是物理單元,即可W位于一個(gè)地方,或者也可W分布到多個(gè) 網(wǎng)絡(luò)單元上??蒞根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目 的。
[0158] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可W集成在一個(gè)處理單元中,也可W 是各個(gè)單元單獨(dú)物理包括,也可W兩個(gè)或兩個(gè)W上單元集成在一個(gè)單元中。上述集成的單 元既可W采用硬件的形式實(shí)現(xiàn),也可W采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0159] 上述W軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可W存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存 儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用W使得一臺(tái)計(jì)算機(jī) 設(shè)備(可W是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部 分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(Read-Only Memory,簡稱 ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory,簡稱RAM)、磁碟或者光盤等各種可W存儲(chǔ) 程序代碼的介質(zhì)。
[0160]最后應(yīng)說明的是:W上實(shí)施例僅用W說明本發(fā)明的技術(shù)方案,而非對其限制;盡管 參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可 W對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換; 而運(yùn)些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和 范圍。
【主權(quán)項(xiàng)】
1. 一種音量調(diào)節(jié)方法,其特征在于,包括: 將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二攝像頭分別同時(shí)拍 攝的包含用戶行為的圖像合成至少一張三維立體圖像; 對所述至少一張三維立體圖像進(jìn)行人體識(shí)別處理,獲取每個(gè)三維立體圖像包含的人體 輪廓信息; 根據(jù)每個(gè)三維立體圖像包含的人體輪廓信息以及用戶行為庫中包括的至少一張行為 標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖像;所述行為標(biāo) 準(zhǔn)圖像包括用戶所處的場景以及用戶在所述場景下的動(dòng)作行為; 根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像以及預(yù)設(shè)音量適配庫中行為標(biāo)準(zhǔn)圖像與預(yù)設(shè)調(diào)整策略之 間的對應(yīng)關(guān)系,對智能終端的音量進(jìn)行調(diào)整。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個(gè)三維立體圖像包含的人體輪 廓信息以及用戶行為庫中包括的至少一個(gè)行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶 行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖像,包括: 將每個(gè)三維立體圖像包含的人體輪廓信息進(jìn)行調(diào)整,形成N個(gè)與標(biāo)準(zhǔn)圖像大小相等的 圖像; 在預(yù)設(shè)時(shí)間內(nèi),計(jì)算Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與用戶行為庫 中的至少一個(gè)行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度;其中,MSN; 若確定所述Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與第一行為標(biāo)準(zhǔn)圖像包 含的人體特征信息之間的相似度均大于等于預(yù)設(shè)閾值,則將所述第一行為標(biāo)準(zhǔn)圖像確定為 目標(biāo)行為標(biāo)準(zhǔn)圖像。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述智能終端還包括人臉特征庫,所述人 臉特征庫包括至少一張圖片,所述圖片中包含人臉信息,所述用戶行為庫還包括所述人臉 特征庫中包含的每張圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像; 相應(yīng)的,所述根據(jù)每個(gè)三維立體圖像包含的人體輪廓信息以及用戶行為庫中包括的至 少一張行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖像, 包括: 根據(jù)所述每個(gè)三維立體圖像包含的人體輪廓信息從人臉特征庫中獲取目標(biāo)圖片以及 所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像;所述目標(biāo)圖片為所述人臉特征庫中包含的每 個(gè)圖片所包含的人臉信息與每個(gè)三維立體圖像包含的人體輪廓信息匹配的圖片; 計(jì)算Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與所述目標(biāo)圖片對應(yīng)的至少一 張行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度; 若確定預(yù)設(shè)時(shí)間內(nèi)所述Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與第一行為 標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度均大于等于預(yù)設(shè)閾值,則將所述第一行為標(biāo) 準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。4. 根據(jù)權(quán)利要求2或3所述的方法,其特征在于,在預(yù)設(shè)時(shí)間內(nèi),若確定所述Μ個(gè)目標(biāo)圖 像中每個(gè)目標(biāo)圖像包含的人體輪廓信息在用戶行為庫中不存在匹配的目標(biāo)行為標(biāo)準(zhǔn)圖像, 則將所述智能終端的音量調(diào)節(jié)至初始值。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像以及預(yù)設(shè) 音量適配庫中行為標(biāo)準(zhǔn)圖像與預(yù)設(shè)調(diào)整策略之間的對應(yīng)關(guān)系,對智能終端的音量進(jìn)行調(diào) 整,包括: 根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像從預(yù)設(shè)音量適配庫中預(yù)設(shè)的行為標(biāo)準(zhǔn)圖像與目標(biāo)音量的 對應(yīng)關(guān)系中確定與所述目標(biāo)行為標(biāo)準(zhǔn)圖像對應(yīng)的目標(biāo)音量; 根據(jù)所述目標(biāo)音量,將智能終端的音量調(diào)整至所述目標(biāo)音量;或, 獲取所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景以及用戶在所述場景下的動(dòng)作行為; 根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景以及用戶在所述場景下的動(dòng)作行為以及所 述預(yù)設(shè)音量適配庫中每個(gè)場景以及用戶在所述場景下的動(dòng)作行為與音量調(diào)整方式之間的 對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音量調(diào)整方式用于指示增大或遞減 智能終端的音量;或; 根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像以及所述預(yù)設(shè)音量適配庫中每個(gè)行為標(biāo)準(zhǔn)圖像與音量調(diào) 整方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音量調(diào)整方式用于指 示增大或遞減智能終端的音量。6. 根據(jù)權(quán)利要求1-5任意一項(xiàng)所述的方法,其特征在于,對于第一三維立體圖像,所述 第一三維立體圖像為所述至少一張三維立體圖像中的任意一個(gè)三維立體圖像; 對所述第一三維立體圖像進(jìn)行人體識(shí)別處理,獲取所述第一三維立體圖像的人體輪廓 信息,包括: 從所述第一三維立體圖像中提取人體的特征信息; 從所述人體的特征信息中提取人體輪廓; 將所述人體輪廓轉(zhuǎn)換為對應(yīng)的矩陣的特征向量,生成人體的輪廓信息。7. -種音量調(diào)節(jié)裝置,其特征在于,包括: 合成單元,用于將預(yù)設(shè)時(shí)間內(nèi)的N個(gè)拍攝時(shí)刻中每個(gè)拍攝時(shí)刻,第一攝像頭和第二攝像 頭分別同時(shí)拍攝的包含用戶行為的圖像合成至少一張三維立體圖像; 獲取單元,用于對所述至少一張三維立體圖像進(jìn)行人體識(shí)別處理,獲取每個(gè)三維立體 圖像包含的人體輪廓信息; 確定單元,用于根據(jù)每個(gè)三維立體圖像包含的人體輪廓信息以及用戶行為庫中包括的 至少一張行為標(biāo)準(zhǔn)圖像包含的人體特征信息,從所述用戶行為庫中確定目標(biāo)行為標(biāo)準(zhǔn)圖 像; 調(diào)整單元,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像以及預(yù)設(shè)調(diào)整策略對智能終端的音量進(jìn)行 調(diào)整。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述確定單元,包括: 調(diào)整模塊,用于將每個(gè)三維立體圖像包含的人體輪廓信息進(jìn)行調(diào)整,形成N個(gè)與標(biāo)準(zhǔn)圖 像大小相等的圖像,其中,所述圖像中包含人體輪廓信息; 第一計(jì)算模塊,用于計(jì)算Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓信息與用戶行 為庫中的至少一個(gè)行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度;其中,MSN; 第一確定模塊,用于在預(yù)設(shè)時(shí)間內(nèi),若確定所述Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人 體輪廓信息與第一行為標(biāo)準(zhǔn)圖像包含的人體特征信息之間的相似度均大于等于預(yù)設(shè)閾值, 則將所述第一行為標(biāo)準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述智能終端還包括人臉特征庫,所述人 臉特征庫包括至少一張圖片,所述圖片中包含人臉信息,所述用戶行為庫還包括所述人臉 特征庫中包含的每張圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像; 相應(yīng)的,所述確定單元,包括: 第一獲取模塊,用于根據(jù)所述每個(gè)三維立體圖像包含的人體輪廓信息從人臉特征庫中 獲取目標(biāo)圖片以及所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像;所述目標(biāo)圖片為所述人臉 特征庫中包含的每個(gè)圖片所包含的人臉信息與每個(gè)三維立體圖像包含的人體輪廓信息匹 配的圖片; 第二計(jì)算模塊,用于在預(yù)設(shè)時(shí)間內(nèi),計(jì)算Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪廓 信息與所述目標(biāo)圖片對應(yīng)的至少一張行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度; 第二確定模塊,用于若確定預(yù)設(shè)時(shí)間所述Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪 廓信息與第一行為標(biāo)準(zhǔn)圖像中包含的人體特征信息之間的相似度均大于等于預(yù)設(shè)閾值,則 將所述第一行為標(biāo)準(zhǔn)圖像確定為目標(biāo)行為標(biāo)準(zhǔn)圖像。10. 根據(jù)權(quán)利要求8或9所述的裝置,其特征在于,所述裝置還包括: 調(diào)節(jié)單元,用于在預(yù)設(shè)時(shí)間內(nèi),若確定所述Μ個(gè)目標(biāo)圖像中每個(gè)目標(biāo)圖像包含的人體輪 廓信息在用戶行為庫中不存在匹配的目標(biāo)行為標(biāo)準(zhǔn)圖像,則將所述智能終端的音量調(diào)節(jié)至 初始值。11. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述調(diào)整單元,包括: 第三確定模塊,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像從預(yù)設(shè)音量適配庫中預(yù)設(shè)的行為標(biāo)準(zhǔn) 圖像與目標(biāo)音量的對應(yīng)關(guān)系中確定與所述目標(biāo)行為標(biāo)準(zhǔn)圖像對應(yīng)的目標(biāo)音量; 第一調(diào)整模塊,用于根據(jù)所述目標(biāo)音量,將智能終端的音量調(diào)整至所述目標(biāo)音量;或, 第二獲取模塊,用于獲取所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景以及用戶在所述場景下 的動(dòng)作行為; 第一調(diào)節(jié)模塊,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像所指示的場景以及用戶在所述場景下 的動(dòng)作行為以及所述預(yù)設(shè)音量適配庫中每個(gè)場景以及用戶在所述場景下的動(dòng)作行為與音 量調(diào)整方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音量調(diào)整方式用 于指示增大或遞減智能終端的音量;或; 第二調(diào)節(jié)模塊,用于根據(jù)所述目標(biāo)行為標(biāo)準(zhǔn)圖像以及所述預(yù)設(shè)音量適配庫中每個(gè)行為 標(biāo)準(zhǔn)圖像與音量調(diào)整方式之間的對應(yīng)關(guān)系,對所述智能終端當(dāng)前的音量進(jìn)行調(diào)整,所述音 量調(diào)整方式用于指示增大或遞減智能終端的音量。12. 根據(jù)權(quán)利要求7-11任意一項(xiàng)所述的裝置,其特征在于,對于第一三維立體圖像,所 述第一三維立體圖像為所述至少一張三維立體圖像中的任意一個(gè)三維立體圖像; 相應(yīng)的,所述獲取單元具體用于: 從所述第一三維立體圖像中提取人體的特征信息; 從所述人體的特征信息中提取人體輪廓; 將所述人體輪廓轉(zhuǎn)換為對應(yīng)的矩陣的特征向量,生成人體的人體輪廓信息。13. -種智能終端,其特征在于,所述智能終端包括處理器、存儲(chǔ)器、系統(tǒng)總線和通信接 口、平行設(shè)置在所述智能終端上的第一攝像頭和第二攝像頭,運(yùn)行在所述智能終端處理器 上的音量調(diào)節(jié)裝置和聲音播放終端; 其中,所述第一攝像頭和第二攝像頭處于同一水平線上; 所述第一攝像頭和第二攝像頭,用于在預(yù)設(shè)時(shí)間拍攝至少一張包含用戶行為的圖像; 所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)執(zhí)行指令,所述處理器與所述存儲(chǔ)器通過所述系統(tǒng)總線連 接,當(dāng)所述智能終端運(yùn)行時(shí),所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的所述計(jì)算機(jī)執(zhí)行指令,以使 所述智能終端執(zhí)行如權(quán)利要求1-6任意一項(xiàng)所述的音量調(diào)節(jié)方法。
【文檔編號(hào)】G06K9/00GK105979358SQ201610292050
【公開日】2016年9月28日
【申請日】2016年5月5日
【發(fā)明人】紀(jì)開虎, 仲維
【申請人】青島海信電器股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1