專利名稱:人機交互方法和裝置的制作方法
人機交互方法和裝置
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像分析領(lǐng)域,特別是涉及一種人機交互方法和裝置。
背景技術(shù):
近年來,隨著智能終端設(shè)備的普及,尋求一種更自然更簡單的人機交互方式已然成為科研和產(chǎn)業(yè)領(lǐng)域的熱點問題。縱觀人機交互技術(shù)的發(fā)展歷史,已逐漸從鼠標(biāo)、鍵盤、遙控器等方式發(fā)展為視覺、語音、姿態(tài)等非接觸式的操作方式,而且視覺技術(shù)作為其中最為重要的手段。即通過攝像頭獲取畫面,基于圖像智能分析技術(shù)判斷操作者的動作和意圖,進而控制機器。但其所面臨最大的問題是環(huán)境的復(fù)雜性和不確定性,使得該技術(shù)還未完全成熟。隨著3D技術(shù)的發(fā)展,微軟推出了 Kinect系統(tǒng),其通過動態(tài)三維重建技術(shù),將人機交互由2D的圖像空間拓展到真實的3D空間,3D空間的深度信息有效的解決了 2D空間中較為復(fù)雜的背景分割問題,使得該技術(shù)趨于成熟,并已應(yīng)用到電視機、游戲機等設(shè)備中,用做外置的人機交互設(shè)備。但是基于3D技術(shù)的手勢體感控制技術(shù):以微軟Kinect系統(tǒng)為代表的該技術(shù)通過動態(tài)三維重構(gòu)技術(shù)實現(xiàn)了對場景的三維實時重建,將視覺檢測算法由2D導(dǎo)入3D空間進行,降低了識別的難度,但增加了硬件成本和計算量,而且產(chǎn)品體積較大,很難嵌入到現(xiàn)有的智能終端設(shè)備中。而且傳統(tǒng)技術(shù)都是預(yù)設(shè)好特定的目標(biāo)圖像,使得用戶在使用過程中,提供目標(biāo)必須限定在預(yù)設(shè)的特定目標(biāo)圖像內(nèi),靈活度較低。
發(fā)明內(nèi)容基于傳統(tǒng)技術(shù)的各種不足,有必要提供一種可用戶自定義目標(biāo)圖像的人機交互方法和裝置。
`
一種人機交互方法,包括如下步驟:步驟S201,接收用戶輸入的學(xué)習(xí)指令,啟動學(xué)習(xí)模式;步驟S202,獲取用戶指定的目標(biāo)圖像,采集正樣本和負(fù)樣本,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器;步驟S203,存儲所述包含多個決策樹的多個分類器,以及存儲所述正樣本和負(fù)樣本,形成正負(fù)樣本合集;步驟S204,接收用戶輸入的檢測指令,啟動檢測模式;步驟S205,獲取待測圖像;步驟S206,利用所述多個決策樹的分類器計算所述待測圖像與目標(biāo)圖像相同的概率,輸出對應(yīng)的多個概率值;步驟S207,根據(jù)所述多個概率值和預(yù)設(shè)的判定閥值,判定所述待測圖像是否為所述目標(biāo)圖像;步驟S208,分析并得到所述待測圖像和正負(fù)樣本合集的相關(guān)度;
步驟S209,根據(jù)所述相關(guān)度和預(yù)設(shè)的第一相關(guān)度閥值,判定所述待測圖像是否為所述目標(biāo)圖像;步驟S210,當(dāng)所述待測圖像在所述判定閥值和所述第一相關(guān)度閥值下均判定與所述目標(biāo)圖像相同時,最終判定所述待測圖像是所述目標(biāo)圖像;步驟S212,利用最終判定與所述目標(biāo)圖像相同的所述待測圖像,調(diào)整所述多個決策樹的分類器的參數(shù);步驟S214,當(dāng)最終判定與所述目標(biāo)圖像相同的所述待測圖像的相關(guān)度滿足預(yù)設(shè)的第二相關(guān)度閥值時,將所述待測圖像作為正樣本添加到所述正負(fù)樣本合集中,當(dāng)最終判定與所述目標(biāo)圖像不同的所述待測圖像的概率值達到預(yù)設(shè)校正閥值時,將所述待測圖像作為負(fù)樣本添加到所述正負(fù)樣本合集中。本發(fā)明一較佳實施例中,所述步驟S202中采集正樣本和負(fù)樣本的動作包括對所述目標(biāo)圖像進行旋轉(zhuǎn)、投影、縮放或平移處理,并分別采集正樣本。本發(fā)明一較佳實施例中,所述步驟S206是先提取所述待測圖像的方差值,利用預(yù)設(shè)的方差閥值排除不滿足要求的所述待測圖像,再計算滿足所述方差閥值要求的所述待測圖像與所述目標(biāo)圖像相同的概率。本發(fā)明一較佳實施例中,所述預(yù)設(shè)的判定閥值設(shè)置為所述步驟S202中訓(xùn)練時驗證負(fù)樣本的最大概率值。本發(fā)明一較佳實施例中,人機交互方法還包括如下步驟步驟S301,提取并記錄判定與所述目標(biāo)圖像相同的所述待測圖像的坐標(biāo)信息;步驟S302,當(dāng)檢測到判定與所述目標(biāo)圖像相同的所述待測圖像停頓時間第一次達到預(yù)設(shè)時間閥值,開始記錄所述待測圖像的運動軌跡;步驟S303,當(dāng)檢測到判定與所述目標(biāo)圖像相同的所述待測圖像停頓時間第二次達到預(yù)設(shè)時間閥值,停止記錄所述待測圖像的軌跡;步驟S304,根據(jù)所述記錄的軌跡進行文字識別。一種人機交互裝置,其包括:學(xué)習(xí)指令接收單元,用于接收用戶輸入的學(xué)習(xí)指令,啟動學(xué)習(xí)模式;訓(xùn)練單元,用于響應(yīng)所述學(xué)習(xí)指令,獲取用戶指定的目標(biāo)圖像,采集正樣本和負(fù)樣本,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器存儲單元,用于存儲所述包含多個決策樹的多個分類器,以及存儲所述正樣本和負(fù)樣本,形成正負(fù)樣本合集。檢測指令接收單元,用于接收用戶輸入的檢測指令,啟動檢測模式。圖像獲取單元,用于獲取待測圖像識別單元,用于利用所述多個決策樹的分類器計算所述待測圖像與所述目標(biāo)圖像相同的概率,輸出對應(yīng)的多個概率值;并根據(jù)所述多個概率值和預(yù)設(shè)的判定閥值,判定所述待測圖像是否為所述目標(biāo)圖像比較單元,用于分析并得到所述待測圖像和正負(fù)樣本合集的相關(guān)度;并根據(jù)所述相關(guān)度和預(yù)設(shè)的第一相關(guān)度閥值,判定所述待測圖像是否為所述目標(biāo)圖像。判定單元,用于在所述待測圖像在所述判定閥值和所述第一相關(guān)度閥值下均判定與所述目標(biāo)圖像相同時,最終判定所述待測圖像是所述目標(biāo)圖像。
更新單元,用于利用最終判定與所述目標(biāo)圖像相同的所述待測圖像,調(diào)整所述多個決策樹的分類器的參數(shù);當(dāng)最終判定與所述目標(biāo)圖像相同的所述待測圖像的相關(guān)度滿足預(yù)設(shè)的第二相關(guān)度閥值時,將所述待測圖像作為正樣本添加到所述正負(fù)樣本合集中,當(dāng)最終判定與所述目標(biāo)圖像不同的所述待測圖像的概率值達到預(yù)設(shè)校正閥值時,將所述待測圖像作為負(fù)樣本添加到所述正負(fù)樣本合集中。本發(fā)明一較佳實施例中,所述訓(xùn)練單元采集正樣本和負(fù)樣本的動作包括對目標(biāo)圖像進行旋轉(zhuǎn)、投影、縮放或平移處理,并分別采集正樣本。本發(fā)明一較佳實施例中,所述識別單元用于提取所述待測圖像的方差值,利用預(yù)設(shè)的方差閥值排除不滿足要求的所述待測圖像,并計算滿足方差閥值要求的所述待測圖像與所述目標(biāo)圖像相同的概率。本發(fā)明一較佳實施例中,所述預(yù)設(shè)的判定閥值設(shè)置為所述訓(xùn)練單元在訓(xùn)練時驗證負(fù)樣本的最大概率值。上述人機交互方法和裝置可接收用戶的自定義目標(biāo)圖像,作為識別對象,為用戶使用提供了很好的靈活性。并且還利用待測圖像對分類器進行修正以及補充目標(biāo)圖像的正負(fù)樣本,使得人機交互的穩(wěn)定性在使用過程中持續(xù)增強,實現(xiàn)效果更好的人機交互功能。
圖1為一實施例的人機交互方法的步驟流程
圖2為基于人機交互方法的動作書寫方法的步驟流程圖;圖3為一實施例的人機交互裝置的功能模塊圖。
具體實施方式為了解決傳統(tǒng)技術(shù)中用戶使用時的靈活度不高的問題,提出了一種可用戶自定義目標(biāo)圖像的人機交互方法和裝置。如圖1所示,其為一實施例的人機交互方法的步驟流程圖,包括如下步驟:步驟S201,接收用戶輸入的學(xué)習(xí)指令,啟動學(xué)習(xí)模式。步驟S202,獲取用戶指定的目標(biāo)圖像,采集正樣本和負(fù)樣本,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器。所述獲取用戶指定的目標(biāo)圖像即是用戶自定義目標(biāo)圖像。假設(shè),用戶希望利用手掌來來實現(xiàn)人機交互。便可以在學(xué)習(xí)模式下,通過攝像頭提供手掌圖像作為目標(biāo)圖像。為了使得采集正樣本更全面,本發(fā)明通過對目標(biāo)圖像進行旋轉(zhuǎn)、投影、縮放以及平移等處理,以獲得更為豐富的正樣本。所述多個決策樹的分類器,是通過對目標(biāo)圖像進行對點特征描述,然后通過預(yù)設(shè)的多棵(如10棵)決策樹建立用于圖像識別的多個分類器,實現(xiàn)相似概率的計算。步驟S203,存儲所述包含多個決策樹的多個分類器,以及存儲所述正樣本和負(fù)樣本,形成正負(fù)樣本合集。步驟S204,接收用戶輸入的檢測指令,啟動檢測模式。步驟S205,獲取待測圖像。獲取待測圖像的方式可以是通過攝像頭拍攝圖像,然后通過不同尺寸的滑動窗口以窮搜的方式從拍攝的圖像中獲取待測圖像。步驟S206,利用所述多個決策樹的分類器計算所述待測圖像與目標(biāo)圖像相同的概率,輸出對應(yīng)的多個概率值。為了提高檢測效率,本發(fā)明一實施例中,步驟S206是首先提取待測圖像的方差值,再利用預(yù)設(shè)的方差閥值直接排除不滿足要求的待測圖像,只計算滿足方差閥值要求的待測圖像與所述目標(biāo)圖像相同的概率。步驟S207,根據(jù)所述多個概率值和預(yù)設(shè)的判定閥值,判定待測圖像是否為目標(biāo)圖像。判定方式可以是先對多個概率值取平均得到平均概率值,然后根據(jù)平均概率值是否大于預(yù)設(shè)的判定閥值,判定待測圖像是否與目標(biāo)圖像相同。本發(fā)明一較佳實施例中,所述預(yù)設(shè)的判定閥值設(shè)置為步驟S202中訓(xùn)練時驗證負(fù)樣本的最大概率值。步驟S208,分析并得到待測圖像和正負(fù)樣本合集的相關(guān)度。步驟S209,根據(jù)所述相關(guān)度和預(yù)設(shè)的第一相關(guān)度閥值,判定待測圖像是否為目標(biāo)圖像。至于判定待測圖像是目標(biāo)圖像后,需要執(zhí)行的指令,則根據(jù)不同情況設(shè)置,如控制鼠標(biāo)指針的動作或其他。步驟S210,當(dāng)待測圖像在判定閥值和第一相關(guān)度閥值下均判定與目標(biāo)圖像相同時,最終判定待測圖像是目標(biāo)圖像。步驟S212,利用最終判定與目標(biāo)圖像相同的待測圖像,調(diào)整所述多個決策樹的分類器的參數(shù)。步驟S214,當(dāng)最終判定與目標(biāo)圖像相同的待測圖像的相關(guān)度滿足預(yù)設(shè)的第二相關(guān)度閥值時,將待測圖像作為正樣本添加到正負(fù)樣本合集中,當(dāng)最終判定與目標(biāo)圖像不同的待測圖像的概率值達到預(yù)設(shè)校正閥值時,將待測圖像作為負(fù)樣本添加到正負(fù)樣本合集中。因為用戶在設(shè)定目標(biāo)圖像時,提供的目標(biāo)圖像的樣本數(shù)量有限,為了進一步提高識別精度,上述人機交互方法在圖像識別過程中,利用判定是目標(biāo)圖像的待測圖像作為目標(biāo)圖像的正樣本補充以及分類器的參數(shù)調(diào)整。還利用判定不是目標(biāo)圖像的待測圖像,但又非常接近目標(biāo)圖像的待測圖像作為目標(biāo)圖像的負(fù)樣本補充。上述人機交互方法可接收用戶的自定義目標(biāo)圖像,作為識別對象,為用戶使用提供了很好的靈活性。并且還利用待測圖像對分類器進行修正以及補充目標(biāo)圖像的正負(fù)樣本,使得人機交互的穩(wěn)定性在使用過程中持續(xù)增強,實現(xiàn)效果更好的人機交互功能。如圖2所示,基于上述人機交互方法的動作書寫方法包括如下步驟:步驟S301,提取并記錄判定與目標(biāo)圖像相同的待測圖像的坐標(biāo)信息。待測圖像的坐標(biāo)信息可以通過對判定結(jié)果相同的多個待測圖像進行聚類和坐標(biāo)加權(quán)平均處理獲得。步驟S302,當(dāng)檢測到判定與目標(biāo)圖像相同的待測圖像停頓時間第一次達到預(yù)設(shè)時間閥值,開始記錄待測圖像的運動軌跡。步驟S303,當(dāng)檢測到判定與目標(biāo)圖像相同的待測圖像停頓時間第二次達到預(yù)設(shè)時間閥值,停止記錄待測圖像的軌跡。步驟S304,根據(jù)記錄的軌跡進行文字識別。以實現(xiàn)用戶利用自己定義的目標(biāo)圖像(手掌)移動,實現(xiàn)書寫輸入功能。軌跡的記錄需要選擇與目標(biāo)圖像相同的待測圖像中的目標(biāo)點來進行記錄,本發(fā)明一實施例中,目標(biāo)點的確定方式包括如下步驟:初始化需要跟蹤的點。計算出兩幀圖像的光流金字塔,根據(jù)兩幀圖像之間的光流來計算由初始化的需要跟蹤的點對應(yīng)當(dāng)前巾貞圖像中的目標(biāo)點。將上一幀圖像與當(dāng)前幀圖像的互換以及將上一幀圖像與當(dāng)前幀圖像的金字塔互換,根據(jù)兩幀圖像之間的光流來計算上一幀圖像中對于當(dāng)前幀圖像中的目標(biāo)點。如圖3所示,其為一實施例的人機交互裝置40的功能模塊圖,包括:學(xué)習(xí)指令接收單元400、訓(xùn)練單元402、存儲單元404、檢測指令接收單元406、圖像獲取單元408、識別單元410、比較單元412、判定單元414和更新單元416。學(xué)習(xí)指令接收單元400用于接收用戶輸入的學(xué)習(xí)指令,啟動學(xué)習(xí)模式訓(xùn)練單元402用于響應(yīng)學(xué)習(xí)指令,獲取用戶指定的目標(biāo)圖像,采集正樣本和負(fù)樣本,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器。所述獲取用戶指定的目標(biāo)圖像即是用戶自定義目標(biāo)圖像。假設(shè),用戶希望利用手掌來來實現(xiàn)人機交互。便可以在學(xué)習(xí)模式下,通過攝像頭提供手掌圖像作為目標(biāo)圖像。為了使得采集正樣本更全面,本發(fā)明訓(xùn)練單元402用于通過對目標(biāo)圖像進行旋轉(zhuǎn)、投影、縮放以及平移等處理,以獲得更為豐富的正樣本。所述多個決策樹的分類器,是通過對目標(biāo)圖像進行對點特征描述,然后通過預(yù)設(shè)的多棵(如10棵)決策樹建立用于圖像識別的多個分類器,實現(xiàn)相似概率的計算。存儲單元404用于存儲所述包含多個決策樹的多個分類器,以及存儲所述正樣本和負(fù)樣本,形成正負(fù)樣本合集。檢測指令接收單元406用于接收用戶輸入的檢測指令,啟動檢測模式。圖像獲取單元408用于獲取待測圖像。獲取待測圖像的方式可以是通過攝像頭拍攝圖像,然后通過不同尺寸的滑動窗口以窮搜的方式從拍攝的圖像中獲取待測圖像。識別單元410用于利用所述多個決策樹的分類器計算所述待測圖像與目標(biāo)圖像相同的概率,輸出對應(yīng)的多個概率值;并根據(jù)所述多個概率值和預(yù)設(shè)的判定閥值,判定待測圖像是否為目標(biāo)圖像。為了提高檢測效率,本發(fā)明一實施例中,識別單元410用于提取待測圖像的方差值,利用預(yù)設(shè)的方差閥值直接排除不滿足要求的待測圖像,并計算滿足方差閥值要求的待測圖像與所述目標(biāo)圖像相同的概率。判定方式可以是先對多個概率值取平均得到平均概率值,然后根據(jù)平均概率值是否大于預(yù)設(shè)的判定閥值,判定待測圖像是否與目標(biāo)圖像相同。本發(fā)明一較佳實施例中,所述預(yù)設(shè)的判定閥值設(shè)置為訓(xùn)練單元402在訓(xùn)練時驗證負(fù)樣本的最大概率值。比較單元412用于分析并得到待測圖像和正負(fù)樣本合集的相關(guān)度;并根據(jù)所述相關(guān)度和預(yù)設(shè)的第一相關(guān)度閥值,判定待測圖像是否為目標(biāo)圖像。判定單元414用于在待測圖像在判定閥值和第一相關(guān)度閥值下均判定與目標(biāo)圖像相同時,最終判定待測圖像是目標(biāo)圖像。
更新單元416用于利用最終判定與目標(biāo)圖像相同的待測圖像,調(diào)整所述多個決策樹的分類器的參數(shù);當(dāng)最終判定與目標(biāo)圖像相同的待測圖像的相關(guān)度滿足預(yù)設(shè)的第二相關(guān)度閥值時,將待測圖像作為正樣本添加到正負(fù)樣本合集中,當(dāng)最終判定與目標(biāo)圖像不同的待測圖像的概率值達到預(yù)設(shè)校正閥值時,將待測圖像作為負(fù)樣本添加到正負(fù)樣本合集中。因為訓(xùn)練單元402在接收用戶設(shè)定目標(biāo)圖像時,采集的樣本數(shù)量有限,為了進一步提高識別精度,上述人機交互裝置在圖像識別過程中,更新單元416利用判定是目標(biāo)圖像的待測圖像作為目標(biāo)圖像的正樣本補充以及分類器的參數(shù)調(diào)整,還利用判定不是目標(biāo)圖像的待測圖像,但又非常接近目標(biāo)圖像的待測圖像作為目標(biāo)圖像的負(fù)樣本補充。上述人機交互裝置可接收用戶的自定義目標(biāo)圖像,作為識別對象,為用戶使用提供了很好的靈活性。并且還利用待測圖像對分類器進行修正以及補充目標(biāo)圖像的正負(fù)樣本,使得人機交互的穩(wěn)定性在使用過程中持續(xù)增強,實現(xiàn)效果更好的人機交互功能。以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種人機交互方法,其特征在于,包括如下步驟: 步驟S201,接收用戶輸入的學(xué)習(xí)指令,啟動學(xué)習(xí)模式; 步驟S202,獲取用戶指定的目標(biāo)圖像,采集正樣本和負(fù)樣本,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器; 步驟S203,存儲所述包含多個決策樹的多個分類器,以及存儲所述正樣本和負(fù)樣本,形成正負(fù)樣本合集; 步驟S204,接收用戶輸入的檢測指令,啟動檢測模式; 步驟S205,獲取待測圖像; 步驟S206,利用所述多個決策樹的分類器計算所述待測圖像與目標(biāo)圖像相同的概率,輸出對應(yīng)的多個概率值; 步驟S207,根據(jù) 所述多個概率值和預(yù)設(shè)的判定閥值,判定所述待測圖像是否為所述目標(biāo)圖像; 步驟S208,分析并得到所述待測圖像和正負(fù)樣本合集的相關(guān)度; 步驟S209,根據(jù)所述相關(guān)度和預(yù)設(shè)的第一相關(guān)度閥值,判定所述待測圖像是否為所述目標(biāo)圖像; 步驟S210,當(dāng)所述待測圖像在所述判定閥值和所述第一相關(guān)度閥值下均判定與所述目標(biāo)圖像相同時,最終判定所述待測圖像是所述目標(biāo)圖像; 步驟S212,利用最終判定與所述目標(biāo)圖像相同的所述待測圖像,調(diào)整所述多個決策樹的分類器的參數(shù); 步驟S214,當(dāng)最終判定與所述目標(biāo)圖像相同的所述待測圖像的相關(guān)度滿足預(yù)設(shè)的第二相關(guān)度閥值時,將所述待測圖像作為正樣本添加到所述正負(fù)樣本合集中,當(dāng)最終判定與所述目標(biāo)圖像不同的所述待測圖像的概率值達到預(yù)設(shè)校正閥值時,將所述待測圖像作為負(fù)樣本添加到所述正負(fù)樣本合集中。
2.根據(jù)權(quán)利要求1所述的人機交互方法,其特征在于,所述步驟S202中采集正樣本和負(fù)樣本的動作包括對所述目標(biāo)圖像進行旋轉(zhuǎn)、投影、縮放或平移處理,并分別采集正樣本。
3.根據(jù)權(quán)利要求1所述的人機交互方法,其特征在于,所述步驟S206是先提取所述待測圖像的方差值,利用預(yù)設(shè)的方差閥值排除不滿足要求的所述待測圖像,再計算滿足所述方差閥值要求的所述待測圖像與所述目標(biāo)圖像相同的概率。
4.根據(jù)權(quán)利要求1所述的人機交互方法,其特征在于,所述預(yù)設(shè)的判定閥值設(shè)置為所述步驟S202中訓(xùn)練時驗證負(fù)樣本的最大概率值。
5.根據(jù)權(quán)利要求1所述的人機交互方法,其特征在于,所述人機交互方法還包括如下步驟 步驟S301,提取并記錄判定與所述目標(biāo)圖像相同的所述待測圖像的坐標(biāo)信息; 步驟S302,當(dāng)檢測到判定與所述目標(biāo)圖像相同的所述待測圖像停頓時間第一次達到預(yù)設(shè)時間閥值,開始記錄所述待測圖像的運動軌跡; 步驟S303,當(dāng)檢測到判定與所述目標(biāo)圖像相同的所述待測圖像停頓時間第二次達到預(yù)設(shè)時間閥值,停止記錄所述待測圖像的軌跡; 步驟S304,根據(jù)所述記錄的軌跡進行文字識別。
6.一種人機交互裝置,其特征在于,其包括:學(xué)習(xí)指令接收單元,用于接收用戶輸入的學(xué)習(xí)指令,啟動學(xué)習(xí)模式; 訓(xùn)練單元,用于響應(yīng)所述學(xué)習(xí)指令,獲取用戶指定的目標(biāo)圖像,采集正樣本和負(fù)樣本,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器 存儲單元,用于存儲所述包含多個決策樹的多個分類器,以及存儲所述正樣本和負(fù)樣本,形成正負(fù)樣本合集。
檢測指令接收單元,用于接收用戶輸入的檢測指令,啟動檢測模式。
圖像獲取單元,用于獲取待測圖像 識別單元,用于利用所述多個決策樹的分類器計算所述待測圖像與所述目標(biāo)圖像相同的概率,輸出對應(yīng)的多個概率值;并根據(jù)所述多個概率值和預(yù)設(shè)的判定閥值,判定所述待測圖像是否為所述目標(biāo)圖像 比較單元,用于分析并得到所述待測圖像和正負(fù)樣本合集的相關(guān)度;并根據(jù)所述相關(guān)度和預(yù)設(shè)的第一相關(guān)度閥值,判定所述待測圖像是否為所述目標(biāo)圖像。
判定單元,用于在所述待測圖像在所述判定閥值和所述第一相關(guān)度閥值下均判定與所述目標(biāo)圖像相同時,最終判定所述待測圖像是所述目標(biāo)圖像。
更新單元,用于利用最終判定與所述目標(biāo)圖像相同的所述待測圖像,調(diào)整所述多個決策樹的分類器的參數(shù);當(dāng)最終判定與所述目標(biāo)圖像相同的所述待測圖像的相關(guān)度滿足預(yù)設(shè)的第二相關(guān)度閥值時,將所述待測圖像作為正樣本添加到所述正負(fù)樣本合集中,當(dāng)最終判定與所述目標(biāo)圖像不同的所述待測圖像的概率值達到預(yù)設(shè)校正閥值時,將所述待測圖像作為負(fù)樣本添加到所述正負(fù)樣本合集中。
7.根據(jù)權(quán)利要求6所述的人機交互裝置,其特征在于,所述訓(xùn)練單元采集正樣本和負(fù)樣本的動作包括對目標(biāo)圖像進行旋轉(zhuǎn)、投影、縮放或平移處理,并分別采集正樣本。`
8.根據(jù)權(quán)利要求6所述的人機交互裝置,其特征在于,所述識別單元用于提取所述待測圖像的方差值,利用預(yù)設(shè)的方差閥值排除不滿足要求的所述待測圖像,并計算滿足方差閥值要求的所述待測圖像與所述目標(biāo)圖像相同的概率。
9.根據(jù)權(quán)利要求6所述的人機交互裝置,其特征在于,所述預(yù)設(shè)的判定閥值設(shè)置為所述訓(xùn)練單元在訓(xùn)練時驗證負(fù)樣本的最大概率值。
全文摘要
一種人機交互方法包括如下步驟獲取用戶指定的目標(biāo)圖像,并基于隨機森林訓(xùn)練,建立包含多個決策樹的分類器;存儲包含多個決策樹的多個分類器和正負(fù)樣本合集;獲取待測圖像;計算待測圖像與目標(biāo)圖像相同的概率;根據(jù)預(yù)設(shè)的判定閥值,判定待測圖像是否為目標(biāo)圖像;分析并得到待測圖像和正負(fù)樣本合集的相關(guān)度;根據(jù)第一相關(guān)度閥值判定待測圖像是否為目標(biāo)圖像;當(dāng)在判定閥值和第一相關(guān)度閥值下均判定與目標(biāo)圖像相同時,最終判定待測圖像是目標(biāo)圖像;利用待測圖像調(diào)整分類器的參數(shù)以及補充正負(fù)樣本合集。本發(fā)明還提供一種人機交互裝置。上述方法和裝置可實現(xiàn)用戶自定義目標(biāo)圖像且能在使用過程中不斷增強識別精度和系統(tǒng)穩(wěn)定性。
文檔編號G06K9/66GK103105924SQ201110361120
公開日2013年5月15日 申請日期2011年11月15日 優(yōu)先權(quán)日2011年11月15日
發(fā)明者鄭鋒, 趙顏果, 宋展 申請人:中國科學(xué)院深圳先進技術(shù)研究院