本發(fā)明涉及互聯(lián)網(wǎng)技術領域,尤其涉及一種對象識別方法和對象識別裝置。
背景技術:
隨著互聯(lián)網(wǎng)技術的快速發(fā)展,用戶可以通過終端設備來觀看視頻,特別地,用戶不僅可以在品牌商贊助制作或人工投放的特定視頻節(jié)目中購物,而且還可以在視頻平臺允許的任意視頻場景中,實時搜索視頻場景中出現(xiàn)的明星身上的衣服、飾品、數(shù)碼產(chǎn)品等、或布景中的沙發(fā)窗簾臺燈等“同款”、以及解說人所介紹和推廣的產(chǎn)品,并購物該“同款”或該產(chǎn)品、即“邊看邊買”,從而相對于以前的“觀眾追劇-登錄購物網(wǎng)站-搜索相關物品-篩選比價-確定購買”的冗長鏈條,用戶無需跳出正在觀看的視頻就能夠購買該“同款”或解說人所介紹和推廣的產(chǎn)品。
上述“邊看邊買”過程為“觀看-搜索-瀏覽-比對-購買”。具體地,“邊看邊買”過程包括:首先,用戶使用終端設備觀看視頻;其次,用戶在該視頻畫面上搜索上述“同款”或解說人所介紹和推廣的產(chǎn)品;然后,在搜索到該“同款”或解說人所介紹和推廣的產(chǎn)品之后,用戶瀏覽該視頻畫面上所顯示的各種購物信息(例如,在視頻畫面的半屏底部所顯示的各種購物信息);接著,用戶將所顯示的各種購物信息與上述“同款”或解說人所介紹和推廣的產(chǎn)品進行比對,并找到與上述“同款”或解說人所介紹和推廣的產(chǎn)品相對應的購物信息;最后,用戶點擊所找到的購物信息以進入購物入口來購買上述“同款”或解說人所介紹和推廣的產(chǎn)品。
然而,上述“邊看邊買”購物過程存在操作繁瑣、用戶的學習成本較高、用戶可能失去對該產(chǎn)品的購買意向、用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率較低的缺點。
技術實現(xiàn)要素:
技術問題
有鑒于此,本發(fā)明要解決的技術問題是,提供一種對象識別方法和對象識別裝置,以簡化上述“邊看邊買”的購物過程,從而提高用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率。
解決方案
為了解決上述技術問題,在第一方面,本發(fā)明提供了一種對象識別方法,包括:
根據(jù)目標視頻的一幀圖像的各特征值,確定所述幀圖像所包括的對象的類別;
根據(jù)所述幀圖像所包括的對象的類別,將所述幀圖像分割為多個子幀圖像,其中,所述多個子幀圖像中的每一個子幀圖像對應于所述幀圖像所包括的對象的一種類別;以及
根據(jù)至少一種識別算法,對所述每一個子幀圖像所包括的實際對象進行并行識別。
結合第一方面,在第一種可能的實現(xiàn)方式中,所述根據(jù)至少一種識別算法,對所述每一個子幀圖像所包括的實際對象進行并行識別,包括:
根據(jù)至少一種識別算法,提取所述每一個子幀圖像的特征值;以及
將所述每一個子幀圖像的特征值與各實際對象的特征值進行匹配,根據(jù)匹配結果確定所述每一個子幀圖像所包括的實際對象。
結合第一方面或第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,
在根據(jù)目標視頻的一幀圖像的各特征值無法確定出所述幀圖像所包括的對象的類別的情況下,將與所述無法確定出類別的對象的形狀類似的對象的種類作為所述無法確定出類別的對象的類別。
結合第一方面或第一方面的第一種可能的實現(xiàn)方式,在第三種可能的實施方式中,還包括:
在所述每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
結合第一方面的第二種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,還包括:
在所述每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
在第二方面,本發(fā)明提供了一種對象識別裝置,包括:
確定單元,用于根據(jù)目標視頻的一幀圖像的各特征值,確定所述幀圖像所包括的對象的類別;
分割單元,與所述確定單元連接,用于根據(jù)所述幀圖像所包括的對象的類別,將所述幀圖像分割為多個子幀圖像,其中,所述多個子幀圖像中的每一個子幀圖像對應于所述幀圖像所包括的對象的一種類別;以及
并行識別單元,與所述分割單元連接,用于根據(jù)至少一種識別算法,對所述每一個子幀圖像所包括的實際對象進行并行識別。
結合第二方面,在第一種可能的實現(xiàn)方式中,所述并行識別單元包括:
提取模塊,用于根據(jù)至少一種識別算法,提取所述每一個子幀圖像的特征值;以及
確定模塊,與所述提取模塊連接,用于將所述每一個子幀圖像的特征值與各實際對象的特征值進行匹配,根據(jù)匹配結果確定所述每一個子幀圖像所包括的實際對象。
結合第二方面或第二方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,
在所述確定單元根據(jù)目標視頻的一幀圖像的各特征值無法確定出所述幀圖像所包括的對象的類別的情況下,所述確定單元將與所述無法確定出類別的對象的形狀類似的對象的種類作為所述無法確定出類別的對象的類別。
結合第二方面或第二方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,還包括:
添加單元,與所述并行識別單元連接,用于在所述每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
結合第二方面的第二種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,還包括:
添加單元,與所述并行識別單元連接,用于在所述每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
有益效果
本發(fā)明實施例的對象識別方法和對象識別裝置,根據(jù)目標視頻的幀圖像所包括的對象的類別來將幀圖像分割為多個子幀圖像、并且根據(jù)識別算法來對分割得到的多個子幀圖像中的每一個子幀圖像所包括的實際對象進行并行識別,由此,通過多線程來并行識別幀圖像所包括的實際對象,用戶在觀看視頻時只需要通過諸如點擊觸摸實際對象等簡單操作就能夠直接購買該實際對象,而無需通過“觀看-搜索-瀏覽-比對-購買”這一復雜冗長操作來購買該實際對象,這樣,能夠?qū)⒂脩舻馁徺I沖動快速地轉(zhuǎn)變?yōu)橘徺I行為,有效提高了用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率。
根據(jù)下面參考附圖對示例性實施例的詳細說明,本發(fā)明的其它特征及方面將變得清楚。
附圖說明
包含在說明書中并且構成說明書的一部分的附圖與說明書一起示出了本發(fā)明的示例性實施例、特征和方面,并且用于解釋本發(fā)明的原理。
圖1示出根據(jù)本發(fā)明實施例一的對象識別方法的流程圖;
圖2示出根據(jù)本發(fā)明實施例二的對象識別方法的流程圖;
圖3示出根據(jù)本發(fā)明實施例三的對象識別裝置的結構框圖;以及
圖4示出根據(jù)本發(fā)明實施例四的對象識別裝置的結構框圖。
具體實施方式
以下將參考附圖詳細說明本發(fā)明的各種示例性實施例、特征和方面。附圖中相同的附圖標記表示功能相同或相似的元件。盡管在附圖中示出了實施例的各種方面,但是除非特別指出,不必按比例繪制附圖。
在這里專用的詞“示例性”意為“用作例子、實施例或說明性”。這里作為“示例性”所說明的任何實施例不必解釋為優(yōu)于或好于其它實施例。
另外,為了更好的說明本發(fā)明,在下文的具體實施方式中給出了眾多的具體細節(jié)。本領域技術人員應當理解,沒有某些具體細節(jié),本發(fā)明同樣可以實施。在一些實例中,對于本領域技術人員熟知的方法、手段、元件和電路未作詳細描述,以便于凸顯本發(fā)明的主旨。
實施例1
圖1示出根據(jù)本發(fā)明實施例一的對象識別方法的流程圖。如圖1所示,該對象識別方法主要可以包括:
步驟S100、根據(jù)目標視頻的一幀圖像的各特征值,確定幀圖像所包括的對象的類別。
步驟S120、根據(jù)幀圖像所包括的對象的類別,將幀圖像分割為多個子幀圖像,其中,多個子幀圖像中的每一個子幀圖像對應于幀圖像所包括的對象的一種類別。
其中,用戶可以使用終端設備來播放視頻。終端設備包括但不限于用戶可以通過鍵盤、鼠標、遙控器、觸摸板、手寫設備等方式進行人機交互的電子產(chǎn)品,例如,計算機、手機、個人數(shù)字助理(英文:Personal Digital Assistant,簡稱:PDA)、筆記本、臺式電腦、智能電視等。視頻例如是指以WMV、RM、RMVB、FLV以及MOV等視頻文件格式傳播的動態(tài)影像,例如可以包括各類影視節(jié)目、新聞、廣告、FLASH動畫、自拍DV、聊天視頻、游戲視頻、監(jiān)控視頻等。
為了便于用戶在使用終端設備觀看目標視頻時能夠方便快捷地購買目標視頻中出現(xiàn)的產(chǎn)品(對象),首先,可以預先提取目標視頻的幀圖像的各特征值,然后,可以根據(jù)提取出的各特征值確定幀圖像所包括的對象的種類,最后,可以根據(jù)確定出的幀圖像所包括的對象的種類,將幀圖像分割為多個子幀圖像。其中,目標視頻是指用戶使用終端設備正在觀看的視頻。
具體地,可以采用諸如SKB特征提取算法、快速近似SIFT特征提取算法、BRIEF特征提取算法等算法來分別提取幀圖像的各特征值。其中,特征值例如可以包括點特征(如,角點、明顯點、畫面的邊緣點)、線特征(如,畫面的邊緣線段)、面特征、紋理特征、顏色特征等。
在提取出幀圖像的各特征值之后,可以根據(jù)各特征值來確定幀圖像所包括的對象的類別。例如,假設提取出幀圖像的特征值A、特征值B和特征值C,并且特征值A表示連衣裙、特征值B表示平底鍋、特征值C表示桌子,則根據(jù)特征值A、特征值B和特征值C可以確定出該幀圖像包括連衣裙、平底鍋和桌子這三類對象(或產(chǎn)品)。
在一種可能的實現(xiàn)方式中,在根據(jù)目標視頻的一幀圖像的各特征值無法確定出幀圖像所包括的對象的類別的情況下,將與無法確定出類別的對象的形狀類似的對象的種類作為無法確定出類別的對象的類別。例如,假設根據(jù)提取出的幀圖像的特征值D無法確定出幀圖像所包括的對象的類別,特征值D所表示的形狀與特征值E所表示的形狀類似,并且根據(jù)特征值E能夠確定出幀圖像的對象的種類為桌子,則可以根據(jù)特征值D確定出幀圖像包括桌子這類對象。
在確定出幀圖像所包括的對象的類別之后,可以根據(jù)幀圖像所包括的對象的類別將幀圖像分割為多個子幀圖像。例如,假設確定出該幀圖像包括連衣裙、平底鍋和桌子這三類對象,則可以將幀圖像分割為對應于連衣裙的子幀圖像1、對應于平底鍋的子幀圖像2、以及對應于桌子的子幀圖像3。
步驟S140、根據(jù)至少一種識別算法,對每一個子幀圖像所包括的實際對象進行并行識別。
具體地,可以采用現(xiàn)有的一種識別算法例如人臉識別算法來對分割得到的每一個子幀圖像所包括的實際對象進行并行識別,也可以采用現(xiàn)有的多種識別算法例如人臉識別算法、物體識別算法等來對分割得到的每一個子幀圖像所包括的實際對象進行并行識別。
舉例而言,假設在步驟S120中將幀圖像分割為對應于連衣裙的子幀圖像1、對應于平底鍋的子幀圖像2、以及對應于桌子的子幀圖像3的三個子幀圖像,則可以同時執(zhí)行如下三個對象識別操作:采用人臉識別算法對子幀圖像1所包括的實際對象進行識別、采用物體識別算法對子幀圖像2所包括的實際對象進行識別、以及采用物體識別算法對子幀圖像3所包括的實際對象進行識別,并且可以并行識別出子幀圖像1所包括的實際對象為“綠色連衣裙”、子幀圖像2所包括的實際對象為“藍色平底鍋”、以及子幀圖像3所包括的實際對象為“圓形桌子”。
在一種可能的實現(xiàn)方式中,該對象識別方法還可以包括:步驟S160、在每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
具體地,在并行識別出分割得到的多個子幀圖像中的每一個子幀圖像所包括的實際對象之后,可以在識別出的實際對象上添加一個浮層,該浮層用于顯示對象相關信息,該對象相關信息例如是實際對象的購買鏈接、與實際對象的購買鏈接相關聯(lián)的實際對象的名稱、二維碼等。在對象相關信息是實際對象的購買鏈接或者對象相關信息是與實際對象的購買鏈接相關聯(lián)的實際對象的名稱的情況下,用戶可以通過點擊觸摸對象相關信息來直接對該實際對象進行購物下單。在對象相關信息是二維碼的情況下,用戶可以通過利用終端設備掃描對象相關信息來直接對該實際對象進行購物下單。
本發(fā)明實施例的對象識別方法,根據(jù)目標視頻的幀圖像所包括的對象的類別來將幀圖像分割為多個子幀圖像、并且根據(jù)識別算法來對分割得到的每一個子幀圖像所包括的實際對象進行并行識別,由此,通過多線程來并行識別幀圖像所包括的實際對象,用戶在觀看視頻時只需要通過諸如點擊觸摸實際對象或者利用終端設備掃描實際對象上添加的二維碼等簡單操作就能夠直接購買該實際對象,而無需通過“觀看-搜索-瀏覽-比對-購買”這一復雜冗長操作來購買該實際對象,這樣,能夠?qū)⒂脩舻馁徺I沖動快速地轉(zhuǎn)變?yōu)橘徺I行為,有效提高了用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率。
實施例2
圖2示出根據(jù)本發(fā)明實施例二的對象識別方法的流程圖。如圖2所示,該對象識別方法主要可以包括:
步驟S200、根據(jù)目標視頻的一幀圖像的各特征值,確定幀圖像所包括的對象的類別。該步驟的具體說明可以參見上述實施例1中的步驟S100中的相關描述。
步驟S220、根據(jù)幀圖像所包括的對象的類別,將幀圖像分割為多個子幀圖像,其中,多個子幀圖像中的每一個子幀圖像對應于幀圖像所包括的對象的一種類別。該步驟的具體說明可以參見上述實施例1中的步驟S120中的相關描述。
步驟S240、根據(jù)至少一種識別算法,提取每一個子幀圖像的特征值。
具體地,在將幀圖像分割為多個子幀圖像之后,可以分別提取每一個子幀圖像的特征值,其中,特征值例如可以包括點特征(如,角點、明顯點、畫面的邊緣點)、線特征(如,畫面的邊緣線段)、面特征、紋理特征、顏色特征等。例如,假設在步驟S220中將幀圖像分割為對應于連衣裙的子幀圖像1、對應于平底鍋的子幀圖像2、以及對應于桌子的子幀圖像3的三個子幀圖像,則可以同時提取這三個子幀圖像的特征值。
步驟S260、將每一個子幀圖像的特征值與各實際對象的特征值進行匹配,根據(jù)匹配結果確定每一個子幀圖像所包括的實際對象。
具體地,可以將每一個子幀圖像的特征值與各實際對象的特征值進行匹配,其中,特征值匹配所采用的算法可以包括基于邊緣特征的匹配算法、基于區(qū)域特征的匹配算法、基于點特征的匹配算法等,并且根據(jù)匹配結果來確定每一個子幀圖像所包括的實際對象。
例如,假設子幀圖像的特征值A與實際對象1的特征值的相似度大于預定閾值并且子幀圖像的特征值B與實際對象2的特征值的相似度大于預定閾值,則可以判斷出該子幀圖像的特征值A與實際對象1的特征值相匹配并且該子幀圖像的特征值B與實際對象2的特征值相匹配,因而可以確定出該子幀圖像包括實際對象1和實際對象2。
在一種可能的實現(xiàn)方式中,該對象識別方法還可以包括:步驟S280、在每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
具體地,在并行識別出分割得到的多個子幀圖像中的每一個子幀圖像所包括的實際對象之后,可以在識別出的實際對象上添加一個浮層,該浮層用于顯示對象相關信息,該對象相關信息例如是實際對象的購買鏈接、與實際對象的購買鏈接相關聯(lián)的實際對象的名稱、二維碼等。在對象相關信息是實際對象的購買鏈接或者對象相關信息是與實際對象的購買鏈接相關聯(lián)的實際對象的名稱的情況下,用戶可以通過點擊觸摸對象相關信息來直接對該實際對象進行購物下單。在對象相關信息是二維碼的情況下,用戶可以通過利用終端設備掃描對象相關信息來直接對該實際對象進行購物下單。
本發(fā)明實施例的對象識別方法,根據(jù)目標視頻的幀圖像所包括的對象的類別來將幀圖像分割為多個子幀圖像、并且根據(jù)提取出的多個子幀圖像中的每一個子幀圖像的特征值與各實際對象的特征值的匹配結果來確定每一個子幀圖像所包括的實際對象,由此,通過多線程來并行識別幀圖像所包括的實際對象,用戶在觀看視頻時只需要通過諸如點擊觸摸實際對象或者利用終端設備掃描實際對象上添加的二維碼等簡單操作就能夠直接購買該實際對象,而無需通過“觀看-搜索-瀏覽-比對-購買”這一復雜冗長操作來購買該實際對象,這樣,能夠?qū)⒂脩舻馁徺I沖動快速地轉(zhuǎn)變?yōu)橘徺I行為,有效提高了用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率。
實施例3
圖3示出根據(jù)本發(fā)明實施例三的對象識別裝置的結構框圖。本實施例提供的對象識別裝置300用于實現(xiàn)圖1所示的對象識別方法。如圖3所示,該對象識別裝置300主要可以包括:
確定單元310,用于根據(jù)目標視頻的一幀圖像的各特征值,確定幀圖像所包括的對象的類別。
分割單元330,與確定單元310連接,用于根據(jù)幀圖像所包括的對象的類別,將幀圖像分割為多個子幀圖像,其中,多個子幀圖像中的每一個子幀圖像對應于幀圖像所包括的對象的一種類別。
其中,用戶可以使用終端設備來播放視頻。終端設備包括但不限于用戶可以通過鍵盤、鼠標、遙控器、觸摸板、手寫設備等方式進行人機交互的電子產(chǎn)品,例如,計算機、手機、個人數(shù)字助理(英文:Personal Digital Assistant,簡稱:PDA)、筆記本、臺式電腦、智能電視等。視頻例如是指以WMV、RM、RMVB、FLV以及MOV等視頻文件格式傳播的動態(tài)影像,例如可以包括各類影視節(jié)目、新聞、廣告、FLASH動畫、自拍DV、聊天視頻、游戲視頻、監(jiān)控視頻等。
為了便于用戶在使用終端設備觀看目標視頻時能夠方便快捷地購買目標視頻中出現(xiàn)的產(chǎn)品(對象),首先,對象識別裝置300可以預先提取目標視頻的幀圖像的各特征值,然后,確定單元310可以根據(jù)提取出的各特征值確定幀圖像所包括的對象的種類,最后,分割單元330可以根據(jù)確定出的幀圖像所包括的對象的種類,將幀圖像分割為多個子幀圖像。其中,目標視頻是指用戶使用終端設備正在觀看的視頻。
具體地,對象識別裝置300可以采用諸如SKB特征提取算法、快速近似SIFT特征提取算法、BRIEF特征提取算法等算法來分別提取幀圖像的各特征值。其中,特征值例如可以包括點特征(如,角點、明顯點、畫面的邊緣點)、線特征(如,畫面的邊緣線段)、面特征、紋理特征、顏色特征等。
在提取出幀圖像的各特征值之后,確定單元310可以根據(jù)各特征值來確定幀圖像所包括的對象的類別。例如,假設提取出幀圖像的特征值A、特征值B和特征值C,并且特征值A表示連衣裙、特征值B表示平底鍋、特征值C表示桌子,則確定單元310根據(jù)特征值A、特征值B和特征值C可以確定出該幀圖像包括連衣裙、平底鍋和桌子這三類對象(或產(chǎn)品)。
在一種可能的實現(xiàn)方式中,在確定單元310根據(jù)目標視頻的一幀圖像的各特征值無法確定出幀圖像所包括的對象的類別的情況下,確定單元310將與無法確定出類別的對象的形狀類似的對象的種類作為無法確定出類別的對象的類別。例如,假設確定單元310根據(jù)提取出的幀圖像的特征值D無法確定出幀圖像所包括的對象的類別,特征值D所表示的形狀與特征值E所表示的形狀類似,并且確定單元310根據(jù)特征值E能夠確定出幀圖像的對象的種類為桌子,則確定單元310可以根據(jù)特征值D確定出幀圖像包括桌子這類對象。
在確定單元310確定出幀圖像所包括的對象的類別之后,分割單元330可以根據(jù)幀圖像所包括的對象的類別將幀圖像分割為多個子幀圖像。例如,假設確定單元310確定出該幀圖像包括連衣裙、平底鍋和桌子這三類對象,則分割單元330可以將幀圖像分割為對應于連衣裙的子幀圖像1、對應于平底鍋的子幀圖像2、以及對應于桌子的子幀圖像3。
并行識別單元350,與所述分割單元330連接,用于根據(jù)至少一種識別算法,對每一個子幀圖像所包括的實際對象進行并行識別。
具體地,并行識別單元350可以采用現(xiàn)有的一種識別算法例如人臉識別算法來對分割得到的每一個子幀圖像所包括的實際對象進行并行識別,并行識別單元350也可以采用現(xiàn)有的多種識別算法例如人臉識別算法、物體識別算法等來對分割得到的每一個子幀圖像所包括的實際對象進行并行識別。
舉例而言,假設分割單元330將幀圖像分割為對應于連衣裙的子幀圖像1、對應于平底鍋的子幀圖像2、以及對應于桌子的子幀圖像3的三個子幀圖像,則并行識別單元350可以同時執(zhí)行如下三個對象識別操作:采用人臉識別算法對子幀圖像1所包括的實際對象進行識別、采用物體識別算法對子幀圖像2所包括的實際對象進行識別、以及采用物體識別算法對子幀圖像3所包括的實際對象進行識別,并且并行識別單元350可以并行識別出子幀圖像1所包括的實際對象為“綠色連衣裙”、子幀圖像2所包括的實際對象為“藍色平底鍋”、以及子幀圖像3所包括的實際對象為“圓形桌子”。
在一種可能的實現(xiàn)方式中,該對象識別裝置300還可以包括:添加單元370,與所述并行識別單元350連接,用于在所述每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
具體地,在并行識別單元350并行識別出分割得到的多個子幀圖像中的每一個子幀圖像所包括的實際對象之后,添加單元370可以在識別出的實際對象上添加一個浮層,該浮層用于顯示對象相關信息,該對象相關信息例如是實際對象的購買鏈接、與實際對象的購買鏈接相關聯(lián)的實際對象的名稱、二維碼等。在對象相關信息是實際對象的購買鏈接或者對象相關信息是與實際對象的購買鏈接相關聯(lián)的實際對象的名稱的情況下,用戶可以通過點擊觸摸對象相關信息來直接對該實際對象進行購物下單。在對象相關信息是二維碼的情況下,用戶可以通過利用終端設備掃描對象相關信息來直接對該實際對象進行購物下單。
本發(fā)明實施例的對象識別裝置,根據(jù)目標視頻的幀圖像所包括的對象的類別來將幀圖像分割為多個子幀圖像、并且根據(jù)識別算法來對分割得到的每一個子幀圖像所包括的實際對象進行并行識別,由此,通過多線程來并行識別幀圖像所包括的實際對象,用戶在觀看視頻時只需要通過諸如點擊觸摸實際對象或者利用終端設備掃描實際對象上添加的二維碼等簡單操作就能夠直接購買該實際對象,而無需通過“觀看-搜索-瀏覽-比對-購買”這一復雜冗長操作來購買該實際對象,這樣,能夠?qū)⒂脩舻馁徺I沖動快速地轉(zhuǎn)變?yōu)橘徺I行為,有效提高了用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率。
實施例4
圖4示出根據(jù)本發(fā)明實施例四的對象識別裝置的結構框圖。本實施例提供的對象識別裝置400用于實現(xiàn)圖2所示的對象識別方法。如圖4所示,該對象識別裝置400主要可以包括:
第一確定單元410,用于根據(jù)目標視頻的一幀圖像的各特征值,確定幀圖像所包括的對象的類別。第一確定單元410的具體說明可以參見上述實施例3中的確定單元310的相關描述。
分割單元430,與所述第一確定單元410連接,用于根據(jù)幀圖像所包括的對象的類別,將幀圖像分割為多個子幀圖像,其中,多個子幀圖像中的每一個子幀圖像對應于幀圖像所包括的對象的一種類別。分割單元430的具體說明可以參見上述實施例3中的分割單元330的相關描述。
提取單元450,與所述分割單元430連接,用于根據(jù)至少一種識別算法,提取每一個子幀圖像的特征值。
具體地,在分割單元430將幀圖像分割為多個子幀圖像之后,提取單元450可以分別提取每一個子幀圖像的特征值,其中,特征值例如可以包括點特征(如,角點、明顯點、畫面的邊緣點)、線特征(如,畫面的邊緣線段)、面特征、紋理特征、顏色特征等。例如,假設分割單元430將幀圖像分割為對應于連衣裙的子幀圖像1、對應于平底鍋的子幀圖像2、以及對應于桌子的子幀圖像3的三個子幀圖像,則提取單元450可以同時提取這三個子幀圖像的特征值。
第二確定單元470,與所述提取單元450連接,用于將每一個子幀圖像的特征值與各實際對象的特征值進行匹配,根據(jù)匹配結果確定每一個子幀圖像所包括的實際對象。
具體地,第二確定單元470可以將每一個子幀圖像的特征值與各實際對象的特征值進行匹配,其中,特征值匹配所采用的算法可以包括基于邊緣特征的匹配算法、基于區(qū)域特征的匹配算法、基于點特征的匹配算法等,并且第二確定單元470可以根據(jù)匹配結果來確定每一個子幀圖像所包括的實際對象。
例如,假設子幀圖像的特征值A與實際對象1的特征值的相似度大于預定閾值并且子幀圖像的特征值B與實際對象2的特征值的相似度大于預定閾值,則第二確定單元470可以判斷出該子幀圖像的特征值A與實際對象1的特征值相匹配并且該子幀圖像的特征值B與實際對象2的特征值相匹配,因而第二確定單元470可以確定出該子幀圖像包括實際對象1和實際對象2。
在一種可能的實現(xiàn)方式中,該對象識別裝置400還可以包括:添加單元490,與所述第二確定單元470連接,用于在每一個子幀圖像所包括的實際對象上分別添加一個用于顯示對象相關信息的浮層。
具體地,在提取單元450和第二確定單元470的配合下并行識別出分割得到的多個子幀圖像中的每一個子幀圖像所包括的實際對象之后,添加單元490可以在識別出的實際對象上添加一個浮層,該浮層用于顯示對象相關信息,該對象相關信息例如是實際對象的購買鏈接、與實際對象的購買鏈接相關聯(lián)的實際對象的名稱、二維碼等。在對象相關信息是實際對象的購買鏈接或者對象相關信息是與實際對象的購買鏈接相關聯(lián)的實際對象的名稱的情況下,用戶可以通過點擊觸摸對象相關信息來直接對該實際對象進行購物下單。在對象相關信息是二維碼的情況下,用戶可以通過利用終端設備掃描對象相關信息來直接對該實際對象進行購物下單。
本發(fā)明實施例的對象識別裝置,根據(jù)目標視頻的幀圖像所包括的對象的類別來將幀圖像分割為多個子幀圖像、并且根據(jù)提取出的多個子幀圖像中的每一個子幀圖像的特征值與各實際對象的特征值的匹配結果來確定每一個子幀圖像所包括的實際對象,由此,通過多線程來并行識別幀圖像所包括的實際對象,用戶在觀看視頻時只需要通過諸如點擊觸摸實際對象或者利用終端設備掃描實際對象上添加的二維碼等簡單操作就能夠直接購買該實際對象,而無需通過“觀看-搜索-瀏覽-比對-購買”這一復雜冗長操作來購買該實際對象,這樣,能夠?qū)⒂脩舻馁徺I沖動快速地轉(zhuǎn)變?yōu)橘徺I行為,有效提高了用戶在觀看視頻時點擊購買產(chǎn)品的轉(zhuǎn)換率。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。