一種處理電視節(jié)目圖片的方法和裝置的制造方法
【技術(shù)領域】
[0001]本發(fā)明涉及圖像處理技術(shù)領域,更具體地,涉及一種處理電視節(jié)目圖片的方法和
目.0
【背景技術(shù)】
[0002]電視節(jié)目播放時,特別是通過電腦等智能終端播放時,用戶可以截取電視節(jié)目的某一幀作為電視節(jié)目的圖片。例如,電視節(jié)目中出現(xiàn)用戶喜歡的演員、物品、場景時,用戶可以截取視頻幀作為電視節(jié)目圖片。
[0003]用戶還可以將電視節(jié)目的圖片上傳到網(wǎng)站供其他用戶觀看或下載。并且,視頻網(wǎng)站還可以將用戶上傳的這些電視節(jié)目圖片,作為包含該電視節(jié)目的視頻的摘要圖片,以便提供視頻的相關(guān)信息。
[0004]然而,隨著用戶上傳的電視節(jié)目圖片越來越多,如何高效地處理數(shù)量眾多的電視節(jié)目圖片是亟待解決的問題。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明實施例的目的是提出一種處理電視節(jié)目圖片的方法和裝置,能夠高效地對電視節(jié)目圖片進行處理。
[0006]為了達到上述目的,本發(fā)明實施例提出一種處理電視節(jié)目圖片的方法,包括以下步驟:
[0007]獲取電視節(jié)目圖片;
[0008]識別電視節(jié)目圖片中的文字;
[0009]根據(jù)識別的文字對電視節(jié)目圖片進行分類。
[0010]本發(fā)明一實施例中,所述根據(jù)識別的文字對電視節(jié)目圖片進行分類,包括:
[0011 ] 對識別出的文字進行分詞獲得詞匯;
[0012]將獲得的詞匯進行聚類;
[0013]將聚類后屬于同一類的詞匯所對應的電視節(jié)目圖片分為一類。
[0014]本發(fā)明一實施例中,所述方法還包括:
[0015]將獲得的詞匯與已有類別的名稱進行匹配;
[0016]當匹配成功時,將與所述已有類別的名稱匹配的詞匯所屬類中的所有詞匯對應的電視節(jié)目圖片加入到所述已有類別。
[0017]本發(fā)明一實施例中,所述將獲得的詞匯進行聚類,包括:將獲得的詞匯與已有類別的詞匯進行聚類;
[0018]將聚類后屬于同一類的詞匯所對應的電視節(jié)目圖片分為一類,還包括:
[0019]將聚類后屬于所述已有類別的詞匯所對應的電視節(jié)目圖片加入到所述已有類別。
[0020]本發(fā)明一實施例中,所述將獲得的詞匯進行聚類,包括:
[0021]獲取詞匯之間的語義相似度;
[0022]將語義相似度高于預設值的詞匯聚到一類。
[0023]本發(fā)明實施例還提出一種處理電視節(jié)目圖片的裝置,包括:
[0024]獲取裝置,用于獲取電視節(jié)目圖片;
[0025]識別模塊,用于識別電視節(jié)目圖片中的文字;
[0026]分類模塊,用于根據(jù)識別的文字對電視節(jié)目圖片進行分類。
[0027]本發(fā)明一實施例中,所述分類模塊,包括:
[0028]分詞子模塊,用于對識別出的文字進行分詞獲得詞匯;
[0029]聚類子模塊,用于將獲得的詞匯進行聚類;
[0030]所述分類模塊,還用于將聚類后屬于同一類的詞匯所對應的電視節(jié)目圖片分為一類。
[0031]本發(fā)明一實施例中,所述裝置還包括:
[0032]匹配模塊,用于將獲得的詞匯與已有類別的名稱進行匹配;
[0033]所述分類模塊,還用于當匹配成功時,將與所述已有類別的名稱匹配的詞匯所屬類中的所有詞匯對應的電視節(jié)目圖片加入到所述已有類別。
[0034]本發(fā)明一實施例中,所述聚類子模塊,還用于:
[0035]將獲得的詞匯與已有類別的詞匯進行聚類;
[0036]所述分類模塊,還用于將聚類后屬于所述已有類別的詞匯所對應的電視節(jié)目圖片加入到所述已有類別。
[0037]本發(fā)明一實施例中,所述聚類子模塊,還用于:
[0038]獲取詞匯之間的語義相似度;
[0039]將語義相似度高于預設值的詞匯聚到一類。
[0040]本發(fā)明實施例提供的技術(shù)方案可以包括以下有益效果:
[0041]本發(fā)明實施例中,根據(jù)電視節(jié)目圖片中的文字對電視節(jié)目圖片進行分類,可以將數(shù)量眾多的電視節(jié)目圖片進行有效的分類,分類后的電視節(jié)目圖片更有利于管理、查找和使用。
[0042]本發(fā)明實施例的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
[0043]下面通過附圖和實施例,對本發(fā)明實施例的技術(shù)方案做進一步的詳細描述。
【附圖說明】
[0044]附圖用來提供對本發(fā)明實施例的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明實施例的限制。在附圖中:
[0045]圖1是本發(fā)明一實施例中的處理電視節(jié)目圖片的方法的流程圖。
[0046]圖2是本發(fā)明一實施例中的處理電視節(jié)目圖片的方法的流程圖。
[0047]圖3是本發(fā)明一實施例中的處理電視節(jié)目圖片的方法的流程圖。
[0048]圖4是本發(fā)明一實施例中的處理電視節(jié)目圖片的方法的流程圖。
[0049]圖5是本發(fā)明一實施例中的處理電視節(jié)目圖片的裝置的結(jié)構(gòu)示意圖。
[0050]圖6是本發(fā)明一實施例中的處理電視節(jié)目圖片的裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0051]以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明實施例,并不用于限定本發(fā)明實施例。
[0052]電視節(jié)目圖片可以是用戶觀看電視時截取并上傳的、也可以是編輯人員截取的。電視節(jié)目圖片可以作為電視節(jié)目(該電視節(jié)目的視頻)的摘要圖片。
[0053]如圖1所示為本發(fā)明實施例中的處理電視節(jié)目圖片的方法的流程圖,該方法包括:
[0054]步驟Sll:獲取電視節(jié)目圖片。
[0055]步驟S12:識別電視節(jié)目圖片中的文字。
[0056]步驟S13:根據(jù)識別的文字對電視節(jié)目圖片進行分類。
[0057]例如,可以將包含有相同和/或語義相似的文字的電視節(jié)目圖片分為一類。
[0058]本發(fā)明實施例中,根據(jù)電視節(jié)目圖片中的文字對電視節(jié)目圖片進行分類,可以將數(shù)量眾多的電視節(jié)目圖片進行有效的分類,分類后的電視節(jié)目圖片更有利于管理、查找和使用。
[0059]如圖2所示為本發(fā)明另一實施例提供的處理電視節(jié)目圖片的方法的流程圖,在該實施例中,包括以下步驟:
[0060]步驟S21:接收用戶上傳的電視節(jié)目圖片。
[0061]用戶上傳的電視節(jié)目圖片可以是用戶在觀看電視時截屏生成的。
[0062]步驟S22:對接收的電視節(jié)目圖片進行圖像識別,識別出電視節(jié)目圖片中的文字。
[0063]圖像識別過程例如可以包括圖像預處理、圖像分割、圖像特征提取和判斷匹配。其中,圖像預處理:濾去干擾、噪聲,當圖像信息微弱無法識別時,還要對圖像進行增強,集合調(diào)整,顏色校正等;圖像分割:定位分離出不同的待識別物體,輸入整幅圖像,輸出像元圖像;圖像特征抽取:提取特征;判斷匹配:根據(jù)預設的模型將提取的特征進行匹配。
[0064]電視節(jié)目圖片中的文字例如可以是電視節(jié)目圖片中的文字表示的臺標,也可以是電視節(jié)目圖片中顯示的電視節(jié)目的名稱,還可以是電視節(jié)目中的其他字幕,例如顯示了演員名字、場景名稱等。
[0065]步驟S23:對識別出的文字進行分詞獲得詞匯。
[0066]分詞算法例如有:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計的分詞方法。
[0067]基于字符串匹配的分詞方法又叫做機械分詞方法,是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞),按照掃描方向的不同,串匹配分詞方法可以分為正向匹配和逆向匹配;按照不同長度優(yōu)先匹配的情況,可以分為最大(最長)匹配和最小(最短)匹配。
[0068]基于理解的分詞方法是通過讓計算機模擬人對句子的理解,達到識別詞的效果,其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象。
[0069]基于統(tǒng)計的分詞方法:從形式上看,詞是穩(wěn)定的字的組合,因此在上下文中,相鄰的字同時出現(xiàn)的次數(shù)越多,就越有可能構(gòu)成一個詞。因此字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映成詞的可信度??梢詫φZ料中相鄰共現(xiàn)的各個字的組合的頻度進行統(tǒng)計,計算它們的互現(xiàn)信息。定義兩個字的互現(xiàn)信息,計算兩個漢字的相鄰共現(xiàn)概率。互現(xiàn)信息體現(xiàn)了漢字之間結(jié)合關(guān)系的緊密程度。當緊密程度高于某一個閾值時,便可認為此字組可能構(gòu)成了一個詞。另外還有基于統(tǒng)計機器學習的方法:首先給出大量已經(jīng)分詞的文本,利用統(tǒng)計機器學習模型學習詞語切分的規(guī)律(稱為訓練),從而實現(xiàn)對未知文本的切分。
[0070]步驟S24:將獲得的詞匯進行聚類。
[0071]在本發(fā)明的其他實施例中,可以根據(jù)詞匯之間的語義相似度,將獲得的詞匯進行聚類。若兩個詞匯之間的語義相似度大于一個預設值,則說明這兩個詞匯非常相似,可以歸為一類。