一種關鍵詞處理方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術領域,特別涉及一種關鍵詞處理方法及裝置。
【背景技術】
[0002]隨著互聯(lián)網(wǎng)技術、通信技術、數(shù)字技術的發(fā)展,以其為基礎的網(wǎng)絡視頻產(chǎn)業(yè)也在短時間內(nèi)迅猛發(fā)展。網(wǎng)絡視頻是以網(wǎng)絡為媒介,通過電腦和手機將信息以文字、聲音、動畫、圖像等形式傳播,其中包括各類影視節(jié)目、新聞、廣告、動畫、自拍視頻、聊天視頻、游戲視頻、監(jiān)控視頻等類型,應用范圍及應用領域非常廣泛。并且,網(wǎng)絡視頻也以其海量性、即時性、選擇主動性、全球化等特點,使網(wǎng)絡視頻用戶越來越多。
[0003]鑒于網(wǎng)絡視頻產(chǎn)業(yè)的巨大潛力,提供網(wǎng)絡視頻播放服務的網(wǎng)絡視頻平臺也越來越多,在提供網(wǎng)絡視頻播放服務的網(wǎng)絡視頻平臺中,通常會提供視頻的訂閱功能,用戶可以通過訂閱功能訂閱不同的頻道,網(wǎng)絡視頻平臺根據(jù)用戶的訂閱內(nèi)容,即時推送用戶所訂閱的頻道中最新視頻的連接或動態(tài)。在此基礎上,訂閱功能還將用戶輸入的關鍵詞作為訂閱主題,搜索該關鍵詞下的視頻,并將搜索到的最新視頻的連接或的動態(tài)發(fā)送給用戶。然而,當用戶輸入多個關鍵詞作為用戶訂閱主題時,有可能輸入意思相近或者涉及到的內(nèi)容相似的關鍵詞,這樣,就會出現(xiàn)大量的重復視頻,因此,有可能會出現(xiàn)多個關鍵詞作為訂閱主題時,同一視頻的重復推送,并且,存儲多個意思相近或者涉及到的內(nèi)容相似的關鍵詞作為訂閱主題,也會造成存儲空間的浪費。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種關鍵詞處理方法及裝置,用以避免多個關鍵詞作為訂閱主題時,同一視頻的重復推送,以及避免存儲空間的浪費。
[0005]本發(fā)明提供一種關鍵詞處理方法,包括:
[0006]接收終端發(fā)送的至少兩個用于訂閱的關鍵詞;
[0007]根據(jù)所述關鍵詞分別搜索各個關鍵詞對應的視頻;
[0008]計算所述關鍵詞中任意兩個關鍵詞對應的視頻的重復度;
[0009]當所述任意兩個關鍵詞對應的視頻的重復度達到預設閾值時,根據(jù)預設配置保留其中一個關鍵詞。
[0010]在一個實施例中,計算所述關鍵詞中任意兩個關鍵詞對應的視頻的重復度,包括:
[0011]比較所述兩個關鍵詞對應的視頻中相同視頻的數(shù)目;
[0012]根據(jù)所述相同視頻的數(shù)目,計算所述兩個關鍵詞對應的視頻的重復度。
[0013]在一個實施例中,根據(jù)所述相同視頻的數(shù)目,計算所述兩個關鍵詞對應的視頻的重復度,包括:
[0014]統(tǒng)計所述兩個關鍵詞對應的非重復視頻的總數(shù)目;
[0015]根據(jù)所述相同視頻的數(shù)目計算所述相同視頻在所述兩個關鍵詞對應的非重復視頻中所占的比例,將所述比例作為所述兩個關鍵詞對應的視頻的重復度。
[0016]在一個實施例中,根據(jù)預設配置保留其中一個關鍵詞,包括:
[0017]比較所述兩個關鍵詞中每個關鍵詞對應的搜索結果中的視頻數(shù)目;
[0018]保留視頻數(shù)目較多的搜索結果所對應的關鍵詞。
[0019]在一個實施例中,當所述兩個關鍵詞對應的搜索結果中的視頻數(shù)目相同時,所述方法還包括:
[0020]將所述兩個關鍵詞合并為一個關鍵詞。
[0021]本發(fā)明還提供一種關鍵詞處理裝置,包括:
[0022]接收模塊,用于接收終端發(fā)送的至少兩個用于訂閱的關鍵詞;
[0023]搜索模塊,用于根據(jù)所述關鍵詞分別搜索各個關鍵詞對應的視頻;
[0024]計算模塊,用于計算所述關鍵詞中任意兩個關鍵詞對應的視頻的重復度;
[0025]處理模塊,用于當所述任意兩個關鍵詞對應的視頻的重復度達到預設閾值時,根據(jù)預設配置保留其中一個關鍵詞。
[0026]在一個實施例中,計算模塊,包括:
[0027]比較子模塊,用于比較所述兩個關鍵詞對應的視頻中相同視頻的數(shù)目;
[0028]計算子模塊,用于根據(jù)所述相同視頻的數(shù)目,計算所述兩個關鍵詞對應的視頻的重復度。
[0029]在一個實施例中,所述計算子模塊,用于統(tǒng)計所述兩個關鍵詞對應的非重復視頻的總數(shù)目;根據(jù)所述相同視頻的數(shù)目計算所述相同視頻在所述兩個關鍵詞對應的非重復視頻中所占的比例,將所述比例作為所述兩個關鍵詞對應的視頻的重復度。
[0030]在一個實施例中,所述處理模塊,包括:
[0031]比較子模塊,用于比較所述兩個關鍵詞中每個關鍵詞對應的搜索結果中的視頻數(shù)目;
[0032]處理子模塊,用于保留視頻數(shù)目較多的搜索結果所對應的關鍵詞。
[0033]在一個實施例中,所述裝置還包括:
[0034]合并模塊,用于當所述兩個關鍵詞對應的搜索結果中的視頻數(shù)目相同時,將所述兩個關鍵詞合并為一個關鍵詞。
[0035]本發(fā)明的有益效果在于:當接收到多個用于訂閱的關鍵詞后,計算根據(jù)關鍵詞分別搜索到的視頻的重復度,當重復度達到預設閾值時,只保留其中一個關鍵詞,避免了同一視頻的重復推送,且避免了存儲空間的浪費。
[0036]本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現(xiàn)和獲得。
[0037]下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。
【附圖說明】
[0038]附圖用來提供對本發(fā)明的進一步理解,并且構成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構成對本發(fā)明的限制。在附圖中:
[0039]圖1為本發(fā)明一實施例中關鍵詞處理法的流程圖;
[0040]圖2為本發(fā)明一實施例中關鍵詞處理法的流程圖;
[0041]圖3為本發(fā)明一實施例中關鍵詞處理法的框圖;
[0042]圖4為本發(fā)明一實施例中關鍵詞處理法的框圖。
【具體實施方式】
[0043]以下結合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0044]圖1為本發(fā)明一實施例中關鍵詞處理法的流程圖,如圖1所示,本發(fā)明中關鍵詞處理方法可用于提供在線視頻播放功能的服務器中,該方法包括如下步驟S11-S14:
[0045]在步驟Sll中,接收終端發(fā)送的至少兩個用于訂閱的關鍵詞;
[0046]在步驟S12中,根據(jù)關鍵詞分別搜索各個關鍵詞對應的視頻;
[0047]在步驟S13中,計算關鍵詞中任意兩個關鍵詞對應的視頻的重復度;
[0048]在步驟S14中,當任意兩個關鍵詞對應的視頻的重復度達到預設閾值時,根據(jù)預設配置保留其中一個關鍵詞。
[0049]舉例而言,在用戶提供網(wǎng)絡視頻播放服務的網(wǎng)絡視頻平臺中,通常都會提供視頻訂閱的功能,可以將用戶輸入的關鍵詞作為訂閱主題。網(wǎng)絡視頻平臺所對應的服務器接收用戶通過終端輸入的多個用于訂閱的關鍵詞,根據(jù)用戶所輸入的關鍵詞搜索各個關鍵詞對應的視頻。對用戶所輸入的所有關鍵詞進行兩兩比較,計算所有關鍵詞中任意兩個關鍵詞對應的視頻的重復度,當任意兩個關鍵詞對應的視頻的重復度達到預設閾值時,根據(jù)預設配置保留其中一個關鍵詞。
[0050]在一個實施例中,如圖2所示,上述步驟S13可被實施為如下步驟S21-S22:
[0051]在步驟S21中,比較兩個關鍵詞對應的視頻中相同視頻的數(shù)目;
[0052]在步驟S22中,根據(jù)相同視頻的數(shù)目,計算兩個關鍵詞對應的視頻的重復度。
[0053]如此,可根據(jù)兩個關鍵詞對應的相同視頻的數(shù)目計算兩個關鍵詞對應的視頻的重復度。
[0054]在一個實施例中,根據(jù)相同視頻的數(shù)目,計算兩個關鍵詞對應的視頻的重復度,包括如下步驟A1-A2:
[0055]在步驟Al中,統(tǒng)計兩個關鍵詞對應的非重復視頻的總數(shù)目;
[0056]在步驟A2中,根據(jù)相同視頻的數(shù)目計算相同視頻在兩個關鍵詞對應的非重復視頻中所占的比例,將比例作為兩個關鍵詞對應的視頻的重復度。
[0057]舉例而言,計算用戶輸入的關鍵詞中,關鍵詞A與關鍵詞B對應的視頻的重復度:首先,分別統(tǒng)計關鍵詞A所搜索到的視頻與關鍵詞B所搜索到的視頻,例如,根據(jù)關鍵詞A搜索到的視頻組Al中的視頻數(shù)為19,根據(jù)關鍵詞B所搜索到的視頻組BI中的視頻數(shù)為21。通過比較,視頻組Al與視頻組BI中存在相同視頻的數(shù)目為15。故關鍵詞A和關鍵詞B所對應的非重復視頻的總數(shù)目η = 19+21-15 = 25,而相同視頻在關鍵詞A和關鍵詞B所對應的非重復視頻中所占的比例k = 15/25 = 60%,上述關鍵詞A和關鍵詞B所對應的非重復視頻中所占的比例k的值即為關鍵詞A和關鍵詞B對應的視頻的重復度,即關鍵詞A與關鍵詞B所對應的視頻的重復度為60%;在本實施例中,重復度預設閾值為50%,而上述關鍵詞A和關鍵詞B所對應的視頻的重復度達到了預設閾值,故關鍵詞A和關鍵詞B中,只保留其中一個關鍵詞,并刪除另外一個關鍵詞。
[0058]需要說明的是,上述步驟S21中,比較兩個關鍵詞對應的視頻中相同視頻的數(shù)目時,根據(jù)以下信息中的一項或多項判斷視頻是否相同:
[0059]判斷視頻的標題是否相同;判斷視頻的語音信息是否相同;判斷視頻的字幕信息是否相同;判斷根據(jù)預設提取方式提取的視頻關鍵幀是否相同。
[0060]同時,當兩個關鍵詞對應的視頻所對應的上述信息中,存在一項或者多項相同時,可進一步判斷上述兩個關鍵詞對應的視頻的時長是否相同。
[0061]如此,通過將兩個關鍵詞對應的視頻的重復度做量化處