視頻播單排序方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及視頻技術(shù)領(lǐng)域,特別是涉及一種視頻播單排序方法及裝置。
【背景技術(shù)】
[0002] 隨著視頻數(shù)量和用戶(hù)對(duì)視頻搜索引擎使用率的快速提升,視頻搜索已成為用戶(hù)獲 取信息的一種有效方式。用戶(hù)進(jìn)行視頻搜索時(shí),視頻搜索引擎可以獲得包含多個(gè)符合搜索 條件的視頻播單的視頻播單候選集,這種情況下,為了提高用戶(hù)體驗(yàn),使用戶(hù)能夠觀看到質(zhì) 量較好的視頻,視頻搜索引擎可以將多個(gè)視頻播單排序后呈現(xiàn)給用戶(hù),例如,可以按照視頻 播單中各視頻質(zhì)量從高到低的順序?qū)⒁曨l播單進(jìn)行排序,并按順序呈現(xiàn)給用戶(hù)。
[0003]目前,視頻搜索引擎通常是基于視頻播單中各子視頻文本信息進(jìn)行視頻播單排 序。基于視頻文本信息的搜索排序主要根據(jù)以下幾個(gè)方面:1)相關(guān)性:視頻信息(標(biāo)題,副 標(biāo)題,別名,角色等)和搜索詞的文本匹配度、語(yǔ)義匹配度等;2)點(diǎn)擊率:視頻在不同時(shí)間周 期內(nèi)的搜索數(shù)、點(diǎn)擊數(shù)等;3)視頻質(zhì)量:視頻本身的屬性因素(碼率,時(shí)長(zhǎng)等)及用戶(hù)的反 饋(平均觀看時(shí)長(zhǎng)等);4)時(shí)間:視頻的發(fā)布時(shí)間和最后更新時(shí)間;5)其他:基于頻道、視頻 類(lèi)別等屬性的人工規(guī)則。視頻搜索引擎可以按固定的權(quán)重綜合各個(gè)維度的得分,進(jìn)而對(duì)視 頻播單候選集做最后的排序。
[0004] 然而,基于視頻文本信息的排序方法對(duì)視頻描述信息的依賴(lài)十分嚴(yán)重,通常簡(jiǎn)短 的視頻描述信息難以完整、準(zhǔn)確的表達(dá)視頻內(nèi)容。通常情況下,視頻描述信息可以由視頻上 傳者填寫(xiě),或者由服務(wù)器根據(jù)視頻內(nèi)容生成。針對(duì)用戶(hù)產(chǎn)生內(nèi)容(UGC),視頻描述信息由視 頻上傳者填寫(xiě),而視頻上傳者通常難以填寫(xiě)足夠完整、規(guī)范的視頻描述信息。因此,在視頻 排序時(shí),殘缺的、不準(zhǔn)確的視頻描述信息在相關(guān)性排序中得分很低,這類(lèi)視頻播單容易排在 靠后的位置,影響用戶(hù)體驗(yàn)。
[0005] 同時(shí),基于視頻文本信息的排序方法,還會(huì)產(chǎn)生一些作弊行為。如為了吸引點(diǎn)擊 率,視頻上傳者會(huì)給播單、視頻添加一些與視頻內(nèi)容不相關(guān)的描述信息,使得這類(lèi)視頻播單 排序較靠前,積累搜索數(shù)和點(diǎn)擊數(shù)。而基于點(diǎn)擊率的搜索得分會(huì)依賴(lài)播單、視頻積累的搜 索、點(diǎn)擊數(shù),使得這類(lèi)作弊的視頻播單分?jǐn)?shù)越來(lái)越高,影響用戶(hù)體驗(yàn)。
[0006] 因此,基于視頻文本信息的視頻播單排序方法,由于對(duì)視頻播單質(zhì)量的評(píng)價(jià)對(duì)視 頻描述信息的完整性和準(zhǔn)確性有較大的依賴(lài),該方法很難準(zhǔn)確地進(jìn)行視頻播單排序。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明實(shí)施例的目的在于提供一種視頻播單排序方法及裝置,以提高視頻播單排 序的準(zhǔn)確性。具體技術(shù)方案如下:
[0008] 第一方面,本發(fā)明提供了一種視頻播單排序方法,應(yīng)用于服務(wù)器,所述方法包括:
[0009] 響應(yīng)于接收到視頻搜索請(qǐng)求,獲取符合搜索條件的各候選視頻播單;
[0010] 從預(yù)先為每個(gè)視頻播單對(duì)應(yīng)存儲(chǔ)的屬性信息中,獲得各候選視頻播單的屬性信 息,所述屬性信息包括:所述各候選視頻播單的性能分?jǐn)?shù)和所述各候選視頻播單的上傳者 的等級(jí)分?jǐn)?shù);
[0011] 基于所述各候選視頻播單的性能分?jǐn)?shù)和所述各候選視頻播單的上傳者的等級(jí)分 數(shù),確定各候選視頻播單的排序分?jǐn)?shù);
[0012] 根據(jù)所述各候選視頻播單的排序分?jǐn)?shù),對(duì)所述各候選視頻播單進(jìn)行排序。
[0013] 進(jìn)一步地,通過(guò)如下步驟,預(yù)先為每個(gè)視頻播單對(duì)應(yīng)存儲(chǔ)屬性信息:
[0014] 從視頻庫(kù)中獲取所有視頻播單;
[0015] 提取各視頻播單的子視頻信息和各視頻播單的上傳者上傳的視頻的視頻信息;
[0016] 根據(jù)各視頻播單的子視頻信息計(jì)算對(duì)應(yīng)各視頻播單的性能分?jǐn)?shù)并對(duì)應(yīng)存儲(chǔ);
[0017] 根據(jù)各視頻播單的上傳者上傳的視頻的視頻信息,計(jì)算對(duì)應(yīng)各視頻播單的上傳者 的等級(jí)分?jǐn)?shù)并對(duì)應(yīng)存儲(chǔ)。
[0018] 進(jìn)一步地,所述子視頻信息包括:子視頻總個(gè)數(shù)和各子視頻時(shí)長(zhǎng);
[0019] 所述根據(jù)各視頻播單的子視頻信息計(jì)算對(duì)應(yīng)各視頻播單的性能分?jǐn)?shù)并對(duì)應(yīng)存儲(chǔ), 包括:
[0020] 基于各視頻播單的子視頻總個(gè)數(shù)和各子視頻時(shí)長(zhǎng),計(jì)算對(duì)應(yīng)各視頻播單的子視頻 時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù)、子視頻平均時(shí)長(zhǎng)分?jǐn)?shù)和子視頻個(gè)數(shù)分?jǐn)?shù);
[0021] 將所計(jì)算得到的各視頻播單的子視頻時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù)、子視頻平均時(shí)長(zhǎng)分?jǐn)?shù)和 子視頻個(gè)數(shù)分?jǐn)?shù)分別乘以預(yù)設(shè)權(quán)重后線性疊加,得到所述對(duì)應(yīng)各視頻播單的性能分?jǐn)?shù)并對(duì) 應(yīng)存儲(chǔ)。
[0022] 進(jìn)一步地,所述計(jì)算對(duì)應(yīng)各視頻播單的子視頻時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù)、子視頻平均時(shí) 長(zhǎng)分?jǐn)?shù)和子視頻個(gè)數(shù)分?jǐn)?shù),包括:
[0023] 利用以下公式計(jì)算對(duì)應(yīng)各視頻播單的子視頻時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù):
[0024] scorecv=min(0· 75,stddurati〇n/avgduration)
[0025] 其中,所述score。^任一視頻播單的子視頻時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù),所述stdduratlC]# 該視頻播單中子視頻時(shí)長(zhǎng)的標(biāo)準(zhǔn)差,所述avgd_tlcinS該視頻播單中子視頻時(shí)長(zhǎng)的均值;
[0026] 利用以下公式計(jì)算對(duì)應(yīng)各視頻播單的子視頻平均時(shí)長(zhǎng)分?jǐn)?shù):
[0027]
[0028] 其中,所述scoread為任一視頻播單的子視頻平均時(shí)長(zhǎng)分?jǐn)?shù),所述optimalduraticJ% 預(yù)設(shè)最優(yōu)子視頻平均時(shí)長(zhǎng);
[0029] 剎用以下公式計(jì)筧對(duì)應(yīng)各視頻播單的子視頻個(gè)數(shù)分?jǐn)?shù):
[0030]
[0031] 其中,所述scorej%任一視頻播單的子視頻個(gè)數(shù)分?jǐn)?shù),所述η為該視頻播單的子 視頻總個(gè)數(shù)。
[0032] 進(jìn)一步地,所述視頻信息包括:視頻總數(shù)、視頻總觀看次數(shù)、視頻總時(shí)長(zhǎng)和視頻總 中值觀看時(shí)長(zhǎng);
[0033] 所述根據(jù)各視頻播單的上傳者上傳的視頻的視頻信息,計(jì)算對(duì)應(yīng)各視頻播單的上 傳者的等級(jí)分?jǐn)?shù)并對(duì)應(yīng)存儲(chǔ),包括:
[0034] 基于各視頻播單的上傳者上傳的視頻的視頻總數(shù)、視頻總觀看次數(shù)、視頻總時(shí)長(zhǎng) 和視頻總中值觀看時(shí)長(zhǎng),計(jì)算對(duì)應(yīng)各視頻播單的上傳者上傳的視頻的視頻觀看次數(shù)分?jǐn)?shù)、 視頻個(gè)數(shù)分?jǐn)?shù)和視頻中值觀看時(shí)長(zhǎng)分?jǐn)?shù);
[0035] 將所計(jì)算得到的各視頻播單的上傳者上傳的視頻的視頻觀看次數(shù)分?jǐn)?shù)、視頻個(gè)數(shù) 分?jǐn)?shù)和視頻中值觀看時(shí)長(zhǎng)分?jǐn)?shù)相乘,得到所述對(duì)應(yīng)各視頻播單的上傳者的等級(jí)分?jǐn)?shù)并對(duì)應(yīng) 存儲(chǔ)。
[0036] 進(jìn)一步地,所述計(jì)算對(duì)應(yīng)各視頻播單的上傳者上傳的視頻的視頻觀看次數(shù)分?jǐn)?shù)、 視頻個(gè)數(shù)分?jǐn)?shù)和視頻中值觀看時(shí)長(zhǎng)分?jǐn)?shù),包括:
[0037] 利用以下公式計(jì)算對(duì)應(yīng)各視頻播單的上傳者上傳的視頻的視頻觀看次數(shù)分?jǐn)?shù):
[0038]
[0039] 其中,所述sC〇revvS任一視頻播單的上傳者上傳的視頻的視頻觀看次數(shù)分?jǐn)?shù),所 述avgvv為該上傳者上傳的視頻的平均觀看次數(shù),所述mid"為當(dāng)所述scorevv =1時(shí)的平均 觀看次數(shù);
[0040] 利用以下公式計(jì)算對(duì)應(yīng)各視頻播單的上傳者上傳的視頻的視頻個(gè)數(shù)分?jǐn)?shù):
[0041 ]
[0042] 其中,所述scorev。為任一視頻播單的上傳者上傳的視頻的視頻個(gè)數(shù)分?jǐn)?shù),所述 videoe_t為該上傳者上傳的視頻總數(shù);
[0043] 利用以下公式計(jì)算對(duì)應(yīng)各視頻播單的上傳者上傳的視頻的視頻中值觀看時(shí)長(zhǎng)分 數(shù):
[0044]
[0045] 其中,所述scoremwt為任一視頻播單的上傳者上傳的視頻的視頻中值觀看時(shí)長(zhǎng)分 數(shù),所述aVg_tS該上傳者上傳的視頻的平均中值觀看時(shí)長(zhǎng),所述avgd為該上傳者上傳的視 頻的平均時(shí)長(zhǎng);
[0046] 進(jìn)一步地,所述基于所述各候選視頻播單的性能分?jǐn)?shù)和所述各候選視頻播單的上 傳者的等級(jí)分?jǐn)?shù),確定各候選視頻播單的排序分?jǐn)?shù),包括:
[0047] 將各候選視頻播單的性能分?jǐn)?shù)和對(duì)應(yīng)各候選視頻播單的上傳者的等級(jí)分?jǐn)?shù)相加, 得到各候選視頻播單的排序分?jǐn)?shù)。
[0048] 進(jìn)一步地,所述基于所述各候選視頻播單的性能分?jǐn)?shù)和所述各候選視頻播單的上 傳者的等級(jí)分?jǐn)?shù),確定各候選視頻播單的排序分?jǐn)?shù),包括:
[0049] 獲得性能分?jǐn)?shù)大于或等于第一預(yù)設(shè)閾值的第一候選視頻播單集合,獲得性能分?jǐn)?shù) 小于所述第一預(yù)設(shè)閾值的第二候選視頻播單集合;
[0050] 將所述第一候選視頻播單集合中各候選視頻播單的性能分?jǐn)?shù)與第一預(yù)設(shè)值相加, 將所述第二候選視頻播單集合中各候選視頻播單的性能分?jǐn)?shù)減去第二預(yù)設(shè)值,得到對(duì)應(yīng)各 候選視頻播單的待利用性能分?jǐn)?shù);
[0051] 獲得上傳者的等級(jí)分?jǐn)?shù)大于或等于第二預(yù)設(shè)閾值的第三候選視頻播單集合,獲得 上傳者的等級(jí)分?jǐn)?shù)小于所述第二預(yù)設(shè)閾值的第四候選視頻播單集合;
[0052] 將所述第三候選視頻播單集合中各候選視頻播單的上傳者的等級(jí)分?jǐn)?shù)與第三預(yù) 設(shè)值相加,將所述第四候選視頻播單集合中各候選視頻播單的上傳者的等級(jí)分?jǐn)?shù)減去第四 預(yù)設(shè)值,得到對(duì)應(yīng)各候選視頻播單的上傳者的待利用等級(jí)分?jǐn)?shù);
[0053] 將各候選視頻播單的待利用性能分?jǐn)?shù)和對(duì)應(yīng)各候選視頻播單的上傳者的待利用 等級(jí)分?jǐn)?shù)相加,得到各候選視頻播單的排序分?jǐn)?shù)。
[0054] 第二方面,本發(fā)明提供了一種視頻播單排序裝置,應(yīng)用于服務(wù)器,所述裝置包括:
[0055] 獲取模塊,用于響應(yīng)于接收到視頻搜索請(qǐng)求,獲取符合搜索條件的各候選視頻播 單;
[0056] 獲得模塊,用于從預(yù)先為每個(gè)視頻播單對(duì)應(yīng)存儲(chǔ)的屬性信息中,獲得各候選視頻 播單的屬性信息,所述屬性信息包括:所述各候選視頻播單的性能分?jǐn)?shù)和所述各候選視頻 播單的上傳者的等級(jí)分?jǐn)?shù);
[0057] 確定模塊,用于基于所述各候選視頻播單的性能分?jǐn)?shù)和所述各候選視頻播單的上 傳者的等級(jí)分?jǐn)?shù),確定各候選視頻播單的排序分?jǐn)?shù);
[0058] 排序模塊,用于根據(jù)所述各候選視頻播單的排序分?jǐn)?shù),對(duì)所述各候選視頻播單進(jìn) 行排序。
[0059] 進(jìn)一步地,所述裝置還包括:屬性信息預(yù)存模塊;
[0060] 所述屬性信息預(yù)存模塊,包括:
[0061] 獲取子模塊,用于從視頻庫(kù)中獲取所有視頻播單;
[0062] 提取子模塊,用于提取各視頻播單的子視頻信息和各視頻播單的上傳者上傳的視 頻的視頻信息;
[0063] 第一存儲(chǔ)子模塊,用于根據(jù)各視頻播單的子視頻信息計(jì)算對(duì)應(yīng)各視頻播單的性能 分?jǐn)?shù)并對(duì)應(yīng)存儲(chǔ);
[0064] 第二存儲(chǔ)子模塊,用于根據(jù)各視頻播單的上傳者上傳的視頻的視頻信息,計(jì)算對(duì) 應(yīng)各視頻播單的上傳者的等級(jí)分?jǐn)?shù)并對(duì)應(yīng)存儲(chǔ)。
[0065] 進(jìn)一步地,所述子視頻信息包括:子視頻總個(gè)數(shù)和各子視頻時(shí)長(zhǎng);
[0066] 所述第一存儲(chǔ)子模塊包括:
[0067] 第一計(jì)算子單元,用于基于各視頻播單的子視頻總個(gè)數(shù)和各子視頻時(shí)長(zhǎng),計(jì)算對(duì) 應(yīng)各視頻播單的子視頻時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù)、子視頻平均時(shí)長(zhǎng)分?jǐn)?shù)和子視頻個(gè)數(shù)分?jǐn)?shù);
[0068] 第一確定子單元,用于將所計(jì)算得到的各視頻播單的子視頻時(shí)長(zhǎng)離散系數(shù)分?jǐn)?shù)、 子視頻平均時(shí)長(zhǎng)分