推廣信息的處理方法及裝置制造方法
【專利摘要】本發(fā)明提供一種推廣信息的處理方法及裝置。本發(fā)明實施例通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會引起視頻文件的觀看者的興趣以對推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
【專利說明】推廣信息的處理方法及裝置
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及推送技術(shù),尤其涉及一種推廣信息的處理方法及裝置。
【【背景技術(shù)】】
[0002]近年來,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,逐漸興起了推廣信息的推送服務(wù),例如,廣告推送、游戲推送或應(yīng)用推送等。在播放多媒體文件的過程中,例如,接收開始播放的指令之后,或者接收暫停播放或停止播放的指令之后,等,可以隨機(jī)向用戶推送推廣信息。
[0003]然而,由于推廣信息是隨機(jī)推送的,從而導(dǎo)致了推廣信息的轉(zhuǎn)化率的降低。
【
【發(fā)明內(nèi)容】
】
[0004]本發(fā)明的多個方面提供一種推廣信息的處理方法及裝置,用以提高推廣信息的轉(zhuǎn)化率。
[0005]本發(fā)明的一方面,提供一種推廣信息的處理方法,包括:
[0006]獲取多媒體文件的字幕內(nèi)容;
[0007]根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文 件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0008]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,包括:
[0009]對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息;
[0010]對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息;
[0011]根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0012]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,包括:
[0013]計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離;
[0014]選擇最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。
[0015]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息,包括:
[0016]利用LDA算法,對所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。[0017]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息,包括:
[0018]利用LDA算法,對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個第二特征信息。
[0019]本發(fā)明的另一方面,提供一種推廣信息的處理裝置,包括:
[0020]獲取單元,用于獲取多媒體文件的字幕內(nèi)容;
[0021]匹配單元,用于根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0022]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述匹配單元,具體用于
[0023]對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息;
[0024]對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息;以及
[0025]根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0026]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述匹配單元,具體用于
[0027]計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離;以及
[0028]選擇最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。
[0029]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述匹配單元,具體用于
[0030]利用LDA算法,對所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。
[0031]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述匹配單元,具體用于
[0032]利用LDA算法,對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個第二特征信息。
[0033]由上述技術(shù)方案可知,本發(fā)明實施例通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會引起視頻文件的觀看者的興趣以對推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0034]另外,采用本發(fā)明提供的技術(shù)方案,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會符合視頻文件的觀看者的情緒波動,能夠有效提高推廣信息的滿意度和相關(guān)性。
[0035]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實現(xiàn)推廣信息的自動推送,因此,能夠有效提高推廣信息的推送成本。
【【專利附圖】
【附圖說明】】
[0036]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0037]圖1為本發(fā)明一實施例提供的推廣信息的處理方法的流程示意圖;
[0038]圖2為本發(fā)明另一實施例提供的推廣信息的處理裝置的結(jié)構(gòu)示意圖。
【【具體實施方式】】
[0039]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞 動前提下所獲得的全部其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0040]需要說明的是,本發(fā)明實施例中所涉及的終端可以包括但不限于手機(jī)、個人數(shù)字助理(Personal Digital Assistant, PDA)、無線手持裝置、無線上網(wǎng)本、個人電腦(Personal Computer, PC)、便攜電腦、MP3播放器、MP4播放器等。
[0041 ] 另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
[0042]圖1為本發(fā)明一實施例提供的推廣信息的處理方法的流程示意圖,如圖1所示。
[0043]101、獲取多媒體文件的字幕內(nèi)容。
[0044]其中,多媒體文件可以包括但不限于音頻文件和視頻文件中的至少一項,本實施例對此不進(jìn)行特別限定。
[0045]102、根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0046]需要說明的是,101和102的執(zhí)行主體可以是推送裝置,可以位于本地的應(yīng)用中,或者還可以位于網(wǎng)絡(luò)側(cè)的服務(wù)器中,或者也可以部分功能位于應(yīng)用中,部分功能位于服務(wù)器中,本實施例對此不進(jìn)行限定。
[0047]可以理解的是,所述應(yīng)用可以是終端上所安裝的應(yīng)用程序,或者還可以是終端上所安裝的瀏覽器的一個網(wǎng)頁,只要能夠?qū)崿F(xiàn)推廣信息的匹配,以提供推廣信息的客觀存在形式都可以,本實施例對此不進(jìn)行特別限定。
[0048]這樣,通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會引起視頻文件的觀看者的興趣以對推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0049]可選地,在本實施例的一個可能的實現(xiàn)方式中,在101中,推送裝置具體可以獲取多媒體文件在指定時間范圍之內(nèi)的內(nèi)幕信息,或者還可以獲取多媒體文件在全部時間范圍之內(nèi)的內(nèi)幕信息,本實施例對此不進(jìn)行特別限定。
[0050]一般來說,多媒體文件的字幕內(nèi)容可以存儲在字幕文件中,該字幕文件中包含字幕時間和字幕內(nèi)容,例如,字幕文件可以包含如下內(nèi)容:
[0051]00:00:36, 136 ^ 00:00:36, 731
[0052]What must it be like not to be crippled by fear and self-loathing ?;
[0053]其中,“00:00:36,136—00:00:36,731”為字幕時間,“What must it be like notto be crippled by fear and self-loathing ?,,為字幕內(nèi)容。
[0054]具體地,推送裝置具體可以對字幕文件進(jìn)行規(guī)格化處理,以提取出該字幕文件中所包含的字幕內(nèi)容。
[0055]還有些時候,多媒體文件的字幕內(nèi)容并不是單獨(dú)存儲在字幕文件中,而其就是多媒體文件的內(nèi)容的一部分。那么,所述推送裝置還可以進(jìn)一步利用現(xiàn)有技術(shù)中的字幕提取技術(shù),從多媒體文件中提取出字幕內(nèi)容。其中,字幕提取技術(shù)的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0056]可選地,在本實施例的一個可能的實現(xiàn)方式中,在102中,推送裝置具體可以對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息,以及對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息。然后,所述推送裝置則可以根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0057]這樣,通過對多媒體文件的字幕內(nèi)容的挖掘,進(jìn)而匹配出對應(yīng)的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在多媒體文件的播放過程中進(jìn)行推送,能夠有效保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0058]具體地,所述推 送裝置具體可以計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離。
[0059]然后,所述推送裝置則可以選擇最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。例如,可以按照距離從小到大的順序,對至少一個候選推廣信息進(jìn)行排序,排序結(jié)果中排名靠前的一個或多個候選推廣信息就是“最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息”。
[0060]或者,所述推送裝置還可以選擇小于或等于預(yù)先配置的距離閾值的距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,本實施例對此不進(jìn)行特別限定。
[0061]其中,所述候選推廣信息的文本信息,可以為候選推廣信息的屬性信息,可以包括但不限于類型;領(lǐng)域;關(guān)鍵詞;標(biāo)簽;以及描述中的至少一項,本實施例對此不進(jìn)行特別限定。
[0062]具體地,推送裝置可以采用現(xiàn)有技術(shù)中的任一特征提取算法,對所述字幕內(nèi)容或候選推廣信息的文本信息進(jìn)行特征提取,本實施例對此不進(jìn)行特別限定。
[0063]例如,推送裝置可以利用主題模型(Latent Dirichlet Allocation,LDA)算法,對所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息即特征向量A(al,a2, a3,……,an);以及利用LDA算法,對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個第二特征信息即特征向量B (bl,b2,b3,……,bn)。進(jìn)而,所述推送裝置則可
以計算特征向量A (al,a2,a3,......,an)與特征向量B (bl,b2,b3,......,bn)之間的距離。
其中,LDA算法的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0064]本實施例中,通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會引起視頻文件的觀看者的興趣以對推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0065]另外,采用本發(fā)明提供的技術(shù)方案,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會符合視頻文件的觀看者的情緒波動,能夠有效提高推廣信息的滿意度和相關(guān)性。
[0066]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實現(xiàn)推廣信息的自動推送,因此,能夠有效提高推廣信息的推送成本。
[0067]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實現(xiàn)推廣信息的自動推送,操作簡單,因此,能夠有效提高推廣信息的推送效率。
[0068]需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。
[0069]在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。
[0070]圖2為本發(fā)明另一實施例提供的推廣信息的處理裝置的結(jié)構(gòu)示意圖,如圖2所示。本實施例的推廣信息的處理裝置可以包括獲取單元21和匹配單元22。其中,
[0071]獲取單元21,用于獲取多媒體文件的字幕內(nèi)容。
[0072]其中,多媒體文件可以包括但不限于音頻文件和視頻文件中的至少一項,本實施例對此不進(jìn)行特別限定。
[0073]匹配單元22,用于根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0074]需要說明的 是,本實施例所提供的推廣信息的處理裝置可以是一推送裝置,可以位于本地的應(yīng)用中,或者還可以位于網(wǎng)絡(luò)側(cè)的服務(wù)器中,或者也可以部分功能位于應(yīng)用中,部分功能位于服務(wù)器中,本實施例對此不進(jìn)行限定。
[0075]可以理解的是,所述應(yīng)用可以是終端上所安裝的應(yīng)用程序,或者還可以是終端上所安裝的瀏覽器的一個網(wǎng)頁,只要能夠?qū)崿F(xiàn)推廣信息的匹配,以提供推廣信息的客觀存在形式都可以,本實施例對此不進(jìn)行特別限定。
[0076]這樣,通過獲取單元獲取多媒體文件的字幕內(nèi)容,進(jìn)而由匹配單元根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會引起視頻文件的觀看者的興趣以對推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0077]可選地,在本實施例的一個可能的實現(xiàn)方式中,所述獲取單元21,具體可以獲取多媒體文件在指定時間范圍之內(nèi)的內(nèi)幕信息,或者還可以獲取多媒體文件在全部時間范圍之內(nèi)的內(nèi)幕信息,本實施例對此不進(jìn)行特別限定。
[0078]一般來說,多媒體文件的字幕內(nèi)容可以存儲在字幕文件中,該字幕文件中包含字幕時間和字幕內(nèi)容,例如,字幕文件可以包含如下內(nèi)容:
[0079]00:00:36,136 — 00:00:36,731
[0080]What must it be like not to be crippled by fear and self-loathing ?;
[0081]其中,“00:00:36,136—00:00:36,731”為字幕時間,“What must it be like notto be crippled by fear and self-loathing ?,,為字幕內(nèi)容。
[0082]具體地,所述獲取單元21具體可以對字幕文件進(jìn)行規(guī)格化處理,以提取出該字幕文件中所包含的字幕內(nèi)容。
[0083]還有些時候,多媒體文件的字幕內(nèi)容并不是單獨(dú)存儲在字幕文件中,而其就是多媒體文件的內(nèi)容的一部分。那么,所述獲取單元21還可以進(jìn)一步利用現(xiàn)有技術(shù)中的字幕提取技術(shù),從多媒體文件中提取出字幕內(nèi)容。其中,字幕提取技術(shù)的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0084]可選地,在本實施例的一個可能的實現(xiàn)方式中,所述匹配單元22,具體可以用于對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息;對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息;以及根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0085]這樣,通過對多媒體文件的字幕內(nèi)容的挖掘,進(jìn)而匹配出對應(yīng)的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在多媒體文件的播放過程中進(jìn)行推送,能夠有效保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0086]具體地,所述匹配單元22,具體可以用于計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離;以及選擇最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。例如,可以按照距離從小到大的順序,對至少一個候選推廣信息進(jìn)行排序,排序結(jié)果中排名靠前的一個或多個候選推廣信息就是“最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息”。
[0087] 具體地,所述匹配單元22,具體可以用于計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離;以及選擇小于或等于預(yù)先配置的距離閾值的距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。
[0088]其中,所述候選推廣信息的文本信息,可以為候選推廣信息的屬性信息,可以包括但不限于類型;領(lǐng)域;關(guān)鍵詞;標(biāo)簽;以及描述中的至少一項,本實施例對此不進(jìn)行特別限定。
[0089]具體地,所述匹配單元2 2可以采用現(xiàn)有技術(shù)中的任一特征提取算法,對所述字幕內(nèi)容或候選推廣信息的文本信息進(jìn)行特征提取,本實施例對此不進(jìn)行特別限定。
[0090]例如,所述匹配單元22可以利用LDA算法,對所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息即特征向量A (al,a2,a3,……,an);以及利用LDA算法,對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個第二特征信息即特征
向量B (bl,b2,b3,......,bn)。進(jìn)而,貝U可以計算特征向量A (al,a2,a3,......,an)與特征
向量B (bl,b2,b3,……,bn)之間的距離。其中,LDA算法的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0091]本實施例中,通過獲取單元獲取多媒體文件的字幕內(nèi)容,進(jìn)而由匹配單元根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會引起視頻文件的觀看者的興趣以對推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0092]另外,采用本發(fā)明提供的技術(shù)方案,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會符合視頻文件的觀看者的情緒波動,能夠有效提高推廣信息的滿意度和相關(guān)性。
[0093]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實現(xiàn)推廣信息的自動推送,因此,能夠有效提高推廣信息的推送成本。
[0094]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實現(xiàn)推廣信息的自動推送,操作簡單,因此,能夠有效提高推廣信息的推送效率。
[0095]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
[0096]在本發(fā)明所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0097]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。[0098]另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0099]上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)裝置(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory, ROM)、隨機(jī)存取存儲器(Random Access Memory, RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0100]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種推廣信息的處理方法,其特征在于,包括: 獲取多媒體文件的字幕內(nèi)容; 根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,包括: 對所述字幕內(nèi)容進(jìn)行 特征提取,以獲得第一特征信息; 對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息; 根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,包括: 計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離; 選擇最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息,包括: 利用LDA算法,對所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息,包括: 利用LDA算法,對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個第二特征信息。
6.一種推廣信息的處理裝置,其特征在于,包括: 獲取單元,用于獲取多媒體文件的字幕內(nèi)容; 匹配單元,用于根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述匹配單元,具體用于 對所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息; 對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個第二特征信息;以及 根據(jù)所述第一特征信息和所述至少一個第二特征信息,選擇至少一個候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述匹配單元,具體用于計算所述第一特征信息與所述至少一個第二特征信息中每個第二特征信息之間的距離;以及 選擇最小的至少一個距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對應(yīng)的第二特征信息所屬的至少一個候選推廣信息,以作為所述目標(biāo)推廣信息。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述匹配單元,具體用于 利用LDA算法,對所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。
10.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述匹配單元,具體用于 利用LDA算法,對待推送的至少一個候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個第 二特征信息。
【文檔編號】G06Q30/02GK103971268SQ201410148989
【公開日】2014年8月6日 申請日期:2014年4月14日 優(yōu)先權(quán)日:2014年4月14日
【發(fā)明者】由清圳 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司