一種標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制方法
【專(zhuān)利摘要】本發(fā)明提供一種標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制方法,包括:a.獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù);b.基于所述目標(biāo)數(shù)據(jù)確定自然語(yǔ)言相似度指數(shù);c.基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù);d.對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)處理,并獲得所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。還提供一種在計(jì)算機(jī)處理系統(tǒng)中進(jìn)行標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制裝置。本發(fā)明可以自適應(yīng)地實(shí)現(xiàn)標(biāo)簽與特定關(guān)鍵信息的匹配度的計(jì)算,提高計(jì)算效率并推進(jìn)了應(yīng)用程序的準(zhǔn)確度。本算法實(shí)現(xiàn)簡(jiǎn)單且計(jì)算復(fù)雜度適中,適合移動(dòng)應(yīng)用。
【專(zhuān)利說(shuō)明】一種標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)處理系統(tǒng),尤其是通過(guò)計(jì)算機(jī)進(jìn)行關(guān)聯(lián)度匹配計(jì)算的算法,具體地,涉及通過(guò)計(jì)算機(jī)對(duì)于標(biāo)簽與關(guān)鍵信息的匹配度進(jìn)行精準(zhǔn)計(jì)算的算法。
【背景技術(shù)】
[0002]隨著20世紀(jì)計(jì)算機(jī)的問(wèn)世,越來(lái)越多的邏輯問(wèn)題、數(shù)學(xué)問(wèn)題都可以通過(guò)計(jì)算機(jī)進(jìn)行計(jì)算。通過(guò)計(jì)算機(jī)進(jìn)行計(jì)算的原理是設(shè)計(jì)一套算法,對(duì)一個(gè)數(shù)學(xué)問(wèn)題或者現(xiàn)實(shí)技術(shù)問(wèn)題進(jìn)行描述,且該描述可以被計(jì)算機(jī)所識(shí)別,從而可以通過(guò)計(jì)算機(jī)的運(yùn)算來(lái)得出針對(duì)該數(shù)學(xué)問(wèn)題或現(xiàn)實(shí)技術(shù)問(wèn)題的答案。通過(guò)對(duì)算法的不斷改進(jìn),可以使得上述答案更加精確或者提高計(jì)算效率,從而對(duì)技術(shù)發(fā)展做出貢獻(xiàn)。
[0003]例如,通過(guò)計(jì)算機(jī)算法可以對(duì)計(jì)算機(jī)的內(nèi)存進(jìn)行補(bǔ)充,這樣的過(guò)程通常是通過(guò)利用外部存儲(chǔ)空間來(lái)完成的,即將計(jì)算機(jī)內(nèi)存內(nèi)暫時(shí)不使用的數(shù)據(jù)、但還沒(méi)有刪除的數(shù)據(jù)移動(dòng)到外部存儲(chǔ)空間,從而使得計(jì)算機(jī)內(nèi)存被空閑出來(lái)給其他應(yīng)用程序使用,并且在需要被移動(dòng)的數(shù)據(jù)時(shí)再將這些數(shù)據(jù)從外部存儲(chǔ)空間移回內(nèi)存內(nèi)。這樣的方式,犧牲了計(jì)算機(jī)的效率但卻提升了計(jì)算機(jī)的空間。
[0004]又例如,在針對(duì)一個(gè)現(xiàn)實(shí)技術(shù)問(wèn)題提出的算法中,可以得出符合要求的結(jié)果,但其計(jì)算復(fù)雜度過(guò)大導(dǎo)致計(jì)算機(jī)的處理效率過(guò)低。所以,提出一個(gè)新的算法來(lái)替代原算法,從而提高了計(jì)算效率,這也是對(duì)現(xiàn)有技術(shù)的一個(gè)改進(jìn)。
[0005]類(lèi)似的例子還存在很多,并被廣泛地應(yīng)用于各行各業(yè)。
[0006]尤其是,當(dāng)移動(dòng)終端作為具有計(jì)算能力的終端被廣泛應(yīng)用之后,眾多應(yīng)用廠商開(kāi)始借助移動(dòng)終端來(lái)進(jìn)行少量的計(jì)算,從而衍生了眾多的移動(dòng)應(yīng)用,這徹底改變了應(yīng)用程序的工作方式,也提出了更多的計(jì)算要求。通過(guò)移動(dòng)終端進(jìn)行計(jì)算,需要盡量少地利用移動(dòng)終端的中央處理單元,并在必須利用該中央處理單元時(shí)通過(guò)最簡(jiǎn)單、有效的算法完成計(jì)算,從而不對(duì)移動(dòng)終端構(gòu)成比較大的影響。相應(yīng)地,與移動(dòng)終端匹配的后臺(tái)服務(wù)器也要被設(shè)計(jì)為有效地進(jìn)行運(yùn)算從而可以實(shí)現(xiàn)應(yīng)用程序的計(jì)算目的。
[0007]在一類(lèi)應(yīng)用程序中,在移動(dòng)終端中可能設(shè)有多個(gè)標(biāo)簽,這些標(biāo)簽可能是針對(duì)網(wǎng)頁(yè)的標(biāo)簽,也可能是針對(duì)移動(dòng)終端本身的標(biāo)簽,也可能是針對(duì)移動(dòng)終端用戶的標(biāo)簽,也可能是針對(duì)移動(dòng)終端用戶所喜歡的應(yīng)用程序、物品、消費(fèi)地點(diǎn)的標(biāo)簽,而后臺(tái)服務(wù)器在通過(guò)應(yīng)用程序與移動(dòng)終端進(jìn)行交互的過(guò)程中,需要對(duì)這些標(biāo)簽與某些關(guān)鍵信息的匹配度進(jìn)行精準(zhǔn)地計(jì)算,這樣的計(jì)算就需要足夠精確,同時(shí)不過(guò)多占用移動(dòng)終端的計(jì)算能力、通訊渠道。然而,現(xiàn)有技術(shù)中對(duì)于此類(lèi)應(yīng)用的算法還不足夠好。
[0008]因此,本發(fā)明要解決如何更準(zhǔn)確地對(duì)移動(dòng)終端中的標(biāo)簽與特定關(guān)鍵信息的匹配度選擇將要發(fā)布的信息的問(wèn)題。
【發(fā)明內(nèi)容】
[0009]針對(duì)現(xiàn)有技術(shù)中無(wú)法對(duì)標(biāo)簽的匹配度進(jìn)行精準(zhǔn)計(jì)算的缺陷,本發(fā)明的目的是提供一種標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制方法以及相應(yīng)的控制裝置。
[0010]根據(jù)本發(fā)明的一個(gè)方面,提供一種標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制方法,用于對(duì)一個(gè)標(biāo)簽與目標(biāo)數(shù)據(jù)的匹配度進(jìn)行計(jì)算,包括如下步驟:
[0011]a.獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù),所述標(biāo)簽數(shù)據(jù)對(duì)應(yīng)于所述標(biāo)簽;
[0012]b.基于所述目標(biāo)數(shù)據(jù)確定自然語(yǔ)言相似度指數(shù);
[0013]c.基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù);
[0014]d.對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)處理,并獲得加權(quán)指數(shù),其中所述加權(quán)指數(shù)即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。
[0015]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種在計(jì)算機(jī)處理系統(tǒng)中進(jìn)行標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制裝置,其用于對(duì)一個(gè)標(biāo)簽與目標(biāo)數(shù)據(jù)的匹配度進(jìn)行計(jì)算,包括:第一獲取裝置,用于獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù),所述標(biāo)簽數(shù)據(jù)對(duì)應(yīng)于所述標(biāo)簽;第一計(jì)算裝置,用于基于所述目標(biāo)數(shù)據(jù)確定自然語(yǔ)言相似度指數(shù);第二計(jì)算裝置,用于基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù);第三計(jì)算裝置,用于對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)處理,并獲得加權(quán)指數(shù),其中所述加權(quán)指數(shù)即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。
[0016]本發(fā)明通過(guò)提出一種全新的計(jì)算機(jī)算法,使得標(biāo)簽與關(guān)鍵信息的匹配足夠智能化,可以自適應(yīng)地實(shí)現(xiàn)標(biāo)簽與特定關(guān)鍵信息的匹配度的計(jì)算,從而提高了計(jì)算效率并推進(jìn)了應(yīng)用程序的準(zhǔn)確度。本算法實(shí)現(xiàn)簡(jiǎn)單且計(jì)算復(fù)雜度適中,適合移動(dòng)應(yīng)用。同時(shí),基于本發(fā)明可以實(shí)現(xiàn)一種用于具有計(jì)算能力的終端內(nèi)的控制裝置,該控制裝置可以以芯片的方式實(shí)現(xiàn)對(duì)上述標(biāo)簽的匹配計(jì)算。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0017]通過(guò)閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0018]圖1示出根據(jù)本發(fā)明的第一實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法的流程圖;
[0019]圖2示出根據(jù)本發(fā)明的第二實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法的流程圖;
[0020]圖3示出根據(jù)本發(fā)明的第二實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法中基于所述情景相似度函數(shù)進(jìn)行相似度計(jì)算的流程圖;
[0021]圖4示出根據(jù)本發(fā)明的第二實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法中的實(shí)況指數(shù)函數(shù)的實(shí)現(xiàn)流程圖;
[0022]圖5示出根據(jù)本發(fā)明的第一實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制裝置的組成結(jié)構(gòu)示意圖;以及
[0023]圖6示出根據(jù)本發(fā)明的第一實(shí)施例的,提供標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法的系統(tǒng)的網(wǎng)絡(luò)拓?fù)洳灰鈭D。
【具體實(shí)施方式】
[0024]圖1示出根據(jù)本發(fā)明的第一實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法的流程圖。在本實(shí)施例中,通過(guò)圖1所示的控制方法,對(duì)一個(gè)標(biāo)簽與目標(biāo)數(shù)據(jù)的匹配度進(jìn)行計(jì)算,具體地,通過(guò)如下步驟實(shí)現(xiàn)該過(guò)程。[0025]首先,執(zhí)行步驟S210,獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù),所述標(biāo)簽數(shù)據(jù)對(duì)應(yīng)于所述標(biāo)簽。本領(lǐng)域技術(shù)人員理解,該獲取步驟可以在一個(gè)移動(dòng)終端中完成,也可以在后臺(tái)服務(wù)器(例如圖3所示設(shè)備91、92……9T)中完成。優(yōu)選地,通過(guò)后臺(tái)服務(wù)器獲取上述目標(biāo)數(shù)據(jù)以及標(biāo)簽數(shù)據(jù)并優(yōu)選地在后臺(tái)服務(wù)器中完成后續(xù)步驟。更為具體地,本領(lǐng)域技術(shù)人員理解,所述目標(biāo)數(shù)據(jù)可以通過(guò)外部輸入獲取,而所述標(biāo)簽數(shù)據(jù)則優(yōu)選地通過(guò)從移動(dòng)終端中獲取。例如,所述標(biāo)簽數(shù)據(jù)都存儲(chǔ)在移動(dòng)終端中的特定區(qū)域,通過(guò)一個(gè)固定的函數(shù)接口可以獲取這些標(biāo)簽數(shù)據(jù),或者通過(guò)讀取該存儲(chǔ)區(qū)域的數(shù)據(jù)可以獲得這些標(biāo)簽數(shù)據(jù)。在另一個(gè)變化例中,在所述移動(dòng)終端中安裝有與本控制方法對(duì)應(yīng)的客戶端程序,通過(guò)該客戶端程序,移動(dòng)終端用戶可以將各種標(biāo)簽數(shù)據(jù)輸入,或者可以將標(biāo)簽數(shù)據(jù)批量導(dǎo)入所述客戶端內(nèi),從而使得所述客戶端獲取這些標(biāo)簽數(shù)據(jù),進(jìn)而可以通過(guò)該客戶端將所述標(biāo)簽數(shù)據(jù)傳輸給所述后臺(tái)服務(wù)器,在此不予贅述。
[0026]然后,進(jìn)入步驟S211,基于所述目標(biāo)數(shù)據(jù)確定自然語(yǔ)言相似度指數(shù)。在獲取上述目標(biāo)數(shù)據(jù)后,優(yōu)選地通過(guò)各種算法確定自然語(yǔ)言相似度指數(shù)。具體地,本領(lǐng)域技術(shù)人員理解,可以通過(guò)多種算法計(jì)算所述自然語(yǔ)言相似度指數(shù),例如下述的自然語(yǔ)言函數(shù)。
[0027]接下來(lái),執(zhí)行步驟S212,基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù)。類(lèi)似地,在獲取了上述目標(biāo)數(shù)據(jù)后,優(yōu)選地計(jì)算情景相似度指數(shù)。同樣地本領(lǐng)域技術(shù)人員理解,可以通過(guò)多種算法計(jì)算所述情景相似度指數(shù),例如下述的情景相似度函數(shù)。
[0028]最后,進(jìn)入步驟S213,對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)處理,并獲得加權(quán)指數(shù)。本領(lǐng)域技術(shù)人員理解,所述加權(quán)指數(shù)即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。本領(lǐng)域技術(shù)人員理解,可以通過(guò)多種方式進(jìn)行上述加權(quán)處理。優(yōu)選地,在本實(shí)施例中,上述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)均被設(shè)置一個(gè)加權(quán)參數(shù)Rl、R2,且Rl+R2=l,即通過(guò)如下公式進(jìn)行加權(quán)計(jì)算:
[0029]S=Rl*自然語(yǔ)言相似度指數(shù)+R2*情景相似度指數(shù)。
[0030]其中,S即代表上述加權(quán)指數(shù),即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。
[0031]進(jìn)一步地,本領(lǐng)域技術(shù)人員理解,還可以通過(guò)其他方式進(jìn)行上述步驟S213的加權(quán)計(jì)算,例如還可以采用局部加權(quán)算法、移動(dòng)加權(quán)平均算法等算法進(jìn)行計(jì)算。
[0032]進(jìn)一步地,圖2示出根據(jù)本發(fā)明的第二實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法的流程圖。在圖1所示基礎(chǔ)上,圖2所示第二實(shí)施例采用了更為具體的實(shí)施方式實(shí)現(xiàn)對(duì)標(biāo)簽自適應(yīng)精準(zhǔn)匹配的處理。具體地,在圖1基礎(chǔ)上,計(jì)算自然語(yǔ)言相似度指數(shù)以及計(jì)算情景相似度指數(shù)的步驟采用了不同的實(shí)施方式。具體地,通過(guò)步驟S221實(shí)現(xiàn)計(jì)算自然語(yǔ)言相似度指數(shù)的目的,即基于自然語(yǔ)言相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)以及所述標(biāo)簽數(shù)據(jù)的相似度進(jìn)行計(jì)算,從而獲得所述自然語(yǔ)言相似度指數(shù)。其中,優(yōu)選地,所述步驟bl中的相似度值范圍優(yōu)選地在0~I之間。
[0033]更為具體地,所述自然語(yǔ)言相似度指數(shù)可以采用Fl進(jìn)行表示,即Fl (target,tag),其中,target表示目標(biāo)數(shù)據(jù),tag表示標(biāo)簽數(shù)據(jù)。
[0034]Fl函數(shù)標(biāo)示基于自然語(yǔ)言架構(gòu)下的,上述目標(biāo)數(shù)據(jù)和標(biāo)簽數(shù)據(jù)直接的相似度,該相似度取值范圍在0~I之間。例如,
[0035]Fl (樂(lè)觀,積極)=0.95
[0036]Fl (苦,甜)=0.01[0037]Fl (幸福,安康)=0.5
[0038]Fl (富二代,有錢(qián))=0.98
[0039]更進(jìn)一步地,本領(lǐng)域技術(shù)人員理解,在本實(shí)施例中,通過(guò)兩種步驟確定上述自然語(yǔ)言相似度指數(shù)。首先,在本實(shí)施例所應(yīng)用的系統(tǒng)中設(shè)置一個(gè)數(shù)據(jù)庫(kù)存儲(chǔ)各種數(shù)據(jù),例如上述的“樂(lè)觀”、“積極”等詞匯,并對(duì)各種詞匯、各種詞匯之間的相似度進(jìn)行存儲(chǔ),相應(yīng)地在步驟S220中獲取了目標(biāo)數(shù)據(jù)以及標(biāo)簽數(shù)據(jù)后,則在步驟S221中通過(guò)對(duì)上述數(shù)據(jù)庫(kù)的訪問(wèn)來(lái)獲得所述目標(biāo)數(shù)據(jù)與標(biāo)簽數(shù)據(jù)之間的相似度。本領(lǐng)域技術(shù)人員理解,在不同的硬件設(shè)備中,所述用于存儲(chǔ)所述詞匯、相似度的設(shè)備會(huì)有所區(qū)別。例如當(dāng)采用圖5所示控制裝置7類(lèi)似的芯片運(yùn)行圖2所示步驟時(shí),則優(yōu)選地所述詞匯、相似度等信息被存儲(chǔ)于一個(gè)Flash或RAM或類(lèi)似存儲(chǔ)設(shè)備中。而當(dāng)所述控制裝置7被設(shè)置為一個(gè)大型服務(wù)器中的一部分,則所述詞匯、相似度被存儲(chǔ)在一個(gè)數(shù)據(jù)庫(kù)中,優(yōu)選地作為一個(gè)數(shù)據(jù)表來(lái)存儲(chǔ),這并不影響本發(fā)明的技術(shù)內(nèi)容。
[0040]而進(jìn)一步地,還存在著一種可能性,即上述目標(biāo)數(shù)據(jù)以及標(biāo)簽數(shù)據(jù)無(wú)法在所述數(shù)據(jù)庫(kù)或其他存儲(chǔ)裝置被找到,則采用兩種不同技術(shù)方案對(duì)沒(méi)有被存儲(chǔ)的目標(biāo)數(shù)據(jù)以及標(biāo)簽數(shù)據(jù)的相似度予以計(jì)算。優(yōu)選地,在上述存儲(chǔ)裝置中尋找與所述目標(biāo)數(shù)據(jù)或標(biāo)簽數(shù)據(jù)的近似詞匯,若找到近似詞匯,則基于所述近似詞匯做與上述操作同樣的步驟來(lái)計(jì)算所述自然語(yǔ)言相似度指數(shù)。若次優(yōu)地,查找不到上述目標(biāo)數(shù)據(jù)或標(biāo)簽數(shù)據(jù)的近似詞匯,則通過(guò)通訊接口發(fā)出查詢請(qǐng)求。該查詢請(qǐng)求可以被一個(gè)特定服務(wù)器處理,也可以以云計(jì)算的方式進(jìn)行處理,即通過(guò)互聯(lián)網(wǎng)進(jìn)行搜索、計(jì)算。
[0041]進(jìn)一步地,通過(guò)上述方式,可以實(shí)現(xiàn)對(duì)所述自然語(yǔ)言相似度指數(shù)的計(jì)算,在此不予贅述。
[0042]更進(jìn)一步地,本領(lǐng)域技術(shù)人員理解,在一個(gè)變化例中,可以通過(guò)其他算法實(shí)現(xiàn)上述計(jì)算自然語(yǔ)言相似度指數(shù)的過(guò)程。例如,針對(duì)Fl (target,tag)可以進(jìn)行自然語(yǔ)言比較,即按照如下步驟進(jìn)行:
[0043]1.對(duì)target、tag中所包含的每個(gè)字進(jìn)行比較,從而得出針對(duì)每個(gè)字的相似度,表示為kl ;
[0044]ii對(duì)target、tag中所包含的每個(gè)詞進(jìn)行比較,從而得出針對(duì)每個(gè)詞的相似度,表示為k2 ;
[0045]ii1.對(duì)target、tag中所包含的每個(gè)詞進(jìn)行相似比較,從而得出針對(duì)每個(gè)相似詞的相似度,表示為k3;
[0046]iv.根據(jù)K=tl*kl+t2*k2+t3*k3的方式計(jì)算相似度K,并將K作為所述自然語(yǔ)言相似度指數(shù)。
[0047]在上述計(jì)算步驟中,tl〈t3〈t2。且通過(guò)這樣的計(jì)算過(guò)程,可以實(shí)現(xiàn)對(duì)自然語(yǔ)言相似度指數(shù)的精準(zhǔn)計(jì)算,在此不予贅述。
[0048]相應(yīng)地,本領(lǐng)域技術(shù)人員理解,在本實(shí)施例中,通對(duì)過(guò)步驟S222實(shí)現(xiàn)計(jì)算情景相似度指數(shù),即基于情景相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)以及時(shí)間參數(shù)進(jìn)行相似度計(jì)算,從而獲得所述情景相似度指數(shù)。
[0049]本領(lǐng)域技術(shù)人員理解,可以采用如下函數(shù)來(lái)計(jì)算所述情景相似度指數(shù):F2 (target, tag, time)。類(lèi)似地,所述target表示目標(biāo)數(shù)據(jù),tag表示標(biāo)簽數(shù)據(jù),所述time表示時(shí)間參數(shù)。
[0050]更進(jìn)一步地,在所述步驟S222的一個(gè)變化例中,所述步驟S222采用如下步驟實(shí)現(xiàn):基于情景相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、時(shí)間參數(shù)以及地理信息參數(shù)進(jìn)行相似度計(jì)算,從而獲得所述情景相似度指數(shù)。本領(lǐng)域技術(shù)人員理解,針對(duì)該變化例,也可以采用如下函數(shù)來(lái)計(jì)算所述情景相似度指數(shù):
[0051]F2 (target, tag, time, GPS),類(lèi)似地,所述target表示目標(biāo)數(shù)據(jù),tag表示標(biāo)簽數(shù)據(jù),所述time表示時(shí)間參數(shù),所述GPS表示地理信息參數(shù)。
[0052]基于上述F2函數(shù),可以容易地計(jì)算所述情景相似度指數(shù),例如:
[0053]F2( ‘牛排’,‘紅酒’,晚餐時(shí)間,上海餐廳)=0.85
[0054]F2( ‘毛峰’,‘豬肉’,12:00 ~13:00,黃山)=0.95
[0055]F2( ‘活魚(yú)’,‘紅燒醬’,午飯時(shí)間,閩南)=0.35
[0056]本領(lǐng)域技術(shù)人員理解,通過(guò)上述情景相似度函數(shù)F2,可以確定在某個(gè)時(shí)間范圍、某個(gè)地點(diǎn),target和tag之間的相似度值。進(jìn)一步地,可以確定所述相似度取值范圍在0~I之間,在此不予贅述。
[0057]進(jìn)一步地,本領(lǐng)域技術(shù)人員理解,可以通過(guò)圖3、圖4所示實(shí)施例實(shí)現(xiàn)基于所述情景相似度函數(shù)進(jìn)行情景相似度計(jì)算的過(guò)程,在此不予贅述。
`[0058]具體地,圖3示出根據(jù)本發(fā)明的第二實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法中基于所述情景相似度函數(shù)進(jìn)行情景相似度計(jì)算的流程圖。首先執(zhí)行步驟S231,基于挖掘函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)以及所述標(biāo)簽數(shù)據(jù)的進(jìn)行計(jì)算,并獲得挖掘指數(shù);然后進(jìn)入步驟S232,基于實(shí)況指數(shù)函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、時(shí)間參數(shù)以及地理信息參數(shù)進(jìn)行計(jì)算,并獲得實(shí)況指數(shù);最后執(zhí)行步驟S234,將所述挖掘指數(shù)與所述實(shí)況指數(shù)相加,并將和作為所述情景相似度指數(shù)。
[0059]具體地,在上述步驟S231中,所述挖掘函數(shù)通過(guò)如下方式獲得。首先,針對(duì)所述客戶標(biāo)簽分兩種:手動(dòng)輸入,智能抽取。在第一種情況下,優(yōu)選地通過(guò)人工輸入所述客戶標(biāo)簽。第二種情況下,在可以通過(guò)很多種途徑獲得所述客戶標(biāo)簽。例如,通過(guò)客戶瀏覽商品,收集商品標(biāo)簽(P1,P2,P3,P4,……)。具體地,通過(guò)如下步驟實(shí)現(xiàn)所述挖掘函數(shù):
[0060]I)假定每個(gè)客戶則擁有0個(gè)標(biāo)簽01,02,03,04,……
[0061]2) N個(gè)客戶則擁有N*0個(gè)標(biāo)簽,對(duì)這些數(shù)組采取關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘Apriori算法;
[0062]3)算法的結(jié)果在不同的置信度和支持度的閥值可以得到不同的規(guī)則合集,在本實(shí)施例中暫定10組閥值,對(duì)應(yīng)的關(guān)聯(lián)度從0.1~1,階梯值為0.1。若兩個(gè)標(biāo)簽,在不同的閥值下面有不同的取值,閥值最高的取值為最終值。通過(guò)上述步驟,則可以實(shí)現(xiàn)所述挖掘函數(shù),進(jìn)而可以確定所述挖掘指數(shù)。
[0063]進(jìn)一步地,本領(lǐng)域技術(shù)人員理解,所述確定客戶標(biāo)簽的方式還可以其他方式實(shí)現(xiàn),例如可以通過(guò)客戶發(fā)起即時(shí)咨詢的內(nèi)容文本而抽取(Ql,Q2,Q3,Q4,……)。又例如,可以通過(guò)分析客戶最近一段時(shí)期的社交關(guān)鍵字(SI,S2,S3,S4,……)。
[0064]............[0065]進(jìn)一步地,本領(lǐng)域技術(shù)人員理解,在所述步驟S232中,通過(guò)如下公式計(jì)算所述實(shí)況指數(shù),即:
[0066]Reality =[0067]Rl*Arrive (target, tag, time, GPS) +
[0068]R2*Hit (target, tag, time, GPS) +
[0069]R3*Query (target, tag, time, GPS)
[0070]Arrive,Hit,Query 三者的取值范圍在 0 ~I 之間,Rl+R2+R3=l。因此 Reality 取值范圍在0~I之間
[0071]其中,Arrive函數(shù)表示被推送標(biāo)簽到達(dá)率;所述Hit函數(shù)表示被推送標(biāo)簽被點(diǎn)擊率;所述Query函數(shù)表示所述被推送標(biāo)簽的互動(dòng)率,即針對(duì)該被推送標(biāo)簽,有哪些終端進(jìn)行了互動(dòng)操作。
[0072]具體地,通過(guò)如下實(shí)例可以更加清楚地知悉所述實(shí)況指數(shù)的計(jì)算過(guò)程:
[0073]I)假設(shè)客戶資源池有N個(gè)客戶;
[0074]2)首次推送標(biāo)簽,輸入目標(biāo)數(shù)據(jù)(keyl,key2,……),進(jìn)而群發(fā)N客戶。假定每客
戶均擁有手動(dòng)定義的tag合集(tagl, tag2, tag3, tag4,......),其中兩tag之間關(guān)聯(lián)度由
上述Fl函數(shù)進(jìn)行計(jì)算;
[0075]3)統(tǒng)計(jì)到達(dá)時(shí)間,用戶終端所在區(qū)域、被推送標(biāo)簽的到達(dá)率、被推送標(biāo)簽的被點(diǎn)擊率、以及被推送標(biāo)簽的互動(dòng)率;即,獲取到F2(keyl,tagni)的所有取值;
[0076]4)對(duì)此次推送涉及的所有的文本標(biāo)簽,通過(guò)使用基于密度聚類(lèi)算法,可以劃分出一些特定的標(biāo)簽簇;采用基于密度,而不是采用基于原型,基于圖的算法在于前者可以丟棄部分被識(shí)別為噪聲的點(diǎn),自動(dòng)的劃分簇,算法復(fù)雜度在0(m2);再者需要多次迭代,數(shù)據(jù)指數(shù)級(jí)增長(zhǎng),因此采用可伸縮的CURE算法,用來(lái)解決運(yùn)行時(shí)間過(guò)長(zhǎng),存儲(chǔ)量大的問(wèn)題;
[0077]5)將同一簇的標(biāo)簽關(guān)聯(lián)度定義為1,從而基于上述規(guī)則可以計(jì)算所述實(shí)況指數(shù)。
[0078]在上述基礎(chǔ)上,本領(lǐng)域技術(shù)人員理解,所述步驟S234中,所述情景相似度指數(shù)可以通過(guò)如下公式獲得:
[0079]F2=挖掘指數(shù)+實(shí)況指數(shù)
[0080]挖掘函數(shù)(target,tag) + 實(shí)況函數(shù)(target, tag, time, GPS)
[0081]圖4示出根據(jù)本發(fā)明的第二實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法中的實(shí)況指數(shù)函數(shù)的實(shí)現(xiàn)流程圖。圖4示出了圖3中步驟S232中計(jì)算所述實(shí)況指數(shù)的過(guò)程。具體地,在一個(gè)優(yōu)選實(shí)施例中,所述實(shí)況指數(shù)函數(shù)通過(guò)如下步驟實(shí)現(xiàn):
[0082]首先執(zhí)行步驟S240,基于所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、所述時(shí)間參數(shù)以及所述地理信息參數(shù)計(jì)算傳播到達(dá)指數(shù);
[0083]然后進(jìn)入步驟S241,基于所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、所述時(shí)間參數(shù)以及所述地理信息參數(shù)計(jì)算傳播點(diǎn)擊指數(shù);
[0084]然后執(zhí)行步驟S242,基于所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、所述時(shí)間參數(shù)以及所述地理信息參數(shù)計(jì)算傳播互動(dòng)指數(shù);
[0085]最后進(jìn)入步驟S243,將上述傳播到達(dá)指數(shù)、傳播點(diǎn)擊指數(shù)、傳播互動(dòng)指數(shù)進(jìn)行加權(quán)計(jì)算,并將所述加權(quán)結(jié)果作為所述實(shí)況指數(shù)。
[0086]圖5示出根據(jù)本發(fā)明的第一實(shí)施例的,標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制裝置的組成結(jié)構(gòu)示意圖。具體地,在本實(shí)施例中,所述標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制裝置7包括第一獲取裝置71、第一計(jì)算裝置72、第二計(jì)算裝置73、第三計(jì)算裝置74。其中,所述第一獲取裝置71用于獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù),所述標(biāo)簽數(shù)據(jù)對(duì)應(yīng)于所述標(biāo)簽;所述第一計(jì)算裝置72用于基于所述目標(biāo)數(shù)據(jù)計(jì)算自然語(yǔ)言相似度指數(shù);所述第二計(jì)算裝置73用于基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù);所述第三計(jì)算裝置74用于對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)計(jì)算,并獲得加權(quán)指數(shù),其中所述加權(quán)指數(shù)即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。
[0087]本領(lǐng)域技術(shù)人員理解,通過(guò)上述四個(gè)裝置的配合,可以實(shí)現(xiàn)對(duì)標(biāo)簽自適應(yīng)精準(zhǔn)匹配的處理。具體地,本領(lǐng)域技術(shù)人員理解,所述第一計(jì)算裝置72、第二計(jì)算裝置73可以并行地進(jìn)行計(jì)算,而不必要順行地進(jìn)行計(jì)算,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。
[0088]更進(jìn)一步地,在本實(shí)施例中,所述第一計(jì)算裝置72包括第四計(jì)算裝置721,其用于基于自然語(yǔ)言相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)以及所述標(biāo)簽數(shù)據(jù)的相似度進(jìn)行計(jì)算,從而獲得所述自然語(yǔ)言相似度指數(shù)。
[0089]更進(jìn)一步地,在本實(shí)施例中,所述第二計(jì)算裝置73包括第五計(jì)算裝置731,其用于基于情景相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、時(shí)間參數(shù)以及地理信息參數(shù)進(jìn)行相似度計(jì)算,從而獲得所述情景相似度指數(shù)。
[0090]更為具體地,上述第一獲取裝置71、第一計(jì)算裝置72、第二計(jì)算裝置73、第三計(jì)算裝置74的內(nèi)部流程可以參考上述圖1至圖4實(shí)施例指導(dǎo)本領(lǐng)域技術(shù)人員實(shí)現(xiàn),在此不予贅述。
[0091]圖6示出根據(jù)本發(fā)明的第一實(shí)施例的,提供標(biāo)簽自適應(yīng)精準(zhǔn)匹配控制方法的系統(tǒng)的網(wǎng)絡(luò)拓?fù)涫疽鈭D。本領(lǐng)域技術(shù)人員理解,在本實(shí)施例中,通過(guò)后臺(tái)服務(wù)器91、92……9T與移動(dòng)終端51、52……5N進(jìn)行交互。在具體的應(yīng)用中,存在N個(gè)移動(dòng)終端,每個(gè)終端有M個(gè)標(biāo)簽數(shù)據(jù),且針對(duì)一個(gè)終端構(gòu)成一個(gè)標(biāo)簽集合,針對(duì)N個(gè)移動(dòng)終端構(gòu)成一個(gè)標(biāo)簽集合矩陣。在當(dāng)目標(biāo)數(shù)據(jù)確定后,通過(guò)上述圖1至圖4所示的步驟確定目標(biāo)數(shù)據(jù)與標(biāo)簽數(shù)據(jù)的相似度,并根據(jù)該相似度確定所述N個(gè)終端中與所述目標(biāo)數(shù)據(jù)相適應(yīng)的終端。在確定所述終端后,則可以向這些終端推送所述被推送標(biāo)簽。
[0092]進(jìn)一步地,參考上述圖1至圖6,本領(lǐng)域技術(shù)人員理解,所述目標(biāo)數(shù)據(jù)包括多種類(lèi)型的信息,例如可以是關(guān)鍵字?jǐn)?shù)據(jù),優(yōu)選地以字符的形式存在,又例如可以是語(yǔ)音數(shù)據(jù),優(yōu)選地以語(yǔ)音數(shù)據(jù)的方式存在;又例如可以是圖片數(shù)據(jù)、視頻數(shù)據(jù)、用于描述氣味的數(shù)據(jù)以及用于描述液體特征的數(shù)據(jù)中的任一種或任多種,這并不影響本發(fā)明的技術(shù)內(nèi)容。
[0093]以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。
【權(quán)利要求】
1.一種標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制方法,用于對(duì)一個(gè)標(biāo)簽與目標(biāo)數(shù)據(jù)的匹配度進(jìn)行計(jì)算,包括如下步驟: a.獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù),所述標(biāo)簽數(shù)據(jù)對(duì)應(yīng)于所述標(biāo)簽; b.基于所述目標(biāo)數(shù)據(jù)確定自然語(yǔ)言相似度指數(shù); c.基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù); d.對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)處理,并獲得加權(quán)指數(shù),其中所述加權(quán)指數(shù)即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。
2.根據(jù)權(quán)利要求1所述的控制方法,其特征在于,所述步驟b包括如下步驟: bl.基于自然語(yǔ)言相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)以及所述標(biāo)簽數(shù)據(jù)的相似度進(jìn)行計(jì)算,從而獲得所述自然語(yǔ)言相似度指數(shù)。
3.根據(jù)權(quán)利要求2所述的控制方法,其特征在于,所述步驟bl中的相似度值范圍優(yōu)選地在O~I之間。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的控制方法,其特征在于,所述步驟c包括如下步驟: Cl.基于情景相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)以及時(shí)間參數(shù)進(jìn)行相似度計(jì)算,從而獲得所述情景相似度指數(shù)。
5.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的控制方法,其特征在于,所述步驟c包括如下步驟: Cl'.基于情景相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、時(shí)間參數(shù)以及地理信息參數(shù)進(jìn)行相似度計(jì)算,從而獲得所述情景相似度指數(shù)。
6.根據(jù)權(quán)利要求4或5所述的控制方法,其特征在于,所述基于所述情景相似度函數(shù)進(jìn)行相似度計(jì)算的步驟包括如下步驟: 1.基于挖掘函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)以及所述標(biāo)簽數(shù)據(jù)的進(jìn)行計(jì)算,并獲得挖掘指數(shù); ii基于實(shí)況指數(shù)函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、時(shí)間參數(shù)以及地理信息參數(shù)進(jìn)行計(jì)算,并獲得實(shí)況指數(shù); ii1.將所述挖掘指數(shù)與所述實(shí)況指數(shù)相加,并將和作為所述情景相似度指數(shù); 其中,優(yōu)選地,所述挖掘函數(shù)通過(guò)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘Apriori算法實(shí)現(xiàn)。
7.根據(jù)權(quán)利要求6所述的控制方法,其特征在于,所述實(shí)況指數(shù)函數(shù)包括如下步驟: 1.基于所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、所述時(shí)間參數(shù)以及所述地理信息參數(shù)計(jì)算傳播到達(dá)指數(shù); I1.基于所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、所述時(shí)間參數(shù)以及所述地理信息參數(shù)計(jì)算傳播點(diǎn)擊指數(shù); II1.基于所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、所述時(shí)間參數(shù)以及所述地理信息參數(shù)計(jì)算傳播互動(dòng)指數(shù); IV.將上述傳播到達(dá)指數(shù)、傳播點(diǎn)擊指數(shù)、傳播互動(dòng)指數(shù)進(jìn)行加權(quán)計(jì)算,并將所述加權(quán)結(jié)果作為所述實(shí)況指數(shù)。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的控制方法,其特征在于,所述目標(biāo)數(shù)據(jù)包括如下數(shù)據(jù)中的任一種或任多種: -關(guān)鍵字?jǐn)?shù)據(jù);-語(yǔ)音數(shù)據(jù); -圖片數(shù)據(jù); -視頻數(shù)據(jù); -用于描述氣味的數(shù)據(jù);以及 -用于描述液體特征的數(shù)據(jù)。
9.一種在具有計(jì)算能力的終端內(nèi)處理標(biāo)簽自適應(yīng)精準(zhǔn)匹配的控制裝置,用于對(duì)一個(gè)標(biāo)簽與目標(biāo)數(shù)據(jù)的匹配度進(jìn)行計(jì)算,包括如下裝置: 第一獲取裝置,其用于獲取目標(biāo)數(shù)據(jù)以及至少一個(gè)標(biāo)簽數(shù)據(jù),所述標(biāo)簽數(shù)據(jù)對(duì)應(yīng)于所述標(biāo)簽; 第一計(jì)算裝置,其用于基于所述目標(biāo)數(shù)據(jù)計(jì)算自然語(yǔ)言相似度指數(shù); 第二計(jì)算裝置,其用于基于所述目標(biāo)數(shù)據(jù)確定情景相似度指數(shù); 第三計(jì)算裝置,其用于對(duì)所述自然語(yǔ)言相似度指數(shù)以及所述情景相似度指數(shù)進(jìn)行加權(quán)計(jì)算,并獲得加權(quán)指數(shù),其中所述加權(quán)指數(shù)即為所述標(biāo)簽與所述目標(biāo)數(shù)據(jù)匹配度指數(shù)。
10.根據(jù)權(quán)利要求9所述的控制裝置,其特征在于,所述第一計(jì)算裝置包括: 第四計(jì)算裝置,其用于基于自然語(yǔ)言相似度函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)以及所述標(biāo)簽數(shù)據(jù)的相似度進(jìn)行計(jì)算,從而獲得所述自然語(yǔ)言相似度指數(shù)。
11.根據(jù)權(quán)利要求9或10所述的控制裝置,其特征在于,所述第二計(jì)算裝置包括: 第五計(jì)算裝置,其用于基于情景相似度`函數(shù)對(duì)所述目標(biāo)數(shù)據(jù)、所述標(biāo)簽數(shù)據(jù)、時(shí)間參數(shù)以及地理信息參數(shù)進(jìn)行相似度計(jì)算,從而獲得所述情景相似度指數(shù)。
【文檔編號(hào)】G06F17/30GK103500219SQ201310476266
【公開(kāi)日】2014年1月8日 申請(qǐng)日期:2013年10月12日 優(yōu)先權(quán)日:2013年10月12日
【發(fā)明者】湯偉杰 申請(qǐng)人:翔傲信息科技(上海)有限公司