1.基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,本發(fā)明涉及語義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其特征是,包括如下步驟:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國每月搜索量、競爭程度和估算每次點(diǎn)擊費(fèi)用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的,其具體計(jì)算過程如下:
這里相關(guān)關(guān)鍵詞個(gè)數(shù)為m,既有下列矩陣:
、、、、依次為第i個(gè)關(guān)鍵詞對(duì)應(yīng)的本國每月搜索量、競爭程度、估算每次點(diǎn)擊費(fèi)用(CPC)、首頁網(wǎng)頁數(shù)、總搜索頁面數(shù)再降維
為四維,即
為搜索效能,為價(jià)值率,即為下式:
步驟4:利用改進(jìn)的均值中心算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:初始化簇的數(shù)目k,從數(shù)據(jù)對(duì)象集合D中隨機(jī)選擇k個(gè)初始簇中心,初始化目標(biāo)函數(shù);
步驟4.2:對(duì)每類關(guān)鍵詞進(jìn)行重新分配,按函數(shù)p(i)選擇聚類中心j;
步驟4.3:根據(jù)判定函數(shù)的結(jié)果,重新計(jì)算各簇中心;
步驟4.4:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟(2),否則迭代結(jié)束,輸出聚類結(jié)果
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
2.根據(jù)權(quán)利要求1中所述的基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其特征是,以上所述步驟4中的具體計(jì)算過程如下:
步驟4:利用改進(jìn)的均值中心算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:初始化簇的數(shù)目k,從數(shù)據(jù)對(duì)象集合D中隨機(jī)選擇k個(gè)初始簇中心,初始化目標(biāo)函數(shù),其具體計(jì)算過程如下:
上式為關(guān)鍵詞i屬于類中心,為關(guān)鍵詞i到類中心的距離
步驟4.2:對(duì)每類關(guān)鍵詞進(jìn)行重新分配,按函數(shù)p(i)選擇聚類中心j,其具體計(jì)算過程如下:
使函數(shù)p(i)最大的對(duì)應(yīng)聚類中心j,為關(guān)鍵詞i到全局最佳位置的距離,為關(guān)鍵詞i到聚類中心j的距離
上式與分別為關(guān)鍵詞i、聚類中心對(duì)象j的4維向量,即、
這里選擇使p(i)值最大,即選擇最小的聚類中心j,有下式:
步驟4.3:根據(jù)判定函數(shù)的結(jié)果,重新計(jì)算各簇中心,其具體計(jì)算過程如下:
為新分類后目標(biāo)函數(shù)的值,為初始化目標(biāo)函數(shù)或上一次迭代出的目標(biāo)函數(shù)
步驟4.4:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟(2),否則迭代結(jié)束,輸出聚類結(jié)果
改進(jìn)的均值中心算法的具體結(jié)構(gòu)流程如圖2。