本發(fā)明涉及語(yǔ)義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
背景技術(shù):
搜索引擎已成為廣大網(wǎng)民獲取信息的一個(gè)重要工具。搜索引擎優(yōu)化(Search Engine Optimization,簡(jiǎn)稱SEO)是指采用相關(guān)技術(shù)對(duì)網(wǎng)站進(jìn)行一系列優(yōu)化,從而提高相應(yīng)關(guān)鍵詞在搜索引擎上的排名,最終達(dá)到網(wǎng)站營(yíng)銷的目的。SEO歸根結(jié)底是關(guān)鍵詞的優(yōu)化。在市場(chǎng)多元化以及各行業(yè)消費(fèi)主體個(gè)性化需求的影響下,涌現(xiàn)出大量新的關(guān)鍵詞(特別是長(zhǎng)尾關(guān)鍵詞),一方面,這些數(shù)量龐大的關(guān)鍵詞給網(wǎng)站運(yùn)營(yíng)者帶來潛在的商機(jī);另一方面,針對(duì)這些關(guān)鍵詞的分析和優(yōu)化,也讓大部分SEO工作人員承擔(dān)巨大的工作量。關(guān)鍵詞優(yōu)化策略一般包括關(guān)鍵詞的選擇、關(guān)鍵詞的分布及密度控制等等,關(guān)鍵詞的使用是否得當(dāng),直接關(guān)系到網(wǎng)站在搜索引擎的搜索結(jié)果中的位置。在研究網(wǎng)絡(luò)搜索關(guān)鍵詞搜索量數(shù)據(jù)與相關(guān)問題的關(guān)系時(shí),選擇哪些關(guān)鍵詞是首先要解決的關(guān)鍵問題,閱讀文獻(xiàn),筆者發(fā)現(xiàn),對(duì)于關(guān)鍵詞的選取大多憑借經(jīng)驗(yàn)和主觀因素,也沒有一個(gè)完善的機(jī)制來管理關(guān)鍵詞優(yōu)化策略和進(jìn)度。為使關(guān)鍵詞的選取更具科學(xué)性和客觀性,基于上述需求,本發(fā)明提供了基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)于關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,本發(fā)明提供了一種基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國(guó)每月搜索量、競(jìng)爭(zhēng)程度和估算每次點(diǎn)擊費(fèi)用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場(chǎng)分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁(yè)面,這里記錄首頁(yè)網(wǎng)頁(yè)數(shù)和總搜索頁(yè)面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的。
步驟4:利用改進(jìn)的均值中心算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:初始化簇的數(shù)目k,從數(shù)據(jù)對(duì)象集合D中隨機(jī)選擇k個(gè)初始簇中心,初始化目標(biāo)函數(shù)f(U);
步驟4.2:對(duì)每類關(guān)鍵詞i(i∈(1,2,…,m))進(jìn)行重新分配,按函數(shù)p(i)選擇聚類中心j;
步驟4.3:根據(jù)判定函數(shù)f(U)的結(jié)果,重新計(jì)算各簇中心;
步驟4.4:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟(2),否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
本發(fā)明有益效果是:
1,此算法可以精簡(jiǎn)關(guān)鍵詞分析流程,進(jìn)而減少整個(gè)網(wǎng)站優(yōu)化工作量。
2,此算法的運(yùn)行時(shí)間復(fù)雜度低,處理速度更快。
3、此算法具有更大的利用價(jià)值。
4、能幫助網(wǎng)站在短時(shí)間內(nèi)快速提升其關(guān)鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來一定的流量和詢盤,從而達(dá)到理想的網(wǎng)站優(yōu)化目標(biāo)。
6、此算法分類結(jié)果的準(zhǔn)確度更符合經(jīng)驗(yàn)值;
附圖說明
圖1基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化結(jié)構(gòu)流程圖
圖2改進(jìn)的均值中心算法在聚類分析中的應(yīng)用流程圖
具體實(shí)施方式
為了解決關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,結(jié)合圖1-圖2對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,其具體實(shí)施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國(guó)每月搜索量、競(jìng)爭(zhēng)程度和估算每次點(diǎn)擊費(fèi)用(CPC)等。
步驟2:結(jié)合企業(yè)產(chǎn)品和市場(chǎng)分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁(yè)面,這里記錄首頁(yè)網(wǎng)頁(yè)數(shù)和總搜索頁(yè)面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的,其具體計(jì)算過程如下:
這里相關(guān)關(guān)鍵詞個(gè)數(shù)為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、NiS、NiY依次為第i個(gè)關(guān)鍵詞對(duì)應(yīng)的本國(guó)每月搜索量、競(jìng)爭(zhēng)程度、估算每次點(diǎn)擊費(fèi)用(CPC)、首頁(yè)網(wǎng)頁(yè)數(shù)、總搜索頁(yè)面數(shù)。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價(jià)值率,即為下式:
步驟4:利用改進(jìn)的均值中心算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:初始化簇的數(shù)目k,從數(shù)據(jù)對(duì)象集合D中隨機(jī)選擇k個(gè)初始簇中心,初始化目標(biāo)函數(shù)f(U),其具體計(jì)算過程如下:
上式i∈wj為關(guān)鍵詞i屬于類中心wj,d(i,wj)為關(guān)鍵詞i到類中心wj的距離。
步驟4.2:對(duì)每類關(guān)鍵詞i(i∈(1,2,…,m))進(jìn)行重新分配,按函數(shù)p(i)選擇聚類中心j,其具體計(jì)算過程如下:
使函數(shù)p(i)最大的對(duì)應(yīng)聚類中心j,d(i,wq)為關(guān)鍵詞i到全局最佳位置wq的距離,d(i,wj∈(1,2,…,k))為關(guān)鍵詞i到聚類中心j的距離。
上式xir與分別為關(guān)鍵詞i、聚類中心對(duì)象j的4維向量,即
xir∈(Xi,Zi,NiS,NiY)、
這里選擇使p(i)值最大,即選擇d(i,wj∈(1,2,…,k))最小的聚類中心j,有下式:
d(i,wj∈(1,2,…,k))min=min(d(i,w1),d(i,w2),…,d(i,wk))
步驟4.3:根據(jù)判定函數(shù)dis(U)的結(jié)果,重新計(jì)算各簇中心,其具體計(jì)算過程如下:
dis(U)=f(U)new-f(U)old<0
f(U)new為新分類后目標(biāo)函數(shù)的值,f(U)old為初始化目標(biāo)函數(shù)或上一次迭代出的目標(biāo)函數(shù)。
步驟4.4:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟(2),否則迭代結(jié)束,輸出聚類結(jié)果。
改進(jìn)的均值中心算法具體結(jié)構(gòu)流程如圖2。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
基于改進(jìn)的均值中心算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其偽代碼過程
輸入:網(wǎng)站提取的核心關(guān)鍵詞,初始化簇的數(shù)目k,初始化目標(biāo)函數(shù)f(U)
輸出:一系列優(yōu)化后的高質(zhì)量關(guān)鍵詞。