本發(fā)明屬于空間模式挖掘技術(shù)領(lǐng)域,特別涉及一種基于co-location模式和本體的商業(yè)地址選擇方法。
背景技術(shù):
商業(yè)選址是經(jīng)濟(jì)學(xué)領(lǐng)域的一個(gè)重要的研究方向。對于任何一個(gè)商業(yè)體來說,位置選擇是其必經(jīng)的一個(gè)階段,因?yàn)橐粋€(gè)不利的商業(yè)位置所帶來的負(fù)面影響很難被其他的改進(jìn)條件或行為而改變。要判斷一個(gè)位置是否是有利的,需要考慮多種因素,比如社會(huì)經(jīng)濟(jì)學(xué)、地質(zhì)學(xué)、生態(tài)學(xué)以及決策者的特定需求等。選址問題在經(jīng)濟(jì)學(xué)領(lǐng)域一直是一個(gè)棘手的問題,因?yàn)樗芏喾N主觀和客觀因素的制約,選址過程通常是漫長而又低效的。
隨著數(shù)據(jù)采集技術(shù)的日益發(fā)展,越來越多的與位置有關(guān)的數(shù)據(jù)能夠被很容易地采集到。這些數(shù)據(jù)不但包括類似于百度地圖的地圖數(shù)據(jù),還包括人口分布數(shù)據(jù)等。在大數(shù)據(jù)的背景下,一個(gè)商業(yè)體不得不去考慮多種數(shù)據(jù)庫,譬如從地區(qū)的購買力分布到居民的消費(fèi)行為特性。對這些包含時(shí)間和空間信息的異構(gòu)型數(shù)據(jù)庫進(jìn)行分析通常是選址必須要考慮的關(guān)鍵性因素。
選址方面的研究工作已經(jīng)延續(xù)了有一個(gè)世紀(jì)之長。與此同時(shí),隨著信息技術(shù)的進(jìn)步,地域的探索空間以及地理數(shù)據(jù)的容量都在不斷地增長,面對指數(shù)級增長的數(shù)據(jù),決策者很難憑經(jīng)驗(yàn)或簡單計(jì)算實(shí)現(xiàn)合理的地址選擇,因此,在實(shí)際中,決策者們往往采用一種自上(洲)而下(區(qū)/鎮(zhèn))的方式來進(jìn)行分析,這種情況下,其他區(qū)域的數(shù)據(jù)就被排除掉,只在當(dāng)前選定的小范圍區(qū)域內(nèi)利用一些主觀的準(zhǔn)則進(jìn)行地址選擇。而在這個(gè)小范圍內(nèi),評估方法往往都是主觀地利用個(gè)人經(jīng)驗(yàn)(相關(guān)專家的主觀評估)來決定“最好的”地址。
空間數(shù)據(jù)挖掘是從空間數(shù)據(jù)庫中挖掘未知的有趣模式的過程。因?yàn)榭臻g數(shù)據(jù)的海量性、多維性、相關(guān)性等特點(diǎn),從空間中挖掘有趣的模式將比從傳統(tǒng)事務(wù)數(shù)據(jù)中挖掘有趣模式要困難得多。
傳統(tǒng)數(shù)據(jù)通常是相互獨(dú)立的,而空間上分布的數(shù)據(jù)則是相關(guān)的,或者更確切地說是空間并置的(co-located),即兩個(gè)對象的位置越近,就越有可能互相影響??臻gco-location模式是空間特征的一個(gè)子集,它們的實(shí)例在空間中頻繁關(guān)聯(lián)。
空間co-location模式在許多應(yīng)用領(lǐng)域發(fā)揮著重要的作用。例如,移動(dòng)服務(wù)運(yùn)營商根據(jù)不同需求用戶的分布,搭配相應(yīng)的服務(wù)套餐以增加收入;廣告運(yùn)營商根據(jù)特定人群的聚集地段,投放相應(yīng)的廣告;銀行根據(jù)不同地域人群的不同收入設(shè)定相應(yīng)的信用卡服務(wù)和理財(cái)產(chǎn)品。空間co-location模式的應(yīng)用領(lǐng)域還包括地球科學(xué)、公共衛(wèi)生、公共交通、生物信息處理、基于位置的服務(wù)、gis信息系統(tǒng)等。
目前已經(jīng)有很多經(jīng)典的co-location模式挖掘算法,另外,由于經(jīng)典的co-location模式挖掘算法會(huì)產(chǎn)生大量冗余的結(jié)果集,以精簡結(jié)果co-location模式為主要目的co-location模式挖掘算法也層出不窮。有趣模式的提出,意味著空間co-location模式開始向交互式的方向發(fā)展,在語義網(wǎng)中,本體(ontology)被認(rèn)為最適合表示復(fù)雜的用戶領(lǐng)域知識(shí),因此涌現(xiàn)了不少在本體指導(dǎo)下的co-location模式挖掘算法。
因?yàn)榭臻gco-location模式描述的是空間特征之間的一種“共存”關(guān)系,利用co-location模式,可以得到一個(gè)商業(yè)圈中商業(yè)實(shí)體店的“共存”關(guān)系。即,co-location模式中隱含著選址的經(jīng)驗(yàn)及信息。譬如,如果在某個(gè)區(qū)域內(nèi)飯店和旅館頻繁地“共存”,那么co-location模式{飯店,旅館}隱含著在飯店旁邊開旅館或者在旅館旁邊開飯店的選址信息。
對區(qū)域的分析主要是分析其地區(qū)因素(lf,locationfactor)與其他地區(qū)的不同。地區(qū)因素由該地區(qū)的屬性描述,比如購買力、居民數(shù)量以及與合作商的距離等等,選址對象目標(biāo)不同,則對不同地區(qū)的地區(qū)因素的考慮就會(huì)不同。每一個(gè)商業(yè)體因目標(biāo)或者需求不同,對地區(qū)因素的偏向程度亦不同。
在實(shí)際情況下,地址選擇過程常常被劃分為多個(gè)階段。zelenovic將其分成一個(gè)個(gè)的宏(macro)并對每個(gè)宏進(jìn)行微觀選址(microselection)。bankhofer將其分成4個(gè)階段:洲選擇、國家選擇、市/區(qū)選擇,最終地址選擇。這種自頂向下的劃分方式效率很低,因其需要手動(dòng)的分析和選擇。從大數(shù)據(jù)中手動(dòng)地進(jìn)行選址過程顯然是不可行的。
對地址選擇進(jìn)行加權(quán)和評估的模型算法在近幾年被提出,比如離散選擇模型(discretechoicemodels)和計(jì)數(shù)模型(countdatamodels)。這些模型包含了很多可變化的地址因素。盡管這些模型在理論上是有用的,但由于時(shí)間和空間上巨大的消耗使得這些模型應(yīng)用在實(shí)際情況下變得比較棘手。這就導(dǎo)致了管理者要同時(shí)根據(jù)給定的地址元素以及它們本身的喜好來做決策。
鑒于目前地址選擇的高主觀性以及高復(fù)雜度,本文采用“經(jīng)驗(yàn)”指導(dǎo)的方式進(jìn)行地址選擇。co-location模式代表的是一組頻繁關(guān)聯(lián)的空間特征,通過這種關(guān)聯(lián)關(guān)系可以得出某個(gè)興趣點(diǎn)的影響特征集,而不必考慮復(fù)雜的地址因素,因?yàn)閯e人成功的經(jīng)驗(yàn)就是最好的借鑒,在這個(gè)“經(jīng)驗(yàn)”的基礎(chǔ)上,對用戶感興趣的興趣點(diǎn)進(jìn)行co-location模式挖掘,并給出最終的推薦地址。從而提出一種基于co-location模式和本體的商業(yè)地址選擇方法coloc_site_miner(后簡稱csminer)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例的目的在于提供一種基于co-location模式和本體的商業(yè)地址選擇方法,給定一個(gè)用戶想要進(jìn)行地址選擇的興趣點(diǎn)特征(比如:火鍋店),可以根據(jù)用戶的要求(互斥,半互斥,全互斥)給出適合創(chuàng)建該興趣點(diǎn)類型(適合開火鍋店)的地址列表供用戶進(jìn)行進(jìn)一步地評估。
本發(fā)明所采用的技術(shù)方案是,基于co-location模式和本體的商業(yè)地址選擇方法,按照以下步驟進(jìn)行:
步驟1,從百度地圖上抓取北京市真實(shí)興趣點(diǎn)數(shù)據(jù)為源數(shù)據(jù),且同時(shí)抓取每個(gè)興趣點(diǎn)的類型,根據(jù)信息類型進(jìn)行數(shù)據(jù)分類,創(chuàng)建相應(yīng)的本體;
步驟2,借助百度地圖提供的api得到兩個(gè)興趣點(diǎn)之間的關(guān)鍵距離;
步驟3,計(jì)算每個(gè)興趣點(diǎn)的邊長;
步驟4,計(jì)算每個(gè)興趣點(diǎn)對應(yīng)的鄰居興趣點(diǎn)集合;基于平面的網(wǎng)格法對地球球體進(jìn)行網(wǎng)格劃分,對當(dāng)前興趣點(diǎn)所在網(wǎng)格周圍的網(wǎng)格中其他興趣點(diǎn)進(jìn)行搜索,計(jì)算周圍網(wǎng)格的興趣點(diǎn)與當(dāng)前興趣點(diǎn)之間的關(guān)鍵距離以求取鄰近關(guān)系,從而進(jìn)行鄰近關(guān)系判斷;
步驟5,當(dāng)指定一個(gè)需要選址的興趣點(diǎn)特征,就要開始尋找包含該特征的關(guān)鍵co-location模式;特征f的關(guān)鍵co-location模式即給定一個(gè)空間特征f,參與度閾值p,設(shè)l為所有包含特征f且參與度不小于p的co-location模式集,l中包含廣義概念最多且階數(shù)最長的co-location模式即為f的關(guān)鍵co-location模式;
步驟6,在最終的選址方式上,需考慮用戶的選址偏向,即互利,半互斥和完全互斥;最后推薦滿足用戶需求的商業(yè)地址列表。
所述步驟1中,本體概念分為3種類型:葉概念、廣義概念和約束概念;葉概念為本體概念間包含關(guān)系的有向無環(huán)圖中的葉節(jié)點(diǎn),在空間co-location模式挖掘中特征即葉概念;廣義概念為包含葉概念的概念;約束概念是定義在其他本體概念上的邏輯表達(dá)式;本體具體創(chuàng)建過程是:在抓取地圖數(shù)據(jù)的過程中,同時(shí)抓取每個(gè)興趣點(diǎn)的類型信息,類型信息是一個(gè)三元組(s1,s2,s3),其中
所述步驟1中,所述步驟3中,計(jì)算每個(gè)興趣點(diǎn)的邊長的具體步驟是:即在以興趣點(diǎn)標(biāo)記地點(diǎn)為中心,以邊長為半徑的一個(gè)圓形區(qū)域均屬于該興趣點(diǎn),為了得到某個(gè)興趣點(diǎn)的覆蓋范圍,首先計(jì)算當(dāng)前興趣點(diǎn)的屬邊長l,設(shè)置邊界模糊度μ,0≤μ≤1,則其邊長為l(1-μ)。
所述步驟1中,所述步驟4中,鄰近關(guān)系的判斷準(zhǔn)則為:給定兩個(gè)興趣點(diǎn)a和b,邊界模糊度μ,影響距離d,興趣點(diǎn)a和b的屬邊長分別為la,lb,若興趣點(diǎn)a和興趣點(diǎn)b的關(guān)鍵距離≤(la+lb)*(1-μ)+d,則a和b滿足鄰近關(guān)系;
進(jìn)行鄰近關(guān)系判斷的具體方法是:將地球球體按照兩個(gè)垂直的方向進(jìn)行180等分,即在豎直方向上,沿著每個(gè)維度的經(jīng)線圈進(jìn)行切分180等分;在水平方向上,沿著每個(gè)維度的緯線圈進(jìn)行切分180等分;對于需要尋找其鄰近興趣點(diǎn)集合的某點(diǎn)p,需要對其所在的格子及周圍的8個(gè)格子進(jìn)行搜索,搜索按照一定的方向且按寬度優(yōu)先的搜索方式;在搜索每個(gè)格子之前,都要判斷p與當(dāng)前格子的最短距離是否大于影響距離,若大于影響距離,則當(dāng)前被探索的格子及其相應(yīng)方向的格子都無須再進(jìn)行探索,因?yàn)楸惶剿鞲褡拥娜魏我粋€(gè)點(diǎn)與p的距離都大于影響距離;若當(dāng)前被探索的格子與p的最短距離不大于影響距離,則遍歷該格子的所有實(shí)例并計(jì)算各個(gè)實(shí)例與p的關(guān)鍵距離,若某個(gè)實(shí)例s與p的關(guān)鍵距離不大于影響距離且s與p不屬于同一個(gè)特征,則s與p滿足鄰近關(guān)系,若s與p屬于同一個(gè)廣義概念,則將s加入到鄰接關(guān)系表中對應(yīng)廣義概念下p的鄰接實(shí)例集合中,否則,將s加入鄰接關(guān)系表中不同廣義概念下p的鄰接實(shí)例集合中;遍歷完當(dāng)前格子的所有實(shí)例之后,將當(dāng)前格子周圍的8個(gè)格子加入到隊(duì)列中,并繼續(xù)遍歷隊(duì)列的下一個(gè)格子,直到隊(duì)列中的格子全部遍歷完畢。
所述步驟1中,所述步驟6中,假設(shè)當(dāng)前需要選址的特征為f;
所述互利:互利即與f同類型特征的商業(yè)體共同互利,與f同屬于一個(gè)本體廣義概念的特征都屬于f的同類型特征;選擇此偏向則依次遍歷f的關(guān)鍵co-location模式的行實(shí)例,以每個(gè)行實(shí)例的中心點(diǎn)作為選擇的地址送給客戶進(jìn)行評估;
所述半互斥:半互斥即不能容忍選擇的地址存在f特征的商業(yè)體;選擇此偏向則需要對關(guān)鍵co-location模式進(jìn)行拆分,將特征f從關(guān)鍵co-location模式中剔除,形成一個(gè)新的模式,然后尋找新模式的表實(shí)例,將f的關(guān)鍵co-location模式與新模式的行實(shí)例進(jìn)行一一對比,得到的不同的行實(shí)例即為候選的地址;
所述全互斥:完全互斥即不能容忍選擇的地址存在與f同類型特征的商業(yè)體;選擇此偏向也需要尋找同半互斥相同的新的模式的表實(shí)例。
本發(fā)明的有益效果:空間co-location模式挖掘即挖掘空間特征間的“共存”關(guān)系,將現(xiàn)實(shí)生活中頻繁關(guān)聯(lián)的空間特征挖掘出來。而根據(jù)地理學(xué)第一定律:地理事物在空間分布上互為相關(guān),利用co-location模式可以快速而準(zhǔn)確地找到與空間某個(gè)特征最相關(guān)的特征集。在商業(yè)選址中,挖掘某個(gè)商業(yè)體的相關(guān)co-location模式可以給我們以經(jīng)驗(yàn):這個(gè)商業(yè)體通常與哪些商業(yè)體頻繁合作可以獲利。而現(xiàn)實(shí)中商業(yè)體類型千千萬萬,某些商業(yè)體有很大的相似性,本發(fā)明利用本體的語義指導(dǎo),將這些商業(yè)體進(jìn)行分類,并在本體的指導(dǎo)下進(jìn)行“利益最大化”的關(guān)鍵co-location模式挖掘,在關(guān)鍵co-location模式的指導(dǎo)下,給出滿足用戶要求的系統(tǒng)認(rèn)為可以獲利的地址列表。之前大部分的商業(yè)選址需要各種主管的評估,耗費(fèi)時(shí)間長,需要大量的人力和物力,本發(fā)明利用co-location模式借鑒成功商業(yè)體的“經(jīng)驗(yàn)”,快速給出具有高準(zhǔn)確率的商業(yè)地址推薦供用戶有目的的進(jìn)行下一步的評估,節(jié)省了大量的人力和物力??臻gco-location模式挖掘技術(shù)與本體的語義指導(dǎo)向結(jié)合,并考慮實(shí)際情況對數(shù)據(jù)進(jìn)行了大量的預(yù)處理以提高結(jié)果的準(zhǔn)確率。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是空間鄰近關(guān)系示例。
圖2是本體h圖示例。
圖3是北京市部分興趣點(diǎn)本體圖示。
圖4是數(shù)據(jù)劃分示例。
圖5是比例參數(shù)下準(zhǔn)確率評估。
圖6是影響距離下準(zhǔn)確率評估。
圖7是邊界模糊度下準(zhǔn)確率評估。
圖8是參與度下準(zhǔn)確率評估。
圖9是距離閾值下鄰近關(guān)系時(shí)間效率評估。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
對基本概念進(jìn)行解釋:
空間特征代表了空間中不同種類的事物,空間特征在空間位置上的一次出現(xiàn)稱為該空間特征的一個(gè)實(shí)例。給定空間特征集f及其實(shí)例集s,s上的空間鄰近關(guān)系r,即如果兩個(gè)不同實(shí)例之間的距離不大于給定的距離閾值d,則這兩個(gè)空間實(shí)例滿足空間鄰近關(guān)系r。一個(gè)co-location模式
圖1給出了一個(gè)空間實(shí)例分布的例子,包含5個(gè)特征a、b、c、d和e,其中a.1表示a特征的第1個(gè)實(shí)例;該空間共有5個(gè)a的實(shí)例,4個(gè)b的實(shí)例,3個(gè)c的實(shí)例,5個(gè)d的實(shí)例以及3個(gè)e的實(shí)例;連線表示兩個(gè)空間實(shí)例滿足鄰近關(guān)系,例如a.1和b.1是互相鄰近的。{b.4,c.1,d.2}形成一個(gè)團(tuán),且是一個(gè)3階co-location模式{b,c,d}的一個(gè)行實(shí)例。因?yàn)樵贌o其他同時(shí)包含b,c,d這3個(gè)特征的實(shí)例形成團(tuán),則co-location模式{b,c,d}的表實(shí)例為{{b.4,c.1,d.2}}。因?yàn)槟J絳b,c,d}的表實(shí)例中只有一個(gè)b的實(shí)例b.4,所以pr({b,c,d},b)=1/4,同理pr({b,c,d},c)=1/3,pr({b,c,d},d)=1/5,則pi({b,c,d})=1/5。若設(shè)參與度閾值為1/5,則{b,c,d}為頻繁co-location模式。
本體是對共享概念模型的明確的規(guī)范的說明。本體可表示為5元組o={c,e,z,h,a},其中c是一組本體概念的集合;e是定義在c上的本體概念關(guān)系集合;z是本體概念的實(shí)例集;h是一個(gè)表示本體概念間包含關(guān)系(is-a關(guān)系,≤)的有向無環(huán)圖,如果本體概念c1包含本體概念c2,則c2is-ac1,在h圖(此處并非說明書附圖h)上則表示為c1指向c2的有向線段;a為加在本體上的額外定理的集合。
本文將本體的概念c分為3種類型,分別為葉概念、廣義概念和約束概念,葉概念即為本體h圖中的葉節(jié)點(diǎn),廣義概念為包含葉概念的概念,約束概念是定義在其他本體概念上的邏輯表達(dá)式。
圖2為一個(gè)本體的h圖,其中鳥類和莊稼為約束概念,虛線表示了約束概念之間的映射關(guān)系。得到的概念集如下:
所有概念集合:{生物,鳥類,動(dòng)物,植物,真菌,莊稼,麻雀,松鼠,蛇,麥子,松樹,柏樹,香菇,樹菇}
葉概念集合:{麻雀,松鼠,蛇,麥子,松樹,柏樹,香菇,樹菇}
廣義概念集合:{生物,動(dòng)物,植物,真菌}
約束概念集合:{鳥類,莊稼}
箭頭表示了包含與被包含關(guān)系,假設(shè)f(c)表示本體概念c所包含的本體概念映射,則:
f(生物)={動(dòng)物,植物,真菌}
f(植物)={麥子,松樹,柏樹}
f(動(dòng)物)={麻雀,松鼠,蛇}
f(莊稼)={麥子}
……
本發(fā)明將本體應(yīng)用到空間co-location模式挖掘,首先將空間特征映射到本體的葉概念,然后利用本體的語義將葉概念分類并在高層提取更加有意義的co-location模式,而不像經(jīng)典co-location挖掘,僅僅只考慮本體葉概念之間的共生關(guān)系。
本發(fā)明的一種基于co-location模式和本體的商業(yè)地址選擇方法,包括數(shù)據(jù)預(yù)處理(本體創(chuàng)建、鄰近關(guān)系度量、邊界度量)、計(jì)算鄰近關(guān)系、關(guān)鍵co-location模式挖掘和地址選擇。
1.本體創(chuàng)建
本文以從百度地圖上抓取的真實(shí)興趣點(diǎn)數(shù)據(jù)為源數(shù)據(jù),且同時(shí)抓取每個(gè)興趣點(diǎn)的類型,根據(jù)這些類型信息,創(chuàng)建了相應(yīng)的本體。圖3為基于北京市興趣點(diǎn)創(chuàng)建的本體的一部分,在本體可視圖的下方給出了每個(gè)概念的具體含義。該本體共包含21個(gè)廣義概念(c1到c20,根節(jié)點(diǎn)),155個(gè)空間特征,385616個(gè)空間實(shí)例(興趣點(diǎn))。
將數(shù)據(jù)分類并創(chuàng)建成本體,有如下的優(yōu)勢:
將數(shù)據(jù)按語義劃分,更清晰明了。本體的廣義概念包含了具有相似性質(zhì)的空間特征,更容易抓住這些特征的本質(zhì)。co-location模式挖掘算法隨著co-location模式階數(shù)的遞增,計(jì)算代價(jià)呈指數(shù)性增長。以20個(gè)廣義概念(c1-c20)代替155個(gè)空間特征進(jìn)行co-location模式挖掘,顯著減少了特征個(gè)數(shù),最終co-location模式的階數(shù)隨之降低,節(jié)省了大量的時(shí)間。在廣義概念層進(jìn)行co-location模式挖掘不會(huì)丟失任何的團(tuán)信息,且生成的co-location模式簡潔無冗余,可以讓用戶更容易做決策。
2.鄰近關(guān)系度量
若兩個(gè)空間實(shí)例之間滿足某種鄰近關(guān)系,則這兩個(gè)實(shí)例是互為鄰居的。在典型的co-location模式挖掘中,常以歐幾里得距離作為鄰近關(guān)系的度量準(zhǔn)則,即,若兩個(gè)實(shí)例之間的歐式距離不大于一個(gè)給定的距離閾值,則這兩個(gè)實(shí)例是滿足鄰近關(guān)系的。鄰居關(guān)系暗示了一個(gè)“影響力”,距離近的兩個(gè)實(shí)體往往是互相依存互相影響的。
而在現(xiàn)實(shí)中,因?yàn)榈厍蚴且粋€(gè)球體,用歐幾里得距離來算兩個(gè)興趣點(diǎn)間的距離是不恰當(dāng)?shù)?,因?yàn)榕d趣點(diǎn)之間總會(huì)有互相連接的路徑,借助百度地圖提供的api可以方便地得到兩個(gè)興趣點(diǎn)之間的可達(dá)距離。
定義1.關(guān)鍵距離。給定地球上的兩個(gè)興趣點(diǎn)a和b,任何一條從a走到b的可行路徑的距離稱作a到b的可達(dá)距離,其中,從a到b的最短可達(dá)距離稱為a和b的關(guān)鍵距離。
定義2.影響距離。給定一個(gè)距離閾值d,若兩個(gè)興趣點(diǎn)a和b之間的關(guān)鍵距離≤d,則a和b互為鄰居。距離閾值d被稱為影響距離。
如圖1所示,若c.3和e.3之間有一條河,則c.3和e.3之間無法直線到達(dá),而從c.3到e.3有圖1所示兩條虛線的可達(dá)路徑,但因?yàn)楸容^粗的虛線是從c.3上橋到e.3要比細(xì)的虛線路徑要近,所以從c.3到e.3的那條粗虛線的距離即為c.3和e.3的關(guān)鍵距離。給定一個(gè)影響距離d,若c.3和e.3的關(guān)鍵距離不大于d,則c.3和e.3互為鄰居,滿足鄰近關(guān)系。
3.邊界度量
興趣點(diǎn)在地圖上都是以一個(gè)其占地范圍的中心點(diǎn)來表示,在實(shí)際情況中,每個(gè)興趣點(diǎn)的占地面積不同,而地圖上的標(biāo)注點(diǎn)往往都是興趣點(diǎn)的中心點(diǎn),若都從其中心位置開始尋找其影響距離之內(nèi)的其他興趣點(diǎn),則可能會(huì)造成某些鄰近關(guān)系的丟失。
例如,d.5的邊界如圖1所示。設(shè)影響距離為500米,若d.5的中心點(diǎn)和c.2的關(guān)鍵距離為1000米,按照經(jīng)典的鄰近關(guān)系度量算法,d.5和c.2不滿足鄰居關(guān)系。而實(shí)際上,d.5的范圍包含了整個(gè)邊界之內(nèi)的部分,由圖1可以明顯看出d.5和c.2以及d.3都滿足鄰近關(guān)系。
因此,興趣點(diǎn)邊界的判定是必要的,但是,因?yàn)槊總€(gè)興趣點(diǎn)的邊界都是不規(guī)則的,且利用模式識(shí)別的相關(guān)算法來進(jìn)行近似計(jì)算復(fù)雜度太高,利用鄰近關(guān)系度量,可以估計(jì)一個(gè)興趣點(diǎn)的近似邊長。
定義3.屬邊長。給定一個(gè)興趣點(diǎn)a的標(biāo)記地址,設(shè)興趣點(diǎn)b是與a直線距離最短的興趣點(diǎn),則a和b之間的直線距離稱為a的屬邊長,即為la。
一般要考慮邊長的興趣點(diǎn)包括公園、景點(diǎn)、學(xué)校等大型建筑,其他像公司大樓、超市、火鍋店等中小型建筑的邊長默認(rèn)為0。而經(jīng)驗(yàn)告訴我們,大型建筑旁邊直接挨著大型建筑的概率比較小,所以這種近似的估計(jì)在一定程度上可以提高選址的覆蓋率。
為了使算法更加靈活,設(shè)置一個(gè)邊界模糊度參數(shù)μ(0≤μ≤1),若一個(gè)興趣點(diǎn)的屬邊長為l,則其邊長為l(1-μ)。當(dāng)μ=1時(shí),邊長為0,這時(shí)遺漏掉的鄰近關(guān)系最多,隨著μ的減少,被加入的鄰近關(guān)系會(huì)越來越多,越來越完整,準(zhǔn)確率在逐漸提高,當(dāng)μ減少到一定程度時(shí),準(zhǔn)確率達(dá)到最高,隨后,隨著μ的減少,可能會(huì)增加一些錯(cuò)誤的鄰近關(guān)系,則準(zhǔn)確率會(huì)進(jìn)一步降低。
4.計(jì)算鄰近關(guān)系
經(jīng)過上面三個(gè)部分的數(shù)據(jù)預(yù)處理過程,就可以計(jì)算每個(gè)興趣點(diǎn)對應(yīng)的鄰居興趣點(diǎn)集合。
定義4.鄰近關(guān)系。給定兩個(gè)興趣點(diǎn)a和b,邊界模糊度μ,影響距離d,a和b的屬邊長分別為la,lb,若興趣點(diǎn)a和興趣點(diǎn)b的關(guān)鍵距離≤(la+lb)*μ+d,則a和b滿足鄰近關(guān)系。
為了得到每個(gè)興趣點(diǎn)對應(yīng)的鄰近關(guān)系,必須對當(dāng)前興趣點(diǎn)周圍的其他興趣點(diǎn)進(jìn)行搜索,計(jì)算周圍的興趣點(diǎn)與當(dāng)前興趣點(diǎn)之間的關(guān)鍵距離以求取鄰近關(guān)系。一種很直觀的方法就是求出每個(gè)興趣點(diǎn)與其他所有興趣點(diǎn)的關(guān)鍵距離,再判斷鄰近關(guān)系,然而這種算法時(shí)間消耗太大,距離太遠(yuǎn)的興趣點(diǎn)沒有必要進(jìn)行計(jì)算?;诰W(wǎng)格法,本文給出了如下的在球體下進(jìn)行鄰近關(guān)系判斷的方法。
將球體按照兩個(gè)垂直的方向進(jìn)行180等分,即在豎直方向上,沿著每個(gè)維度的經(jīng)線圈進(jìn)行切分,在水平方向上,亦按照同樣的方法進(jìn)行180等分。圖4顯示了將分割后的球體投影后的示例,對于圖4中需要尋找其鄰近興趣點(diǎn)集合的點(diǎn)a,需要對其所在的格子及周圍的8個(gè)格子進(jìn)行搜索,搜索可以按照一定的方向按寬度優(yōu)先或者深度優(yōu)先搜索都可。在搜索每個(gè)格子之前,都要判斷該點(diǎn)與當(dāng)前格子的最短距離是否大于影響距離,若大于影響距離,則當(dāng)前被探索的格子及其相應(yīng)方向的格子都無須再進(jìn)行探索。例如,對于圖4中的點(diǎn)a,首先搜索其所在的格子,接著搜索1號(hào)格子,若1號(hào)格子與點(diǎn)a的距離大于影響距離,則2,8,9,10,11,12,13,23,24號(hào)格子均無須再搜索,否則,將1號(hào)格子周圍的格子(2,8,9,10,11)加入到隊(duì)列中去,以此類推。這種劃分方式可以有效地避免不必要的距離運(yùn)算,提高了算法的效率。
依據(jù)圖3的本體以及圖1的部分特征的分布圖,假設(shè)圖1中直線相連的興趣點(diǎn)存在鄰近關(guān)系,表1給出了對應(yīng)的鄰接關(guān)系表。因?yàn)橹蟮腸o-location模式挖掘算法均從廣義概念出發(fā),則特征a、b、c抽象為一個(gè)新特征,d和e抽象為1個(gè)新特征。所以,a.1雖然跟b.1鄰近,但因?yàn)閍.1和b.1同屬一個(gè)新的廣義概念,所以鄰接關(guān)系表分為兩部分,一部分存儲(chǔ)不同廣義概念下的鄰接點(diǎn),用來尋找關(guān)鍵co-location模式。一部分存儲(chǔ)同一廣義概念下的鄰接點(diǎn),用來衡量同一廣義概念下特征的聯(lián)系緊密度。
表1鄰接關(guān)系表
5.關(guān)鍵co-location模式挖掘
當(dāng)用戶指定一個(gè)需要選址的特征,csminer就要開始尋找包含該特征的頻繁co-location模式,即,該特征與哪些其他類型的特征頻繁地“共存”。
上文介紹了本體的創(chuàng)建,而且在co-location模式挖掘中,從高層廣義概念(圖1中c1到c20)進(jìn)行co-location模式挖掘則類似于將具有相似屬性的特征進(jìn)行聚類并合成為一個(gè)新的特征。例如圖1中,廣義概念“餐飲”包含了“中餐”、“西餐”、“咖啡屋”等原始特征信息。這種抽象對用戶是不可見的,用戶指定的是一個(gè)感興趣的特征,比如若用戶想在北京市建一個(gè)中餐廳,則他會(huì)直接選擇“中餐”這個(gè)特征。為了從數(shù)據(jù)中得到與“中餐”特征頻繁關(guān)聯(lián)的其他特征,需要挖掘其關(guān)鍵co-location模式。
定義5.關(guān)鍵co-location模式。給定一個(gè)空間特征f,參與度閾值p,設(shè)l為所有包含特征f且參與度不小于p的co-location模式集,l中包含廣義概念最多且階數(shù)最長的co-location模式即為f的關(guān)鍵co-location模式。
利用表1可以得到包含特征f的實(shí)例的所有極大團(tuán),并根據(jù)極大團(tuán)算出每個(gè)包含特征f的模式的參與度值。例如,若用戶選擇的興趣點(diǎn)為“中餐”,則從表1中尋找“中餐”特征a的所有極大團(tuán):{{a.1,e.1},{a.2,d.1,e.2},{a.4,d.1,e.2},{a.4,d.4,e.2},{a.5,e.1}}。假設(shè)參與度閾值為1/4,則可知pi({a,d})=min{3/5,2/5}=2/5,pi({a,e})=min{3/5,2/3}=3/5,pi({a,d,e})=min{2/5,2/5,1/3}=1/3,則可得包含特征a的頻繁co-location模式集為{{a,d},{a,e},{a,d,e}},因這三個(gè)模式都包含了1個(gè)高層概念(c2),但{a,d,e}的階數(shù)最長,則{a,d,e}為特征a的關(guān)鍵co-location模式。關(guān)鍵co-location模式的選取是基于一個(gè)生活中的經(jīng)驗(yàn):越多商業(yè)類型聚集的區(qū)域越有潛力。
若特征“中餐”的關(guān)鍵co-location模式為{中餐,公交站,便利店,超市,公園},則說明在一個(gè)附近(影響距離內(nèi))存在有公交站、便利店、超市和公園的地址最適合開一個(gè)中餐館。而關(guān)鍵co-location模式的每一個(gè)行實(shí)例都代表了包含f下實(shí)例的一個(gè)團(tuán),也指定了具體的選址范圍。
6.地址選擇
注意到在上節(jié)挖掘特征f的關(guān)鍵co-location模式的時(shí)候忽略了“同類”的鄰近關(guān)系,這是因?yàn)殛P(guān)鍵co-location模式的目的是為了找到特征f的最佳“共存”匹配,“同類”的鄰接關(guān)系則可以忽略。
然而在實(shí)際情況中,未必關(guān)鍵co-location模式中的每個(gè)行實(shí)例都是可行的地址。例如,特征“中餐”的關(guān)鍵co-location模式中的某個(gè)行實(shí)例代表的區(qū)域內(nèi)中餐館已經(jīng)趨于飽和,再加入相同類型的中餐館可能會(huì)有比較大的競爭。另外,由于關(guān)鍵co-location模式只考慮不同類別的最佳組合而忽略了同類別特征的影響,所以,在最終的選址策略上,還需要用戶的選址偏向。
本文給出3個(gè)選址偏向供用戶選擇:互利,半互斥和完全互斥。互利即與同類型的商業(yè)體共同盈利;半互斥即不能容忍選擇的地址存在與自己同特征類型的商業(yè)體;完全互斥即不能容忍選擇的地址存在與自己同廣義概念的商業(yè)體。例如,參照圖3的本體,若用戶希望選址的特征為“中餐”,若用戶選址偏向?yàn)榛ダ瑒t只要滿足關(guān)鍵co-location模式的分布地址都可以進(jìn)行選擇;若用戶選址偏向?yàn)榘牖コ?,則選擇的地址中附近不能存在中餐館;若用戶選擇偏向?yàn)橥耆コ?,則選擇的地址中不能包含“中餐館”、“西餐館”、“咖啡屋”等餐飲業(yè)。下面給出這三種偏向的地址選擇策略:
互利:選擇此偏向則依次遍歷關(guān)鍵co-location模式的行實(shí)例,以每個(gè)行實(shí)例的中心點(diǎn)作為選擇的地址送給客戶進(jìn)行評估。需要注意的是,為了防止選擇過于靠近的地址,若當(dāng)前待選擇的地址與目前已經(jīng)選定的某個(gè)地址的距離小于影響距離的2倍,則放棄選擇該地址。
半互斥:選擇此偏向則需要對關(guān)鍵co-location模式進(jìn)行拆分,將用戶感興趣的特征從關(guān)鍵co-location模式中剔除,形成一個(gè)新的模式,然后從表1所示的鄰近關(guān)系表中尋找新模式的表實(shí)例,將關(guān)鍵co-location模式與新模式的行實(shí)例進(jìn)行一一對比,得到的不同的行實(shí)例即為候選的地址。若已知a的關(guān)鍵co-location模式為{a,c,d,e,f},則需要尋找{c,d,e,f}的表實(shí)例,若{c,d,e,f}的某個(gè)行實(shí)例{c.1,d.1,e.1,f.1}不存在于{a,c,d,e,f}的行實(shí)例中,則{c.1,d.1,e.1,f.1}即是一個(gè)候選的推薦區(qū)域。若{c,d,e,f}的所有行實(shí)例都在{a,c,d,e,f}中找到,則需要考察{c,d,e,f}的所有子集,直到有差集為止。事實(shí)上,重新尋找新模式的表實(shí)例代價(jià)比較大,為了更快地得到兩個(gè)模式表實(shí)例的差集,可以利用表1的同廣義概念下的鄰近點(diǎn)進(jìn)行快速剪枝。例如,若表1中用戶選擇的興趣特征為a,則可知包含實(shí)例b.1的候選團(tuán)必不滿足條件,因?yàn)閍.1和a.5都與b.1是鄰近的,b.1形成的團(tuán)附近必有a.1和a.5,同理可知包含b.2、b.3和c.3的候選團(tuán)都不滿足條件,這樣可以顯著減少判團(tuán)次數(shù),加快運(yùn)行時(shí)間。
全互斥:此部分操作與半互斥相似,只是需要排除同一廣義概念下的所有特征。
算法描述如下:
輸入:原始興趣點(diǎn)數(shù)據(jù)文件data,參與度閾值p,影響距離d,邊界模糊度μ,用戶偏向r,用戶希望選址的特征f
輸出:滿足用戶需求的地址坐標(biāo)列表result
①o=createontologies(data);/*創(chuàng)建本體*/
②girds=datadivision(data);/*數(shù)據(jù)劃分*/
③neighbors=findneighbors(o,grids,d,μ)/*計(jì)算鄰近關(guān)系*/
④c=minekeycolocation(f,neighbors,p)/*挖掘f的關(guān)鍵co-location模式*/
⑤result=findsites(c,neighbirs,r)/*給出最終的結(jié)果,其中r=0表示互利,r=1表示半互斥,r=2表示完全互斥*/
實(shí)驗(yàn)評估
在北京市興趣點(diǎn)數(shù)據(jù)上驗(yàn)證csminer在不同參數(shù)下的準(zhǔn)確率,同時(shí)在最后進(jìn)行了鄰近關(guān)系計(jì)算方法的時(shí)間評估。
1.實(shí)驗(yàn)設(shè)置
實(shí)驗(yàn)采用的真實(shí)數(shù)據(jù)為北京市興趣點(diǎn)數(shù)據(jù)集。該數(shù)據(jù)集包含155個(gè)空間特征,興趣點(diǎn)(空間實(shí)例)個(gè)數(shù)為385616個(gè)。限于篇幅,創(chuàng)建的本體的部分可視化如圖3所示。csminer利用c#語言編寫,實(shí)驗(yàn)環(huán)境為win10系統(tǒng),8g內(nèi)存,inteli5處理器。
本實(shí)驗(yàn)中,采集到的北京市的興趣點(diǎn)的覆蓋范圍為北緯39度到41度,東經(jīng)115度到118度,按照3.4節(jié)介紹的網(wǎng)格法的策略,為了更快地尋找鄰近關(guān)系,csminer將北京市的區(qū)域按0.1度的跨度進(jìn)行分割,即將原始數(shù)據(jù)集分成了20行30列共600個(gè)格子。
為了評估csminer的準(zhǔn)確率,實(shí)驗(yàn)將原始數(shù)據(jù)分成兩個(gè)部分d1和d2,d1為原始訓(xùn)練數(shù)據(jù)集,d2為測試數(shù)據(jù)集,實(shí)驗(yàn)中按格子數(shù)對d1和d2進(jìn)行劃分。設(shè)置一個(gè)比例參數(shù)
為了更好地測試csminer的準(zhǔn)確率,需要進(jìn)行多次的驗(yàn)證。本實(shí)驗(yàn)為求csminer的準(zhǔn)確率共需要進(jìn)行10次驗(yàn)證,一次驗(yàn)證過程如下:首先要從訓(xùn)練集d1中獲取關(guān)鍵co-location模式,從d1的特征列表中隨機(jī)選取20個(gè)特征,并分別挖掘這20個(gè)特征的關(guān)鍵co-location模式,d2中則分20次分別刪除從d1中選取的20個(gè)特征下的所有興趣點(diǎn),再對d2進(jìn)行對應(yīng)特征的地址推薦。將推薦的地址與之前刪掉的興趣點(diǎn)地址做對比,若兩個(gè)地址的距離滿足鄰近,則說明推薦的地址是正確的。則當(dāng)前特征的推薦正確率=滿足鄰近關(guān)系的點(diǎn)的個(gè)數(shù)/生成的推薦點(diǎn)總數(shù)。注意,這個(gè)推薦正確率是真實(shí)正確率的下限,因?yàn)槿敉扑]的點(diǎn)周圍原來不存在某個(gè)待驗(yàn)證的興趣點(diǎn),說明推薦點(diǎn)要么是錯(cuò)誤的,要么是一個(gè)潛在的最佳地址。取20個(gè)特征下得到的正確率的平均值即作為1次驗(yàn)證過程的正確率。將10次驗(yàn)證過程的結(jié)果取平均值即為最終的csminer算法在ε劃分下的選址準(zhǔn)確率。
本次實(shí)驗(yàn)分別用比例參數(shù)、影響距離、邊界模糊度、參與度閾值4個(gè)參數(shù)來評估csminer的準(zhǔn)確率,并在最后進(jìn)行鄰近關(guān)系算法的效率評估,實(shí)驗(yàn)中各個(gè)參數(shù)的具體設(shè)置見表2。
表2實(shí)驗(yàn)設(shè)置
2.比例參數(shù)ε對準(zhǔn)確率的影響
如圖5所示,隨著比例參數(shù)ε的增加,準(zhǔn)確率在逐漸降低,這是因?yàn)殡S著比例參數(shù)的增加,訓(xùn)練集中的興趣點(diǎn)數(shù)目越來越少,訓(xùn)練集規(guī)模的減少意味著可借鑒的經(jīng)驗(yàn)越來越少,很難得到完整的關(guān)鍵co-location模式,從而導(dǎo)致準(zhǔn)確率的降低。從圖中亦可以看出隨著比例參數(shù)ε的增大,準(zhǔn)確率降低的幅度越來越大,這是因?yàn)殡S著比例參數(shù)ε的增加,從訓(xùn)練集中可得到的頻繁co-location模式的階數(shù)在逐漸減少,導(dǎo)致關(guān)鍵co-location模式的階數(shù)減少,在低階的不完整的關(guān)鍵co-location模式的指導(dǎo)下,會(huì)在測試數(shù)據(jù)集中標(biāo)注更多錯(cuò)誤的地址。
3.影響距離對準(zhǔn)確率的影響
如圖6所示,隨著影響距離d的增加,csminer的準(zhǔn)確率先升高再降低,這是因?yàn)樵谟绊懢嚯x過小的情況下,會(huì)將真實(shí)世界本來就存在的一些有聯(lián)系的興趣點(diǎn)忽略,導(dǎo)致得到的關(guān)鍵co-location模式不完整,隨著影響距離d的增加,得到的關(guān)鍵co-location模式會(huì)越來越完整,準(zhǔn)確率逐漸增加。但當(dāng)影響距離過大,一些現(xiàn)實(shí)中本沒有影響的興趣點(diǎn)被當(dāng)作鄰近點(diǎn)來處理,會(huì)得到錯(cuò)誤的關(guān)鍵co-location模式,這會(huì)導(dǎo)致準(zhǔn)確率的降低。上節(jié)給出了比例參數(shù)ε與準(zhǔn)確率的關(guān)系,這里給出了ε=1/15和ε=1/5的準(zhǔn)確率比較,可以看出,隨著影響距離的增大兩條線越來越近,這是因?yàn)殡S著影響距離的增大,關(guān)鍵co-location模式的階數(shù)也在變大,在測試集中尋找關(guān)鍵co-location模式下的團(tuán)的數(shù)量也會(huì)急劇減少,使得準(zhǔn)確率相差越來越少。
4.邊界模糊度對準(zhǔn)確率的影響
如圖7所示,隨著邊界模糊度的增加,csminer的準(zhǔn)確率先升高后降低,這是因?yàn)楫?dāng)邊界模糊度=1的時(shí)候丟失的鄰近關(guān)系最多,容易得到錯(cuò)誤的關(guān)鍵co-location模式,這時(shí)的準(zhǔn)確率最低,隨著邊界模糊度的降低,丟失的鄰近關(guān)系慢慢找回,準(zhǔn)確率慢慢提高,但是當(dāng)模糊度減少到一定限度之后,真實(shí)邊界外的一些本來沒有影響的興趣點(diǎn)被當(dāng)作鄰居,導(dǎo)致準(zhǔn)確率又慢慢降低。
5.參與度閾值
如圖8所示,隨著參與度閾值的增大,準(zhǔn)確率先升高后降低,這是因?yàn)殡S著參與度閾值的增大,頻繁co-location模式的數(shù)目越來越少,根據(jù)co-location模式的向下閉合性[12],co-location頻繁模式的階越來越低。只有當(dāng)參與度閾值合理地設(shè)置在某個(gè)值的時(shí)候,才會(huì)得到較高的準(zhǔn)確度。參與度閾值過低會(huì)導(dǎo)致某些階較短的co-location模式頻繁,導(dǎo)致錯(cuò)誤的關(guān)鍵co-location模式;參與度閾值過高則會(huì)導(dǎo)致只有某些較長階的co-location模式頻繁,導(dǎo)致不完整的關(guān)鍵co-location模式。從圖8中還可以看到,當(dāng)參與度閾值小于0.3的時(shí)候,準(zhǔn)確率的變化比較平穩(wěn),而大于3之后急劇下滑,這是因?yàn)槟承┨卣鞯年P(guān)鍵co-location模式在參與度閾值不大于0.3的時(shí)候是完全一致的,當(dāng)大于0.3的時(shí)候,各個(gè)特征的關(guān)鍵co-location模式變化較大,導(dǎo)致準(zhǔn)確率在0.3之后急速下降。
6.鄰近關(guān)系計(jì)算方法效率評估
主要評估網(wǎng)格法尋找鄰近關(guān)系的效率。因?yàn)楸本┑貐^(qū)大約跨2個(gè)經(jīng)度,3個(gè)緯度,以0.1度為間隔劃分成600個(gè)格子。每個(gè)格子的邊長大約在5千米左右,當(dāng)影響距離小于5千米時(shí),基本只考慮當(dāng)前興趣點(diǎn)所在格子周圍的九宮格,為了更好地驗(yàn)證網(wǎng)格法的時(shí)間效率,如圖9所示,對影響距離按5千米的跨度來進(jìn)行評估。從圖9可以看出,遍歷法的運(yùn)行時(shí)間與影響距離d無關(guān),是一個(gè)固定的值,因?yàn)樵撍惴看味家闅v所有興趣點(diǎn)之間的距離。而網(wǎng)格法的時(shí)間效率明顯優(yōu)于遍歷法,隨著影響距離的增加,判斷的格子的數(shù)目也在增加,所以時(shí)間會(huì)慢慢增加。按照圖9的趨勢,當(dāng)影響距離上升到足夠大時(shí),網(wǎng)格法的運(yùn)行時(shí)間必定會(huì)超過遍歷法,因?yàn)榫W(wǎng)格法還有額外的判斷最短距離等操作的時(shí)間消耗,但是在實(shí)際情況下,特別是在本文所涉及的選址問題,兩個(gè)興趣點(diǎn)的影響距離一般不會(huì)超過10km,所以網(wǎng)格法在選址問題中依然有很大的優(yōu)勢。
因此,本文以co-location模式為基礎(chǔ),利用co-location模式的“共存”性,尋找興趣點(diǎn)對應(yīng)特征的其他頻繁共存的特征,挖掘其關(guān)鍵co-location模式,為了增加挖掘的準(zhǔn)確率,本文做了許多相關(guān)的預(yù)處理工作以更加適應(yīng)實(shí)際情況,以關(guān)鍵co-location模式,結(jié)合用戶的傾向,推薦給用戶感興趣的地址供用戶進(jìn)一步?jīng)Q策。通過實(shí)驗(yàn)對csminer的準(zhǔn)確率以及鄰近關(guān)系算法的效率進(jìn)行了驗(yàn)證。數(shù)據(jù)劃分以及本體的高層挖掘使得csminer可以輕松地處理海量數(shù)據(jù)。從實(shí)驗(yàn)中可以看到不同參數(shù)設(shè)置下csminer的準(zhǔn)確率差距比較大。在圖5至圖8的數(shù)據(jù)圖中csminer的準(zhǔn)確率均達(dá)到了80%以上,說明csminer在合適的參數(shù)設(shè)置下,選擇的地址具有較高的可靠性。合理的參數(shù)設(shè)置,可以讓csminer發(fā)揮得更好。
本說明書中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。