本發(fā)明涉及醫(yī)療機(jī)構(gòu)技術(shù)領(lǐng)域,更特別地說,是指一種基于線性回歸因子非負(fù)矩陣分解模型的醫(yī)療機(jī)構(gòu)推薦方法。
背景技術(shù):
數(shù)據(jù)活化之非負(fù)矩陣分解(Non-negative Matrix Factorization,NMF)由D.Lee等在1999年正式提出的(即Lee D D,Seung H S.Learning the parts of objects by non-negativ matrix factorization[J].Nature,1999,401(6755):788-91.),經(jīng)過了十余年的發(fā)展,現(xiàn)在已經(jīng)成為了相對完善的數(shù)據(jù)分析方法。并且,NMF方法還在圖像分析、文本聚類、數(shù)據(jù)挖掘、語音處理等方面得到了廣泛的應(yīng)用。由于NMF方法具有快速和有效等特性,在模式識別領(lǐng)域中被廣泛用于特征提取與數(shù)據(jù)降維。在圖像處理方向,NMF方法被用于研究機(jī)器人對外界感知這一課題。因為非負(fù)性約束的存在,分解結(jié)果中有大量的元素為零,故這種表示方法屬于稀疏編碼,具有節(jié)省存儲空間的特點(diǎn)。
線性回歸是一種回歸分析方法,這種分析利用線性回歸方程的最小平方函數(shù),對一個或多個自變量與一個因變量之間的關(guān)系進(jìn)行建模。線性回歸方法基于數(shù)理統(tǒng)計中的回歸分析,是廣泛應(yīng)用的一種用來確定兩個或兩個以上變量之間關(guān)系的統(tǒng)計方法之一。在實際應(yīng)用中,只有一個自變量的線性回歸為一元線性回歸,而有多個自變量的線性回歸為多元線性回歸。
醫(yī)療機(jī)構(gòu),是指依法定程序設(shè)立的從事疾病診斷、治療活動的衛(wèi)生機(jī)構(gòu)的總稱。對于醫(yī)療機(jī)構(gòu)在進(jìn)行注冊或?qū)徟鷷r,在審批部門將留下名稱、地址、網(wǎng)址、服務(wù)特長等相關(guān)信息的數(shù)據(jù)?;蛘呓?jīng)地理位置信息軟件(如百度地圖、谷歌地圖)分析獲得醫(yī)療機(jī)構(gòu)的地理信息。
面對互聯(lián)網(wǎng)上的海量信息,普通用戶往往無所適從。為了滿足用戶的信息需求,計算機(jī)科學(xué)家發(fā)明了兩項意義深遠(yuǎn)的技術(shù):一是搜索技術(shù),它幫助計算機(jī)系統(tǒng)被動地應(yīng)答用戶的查詢,將與之最相關(guān)、最重要的信息返回給用戶;二是推薦系統(tǒng)技術(shù),它根據(jù)用戶的興趣、行為、情景等信息,把用戶最可能感興趣的內(nèi)容主動推送給用戶。近年來,推薦系統(tǒng)技術(shù)得到了長足的發(fā)展,不但成為學(xué)術(shù)研究的熱點(diǎn)之一,而且在電子商務(wù)、在線廣告、社交網(wǎng)絡(luò)等重要的互聯(lián)網(wǎng)應(yīng)用中大顯身手。推薦系統(tǒng)(Recommender System,RS)是為用戶推薦所需物品的軟件工具的技術(shù)。
技術(shù)實現(xiàn)要素:
為了解決醫(yī)療機(jī)構(gòu)在推薦系統(tǒng)的互聯(lián)網(wǎng)應(yīng)用中出現(xiàn)的推薦準(zhǔn)確度差的問題,本發(fā)明提出了一種基于線性回歸因子非負(fù)矩陣分解模型的醫(yī)療機(jī)構(gòu)推薦方法。本發(fā)明方法是通過解決具有多源異構(gòu)性和極高稀疏性的數(shù)據(jù)的預(yù)測技術(shù)難點(diǎn),同時優(yōu)化算法改善多系數(shù)調(diào)參難以達(dá)到全局最優(yōu)的困難,使模型獲得更優(yōu)解,提高了數(shù)據(jù)預(yù)測的準(zhǔn)確性。本發(fā)明應(yīng)用在推薦系統(tǒng)中有效提高了對醫(yī)療機(jī)構(gòu)的推薦準(zhǔn)確度,從而提高醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)對于智慧城市的建設(shè)的利用價值,解決殘缺數(shù)據(jù)對大部分智慧城市的智能化建設(shè)的影響。
本發(fā)明提出的一種基于線性回歸因子非負(fù)矩陣分解模型的醫(yī)療機(jī)構(gòu)推薦方法,包括有下列步驟:
步驟A:初始化醫(yī)療機(jī)構(gòu)推薦系統(tǒng),并從GPS地理信息模塊、醫(yī)療機(jī)構(gòu)信息模塊、病患就診信息模塊和手機(jī)基站信息模塊中獲取推薦用原始數(shù)據(jù);
步驟B:應(yīng)用步驟A獲取的推薦用原始數(shù)據(jù)構(gòu)建二維醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;
在本發(fā)明中,醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣記為
步驟C:根據(jù)步驟B得到的醫(yī)療機(jī)構(gòu)—居住區(qū)就診量設(shè)計適用于時空多維度條件下,多尺度與多粒度的海量數(shù)據(jù)的線性回歸張量因子;
在本發(fā)明中,線性回歸張量因子記為FR=[Rr,Rs,Rt]b×a×3。
步驟D:依據(jù)步驟C的線性回歸張量因子重新對步驟B的醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣進(jìn)行處理,得到醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型;
在本發(fā)明中,醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型記為
步驟E:在醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中應(yīng)用步驟D的醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型,并初始化;然后采用隱性特征模型對多元異構(gòu)的推薦用原始數(shù)據(jù)進(jìn)行活化數(shù)據(jù)挖掘,得到隱性特征矩陣;
在本發(fā)明中,隱性特征有2個,即醫(yī)療機(jī)構(gòu)的隱性特征記為
即居住區(qū)域的隱性特征記為
步驟F:通過步驟E得到的隱性特征矩陣,迭代計算醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;若未達(dá)到收斂,則返回步驟E,重新計算隱性特征矩陣偏導(dǎo);若收斂,則修正醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;
在本發(fā)明中,以來修正步驟B構(gòu)建的醫(yī)療機(jī)構(gòu)-居住區(qū)域就診量矩陣,記為Tm就診量_重構(gòu)。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
步驟G:以推薦標(biāo)準(zhǔn)誤差模型對經(jīng)步驟F修正后的醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣進(jìn)行推薦標(biāo)準(zhǔn)誤差的計算,若標(biāo)準(zhǔn)誤差小于0.3,則將獲得推薦結(jié)果提供給用戶。
在本發(fā)明中,推薦標(biāo)準(zhǔn)誤差模型記為
計算推薦標(biāo)準(zhǔn)誤差模型RMSE就診量_誤差作為算法準(zhǔn)確度的評判標(biāo)準(zhǔn),如果Weight缺失中為0,則通過所述RMSE就診量_誤差來對和進(jìn)行相似度衡量。
本發(fā)明醫(yī)療機(jī)構(gòu)推薦方法的優(yōu)點(diǎn)在于:
①本發(fā)明方法中應(yīng)用線性回歸張量因子與非負(fù)矩陣分解(即二維醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣)兩種方法的結(jié)合,充分考慮了醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)的多源異構(gòu)性。
②本發(fā)明方法中用了線性回歸張量因子,可以自適應(yīng)訓(xùn)練特征系數(shù),改善了已有醫(yī)療機(jī)構(gòu)研究中由于加入多種數(shù)據(jù)因子造成因子系數(shù)繁多、調(diào)參困難、難以達(dá)到全局最優(yōu)的問題,這樣可以在推薦時計算出更優(yōu)解推薦給用戶。
③本發(fā)明利用隱性特征來對醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行學(xué)習(xí)預(yù)測,能夠解決醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)的極高稀疏性(尤其非零率極高的情況,即數(shù)據(jù)大部分缺失狀態(tài)),從而提高推薦醫(yī)療機(jī)構(gòu)的準(zhǔn)確度。
④本發(fā)明利用推薦標(biāo)準(zhǔn)誤差模型對二維醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣進(jìn)行修正,并用推薦標(biāo)準(zhǔn)誤差值來作衡量,從而可以提高推薦的優(yōu)質(zhì)性。
附圖說明
圖1是本發(fā)明基于線性回歸因子非負(fù)矩陣分解模型的醫(yī)療機(jī)構(gòu)推薦方法的流程圖。
圖2是不同區(qū)域的醫(yī)療機(jī)構(gòu)經(jīng)本發(fā)明方法的標(biāo)準(zhǔn)誤差對比圖。
圖3是不同方法的標(biāo)準(zhǔn)誤差對比圖。
具體實施方式
下面將結(jié)合附圖和實施例對本發(fā)明做進(jìn)一步的詳細(xì)說明。
參見圖1所示,本發(fā)明提出了一種基于線性回歸因子非負(fù)矩陣分解模型的醫(yī)療機(jī)構(gòu)推薦方法,該推薦方法包括有下列處理步驟:
步驟A:初始化醫(yī)療機(jī)構(gòu)推薦系統(tǒng),并從GPS地理信息模塊、醫(yī)療機(jī)構(gòu)信息模塊、病患就診信息模塊和手機(jī)基站信息模塊中獲取推薦用原始數(shù)據(jù);
在本發(fā)明中,醫(yī)療機(jī)構(gòu)推薦系統(tǒng)借助公共的互聯(lián)網(wǎng)系統(tǒng)的大數(shù)據(jù)進(jìn)行推薦技術(shù)處理。醫(yī)療機(jī)構(gòu)推薦系統(tǒng)所需的推薦用原始數(shù)據(jù)是由互聯(lián)網(wǎng)提供。為滿足本發(fā)明所需的原始數(shù)據(jù),則互聯(lián)網(wǎng)中至少需要以下模塊提供數(shù)據(jù)信息,即包括有:
GPS地理信息模塊,用于提供目標(biāo)的地理位置,地理位置以經(jīng)度和緯度顯示,即(x,y);
醫(yī)療機(jī)構(gòu)信息模塊,用于提供不同醫(yī)療機(jī)構(gòu)的名稱、醫(yī)療機(jī)構(gòu)類型、患者關(guān)聯(lián)信息(屬于各醫(yī)療機(jī)構(gòu)共享的部分患者信息,不涉及患者隱私)、治療特色等信息;所述患者關(guān)聯(lián)信息有就診信息DI和患者就診時間信息DT等;而就診信息DI包括有患者的住址、患者的病歷、患者的姓名、患者的年齡、患者的性別、患者的電話等相關(guān)信息,其中,患者的住址為不可缺少項;
病患就診信息模塊,用于提供患者自愿公開的患者基礎(chǔ)信息,如患者的住址、患者的病歷、患者的姓名、患者的年齡、患者的性別、患者的電話等相關(guān)信息;
手機(jī)基站信息模塊,用于提供手機(jī)用戶注冊信息、用戶的移動狀態(tài)信息、用戶登錄互聯(lián)網(wǎng)信息等。
在本發(fā)明中,為了表征醫(yī)療機(jī)構(gòu)與居住區(qū)域之間的就診量,應(yīng)用了患者的就診信息DI、患者就診時間信息DT、以及醫(yī)療機(jī)構(gòu)集DC={Doctor1,Doctor2,…,Doctorb}和居住區(qū)域集RE={re1,re2,…,ren-1,ren,ren+1,…,rea}的信息。所述患者的就診信息DI包括有患者的家庭住址、患者的病歷、患者的姓名、患者的年齡、患者的性別、患者的電話等相關(guān)信息,其中,患者的家庭住址為不可缺少項。
步驟B:應(yīng)用步驟A獲取的推薦用原始數(shù)據(jù)構(gòu)建二維醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;
在本發(fā)明中,醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣記為
步驟C:根據(jù)步驟B得到的醫(yī)療機(jī)構(gòu)—居住區(qū)就診量設(shè)計適用于時空多維度條件下,多尺度與多粒度的海量數(shù)據(jù)的線性回歸張量因子;
在本發(fā)明中,線性回歸張量因子記為FR=[Rr,Rs,Rt]b×a×3。
步驟D:依據(jù)步驟C的線性回歸張量因子重新對步驟B的醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣進(jìn)行處理,得到醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型;
在本發(fā)明中,醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型記為
步驟E:在醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中應(yīng)用步驟D的醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型,并初始化;然后采用隱性特征模型對多元異構(gòu)的推薦用原始數(shù)據(jù)進(jìn)行活化數(shù)據(jù)挖掘,得到隱性特征矩陣;
在本發(fā)明中,隱性特征有2個,即醫(yī)療機(jī)構(gòu)的隱性特征記為
即居住區(qū)域的隱性特征記為
步驟F:通過步驟E得到的隱性特征矩陣,迭代計算醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;若未達(dá)到收斂,則返回步驟E,重新計算隱性特征矩陣偏導(dǎo);若收斂,則修正醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;
在本發(fā)明中,以來修正步驟B構(gòu)建的醫(yī)療機(jī)構(gòu)-居住區(qū)域就診量矩陣,記為Tm就診量_重構(gòu)。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
表示經(jīng)修正后的就診量。
步驟G:以推薦標(biāo)準(zhǔn)誤差模型對經(jīng)步驟F修正后的醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣進(jìn)行推薦標(biāo)準(zhǔn)誤差的計算,若標(biāo)準(zhǔn)誤差小于0.3,則將獲得推薦結(jié)果提供給用戶。
在本發(fā)明中,推薦標(biāo)準(zhǔn)誤差模型記為
計算推薦標(biāo)準(zhǔn)誤差模型RMSE就診量_誤差作為算法準(zhǔn)確度的評判標(biāo)準(zhǔn),如果Weight缺失中為0,則通過所述RMSE就診量_誤差來對和進(jìn)行相似度衡量。
在本發(fā)明的醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中,居住區(qū)域記為re,多個居住區(qū)域形成的居住區(qū)域集記為RE={re1,re2,…,ren-1,ren,ren+1,…,rea},角標(biāo)a表示居住區(qū)域的總個數(shù),n表示居住區(qū)域的標(biāo)識號。居住區(qū)域re的地理位置re(x,y)中的x為經(jīng)度,y為緯度。
re1表示第一個居住區(qū)域,所述第一個居住區(qū)域re1的地理位置記為
re2表示第二個居住區(qū)域,所述第二個居住區(qū)域re2的地理位置記為
ren表示任意一個居住區(qū)域,所述任意一個居住區(qū)域ren的地理位置記為
ren-1表示與ren距離最近的一個居住區(qū)域,簡稱為前一個居住區(qū)域,所述前一個居住區(qū)域ren-1的地理位置記為
ren+1表示與ren距離次近的一個居住區(qū)域,簡稱為后一個居住區(qū)域,所述后一個居住區(qū)域ren+1的地理位置記為
rea表示最后一個居住區(qū)域,所述最后一個居住區(qū)域rea的地理位置記為
在本發(fā)明的醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中,醫(yī)療機(jī)構(gòu)記為Doctor,多個醫(yī)療機(jī)構(gòu)形成的醫(yī)療機(jī)構(gòu)集記為DC={Doctor1,Doctor2,…,Doctorb},角標(biāo)b表示醫(yī)療機(jī)構(gòu)的總個數(shù),也是醫(yī)療機(jī)構(gòu)的標(biāo)識號。醫(yī)療機(jī)構(gòu)Doctor的地理位置Doctor(x,y)中的x為經(jīng)度,y為緯度。
Doctor1表示第一個醫(yī)療機(jī)構(gòu),所述第一個醫(yī)療機(jī)構(gòu)Doctor1的地理位置記為
Doctor2表示第二個醫(yī)療機(jī)構(gòu),所述第二個醫(yī)療機(jī)構(gòu)Doctor2的地理位置記為
Doctorb表示最后一個醫(yī)療機(jī)構(gòu),所述最后一個醫(yī)療機(jī)構(gòu)Doctorb的地理位置記為為了方便敘述,將Doctorb也稱為任意一個醫(yī)療機(jī)構(gòu)。
在本發(fā)明的醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中,手機(jī)用戶記為Phone,多個手機(jī)用戶形成的手機(jī)用戶集記為PH={Phone1,Phone2,…,Phonec},角標(biāo)c表示手機(jī)用戶的總個數(shù),也是手機(jī)用戶的標(biāo)識號。手機(jī)用戶Phone所屬的手機(jī)基站地理位置Phone(x,y)中的x為經(jīng)度,y為緯度。
Phone1表示第一個手機(jī)用戶,所述第一個手機(jī)用戶Phone1所屬的手機(jī)基站地理位置記為
Phone2表示第二個手機(jī)用戶,所述第二個手機(jī)用戶Phone2所屬的手機(jī)基站地理位置記為
Phonec表示最后一個手機(jī)用戶,所述最后一個手機(jī)用戶Phonec所屬的手機(jī)基站地理位置記為為了方便敘述,將Phonec也稱為任意一個手機(jī)用戶。
在本發(fā)明中,醫(yī)療機(jī)構(gòu)推薦系統(tǒng)應(yīng)用手機(jī)用戶信息來表征醫(yī)療機(jī)構(gòu)與居住區(qū)域之間的人流量。
本發(fā)明是一種基于線性回歸因子非負(fù)矩陣分解模型的醫(yī)療機(jī)構(gòu)推薦方法,包括有下列步驟:
在步驟B中的醫(yī)療機(jī)構(gòu)與居住區(qū)就診量信息的獲取處理過程如下;
以地圖(如地理位置)為基礎(chǔ)的空間結(jié)構(gòu)是醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)的一種基本組織方式,而城市快節(jié)奏的生活方式也使得醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)對于時間維度的變化非常敏感。因此,時空多維特性成為醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)的另一個重要特點(diǎn)。在空間上,根據(jù)城市地理規(guī)模的不同,醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)具有不同尺度的空間跨度。在時間上,根據(jù)產(chǎn)生的時間不同,醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)具有時間相關(guān)的變化和分布。因此在進(jìn)行醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)分析和應(yīng)用時,一方面需要考慮時間和空間兩個維度的數(shù)據(jù)演化特性,另一方面還需要充分利用時間和空間不同維度之間的數(shù)據(jù)關(guān)聯(lián)關(guān)系。
在本發(fā)明的醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中,醫(yī)療機(jī)構(gòu)與居住區(qū)就診量信息以二維矩陣形式來進(jìn)行關(guān)聯(lián)數(shù)據(jù)信息的收集,采用矩陣形式構(gòu)建,即得到醫(yī)療機(jī)構(gòu)-居住區(qū)就診量矩陣b表示醫(yī)療機(jī)構(gòu)的總個數(shù),a表示居住區(qū)域的總個數(shù),在本發(fā)明中,b的取值為321,a的取值為1343。
表示Doctor1跟re1之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctor1的就診信息的住址是否位于居住區(qū)域re1的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示去Doctor1進(jìn)行就診的患者的家庭住址。
表示Doctor1跟re2之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctor1的就診信息的住址是否位于居住區(qū)域re2的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示Doctor1跟rea之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctor1的就診信息的住址是否位于居住區(qū)域rea的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示Doctor2跟re1之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctor2的就診信息的住址是否位于居住區(qū)域re1的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示去Doctor2進(jìn)行就診的患者的家庭住址。
表示Doctor2跟re2之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctor2的就診信息的住址是否位于居住區(qū)域re2的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示Doctor2跟rea之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctor2的就診信息的住址是否位于居住區(qū)域rea的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示Doctorb跟re1之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctorb的就診信息的住址是否位于居住區(qū)域re1的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示去Doctorb進(jìn)行就診的患者的家庭住址。
表示Doctorb跟re2之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctorb的就診信息的住址是否位于居住區(qū)域re2的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
表示Doctorb跟rea之間映射的的就診量;所述的計算關(guān)系為:判斷患者在Doctorb的就診信息的住址是否位于居住區(qū)域rea的地理位置里,是,則在Tm就診量中記錄下否,放棄在Tm就診量中記錄。
在步驟C中的線性回歸張量因子的獲取處理過程如下:
研究和利用醫(yī)療機(jī)構(gòu)數(shù)據(jù)除了要考慮時間和空間等多個維度之外,還需要考慮數(shù)據(jù)尺度和數(shù)據(jù)粒度對于數(shù)據(jù)特性的影響。在規(guī)模的尺度上,醫(yī)療機(jī)構(gòu)可以分為專科醫(yī)院、中型醫(yī)院、大型醫(yī)院等;在地理尺度上,對于醫(yī)療機(jī)構(gòu)數(shù)據(jù)的描述可以小到幾個街區(qū)或大到數(shù)千平方公里;在時間尺度上,醫(yī)療機(jī)構(gòu)數(shù)據(jù)的覆蓋時間可以短到一些事件的監(jiān)控,長到上百年的醫(yī)療機(jī)構(gòu)變遷。在地理采樣粒度上,可以像遙感測繪數(shù)據(jù)一樣精確到數(shù)米,也可以向氣象環(huán)境數(shù)據(jù)一樣以區(qū)縣、地區(qū)、甚至省市為單位;在時間粒度上,更是根據(jù)數(shù)據(jù)采樣設(shè)備的時鐘、存儲與傳輸能力、計算速度等因素產(chǎn)生不同的時間粒度。在本發(fā)明的醫(yī)療機(jī)構(gòu)推薦系統(tǒng)中,在時空多維度的條件下,高效處理多尺度與多粒度的海量數(shù)據(jù),采用了“線性回歸張量因子”來改善海量數(shù)據(jù)多特征因子公式冗余并且計算難以達(dá)到全局最優(yōu)的問題。根據(jù)步驟B中提取出來的Tm就診量設(shè)計線性回歸張量因子。
在本發(fā)明中,線性回歸張量因子為FR=[Rr,Rs,Rt]b×a×3,且
所述距離因子
所述就診量因子
所述人流量因子其中,b表示醫(yī)療機(jī)構(gòu)的總個數(shù),a表示居住區(qū)域的總個數(shù),在本發(fā)明中,b的取值為321,a的取值為1343。r表示距離標(biāo)識,s表示就診量標(biāo)識,r表示人流量標(biāo)識。
表示Doctor1跟re1之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctor1跟re2之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctor1跟rea之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctor2跟re1之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctor2跟re2之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctor2跟rea之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctorb跟re1之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctorb跟re2之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctorb跟rea之間的距離,利用和進(jìn)行距離的計算,計算公式為
表示Doctor1跟距離re1最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,距離最近的五個居住區(qū)域表現(xiàn)形式為則
表示Doctor1跟距離re2最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea為距離最近的五個居住區(qū)域。的計算形式為
表示Doctor1跟距離rea最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1為距離最近的五個居住區(qū)域。的計算公式為
表示Doctor2跟距離re1最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re2,ren-1,ren,ren+1,rea為距離最近的五個居住區(qū)域。的計算公式為
表示Doctor2跟距離re2最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea為距離最近的五個居住區(qū)域。的計算公式為
表示Doctor2跟距離rea最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1為距離最近的五個居住區(qū)域。的計算形式為
表示Doctorb跟距離re1最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re2,ren-1,ren,ren+1,rea為距離最近的五個居住區(qū)域。的計算公式為
表示Doctorb跟距離re2最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea為距離最近的五個居住區(qū)域。的計算公式為
表示Doctorb跟距離rea最近的5個居住區(qū)域之間的患者就診量的平均值。令為從RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中選出的距離最近的五個居住區(qū)域。的計算形式為為了方便說明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1為距離最近的五個居住區(qū)域。的計算公式為
表示Doctor1跟re1之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在人流量因子Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
表示Doctor1跟re2之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
表示Doctor1跟rea之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
表示Doctor2跟re1之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
表示Doctor2跟re2之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
表示Doctor2跟rea之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
表示Doctorb跟re1之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
表示Doctorb跟re2之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
表示Doctorb跟rea之間映射的人流量;所述的計算關(guān)系為:判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在醫(yī)院基站列表HL中,不是則放棄記錄;同理,判斷PH={Phone1,Phone2,…,Phonec}中的任意是否位于如果是,則記錄在居住區(qū)基站列表REL中,不是則放棄記錄。如果Phonec同時存在于醫(yī)院基站列表HL和居住區(qū)基站列表REL中則在Rt中記錄否則,放棄記錄。
在本發(fā)明中,醫(yī)院基站列表HL的列表形式為:
在本發(fā)明中,居住區(qū)基站列表REL的列表形式為:
在步驟D和步驟E中,對推薦目標(biāo)模型和隱性特征矩陣的獲取處理過程如下:
由于醫(yī)療機(jī)構(gòu)互聯(lián)網(wǎng)數(shù)據(jù)具有非常多的類型與來源,即數(shù)據(jù)的多元性.這些不同來源的醫(yī)療機(jī)構(gòu)數(shù)據(jù)無論是從結(jié)構(gòu)上、組織方式上、維度尺度與粒度上都會存在巨大差異,即數(shù)據(jù)的異構(gòu)性、智慧城市的應(yīng)用需求要求推薦系統(tǒng)必須將這些多元異構(gòu)數(shù)據(jù)進(jìn)行有機(jī)的融合,通過挖掘活化數(shù)據(jù)之間的相關(guān)性與相互作用方式來獲取隱性特征。
在本發(fā)明中,根據(jù)Tm就診量和FR來設(shè)計醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型記為
在本發(fā)明中,當(dāng)前輪次的J值(方便說明,記為J當(dāng)前)與前一次的J值(方便說明,記為J前一次)進(jìn)行差值比較ΔJ=|J當(dāng)前-J前一次|,若ΔJ趨近于0,則隱性特征模型J達(dá)到收斂,并用醫(yī)療機(jī)構(gòu)推薦目標(biāo)模型來修改醫(yī)療機(jī)構(gòu)—居住區(qū)就診量矩陣;若ΔJ不趨近于0,則說明隱性特征模型J未達(dá)到收斂,返回步驟E重新進(jìn)行隱性特征矩陣獲取。
F表示范數(shù),即Frobenius范數(shù)。
γ表示醫(yī)院隱性特征矩陣的系數(shù)。
θ表示對FR張量因子的學(xué)習(xí)系數(shù)。
δ表示居住區(qū)隱性特征矩陣的系數(shù)。
Weight缺失表示缺失值權(quán)重。
其中,所述缺失值權(quán)重
取值范圍是0或者1,0代表Doctor1跟re1之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctor1跟re1之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctor1跟re2之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctor1跟re2之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctor1跟rea之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctor1跟rea之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctor2跟re1之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctor2跟re1之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctor2跟re2之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctor2跟re2之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctor2跟rea之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctor2跟rea之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctorb跟re1之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctorb跟re1之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctorb跟re2之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctorb跟re2之間的數(shù)據(jù)存在,不需要預(yù)測。
取值范圍是0或者1,0代表Doctorb跟rea之間的數(shù)據(jù)缺失,是需要預(yù)測的對象,1代表Doctorb跟rea之間的數(shù)據(jù)存在,不需要預(yù)測。
其中,對應(yīng)于醫(yī)療機(jī)構(gòu)的隱性特征記為
表示Doctor1跟re1之間就診量預(yù)測的隱性特征值,最大迭代次數(shù)記為m,且m=500;每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:α表示梯度下降系數(shù)。
表示Doctor1跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor1跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor2跟re1之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor2跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor2跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctorb跟re1之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctorb跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctorb跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示Q特征矩陣的轉(zhuǎn)置。計算公式:
對應(yīng)于居住區(qū)域的隱性特征記為
表示Doctor1跟re1之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor1跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor1跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor2跟re1之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor2跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctor2跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctorb跟re1之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctorb跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
表示Doctorb跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值,表示P特征矩陣的轉(zhuǎn)置。計算公式:
由于本發(fā)明的線性回歸張量因子FR選用了多個就診量協(xié)同,因此線性回歸張量因子FR的系數(shù)記為
表示Doctor1跟re1之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值。計算公式:α表示梯度下降系數(shù)。sum為加和函數(shù)符號。
表示Doctor1跟re2之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值。計算公式:
表示Doctor1跟rea之間就診量預(yù)測的隱性特征值,迭代m次循環(huán)計算,每一輪的都由前一輪的隱性特征值通過以下公式更新,第一輪的表示隨機(jī)產(chǎn)生的一個初始數(shù)值。計算公式:
實施例1
若一個行政地區(qū)的醫(yī)療機(jī)構(gòu)總數(shù)為321個,劃分在市區(qū)區(qū)域里的醫(yī)療機(jī)構(gòu)有157個,劃分在郊區(qū)區(qū)域里的醫(yī)療機(jī)構(gòu)有164個。
若一個行政地區(qū)的醫(yī)療機(jī)構(gòu)測試集為160個,訓(xùn)練集為161個,劃分在市區(qū)區(qū)域里的醫(yī)療機(jī)構(gòu)測試集有78個,訓(xùn)練集有79個,劃分在郊區(qū)區(qū)域里的醫(yī)療機(jī)構(gòu)測試集有82個,訓(xùn)練集有82個。
如圖2所示,圖中A號線表示行政區(qū)域所有醫(yī)療機(jī)構(gòu)參與本發(fā)明方法的標(biāo)準(zhǔn)誤差,其中測試集有160個醫(yī)療機(jī)構(gòu),訓(xùn)練集有161個醫(yī)療機(jī)構(gòu)。
如圖2所示,圖中B號線表示行政區(qū)域劃分在市區(qū)區(qū)域里的醫(yī)療機(jī)構(gòu)參與本發(fā)明方法的標(biāo)準(zhǔn)誤差,其中測試集有78個醫(yī)療機(jī)構(gòu),訓(xùn)練集有79個醫(yī)療機(jī)構(gòu)。
如圖2所示,圖中C號線表示行政區(qū)域劃分在郊區(qū)區(qū)域里的醫(yī)療機(jī)構(gòu)參與本發(fā)明方法的標(biāo)準(zhǔn)誤差,其中測試集有82個醫(yī)療機(jī)構(gòu),訓(xùn)練集有82個醫(yī)療機(jī)構(gòu)。
從圖2可以看出,經(jīng)過本發(fā)明方法計算得到的標(biāo)準(zhǔn)誤差很小,說明針對醫(yī)療機(jī)構(gòu)的推薦準(zhǔn)確度高。
實施例2
若一個行政地區(qū)的醫(yī)療機(jī)構(gòu)總數(shù)為321個,則測試集有160個醫(yī)療機(jī)構(gòu),訓(xùn)練集有161個醫(yī)療機(jī)構(gòu)。
如圖3所示,經(jīng)“SVD”、“LR”和“本發(fā)明”三種方法的標(biāo)準(zhǔn)誤差對比可見,本發(fā)明的標(biāo)準(zhǔn)誤差最小,說明本發(fā)明的方法比“SVD”、“LR”兩種方法的推薦準(zhǔn)確度高。
“SVD”方法請參考《推薦系統(tǒng)技術(shù)、評估及高效算法》李艷民譯,2015年7月第1版,第104-105頁。
“LR(Linear Models for Regression)”方法請參考《Pattern Recognition and Machine Learning》Christopher M.Bishop,2006年,第136-147中。