本發(fā)明涉及醫(yī)療信息化領(lǐng)域,尤其涉及一種乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)及方法。
背景技術(shù):
近年來(lái)隨著互聯(lián)網(wǎng)、云計(jì)算、移動(dòng)通信和物聯(lián)網(wǎng)等的迅猛發(fā)展,無(wú)所不在的移動(dòng)設(shè)備、rfid、無(wú)線傳感器每分每秒都在產(chǎn)生數(shù)據(jù),數(shù)以億計(jì)用戶的互聯(lián)網(wǎng)服務(wù)時(shí)時(shí)刻刻在產(chǎn)生巨量的交互,要處理的數(shù)據(jù)量巨大,數(shù)據(jù)一直都在以每年50%的速度增長(zhǎng),而業(yè)務(wù)需求和競(jìng)爭(zhēng)壓力對(duì)數(shù)據(jù)處理的實(shí)時(shí)性、有效性又提出了更高要求,傳統(tǒng)的常規(guī)技術(shù)手段根本無(wú)法應(yīng)付,因此,大數(shù)據(jù)技術(shù)(bigdata)成為近來(lái)的一個(gè)技術(shù)熱點(diǎn),引起了廣泛的重視。
通過(guò)大數(shù)據(jù)技術(shù)可以加速乳腺癌的風(fēng)險(xiǎn)預(yù)測(cè):借助于不斷增長(zhǎng)的私密和公開(kāi)用戶信息,大數(shù)據(jù)技術(shù)幫助人們從大體量、高復(fù)雜的醫(yī)療數(shù)據(jù)中提取價(jià)值。
然而,現(xiàn)階段的乳腺癌發(fā)病率預(yù)測(cè)系統(tǒng)在針對(duì)醫(yī)療數(shù)據(jù)進(jìn)行分析處理時(shí),并沒(méi)有考慮用戶平時(shí)使用搜索引擎的因素,在網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代,降低了乳腺癌發(fā)病率的預(yù)測(cè)精度。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的主要目的在于提供一種乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)及方法,旨在解決現(xiàn)有乳腺癌發(fā)生率預(yù)測(cè)系統(tǒng)中沒(méi)有基于搜索引擎關(guān)鍵字進(jìn)行乳腺癌發(fā)生率預(yù)測(cè)的技術(shù)問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng),運(yùn)行于數(shù)據(jù)中心,所述數(shù)據(jù)中心通過(guò)網(wǎng)絡(luò)與電信營(yíng)運(yùn)商連接,所述電信營(yíng)運(yùn)商通過(guò)所述網(wǎng)絡(luò)與所述客戶端連接,該系統(tǒng)包括:
獲取模塊,用于從電信運(yùn)營(yíng)商獲取用戶通過(guò)所述客戶端使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù);
提取模塊,用于根據(jù)預(yù)設(shè)的年齡段劃分規(guī)則對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行分類,并提取每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù),以及從每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù)中獲取用戶使用搜索引擎所輸入的關(guān)鍵字;
解析模塊,用于對(duì)每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字進(jìn)行解析以獲取每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字;及
計(jì)算模塊,用于計(jì)算每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字對(duì)應(yīng)的乳腺癌發(fā)生率。
優(yōu)選的,所述訪問(wèn)數(shù)據(jù)包括訪問(wèn)時(shí)間、訪問(wèn)網(wǎng)址、使用搜索引擎所輸入的關(guān)鍵字、網(wǎng)絡(luò)流量及使用互聯(lián)網(wǎng)服務(wù)的用戶信息,其中,所述用戶信息包括用戶姓名、年齡、身高、職業(yè)、學(xué)歷、家庭住址、電話號(hào)碼及郵箱。
優(yōu)選的,所述預(yù)設(shè)的年齡段劃分規(guī)則是指以預(yù)設(shè)年齡為起點(diǎn)將人的壽命劃分為多個(gè)年齡段。
優(yōu)選的,所述乳腺癌發(fā)生率的計(jì)算公式為:p=m/n,其中,m為每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字的數(shù)量,n為每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字的數(shù)量。
另一方面,本發(fā)明還提供一種乳腺癌云平臺(tái)預(yù)測(cè)方法,應(yīng)用于數(shù)據(jù)中心,所述數(shù)據(jù)中心通過(guò)網(wǎng)絡(luò)與電信營(yíng)運(yùn)商連接,所述電信營(yíng)運(yùn)商通過(guò)所述網(wǎng)絡(luò)與所述客戶端連接,該方法包括:
從電信運(yùn)營(yíng)商獲取用戶通過(guò)所述客戶端使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù);
根據(jù)預(yù)設(shè)的年齡段劃分規(guī)則對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行分類,并提取每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù);
從每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù)中獲取用戶使用搜索引擎所輸入的關(guān)鍵字;
對(duì)每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字進(jìn)行解析,以獲取每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字;及
計(jì)算每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字對(duì)應(yīng)的乳腺癌發(fā)生率。
優(yōu)選的,所述訪問(wèn)數(shù)據(jù)包括訪問(wèn)時(shí)間、訪問(wèn)網(wǎng)址、使用搜索引擎所輸入的關(guān)鍵字、網(wǎng)絡(luò)流量及使用互聯(lián)網(wǎng)服務(wù)的用戶信息,其中,所述用戶信息包括用戶姓名、年齡、身高、職業(yè)、學(xué)歷、家庭住址、電話號(hào)碼及郵箱。
優(yōu)選的,所述預(yù)設(shè)的年齡段劃分規(guī)則是指以預(yù)設(shè)年齡為起點(diǎn)將人的壽命劃分為多個(gè)年齡段。
優(yōu)選的,所述乳腺癌發(fā)生率的計(jì)算公式為:p=m/n,其中,m為每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字的數(shù)量,n為每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字的數(shù)量。
本發(fā)明采用上述技術(shù)方案,帶來(lái)的技術(shù)效果為:本發(fā)明所述乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)及方法,結(jié)合用戶使用搜索引擎所輸入的關(guān)鍵字了解乳腺癌風(fēng)險(xiǎn)率,提高了乳腺癌發(fā)病率的預(yù)測(cè)精度。
附圖說(shuō)明
圖1是本發(fā)明乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)的應(yīng)用環(huán)境示意圖。
圖2是本發(fā)明乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)的優(yōu)選實(shí)施例的模塊示意圖。
圖3是本發(fā)明乳腺癌云平臺(tái)預(yù)測(cè)方法的優(yōu)選實(shí)施例的流程圖。
本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說(shuō)明。
具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式、結(jié)構(gòu)、特征及其功效,詳細(xì)說(shuō)明如下。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
參照?qǐng)D1所示,圖1是本發(fā)明乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)的應(yīng)用環(huán)境示意圖。
本發(fā)明中的乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)20運(yùn)行于數(shù)據(jù)中心2。所述數(shù)據(jù)中心2通過(guò)網(wǎng)絡(luò)3與所述電信營(yíng)運(yùn)商5連接。
所述電信營(yíng)運(yùn)商5還通過(guò)網(wǎng)絡(luò)3與一個(gè)或多個(gè)客戶端4(圖1中以三個(gè)為例進(jìn)行說(shuō)明)通信連接。
所述電信營(yíng)運(yùn)商5用于提供互聯(lián)網(wǎng)服務(wù),并記錄所述客戶端4使用互聯(lián)網(wǎng)服務(wù)時(shí)的訪問(wèn)數(shù)據(jù)。
具體的說(shuō),所述客戶端4使用電信運(yùn)營(yíng)商5提供的互聯(lián)網(wǎng)服務(wù)時(shí),所述電信營(yíng)運(yùn)商5會(huì)獲知所述客戶端4使用互聯(lián)網(wǎng)服務(wù)時(shí)的訪問(wèn)數(shù)據(jù),所述訪問(wèn)數(shù)據(jù)包括訪問(wèn)時(shí)間、訪問(wèn)網(wǎng)址、使用搜索引擎所輸入的關(guān)鍵字、網(wǎng)絡(luò)流量及使用互聯(lián)網(wǎng)服務(wù)的用戶信息等數(shù)據(jù)。所述用戶信息包括,但不限于,用戶姓名、年齡、身高、職業(yè)、學(xué)歷、家庭住址、電話號(hào)碼及郵箱等信息。
所述電信營(yíng)運(yùn)商5提供數(shù)據(jù)導(dǎo)入接口(例如,應(yīng)用程序接口,applicationprograminterface,api),接入該api接口的設(shè)備或系統(tǒng)都可以從所述電信營(yíng)運(yùn)商5中獲取客戶端4使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù)。所述數(shù)據(jù)中心2在所述電信營(yíng)運(yùn)商5授權(quán)的基礎(chǔ)上(即授權(quán)接入所述電信營(yíng)運(yùn)商5提供的api接口)獲取所述訪問(wèn)數(shù)據(jù),并對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行解析以得到用戶使用搜索引擎所輸入的關(guān)鍵字。
所述網(wǎng)絡(luò)3可以是有線通訊網(wǎng)絡(luò)或無(wú)線通訊網(wǎng)絡(luò)。所述網(wǎng)絡(luò)3優(yōu)選為無(wú)線通訊網(wǎng)絡(luò),包括但不限于,gsm網(wǎng)絡(luò)、gprs網(wǎng)絡(luò)、cdma網(wǎng)絡(luò)、td-scdma網(wǎng)絡(luò)、wimax網(wǎng)絡(luò)、td-lte網(wǎng)絡(luò)、fdd-lte網(wǎng)絡(luò)等無(wú)線傳輸網(wǎng)絡(luò)。
此外,所述數(shù)據(jù)中心2通過(guò)網(wǎng)絡(luò)3與所述客戶端4連接。需要說(shuō)明的是,所述數(shù)據(jù)中心2是云平臺(tái)或云平臺(tái)中的某一臺(tái)服務(wù)器,通過(guò)數(shù)據(jù)中心2的數(shù)據(jù)傳輸能力及數(shù)據(jù)存儲(chǔ)能力,可以更好地管理及/或協(xié)助與該數(shù)據(jù)中心2連接的客戶端4,有利于了解用戶通過(guò)所述客戶端4使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù)。
所述客戶端4可以是,但不限于,智能手機(jī)、平板電腦、個(gè)人數(shù)字助理(personaldigitalassistant,pda)、個(gè)人電腦等其它任意合適的具有電話功能的便攜式電子設(shè)備。需要說(shuō)明的是,用戶通過(guò)所述客戶端4使用所述電信營(yíng)運(yùn)商5所提供的互聯(lián)網(wǎng)服務(wù)之前,所述電信營(yíng)運(yùn)商5會(huì)進(jìn)行用戶信息登記,之后電信運(yùn)營(yíng)商5為用戶開(kāi)通互聯(lián)網(wǎng)服務(wù),用戶通過(guò)所述客戶端4使用互聯(lián)網(wǎng)服務(wù)時(shí),電信運(yùn)營(yíng)商5會(huì)記錄用戶使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù)。
參照?qǐng)D2所示,是本發(fā)明乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)的優(yōu)選實(shí)施例的模塊示意圖。在本實(shí)施例中,所述乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)20應(yīng)用于數(shù)據(jù)中心2。該數(shù)據(jù)中心2包括,但不僅限于,乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)20、存儲(chǔ)單元22、處理單元24及通訊單元26。
所述的存儲(chǔ)單元22可以為一種只讀存儲(chǔ)單元rom,電可擦寫存儲(chǔ)單元eeprom、快閃存儲(chǔ)單元flash或固體硬盤等。
所述的處理單元24可以為一種中央處理器(centralprocessingunit,cpu)、微控制器(mcu)、數(shù)據(jù)處理芯片、或者具有數(shù)據(jù)處理功能的信息處理單元。
所述的通訊單元26為一種具有遠(yuǎn)程無(wú)線通訊功能的無(wú)線通訊接口,例如,支持gsm、gprs、wcdma、cdma、td-scdma、wimax、td-lte、fdd-lte等通訊技術(shù)的通訊接口。
所述乳腺癌云平臺(tái)預(yù)測(cè)系統(tǒng)20包括,但不局限于,獲取模塊200、提取模塊210、解析模塊220及計(jì)算模塊230,本發(fā)明所稱的模塊是指一種能夠被所述數(shù)據(jù)中心2的處理單元24執(zhí)行并且能夠完成固定功能的一系列計(jì)算機(jī)程序指令段,其存儲(chǔ)在所述數(shù)據(jù)中心2的存儲(chǔ)單元22中。
所述獲取模塊200用于從電信運(yùn)營(yíng)商5獲取用戶通過(guò)客戶端4使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù)。
具體而言,所述電信運(yùn)營(yíng)商5提供api接口,接入該api接口的設(shè)備或系統(tǒng)都可以從所述電信運(yùn)營(yíng)商5中獲取所述訪問(wèn)數(shù)據(jù)。所述獲取模塊200調(diào)用所述電信運(yùn)營(yíng)商5提供的api接口以獲取所述訪問(wèn)數(shù)據(jù)。
需要說(shuō)明的是,由于所述訪問(wèn)數(shù)據(jù)屬于隱私信息,為了確保信息安全,所述訪問(wèn)數(shù)據(jù)發(fā)送給數(shù)據(jù)中心2時(shí),會(huì)通過(guò)加解密算法(例如,md5加解密算法、rsa加解密算法、des加解密算法、dsa加解密算法、aes加解密算法等)先對(duì)訪問(wèn)數(shù)據(jù)進(jìn)行加密處理,之后傳輸給所述數(shù)據(jù)中心2。
所述提取模塊210用于根據(jù)預(yù)設(shè)的年齡段劃分規(guī)則對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行分類,并提取每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù)。所述預(yù)設(shè)的年齡段劃分規(guī)則是指以預(yù)設(shè)年齡為起點(diǎn)(例如,18歲)將人的壽命設(shè)劃分為多個(gè)年齡段。例如,在18歲與為起點(diǎn)進(jìn)行劃分,其中,18-34歲為青年、35-45歲為壯年、45-60為中年、60歲以上為老年。由于所述訪問(wèn)數(shù)據(jù)中包括用戶信息,因此所述提取模塊210能夠提取用戶信息中的年齡,并根據(jù)預(yù)設(shè)的年齡段劃分規(guī)則對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行分類。
所述提取模塊210還用于從每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù)中獲取用戶使用搜索引擎所輸入的關(guān)鍵字。
所述解析模塊220用于對(duì)每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字進(jìn)行解析以獲取每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字。具體地說(shuō),所述解析模塊220對(duì)每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字與預(yù)設(shè)的乳腺癌關(guān)鍵字進(jìn)行比對(duì),若所輸入的關(guān)鍵字與預(yù)設(shè)的乳腺癌關(guān)鍵字相同,則該關(guān)鍵字為乳腺癌關(guān)鍵字。
所述計(jì)算模塊230用于計(jì)算每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字對(duì)應(yīng)的乳腺癌發(fā)生率。所述乳腺癌發(fā)生率的計(jì)算公式為:p=m/n,其中,m為每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字的數(shù)量,n為每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字的數(shù)量。舉例而言,在青年階段(18歲至34歲),用戶使用搜索引擎輸入的關(guān)鍵字的數(shù)量為一百萬(wàn)次,而用戶使用搜索引擎輸入的乳腺癌關(guān)鍵字的數(shù)量為一萬(wàn)次,則乳腺癌發(fā)生率為1%。
參照?qǐng)D3所示,是本發(fā)明乳腺癌云平臺(tái)預(yù)測(cè)方法的優(yōu)選實(shí)施例的流程圖。在本實(shí)施例中,所述的乳腺癌云平臺(tái)預(yù)測(cè)方法應(yīng)用于數(shù)據(jù)中心2,該方法包括以下步驟:
步驟s10:所述獲取模塊200從電信運(yùn)營(yíng)商5獲取用戶通過(guò)客戶端4使用互聯(lián)網(wǎng)服務(wù)的訪問(wèn)數(shù)據(jù)。
具體而言,所述電信運(yùn)營(yíng)商5提供api接口,接入該api接口的設(shè)備或系統(tǒng)都可以從所述電信運(yùn)營(yíng)商5中獲取所述訪問(wèn)數(shù)據(jù)。所述獲取模塊200調(diào)用所述電信運(yùn)營(yíng)商5提供的api接口以獲取所述訪問(wèn)數(shù)據(jù)。
需要說(shuō)明的是,由于所述訪問(wèn)數(shù)據(jù)屬于隱私信息,為了確保信息安全,所述訪問(wèn)數(shù)據(jù)發(fā)送給數(shù)據(jù)中心2時(shí),會(huì)通過(guò)加解密算法(例如,md5加解密算法、rsa加解密算法、des加解密算法、dsa加解密算法、aes加解密算法等)先對(duì)訪問(wèn)數(shù)據(jù)進(jìn)行加密處理,之后傳輸給所述數(shù)據(jù)中心2。
步驟s11:所述提取模塊210根據(jù)預(yù)設(shè)的年齡段劃分規(guī)則對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行分類,并提取每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù)。所述預(yù)設(shè)的年齡段劃分規(guī)則為以預(yù)設(shè)年齡為起點(diǎn)(例如,18歲)將人的壽命設(shè)劃分為多個(gè)年齡段。例如,在18歲與為起點(diǎn)進(jìn)行劃分,其中,18-34歲為青年、35-45歲為壯年、45-60為中年、60歲以上為老年。由于所述訪問(wèn)數(shù)據(jù)中包括用戶信息,所述提取模塊210提取用戶信息中的年齡,并根據(jù)預(yù)設(shè)的年齡段劃分規(guī)則對(duì)所述訪問(wèn)數(shù)據(jù)進(jìn)行分類。
步驟s12:所述提取模塊210從每個(gè)年齡段對(duì)應(yīng)的訪問(wèn)數(shù)據(jù)中獲取用戶使用搜索引擎所輸入的關(guān)鍵字。
步驟s13:所述解析模塊220對(duì)每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字進(jìn)行解析,以獲取每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字。具體地說(shuō),所述解析模塊220對(duì)每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字與預(yù)設(shè)的乳腺癌關(guān)鍵字進(jìn)行比對(duì),若所輸入的關(guān)鍵字與預(yù)設(shè)的乳腺癌關(guān)鍵字相同,則該關(guān)鍵字為乳腺癌關(guān)鍵字。
步驟s14:所述計(jì)算模塊230計(jì)算每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字對(duì)應(yīng)的乳腺癌發(fā)生率。所述乳腺癌發(fā)生率的計(jì)算公式為:p=m/n,其中,m為每個(gè)年齡段中用戶使用搜索引擎所輸入的乳腺癌關(guān)鍵字的數(shù)量,n為每個(gè)年齡段中用戶使用搜索引擎所輸入的關(guān)鍵字的數(shù)量。舉例而言,在青年階段(18歲至34歲),用戶使用搜索引擎輸入的關(guān)鍵字的數(shù)量為一百萬(wàn)次,而用戶使用搜索引擎輸入的乳腺癌關(guān)鍵字的數(shù)量為一萬(wàn)次,則乳腺癌發(fā)生率為1%。
此外,上述醫(yī)療乳腺癌發(fā)生率預(yù)測(cè)算法僅僅是舉例說(shuō)明,本發(fā)明中的所述醫(yī)療乳腺癌發(fā)生率預(yù)測(cè)算法還可以是其它現(xiàn)有的包含乳腺癌發(fā)生率的乳腺癌發(fā)生率預(yù)測(cè)算法。
以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說(shuō)明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。