本發(fā)明涉及一種數(shù)據(jù)分析方法,更具體的,涉及一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的方法及系統(tǒng)。
背景技術(shù):
高校讀研比例是學(xué)生填報志愿選學(xué)??紤]的因素之一,以往想了解某所高校的的讀研情況只能在官方網(wǎng)站查找就業(yè)報告,在其中找到相應(yīng)的數(shù)據(jù)。
如果想全面了解全國高校的讀研比例更是人力工程巨大,遇到?jīng)]有公布或頁面改版撤下文件的時候,就無法獲得高校的讀研比例。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在解決現(xiàn)有技術(shù)中存在的技術(shù)問題,利用某些學(xué)校官方公布的有限信息,再結(jié)合學(xué)校的其他的信息,去預(yù)測別的學(xué)校的讀研比例。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的方法,該方法包括如下步驟:
步驟1,采集部分學(xué)校官方公布的讀研數(shù)據(jù);
步驟2,根據(jù)統(tǒng)計的各學(xué)校所述讀研數(shù)據(jù)生成學(xué)校變量;
步驟3,用生成的所述學(xué)校變量擬合所述部分學(xué)校的所述讀研數(shù)據(jù),得出建模模型;
步驟4,根據(jù)所述模型,把需要預(yù)測的學(xué)校變量作為自變量,得出讀研比例。
更具體的,所述步驟2中的所述生成學(xué)校變量具體包括:
計算全國高校二級學(xué)科即各專業(yè)的讀研比例mjr2_ratio;
根據(jù)所述mjr2_ratio計算所述學(xué)校的理論讀研率theoryInUp;
統(tǒng)計所述學(xué)校讀研率inUp;
統(tǒng)計所述學(xué)校專業(yè)大類中工學(xué)engineering,文學(xué)literature的讀研率;
統(tǒng)計所述學(xué)校的男女比例gender;
統(tǒng)計所述學(xué)校官方公布的讀研率 gfInUp。
更具體的,所述步驟3中的所述模型可以用如下回歸方程表示為:
gfInUp=theoryInUp+inUp+gender+engineering+literature。
根據(jù)本發(fā)明的另一方面,本發(fā)明還提供了一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的系統(tǒng),該系統(tǒng)包括:數(shù)據(jù)采集模塊,用于采集部分學(xué)校官方公布的讀研數(shù)據(jù);
變量生成模塊,根據(jù)統(tǒng)計的各學(xué)校所述讀研數(shù)據(jù)生成學(xué)校變量;
建模模塊,用生成的所述學(xué)校變量擬合所述部分學(xué)校的所述讀研數(shù)據(jù),得出建模模型;
預(yù)測模塊,根據(jù)所述模型,把需要預(yù)測的學(xué)校變量作為自變量,得出讀研比例。
更具體的,所述變量生成模塊中的所述生成學(xué)校變量具體包括:
計算全國高校二級學(xué)科即各專業(yè)的讀研比例mjr2_ratio;
根據(jù)所述mjr2_ratio計算所述學(xué)校的理論讀研率theoryInUp;
統(tǒng)計所述學(xué)校讀研率inUp;
統(tǒng)計所述學(xué)校專業(yè)大類中工學(xué)engineering,文學(xué)literature的讀研率;
統(tǒng)計所述學(xué)校的男女比例gender;
統(tǒng)計所述學(xué)校官方公布的讀研率 gfInUp。
更具體的,所述建模模塊中的所述模型可以用如下回歸方程表示為:
gfInUp=theoryInUp+inUp+gender+engineering+literature。
本發(fā)明能預(yù)測其它各個高校的讀研比例,解決了官方數(shù)據(jù)的缺失(沒有就業(yè)報告)的問題,為考生提供了有效的數(shù)據(jù)參考。
本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述部分中給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1示出了根據(jù)本發(fā)明一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的方法的流程圖;
圖2示出了根據(jù)本發(fā)明一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的系統(tǒng)的框圖。
具體實(shí)施方式
為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點(diǎn),下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說明的是,在不沖突的情況下,本申請的實(shí)施例及實(shí)施例中的特征可以相互組合。
在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的方式來實(shí)施,因此,本發(fā)明的保護(hù)范圍并不受下面公開的具體實(shí)施例的限制。
為了更好的說明本發(fā)明的方案,下面將結(jié)合說明書附圖進(jìn)行說明。
圖1示出了根據(jù)本發(fā)明一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的方法的流程圖。
如圖1所示,根據(jù)本發(fā)明的一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的方法,該方法包括以下步驟:
步驟1,采集部分學(xué)校官方公布的讀研數(shù)據(jù)。
舉例來說,自動采集某一年份學(xué)校官方網(wǎng)站上公布的各種讀研數(shù)據(jù)。
步驟2,根據(jù)統(tǒng)計的各學(xué)校所述讀研數(shù)據(jù)生成學(xué)校變量。
具體來說,根據(jù)步驟1中的讀研數(shù)據(jù)統(tǒng)計出該年份的相關(guān)專業(yè)、理論和實(shí)際讀研率,然后生成學(xué)校變量,具體包括:
計算全國高校二級學(xué)科即各專業(yè)的讀研比例mjr2_ratio;
根據(jù)所述mjr2_ratio計算所述學(xué)校的理論讀研率theoryInUp;
統(tǒng)計所述學(xué)校讀研率inUp;
統(tǒng)計所述學(xué)校專業(yè)大類中工學(xué)engineering,文學(xué)literature的讀研率;
統(tǒng)計所述學(xué)校的男女比例gender;
統(tǒng)計所述學(xué)校官方公布的讀研率 gfInUp。
步驟3,用生成的所述學(xué)校變量擬合所述部分學(xué)校的所述讀研數(shù)據(jù),得出建模模型;
步驟4,根據(jù)所述模型,把需要預(yù)測的學(xué)校變量作為自變量,得出讀研比例。
更具體的,所述步驟3中的所述模型可以用如下回歸方程表示為:
gfInUp=theoryInUp+inUp+gender+engineering+literature。
圖2示出了根據(jù)本發(fā)明一種基于部分學(xué)校官方讀研數(shù)據(jù)預(yù)測其它學(xué)校讀研比例的系統(tǒng)的框圖。
如圖2所示,該系統(tǒng)包括:數(shù)據(jù)采集模塊、變量生成模塊、建模模塊和預(yù)測模塊,
數(shù)據(jù)采集模塊,用于采集部分學(xué)校官方公布的讀研數(shù)據(jù);
變量生成模塊,根據(jù)統(tǒng)計的各學(xué)校所述讀研數(shù)據(jù)生成學(xué)校變量;
建模模塊,用生成的所述學(xué)校變量擬合所述部分學(xué)校的所述讀研數(shù)據(jù),得出建模模型;
預(yù)測模塊,根據(jù)所述模型,把需要預(yù)測的學(xué)校變量作為自變量,得出讀研比例。
更具體的,所述變量生成模塊中的所述生成學(xué)校變量具體包括:
計算全國高校二級學(xué)科即各專業(yè)的讀研比例mjr2_ratio;
根據(jù)所述mjr2_ratio計算所述學(xué)校的理論讀研率theoryInUp;
統(tǒng)計所述學(xué)校讀研率inUp;
統(tǒng)計所述學(xué)校專業(yè)大類中工學(xué)engineering,文學(xué)literature的讀研率;
統(tǒng)計所述學(xué)校的男女比例gender;
統(tǒng)計所述學(xué)校官方公布的讀研率 gfInUp。
更具體的,所述建模模塊中的所述模型可以用如下回歸方程表示為:
gfInUp=theoryInUp+inUp+gender+engineering+literature。
本發(fā)明能夠依據(jù)有限的高校就業(yè)報告,獲取相關(guān)考研數(shù)據(jù),將數(shù)據(jù)結(jié)構(gòu)化,構(gòu)建模型,只需要用部分高校的數(shù)據(jù),就可以預(yù)測其它各個高校的讀研比例,解決了官方數(shù)據(jù)的缺失(沒有就業(yè)報告)的問題,可以有效的為考生提供數(shù)據(jù)參考。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。