本發(fā)明涉及一種篩選排序方法,特別是一種面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法。
背景技術(shù):
對于客觀實(shí)體的評價(jià)與篩選方法,目前主要采用AHP層次分析法。AHP是對定性問題進(jìn)行定量分析的一種簡便、靈活而又實(shí)用的多準(zhǔn)則決策方法。它的特點(diǎn)是把復(fù)雜問題中的各種因素通過劃分為相互聯(lián)系的有序?qū)哟?,使之條理化,根據(jù)對一定客觀現(xiàn)實(shí)的主觀判斷結(jié)構(gòu)(主要是兩兩比較)把專家意見和分析者的客觀判斷結(jié)果直接而有效地結(jié)合起來,將一層次元素兩兩比較的重要性進(jìn)行定量描述。而后,利用數(shù)學(xué)方法計(jì)算反映每一層次元素的相對重要性次序的權(quán)值,通過所有層次之間的總排序計(jì)算所有元素的相對權(quán)重并進(jìn)行排序。但這類方法的主要缺陷在于,過于依賴人為對研究對象的數(shù)學(xué)建模,而難以發(fā)現(xiàn)各種因素間的潛在關(guān)系,使得其分析結(jié)果受人為因素的影響較多。
另一種用于客觀實(shí)體評價(jià)方法是主成分分析法。主成分分析也稱主分量分析,利用降維思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)(即主成分),其中每個(gè)主成分都能夠反映原始變量的大部分信息,且所含信息互不重復(fù)。這種方法在引進(jìn)多方面變量的同時(shí)將復(fù)雜因素歸結(jié)為幾個(gè)主成分,使問題簡單化,同時(shí)得到的結(jié)果更加科學(xué)有效的數(shù)據(jù)信息。在實(shí)際問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標(biāo),在多元統(tǒng)計(jì)分析中也稱為變量。因?yàn)槊總€(gè)變量都在不同程度上反映了所研究問題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計(jì)數(shù)據(jù)反映的信息在一定程度上有重疊。而這類方法一般模型較為簡單,而篩選的變量之間又相互存在重疊,雖然在計(jì)算復(fù)雜度方面有一些優(yōu)勢,但其無法根據(jù)實(shí)際的需要靈活的改變評價(jià)的標(biāo)準(zhǔn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題,特別創(chuàng)新地提出了面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法。
為了實(shí)現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了一種面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法,包括:
S1,根據(jù)關(guān)于項(xiàng)目需求方與項(xiàng)目承接企業(yè)之間項(xiàng)目合作的大數(shù)據(jù),進(jìn)行數(shù)學(xué)建模;
S2,計(jì)算項(xiàng)目合作的大數(shù)據(jù)屬性的先驗(yàn)概率分布,先驗(yàn)條件概率分布,以及集合A中各個(gè)屬性節(jié)點(diǎn)與集合B中各個(gè)屬性節(jié)點(diǎn)的條件互信息量;
S3,根據(jù)條件互信息量,構(gòu)建貝葉斯網(wǎng)絡(luò);
S4,利用貝葉斯網(wǎng)絡(luò)計(jì)算每個(gè)項(xiàng)目合作之后的滿意概率,并篩選排序后,使用滿意概率最高的項(xiàng)目需求方。
所述的面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法,優(yōu)選的,所述S1包括:
S1-1,開始;
S1-2,從關(guān)于項(xiàng)目需求方與項(xiàng)目承接企業(yè)之間項(xiàng)目合作的相關(guān)大數(shù)據(jù)中提取有效的數(shù)據(jù)分為三個(gè)集合,分別為:大數(shù)據(jù)中各個(gè)企業(yè)的基本信息,以上各個(gè)企業(yè)的歷史合作項(xiàng)目的基本信息,以及項(xiàng)目需求方對各歷史合作項(xiàng)目中該企業(yè)表現(xiàn)的滿意度評價(jià);
S1-3,各個(gè)企業(yè)的基本信息被建模為一個(gè)包含N個(gè)屬性節(jié)點(diǎn)的集合A,其中各個(gè)屬性節(jié)點(diǎn)分別表示描述該企業(yè)基本信息的一項(xiàng)屬性,所述N≥3;
各個(gè)企業(yè)歷史合作項(xiàng)目的基本信息被建模為一個(gè)包含M個(gè)屬性節(jié)點(diǎn)的集合B,其中各個(gè)屬性節(jié)點(diǎn)分別表示描述該項(xiàng)目信息的一項(xiàng)屬性,所述M≥4;
其中項(xiàng)目需求方對各歷史合作項(xiàng)目中該企業(yè)的表現(xiàn)滿意度評價(jià)建模為貝葉斯網(wǎng)絡(luò)中的類屬性節(jié)點(diǎn)C,評價(jià)為“滿意”則C=1,評價(jià)為“不滿意”則C=0。
所述的面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法,優(yōu)選的,所述S2包括:
S2-1,屬性的先驗(yàn)概率分布可通過大數(shù)據(jù)中的統(tǒng)計(jì)信息計(jì)算;
S2-2,屬性的先驗(yàn)條件概率分布,指集合A與B中的各個(gè)屬性,在以類屬性C為條件的情況下的條件概率P(Ai|C)、P(Bj|C);其計(jì)算方法如下,其中P(Ai,C)表示Ai與C的聯(lián)合概率分布,遍歷Ai與C的取值能夠得到其條件概率分布P(Ai|C);
S2-3,集合A中各個(gè)屬性節(jié)點(diǎn)與集合B中各個(gè)屬性節(jié)點(diǎn)的條件互信息量I(Ai;Bj|C)計(jì)算方法如下;
其中,P(Ai,Bj,C)表示Ai,Bj與C的聯(lián)合概率分布。
所述的面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法,優(yōu)選的,所述S3包括:
S3-1,選取類屬性節(jié)點(diǎn)C放入網(wǎng)絡(luò)中;
S3-2,將集合A中的各個(gè)屬性節(jié)點(diǎn)以類屬性節(jié)點(diǎn)C為父節(jié)點(diǎn),構(gòu)造一個(gè)樸素貝葉斯網(wǎng)絡(luò);
S3-3,將集合B中的節(jié)點(diǎn)逐個(gè)放入網(wǎng)絡(luò)中;對于屬性節(jié)點(diǎn)Bj而言,若I(Ai;Bj|C)滿足I(Ai;Bj|C)>I(Ak;Bj|C)(k≠i),則將Bj放入網(wǎng)絡(luò),并將Ai作為其父節(jié)點(diǎn);集合B中的其余節(jié)點(diǎn)也通過類似方法匹配父節(jié)點(diǎn);從而得到一個(gè)完整的可以用于項(xiàng)目合作企業(yè)篩選排序的貝葉斯網(wǎng)絡(luò)。
所述的面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法,優(yōu)選的,所述S4包括:
S4-1,計(jì)算類屬性C的概率質(zhì)量函數(shù)P(C,A1,...,AN,B1,...,BM),滿足
其中表示Ai的所有子節(jié)點(diǎn)Bj的條件概率的乘積;
S4-2,由項(xiàng)目需求方根據(jù)其合作項(xiàng)目的情況,向網(wǎng)絡(luò)中集合A的各個(gè)屬性節(jié)點(diǎn)Ai賦值;另一方面,根據(jù)大數(shù)據(jù)中各個(gè)企業(yè)的基本信息,輪流將各個(gè)企業(yè)的基本信息代入網(wǎng)絡(luò)中集合B的各個(gè)屬性節(jié)點(diǎn)Bj,計(jì)算對于各個(gè)企業(yè)的類屬性C的概率質(zhì)量函數(shù)P(C,A1,...,AN,B1,...,BM);
S4-3,篩選出滿意概率大于0.5的企業(yè),并按照從大到小的順序?qū)@些企業(yè)排列,輸出給項(xiàng)目需求方,從而獲取滿意概率最高的項(xiàng)目需求方。
綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
利用貝葉斯網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)的方法,能夠通過項(xiàng)目需求方對所需合作項(xiàng)目的描述為其從大數(shù)據(jù)中篩選出來適宜完成該項(xiàng)目的企業(yè),并按照其適宜的程度對其排序。相較于傳統(tǒng)的通過中介方或朋友圈的方法,該方法所受人為因素的限制和影響較少,能夠從較大的海量數(shù)據(jù)的企業(yè)中進(jìn)行篩選,客觀得到企業(yè)的行為習(xí)慣,以及評價(jià)數(shù)據(jù),從而能夠給用戶提供準(zhǔn)確的排序數(shù)據(jù),獲得客觀數(shù)值從而為工程施工或者工程合作提供良好的后續(xù)服務(wù)作為保障。
貝葉斯網(wǎng)絡(luò)是一種常用于大數(shù)據(jù)分析決策的方法。應(yīng)用貝葉斯網(wǎng)絡(luò)做大數(shù)據(jù)分析并引導(dǎo)決策,首先,對分析對象建立數(shù)學(xué)模型,用各項(xiàng)屬性描述分析對象,通過對各個(gè)數(shù)據(jù)單元中各項(xiàng)屬性統(tǒng)計(jì)特性的分析,計(jì)算各個(gè)屬性間的互信息量,并以此為參考構(gòu)建貝葉斯網(wǎng)絡(luò)。網(wǎng)絡(luò)構(gòu)建完成后,能夠得到網(wǎng)絡(luò)整體的概率分布,向網(wǎng)絡(luò)中各個(gè)屬性節(jié)點(diǎn)賦值,便可得到源節(jié)點(diǎn)的條件概率分布情況。
利用貝葉斯網(wǎng)絡(luò)解決這類問題相對于AHP方法而言,其主要優(yōu)勢在于,貝葉斯網(wǎng)絡(luò)利用大數(shù)據(jù)的統(tǒng)計(jì)信息能夠有效的提取出各個(gè)被建模為屬性的因素間的統(tǒng)計(jì)關(guān)系,能夠發(fā)現(xiàn)屬性間的潛在的聯(lián)系,使得分析結(jié)果更加符合實(shí)際情況。
附圖說明
本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1樸素貝葉斯網(wǎng)絡(luò)示意圖;
圖2項(xiàng)目合作企業(yè)智慧篩選貝葉斯網(wǎng)絡(luò)示意圖;
圖3面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法流程圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
在本發(fā)明的描述中,需要理解的是,術(shù)語“縱向”、“橫向”、“上”、“下”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限制。
在本發(fā)明的描述中,除非另有規(guī)定和限定,需要說明的是,術(shù)語“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,能夠是機(jī)械連接或電連接,也能夠是兩個(gè)元件內(nèi)部的連通,能夠是直接相連,也能夠通過中間媒介間接相連,對于本領(lǐng)域的普通技術(shù)人員而言,能夠根據(jù)具體情況理解上述術(shù)語的具體含義。
本發(fā)明利用項(xiàng)目需求方與項(xiàng)目承接企業(yè)之間項(xiàng)目合作的相關(guān)大數(shù)據(jù),將合作項(xiàng)目及承接企業(yè)建模為兩個(gè)屬性集合。根據(jù)項(xiàng)目需求方對承接企業(yè)的合作滿意度的評價(jià),以及合作項(xiàng)目與承接企業(yè)各個(gè)屬性間的互信息量,構(gòu)建貝葉斯網(wǎng)絡(luò),并計(jì)算項(xiàng)目合作滿意度的概率分布。貝葉斯網(wǎng)絡(luò)構(gòu)建完成后,根據(jù)項(xiàng)目需求,為各個(gè)合作項(xiàng)目屬性賦值,并依次代入各個(gè)承接企業(yè)的屬性值,計(jì)算各個(gè)承接企業(yè)與該合作項(xiàng)目的滿意度。并篩選出滿意概率較高的承接企業(yè),按滿意概率高低對其排序,并輸出給項(xiàng)目需求方供其參考,從中篩選出滿意概率最高的一方提供給用戶,并且剔除掉滿意概率最低的一方。
如圖3所示,本發(fā)明提供了一種面向大數(shù)據(jù)的項(xiàng)目合作企業(yè)智慧篩選排序方法,包括:
S1,根據(jù)關(guān)于項(xiàng)目需求方與項(xiàng)目承接企業(yè)之間項(xiàng)目合作的大數(shù)據(jù),進(jìn)行數(shù)學(xué)建模;
S2,計(jì)算項(xiàng)目合作的大數(shù)據(jù)屬性的先驗(yàn)概率分布,先驗(yàn)條件概率分布,以及集合A中各個(gè)屬性節(jié)點(diǎn)與集合B中各個(gè)屬性節(jié)點(diǎn)的條件互信息量;
S3,根據(jù)條件互信息量,構(gòu)建貝葉斯網(wǎng)絡(luò);
S4,利用貝葉斯網(wǎng)絡(luò)計(jì)算每個(gè)項(xiàng)目合作之后的滿意概率,并篩選排序后,使用滿意概率最高的項(xiàng)目需求方。
本發(fā)明的技術(shù)方案:
本發(fā)明中涉及的“企業(yè)”包括但不限于,有能力達(dá)成某種目的或完成某個(gè)任務(wù)的法人或其他社會經(jīng)濟(jì)組織。
本發(fā)明中涉及的“項(xiàng)目需求方”包括但不限于,為達(dá)成某種目的或完成某個(gè)任務(wù)時(shí),將該任務(wù)的部分或全部作為項(xiàng)目,尋求合作伙伴共同完成的個(gè)人或企業(yè)。
本發(fā)明中涉及的“合作項(xiàng)目”包括但不限于,由項(xiàng)目需求方提出的某個(gè)目標(biāo)或某項(xiàng)任務(wù)。
本發(fā)明中涉及的“滿意度”包括但不限于,當(dāng)企業(yè)完成項(xiàng)目需求方提出的合作項(xiàng)目后,由項(xiàng)目需求方對該企業(yè)是否滿意的評價(jià)。
本發(fā)明中涉及的“承接企業(yè)”包括但不限于,已經(jīng)完成了由項(xiàng)目需求方提出的合作項(xiàng)目,并得到了項(xiàng)目需求方滿意度評價(jià)的企業(yè)。
本發(fā)明中涉及的“關(guān)于項(xiàng)目需求方與項(xiàng)目承接企業(yè)之間項(xiàng)目合作的相關(guān)大數(shù)據(jù)”包括但不限于,大數(shù)量企業(yè)的基本信息(包括但不限于:該企業(yè)的市場估值,該企業(yè)的成立時(shí)間,該企業(yè)員工數(shù)量,企業(yè)的經(jīng)營業(yè)務(wù)等等),以及以上各個(gè)企業(yè)的歷史合作項(xiàng)目的基本信息(包括但不限于:項(xiàng)目的投資金額,項(xiàng)目的主要目標(biāo),項(xiàng)目的合作周期等等),以及項(xiàng)目需求方對各歷史合作項(xiàng)目中該企業(yè)的表現(xiàn)滿意度評價(jià)(滿意或不滿意)。
首先,需要從關(guān)于項(xiàng)目需求方與項(xiàng)目承接企業(yè)之間項(xiàng)目合作的相關(guān)大數(shù)據(jù)中提取有效的數(shù)據(jù),完成數(shù)學(xué)建模。從中提取數(shù)據(jù)可分為三個(gè)集合,分別為:大數(shù)據(jù)中各個(gè)企業(yè)的基本信息,以上各個(gè)企業(yè)的歷史合作項(xiàng)目的基本信息,以及項(xiàng)目需求方對各歷史合作項(xiàng)目中該企業(yè)的表現(xiàn)滿意度評價(jià)。
其中各個(gè)企業(yè)的基本信息被建模為一個(gè)包含N個(gè)屬性節(jié)點(diǎn)的集合A,其中各個(gè)屬性節(jié)點(diǎn)分別表示描述該企業(yè)基本信息的一項(xiàng)屬性(例如:Ai表示企業(yè)的員工人數(shù),員工人數(shù)大于100,則Ai=1,員工人數(shù)小于等于100,則Ai=0)。具體各屬性的賦值規(guī)則由該方法的應(yīng)用領(lǐng)域及項(xiàng)目需求方的具體需求而定。
其中各個(gè)企業(yè)的歷史合作項(xiàng)目的基本信息被建模為一個(gè)包含M個(gè)屬性節(jié)點(diǎn)的集合B,其中各個(gè)屬性節(jié)點(diǎn)分別表示描述該項(xiàng)目信息的一項(xiàng)屬性(例如:Bj表示項(xiàng)目需求方在該項(xiàng)目上的投資金額,投資金額大于人民幣10萬元,則Bj=1,投資金額小于等于10萬元,則Bj=0)。具體各屬性的賦值規(guī)則由該方法的應(yīng)用領(lǐng)域及項(xiàng)目需求方的具體需求而定。
其中項(xiàng)目需求方對各歷史合作項(xiàng)目中該企業(yè)的表現(xiàn)滿意度評價(jià)建模為貝葉斯網(wǎng)絡(luò)中的類屬性節(jié)點(diǎn)C,若評價(jià)為“滿意”則C=1;若評價(jià)為“不滿意”則C=0。
數(shù)學(xué)建模完成后,計(jì)算各屬性的先驗(yàn)概率分布,先驗(yàn)條件概率分布,以及集合A中各個(gè)屬性節(jié)點(diǎn)與集合B中各個(gè)屬性節(jié)點(diǎn)的條件互信息量I(Ai;Bj|C)。
屬性的先驗(yàn)概率分布計(jì)算方法如下。對類屬性C而言,設(shè)大數(shù)據(jù)中共有P項(xiàng)歷史合作項(xiàng)目,其中項(xiàng)目需求方覺得滿意的有Q項(xiàng),則若其中某一屬性節(jié)點(diǎn)Ai表示企業(yè)的員工人數(shù),員工人數(shù)大于100,則Ai=1,員工人數(shù)小于等于100,則Ai=0;若大數(shù)據(jù)中共有Z家企業(yè),其中員工人數(shù)大于100的為X家,則由此得到了屬性Ai的先驗(yàn)概率分布P(Ai)。其余屬性先驗(yàn)概率分布計(jì)算方法與此相同。
屬性的先驗(yàn)條件概率分布,指集合A與B中的各個(gè)屬性,在以類屬性C為條件的情況下的條件概率P(Ai|C)、P(Bj|C)。其計(jì)算方法如下,其中P(Ai,C)表示Ai與C的聯(lián)合概率分布,遍歷Ai與C的取值能夠得到其條件概率分布P(Ai|C)。
集合A中各個(gè)屬性節(jié)點(diǎn)與集合B中各個(gè)屬性節(jié)點(diǎn)的條件互信息量I(Ai;Bj|C)計(jì)算方法如下。其中,P(Ai,Bj,C)表示Ai,Bj與C的聯(lián)合概率分布。
至此訓(xùn)練完成,可根據(jù)上述方法計(jì)算得到的集合A中各個(gè)屬性節(jié)點(diǎn)與集合B中各個(gè)屬性節(jié)點(diǎn)的條件互信息量I(Ai;Bj|C),構(gòu)建貝葉斯網(wǎng)絡(luò),具體構(gòu)建方法如下。首先選取類屬性節(jié)點(diǎn)C放入網(wǎng)絡(luò)中,再將集合A中的各個(gè)屬性節(jié)點(diǎn)以類屬性節(jié)點(diǎn)C為父節(jié)點(diǎn),先構(gòu)造一個(gè)樸素貝葉斯網(wǎng)絡(luò)如附圖1所示。之后,將集合B中的節(jié)點(diǎn)逐個(gè)放入網(wǎng)絡(luò)中。對于屬性節(jié)點(diǎn)Bj而言,若I(Ai;Bj|C)滿足I(Ai;Bj|C)>I(Ak;Bj|C)(k≠i),則將Bj放入網(wǎng)絡(luò),并將Ai作為其父節(jié)點(diǎn)。集合B中的其余節(jié)點(diǎn)也通過類似方法匹配父節(jié)點(diǎn),得到貝葉斯網(wǎng)絡(luò)如附圖2所示。
如圖3所示,網(wǎng)絡(luò)構(gòu)建完成后,需根據(jù)網(wǎng)絡(luò)的模型,計(jì)算類屬性C的概率質(zhì)量函數(shù)P(C,A1,...,AN,B1,...,BM),滿足
其中表示Ai的所有子節(jié)點(diǎn)Bj的條件概率的乘積。
之后由項(xiàng)目需求方根據(jù)其合作項(xiàng)目的情況,向網(wǎng)絡(luò)中集合A的各個(gè)屬性節(jié)點(diǎn)Ai賦值。另一方面,根據(jù)大數(shù)據(jù)中各個(gè)企業(yè)的基本信息,輪流將各個(gè)企業(yè)的基本信息代入網(wǎng)絡(luò)中集合B的各個(gè)屬性節(jié)點(diǎn)Bj,計(jì)算對于各個(gè)企業(yè)的類屬性C的概率質(zhì)量函數(shù)P(C,A1,...,AN,B1,...,BM),這一指標(biāo)表示了若該企業(yè)承接此項(xiàng)目,項(xiàng)目需求方會對其表現(xiàn)滿意的概率。
篩選出滿意概率大于0.5的企業(yè),并按照從大到小的順序?qū)@些企業(yè)排列,輸出給項(xiàng)目需求方,以供其參考。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)能夠在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,本領(lǐng)域的普通技術(shù)人員能夠理解:在不脫離本發(fā)明的原理和宗旨的情況下能夠?qū)@些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同物限定。