本發(fā)明涉及一種虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng),用于對(duì)虛假房源及錄入行為進(jìn)行識(shí)別。
背景技術(shù):
目前的房產(chǎn)信息大都是通過房產(chǎn)中介公司的房源展示系統(tǒng)來(lái)進(jìn)行,該系統(tǒng)向房地產(chǎn)經(jīng)紀(jì)人提供一個(gè)輸入端口,房產(chǎn)經(jīng)紀(jì)人可以將房產(chǎn)相關(guān)信息錄入到這個(gè)系統(tǒng)中供用戶選擇。用戶通過瀏覽這些房產(chǎn)信息來(lái)決定是否購(gòu)買,同時(shí)戶主也可以委托房產(chǎn)經(jīng)紀(jì)人將自己的房產(chǎn)信息放到平臺(tái)上進(jìn)行售賣,我們將這樣一個(gè)系統(tǒng)稱之為房源展示系統(tǒng)。
這個(gè)房源展示系統(tǒng)由某個(gè)特定的房產(chǎn)中介公司實(shí)際運(yùn)營(yíng),房產(chǎn)中介公司對(duì)房地產(chǎn)經(jīng)紀(jì)人進(jìn)行考核,考核的指標(biāo)中包括房源錄入次數(shù)、核實(shí)房源信息真實(shí)性次數(shù)、售出房源套數(shù)等指標(biāo);因?yàn)樯婕暗綐I(yè)績(jī)的考核,所以一些房產(chǎn)經(jīng)紀(jì)人會(huì)錄入一些虛假編造的房源來(lái)滿足考核的要求,而這些虛假的房源信息若沒有經(jīng)過仔細(xì)的勘察檢驗(yàn)會(huì)最終被展示到房源信息頁(yè)面中供用戶瀏覽,為用戶購(gòu)置房產(chǎn)帶來(lái)了不必要的麻煩,同時(shí)也因表面上的房源信息豐富而對(duì)同行競(jìng)爭(zhēng)對(duì)手造成嚴(yán)重的影響,更因?yàn)榉績(jī)r(jià)信息的胡亂編造而對(duì)整個(gè)社會(huì)的房?jī)r(jià)帶來(lái)十分惡劣的影響。
基于以上原因,構(gòu)造監(jiān)督式學(xué)習(xí)算法通過識(shí)別虛假房源信息對(duì)房產(chǎn)經(jīng)紀(jì)人錄入虛假房源的行為進(jìn)行預(yù)警,從而降低由此帶來(lái)的影響。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)上述技術(shù)問題,本發(fā)明提供一種能夠識(shí)別虛假房源錄入行為并對(duì)該行為進(jìn)行預(yù)警的虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng)。
本發(fā)明采用的技術(shù)方案為:
本發(fā)明的實(shí)施例提供一種虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng),包括:
數(shù)據(jù)獲取模塊,獲取以預(yù)定時(shí)間段為周期記錄的的房源錄入總量i和銷售房源的如下信息:舉報(bào)有效量y、被他人改為無(wú)效的量a、被他人改為暫不出售的量b、被本人改為無(wú)效的量c、被本人改為暫不出售的量d,其中本人是指與獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人,他人是指除該房產(chǎn)經(jīng)紀(jì)人之外的人;
行為識(shí)別模塊,將獲取的以預(yù)定時(shí)間段為周期記錄的房源數(shù)據(jù)與預(yù)設(shè)條件進(jìn)行對(duì)比,判斷與獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人是否存在虛假房源錄入行為,在判斷為存在虛假房源錄入行為的情況下,將該房產(chǎn)經(jīng)紀(jì)人的識(shí)別標(biāo)簽標(biāo)注為指示有虛假房源錄入行為值1,否則將識(shí)別標(biāo)簽標(biāo)注為值0;
預(yù)警模型構(gòu)建模塊,選取以預(yù)定時(shí)間段為周期記錄的的舉報(bào)有效量、被他人改為無(wú)效的量、被他人改為暫不出售的量、被本人改為無(wú)效的量、被本人改為暫不出售的量作為特征向量,建立特征向量和虛假房源錄入行為概率之間的邏輯回歸模型,得到的預(yù)警模型如下式(1)所示:
logit(p)=θ0+θ1x1+θ2x2+θ3x3+θ4x4+θ5x5(1)
其中,logit(p)為預(yù)警值,x1,x2,x3,x4,x5分別為以預(yù)定時(shí)間段為周期記錄的舉報(bào)有效量、被他人改為無(wú)效的量、被他人改為暫不出售的量、被本人改為無(wú)效的量、被本人改為暫不出售的量的數(shù)值;θ0為截距,θ1,θ2,θ3,θ4,θ5為各特征向量與虛假房源錄入行為之間的關(guān)聯(lián)度系數(shù);
目標(biāo)預(yù)警模型確定模塊,基于獲取的各特征向量的數(shù)值和所對(duì)應(yīng)的識(shí)別標(biāo)簽值,對(duì)上述預(yù)警模型進(jìn)行邏輯回歸計(jì)算以得到各特征向量的回歸值,從而得到進(jìn)行預(yù)測(cè)的目標(biāo)預(yù)警模型:
預(yù)警管理模塊,在預(yù)定周期內(nèi),利用數(shù)據(jù)獲取模塊獲取的房源數(shù)據(jù)和確定的目標(biāo)預(yù)警模型來(lái)確定所獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人的虛假房源錄入行為的預(yù)警值。
可選地,當(dāng)以預(yù)定時(shí)間段為周期記錄的房源數(shù)據(jù)滿足下列預(yù)設(shè)條件的任一條件時(shí),判斷房產(chǎn)經(jīng)紀(jì)人存在虛假房源錄入行為:
(1)a≧5;
(2)b≧30;
(4)d≧10;
(5)y≧5且
可選地,所述預(yù)定時(shí)間段為7天。
可選地,通過極大似然估計(jì)方法來(lái)確定構(gòu)建的預(yù)警模型的各特征向量的回歸值,得到的目標(biāo)預(yù)警模型如下式(2)所示:
logit(p)=-4.463+1.261x1+0.16x2-0.157x3+0.162x4+0.955x5(2)。
可選地,當(dāng)預(yù)警值logit(p)大于0時(shí),將該房產(chǎn)經(jīng)紀(jì)人的預(yù)警標(biāo)簽標(biāo)注為預(yù)警狀態(tài);當(dāng)預(yù)警值logit(p)小于0時(shí),將該房產(chǎn)經(jīng)紀(jì)人的預(yù)警標(biāo)簽標(biāo)注為正常狀態(tài),如果該房產(chǎn)經(jīng)紀(jì)人的預(yù)警次數(shù)或者預(yù)警等級(jí)超過一定閾值,則對(duì)該房產(chǎn)經(jīng)紀(jì)人采取懲罰措施
可選地,按照預(yù)警值logit(p)的分布情況,按從低到高的順序設(shè)置10個(gè)預(yù)警等級(jí)p1,p2,p3,p4,p5,p6,p7,p8,p9,p10,如果房產(chǎn)經(jīng)紀(jì)人的預(yù)警等級(jí)連續(xù)3個(gè)月都為p10等級(jí),則對(duì)該房產(chǎn)經(jīng)紀(jì)人采取懲罰措施。
可選地,當(dāng)預(yù)警值logit(p)位于區(qū)間(0,200]時(shí),將預(yù)警等級(jí)設(shè)置為p1等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(200,400]時(shí),將預(yù)警等級(jí)設(shè)置為p2等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(400,600]時(shí),將預(yù)警等級(jí)設(shè)置為p3等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(600,800]時(shí),將預(yù)警等級(jí)設(shè)置為p4等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(800,1000]時(shí),將預(yù)警等級(jí)設(shè)置為p5等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(1000,2000]時(shí),將預(yù)警等級(jí)設(shè)置為p6等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(2000,4000]時(shí),將預(yù)警等級(jí)設(shè)置為p7等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(4000,6000]時(shí),將預(yù)警等級(jí)設(shè)置為p8等級(jí);當(dāng)預(yù)警值logit(p)位于區(qū)間(6000,9000]時(shí),將預(yù)警等級(jí)設(shè)置為p9等級(jí);當(dāng)預(yù)警值logit(p)大于9000時(shí),將預(yù)警等級(jí)設(shè)置為p10等級(jí)。
本發(fā)明提供的虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng)能夠?qū)Ψ慨a(chǎn)經(jīng)紀(jì)人是否錄入了虛假房源進(jìn)行識(shí)別,并能對(duì)該行為進(jìn)行預(yù)警,在預(yù)警值達(dá)到一定等級(jí)時(shí),對(duì)該經(jīng)紀(jì)人采取懲罰措施,以避免給用戶帶來(lái)不必要的麻煩和對(duì)同行業(yè)競(jìng)爭(zhēng)對(duì)手造成嚴(yán)重的影響,防止影響公司名譽(yù)和形象,從而避免不必要的經(jīng)濟(jì)損失,規(guī)范房產(chǎn)交易市場(chǎng)。
附圖說(shuō)明
圖1為本發(fā)明的虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。
圖1為本發(fā)明的虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng)的結(jié)構(gòu)示意圖。
如圖1所示,本發(fā)明提供的一種虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng),用于根據(jù)銷售房屋的公司的數(shù)據(jù)庫(kù)所采集的數(shù)據(jù)來(lái)構(gòu)建用于對(duì)房產(chǎn)經(jīng)紀(jì)人錄入虛假房源的行為進(jìn)行監(jiān)測(cè)的預(yù)警模型,從而可對(duì)房產(chǎn)經(jīng)紀(jì)人的行為進(jìn)行規(guī)范化管理,包括數(shù)據(jù)獲取模塊1、行為識(shí)別模塊2、預(yù)警模型構(gòu)建模塊3和目標(biāo)預(yù)警模型確定模塊。以下分別對(duì)這些模塊進(jìn)行詳細(xì)介紹。
【數(shù)據(jù)獲取模塊】
數(shù)據(jù)獲取模塊1用于獲取房源錄入總量i和銷售房源的如下信息:獲取以預(yù)定時(shí)間段為周期記錄的的房源錄入總量i和銷售房源的如下信息:舉報(bào)有效量y、被他人改為無(wú)效的量a、被他人改為暫不出售的量b、被本人改為無(wú)效的量c、被本人改為暫不出售的量d,其中本人是指與獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人,他人是指除該房產(chǎn)經(jīng)紀(jì)人之外的人。由于目前房產(chǎn)中介公司的房源狀態(tài)在后臺(tái)更改且被審核的周期最長(zhǎng)為7天,所以在發(fā)明的一示意性實(shí)施例中,可將預(yù)定時(shí)間段設(shè)置為7天,這樣可在后續(xù)預(yù)警模型的構(gòu)建中建立以7為時(shí)長(zhǎng)的變量,但并不局限于此。
在實(shí)際操作中,房產(chǎn)經(jīng)紀(jì)人通過房源展示系統(tǒng)中的電話系統(tǒng)和出售人進(jìn)行溝通,系統(tǒng)存下錄音,通過語(yǔ)音識(shí)別、自然語(yǔ)言處理等方法將該通話進(jìn)行標(biāo)簽標(biāo)注,如無(wú)人接聽、占線、暫不出售、無(wú)效等標(biāo)簽,然后系統(tǒng)存入數(shù)據(jù)庫(kù)。后臺(tái)數(shù)據(jù)庫(kù)中存有房源狀態(tài)被修改的時(shí)間日期以及修改人,通過簡(jiǎn)單的數(shù)據(jù)邏輯計(jì)算生成新的字段并保存新數(shù)據(jù)庫(kù)表:房源錄入總量、舉報(bào)有效量、被他人改為無(wú)效的量、被他人改為暫不出售的量、被本人改為無(wú)效的量、被本人改為暫不出售的量、虛假錄入狀態(tài)、預(yù)警值。
這樣,數(shù)據(jù)獲取模塊1可從后臺(tái)數(shù)據(jù)庫(kù)獲取某段時(shí)間的數(shù)據(jù)進(jìn)行行為識(shí)別和用于預(yù)警模型構(gòu)建,并且可在構(gòu)建預(yù)警模型之后按照預(yù)定周期,例如月末采集本月的房源數(shù)據(jù)來(lái)對(duì)房產(chǎn)經(jīng)紀(jì)人的房源錄入行為進(jìn)行管理。
【行為識(shí)別模塊】
行為識(shí)別模塊2用于將獲取的以預(yù)定時(shí)間段為周期記錄的房源數(shù)據(jù)與預(yù)設(shè)條件進(jìn)行對(duì)比,判斷與獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人是否存在虛假房源錄入行為,在判斷為存在虛假房源錄入行為的情況下,將該房產(chǎn)經(jīng)紀(jì)人的識(shí)別標(biāo)簽標(biāo)注為指示有虛假房源錄入行為值1,否則將識(shí)別標(biāo)簽標(biāo)注為值0。
具體地,當(dāng)以預(yù)定時(shí)間段為周期記錄的房源數(shù)據(jù)滿足下列預(yù)設(shè)條件的任一條件時(shí),即只要下述條件有一條得到滿足,則判斷房產(chǎn)經(jīng)紀(jì)人存在虛假房源錄入行為:
(1)被他人改為無(wú)效的量≧5,即a≧5;
(2)被他人改為暫不出售的量≧30,即b≧30;
(3)(被他人改為無(wú)效的量+被本人改為無(wú)效的量)/房源錄入總量≧10%,即
(4)被本人改為暫不出售的量≧10,即d≧10;
(5)舉報(bào)有效量≧5且舉報(bào)有效量/房源錄入總量≧10%,即y≧5且
在實(shí)際操作中,當(dāng)根據(jù)獲取的數(shù)據(jù)確認(rèn)某房產(chǎn)經(jīng)紀(jì)人存在虛假房源錄入行為時(shí),則在后臺(tái)數(shù)據(jù)庫(kù)中將該房產(chǎn)經(jīng)紀(jì)人的id進(jìn)行標(biāo)注。
【預(yù)警模型構(gòu)建模塊】
預(yù)警模型構(gòu)建模塊3用于選取數(shù)據(jù)獲取模塊1所獲取的舉報(bào)有效量y、被他人改為無(wú)效的量a、被他人改為暫不出售的量b、被本人改為無(wú)效的量c、被本人改為暫不出售的量d作為特征向量,建立特征向量和虛假房源錄入行為概率之間的邏輯回歸模型。
具體地,將房源數(shù)據(jù)的特征集合x作為邏輯回歸模型的獨(dú)立變量向量,x={x1,x2,x3,x4,x5},虛假房源錄入行為y作為邏輯回歸模型的因變量,取值為0或1,這樣,引入將回歸結(jié)果y二分化的激勵(lì)函數(shù)(sigmoid函數(shù))g(x),
不發(fā)生虛假房源錄入行為的概率函數(shù)為:
可得事件的發(fā)生比:
又因?yàn)?,h(x)=θ0+θ1x1+...+θnxn,所以對(duì)事件的發(fā)生比取對(duì)數(shù),得到線性函數(shù),即虛假房源錄入行為的預(yù)警模型如下式(1)所示:
logit(p)=θ0+θ1x1+θ2x2+θ3x3+θ4x4+θ5x5(1)
其中,logit(p)為虛假房源錄入行為概率優(yōu)勢(shì)比的對(duì)數(shù)值,又稱為預(yù)警值,預(yù)警值越大說(shuō)明與獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人的錄入虛假房源的行為次數(shù)越多,行為越惡劣;x1,x2,x3,x4,x5分別為預(yù)定時(shí)間段內(nèi)獲取的舉報(bào)有效量、被他人改為無(wú)效的量、被他人改為暫不出售的量、被本人改為無(wú)效的量、被本人改為暫不出售的量的數(shù)值,y為識(shí)別標(biāo)簽值,取值為0時(shí),表示不存在虛假房源錄入行為,取值為1時(shí),表示存在虛假房源錄入行為;θ0為截距,θ1,θ2,θ3,θ4,θ5為各特征向量與虛假房源錄入行為之間的關(guān)聯(lián)度系數(shù)。
【目標(biāo)預(yù)警模型確定模塊】
目標(biāo)預(yù)警模型確定模塊4基于獲取的各特征向量的數(shù)值和所對(duì)應(yīng)的識(shí)別標(biāo)簽值,對(duì)上述預(yù)警模型進(jìn)行邏輯回歸計(jì)算以得到各特征向量的回歸值,從而得到對(duì)虛假房源錄入行為進(jìn)行預(yù)測(cè)的目標(biāo)預(yù)警模型。
具體地,本發(fā)明利用極大似然估計(jì)方法來(lái)確定構(gòu)建的預(yù)警模型的各特征向量的回歸值?;谏鲜龉?1)構(gòu)建的似然函數(shù)如下述公式(2)所示:
對(duì)上述公式(3)所示的極大似然函數(shù)兩端求導(dǎo)得到其對(duì)數(shù)似然函數(shù),如下式(4)所示:
l(θ)=∑yi*logg(xi)+(1-yi)*log(1-g(xi))(3)
通過對(duì)上述公式(3)所示的對(duì)數(shù)似然函數(shù)的參數(shù)進(jìn)行求解,可得到預(yù)警模型的模型參數(shù),即回歸值,從而得到最終的目標(biāo)預(yù)測(cè)模型。
本發(fā)明采用梯度下降法來(lái)對(duì)最大似然函數(shù)的參數(shù)進(jìn)行求解,包括如下步驟:
(1)選擇梯度方向
(2)選擇下降步長(zhǎng)α,對(duì)參數(shù)進(jìn)行更新:
(3)重復(fù)以上步驟直至滿足停止條件。
其中,
在實(shí)際操作中,可通過計(jì)算機(jī)軟件如sas軟件來(lái)運(yùn)用獲取的舉報(bào)有效量、被他人改為無(wú)效的量、被他人改為暫不出售的量、被本人改為無(wú)效的量、被本人改為暫不出售的量的數(shù)值以及對(duì)應(yīng)的標(biāo)簽值來(lái)進(jìn)行回歸求得各特征向量的權(quán)重θ1,θ2,θ3,θ4,θ5。
【預(yù)警管理模塊】
預(yù)警管理模塊5用于在預(yù)定周期內(nèi),利用數(shù)據(jù)獲取模塊獲取的房源數(shù)據(jù)和得到的目標(biāo)預(yù)警模型來(lái)確定所獲取的房源數(shù)據(jù)所對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人的虛假房源錄入行為的預(yù)警值,當(dāng)預(yù)警值logit(p)大于0時(shí),將該房產(chǎn)經(jīng)紀(jì)人的預(yù)警標(biāo)簽標(biāo)注為預(yù)警狀態(tài);當(dāng)預(yù)警值logit(p)小于0時(shí),將該房產(chǎn)經(jīng)紀(jì)人的預(yù)警標(biāo)簽標(biāo)注為正常狀態(tài),如果該房產(chǎn)經(jīng)紀(jì)人的預(yù)警次數(shù)或者預(yù)警等級(jí)超過一定閾值,則對(duì)該房產(chǎn)經(jīng)紀(jì)人采取懲罰措施。例如,以一個(gè)月為周期,利用采集的房源數(shù)據(jù)和上述目標(biāo)預(yù)警模型可得到與房源數(shù)據(jù)相對(duì)應(yīng)的房產(chǎn)經(jīng)紀(jì)人的預(yù)警值,當(dāng)預(yù)警值logit(p)大于0時(shí),在后臺(tái)數(shù)據(jù)庫(kù)中將該房產(chǎn)經(jīng)紀(jì)人的id標(biāo)注為預(yù)警狀態(tài),當(dāng)預(yù)警值logit(p)小于0時(shí),標(biāo)注為正常狀態(tài),并按照預(yù)警值logit(p)的分布情況,按從低到高的順序設(shè)置10個(gè)預(yù)警等級(jí)p1,p2,p3,p4,p5,p6,p7,p8,p9,p10。如果根據(jù)某段時(shí)間的數(shù)據(jù)計(jì)算的預(yù)警值越大說(shuō)明此經(jīng)紀(jì)人錄入虛假房源的行為次數(shù)越多,行為越惡劣。如果房產(chǎn)經(jīng)紀(jì)人的預(yù)警次數(shù)或者預(yù)警等級(jí)超過一定閾值時(shí),則對(duì)該房產(chǎn)經(jīng)紀(jì)人采取懲罰措施,例如,如果一個(gè)經(jīng)紀(jì)人連續(xù)3個(gè)月的預(yù)警等級(jí)都為p10,則需要對(duì)其進(jìn)行嚴(yán)重懲罰,具體的處罰措施可根據(jù)實(shí)際情況來(lái)確定,例如可開除該經(jīng)紀(jì)人。具體地:
當(dāng)預(yù)警值logit(p)位于區(qū)間(0,200]時(shí),將預(yù)警等級(jí)設(shè)置為p1等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(200,400]時(shí),將預(yù)警等級(jí)設(shè)置為p2等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(400,600]時(shí),將預(yù)警等級(jí)設(shè)置為p3等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(600,800]時(shí),將預(yù)警等級(jí)設(shè)置為p4等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(800,1000]時(shí),將預(yù)警等級(jí)設(shè)置為p5等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(1000,2000]時(shí),將預(yù)警等級(jí)設(shè)置為p6等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(2000,4000]時(shí),將預(yù)警等級(jí)設(shè)置為p7等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(4000,6000]時(shí),將預(yù)警等級(jí)設(shè)置為p8等級(jí);
當(dāng)預(yù)警值logit(p)位于區(qū)間(6000,9000]時(shí),將預(yù)警等級(jí)設(shè)置為p9等級(jí);
當(dāng)預(yù)警值logit(p)大于9000時(shí),將預(yù)警等級(jí)設(shè)置為p10等級(jí)。
【實(shí)施例】
本發(fā)明以某大型房產(chǎn)中介公司的后臺(tái)數(shù)據(jù)庫(kù)所記錄的數(shù)據(jù)為例,對(duì)本發(fā)明的虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng)進(jìn)行說(shuō)明。
在本實(shí)施例的目標(biāo)預(yù)警模型的確定中,使用該大型房產(chǎn)中介公司的2015年1月到2016年2月份所統(tǒng)計(jì)的北京、南京、上海、深圳、蘇州、天津、武漢、長(zhǎng)春、重慶等9個(gè)重點(diǎn)城市的48986條數(shù)據(jù)作為樣本數(shù)據(jù),如下表1所示。
表1:房源數(shù)據(jù)記錄表
利用表1記錄的數(shù)據(jù),運(yùn)用梯度下降法對(duì)構(gòu)建的預(yù)測(cè)模型進(jìn)行參數(shù)求解,迭代次數(shù)為11次,步長(zhǎng)為1,得到的回歸結(jié)果如下表2所示:
表2:回歸結(jié)果
方程式中的變量
a.步驟1:[%]:,1:
由此可得到進(jìn)行預(yù)測(cè)的目標(biāo)預(yù)警模型如下式(4)所示:
logit(p)=-4.463+1.261x1+0.16x2-0.157x3+0.162x4+0.955x5(4)。
此外,由表2可知,本實(shí)施例建立的目標(biāo)預(yù)警模型的顯著性檢驗(yàn)效果非常好,從而說(shuō)明根據(jù)本發(fā)明提供的虛假房源錄入行為識(shí)別與預(yù)警系統(tǒng)所建立的目標(biāo)預(yù)警模型非常合理。
以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。