本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種常住地確定方法和裝置。
背景技術(shù):
1、旅客常住地的確定對(duì)于民航企業(yè)向旅客提供針對(duì)性服務(wù)和個(gè)性化產(chǎn)品設(shè)計(jì)十分重要。
2、目前,確定旅客常住地的常用方法是在旅客進(jìn)行航班出行的事件操作時(shí),使用埋點(diǎn)分析方法獲取到旅客的經(jīng)緯信息,并利用預(yù)設(shè)的地圖庫(kù)對(duì)經(jīng)緯信息進(jìn)行地址匹配,然后將得到的地址信息作為旅客的常住地。
3、然而,上述方法在確定旅客常住地時(shí),首先需要獲取到旅客諸如經(jīng)緯信息的全量位置信息,若無(wú)法獲取旅客全量位置信息,就無(wú)法確定旅客常住地。并且,根據(jù)經(jīng)緯信息確定旅客常住地屬于一種單線程邏輯,沒(méi)有綜合考慮各種因素,缺乏業(yè)務(wù)支持,不能適配不同應(yīng)用場(chǎng)景,使得根據(jù)經(jīng)緯信息確定的地址可能并非旅客的常住地,而是旅客的差旅地,進(jìn)而導(dǎo)致確定的旅客常住地結(jié)果不準(zhǔn)確。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種常住地確定方法和裝置,用以解決現(xiàn)有技術(shù)中在無(wú)法獲取旅客經(jīng)緯信息時(shí)就無(wú)法確定旅客常住地,以及僅根據(jù)經(jīng)緯信息確定旅客常住地導(dǎo)致結(jié)果不準(zhǔn)確的缺陷,以在無(wú)需獲取旅客全量位置信息的情況下,也能準(zhǔn)確確定旅客常住地。
2、第一方面,本發(fā)明提供一種常住地確定方法,包括:
3、根據(jù)旅客的航班出行記錄,分別從多個(gè)維度對(duì)所述旅客的常住地進(jìn)行分析,得到所述旅客的常住地多維度判定結(jié)果;
4、基于所述常住地多維度判定結(jié)果,確定所述旅客的常住地;
5、所述常住地多維度判定結(jié)果,包括飛行次數(shù)判定結(jié)果、節(jié)假日判定結(jié)果、差旅判定結(jié)果、停留時(shí)長(zhǎng)判定結(jié)果或身份證判定結(jié)果中的多項(xiàng)。
6、根據(jù)本發(fā)明提供的一種常住地確定方法,在所述常住地多維度判定結(jié)果包括所述飛行次數(shù)判定結(jié)果的情況下,所述飛行次數(shù)判定結(jié)果是基于以下方式確定的:
7、根據(jù)所述航班出行記錄,確定各出發(fā)城市及其對(duì)應(yīng)的出發(fā)次數(shù),以及各到達(dá)城市及其對(duì)應(yīng)的到達(dá)次數(shù);
8、將所有所述出發(fā)城市和所有所述到達(dá)城市均作為候選常住地,構(gòu)建第一候選常住地集合;
9、確定所述第一候選常住地集合中的每一所述候選常住地被判斷為常住地的置信度,作為所述飛行次數(shù)判定結(jié)果;
10、每一所述候選常住地被判斷為常住地的置信度,是根據(jù)所述候選常住地的飛行次數(shù)和總飛行次數(shù)確定的,所述飛行次數(shù)是根據(jù)所述候選常住地的出發(fā)次數(shù)和到達(dá)次數(shù)確定的,所述總飛行次數(shù)是根據(jù)總出發(fā)次數(shù)和總到達(dá)次數(shù)確定的。
11、根據(jù)本發(fā)明提供的一種常住地確定方法,在所述常住地多維度判定結(jié)果包括所述節(jié)假日判定結(jié)果的情況下,所述節(jié)假日判定結(jié)果是基于以下方式確定的:
12、獲取旅客在各個(gè)節(jié)假日時(shí)間段的第一航班出行記錄,所述各個(gè)節(jié)假日時(shí)間段是根據(jù)從第三方數(shù)據(jù)庫(kù)中預(yù)先調(diào)取的節(jié)假日時(shí)間段數(shù)據(jù)集確定的;
13、根據(jù)所述第一航班出行記錄,確定各首次航班出發(fā)城市及其對(duì)應(yīng)的首次航班出發(fā)次數(shù),確定各末次航班到達(dá)城市及其對(duì)應(yīng)的末次航班到達(dá)次數(shù);
14、將所有所述首次航班出發(fā)城市和所有所述末次航班到達(dá)城市作為候選常住地,構(gòu)建第二候選常住地集合;
15、確定所述第二候選常住地集合中的每一所述候選常住地被判斷為常住地的置信度,作為所述節(jié)假日判定結(jié)果;
16、每一所述候選常住地被判斷為常住地的置信度,是根據(jù)所述候選常住地的節(jié)假日飛行次數(shù)和總節(jié)假日飛行次數(shù)確定的,所述節(jié)假日飛行次數(shù)是根據(jù)所述候選常住地的首次航班出發(fā)次數(shù)和末次航班到達(dá)次數(shù)確定的,所述總節(jié)假日飛行次數(shù)是根據(jù)總首次航班出發(fā)次數(shù)和總末次航班到達(dá)次數(shù)確定的;
17、所述首次航班出發(fā)城市是旅客在節(jié)假日時(shí)間段的前半段的首次航班記錄中的出發(fā)城市,所述末次航班到達(dá)城市是旅客在節(jié)假日時(shí)間段的后半段的末次航班記錄中的到達(dá)城市。
18、根據(jù)本發(fā)明提供的一種常住地確定方法,根據(jù)旅客在航班出行時(shí)的年齡,判斷旅客是否為學(xué)生;
19、若旅客為學(xué)生,將所述節(jié)假日時(shí)間段確定為學(xué)生節(jié)假日時(shí)間段。
20、根據(jù)本發(fā)明提供的一種常住地確定方法,在所述常住地多維度判定結(jié)果包括差旅判定結(jié)果的情況下,所述差旅判定結(jié)果是基于以下方式確定的:
21、獲取旅客在非節(jié)假日時(shí)間段的第二航班出行記錄;
22、從所述第二航班出行記錄中,確定首次差旅航班和/或末次差旅航班滿足折扣率條件的連續(xù)差旅行程;所述連續(xù)差旅行程是旅客在差旅地停留時(shí)長(zhǎng)小于預(yù)設(shè)時(shí)長(zhǎng)的連續(xù)行程;
23、根據(jù)所述連續(xù)差旅行程,確定各首次差旅出發(fā)城市及其對(duì)應(yīng)的首次差旅出發(fā)次數(shù),確定各末次差旅到達(dá)城市及其對(duì)應(yīng)的末次差旅到達(dá)次數(shù);
24、將所有所述首次差旅出發(fā)城市和所有所述末次差旅到達(dá)城市作為候選常住地,構(gòu)建第三候選常住地集合;
25、確定所述第三候選常住地集合中的每一所述候選常住地被判斷為常住地的置信度,作為所述差旅判定結(jié)果;
26、每一所述候選常住地被判斷為常住地的置信度,是根據(jù)所述候選常住地的差旅飛行次數(shù)和總差旅飛行次數(shù)確定的,所述差旅飛行次數(shù)是根據(jù)所述候選常住地的首次差旅出發(fā)次數(shù)和末次差旅到達(dá)次數(shù)確定的,所述總差旅飛行次數(shù)是根據(jù)總首次差旅出發(fā)次數(shù)和總末次差旅到達(dá)次數(shù)確定的。
27、根據(jù)本發(fā)明提供的一種常住地確定方法,在所述常住地多維度判定結(jié)果包括停留時(shí)長(zhǎng)判定結(jié)果的情況下,所述停留時(shí)長(zhǎng)判定結(jié)果是基于以下方式確定的:
28、根據(jù)所述航班出行記錄,確定旅客在每個(gè)到達(dá)城市的有效停留時(shí)長(zhǎng);
29、將所有所述到達(dá)城市作為候選常住地,構(gòu)建第四候選常住地集合;
30、確定所述第四候選常住地集合中的每一所述候選常住地被判斷為常住地的置信度,作為所述停留時(shí)長(zhǎng)判定結(jié)果;
31、每一所述候選常住地被判斷為常住地的置信度,是根據(jù)所述候選常住地的所述有效停留時(shí)長(zhǎng)與總有效停留時(shí)長(zhǎng)確定的,所述總有效停留時(shí)長(zhǎng)是所有所述候選常住地的有效停留時(shí)長(zhǎng)之和。
32、根據(jù)本發(fā)明提供的一種常住地確定方法,所述基于所述常住地多維度判定結(jié)果,確定所述旅客的常住地,包括:
33、根據(jù)每項(xiàng)常住地多維度判定結(jié)果及其對(duì)應(yīng)的概率權(quán)重,對(duì)每個(gè)候選常住地的置信度進(jìn)行加權(quán)求和,得到每個(gè)候選常住地的綜合置信度;所述概率權(quán)重是根據(jù)權(quán)重系數(shù)和梯度系數(shù)的乘積確定的;
34、確定所述旅客的常住地,所述常住地是所述綜合置信度最大的候選常住地;
35、所述權(quán)重系數(shù)是基于多個(gè)樣本常住地多維度判定結(jié)果及其對(duì)應(yīng)的常住地標(biāo)簽訓(xùn)練得到的。
36、根據(jù)本發(fā)明提供的一種常住地確定方法,將所述飛行次數(shù)判定結(jié)果和所述節(jié)假日判定結(jié)果對(duì)應(yīng)的梯度系數(shù)均設(shè)置為第一梯度系數(shù);將所述差旅判定結(jié)果和所述停留時(shí)長(zhǎng)判定結(jié)果對(duì)應(yīng)的梯度系數(shù)設(shè)置為第二梯度系數(shù);將所述身份證判定結(jié)果對(duì)應(yīng)的梯度系數(shù)設(shè)置為第三梯度系數(shù);
37、所述第一梯度系數(shù)大于所述第二梯度系數(shù),所述第二梯度系數(shù)大于所述第三梯度系數(shù)。
38、根據(jù)本發(fā)明提供的一種常住地確定方法,在根據(jù)每項(xiàng)常住地多維度判定結(jié)果及其對(duì)應(yīng)的概率權(quán)重,對(duì)每個(gè)候選常住地的置信度進(jìn)行加權(quán)求和之后,還包括:
39、計(jì)算總置信度,所述總置信度是所有候選常住地的綜合置信度之和;
40、對(duì)于任一候選常住地,根據(jù)所述候選常住地的綜合置信度和所述總置信度的比值,確定所述候選常住地的新的綜合置信度,以實(shí)現(xiàn)置信度歸一化處理。
41、第二方面,本發(fā)明還提供一種常住地確定裝置,包括:
42、多維度判定單元,用于根據(jù)旅客的航班出行記錄,分別從多個(gè)維度對(duì)所述旅客的常住地進(jìn)行分析,得到所述旅客的常住地多維度判定結(jié)果;
43、常住地確定單元,用于基于所述常住地多維度判定結(jié)果,確定所述旅客的常住地;
44、所述常住地多維度判定結(jié)果,包括飛行次數(shù)判定結(jié)果、節(jié)假日判定結(jié)果、差旅判定結(jié)果、停留時(shí)長(zhǎng)判定結(jié)果或身份證判定結(jié)果中的多項(xiàng)。
45、本發(fā)明提供的常住地確定方法和裝置,綜合考慮了各種因素和業(yè)務(wù)特性,通過(guò)對(duì)旅客的航班出行記錄進(jìn)行飛行次數(shù)判定、節(jié)假日判定、差旅判定、停留時(shí)長(zhǎng)判定或身份證判定這五項(xiàng)維度分析中的至少兩項(xiàng)分析,能夠適配不同的應(yīng)用場(chǎng)景,并利用可能作為旅客常住地的城市及對(duì)應(yīng)置信度結(jié)果最終確定旅客的常住地,能夠在無(wú)需獲取旅客全量位置信息的情況下,準(zhǔn)確確定旅客常住地。