合 歸一化處理。比如從互聯(lián)網(wǎng)抓取了大量酒店數(shù)據(jù),但是由于從不同網(wǎng)站抓取到的酒店數(shù)據(jù) 的描述可能不一致,因此,需要對酒店數(shù)據(jù)的內(nèi)容進(jìn)行對比、去重處理。假如某個酒店在某 個網(wǎng)站中的名稱為A,而在另一個網(wǎng)站中的名稱為B,則需要對這兩個酒店數(shù)據(jù)進(jìn)行融合歸 一化處理。例如,可以根據(jù)酒店坐標(biāo)、酒店電話、酒店地址等信息判斷A與B是否為同一個 酒店,若是,則可以合并這兩個酒店數(shù)據(jù)。
[0054] 此外,由于從不同網(wǎng)站抓取到數(shù)據(jù)的數(shù)據(jù)格式也可能不一致,因此,需要對通過不 同渠道獲取的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,以得到統(tǒng)一的第一結(jié)構(gòu)化數(shù)據(jù)。比如從不同網(wǎng)站抓取到 大量的游記,但是格式各不相同,因此需要將該大量的游記整理成統(tǒng)一的格式,以得到統(tǒng)一 的第一結(jié)構(gòu)化數(shù)據(jù),例如,該第一結(jié)構(gòu)化數(shù)據(jù)具體可以包括以下內(nèi)容:標(biāo)題、目的地、人數(shù)、 景點(diǎn)順序、每個景點(diǎn)評價、每個景點(diǎn)的圖片等等。當(dāng)然,本發(fā)明對于上述第一結(jié)構(gòu)化數(shù)據(jù)的 具體結(jié)構(gòu)不加以限制。
[0055] 步驟S13、依據(jù)上述第一結(jié)構(gòu)化數(shù)據(jù),建立城市標(biāo)識信息與城市基礎(chǔ)特征信息之間 的映射關(guān)系。
[0056] 可以理解,可以依據(jù)不斷獲取的城市基礎(chǔ)特征信息對上述旅游實體數(shù)據(jù)庫進(jìn)行更 新和維護(hù)。
[0057] 參見表1,示出了本發(fā)明的一種旅游實體數(shù)據(jù)庫的數(shù)據(jù)記錄的結(jié)構(gòu)示意。具體可以 包括:城市名稱,及該城市名稱對應(yīng)的熱門程度、推薦游覽天數(shù)、所屬國家、特色標(biāo)簽、特定 活動等城市基礎(chǔ)特征信息。在查找過程中,可以將符合所述行程城市信息的行程順序中的 單個行程城市與表1中"城市名稱"進(jìn)行匹配,以得到單個行程城市相匹配的城市基礎(chǔ)特征 信息。
[0058] 表 1
[0059]
[0060] 參見表2,示出了本發(fā)明的另一種旅游實體數(shù)據(jù)庫的數(shù)據(jù)記錄的結(jié)構(gòu)示意,其具體 可以包括:城市對名稱、及該城市對名稱對應(yīng)的兩兩城市間的城市基礎(chǔ)特征信息:飛機(jī)平 均價格、飛機(jī)平均時間、火車平均價格、火車平均時間等。則在查找過程中,可以將符合所述 行程城市信息的行程順序中相鄰行程城市的組合與表2中"城市對名稱"進(jìn)行匹配,以得到 相鄰行程城市的組合相匹配的城市基礎(chǔ)特征信息。
[0061] 表 2
[0062]
[0063] 基于上述城市基礎(chǔ)特征信息,上述方案A1中的城市基礎(chǔ)特征信息具體可以包括 如下信息中的至少一種:
[0064] 城市基礎(chǔ)特征信息中兩兩城市之間的交通信息,和/或
[0065] 城市基礎(chǔ)特征信息中兩兩城市之間的距離信息,和/或
[0066] 城市基礎(chǔ)特征信息中所屬國家信息。
[0067] 1)在具體實現(xiàn)中,可以針對T種行程順序中每一種,按照從前往后的順序遍歷其 中的相鄰行程城市,并根據(jù)兩兩城市之間的交通信息,例如交通便利程度等對每一種行程 順序進(jìn)行評價計算得分。具體地,可以為不同的交通工具設(shè)置不同的便利系數(shù),假設(shè)飛機(jī)為 〇. 8、高鐵為0. 7、火車為0. 5、輪船為0. 4等等,將各行程順序的得分乘以便利系數(shù)得到的得 分,可以反映出各行程順序的便利程度。當(dāng)然,在實際應(yīng)用中,還可以根據(jù)不同的交通信息 對行程順序進(jìn)行評價計算得分,例如,還可以使得交通時間越長的得分越低等,本發(fā)明對于 根據(jù)兩兩城市之間的交通信息對行程順序進(jìn)行評價計算得分具體計算方式不加以限制。
[0068] 2)在具體實現(xiàn)中,可以針對T種行程順序中每一種,按照從前往后的順序遍歷其 中的相鄰行程城市,并根據(jù)兩兩城市之間的距離信息,對每一種行程順序進(jìn)行評價計算得 分。具體地,在評價行程順序的過程中,兩兩城市之間的距離越大的行程順序,得分越低,反 之,則得分越高。這樣一來,可以使得行程距離較短的行程順序具有較高得分,以節(jié)省用戶 在旅行中花費(fèi)的時間和精力。
[0069] 3)在具體實現(xiàn)中,可以針對T種行程順序中每一種,按照從前往后的順序遍歷其 中的相鄰行程城市,并根據(jù)城市基礎(chǔ)特征信息中所屬國家信息,對每一種行程順序進(jìn)行評 價計算得分。
[0070] 在行程順序中,行程城市的所屬國家信息變化一次則可以認(rèn)為產(chǎn)生了一次跨境。 則在具體實現(xiàn)中,可以根據(jù)行程請求對應(yīng)的國家數(shù)目確定上述跨境次數(shù),可以根據(jù)跨境次 數(shù)對每一種行程順序進(jìn)行評價計算得分。例如,跨境次數(shù)越少則得分越高。由此,使得跨 境次數(shù)較少的行程順序的得分可以排在前面,以節(jié)省旅行時間以及減少跨境手續(xù)的辦理等 等。
[0071] 例如,在上述應(yīng)用示例1中,行程請求對應(yīng)2個國家6個城市,行程順序1 "巴黎、 普羅旺斯、尼斯、威尼斯、羅馬、那不勒斯"對應(yīng)的跨境次數(shù)為2,而行程順序2 "巴黎、威尼 斯、普羅旺斯、尼斯、羅馬、那不勒斯"對應(yīng)的跨境次數(shù)為3,則根據(jù)跨境次數(shù)對上述兩個行程 順序進(jìn)行評價計算得分時,行程順序1的得分高于行程順序2的得分。
[0072] 在本發(fā)明的一種優(yōu)選實施例中,在用戶輸入行程請求時,還可以指定用戶偏好,例 如用戶對時裝感興趣,則本發(fā)明實施例還可以根據(jù)城市基礎(chǔ)特征信息中特定活動信息,對 每一種行程順序進(jìn)行評價計算得分。
[0073] 以表1為例,特定活動"巴黎時裝周"對應(yīng)的時間范圍為2月1日~3月31日,則 將可以將符合該活動日期的行程順序賦予較高得分,上述應(yīng)用示例1中行程請求的出發(fā)日 期為3月28日,不在該活動的日期內(nèi),因此,該行程順序的得分較低。
[0074] 以上對利用城市基礎(chǔ)特征信息對所有符合所述行程城市信息的行程順序進(jìn)行過 濾的技術(shù)方案進(jìn)行了詳細(xì)介紹,可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)實際需要采用上述技 術(shù)方案中的一種或者多種,或者,還可以采用其它技術(shù)方案,如利用熱門程度等城市基礎(chǔ)特 征信息對所有符合所述行程城市信息的行程順序進(jìn)行過濾等,本發(fā)明實施例對于利用城市 基礎(chǔ)特征信息對所有符合所述行程城市信息的行程順序進(jìn)行過濾的具體技術(shù)方案不加以 限制。
[0075] 方案A2
[0076] 方案A2給出了利用旅游行為特征信息這一種信息,對所述行程城市信息對應(yīng)的 所有行程順序進(jìn)行評價得到相應(yīng)的評價得分的具體過程。
[0077] 本發(fā)明實施例中,所述旅游行為特征信息可用于反映用戶的旅游行為習(xí)慣,使得 依據(jù)旅游行為特征信息確定的行程順序能夠更加符合用戶的行為習(xí)慣。
[0078] 在本發(fā)明的一種優(yōu)選實施例中,可以建立旅游行為數(shù)據(jù)庫;所述旅游行為數(shù)據(jù)庫 中可以存儲有歷史行程城市信息與旅游行為特征信息之間的映射關(guān)系。這樣,在具體實現(xiàn) 中,可以依據(jù)所述行程城市信息,在上述所述旅游實體數(shù)據(jù)庫中進(jìn)行查找,以得到與所述行 程城市信息相匹配的旅游行為特征信息。
[0079] 參見表3,示出了本發(fā)明的一種旅游行為數(shù)據(jù)庫的數(shù)據(jù)記錄的結(jié)構(gòu)示意,其具體可 以包括歷史行程城市信息、及對應(yīng)的旅游行為特征信息,其中,上述旅游行為特征信息具體 可以包括:歷史行程時間、歷史行程風(fēng)格、用戶偏好、歷史行程順序及對應(yīng)的使用頻率等信 息。
[0080] 表 3
[0081]
_________________________________________________________________________________________________________________________________________________________________________________________________________________________j
[0082] 在本發(fā)明的一種優(yōu)選實施例中,可以通過如下步驟建立所述旅游行為數(shù)據(jù)庫:
[0083] 步驟S21、從互聯(lián)網(wǎng)抓取游記數(shù)據(jù);
[0084] 步驟S22、對所述游記數(shù)據(jù)進(jìn)行融合歸一化處理,生成統(tǒng)一的第二結(jié)構(gòu)化數(shù)據(jù);
[0085] 步驟S23、依據(jù)上述第二結(jié)構(gòu)化數(shù)據(jù),建立歷史行程城市信息與旅游行為特征信息 之間的映射關(guān)系;
[0086] 步驟S24、依據(jù)用戶對行程方案(第一行程方案和/或第二行程方案等)的調(diào)整數(shù) 據(jù)信息,更新所述旅游行為數(shù)據(jù)庫。
[0087] 在具體應(yīng)用中,所述旅游行為數(shù)據(jù)庫可以包括兩方面的數(shù)據(jù)來源。一方面可以從 互聯(lián)網(wǎng)抓取大量的游記數(shù)據(jù),通過分析游記數(shù)據(jù),抽取其中的關(guān)鍵信息(如歷史行程順序 及對應(yīng)的使用頻率、旅行季節(jié)和時間、機(jī)票酒店價格、整體旅行風(fēng)格等等)作為上述旅游行 為特征信息。
[0088] 另一方面,可以通過分析大量用戶的調(diào)整數(shù)據(jù)信息,得到用戶在特定條件(特定 行程、用戶偏好等等)下使用的行程順序、酒店和機(jī)票等信息,可以依據(jù)所述調(diào)整數(shù)據(jù)信 息,優(yōu)化更新所述旅游行為數(shù)據(jù)庫。
[0089] 可以理解,上述旅游行為特征信息只是作為示例,本領(lǐng)域技術(shù)人員可以根據(jù)實際 需要獲取不同內(nèi)容的旅游行為特征信息,本發(fā)明實施例對于旅游行為特征信息的具體內(nèi)容 不加以限制。
[0090] 基于上述旅游行為特征信息,上述方案A2具體可以包括如下步驟:
[0091] 依據(jù)所述旅游行為特征信息中歷史行程順序及對應(yīng)的使用頻率,確定所有符合所 述行程城市信息的行程順序的使用頻率,并依據(jù)所述行程順序的使用頻率對所述行程城市 信息對應(yīng)的所有行程順序進(jìn)行評價得到相應(yīng)的評價得分。
[0092] 在本發(fā)明的一種應(yīng)用示例中,假設(shè)行程城市信息具體可以包括巴黎、里昂、普羅旺 斯,則可以在表3中查找得到對應(yīng)行程順序的使用頻率,如"巴黎-里昂-普羅旺斯"的使 用頻率為80%,"普羅旺斯-里昂-巴黎"的使用頻率為8%等,因此,可以在評價得分時,對 上述兩種順序的得分分別乘以對應(yīng)的使用頻率,則使用頻率高的行程順序可以具有較高得 分。當(dāng)然,上述乘以使用頻率僅僅作為計算得分的一種示例,本領(lǐng)域技術(shù)人員可以根據(jù)實際 需要選擇適合的計算方式,本發(fā)明對行程順序進(jìn)行評價計算得分的具體方式不加以限制。
[0093]方案A3
[0094] 方案A3給出了城市實時特征信息這一種信息,對所述行程城市信息對應(yīng)的所有 行程順序進(jìn)行評價得到相應(yīng)的評價得分的具體過程。
[0095] 本發(fā)明實施例中,相對于城市基礎(chǔ)特征信息可表示固定不變的一些基本信息,所 述城市實時特征信息可用于反映城市的實時狀況,使得依據(jù)城市實時特征信息確定的行程 順序能夠更加符合城市的實時狀況。
[0096] 在具體應(yīng)用中,實時狀況可以表示動態(tài)變化的信息,如當(dāng)前的實時天氣、航班的實 時價格、酒店的剩余床位等信息。從而,所述實時數(shù)據(jù)信息具體可以包括:單個城市的城市 實時特征信息和/或兩兩城市間的城市實時特征信息;其中,所述單個城市的城市實時特 征信息具體可以包括:實時天氣信息、實時酒店信息(房型對應(yīng)價格,剩余床位等)等信息; 上述兩兩城市間的城市實時特征信息具體可以包括:兩兩城市的實時交通信息(如價格, 剩余票數(shù),數(shù)據(jù)來源等)等等??梢岳斫?,上述城市實時特征信息只是作為城市實時特征信 息的一種示例,本領(lǐng)域技術(shù)人員可以根據(jù)實際需要采用不同內(nèi)容的城市實時特征信息,本 發(fā)明實施例對于城市實時特征信息的具體內(nèi)容不加以限制。
[0097] 在本發(fā)明的一種優(yōu)選實施例中,可以建立旅游實時數(shù)據(jù)庫,該旅游實時數(shù)據(jù)庫中 可以存儲有城市標(biāo)識信息與城市實時特征信息之間的映射關(guān)系。這樣,在具體實現(xiàn)中,可以 依據(jù)符合所述行程城市信息的行程順序中的單個行程城市或者相鄰行程城市的組合,在上 述所述旅游實時數(shù)據(jù)庫中進(jìn)行查找,以得到與單個行程城市或者行程城市的組合相匹配的 城市實時特征信息。
[0098] 在本發(fā)明的一種實施例中,可以通過如下步驟建立所述旅游實時數(shù)據(jù)庫:通過互 聯(lián)網(wǎng)抓取和計算,得到城市之間的實時交通價格信息和票源數(shù)據(jù)信息,以及各個城市的酒 店房型信息和實時價格信息,城市標(biāo)識信息與城市實時特征信息之間的映射關(guān)系。其中,對 于旅游實時數(shù)據(jù)庫的數(shù)據(jù)來源,并不局限于互聯(lián)網(wǎng)抓取,也可以是〇TA(在線旅游社,Online TravelAgen)或者第三方的合作數(shù)據(jù)等。
[0099] 參見表