基于旅游目標(biāo)地域來挖掘旅游路線的方法和設(shè)備的制作方法
【專利摘要】本發(fā)明公開了一種基于旅游目標(biāo)地域來挖掘旅游路線的方法和設(shè)備。旅游路線以景點(diǎn)序列的形式表示。該方法包括:檢索涉及旅游目標(biāo)地域的旅游文章;針對(duì)各篇旅游文章,分別獲得由其中包含的景點(diǎn)構(gòu)成的景點(diǎn)序列;篩選包含一個(gè)或多個(gè)特定景點(diǎn)的景點(diǎn)序列,作為針對(duì)旅游目標(biāo)地域的備選景點(diǎn)序列(可以推薦給用戶的旅游線路)。通過本發(fā)明的方法和設(shè)備,可以從互聯(lián)網(wǎng)上海量的旅游文章中獲取由于大量用戶采用而值得向用戶推薦的旅游線路。
【專利說明】基于旅游目標(biāo)地域來挖掘旅游路線的方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別涉及基于旅游目標(biāo)地域來挖掘旅游路線的方法和設(shè) 備。
【背景技術(shù)】
[0002] 人們對(duì)于旅游的需求已經(jīng)不能滿足于跟隨旅行團(tuán)的出游。與跟團(tuán)游的諸多限制相 t匕,人們更加喜歡自己設(shè)計(jì)旅行路線,然后自由出行。
[0003] -些旅游網(wǎng)站采集了大量旅游景點(diǎn)的信息,并且自行設(shè)計(jì)了一些旅游路線。用戶 可以在網(wǎng)站上輸入一些條件,例如希望旅游的景點(diǎn)、出游時(shí)間等,然后在網(wǎng)站的協(xié)助下,設(shè) 計(jì)旅游路線。
[0004] 但是,一方面,這些旅游景點(diǎn)信息的收集和整理以及旅游路線的預(yù)先設(shè)計(jì)需要大 量人工;另一方面,這里人為設(shè)定的一些參數(shù)(例如景點(diǎn)熱門程度、推薦指數(shù)等)是基于工 作人員的經(jīng)驗(yàn)和感受設(shè)置的,有可能偏離實(shí)際游客的經(jīng)驗(yàn)和感受。
[0005] 因此,人們會(huì)更多的通過搜索引擎來搜索前人在網(wǎng)上提供的旅游信息,例如游記、 旅游攻略等,當(dāng)然也包括旅游網(wǎng)站上提供的相關(guān)信息(可以統(tǒng)稱為"旅游文章")。人們期 望通過瀏覽所檢索到的相關(guān)網(wǎng)頁或文章來確定自己的旅游路線。
[0006] 事實(shí)上,在搜索引擎中,用戶對(duì)于旅游的搜索需求也的確占據(jù)了一個(gè)很大的比例。 然而,在這個(gè)信息爆炸的時(shí)代,即便是通過使用搜索引擎,所能得到的旅游文章也很繁雜。 用戶需要大量的閱讀和再加工,才能確定旅游路線。這將是費(fèi)時(shí)費(fèi)力的。
[0007] 從搜索查尋(Query)分析看,有的用戶是針對(duì)某個(gè)景點(diǎn)的旅游需求,例如:用戶搜 索"西湖旅游";有的用戶是針對(duì)某個(gè)城市的旅游需求,例如:用戶搜索"杭州旅游"。這一類 可以算用戶對(duì)于要游玩的目的(或者說,"旅游目標(biāo)地域")是非常明確的。
[0008] 傳統(tǒng)搜索引擎通過提供聚合結(jié)構(gòu)化數(shù)據(jù),可以滿足用戶的常規(guī)需求,例如:對(duì)于某 個(gè)景點(diǎn)和某個(gè)城市的旅游需求,傳統(tǒng)搜索引擎通過一些結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行組織表達(dá),基本 可以達(dá)到能讓用戶更便捷獲取信息的目的。但是這些結(jié)構(gòu)化數(shù)據(jù)對(duì)于用戶來說仍然有較大 的使用成本,用戶旅游在進(jìn)行行程挖掘時(shí),需要從搜索引擎提供的成百上千條攻略游記中 自行歸納和整理,這并不能很好的滿足用戶的需求。
[0009] 因此,仍需要一種能夠?yàn)橛脩敉扑]高質(zhì)量的旅游線路的方法和設(shè)備
【發(fā)明內(nèi)容】
[0010] 本發(fā)明所要解決的一個(gè)技術(shù)問題是提供一種基于旅游目標(biāo)地域來挖掘旅游路線 的方法和設(shè)備,其能夠自行挖掘分析高質(zhì)量的旅游線路。在本公開的上下文中,旅游路線以 景點(diǎn)序列的形式表示。
[0011] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于旅游目標(biāo)地域來挖掘旅游路線的方法, 旅游路線以景點(diǎn)序列的形式表示,該方法包括:檢索涉及旅游目標(biāo)地域的旅游文章;針對(duì) 各篇旅游文章,分別獲得由其中包含的景點(diǎn)構(gòu)成的景點(diǎn)序列;篩選包含一個(gè)或多個(gè)特定景 點(diǎn)的景點(diǎn)序列,作為針對(duì)旅游目標(biāo)地域的備選景點(diǎn)序列。備選景點(diǎn)序列可以作為能夠推薦 給用戶的旅游線路。
[0012] 通過本發(fā)明的方法,可以從互聯(lián)網(wǎng)上海量的旅游文章中獲取由于大量用戶采用而 值得向用戶推薦的旅游線路(備選景點(diǎn)序列)。
[0013] 優(yōu)選地,該方法還可以包括:根據(jù)預(yù)定序列評(píng)分規(guī)則,為每個(gè)備選景點(diǎn)序列設(shè)置景 點(diǎn)序列分值,并且按景點(diǎn)序列分值從高到低的順序?qū)⒍鄠€(gè)所述備選景點(diǎn)序列排序,以便響 應(yīng)于來自客戶端的請(qǐng)求而按此順序提供給客戶端。
[0014] 通過為每個(gè)備選景點(diǎn)序列設(shè)置景點(diǎn)序列分值,可以根據(jù)實(shí)際需要,進(jìn)一步提高為 用戶推薦旅游路線的效率。
[0015] 優(yōu)選地,預(yù)定序列評(píng)分規(guī)則可以基于以下特征中的至少一項(xiàng):時(shí)間合理性;是否 存在重復(fù)景點(diǎn);熱門景點(diǎn)所占比例;冷門景點(diǎn)所占比例;旅行強(qiáng)度;以及線路長度。
[0016] 優(yōu)選地,該方法還可以包括:響應(yīng)于來自客戶端的包含表示旅游意向的旅游特征 詞和表示旅游目標(biāo)地域的旅游目標(biāo)地域詞的搜索請(qǐng)求,確定旅游目標(biāo)地域;以及基于所確 定的旅游目標(biāo)地域,向客戶端提供備選景點(diǎn)序列中的至少一個(gè)。
[0017] 由此,可以通過與客戶端通信來向用戶推薦旅游路線。
[0018] 優(yōu)選地,該方法還可以包括:基于來自客戶端的旅游條件信息、包含特定景點(diǎn)的數(shù) 量以及景點(diǎn)序列分值,計(jì)算備選景點(diǎn)序列的相關(guān)性分值,其中,基于相關(guān)性分值,向客戶端 提供備選景點(diǎn)序列中的至少一個(gè)。
[0019] 由此,可以更有針對(duì)性地向用戶推薦旅游線路。
[0020] 優(yōu)選地,該方法還可以包括:濾除包含景點(diǎn)黑名單上的景點(diǎn)的景點(diǎn)序列。
[0021] 通過濾除景點(diǎn)黑名單上的景點(diǎn)所涉及的景點(diǎn)序列,可以進(jìn)一步提高為用戶推薦旅 游路線的效率。
[0022] 優(yōu)選地,獲得景點(diǎn)序列的步驟可以包括:在旅游文章中查找與景點(diǎn)的游覽時(shí)間相 關(guān)的游覽時(shí)間信息;在沒有查找到游覽時(shí)間信息的情況下,根據(jù)旅游文章中出現(xiàn)次序相鄰 的兩個(gè)景點(diǎn)之間的距離和/或從第三方獲取的游覽時(shí)間建議,估計(jì)與各景點(diǎn)對(duì)應(yīng)的游覽時(shí) 間信息;在查找到游覽時(shí)間信息的情況下,從旅游文章中提取與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信 息;以及通過使各景點(diǎn)和與其對(duì)應(yīng)的游覽時(shí)間信息相關(guān)聯(lián)來形成景點(diǎn)序列。
[0023] 通過使得在景點(diǎn)序列中包含了游覽時(shí)間信息,更有助于用戶規(guī)劃旅游方案。
[0024] 優(yōu)選地,該方法還可以包括:根據(jù)預(yù)定景點(diǎn)評(píng)分規(guī)則為景點(diǎn)分別設(shè)置景點(diǎn)分值,并 基于景點(diǎn)分值設(shè)定特定景點(diǎn);和/或向客戶端提供旅游文章中包含的至少部分景點(diǎn)的列 表,并將用戶從列表中選擇的景點(diǎn)設(shè)定為特定景點(diǎn)。
[0025] 通過基于景點(diǎn)分值設(shè)定特定景點(diǎn)和/或根據(jù)用戶選擇設(shè)定特定景點(diǎn),可以確保在 所推薦的景點(diǎn)序列(旅游線路)中包含有最值得推薦的景點(diǎn)和/或用戶特別希望游玩的景 點(diǎn)。
[0026] 優(yōu)選地,預(yù)定景點(diǎn)評(píng)分規(guī)則可以基于以下特征中的至少一項(xiàng):景點(diǎn)的搜索頁面瀏 覽量;針對(duì)景點(diǎn)的搜索量;包含該景點(diǎn)的景點(diǎn)序列數(shù)量;以及第三方對(duì)該景點(diǎn)的評(píng)價(jià)。
[0027] 通過根據(jù)景點(diǎn)評(píng)分來設(shè)定特定景點(diǎn),可以自動(dòng)準(zhǔn)備好包括值得推薦的景點(diǎn)的景點(diǎn) 序列(旅游路線)。通過根據(jù)用戶的選擇來設(shè)定特定景點(diǎn),可以更加有針對(duì)性地準(zhǔn)備好用戶 感興趣的景點(diǎn)序列(旅游路線)。
[0028] 根據(jù)本發(fā)明的另一個(gè)方面,提供了一種基于旅游目標(biāo)地域來挖掘旅游路線的設(shè) 備,旅游路線以景點(diǎn)序列的形式表示,該設(shè)備包括:旅游文章檢索裝置,用于檢索涉及旅游 目標(biāo)地域的旅游文章;景點(diǎn)序列獲得裝置,用于針對(duì)各篇旅游文章,分別獲得由其中包含的 景點(diǎn)構(gòu)成的景點(diǎn)序列;景點(diǎn)序列篩選裝置,用于篩選包含一個(gè)或多個(gè)特定景點(diǎn)的景點(diǎn)序列, 作為針對(duì)旅游目標(biāo)地域的備選景點(diǎn)序列。
[0029] 優(yōu)選地,該設(shè)備還可以包括:景點(diǎn)序列評(píng)分裝置,用于根據(jù)預(yù)定序列評(píng)分規(guī)則,為 每個(gè)備選景點(diǎn)序列設(shè)置景點(diǎn)序列分值,并且按景點(diǎn)序列分值從高到低的順序?qū)⒍鄠€(gè)所述備 選景點(diǎn)序列排序,以便響應(yīng)于來自客戶端的請(qǐng)求而按此順序提供給客戶端。
[0030] 優(yōu)選地,該設(shè)備還可以包括:目標(biāo)地域確定裝置,用于響應(yīng)于來自客戶端的包含表 示旅游意向的旅游特征詞和表示旅游目標(biāo)地域的旅游目標(biāo)地域詞的搜索請(qǐng)求,確定旅游目 標(biāo)地域;以及景點(diǎn)序列提供裝置,用于基于目標(biāo)地域確定裝置確定的旅游目標(biāo)地域,向客戶 端提供備選景點(diǎn)序列中的至少一個(gè)。
[0031] 優(yōu)選地,該設(shè)備還可以包括:相關(guān)性分值計(jì)算裝置,用于基于來自客戶端的旅游條 件信息、包含特定景點(diǎn)的數(shù)量以及景點(diǎn)序列分值,計(jì)算備選景點(diǎn)序列的相關(guān)性分值,其中, 景點(diǎn)序列提供裝置基于相關(guān)性分值,向客戶端提供備選景點(diǎn)序列中的至少一個(gè)。
[0032] 優(yōu)選地,該設(shè)備還可以包括:景點(diǎn)序列濾除裝置,用于濾除包含景點(diǎn)黑名單上的景 點(diǎn)的景點(diǎn)序列。
[0033] 優(yōu)選地,景點(diǎn)序列獲得裝置可以包括:查找裝置,用于在旅游文章中查找與景點(diǎn)的 游覽時(shí)間相關(guān)的游覽時(shí)間信息;游覽時(shí)間信息估計(jì)裝置,用于在沒有查找到游覽時(shí)間信息 的情況下,根據(jù)旅游文章中出現(xiàn)次序相鄰的兩個(gè)景點(diǎn)之間的距離和/或從第三方獲取的游 覽時(shí)間建議,估計(jì)與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息;游覽時(shí)間信息提取裝置,用于在查找到了 游覽時(shí)間信息的情況下,從旅游文章中提取與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息;以及景點(diǎn)序列 生成裝置,用于通過使各景點(diǎn)和與其對(duì)應(yīng)的游覽時(shí)間信息相關(guān)聯(lián)來形成景點(diǎn)序列。
[0034] 優(yōu)選地,該設(shè)備還可以包括:景點(diǎn)評(píng)分裝置,用于根據(jù)預(yù)定景點(diǎn)評(píng)分規(guī)則為景點(diǎn)分 別設(shè)置景點(diǎn)分值;和/或景點(diǎn)列表提供裝置,用于向客戶端提供旅游文章中包含的至少部 分景點(diǎn)的列表;以及特定景點(diǎn)設(shè)定裝置,用于基于景點(diǎn)分值設(shè)定特定景點(diǎn),和/或?qū)⒂脩魪?列表中選擇的景點(diǎn)設(shè)定為特定景點(diǎn)。
[0035] 通過本發(fā)明的設(shè)備,可以從互聯(lián)網(wǎng)上海量的旅游文章中獲取由于大量用戶采用而 值得向用戶推薦的旅游線路(備選景點(diǎn)序列)。
【專利附圖】
【附圖說明】
[0036] 通過結(jié)合附圖對(duì)本公開示例性實(shí)施方式進(jìn)行更詳細(xì)的描述,本公開的上述以及其 它目的、特征和優(yōu)勢(shì)將變得更加明顯,其中,在本公開示例性實(shí)施方式中,相同的參考標(biāo)號(hào) 通常代表相同部件。
[0037] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的挖掘旅游路線的方法的示意性流程圖。
[0038] 圖2是圖1中的步驟200中可以進(jìn)一步包括的步驟的示意性流程圖。
[0039] 圖3A和圖3B是圖1中的步驟300中所用到的特定景點(diǎn)的兩種設(shè)定方式的示意性 流程圖。
[0040] 圖4是根據(jù)本發(fā)明的改進(jìn)實(shí)施例的挖掘旅游路線的方法的示意性流程圖。
[0041] 圖5是通過與客戶端通信來向用戶推薦旅游路線的方法的示意性流程圖。
[0042] 圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例的挖掘旅游路線的設(shè)備的示意性方框圖。
[0043] 圖7是圖6中的景點(diǎn)序列獲得裝置200可以進(jìn)一步包括的裝置的示意性方框圖。
[0044] 圖8是可用于設(shè)定特定景點(diǎn)的裝置的示意性方框圖。
[0045] 圖9是根據(jù)本發(fā)明的改進(jìn)實(shí)施例的挖掘旅游路線的設(shè)備的示意性方框圖。
[0046] 圖10是通過與客戶端通信來向用戶推薦旅游路線的裝置的示意性方框圖。
【具體實(shí)施方式】
[0047] 下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實(shí)施方式。雖然附圖中顯示了本公開 的優(yōu)選實(shí)施方式,然而應(yīng)該理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方 式所限制。相反,提供這些實(shí)施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的 范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0048] 圖1示意性地示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的挖掘旅游路線的方法的示意性 流程圖。
[0049] 通過圖1所示的方法,可以從互聯(lián)網(wǎng)上海量的旅游文章中獲取由于大量用戶采用 而值得向用戶推薦的旅游線路(備選景點(diǎn)序列)。
[0050] 首先,在步驟S100,檢索涉及旅游目標(biāo)地域的旅游文章。
[0051] 旅游目標(biāo)地域可以是具有一定空間范圍的地理區(qū)域,其中包含有若干個(gè)旅游景 點(diǎn),人們需要在這些景點(diǎn)中挑選最值得游玩的景點(diǎn),并按照最優(yōu)化的路線來旅游。
[0052] 例如,旅游目標(biāo)地域可以是一個(gè)較大的景區(qū),例如圓明園、九寨溝、壩上草原等。
[0053] 或者,旅游目標(biāo)地域也可以是一個(gè)城市或省,或者一個(gè)城市或省的部分,例如杭 州、海南、新疆北部等。
[0054] 或者,旅游目標(biāo)地域也可以是一個(gè)包括幾個(gè)省份的大區(qū)域,例如華南、東北等。
[0055] 或者,當(dāng)涉及境外旅游時(shí),還可以是一個(gè)或幾個(gè)國家,例如日本、美國等。甚至還可 以是一個(gè)洲或一個(gè)洲的一部分,例如非洲、東歐等。
[0056] 互聯(lián)網(wǎng)上有海量的旅游文章,即與旅游有關(guān)的文章,例如游客用戶撰寫的各種游 記和旅游攻略,還有旅游網(wǎng)站上提供的旅游行程介紹等。
[0057] 這些旅游文章,特別是游記和旅游攻略,描述了人們的旅游行程。通過分析大量旅 游文章,可以了解大量用戶的旅游經(jīng)歷,從而確定最值得推薦的景點(diǎn)和路線。
[0058] 然后,在步驟S200,針對(duì)所檢索到的各篇旅游文章,分別獲得由其中包含的景點(diǎn)構(gòu) 成的景點(diǎn)序列。這樣的景點(diǎn)序列可以代表對(duì)應(yīng)的旅游路線。
[0059] 在步驟S200中獲得景點(diǎn)序列的過程中,除了從旅游文章中找出各個(gè)景點(diǎn)之外,還 可以嘗試從旅游文章中分析各個(gè)景點(diǎn)的游覽時(shí)間信息,例如游覽各個(gè)景點(diǎn)所耗費(fèi)的時(shí)間, 是否分幾天來游覽多個(gè)景點(diǎn),每個(gè)景點(diǎn)在第幾天等。這些信息也可以用來為用戶制定旅游 路線提供幫助。
[0060] 圖2是示意性地示出了可以用來獲取游覽時(shí)間信息的步驟的流程圖。
[0061] 首先,針對(duì)所檢索到的旅游文章,在步驟S210,在旅游文章中查找與景點(diǎn)的游覽時(shí) 間相關(guān)的游覽時(shí)間信息。游覽時(shí)間信息包括例如多個(gè)景點(diǎn)的天數(shù)分割、各個(gè)景點(diǎn)的游覽持 續(xù)時(shí)間等與景點(diǎn)的游覽時(shí)間有關(guān)的信息。
[0062] 在步驟S215判斷是否在旅游文章中查找到了游覽時(shí)間信息。
[0063] 如果在旅游文章中查找到了游覽時(shí)間信息,則在步驟S220,從旅游文章中直接提 取與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息。
[0064] 如果在旅游文章中沒有查找到游覽時(shí)間信息,則在步驟S230,根據(jù)旅游文章中出 現(xiàn)次序相鄰的兩個(gè)景點(diǎn)之間的距離和/或從第三方獲取的游覽時(shí)間建議,估計(jì)與各景點(diǎn)對(duì) 應(yīng)的游覽時(shí)間信息。
[0065] 當(dāng)使用兩個(gè)景點(diǎn)之間的距離來估計(jì)游覽時(shí)間信息時(shí),可以訓(xùn)練擬合一個(gè)映射到時(shí) 間的公式,通過這個(gè)公式,可以計(jì)算出兩個(gè)景點(diǎn)的時(shí)間。必要時(shí),在借鑒第三方提供的游覽 時(shí)間建議,可以計(jì)算整個(gè)線路的游覽持續(xù)時(shí)間,從而可以實(shí)現(xiàn)天數(shù)分割,并確定每個(gè)景點(diǎn)的 游覽持續(xù)時(shí)間。
[0066] 然后,在步驟S240,通過使各景點(diǎn)和與其對(duì)應(yīng)的游覽時(shí)間信息相關(guān)聯(lián)來形成景點(diǎn) 序列。
[0067] 這樣形成的景點(diǎn)序列不但依次羅列了旅游線路所涉及的景點(diǎn),還可以注明每個(gè)景 點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息,例如兩個(gè)景點(diǎn)是否分在兩天游覽,一個(gè)景點(diǎn)需要多長游覽持續(xù)時(shí) 間等。這樣,可以為用戶提供更為合理的旅游方案,也更有助于用戶從所推薦的旅游路線 (備選景點(diǎn)序列)中選擇旅游方案。
[0068] 返回圖1,在完成步驟S200之后,可以獲得若干條用景點(diǎn)序列表示的旅游線路。
[0069] 為了更有效地向用戶推薦旅游線路,可以在步驟S300,基于一個(gè)或多個(gè)特定景點(diǎn) 來對(duì)這些景點(diǎn)序列進(jìn)行篩選,即篩選包含一個(gè)或多個(gè)特定景點(diǎn)的景點(diǎn)序列,作為針對(duì)旅游 目標(biāo)地域的備選景點(diǎn)序列。
[0070] 下面參考圖3A和圖3B來描述這里的特定景點(diǎn)的設(shè)定方法。
[0071] 圖3A和圖3B是圖1中的步驟300中所用到的特定景點(diǎn)的兩種設(shè)定方式的示意性 流程圖。
[0072] 圖3A所示出的是根據(jù)景點(diǎn)評(píng)分來設(shè)定特定景點(diǎn)的方式。
[0073] 在步驟S310,根據(jù)預(yù)定景點(diǎn)評(píng)分規(guī)則為各個(gè)景點(diǎn)分別設(shè)置景點(diǎn)分值。
[0074] 這里,預(yù)定景點(diǎn)評(píng)分規(guī)則可以基于以下特征中的至少一項(xiàng):
[0075] 景點(diǎn)的搜索頁面瀏覽量(PV);
[0076] 針對(duì)景點(diǎn)的搜索量(體現(xiàn)景點(diǎn)熱度);
[0077] 包含該景點(diǎn)的景點(diǎn)序列數(shù)量;以及
[0078] 第三方對(duì)該景點(diǎn)的評(píng)價(jià)。
[0079] 景點(diǎn)的搜索頁面瀏覽量(PV)和針對(duì)景點(diǎn)的搜索量(體現(xiàn)景點(diǎn)熱度)可以通過分 析搜索網(wǎng)站的搜索日志來得到。
[0080] 例如:如果某個(gè)景點(diǎn)的搜索頁面瀏覽量(PV)為XI,景點(diǎn)的評(píng)分(即第三方對(duì)該景 點(diǎn)的評(píng)價(jià))為X2,景點(diǎn)的熱度(針對(duì)景點(diǎn)的搜索量)為X3,景點(diǎn)覆蓋的線路數(shù)量(包含該 景點(diǎn)的景點(diǎn)序列數(shù)量)為x4,則景點(diǎn)的最終得分為Vspot :
[0081] Vspot = al*xl+a2*x2+a3*x3+a4*x4
[0082] 其中,al,a2, a3, a4為各個(gè)特征的權(quán)重,這個(gè)權(quán)重可以通過使用訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練 得到。
[0083] 在步驟S320,基于景點(diǎn)分值設(shè)定特定景點(diǎn)。例如,可以設(shè)定景點(diǎn)分值最高的一個(gè)或 若干個(gè)景點(diǎn)為特定景點(diǎn)。
[0084] 通過基于景點(diǎn)分值來設(shè)定備選景點(diǎn)序列中要包含的特定景點(diǎn),可以在用戶沒有設(shè) 定特別想要去游玩的景點(diǎn)的情況下,或者用戶想要游玩的景點(diǎn)不夠多(例如少于預(yù)定數(shù) 值,例如2個(gè)或3個(gè)景點(diǎn))的情況下,將景點(diǎn)分值最高,也就是最熱門的,廣大用戶普遍認(rèn)為 值得游玩的景點(diǎn)包含在備選景點(diǎn)序列中,避免用戶錯(cuò)過值得游玩的景點(diǎn)。
[0085] 圖3B示出的是根據(jù)用戶的選擇來設(shè)定特定景點(diǎn)的方式。
[0086] 在步驟S330,向客戶端提供旅游文章中包含的至少部分景點(diǎn)的列表。
[0087] 然后,在步驟S340,響應(yīng)于來自客戶端的用戶選擇,將用戶從列表中選擇的景點(diǎn)設(shè) 定為特定景點(diǎn)。
[0088] 通過將用戶選擇的景點(diǎn)設(shè)定為特定景點(diǎn),可以讓用戶參與到旅游線路(景點(diǎn)序 列)的規(guī)劃過程中,使得整個(gè)旅游線路規(guī)劃方案更加靈活。例如在用戶特別想要去某個(gè)較 為冷門的景點(diǎn),而涉及這個(gè)冷門景點(diǎn)的旅游文章較少的情況下,可以避免用戶耗費(fèi)很大的 精力才找到包含這個(gè)景點(diǎn)的旅游線路(景點(diǎn)序列)。
[0089] 事實(shí)上,圖3A和3B的兩種方式可以結(jié)合使用。例如,可以以用戶選擇的一個(gè)或幾 個(gè)景點(diǎn)和景點(diǎn)分值較高的一個(gè)或幾個(gè)景點(diǎn)公共作為在步驟S300中需要考慮的特定景點(diǎn)。
[0090] 如上所述,通過圖1所示的方法,可以從互聯(lián)網(wǎng)上海量的旅游文章中獲取由于大 量用戶采用而值得向用戶推薦的旅游線路(備選景點(diǎn)序列)。
[0091] 圖4示意性地示出了根據(jù)本發(fā)明的改進(jìn)實(shí)施例的挖掘旅游路線的方法的流程圖。
[0092] 其中步驟S100、S200、S300可以與上文中參考圖1描述的內(nèi)容相同。
[0093] 如圖4所示,在步驟S500,還可以進(jìn)一步根據(jù)預(yù)定序列評(píng)分規(guī)則,為每個(gè)備選景點(diǎn) 序列設(shè)置景點(diǎn)序列分值。并且還可以進(jìn)一步按景點(diǎn)序列分值從高到低的順序?qū)⑺@得的多 個(gè)備選景點(diǎn)序列排序,以便響應(yīng)于來自客戶端的請(qǐng)求而按此順序提供給客戶端。
[0094] 這里,預(yù)定序列評(píng)分規(guī)則可以基于以下特征中的至少一項(xiàng):
[0095] 時(shí)間合理性;
[0096] 是否存在重復(fù)景點(diǎn);
[0097] 熱門景點(diǎn)所占比例;
[0098] 冷門景點(diǎn)所占比例;
[0099] 旅行強(qiáng)度;以及
[0100] 線路長度。
[0101] 例如,某個(gè)景點(diǎn)序列(旅游線路)的時(shí)間合理性為yl、線路中是否出現(xiàn)重復(fù)景點(diǎn)為 y2 (0/1)、線路覆蓋熱門景點(diǎn)的比例為y3、線路覆蓋冷門景點(diǎn)的比例為y4、旅行強(qiáng)度為y5與 路線長度為y6,則景點(diǎn)序列分值為spotValue :
[0102] spotValue = bl*yl+b2*y2+b3*y3+b4*y4+b5*y5+b6*y6
[0103] 其中,bl, b2, b3, b4, b5, b6為各個(gè)特征的權(quán)重,這個(gè)權(quán)重可以通過使用訓(xùn)練數(shù)據(jù)進(jìn) 行訓(xùn)練得到。
[0104] 通過為每個(gè)備選景點(diǎn)序列設(shè)置景點(diǎn)序列分值,可以根據(jù)實(shí)際需要,進(jìn)一步提高為 用戶推薦旅游路線的效率。
[0105] 另外,如圖4所示,還可以在步驟S400,進(jìn)一步濾除包含景點(diǎn)黑名單上的景點(diǎn)的景 點(diǎn)序列。
[0106] 這個(gè)景點(diǎn)黑名單可以是通過各種方式根據(jù)各種標(biāo)準(zhǔn)設(shè)置的。例如可以是由用戶自 行設(shè)置并從客戶端上傳到服務(wù)器端的,也可以是根據(jù)大量用戶的反饋設(shè)置的,也可以是根 據(jù)工作人員的經(jīng)驗(yàn)設(shè)置的,也可以是通過分析互聯(lián)網(wǎng)上用戶對(duì)景點(diǎn)的評(píng)價(jià)而設(shè)置的。
[0107] 通過濾除景點(diǎn)黑名單上的景點(diǎn)所涉及的景點(diǎn)序列,可以進(jìn)一步提高為用戶推薦旅 游路線的效率。
[0108] 圖4中示出步驟S400在步驟S300之后執(zhí)行,而步驟S500在步驟S400之后執(zhí)行。
[0109] 事實(shí)上,可以只執(zhí)行步驟S500而不執(zhí)行步驟S400。另一方面,步驟S300、S400、 S500之間的順序也是可以調(diào)整的。(因此,圖4中采用虛線框來示出步驟S400和步驟 S500)。
[0110] 例如,可以先執(zhí)行步驟S500,為步驟S200中獲得的各景點(diǎn)序列分別設(shè)置景點(diǎn)序列 分值并排序,然后再執(zhí)行步驟S300和/或S400中的篩選和/或?yàn)V除操作。
[0111] 或者,也可以先執(zhí)行步驟S400,根據(jù)景點(diǎn)黑名單濾除相關(guān)的景點(diǎn)序列,然后再執(zhí)行 步驟S300篩選包含特定景點(diǎn)的景點(diǎn)序列作為備選景點(diǎn)序列。
[0112] 上文中描述的操作中,只有圖3B的步驟涉及了與客戶端的交互。而事實(shí)上,在需 要設(shè)定特定景點(diǎn)時(shí),可以先采用圖3A的方式。待到與客戶端交互時(shí),再進(jìn)一步按照?qǐng)D3B的 方式進(jìn)一步設(shè)定特定景點(diǎn),然后進(jìn)一步篩選備選景點(diǎn)序列。
[0113] 換句話說,為了提高用戶搜索的速度,可以預(yù)先在服務(wù)器端執(zhí)行上述方法,從而準(zhǔn) 備好針對(duì)若干旅游目標(biāo)區(qū)域的備選景點(diǎn)序列。當(dāng)用戶在客戶端執(zhí)行搜索時(shí),可以直接向用 戶提供已經(jīng)準(zhǔn)備好的備選景點(diǎn)序列,而不用從頭開始執(zhí)行檢索旅游文章、獲得景點(diǎn)序列、篩 選景點(diǎn)序列等操作。而只需要在用戶已經(jīng)得到的備選景點(diǎn)序列的基礎(chǔ)上,進(jìn)一步設(shè)定了特 定景點(diǎn)的情況下,進(jìn)一步篩選備選景點(diǎn)序列即可。
[0114] 只有當(dāng)服務(wù)器上沒有預(yù)先準(zhǔn)備好針對(duì)用戶所搜索的旅游目標(biāo)區(qū)域的備選景點(diǎn)序 列的情況下,才響應(yīng)于用戶的搜索請(qǐng)求而從頭開始執(zhí)行圖1或圖4的操作。
[0115] 這樣,既可以減少用戶的搜索等待時(shí)間,也可以減少服務(wù)器的運(yùn)算量。
[0116] 下面參考圖5描述用戶通過客戶端來搜索旅游路線時(shí)向用戶推薦旅游路線的方 法。
[0117] 圖5示意性地示出了通過與客戶端通信來向用戶推薦旅游路線的方法的流程圖。
[0118] 在用戶在客戶端輸入搜索查詢(query)請(qǐng)求后,可以對(duì)搜索查詢的關(guān)鍵詞進(jìn)行切 詞,判斷是否在切詞結(jié)果中匹配到了表示旅游意向的旅游特征詞。
[0119] 如果沒有匹配到,則該方法結(jié)束。
[0120] 如果匹配到了,則進(jìn)一步判斷是否匹配到了城市或景點(diǎn)等表示旅游目標(biāo)地域的旅 游目標(biāo)地域詞。如果沒有則該方法也結(jié)束。如果有,則可以認(rèn)為,用戶發(fā)出的很可能是基于 旅游目標(biāo)地域來規(guī)劃旅游線路的搜索請(qǐng)求。此時(shí)可以啟動(dòng)下面描述的方法。
[0121] 響應(yīng)于來自客戶端的包含表示旅游意向的旅游特征詞和表示旅游目標(biāo)地域的旅 游目標(biāo)地域詞的搜索請(qǐng)求,在步驟S600確定旅游目標(biāo)地域。
[0122] 在服務(wù)器上已經(jīng)通過上面參考圖1或圖4的方法針對(duì)該旅游目標(biāo)地域準(zhǔn)備了備選 景點(diǎn)序列的情況下,可以直接從服務(wù)器獲取已經(jīng)準(zhǔn)備好的備選景點(diǎn)序列,并在步驟S800向 客戶端提供備選景點(diǎn)序列中的至少一個(gè)。
[0123] 在如圖4所示設(shè)置了景點(diǎn)序列分值的情況下,可以基于景點(diǎn)序列分值的高低來向 客戶端提供備選景點(diǎn)序列。例如,可以向客戶端提供景點(diǎn)序列分值最高的若干個(gè)備選景點(diǎn) 序列,或者可以向客戶端提供景點(diǎn)序列分值高于預(yù)定閾值的備選景點(diǎn)序列。
[0124] 優(yōu)選地,可以在步驟S800之前,在步驟S700 (可選步驟,圖5中用虛線框表示),基 于來自客戶端的旅游條件信息(例如旅游時(shí)間長短等)、包含特定景點(diǎn)的數(shù)量以及景點(diǎn)序 列分值,計(jì)算備選景點(diǎn)序列的相關(guān)性分值。
[0125] 例如,可以通過下面的公式來計(jì)算備選景點(diǎn)序列的相關(guān)性分值Score。
【權(quán)利要求】
1. 一種基于旅游目標(biāo)地域來挖掘旅游路線的方法,所述旅游路線w景點(diǎn)序列的形式表 示,該方法包括: 檢索涉及所述旅游目標(biāo)地域的旅游文章; 針對(duì)各篇旅游文章,分別獲得由其中包含的景點(diǎn)構(gòu)成的景點(diǎn)序列; 篩選包含一個(gè)或多個(gè)特定景點(diǎn)的所述景點(diǎn)序列,作為針對(duì)所述旅游目標(biāo)地域的備選景 點(diǎn)序列。
2. 根據(jù)權(quán)利要求1所述的方法,還包括: 根據(jù)預(yù)定序列評(píng)分規(guī)則,為每個(gè)備選景點(diǎn)序列設(shè)置景點(diǎn)序列分值,并且按景點(diǎn)序列分 值從高到低的順序?qū)⒍鄠€(gè)所述備選景點(diǎn)序列排序,W便響應(yīng)于來自客戶端的請(qǐng)求而按此順 序提供給客戶端。
3. 根據(jù)權(quán)利要求2所述的方法,其中,所述預(yù)定序列評(píng)分規(guī)則基于W下特征中的至少 一項(xiàng): 時(shí)間合理性; 是否存在重復(fù)景點(diǎn); 熱口景點(diǎn)所占比例; 冷口景點(diǎn)所占比例; 旅行強(qiáng)度;W及 線路長度。
4. 根據(jù)權(quán)利要求1或2所述的方法,還包括: 響應(yīng)于來自客戶端的包含表示旅游意向的旅游特征詞和表示旅游目標(biāo)地域的旅游目 標(biāo)地域詞的搜索請(qǐng)求,確定所述旅游目標(biāo)地域;W及 基于所確定的旅游目標(biāo)地域,向所述客戶端提供所述備選景點(diǎn)序列中的至少一個(gè)。
5. 根據(jù)權(quán)利要求4所述的方法,還包括: 基于來自客戶端的旅游條件信息、包含所述特定景點(diǎn)的數(shù)量W及所述景點(diǎn)序列分值, 計(jì)算所述備選景點(diǎn)序列的相關(guān)性分值, 其中,基于所述相關(guān)性分值,向所述客戶端提供所述備選景點(diǎn)序列中的至少一個(gè)。
6. 根據(jù)權(quán)利要求1所述的方法,還包括: 濾除包含景點(diǎn)黑名單上的景點(diǎn)的景點(diǎn)序列。
7. 根據(jù)權(quán)利要求1所述的方法,其中,所述獲得景點(diǎn)序列的步驟包括: 在所述旅游文章中查找與景點(diǎn)的游覽時(shí)間相關(guān)的游覽時(shí)間信息; 在沒有查找到游覽時(shí)間信息的情況下,根據(jù)所述旅游文章中出現(xiàn)次序相鄰的兩個(gè)景點(diǎn) 之間的距離和/或從第H方獲取的游覽時(shí)間建議,估計(jì)與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息; 在查找到游覽時(shí)間信息的情況下,從所述旅游文章中提取與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信 息;W及 通過使各景點(diǎn)和與其對(duì)應(yīng)的游覽時(shí)間信息相關(guān)聯(lián)來形成所述景點(diǎn)序列。
8. 根據(jù)權(quán)利要求1所述的方法,還包括: 根據(jù)預(yù)定景點(diǎn)評(píng)分規(guī)則為所述景點(diǎn)分別設(shè)置景點(diǎn)分值,并基于所述景點(diǎn)分值設(shè)定所述 特定景點(diǎn);和/或 向客戶端提供所述旅游文章中包含的至少部分景點(diǎn)的列表,并將用戶從所述列表中選 擇的景點(diǎn)設(shè)定為所述特定景點(diǎn)。
9. 根據(jù)權(quán)利要求8所述的方法,其中,所述預(yù)定景點(diǎn)評(píng)分規(guī)則基于W下特征中的至少 一項(xiàng): 景點(diǎn)的搜索頁面瀏覽量; 針對(duì)景點(diǎn)的搜索量; 包含該景點(diǎn)的景點(diǎn)序列數(shù)量;W及 第H方對(duì)該景點(diǎn)的評(píng)價(jià)。
10. -種基于旅游目標(biāo)地域來挖掘旅游路線的設(shè)備,所述旅游路線W景點(diǎn)序列的形式 表示,該設(shè)備包括: 旅游文章檢索裝置,用于檢索涉及所述旅游目標(biāo)地域的旅游文章; 景點(diǎn)序列獲得裝置,用于針對(duì)各篇旅游文章,分別獲得由其中包含的景點(diǎn)構(gòu)成的景點(diǎn) 序列; 景點(diǎn)序列篩選裝置,用于篩選包含一個(gè)或多個(gè)特定景點(diǎn)的所述景點(diǎn)序列,作為針對(duì)所 述旅游目標(biāo)地域的備選景點(diǎn)序列。
11. 根據(jù)權(quán)利要求10所述的設(shè)備,還包括: 景點(diǎn)序列評(píng)分裝置,用于根據(jù)預(yù)定序列評(píng)分規(guī)則,為每個(gè)所述備選景點(diǎn)序列設(shè)置景點(diǎn) 序列分值,并且按景點(diǎn)序列分值從高到低的順序?qū)⒍鄠€(gè)所述備選景點(diǎn)序列排序,W便響應(yīng) 于來自客戶端的請(qǐng)求而按此順序提供給客戶端。
12. 根據(jù)權(quán)利要求10或11所述的設(shè)備,還包括: 目標(biāo)地域確定裝置,用于響應(yīng)于來自客戶端的包含表示旅游意向的旅游特征詞和表示 旅游目標(biāo)地域的旅游目標(biāo)地域詞的搜索請(qǐng)求,確定所述旅游目標(biāo)地域;W及 景點(diǎn)序列提供裝置,用于基于所述目標(biāo)地域確定裝置確定的旅游目標(biāo)地域,向所述客 戶端提供所述備選景點(diǎn)序列中的至少一個(gè)。
13. 根據(jù)權(quán)利要求12所述的設(shè)備,還包括: 相關(guān)性分值計(jì)算裝置,用于基于來自客戶端的旅游條件信息、包含所述特定景點(diǎn)的數(shù) 量W及所述景點(diǎn)序列分值,計(jì)算所述備選景點(diǎn)序列的相關(guān)性分值, 其中,所述景點(diǎn)序列提供裝置基于所述相關(guān)性分值,向所述客戶端提供所述備選景點(diǎn) 序列中的至少一個(gè)。
14. 根據(jù)權(quán)利要求10所述的設(shè)備,還包括: 景點(diǎn)序列濾除裝置,用于濾除包含景點(diǎn)黑名單上的景點(diǎn)的景點(diǎn)序列。
15. 根據(jù)權(quán)利要求10所述的設(shè)備,其中,所述景點(diǎn)序列獲得裝置包括: 查找裝置,用于在所述旅游文章中查找與景點(diǎn)的游覽時(shí)間相關(guān)的游覽時(shí)間信息; 游覽時(shí)間信息估計(jì)裝置,用于在沒有查找到游覽時(shí)間信息的情況下,根據(jù)所述旅游文 章中出現(xiàn)次序相鄰的兩個(gè)景點(diǎn)之間的距離和/或從第H方獲取的游覽時(shí)間建議,估計(jì)與各 景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息; 游覽時(shí)間信息提取裝置,用于在查找到游覽時(shí)間信息的情況下,從所述旅游文章中提 取與各景點(diǎn)對(duì)應(yīng)的游覽時(shí)間信息;W及 景點(diǎn)序列生成裝置,用于通過使各景點(diǎn)和與其對(duì)應(yīng)的游覽時(shí)間信息相關(guān)聯(lián)來形成所述 景點(diǎn)序列。
16.根據(jù)權(quán)利要求10所述的設(shè)備,還包括: 景點(diǎn)評(píng)分裝置,用于根據(jù)預(yù)定景點(diǎn)評(píng)分規(guī)則為所述景點(diǎn)分別設(shè)置景點(diǎn)分值;和/或 景點(diǎn)列表提供裝置,用于向客戶端提供所述旅游文章中包含的至少部分景點(diǎn)的列表; W及 特定景點(diǎn)設(shè)定裝置,用于基于所述景點(diǎn)分值設(shè)定所述特定景點(diǎn),和/或?qū)⒂脩魪乃?列表中選擇的景點(diǎn)設(shè)定為所述特定景點(diǎn)。
【文檔編號(hào)】G06Q50/14GK104463730SQ201410848598
【公開日】2015年3月25日 申請(qǐng)日期:2014年12月29日 優(yōu)先權(quán)日:2014年12月29日
【發(fā)明者】李天寧 申請(qǐng)人:廣州神馬移動(dòng)信息科技有限公司