一種導航設備的搜索自動補全方法
【專利摘要】一種導航設備的搜索自動補全方法,包括搜索自動補全格式的設計,自動補全數(shù)據(jù)庫的編譯方法,提供建議的排序打分算法,自動補全的軟件功能實現(xiàn);自動補全數(shù)據(jù)庫格式、編譯方法:自動補全數(shù)據(jù)中主要存儲詞和詞組;詞會基于搜索數(shù)據(jù)產生,通過分詞器將數(shù)據(jù)分詞,同時對這些詞統(tǒng)計出現(xiàn)的頻率,并記錄詞出現(xiàn)在搜索數(shù)據(jù)中的位置,產生了詞;當詞生成后,對詞與詞同時出現(xiàn)的頻率大于經驗閾值的結果將生成詞組,判定詞組產生的經驗閾值與搜索數(shù)據(jù)體量有關。本發(fā)明的優(yōu)點:在搜索輸入的過程中,加入了搜索建議,用戶可以根據(jù)搜索目的,選擇搜索建議進行搜索,解決了用戶搜索輸入操作步驟多的問題,使用本發(fā)明的方法也會使搜索建議結果排序更加合理。
【專利說明】一種導航設備的搜索自動補全方法
【技術領域】
[0001] 本發(fā)明涉及車載導航設備搜索建議或搜索提示或搜索輔助功能【技術領域】,特別涉 及了一種導航設備的搜索自動補全方法。
【背景技術】
[0002] 用戶在使用導航的搜索功能時,為了比較迅速的查找到一個地點,經常平均要輸 入4至5個字符,輸入關鍵字的個數(shù)少于這個數(shù)值,通常來說會因為搜索結果太多,需要花 費較多的時間去瀏覽這些結果而降低了用戶的體驗。
[0003] 用戶不能既快速、又輸入盡可能多的字符,如下幾個原因限制了用戶的這個行為: 用戶開車過程中,想加入一個途經地,用戶想在道邊停車,或等信號的時候,通過簡單地幾 個步驟快速的完成操作。但現(xiàn)在的拼音輸入法,對于要輸入4至5個字符,大約需要點擊屏 幕20次以上,漢字手寫輸入法也需要12次以上,這樣想快速都難。用戶對查找的地點不熟 悉,只知道地點的讀音,或者只知道地點名稱的部分,因此也沒辦法輸入更多的字符。
【發(fā)明內容】
[0004] 本發(fā)明的目的是為了解決上述問題,特提供了一種導航設備的搜索自動補全方 法。
[0005] 本發(fā)明提供了一種導航設備的搜索自動補全方法,其特征在于:所述的導航設備 的搜索自動補全方法,包括搜索自動補全格式的設計,自動補全數(shù)據(jù)庫的編譯方法,提供建 議的排序打分算法,自動補全的軟件功能實現(xiàn);解決方案具體如下:
[0006] 自動補全數(shù)據(jù)庫格式、編譯方法:
[0007] 自動補全數(shù)據(jù)中主要存儲詞和詞組;詞會基于搜索數(shù)據(jù)產生,通過分詞器將數(shù)據(jù) 分詞,同時統(tǒng)計詞出現(xiàn)的頻率,并記錄詞出現(xiàn)在搜索數(shù)據(jù)中的位置。當詞生成后,對頻率大 于經驗閾值的結果將生成詞組,判定詞組產生的經驗閾值與搜索數(shù)據(jù)體量有關。判定過程 通過對詞之間搜索位置的匹配,例如:詞A出現(xiàn)在文檔D 〇cl,D〇C2,D〇C4,D〇C5中,詞B出現(xiàn) 在在文檔Docl,Doc2, Doc3,于是詞A和詞B同時出現(xiàn)在Docl和Doc2中,同時出現(xiàn)的次數(shù) 是2次,當2次大于經驗值,那就判定為詞A和詞B具有某種粘著關系,詞A和詞B將構成 詞組。在存儲詞A和詞B時,中間需要添加一個連接符號,至于采用什么連接符號,這可以 跟搜索引擎一起來制定,可以是空格AB,可以是與運算符A&B,其前提是用戶容易理解這個 以詞組的形式給出的搜索建議。
[0008] 當搜索詞和詞組產生后,按照一定的順序來排序,要與查找的順序保持一致,例 如:如果按照拼音字母音序查找,那么要按照拼音音序來排列這些詞。如果按照漢字來查 找,推薦采用按照字符編碼的順序來排序。當這些詞和詞組有序后,就可以考慮制作目標數(shù) 據(jù)了。具體的數(shù)據(jù)的格式可以參考下面的格式設計。在實際的使用過程中,可能會針對不 同應用場景,建議詞數(shù)據(jù)量的差異,為了提供性能,還會增加一些跳躍表。如果在搜素建議 中,還要提供其他的信息,還會增加一些表或者字段。因此自動補全的格式不僅限于這里列 出的內容,可以做必要的擴充。
[0009] 建議詞索引:
[0010] 會對搜索建議詞的首個字符建立索引,輸入都是從頭開始輸入,建立索引是高效 的。這里1、2、3字段是必選。對于輸入匹配到【詞首字】后,可以通過【指向建議詞】字段, 跳轉到對應建議詞的位置。對于有詞組的情況,可以考慮使用4、5字段。對于用戶在第一 個詞輸入完,第二個詞開始輸入的情況,可以通過【下一個建議詞索引】,跳轉到第二個建議 詞索引來進行匹配。如果數(shù)據(jù)量少,也可以直接跳轉到【建議詞】。
[0011] 表1.建議詞索引的數(shù)據(jù)格式
[0012]
【權利要求】
1. 一種導航設備的搜索自動補全方法,其特征在于:所述的導航設備的搜索自動補全 方法,包括搜索自動補全格式的設計,自動補全數(shù)據(jù)庫的編譯方法,提供建議的排序打分算 法,自動補全的軟件功能實現(xiàn);解決方案具體如下: 自動補全數(shù)據(jù)庫格式、編譯方法: 自動補全數(shù)據(jù)中主要存儲詞和詞組;詞會基于搜索數(shù)據(jù)產生,通過分詞器將數(shù)據(jù)分詞, 同時統(tǒng)計詞出現(xiàn)的頻率,并記錄詞出現(xiàn)在搜索數(shù)據(jù)中的位置;當詞生成后,對詞與詞同時 出現(xiàn)的頻率大于經驗閾值的結果將生成詞組,判定詞組產生的經驗閾值與搜索數(shù)據(jù)體量有 關; 當搜索詞和詞組產生后,按照一定的順序來排序,要與查找的順序保持一致; 建議詞索引:會對搜索建議詞的首個字符建立索引,輸入都是從頭開始輸入,建立索引 是1?效的; 建議詞:建議詞的具體內容,所有字段都是必須存儲的;存儲的和搜索建議顯示的保 持一致; 排序相關:這是搜索建議列表的排序因子,最常見影響排序的因子是出現(xiàn)頻率和用戶 使用頻率,如果單純的使用字段1,整個排序就會是靜態(tài)化,用戶行為沒有考慮進去;出現(xiàn) 頻率和用戶使用頻率相互疊加作用在搜索建議的排序上; 排序打分公式:Scorei=x /=你,-1 - §5"x2 Freqd建議詞i在數(shù)據(jù)中出現(xiàn)的頻率,F(xiàn)reqd全部建議詞在數(shù)據(jù)中總的出現(xiàn)頻率; Frequ建議詞i用戶使用的頻率,F(xiàn)reqU用戶選擇過的詞總的使用頻率; factorl數(shù)據(jù)的排序調整因子,factor2用戶使用頻率的調整因子;factorl+factor2 =1 ; 以上列出的打分公式是對自動補全最基本的排序建模,實際應用過程中,可以增加字 段,逐步調整排序的結果。
2. 按照權利要求1所述的導航設備的搜索自動補全方法,其特征在于:所述的導航設 備的搜索自動補全方法,自動補全的軟件功能實現(xiàn): 首先判斷是否有新的輸入,如果有,將開始自動補全過程; 對所有的輸入字符需要判斷從哪個字符開始進行自動補全,通常的做法可以考慮使用 分詞器來做,最后的一個詞將參與自動補全;這個詞會在建議詞中查找,如果查找到,將會 對結果排序,并提供排序結果;如果沒有查找到,不需要提供; 提供搜索建議后,等待用戶選擇,如果用戶選擇,將把對應詞和詞組的使用頻率加1,如 果沒有選擇,又開始輸入新的字符,將重復之前的流程。
【文檔編號】G06F17/30GK104462369SQ201410747130
【公開日】2015年3月25日 申請日期:2014年12月8日 優(yōu)先權日:2014年12月8日
【發(fā)明者】解威, 李濰希, 于航, 孫浩增, 朱小瑩 申請人:沈陽美行科技有限公司