一種連續(xù)字符串的切分方法和裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種連續(xù)字符串的切分方法和裝置,屬于網(wǎng)絡(luò)通信領(lǐng)域。方法包括:接收用戶(hù)輸入的連續(xù)字符串;獲取所述連續(xù)字符串的切分資源;所述切分資源為與所述連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串和/或與所述連續(xù)字符串相匹配且所述用戶(hù)修改次數(shù)最多的字符串;根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分。裝置包括:接收模塊、獲取模塊和切分模塊。本發(fā)明解決了現(xiàn)有技術(shù)對(duì)于新詞技術(shù)無(wú)法匹配以及切分存在歧義導(dǎo)致的切分錯(cuò)誤的問(wèn)題,實(shí)現(xiàn)了對(duì)連續(xù)字符串的準(zhǔn)確切分。
【專(zhuān)利說(shuō)明】一種連續(xù)字符串的切分方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)通信領(lǐng)域,特別涉及一種連續(xù)字符串的切分方法和裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,用戶(hù)越來(lái)越依賴(lài)于搜索引擎來(lái)搜索所需要的信息,在使用搜索引擎時(shí),用戶(hù)經(jīng)常會(huì)輸入連續(xù)字符串,這就需要對(duì)輸入的連續(xù)字符串進(jìn)行切分,以便更好的搜索到用戶(hù)需要的信息。
[0003]目前對(duì)連續(xù)字符串的切分方法,主要是對(duì)連續(xù)英文串以及連續(xù)英文數(shù)字組合串利用固定的英文詞典,對(duì)輸入的連續(xù)英文串以及連續(xù)英文數(shù)字組合串進(jìn)行匹配,然后得到切分結(jié)果,例如,輸入“gohome”,“go”和“home”在詞典中存在那么進(jìn)行匹配,得到這個(gè)英文串是由“go”和“home”兩個(gè)單詞構(gòu)成,那么切分結(jié)果為“go home”。
[0004]在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題:
[0005]現(xiàn)有對(duì)連續(xù)字符串中的連續(xù)英文串以及連續(xù)英文數(shù)字組合串利用英文詞典進(jìn)行切分的方法,一方面,由于互聯(lián)網(wǎng)的網(wǎng)絡(luò)上的新詞不斷更新,對(duì)于用戶(hù)輸入的這些新詞時(shí)無(wú)法找到固定的詞表來(lái)匹配,例如:win7, gaga等;另一方面,根據(jù)英文詞典對(duì)連續(xù)英文串以及連續(xù)英文數(shù)字組合串進(jìn)行匹配切分,會(huì)存在很大切分歧義,從而導(dǎo)致切分錯(cuò)誤。
【發(fā)明內(nèi)容】
[0006]為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種連續(xù)字符串的切分方法和裝置。所述技術(shù)方案如下:
[0007]一方面,提供了一種連續(xù)字符串的切分方法,所述方法包括:
[0008]接收用戶(hù)輸入的連續(xù)字符串;
[0009]獲取所述連續(xù)字符串的切分資源;所述切分資源為與所述連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串和/或與所述連續(xù)字符串相匹配且所述用戶(hù)修改次數(shù)最多的字符串;
[0010]根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分。
[0011]具體地,所述獲取所述連續(xù)字符串的切分資源,包括:
[0012]從搜索引擎的查詢(xún)?nèi)罩局蝎@取所述連續(xù)字符串的切分資源;
[0013]和/ 或,
[0014]從所述搜索引擎中所述用戶(hù)的會(huì)話日志中獲取所述連續(xù)字符串的切分資源。
[0015]進(jìn)一步地,所述從所述搜索引擎的查詢(xún)?nèi)罩局蝎@取所述連續(xù)字符串的切分資源,具體包括:
[0016]在所述搜索引擎中獲取預(yù)設(shè)時(shí)間內(nèi)的查詢(xún)?nèi)罩?,所述查?xún)?nèi)罩景ㄋ杏脩?hù)在搜索引擎中的查詢(xún)記錄;
[0017]從所述查詢(xún)?nèi)罩局胁檎遗c所述連續(xù)字符串相匹配的至少一個(gè)切分查詢(xún)結(jié)果,并獲取所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)以及所述連續(xù)字符串的查詢(xún)次數(shù);
[0018]當(dāng)所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)時(shí),從查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)的切分查詢(xún)結(jié)果中選擇查詢(xún)次數(shù)最多的切分查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
[0019]進(jìn)一步地,所述從所述搜索引擎中所述用戶(hù)的會(huì)話日志中獲取所述連續(xù)字符串的切分資源,具體包括:
[0020]在所述搜索引擎中獲取保存的所述用戶(hù)的會(huì)話日志,所述會(huì)話日志為根據(jù)預(yù)設(shè)的時(shí)間閾值進(jìn)行劃分的會(huì)話日志;
[0021]從所述用戶(hù)的會(huì)話日志中查找與所述連續(xù)字符串相匹配的至少一個(gè)會(huì)話查詢(xún)結(jié)果,并獲取所述會(huì)話查詢(xún)結(jié)果的修改次數(shù);所述會(huì)話查詢(xún)結(jié)果為所述用戶(hù)在所述會(huì)話日志中對(duì)所述連續(xù)字符串進(jìn)行改寫(xiě)且改寫(xiě)后被所述用戶(hù)點(diǎn)擊的字符串;
[0022]從獲取的至少一個(gè)所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
[0023]進(jìn)一步地,所述從獲取的至少一個(gè)所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源,具體包括:
[0024]從所述搜索引擎中獲取所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)和所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù),并獲取所述連續(xù)字符串的檢索次數(shù)和所述連續(xù)字符串的點(diǎn)擊次數(shù);
[0025]當(dāng)所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)大于所述連續(xù)字符串的檢索次數(shù)且所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù)大于所述連續(xù)字符串的點(diǎn)擊次數(shù)時(shí),從檢索次數(shù)和點(diǎn)擊次數(shù)分別都大于所述連續(xù)字符串的檢索次數(shù)和點(diǎn)擊次數(shù)的所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
[0026]具體地,所述根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分之后,還包括:
[0027]在所述搜索引擎中顯示所述連續(xù)字符串的切分結(jié)果。
[0028]另一方面,提供了一種連續(xù)字符串的切分裝置,所述裝置包括:
[0029]接收模塊,用于接收用戶(hù)輸入的連續(xù)字符串;
[0030]獲取模塊,用于獲取所述連續(xù)字符串的切分資源;所述切分資源為與所述連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串和/或與所述連續(xù)字符串相匹配且所述用戶(hù)修改次數(shù)最多的字符串;
[0031]切分模塊,用于根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分。
[0032]具體地,所述獲取模塊,包括:
[0033]第一獲取單元,用于從搜索引擎的查詢(xún)?nèi)罩局蝎@取所述連續(xù)字符串的切分資源;
[0034]第二獲取單元,用于從所述搜索引擎中所述用戶(hù)的會(huì)話日志中獲取所述連續(xù)字符串的切分資源。
[0035]進(jìn)一步地,所述第一獲取單元,具體包括:
[0036]查詢(xún)?nèi)罩咀訂卧?,用于在所述搜索引擎中獲取預(yù)設(shè)時(shí)間內(nèi)的查詢(xún)?nèi)罩?,所述查?xún)?nèi)罩景ㄋ杏脩?hù)在搜索引擎中的查詢(xún)記錄;
[0037]切分查詢(xún)結(jié)果子單元,用于從所述查詢(xún)?nèi)罩局胁檎遗c所述連續(xù)字符串相匹配的至少一個(gè)切分查詢(xún)結(jié)果,并獲取所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)以及所述連續(xù)字符串的查詢(xún)次數(shù);[0038]選擇切分查詢(xún)子單元,用于當(dāng)所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)時(shí),從查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)的切分查詢(xún)結(jié)果中選擇查詢(xún)次數(shù)最多的切分查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
[0039]進(jìn)一步地,所述第二獲取單元,具體包括:
[0040]會(huì)話日志子單元,用于在所述搜索引擎中獲取保存的所述用戶(hù)的會(huì)話日志,所述會(huì)話日志為根據(jù)預(yù)設(shè)的時(shí)間閾值進(jìn)行劃分的會(huì)話日志;
[0041]會(huì)話查詢(xún)結(jié)果子單元,用于從所述用戶(hù)的會(huì)話日志中查找與所述連續(xù)字符串相匹配的至少一個(gè)會(huì)話查詢(xún)結(jié)果,并獲取所述會(huì)話查詢(xún)結(jié)果的修改次數(shù);所述會(huì)話查詢(xún)結(jié)果為所述用戶(hù)在所述會(huì)話日志中對(duì)所述連續(xù)字符串進(jìn)行改寫(xiě)且改寫(xiě)后被所述用戶(hù)點(diǎn)擊的字符串;
[0042]選擇會(huì)話查詢(xún)子單元,用于從獲取的至少一個(gè)所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
[0043]進(jìn)一步地,所述選擇會(huì)話查詢(xún)子單元,具體用于從所述搜索引擎中獲取所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)和所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù),并獲取所述連續(xù)字符串的檢索次數(shù)和所述連續(xù)字符串的點(diǎn)擊次數(shù);
[0044]當(dāng)所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)大于所述連續(xù)字符串的檢索次數(shù)且所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù)大于所述連續(xù)字符串的點(diǎn)擊次數(shù)時(shí),從檢索次數(shù)和點(diǎn)擊次數(shù)分別都大于所述連續(xù)字符串的檢索次數(shù)和點(diǎn)擊次數(shù)的所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
[0045]具體地,所述裝置還包括:
[0046]顯示模塊,用于所述切分模塊根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分之后,在所述搜索引擎中顯示所述連續(xù)字符串的切分結(jié)果。
[0047]本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
[0048]通過(guò)獲取用戶(hù)在搜索引擎中輸入的連續(xù)字符串的切分資源,根據(jù)從搜索引擎中獲取的連續(xù)字符串的切分資源對(duì)連續(xù)字符串進(jìn)行匹配切分,解決了現(xiàn)有技術(shù)對(duì)于新詞技術(shù)無(wú)法匹配以及切分存在歧義導(dǎo)致的切分錯(cuò)誤的問(wèn)題,實(shí)現(xiàn)了對(duì)連續(xù)字符串的準(zhǔn)確切分。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0049]為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0050]圖1是本發(fā)明實(shí)施例一提供的連續(xù)字符串的切分方法流程圖;
[0051]圖2是本發(fā)明實(shí)施例二提供的連續(xù)字符串的切分方法流程圖;
[0052]圖3是本發(fā)明實(shí)施例三提供的連續(xù)字符串的切分方法流程圖;
[0053]圖4是本發(fā)明實(shí)施例四提供的連續(xù)字符串的切分方法流程圖;
[0054]圖5是本發(fā)明實(shí)施例五提供的連續(xù)字符串的切分裝置第一種結(jié)構(gòu)示意圖;
[0055]圖6是本發(fā)明實(shí)施例五提供的連續(xù)字符串的切分裝置第二種結(jié)構(gòu)示意圖;
[0056]圖7是本發(fā)明實(shí)施例五提供的連續(xù)字符串的切分裝置第三種結(jié)構(gòu)示意圖?!揪唧w實(shí)施方式】
[0057]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0058]實(shí)施例一
[0059]參見(jiàn)圖1,本發(fā)明實(shí)施例提供了一種連續(xù)字符串的切分方法,該方法包括:
[0060]101、接收用戶(hù)輸入的連續(xù)字符串;
[0061]102、獲取連續(xù)字符串的切分資源;該切分資源為與連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串和/或與連續(xù)字符串相匹配且用戶(hù)修改次數(shù)最多的字符串;
[0062]103、根據(jù)獲取的連續(xù)字符串的切分資源對(duì)連續(xù)字符串進(jìn)行切分。
[0063]具體地,獲取連續(xù)字符串的切分資源,包括:
[0064]從搜索引擎的查詢(xún)?nèi)罩局蝎@取連續(xù)字符串的切分資源;
[0065]和/ 或,
[0066]從搜索引擎中用戶(hù)的會(huì)話日志中獲取連續(xù)字符串的切分資源。
[0067]進(jìn)一步地,從搜索引擎的查詢(xún)?nèi)罩局蝎@取連續(xù)字符串的切分資源,具體包括:
[0068]在搜索引擎中獲取預(yù)設(shè)時(shí)間內(nèi)的查詢(xún)?nèi)罩荆樵?xún)?nèi)罩景ㄋ杏脩?hù)在搜索引擎中的查詢(xún)記錄;
[0069]從查詢(xún)?nèi)罩局胁檎遗c連續(xù)字符串相匹配的至少一個(gè)切分查詢(xún)結(jié)果,并獲取切分查詢(xún)結(jié)果的查詢(xún)次數(shù)以及連續(xù)字符串的查詢(xún)次數(shù);
[0070]當(dāng)切分查詢(xún)結(jié)果的查詢(xún)次數(shù)大于連續(xù)字符串的查詢(xún)次數(shù)時(shí),從查詢(xún)次數(shù)大于連續(xù)字符串的查詢(xún)次數(shù)的切分查詢(xún)結(jié)果中選擇查詢(xún)次數(shù)最多的切分查詢(xún)結(jié)果作為連續(xù)字符串的切分資源。
[0071]進(jìn)一步地,從搜索引擎中用戶(hù)的會(huì)話日志中獲取連續(xù)字符串的切分資源,具體包括:
[0072]在搜索引擎中獲取保存的用戶(hù)的會(huì)話日志,會(huì)話日志為根據(jù)預(yù)設(shè)的時(shí)間閾值進(jìn)行劃分的會(huì)話日志;
[0073]從用戶(hù)的會(huì)話日志中查找與連續(xù)字符串相匹配的至少一個(gè)會(huì)話查詢(xún)結(jié)果,并獲取會(huì)話查詢(xún)結(jié)果的修改次數(shù);該會(huì)話查詢(xún)結(jié)果為用戶(hù)在會(huì)話日志中對(duì)連續(xù)字符串進(jìn)行改寫(xiě)且改寫(xiě)后被用戶(hù)點(diǎn)擊的字符串;
[0074]從獲取的至少一個(gè)會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為連續(xù)字符串的切分資源。
[0075]進(jìn)一步地,從獲取的至少一個(gè)會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為連續(xù)字符串的切分資源,具體包括:
[0076]從搜索引擎中獲取會(huì)話查詢(xún)結(jié)果的檢索次數(shù)和會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù),并獲取連續(xù)字符串的檢索次數(shù)和連續(xù)字符串的點(diǎn)擊次數(shù);
[0077]當(dāng)會(huì)話查詢(xún)結(jié)果的檢索次數(shù)大于連續(xù)字符串的檢索次數(shù)且會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù)大于連續(xù)字符串的點(diǎn)擊次數(shù)時(shí),從檢索次數(shù)和點(diǎn)擊次數(shù)分別都大于連續(xù)字符串的檢索次數(shù)和點(diǎn)擊次數(shù)的會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為連續(xù)字符串的切分資源。[0078]具體地,根據(jù)獲取的連續(xù)字符串的切分資源對(duì)連續(xù)字符串進(jìn)行切分之后,還包括:
[0079]在搜索引擎中顯示連續(xù)字符串的切分結(jié)果。
[0080]本發(fā)明實(shí)施例提供的方法,通過(guò)獲取用戶(hù)在搜索引擎中輸入的連續(xù)字符串的切分資源,根據(jù)從搜索引擎中獲取的連續(xù)字符串的切分資源對(duì)連續(xù)字符串進(jìn)行匹配切分,解決了現(xiàn)有技術(shù)對(duì)于新詞技術(shù)無(wú)法匹配以及切分存在歧義導(dǎo)致的切分錯(cuò)誤的問(wèn)題,實(shí)現(xiàn)了對(duì)連續(xù)字符串的準(zhǔn)確切分。
[0081]實(shí)施例二
[0082]參見(jiàn)圖2,本發(fā)明實(shí)施例提供了一種連續(xù)字符串的切分方法,該方法包括:
[0083]201、接收用戶(hù)輸入的連續(xù)字符串;
[0084]具體地,用戶(hù)在搜索引擎中輸入連續(xù)字符串,也可以為連續(xù)字符串和中文的組合,只需對(duì)其中的連續(xù)字符串處理即可;其中,本發(fā)明實(shí)施例中的連續(xù)數(shù)字英文數(shù)字串,可以是純英文數(shù)字串如f Iashgetdownload,也可以是英文和數(shù)字的組合串,如win7。
[0085]202、從搜索引擎的查詢(xún)?nèi)罩局蝎@取連續(xù)字符串的切分資源;該切分資源為與連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串;
[0086]具體地,首先,在搜索引擎中獲取預(yù)設(shè)時(shí)間內(nèi)的查詢(xún)?nèi)罩?,查?xún)?nèi)罩景ㄋ杏脩?hù)在搜索引擎中的查詢(xún)記錄;其中,預(yù)設(shè)時(shí)間可以根據(jù)情況靈活設(shè)置,比如可以設(shè)置90天;所獲取的查詢(xún)?nèi)罩局邪ㄋ械挠脩?hù)在搜索引擎中的查詢(xún)記錄,不僅僅是用戶(hù)本身。
[0087]其次,從查詢(xún)?nèi)罩局胁檎遗c連續(xù)字符串相匹配的至少一個(gè)切分查詢(xún)結(jié)果,并獲取切分查詢(xún)結(jié)果的查詢(xún)次數(shù)以及連續(xù)字符串的查詢(xún)次數(shù);其中,本發(fā)明實(shí)施例中與連續(xù)字符串相匹配的切分查詢(xún)結(jié)果是指與連續(xù)字符串只差空格的切分查詢(xún)結(jié)果,該切分查詢(xún)結(jié)果可能為一個(gè)也可能為多個(gè);如表1所示:連續(xù)字符串dreamhigh2的查詢(xún)次數(shù)為7181,在查詢(xún)?nèi)罩局械那蟹植樵?xún)結(jié)果dream high2的查詢(xún)次數(shù)為40062、切分查詢(xún)結(jié)果dream high 2的查詢(xún)次數(shù)為10000。
[0088]表1
[0089]
【權(quán)利要求】
1.一種連續(xù)字符串的切分方法,其特征在于,所述方法包括: 接收用戶(hù)輸入的連續(xù)字符串; 獲取所述連續(xù)字符串的切分資源;所述切分資源為與所述連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串和/或與所述連續(xù)字符串相匹配且所述用戶(hù)修改次數(shù)最多的字符串;根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述連續(xù)字符串的切分資源,包括: 從搜索引擎的查詢(xún)?nèi)罩局蝎@取所述連續(xù)字符串的切分資源; 和/或, 從所述搜索引擎中所述用戶(hù)的會(huì)話日志中獲取所述連續(xù)字符串的切分資源。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述從所述搜索引擎的查詢(xún)?nèi)罩局蝎@取所述連續(xù)字符串的切分資源,具體包括: 在所述搜索引擎中獲取預(yù)設(shè)時(shí)間內(nèi)的查詢(xún)?nèi)罩?,所述查?xún)?nèi)罩景ㄋ杏脩?hù)在搜索引擎中的查詢(xún)記錄; 從所述查詢(xún)?nèi)罩局胁檎遗c所述連續(xù)字符串相匹配的至少一個(gè)切分查詢(xún)結(jié)果,并獲取所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)以及所述連續(xù)字符串的查詢(xún)次數(shù); 當(dāng)所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)時(shí),從查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)的切分查詢(xún)結(jié)果中選擇查詢(xún)次數(shù)最多的切分查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述從所述搜索引擎中所述用戶(hù)的會(huì)話日志中獲取所述連續(xù)字符串的切分資源,具體包括: 在所述搜索引擎中獲取保存的所述用戶(hù)的會(huì)話日志,所述會(huì)話日志為根據(jù)預(yù)設(shè)的時(shí)間閾值進(jìn)行劃分的會(huì)話日志; 從所述用戶(hù)的會(huì)話日志中查找與所述連續(xù)字符串相匹配的至少一個(gè)會(huì)話查詢(xún)結(jié)果,并獲取所述會(huì)話查詢(xún)結(jié)果的修改次數(shù);所述會(huì)話查詢(xún)結(jié)果為所述用戶(hù)在所述會(huì)話日志中對(duì)所述連續(xù)字符串進(jìn)行改寫(xiě)且改寫(xiě)后被所述用戶(hù)點(diǎn)擊的字符串; 從獲取的至少一個(gè)所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述從獲取的至少一個(gè)所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源,具體包括: 從所述搜索引擎中獲取所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)和所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù),并獲取所述連續(xù)字符串的檢索次數(shù)和所述連續(xù)字符串的點(diǎn)擊次數(shù); 當(dāng)所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)大于所述連續(xù)字符串的檢索次數(shù)且所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù)大于所述連續(xù)字符串的點(diǎn)擊次數(shù)時(shí),從檢索次數(shù)和點(diǎn)擊次數(shù)分別都大于所述連續(xù)字符串的檢索次數(shù)和點(diǎn)擊次數(shù)的所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分之后,還包括: 在所述搜索引擎中顯示所述連續(xù)字符串的切分結(jié)果。
7.—種連續(xù)字符串的切分裝置,其特征在于,所述裝置包括: 接收模塊,用于接收用戶(hù)輸入的連續(xù)字符串; 獲取模塊,用于獲取所述連續(xù)字符串的切分資源;所述切分資源為與所述連續(xù)字符串相匹配且查詢(xún)次數(shù)最多的字符串和/或與所述連續(xù)字符串相匹配且所述用戶(hù)修改次數(shù)最多的字符串; 切分模塊,用于根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述獲取模塊,包括: 第一獲取單元,用于從搜索引擎的查詢(xún)?nèi)罩局蝎@取所述連續(xù)字符串的切分資源; 第二獲取單元,用于從所述搜索引擎中所述用戶(hù)的會(huì)話日志中獲取所述連續(xù)字符串的切分資源。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第一獲取單元,具體包括: 查詢(xún)?nèi)罩咀訂卧?,用于在所述搜索引擎中獲取預(yù)設(shè)時(shí)間內(nèi)的查詢(xún)?nèi)罩?,所述查?xún)?nèi)罩景ㄋ杏脩?hù)在搜索引擎中的查詢(xún)記錄; 切分查詢(xún)結(jié)果子單元,用于從所述查詢(xún)?nèi)罩局胁檎遗c所述連續(xù)字符串相匹配的至少一個(gè)切分查詢(xún)結(jié)果,并獲取所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)以及所述連續(xù)字符串的查詢(xún)次數(shù); 選擇切分查詢(xún)子單元,用于當(dāng)所述切分查詢(xún)結(jié)果的查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)時(shí),從查詢(xún)次數(shù)大于所述連續(xù)字符串的查詢(xún)次數(shù)的切分查詢(xún)結(jié)果中選擇查詢(xún)次數(shù)最多的切分查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第二獲取單元,具體包括: 會(huì)話日志子單元,用于在所述搜索引擎中獲取保存的所述用戶(hù)的會(huì)話日志,所述會(huì)話日志為根據(jù)預(yù)設(shè)的時(shí)間閾值進(jìn)行劃分的會(huì)話日志; 會(huì)話查詢(xún)結(jié)果子單元,用于從所述用戶(hù)的會(huì)話日志中查找與所述連續(xù)字符串相匹配的至少一個(gè)會(huì)話查詢(xún)結(jié)果,并獲取所述會(huì)話查詢(xún)結(jié)果的修改次數(shù);所述會(huì)話查詢(xún)結(jié)果為所述用戶(hù)在所述會(huì)話日志中對(duì)所述連續(xù)字符串進(jìn)行改寫(xiě)且改寫(xiě)后被所述用戶(hù)點(diǎn)擊的字符串; 選擇會(huì)話查詢(xún)子單元,用于從獲取的至少一個(gè)所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述選擇會(huì)話查詢(xún)子單元,具體用于從所述搜索引擎中獲取所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)和所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù),并獲取所述連續(xù)字符串的檢索次數(shù)和所述連續(xù)字符串的點(diǎn)擊次數(shù); 當(dāng)所述會(huì)話查詢(xún)結(jié)果的檢索次數(shù)大于所述連續(xù)字符串的檢索次數(shù)且所述會(huì)話查詢(xún)結(jié)果的點(diǎn)擊次數(shù)大于所述連續(xù)字符串的點(diǎn)擊次數(shù)時(shí),從檢索次數(shù)和點(diǎn)擊次數(shù)分別都大于所述連續(xù)字符串的檢索次數(shù)和點(diǎn)擊次數(shù)的所述會(huì)話查詢(xún)結(jié)果中選擇修改次數(shù)最多的會(huì)話查詢(xún)結(jié)果作為所述連續(xù)字符串的切分資源。
12.根 據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 顯示模塊,用于所述切分模塊根據(jù)獲取的所述連續(xù)字符串的切分資源對(duì)所述連續(xù)字符串進(jìn)行切分之后,在所述搜索引擎中顯示所述連續(xù)字符串的切分結(jié)果。
【文檔編號(hào)】G06F17/30GK103778138SQ201210401107
【公開(kāi)日】2014年5月7日 申請(qǐng)日期:2012年10月19日 優(yōu)先權(quán)日:2012年10月19日
【發(fā)明者】李超, 宋國(guó)龍, 李磊 申請(qǐng)人:深圳市世紀(jì)光速信息技術(shù)有限公司