亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種產(chǎn)品實時搜索方法

文檔序號:6352757閱讀:140來源:國知局
專利名稱:一種產(chǎn)品實時搜索方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)搜索技術(shù),尤其是一種產(chǎn)品實時搜索方法。
背景技術(shù)
目前,搜索引擎已經(jīng)和人們的生活息息相關(guān),為我們的生活提供了極大的便利。傳 統(tǒng)的搜索引擎均采用基于文本的搜索方法,這些搜索引擎能夠根據(jù)文本關(guān)鍵字讓用戶準確 地找到所需信息,但是它無法告知用戶諸如“最便宜的水族箱”這類問題。在產(chǎn)品搜索這一 特定領(lǐng)域,用戶需要對產(chǎn)品的價格、歸屬地、屬性特征等進行精確查找,進而找到自己想要 的產(chǎn)品;同時,產(chǎn)品的價格等屬性可能是實時變化的,傳統(tǒng)搜索引擎建立快照的方式勢必會 導(dǎo)致價格等屬性的不準確性,因此傳統(tǒng)的基于文本的搜索方法已經(jīng)滿足不了產(chǎn)品的搜索需 求。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種產(chǎn)品實時搜索方法,該搜索 方法能夠?qū)Ξa(chǎn)品的價格、歸屬地、各種屬性特征進行精確搜索,并能實時更新產(chǎn)品的信息, 滿足搜索用戶快速、準確地找到自己想要產(chǎn)品的需要。本發(fā)明解決其技術(shù)問題是采取以下技術(shù)方案實現(xiàn)的一種產(chǎn)品實時搜索方法,其特征在于包括產(chǎn)品索引和產(chǎn)品搜索方法,其采用的方 法步驟如下(1)產(chǎn)品索引搜索采用統(tǒng)一的索引結(jié)構(gòu),將索引數(shù)據(jù)分為字段和屬性兩部分,字 段部分包括需要提供全文檢索文本內(nèi)容的產(chǎn)品名稱和產(chǎn)品關(guān)鍵字數(shù)據(jù);屬性部分包括需要 提供篩選內(nèi)容的產(chǎn)品價格、歸屬地和分類數(shù)據(jù);(2)數(shù)據(jù)查詢搜索首先采用變元分詞方法對用戶關(guān)鍵字進行分詞,然后啟用語 法分析引擎對分詞結(jié)果進行分析理解和過濾,最后提交到搜索查詢器,由搜索查詢器檢索 分析后的關(guān)鍵字,返回搜索結(jié)果。而且,所述的統(tǒng)一的索引結(jié)構(gòu)采用如下兩種形式之一 (1)使用統(tǒng)一的數(shù)據(jù)庫結(jié) 構(gòu),將對產(chǎn)品的索引轉(zhuǎn)換成了對數(shù)據(jù)庫的數(shù)據(jù)索引;(2)使用XML標準來索引,而且,所述產(chǎn)品索引搜索還包括產(chǎn)品索引的更新,其更新方法為當(dāng)產(chǎn)品更新時, 產(chǎn)品發(fā)布者通過數(shù)據(jù)庫或者XML的方式實時反饋到搜索數(shù)據(jù)中心,更新產(chǎn)品索引數(shù)據(jù)。而且,所述的變元分詞方法為對用戶輸入的詞語按照其長度計算該詞語的變元 長度;設(shè)置切分步進值;按照變元長度及切分步進值對輸入的詞語進行切分。而且,所述的變元長度的計算方法為將詞語的長度開平方,然后取整數(shù)便得到變 元長度。而且,所述的切分步進值為1 5。本發(fā)明的優(yōu)點和積極效果是本搜索方法采用兩種形式的索引形式并能夠?qū)λ饕龜?shù)據(jù)進行實時更新,還提供基于關(guān)鍵字的全文檢索和基于屬性的篩選,能讓用戶更方便地找到自己需要的信息,同時采 用變元分詞技術(shù),實現(xiàn)對產(chǎn)品的精確搜索功能,使得用戶在搜索一個產(chǎn)品的時候,并不是簡 單的找到符合我搜索關(guān)鍵字的結(jié)果,而是需要對產(chǎn)品價格、歸屬地、分類屬性等進行精確地 篩選。解決了產(chǎn)品的搜索問題,可廣泛用于電子商務(wù)搜索等對搜索精度高的搜索領(lǐng)域。
具體實施例方式以下對本發(fā)明實施例做進一步詳述。一種產(chǎn)品實時搜索方法,包括產(chǎn)品索引和產(chǎn)品搜索方法,其采用的方法步驟如 下(1)產(chǎn)品索引搜索采用統(tǒng)一的索引結(jié)構(gòu),將索引數(shù)據(jù)分為字段和屬性兩部分,字 段部分包括需要提供全文檢索文本內(nèi)容的產(chǎn)品名稱和產(chǎn)品關(guān)鍵字數(shù)據(jù);屬性部分包括需要 提供篩選內(nèi)容的產(chǎn)品價格、歸屬地、分類數(shù)據(jù);通過這種索引方式,使搜索“最便宜的水族 箱”成為可能。該統(tǒng)一的索引結(jié)構(gòu)包括以下兩種形式(1)統(tǒng)一的數(shù)據(jù)庫結(jié)構(gòu),將產(chǎn)品的索引轉(zhuǎn) 換成了對數(shù)據(jù)庫的數(shù)據(jù)索引,這種形式是屬于會員站的形式,即所有產(chǎn)品的發(fā)布站點都是 搜索引擎系統(tǒng)的會員;(2) XML標準來索引。產(chǎn)品索引搜索還包括產(chǎn)品索引的更新,其更新方法為當(dāng)產(chǎn)品更新時,產(chǎn)品發(fā)布者 通過數(shù)據(jù)庫或者XML的方式實時反饋到搜索數(shù)據(jù)中心,更新搜索數(shù)據(jù),這種方式用來索引 非會員站的數(shù)據(jù)。(2)數(shù)據(jù)查詢搜索首先采用變元分詞方法對用戶關(guān)鍵字進行分詞,然后啟用語 法分析引擎對分詞結(jié)果進行分析理解,過濾掉無用信息后提交到搜索查詢器,搜索查詢器 檢索分析后的關(guān)鍵字,返回搜索結(jié)果。用戶根據(jù)結(jié)果進一步進行分類篩選,價格排序等操 作,從而找到自己最感興趣的產(chǎn)品。上述變元分詞方法是使用如下方法實現(xiàn)的對用戶輸入的詞語按照其長度計算該 詞語的變元長度,其計算方法為將詞語的長度開平方,然后取整數(shù)便得到變元長度;設(shè)置 切分步進值,該切分步進值為1 5 ;按照變元長度及切分步進值對輸入的詞語進行切分。 例如用戶輸入詞語的長度為10,然后按照規(guī)則來計算可變元長度,將詞語的長度10開方后 取整,則得到變元長度3 ;將切分步進值設(shè)置為1,最后,根據(jù)變元長度及切分步進值來切分 用戶輸入的詞語。需要強調(diào)的是,本發(fā)明所述的實施例是說明性的,而不是限定性的,因此本發(fā)明并 不限于具體實施方式
中所述的實施例,凡是由本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出 的其他實施方式,同樣屬于本發(fā)明保護的范圍。
權(quán)利要求
一種產(chǎn)品實時搜索方法,其特征在于包括產(chǎn)品索引和產(chǎn)品搜索方法,其采用的方法步驟如下(1)產(chǎn)品索引搜索采用統(tǒng)一的索引結(jié)構(gòu),將索引數(shù)據(jù)分為字段和屬性兩部分,字段部分包括需要提供全文檢索文本內(nèi)容的產(chǎn)品名稱和產(chǎn)品關(guān)鍵字數(shù)據(jù);屬性部分包括需要提供篩選內(nèi)容的產(chǎn)品價格、歸屬地和分類數(shù)據(jù);(2)數(shù)據(jù)查詢搜索首先采用變元分詞方法對用戶關(guān)鍵字進行分詞,然后啟用語法分析引擎對分詞結(jié)果進行分析理解和過濾,最后提交到搜索查詢器,由搜索查詢器檢索分析后的關(guān)鍵字,返回搜索結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種產(chǎn)品實時搜索方法,其特征在于所述的統(tǒng)一的索引結(jié) 構(gòu)采用如下兩種形式之一 (1)使用統(tǒng)一的數(shù)據(jù)庫結(jié)構(gòu),將對產(chǎn)品的索引轉(zhuǎn)換成了對數(shù)據(jù) 庫的數(shù)據(jù)索引;(2)使用XML標準來索引,
3.根據(jù)權(quán)利要求1所述的一種產(chǎn)品實時搜索方法,其特征在于所述產(chǎn)品索引搜索還 包括產(chǎn)品索引的更新,其更新方法為當(dāng)產(chǎn)品更新時,產(chǎn)品發(fā)布者通過數(shù)據(jù)庫或者XML的方 式實時反饋到搜索數(shù)據(jù)中心,更新產(chǎn)品索引數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的一種產(chǎn)品實時搜索方法,其特征在于所述的變元分詞方法 為對用戶輸入的詞語按照其長度計算該詞語的變元長度;設(shè)置切分步進值;按照變元長 度及切分步進值對輸入的詞語進行切分。
5.根據(jù)權(quán)利要求4所述的一種產(chǎn)品實時搜索方法,其特征在于所述的變元長度的計 算方法為將詞語的長度開平方,然后取整數(shù)便得到變元長度。
6.根據(jù)權(quán)利要求4所述的一種產(chǎn)品實時搜索方法,其特征在于所述的切分步進值為 1 5。
全文摘要
本發(fā)明涉及一種產(chǎn)品實時搜索方法,包括以下步驟(1)產(chǎn)品索引搜索采用統(tǒng)一的索引結(jié)構(gòu),將索引數(shù)據(jù)分為字段和屬性兩部分,字段部分包括需要提供全文檢索文本內(nèi)容的產(chǎn)品名稱和產(chǎn)品關(guān)鍵字數(shù)據(jù);屬性部分包括需要提供篩選內(nèi)容的產(chǎn)品價格、歸屬地和分類數(shù)據(jù);(2)數(shù)據(jù)查詢搜索首先采用變元分詞方法對用戶關(guān)鍵字進行分詞,然后啟用語法分析引擎對分詞結(jié)果進行分析理解和過濾,最后提交到搜索查詢器,由搜索查詢器檢索分析后的關(guān)鍵字,返回搜索結(jié)果。本發(fā)明能夠?qū)λ饕龜?shù)據(jù)進行實時更新,并提供基于關(guān)鍵字的全文檢索和基于屬性的篩選,實現(xiàn)對產(chǎn)品的精確搜索功能,可廣泛用于電子商務(wù)搜索等對搜索精度高的搜索領(lǐng)域。
文檔編號G06F17/30GK101937433SQ20091006947
公開日2011年1月5日 申請日期2009年6月29日 優(yōu)先權(quán)日2009年6月29日
發(fā)明者劉霞, 徐純芳, 趙鵬 申請人:天津一度搜索網(wǎng)絡(luò)科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1