專利名稱:一種商品名稱和型號智能識別系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及商品名稱和型號智能識別系統(tǒng)和方法,尤其是在電子商務(wù)領(lǐng)域自動識別商品名稱和型號的智能信息處理技術(shù)的系統(tǒng)及方法。
背景技術(shù):
現(xiàn)在互聯(lián)網(wǎng)已經(jīng)成為人們購物及企業(yè)銷售的重要途徑,提供網(wǎng)上商品銷售服務(wù)的網(wǎng)站也非常的多。而針對購物的應(yīng)用工具也逐漸增多,比如針對購物的購物搜索、LBS等。 然而因為商家對商品的標(biāo)題描述的不一致,導(dǎo)致計算機對商品的后續(xù)處理變得很難,比如對同一款液晶顯示器,可能的商品名描述為1)情人節(jié)禮物超大液晶顯示器;2)超薄超寬彩色液晶顯示器送耳機。針對目前狀況,本發(fā)明采用人工智能的方式,對系統(tǒng)加以訓(xùn)練后, 能夠自動識別商品的名稱和型號,能有效的解決因商品名稱不規(guī)范而導(dǎo)致計算機很難對商品數(shù)據(jù)做后續(xù)處理的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明提供一種商品名稱和型號智能識別方法,根據(jù)互聯(lián)網(wǎng)電商提供的商品名稱、分類信息,自動識別出商品的名稱及型號,實現(xiàn)對商品的準(zhǔn)確標(biāo)識。
本發(fā)明的技術(shù)方案是一種商品名稱和型號智能識別系統(tǒng),它包括知識數(shù)據(jù)庫、學(xué)習(xí)系統(tǒng)和識別系統(tǒng)。知識數(shù)據(jù)庫是一個數(shù)據(jù)庫系統(tǒng),存儲了特征關(guān)鍵詞,及特征關(guān)鍵詞與商品的對應(yīng)關(guān)系。學(xué)習(xí)系統(tǒng)由一臺或多臺計算機組成,其連接知識數(shù)據(jù)庫,通過人工識別的方法來增加知識數(shù)據(jù)庫中特征關(guān)鍵詞及模式規(guī)則內(nèi)容,提高識別系統(tǒng)的自動識別的能力。識別系統(tǒng)由一臺或多臺計算機組成,其連接知識數(shù)據(jù)庫和待識別的商品數(shù)據(jù)庫, 它通過提起取商品的特征關(guān)鍵詞集合,結(jié)合知識數(shù)據(jù)庫的規(guī)則,準(zhǔn)確識別出商品的名稱和型號,對識別失敗的,需要推送該商品到學(xué)習(xí)系統(tǒng)。
一種商品名稱和型號智能識別系統(tǒng)及方法,它包括以下步驟a)學(xué)習(xí)系統(tǒng)從商品數(shù)據(jù)庫中讀入一個商品,并根據(jù)知識數(shù)據(jù)庫中的特征詞字典對商品原始標(biāo)題、類別、品牌進(jìn)行拆詞,形成以特征詞為基礎(chǔ)的一個集合。b)通過人工方式,對商品和型號名稱標(biāo)識,I)回寫入商品數(shù)據(jù)庫,2)并檢查該商品名為一個新的特征詞,如果是,則回寫入知識數(shù)據(jù)庫中,3)檢查新的特征詞集合是否為新的規(guī)則,如果是,則寫入知識庫數(shù)據(jù)庫中。c)識別系統(tǒng),從商品數(shù)據(jù)庫中讀入待識別的商品,并以知識數(shù)據(jù)庫中特征詞為基礎(chǔ)對商品的標(biāo)題、類別、品牌拆詞,形成一個特征詞的集合。d)根據(jù)商品的特征詞集合,總知識數(shù)據(jù)庫中讀取規(guī)則,根據(jù)規(guī)則中定義的商品名及型號對該商品重新命名。
識別流程見圖2,1)根據(jù)商品的原始標(biāo)題、分類和品牌,構(gòu)建商品的特征詞集合
2)檢查特征詞集合是否為空,如果為空,則無法識別
3)如果特征詞集合不為空,則從知識數(shù)據(jù)庫中根據(jù)特征詞集合讀取規(guī)則,如果讀取成功,則識別成功,否則
4)根據(jù)特征詞的創(chuàng)建時間,去除一個最近創(chuàng)建的特征詞,重復(fù)步驟2),直到無法識別或識別成功e)把新的商品名和型號寫回商品數(shù)據(jù)庫,如果識別失敗的,則標(biāo)識該商品需要學(xué)習(xí)系統(tǒng)人工處理并幫助系統(tǒng)建立新的規(guī)則。
本發(fā)明的有益效果通過本發(fā)明,系統(tǒng)能夠通過學(xué)習(xí),可以準(zhǔn)確識別商品的名稱和型號,為互聯(lián)網(wǎng)電子商務(wù)的應(yīng)用開發(fā)提供更有利的數(shù)據(jù)基礎(chǔ)。比如為購物搜索引擎提供更加準(zhǔn)確的搜索結(jié)果。
圖I是本發(fā)明的系統(tǒng)結(jié)構(gòu)2是本發(fā)明的系統(tǒng)中識別系統(tǒng)的流程圖具體實施方法實施例一下面結(jié)合圖2和實施例對本發(fā)明進(jìn)一步說明。I)現(xiàn)有四個商品A 耳機”,商品B 手機”,商品C 無線耳機”;商品D 智能手機,,2)通過學(xué)習(xí)系統(tǒng),人工處理商品A和商品B,商品A :耳機,學(xué)習(xí)系統(tǒng)創(chuàng)建特征詞耳機,及規(guī)則[耳機]_>耳機;商品B :手機,學(xué)習(xí)系統(tǒng)創(chuàng)建特征詞手機,及規(guī)則[手機]手機。3)系統(tǒng)看是自動處理商品C和商品D,處理商品C的特征詞集合為[耳機],從知識數(shù)據(jù)庫中提取特征詞集合[耳機]的對應(yīng)規(guī)則為耳機,則標(biāo)識商品名為耳機;商品D的特征詞集合為[手機],從知識數(shù)據(jù)庫中提取特征詞集合[手機]的對應(yīng)規(guī)則為手機,則標(biāo)識商品名為手機。實施例二 現(xiàn)以購物搜索為例,背景,用戶輸入某個關(guān)鍵詞比如耳機,他/她的真實愿望是能搜索到所有的耳機,而當(dāng)使用全文搜索引擎是,對兩個商品1)耳機,2)手機送耳機,都會成為關(guān)鍵結(jié)果,但是如何把這兩個商品區(qū)分開,給用戶一個準(zhǔn)確結(jié)果和相關(guān)結(jié)果?根據(jù)本專利技術(shù),第I)商品會被識別成真正的“耳機”,而第2)商品會被識別而為手機。最終搜索出現(xiàn)兩個結(jié)果,但第I)商品名識別為“耳機”為準(zhǔn)確結(jié)果,而第2)商品雖然也被搜索到了,但因為識別后的商品名不是“耳機”,因此作為相關(guān)結(jié)果顯示給用戶。本發(fā)明未涉及部分均與現(xiàn)有技術(shù)相同或可采用現(xiàn)有技術(shù)加以實現(xiàn)。
權(quán)利要求
1.一種互聯(lián)網(wǎng)上商品名稱和型號智能識別系統(tǒng)及方法,其特征在于它包括一個知識數(shù)據(jù)庫,用于存儲特征詞和以特征詞為基礎(chǔ)的規(guī)則表;學(xué)習(xí)系統(tǒng)以真實商品為基礎(chǔ),建立新的特征詞和規(guī)則;識別系統(tǒng)提取商品的特征詞集合,并根據(jù)特征詞提取規(guī)則以識別商品的名稱與型號。
2.如權(quán)利要求I所述的商品名稱和型號智能識別系統(tǒng)及方法,其特征在于它包括一個商品數(shù)據(jù)庫,用于存儲待識別和識別后的商品參數(shù)。
3.如權(quán)利要求I所述的商品名稱和型號智能識別系統(tǒng)及方法,其特征在于學(xué)習(xí)系統(tǒng)會創(chuàng)建新的特征詞和特征詞集合的規(guī)則,并把新的特征詞和創(chuàng)建時間存入知識庫。
4.如權(quán)利要求I所述的商品名稱和型號智能識別系統(tǒng)及方法,其特征在于特征詞集合是根據(jù)原始商品名稱、分類和品牌參數(shù)中的特征詞組成的。
5.如權(quán)利要求I所述的商品名稱和型號智能識別系統(tǒng)及方法,其特征在于商品識別是根據(jù)商品特征詞集合,從知識數(shù)據(jù)庫中查找該集合的規(guī)則,以此確定商品名稱及型號。
6.如權(quán)利要求5所述的商品名稱和型號智能識別系統(tǒng)及方法,其特征在于其識別的步驟為1)根據(jù)特征詞集合,從知識數(shù)據(jù)庫中查找規(guī)則2)如果查找失敗,去除最近創(chuàng)建的特征詞,并繼續(xù)查找,直到集合為空或查找到相應(yīng)規(guī)則為止。
全文摘要
一種商品名稱和型號智能識別系統(tǒng)及方法,它包括一個知識數(shù)據(jù)庫、學(xué)習(xí)系統(tǒng)和識別系統(tǒng)。針對目前電子商務(wù)中對商品命名不規(guī)范,導(dǎo)致計算機很難做后續(xù)處理。本發(fā)明能夠在人工訓(xùn)練的基礎(chǔ)上,自動識別商品的名稱與型號,為購物搜索以及其他以商品名和型號為基礎(chǔ)的應(yīng)用提供數(shù)據(jù)準(zhǔn)備基礎(chǔ)。
文檔編號G06F17/30GK102609853SQ20121004425
公開日2012年7月25日 申請日期2012年2月27日 優(yōu)先權(quán)日2012年2月27日
發(fā)明者吳俊 , 吳娟, 吳敏, 蔣永 申請人:吳俊 , 吳娟, 吳敏, 蔣永