算:“樂百氏牛奶”的得分= 3/4 = 0.75。
[0096]第二個(gè)例子:用戶輸入“話劇行白居”,其全拼、簡(jiǎn)拼為huaju hang bai ju和hjhbj,而企業(yè)中含有商品“花之語杭白菊”,其全拼、簡(jiǎn)拼為hua zhi yu hang bai ju和hzyhbj,按照匹配,那么其匹配得分為:
[0097]字面2-gram-Score( “花之語杭白菊”)=O;
[0098]全拼字整體2-gram-Score ( “花之語杭白菊,,)=2/4 = 0.5;
[00"]全拼字符2_gram-Score ( “花之語杭白菊” )=10/12 = 0.83 ;
[0100]簡(jiǎn)拼2-gram-Score(“花之語杭白菊”)=2/4 = 0.5;
[0101]第三個(gè)例子:引入韻母的匹配作用主要解決那些發(fā)音聲母相同但是韻母類似的字面匹配,比如“木姜子油”中的“木姜”識(shí)別為“怒江”,在識(shí)別過程中會(huì)將“怒江”糾正為“木姜,,O
[0102]第四個(gè)例子:引入簡(jiǎn)拼的二元匹配,比如商品“三五麻辣魚”,用戶發(fā)音“麻辣魚”,語音識(shí)別為“馬來語”,這種情況下簡(jiǎn)拼的一元、二元、三元分詞對(duì)于“馬來語”識(shí)別為“麻辣魚”的轉(zhuǎn)向起了正向的作用。
[0103]其中,對(duì)于全拼的匹配,可以字的全拼作為整體去匹配,非字符;也可以按照字符級(jí)別的n-gram進(jìn)行匹配,簡(jiǎn)拼也可以采取類似方式,最后每個(gè)匹配得到的商品得分加權(quán)得出:字面匹配權(quán)重最高,全拼次之,簡(jiǎn)拼權(quán)重最低,將得分大于預(yù)設(shè)閾值的商品作為目標(biāo)商品輸出,若得分低于預(yù)設(shè)閾值,則說明通過本級(jí)別系統(tǒng)認(rèn)為沒有識(shí)別出。
[0104]2.4第四級(jí)系統(tǒng):品牌品類投票及企業(yè)商品搭配識(shí)別系統(tǒng)
[0105]本級(jí)別系統(tǒng)主要目的是根據(jù)用戶的輸入和候選的品牌和品類的列表的模糊相似度進(jìn)行投票,得到相似的品牌和品類的列表,組合品牌和品類的商品搭配,依據(jù)通用商品品牌和品牌的統(tǒng)計(jì)信息,按照搭配頻次的高低進(jìn)行商品排序,綜合選出最佳匹配的相似商品集合。具體地,首先分別找出候選的品牌和品類集合,然后根據(jù)這些候選品牌和品類給企業(yè)所屬商品進(jìn)行投票打分,比如企業(yè)有商品“樂百氏牛奶”,候選品牌里面如果有“樂百氏”,品類列表中也有“牛奶”,則這個(gè)商品條目獲得兩張投票。
[0106]下面舉例來說明這四級(jí)系統(tǒng)的識(shí)別效果:
[0107]I)、假設(shè)企業(yè)存貨中含有“樂百氏牛奶”,語音識(shí)別結(jié)果為“樂拜師牛奶”等字面錯(cuò)誤但全拼結(jié)果正確的,第一級(jí)企業(yè)商品Trie樹能直接識(shí)別,主要是全拼Trie樹的識(shí)別。
[0108]2)、假設(shè)企業(yè)商品存貨不包含,但是通用商品包含,如果出現(xiàn)第一級(jí)別簡(jiǎn)單錯(cuò)誤,那么在第二級(jí)通用商品Trie樹能夠識(shí)別。
[0109]3)、假設(shè)企業(yè)商品中包含,但是識(shí)別結(jié)果比較離譜,將進(jìn)入第三級(jí)系統(tǒng)。比如商品名稱為“花之語杭白菊”,但語音文本為“話劇行白居”,雖然語音文本與實(shí)際的商品差別很大,但是其一元全拼花hua,二元全拼白菊bai ju對(duì)于實(shí)際的商品發(fā)音也有一些模糊相似,另夕卜,第三級(jí)系統(tǒng)還結(jié)合著三元(連續(xù)三個(gè)字)的全拼和字面也給出模糊得分以及商品的簡(jiǎn)拼和商品韻母匹配得分,最終在給定預(yù)設(shè)閾值中識(shí)別出實(shí)際的商品。
[0110]4)、假設(shè)語音文本和實(shí)際商品的匹配程度第三級(jí)沒有給出商品,說明語音文本和實(shí)際商品的模糊匹配程度低于預(yù)設(shè)閾值,那么啟用第四級(jí)系統(tǒng),根據(jù)語音文本按照模糊相似性的方法在品牌詞庫(kù)中識(shí)別出品牌列表,在品類詞庫(kù)中識(shí)別出品類的列表,最終根據(jù)品牌和品類的搭配情況識(shí)別出最終的商品,比如實(shí)際商品為“脈動(dòng)青檸運(yùn)動(dòng)飲料”,語音文本為“買多起立云朵銀鷺”,跟語音輸入相關(guān)的品牌可能含有麥多、脈動(dòng)、銀鷺,相似品類列表含有耳朵、飲料、火鍋等,而品牌品類的組合中,根據(jù)通用商品的搭配信息,計(jì)算出搭配得分(品牌和拼配的互信息得分),選出脈動(dòng)飲料為最佳的商品作為此次商品識(shí)別的結(jié)果。
[0111]以上結(jié)合附圖詳細(xì)說明了本發(fā)明的技術(shù)方案,提出了一種新的基于語音識(shí)別的商品搜索方案,在用戶通過語音搜索商品的過程中,通過不同優(yōu)先級(jí)別的查找模式來逐步搜索查找目標(biāo)商品,大大增加查找到目標(biāo)商品的概率,使得即便識(shí)別到的字符信息和目標(biāo)商品差異較大時(shí),也能確保搜索到對(duì)應(yīng)商品,提升了用戶的使用體驗(yàn)。
[0112]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于語音識(shí)別的商品搜索方法,其特征在于,包括: 識(shí)別用戶輸入的語音信息,以生成與所述語音信息對(duì)應(yīng)的字符信息; 根據(jù)查找時(shí)所依據(jù)的商品信息來源和所述字符信息中的關(guān)鍵字,預(yù)先設(shè)置不同優(yōu)先級(jí)的多個(gè)查找模式; 根據(jù)所述多個(gè)查找模式的優(yōu)先級(jí)以及所述多個(gè)查找模式,查找與所述字符信息匹配的目標(biāo)商品,并輸出所述目標(biāo)商品。2.根據(jù)權(quán)利要求1所述的基于語音識(shí)別的商品搜索方法,其特征在于,根據(jù)所述多個(gè)查找模式的優(yōu)先級(jí)以及所述多個(gè)查找模式,查找與所述字符信息匹配的目標(biāo)商品的步驟具體包括: 在預(yù)設(shè)的第一商品信息庫(kù)中,查找與所述字符信息中的全部字符或全部字符的全拼或全部字符的簡(jiǎn)拼匹配的第一商品,以將查找到的所述第一商品作為所述目標(biāo)商品。3.根據(jù)權(quán)利要求2所述的基于語音識(shí)別的商品搜索方法,其特征在于,還包括: 檢測(cè)是否能夠查找到所述第一商品; 在確定查找不到所述第一商品時(shí),在預(yù)設(shè)的第二商品信息庫(kù)中,查找與所述字符信息中的全部字符或全部字符的全拼或全部字符的簡(jiǎn)拼匹配的第二商品,以將查找到的所述第二商品作為所述目標(biāo)商品。4.根據(jù)權(quán)利要求3所述的基于語音識(shí)別的商品搜索方法,其特征在于,還包括: 檢測(cè)是否能夠查找到所述第二商品; 在確定查找不到所述第二商品時(shí),對(duì)所述字符信息中的全部字符、全部字符的全拼和全部字符的簡(jiǎn)拼進(jìn)行多元分解,以得到多個(gè)查找時(shí)所依據(jù)的所述關(guān)鍵字; 根據(jù)所述關(guān)鍵字查找相似度大于預(yù)設(shè)閾值的第三商品,以將查找到的所述第三商品作為所述目標(biāo)商品。5.根據(jù)權(quán)利要求4所述的基于語音識(shí)別的商品搜索方法,其特征在于,還包括: 檢測(cè)是否能夠查找到所述第三商品; 在確定查找不到所述第三商品時(shí),對(duì)所述字符信息進(jìn)行模糊匹配,以確定對(duì)應(yīng)的候選品牌集和候選品類集; 將所述候選品牌集中的任一品牌和所述候選品類集中的任一品類進(jìn)行搭配組合,并查找搭配組合度最高的第四商品,以將查找到的所述第四商品作為所述目標(biāo)商品。6.一種基于語音識(shí)別的商品搜索裝置,其特征在于,包括: 語音識(shí)別單元,用于識(shí)別用戶輸入的語音信息,以生成與所述語音信息對(duì)應(yīng)的字符信息; 設(shè)置單元,用于根據(jù)查找時(shí)所依據(jù)的商品信息來源和所述字符信息中的關(guān)鍵字,預(yù)先設(shè)置不同優(yōu)先級(jí)的多個(gè)查找模式; 處理單元,用于根據(jù)所述多個(gè)查找模式的優(yōu)先級(jí)以及所述多個(gè)查找模式,查找與所述字符信息匹配的目標(biāo)商品,并輸出所述目標(biāo)商品。7.根據(jù)權(quán)利要求6所述的基于語音識(shí)別的商品搜索裝置,其特征在于,所述處理單元包括: 第一查找單元,用于在預(yù)設(shè)的第一商品信息庫(kù)中,查找與所述字符信息中的全部字符或全部字符的全拼或全部字符的簡(jiǎn)拼匹配的第一商品,以將查找到的所述第一商品作為所述目標(biāo)商品。8.根據(jù)權(quán)利要求7所述的基于語音識(shí)別的商品搜索裝置,其特征在于,所述處理單元還包括: 第一檢測(cè)單元,檢測(cè)是否能夠查找到所述第一商品; 第二查找單元,用于在所述第一檢測(cè)單元確定查找不到所述第一商品時(shí),在預(yù)設(shè)的第二商品信息庫(kù)中,查找與所述字符信息中的全部字符或全部字符的全拼或全部字符的簡(jiǎn)拼匹配的第二商品,以將查找到的所述第二商品作為所述目標(biāo)商品。9.根據(jù)權(quán)利要求8所述的基于語音識(shí)別的商品搜索裝置,其特征在于,所述處理單元還包括: 第二檢測(cè)單元,用于檢測(cè)是否能夠查找到所述第二商品; 獲取單元,用于在所述第二檢測(cè)單元確定查找不到所述第二商品時(shí),對(duì)所述字符信息中的全部字符、全部字符的全拼和全部字符的簡(jiǎn)拼進(jìn)行多元分解,以得到多個(gè)查找時(shí)所依據(jù)的所述關(guān)鍵字; 第三查找單元,用于根據(jù)所述關(guān)鍵字查找相似度大于預(yù)設(shè)閾值的第三商品,以將查找到的所述第三商品作為所述目標(biāo)商品。10.根據(jù)權(quán)利要求9所述的基于語音識(shí)別的商品搜索裝置,其特征在于,所述處理單元還包括: 第三檢測(cè)單元,用于檢測(cè)是否能夠查找到所述第三商品; 確認(rèn)單元,用于在所述第三檢測(cè)單元確定查找不到所述第三商品時(shí),對(duì)所述字符信息進(jìn)行模糊匹配,以確定對(duì)應(yīng)的候選品牌集和候選品類集; 第四查找單元,用于將所述候選品牌集中的任一品牌和所述候選品類集中的任一品類進(jìn)行搭配組合,并查找搭配組合度最高的第四商品,以將查找到的所述第四商品作為所述目標(biāo)商品。
【專利摘要】本發(fā)明提供了一種基于語音識(shí)別的商品搜索方法及商品搜索裝置,其中,所述基于語音識(shí)別的商品搜索方法,包括:識(shí)別用戶輸入的語音信息,以生成與所述語音信息對(duì)應(yīng)的字符信息;根據(jù)查找時(shí)所依據(jù)的商品信息來源和所述字符信息中的關(guān)鍵字,預(yù)先設(shè)置不同優(yōu)先級(jí)的多個(gè)查找模式;根據(jù)所述多個(gè)查找模式的優(yōu)先級(jí)以及所述多個(gè)查找模式,查找與所述字符信息匹配的目標(biāo)商品,并輸出所述目標(biāo)商品。通過本發(fā)明的技術(shù)方案,在用戶通過語音搜索商品的過程中,通過不同優(yōu)先級(jí)別的查找模式來逐步搜索查找目標(biāo)商品,大大增加查找到目標(biāo)商品的概率,使得即便識(shí)別到的字符信息和目標(biāo)商品差異較大時(shí),也能確保搜索到對(duì)應(yīng)商品,提升了用戶的使用體驗(yàn)。
【IPC分類】G06F17/30, G10L15/26
【公開號(hào)】CN105574173
【申請(qǐng)?zhí)枴緾N201510958874
【發(fā)明人】黃通文, 薛會(huì)萍
【申請(qǐng)人】暢捷通信息技術(shù)股份有限公司
【公開日】2016年5月11日
【申請(qǐng)日】2015年12月18日