一種電子終端問題分類及解決方案提供方法、系統(tǒng)及裝置制造方法
【專利摘要】本發(fā)明提供一種電子終端問題分類及解決方案提供方法及裝置,該方法對方案數(shù)據(jù)庫中保存的用戶提問的電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中,在每個類別中確定標(biāo)桿問題,建立解決方案和標(biāo)桿問題的對應(yīng)關(guān)系,從而向用戶提供解決方案。由于在本發(fā)明實施例中對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行了聚類,并在每個類別中確定了標(biāo)桿問題,從而建立了每個解決方案和標(biāo)桿問題的對應(yīng)關(guān)系,在進(jìn)行搜索時根據(jù)該對應(yīng)關(guān)系即可確定電子終端問題的解決方案,提高了解決方案提供的效率,滿足了向用戶提供解決方案的實時性需求。
【專利說明】—種電子終端問題分類及解決方案提供方法、系統(tǒng)及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理【技術(shù)領(lǐng)域】,尤其涉及一種電子終端問題分類及解決方案提供方法、系統(tǒng)及裝置。
【背景技術(shù)】
[0002]隨著PC技術(shù)和互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,用戶對互聯(lián)網(wǎng)的依賴越來越大。當(dāng)用戶存在問題需要解決時,一般都會直接到互聯(lián)網(wǎng)上進(jìn)行搜索,獲取相應(yīng)的解決方案。例如,出現(xiàn)與電子終端(電腦、移動終端等),比如用戶存在電腦相關(guān)的問題時,一般用戶會將電腦問題提供給搜索引擎,搜索引擎根據(jù)問題反饋與之相關(guān)的網(wǎng)頁結(jié)果,用戶需要手工逐一瀏覽網(wǎng)頁和篩選,一一嘗試解決電腦問題。導(dǎo)致用戶耗時較長,無法滿足用戶對解決方案提供的實時性要求,影響用戶的體驗。
【發(fā)明內(nèi)容】
[0003]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種電子終端問題分類及解決方案提供方法、系統(tǒng)及裝置。
[0004]本發(fā)明實施例提供了一種電子終端問題分類方法,該方法包括:
[0005]對方案數(shù)據(jù)庫中保存的用戶提問的每個電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中;
[0006]在每個類別中,確定至少一個標(biāo)桿問題;
[0007]建立方案數(shù)據(jù)庫中每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
[0008]進(jìn)一步地,所述在每個類別中,確定至少一個標(biāo)桿問題包括:
[0009]在每個類別中,根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題。
[0010]進(jìn)一步地,所述根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題包括:
[0011]確定每兩個電子終端問題間的文本相似度;
[0012]判斷該文本相似度是否大于設(shè)定的閾值;
[0013]當(dāng)該文本相似度大于設(shè)定的閾值時,提取該兩個電子終端問題作為該類別的標(biāo)桿問題。
[0014]進(jìn)一步地,所述在每個類別中,確定至少一個標(biāo)桿問題包括:
[0015]根據(jù)電子終端問題間的文本相似度,及設(shè)定時間長度內(nèi)每個電子終端問題被用戶提問的頻次,提取每個類別中的至少一個標(biāo)桿問題。
[0016]進(jìn)一步地,所述提取每個類別中的至少一個標(biāo)桿問題包括:
[0017]在每個類別中,確定每兩個電子終端問題間的文本相似度;
[0018]識別文本相似度閾值大于設(shè)定閾值的每兩個電子終端問題;[0019]根據(jù)設(shè)定時間長度內(nèi)該識別出的電子終端問題被用戶提問的頻次,提取至少一個標(biāo)桿問題。
[0020]進(jìn)一步地,所述對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行聚類包括:
[0021]采用Kmeans聚類算法,對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行聚類。
[0022]一種基于電子終端問題分類的解決方案提供方法,所述方法包括:
[0023]接收用戶提問的電子終端問題;
[0024]判斷所述電子終端問題是否命中線下統(tǒng)計出的方案數(shù)據(jù)庫中各個的標(biāo)桿問題中的一個或多個,確定所述電子終端問題與所述命中的各標(biāo)桿問題所對應(yīng)的一個或多個解決方案的相似度;
[0025]匯總所述電子終端問題與所述每個解決方案的相似度,確定該電子終端問題對應(yīng)的解決方案,并將該解決方案提供給用戶。
[0026]進(jìn)一步地,所述確定每個電子終端問題與命中的各標(biāo)桿問題對應(yīng)的一個或多個解決方案的相似度包括:
[0027]針對每個解決方案,統(tǒng)計該用戶提問的電子終端問題與該解決方案中的每個標(biāo)桿問題的文本相似度;
[0028]確定文本相似度的最大值;
[0029]將所述最大值作為該電子終端問題與該解決方案的相似度。
[0030]本發(fā)明實施例提供了一種電子終端問題分類裝置,該裝置包括:
[0031]方案數(shù)據(jù)庫,用于保存用戶提問的每個電子終端問題及其對應(yīng)的解決方案;
[0032]聚類模塊,用于對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中;
[0033]提取模塊,用于在每個類別中,確定至少一個標(biāo)桿問題;
[0034]所述方案數(shù)據(jù)庫,還用于根據(jù)提取模塊在每個類別中確定的至少一個標(biāo)桿問題,建立每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
[0035]進(jìn)一步地,所述提取模塊,具體用于在每個類別中,根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題。
[0036]進(jìn)一步地,所述提取模塊,具體用于確定每兩個電子終端問題間的文本相似度;判斷該文本相似度是否大于設(shè)定的閾值;當(dāng)該文本相似度大于設(shè)定的閾值時,提取該兩個電子終端問題作為該類別的標(biāo)桿問題。
[0037]進(jìn)一步地,所述提取模塊,具體用于根據(jù)電子終端問題間的文本相似度,及設(shè)定時間長度內(nèi)每個電子終端問題被用戶提問的頻次,提取每個類別中的至少一個標(biāo)桿問題。
[0038]進(jìn)一步地,所述提取模塊,具體用于在每個類別中,確定每兩個電子終端問題間的文本相似度;識別文本相似度閾值大于設(shè)定閾值的每兩個電子終端問題;根據(jù)設(shè)定時間長度內(nèi)該識別出的電子終端問題被用戶提問的頻次,提取至少一個標(biāo)桿問題。
[0039]本發(fā)明實施例提供了一種基于電子終端問題分類裝置的解決方案提供系統(tǒng),所述系統(tǒng)包括:
[0040]接收模塊,用于接收用戶提問的電子終端問題;
[0041]方案數(shù)據(jù)庫,用于存儲每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系;[0042]方案匹配模塊,用于判斷所述電子終端是否命中線下統(tǒng)計出的方案數(shù)據(jù)庫中各標(biāo)桿問題中的一個或多個,確定所述電子終端問題與所述命中的各標(biāo)桿問題所對應(yīng)的一個或多個解決方案的相似度,匯總所述電子終端問題與所述每個解決方案的相似度,確定該電子終端問題對應(yīng)的解決方案;
[0043]提供模塊,用于將該解決方案提供給用戶。
[0044]進(jìn)一步地,所述方案匹配模塊,具體用于針對每個解決方案,統(tǒng)計該用戶提問的電子終端問題與該解決方案中的每個標(biāo)桿問題的文本相似度;確定文本相似度的最大值;將所述最大值作為該電子終端問題與該解決方案的相似度。
[0045]本發(fā)明實施例提供了一種電子終端問題分類及解決方案提供方法及裝置,該方法對方案數(shù)據(jù)庫中保存的用戶提問的電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中,在每個類別中確定標(biāo)桿問題,建立解決方案和標(biāo)桿問題的對應(yīng)關(guān)系,從而向用戶提供解決方案。由于在本發(fā)明實施例中對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行了聚類,并在每個類別中確定了標(biāo)桿問題,從而建立了每個解決方案和標(biāo)桿問題的對應(yīng)關(guān)系,在進(jìn)行搜索時根據(jù)該對應(yīng)關(guān)系即可確定電子終端問題的解決方案,提高了解決方案提供的效率,滿足了向用戶提供解決方案的實時性需求。
[0046]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0047]通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0048]圖1為本發(fā)明實施例提供的一種電子終端問題分類過程圖;
[0049]圖2為本發(fā)明實施例一提供的一種電子終端問題分類的過程圖;
[0050]圖3為本發(fā)明實施例二提供的一種電子終端問題分類過程示意圖;
[0051]圖4為本發(fā)明實施例提供的一種基于電子終端問題分類方法的解決方案提供過程不意圖;
[0052]圖5為本發(fā)明實施例提供的一種解決方案提供過程示意圖;
[0053]圖6A為本發(fā)明實施例提供的采用線下電子終端問題分類方法及線上解決方案提供方法的示意圖;
[0054]圖6B為本發(fā)明實施例提供的一種電子終端問題分類裝置結(jié)構(gòu)示意圖;
[0055]圖7為本發(fā)明實施例提供的一種基于電子終端問題分類裝置的解決方案提供系統(tǒng)結(jié)構(gòu)示意圖。
【具體實施方式】
[0056]為了提高解決方案的提供效率,滿足用戶對解決方案的實時性需求,本發(fā)明實施例提供了一種電子終端問題分類及解決方案提供方法、系統(tǒng)及裝置。
[0057]下面將參照附圖更詳細(xì)地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0058]下面結(jié)合說明書附圖,對本發(fā)明實施例進(jìn)行詳細(xì)說明。
[0059]圖1為本發(fā)明實施例提供的一種電子終端問題分類過程圖,該過程包括以下步驟:
[0060]SlOl:對方案數(shù)據(jù)庫中保存的用戶提問的每個電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中。
[0061]方案數(shù)據(jù)庫中保存有歷史上用戶提問的每個電子終端問題,并針對每個電子終端問題保存有解決該電子終端問題的解決方案,該解決方案包括:工具包和URL文章,工具包是可以在用戶本地設(shè)備運行的批處理文件,URL文章的該URL對應(yīng)的網(wǎng)頁描述了一系列的操作步驟。電子終端包括:電腦、移動終端、IPAD平板電腦等。
[0062]存在同一解決方案解決多個電子終端問題的情況,本發(fā)明實施例中,為了實現(xiàn)對解決方案的細(xì)粒度劃分,針對每個電子終端問題進(jìn)行聚類時,將同一解決方案解決的技術(shù)問題聚合到一個類別中。根據(jù)每個解決方案解決的電子終端問題,每個類別中可能包括一個或兩個以上的電子終端問題。
[0063]S102:在每個類別中,確定至少一個標(biāo)桿問題。
[0064]在本發(fā)明實施例中標(biāo)桿問題(stand quest1n)為具有代表性的電子終端問題。確定的標(biāo)桿問題可以是一個,兩個或者多個。在每個類別中確定的標(biāo)桿問題的數(shù)量可以相同,也可以不同,例如在解決方案I對應(yīng)的類別中確定了 3個標(biāo)桿問題,在解決方案2對應(yīng)的類別中確定了 2個標(biāo)桿問題,或者,在每個解決方案對應(yīng)的類別中都確定了 4個標(biāo)桿問題等
坐寸ο
[0065]將電子終端問題聚類后,聚類后得到的類別數(shù)量與解決方案的數(shù)量相同。在每個類別中確定至少一個標(biāo)桿問題時,可以采用多種方法,例如將該類別中的任意一個電子終端問題作為標(biāo)桿問題,或者,也可以按照每個類別中電子終端問題的排列位置,將排列在最前面的電子終端問題作為標(biāo)桿問題,或者,也可以根據(jù)電子終端問題之間的文本相似度,確定標(biāo)桿問題。具體在使用時,可以根據(jù)需要任意選定相應(yīng)的確定方法。文本相似度是兩個電子終端問題的文本之間的相似程度,文本相似度越大,兩個文本之間的相似程度越大,反之亦然。
[0066]S103:建立方案數(shù)據(jù)庫中每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
[0067]在每個解決方案對應(yīng)的類別中確定至少一個標(biāo)桿問題,為了便于向用戶提供解決方案,在方案數(shù)據(jù)庫中建立該解決方案與每個標(biāo)桿問題的對應(yīng)關(guān)系。例如在解決方案I對應(yīng)的類別中確定了兩個標(biāo)桿問題,分別為標(biāo)桿問題I和標(biāo)桿問題2,則建立解決方案I與標(biāo)桿問題I的對應(yīng)關(guān)系,并建立解決方案I與標(biāo)桿問題2的對應(yīng)關(guān)系。
[0068]由于在本發(fā)明實施例中對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行了聚類,并在每個類別中確定了標(biāo)桿問題,從而建立了每個解決方案和標(biāo)桿問題的對應(yīng)關(guān)系,在進(jìn)行搜索時根據(jù)該對應(yīng)關(guān)系即可確定電子終端問題的解決方案,提高了解決方案提供的效率,滿足了向用戶提供解決方案的實時性需求。[0069]本發(fā)明實施例中方案數(shù)據(jù)庫中保存有歷史上用戶提出的電子終端問題,并針對每個電子終端問題保存有解決該電子終端問題的解決方案,即在方案數(shù)據(jù)庫中保存有電子終端問題及其對應(yīng)的解決方案。
[0070]根據(jù)每個解決方案,對方案數(shù)據(jù)庫中保存的用戶提問的電子終端問題進(jìn)行聚類時,可以采用常用的聚類算法,例如Kmeans聚類算法或者Agnes聚類算法等。當(dāng)采用Kmeans聚類算法對電子終端問題進(jìn)行聚類時,可以根據(jù)每個解決方案設(shè)置中心點,根據(jù)每個電子終端問題與中心點的距離,將每個電子終端問題劃分到相應(yīng)的類別中,其中每個類別中包含的電子終端問題不重復(fù),即每個電子終端問題只能位于一個類別中,每個類別中的電子終端問題都可以通過同一解決方案解決。
[0071]確定了每個類別中的電子終端問題后,確定該類別中的至少一個標(biāo)桿問題時,可以采用任意方式確定。在本發(fā)明實施例中,為了保證確定出的標(biāo)桿問題能夠代表該類別所有電子終端問題,從而提高后續(xù)向用戶的提供解決方案的準(zhǔn)確性,確定該類別中的至少一個標(biāo)桿問題,可以在每個類別中,根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題。
[0072]具體的,在根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題時包括:
[0073]確定每兩個電子終端問題間的文本相似度;
[0074]判斷該文本相似度是否大于設(shè)定的閾值;
[0075]當(dāng)該文本相似度大于設(shè)定的閾值時,提取該兩個電子終端問題作為該類別的標(biāo)桿問題。
[0076]圖2為本發(fā)明實施例一提供的一種電子終端問題分類的過程圖,該過程包括以下步驟:
[0077]S201:對方案數(shù)據(jù)庫中保存的用戶提問的每個電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中。
[0078]S202:在每個類別中,確定每兩個電子終端問題間的文本相似度。
[0079]S203:針對每兩個電子終端問題之間的文本相似度,判斷該文本相似度是否大于設(shè)定的閾值,當(dāng)判斷結(jié)果為是時,進(jìn)行步驟S204,否則,進(jìn)行步驟S205。
[0080]S204:提取該兩個電子終端問題作為該類別的標(biāo)桿問題。
[0081]S205:確定該兩個電子終端問題非該類別的標(biāo)桿問題。
[0082]S206:建立方案數(shù)據(jù)庫中每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
[0083]在本發(fā)明實施例中將同一解決方案解決的電子終端問題聚合到一個類別中后,針對每個類別,在該類別中確定至少一個標(biāo)桿問題時,根據(jù)電子終端問題間的文本相似度。具體的,在該類別中,確定每兩個電子終端問題間的文本相似度時,可以將該類別中的該兩個電子終端問題進(jìn)行分詞,得到每個基礎(chǔ)詞,比較該兩個電子終端問題間存在相同基礎(chǔ)詞的數(shù)量,根據(jù)該兩個電子終端問題間出現(xiàn)相同基礎(chǔ)詞的數(shù)量,及該兩個電子終端問題分詞得到的基礎(chǔ)詞數(shù)量,確定該兩個電子終端問題間的文本相似度?;蛘撸部梢允歉鶕?jù)該兩個電子終端問題間出現(xiàn)相同基礎(chǔ)詞的數(shù)量,及該兩個電子終端問題分詞得到的非相同基礎(chǔ)詞的數(shù)量,確定該兩個電子終端問題間的文本相似度。[0084]為了保證確定的標(biāo)桿問題的準(zhǔn)確性,使標(biāo)桿問題準(zhǔn)確的代表該類別的電子終端問題,在對每個電子終端問題進(jìn)行分詞,得到每個基礎(chǔ)詞后,對每個基礎(chǔ)詞進(jìn)行過濾,根據(jù)過濾后的基礎(chǔ)詞,在每個類別中確定至少一個標(biāo)桿問題。該過濾過程可以將基礎(chǔ)詞中的停止詞過濾掉,其中停止詞為無語義的詞,例如“的”、“了”、“很”、“非?!钡鹊仍~。
[0085]具體的,例如方案數(shù)據(jù)庫中保存的兩個用戶提問的電子終端問題“電腦很卡”和“電腦卡的不行了”,該兩個電子終端問題被聚類到同一類別中。針對該兩個電子終端問題,進(jìn)行分詞,得到每個基礎(chǔ)詞。
[0086]其中“電腦很卡”進(jìn)行分詞后,得到基礎(chǔ)詞“電腦”、“很”和“卡”,對基礎(chǔ)詞進(jìn)行過濾,去掉該基礎(chǔ)詞中作為停止詞的“很”。過濾后得到每個基礎(chǔ)詞為:“電腦、卡”。
[0087]“電腦卡的不行了”進(jìn)行分詞后,得到基礎(chǔ)詞“電腦”、“卡”、“的”、“不行”和“ 了 ”,去掉該基礎(chǔ)詞中作為停止詞的“的”和“了”。過濾后得到每個基礎(chǔ)詞分別為:“電腦、卡、不行”。
[0088]則兩個電子終端問題間的文本相似度為:2/5 = 0.4,或者電子終端問題間的文本相似度也可以為:2/1 = 2。
[0089]采用上述方法確定了每兩個電子終端問題間的文本相似度后,判斷該對電子終端問題的文本相似度是否大于設(shè)定的閾值,當(dāng)該對電子終端問題的文本相似度大于設(shè)定的閾值時,提取該對電子終端問題作為該類別的標(biāo)桿問題。
[0090]或者,在確定標(biāo)桿問題時,也可以設(shè)置確定的標(biāo)桿問題的數(shù)量,根據(jù)確定的每對電子終端問題的文本相似度,將每對電子終端問題的文本相似度按照從大到小的順序,將每對電子終端問題從前往后進(jìn)行排序,根據(jù)標(biāo)桿問題的數(shù)量,從前往后提取該數(shù)量的電子終端問題作為標(biāo)桿問題。
[0091]確定了每個類別的至少一個標(biāo)桿問題后,在方案數(shù)據(jù)庫中建立解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,用于向用戶提供解決方案。
[0092]進(jìn)一步地,為了使確定的標(biāo)桿問題準(zhǔn)確的代表該類別中的其他電子終端問題,在本發(fā)明實施例中,確定至少一個標(biāo)桿問題時,根據(jù)電子終端問題間的文本相似度,及設(shè)定時間長度內(nèi)每個電子終端問題被用戶提問的頻次,提取每個類別中的至少一個標(biāo)桿問題。
[0093]具體的,在提取每個類別中的至少一個標(biāo)桿問題時包括:
[0094]在每個類別中,確定每兩個電子終端問題間的文本相似度;
[0095]識別文本相似度閾值大于設(shè)定閾值的每兩個電子終端問題;
[0096]根據(jù)設(shè)定時間長度內(nèi)該識別出的電子終端問題被用戶提問的頻次,提取至少一個標(biāo)桿問題。
[0097]圖3為本發(fā)明實施例二提供的一種電子終端問題分類過程示意圖,該過程包括以下步驟:
[0098]S301:對方案數(shù)據(jù)庫中保存的用戶提問的每個電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中。
[0099]S302:在每個類別中,確定每兩個電子終端問題間的文本相似度。
[0100]S303:針對每兩個電子終端問題之間的文本相似度,判斷該文本相似度是否大于設(shè)定的閾值,當(dāng)判斷結(jié)果為是時,進(jìn)行步驟S304,否則,進(jìn)行步驟S305。
[0101]S304:提取該兩個電子終端問題,之后進(jìn)行步驟S306。[0102]S305:不提取該兩個電子終端問題。
[0103]S306:根據(jù)設(shè)定時間長度內(nèi)該提取出的電子終端問題被用戶提問的頻次,提取至少一個標(biāo)桿問題。
[0104]S307:建立方案數(shù)據(jù)庫中每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
[0105]在本發(fā)明的上述實施例中,在每個類別中,確定每兩個電子終端問題的文本相似度時,可以將該類別中的該兩個電子終端問題進(jìn)行分詞,得到每個基礎(chǔ)詞,比較該兩個電子終端問題間存在相同基礎(chǔ)詞的數(shù)量,根據(jù)該兩個電子終端問題間出現(xiàn)相同基礎(chǔ)詞的數(shù)量,及該兩個電子終端問題分詞得到的基礎(chǔ)詞數(shù)量,確定該兩個電子終端問題間的文本相似度?;蛘?,也可以是根據(jù)該兩個電子終端問題間出現(xiàn)相同基礎(chǔ)詞的數(shù)量,及該兩個電子終端問題分詞得到的非相同基礎(chǔ)詞的數(shù)量,確定該兩個電子終端問題間的文本相似度。
[0106]為了保證確定的標(biāo)桿問題的準(zhǔn)確性,使標(biāo)桿問題準(zhǔn)確的代表該類別的電子終端問題,在對每個電子終端問題進(jìn)行分詞,得到每個基礎(chǔ)詞后,對每個基礎(chǔ)詞進(jìn)行過濾,根據(jù)過濾后的基礎(chǔ)詞,在每個類別中確定至少一個標(biāo)桿問題。該過濾過程可以將基礎(chǔ)詞中的停止詞過濾掉,其中停止詞為無語義的詞,例如“的”、“了”、“很”、“非?!钡鹊仍~。
[0107]根據(jù)每個電子終端問題過濾后得到的基礎(chǔ)詞,確定每兩個電子終端問題的文本相似度。根據(jù)確定的每兩個電子終端問題(每對電子終端問題)的文本相似度,判斷每對電子終端問題的文本相似度是否大于設(shè)定的閾值,當(dāng)該對電子終端問題的文本相似度大于設(shè)定的閾值時,提取該對電子終端問題。
[0108]針對每個類別,根據(jù)該類別中提取的電子終端問題,統(tǒng)計設(shè)定時間長度內(nèi)該提取的每個電子終端問題被用戶提問的頻次,提取至少一個標(biāo)桿問題。該設(shè)定時間長度可以是一周,或者一個月,也可以是一天,一個小時等,可以根據(jù)需要靈活設(shè)定。當(dāng)在設(shè)定時間長度內(nèi),用戶在瀏覽器中輸入電子終端問題,并向搜索引擎提交針對該電子終端問題的搜索請求時,針對該電子終端問題,將該電子終端問題被提問的頻次加一。
[0109]具體的,根據(jù)設(shè)定時間長度內(nèi)該提取的每個電子終端問題的頻次,按照頻次由高到底的順序,將每個電子終端問題從前往后進(jìn)行排序,從前面開始提取至少一個電子終端問題作為標(biāo)桿問題。確定了每個類別的至少一個標(biāo)桿問題后,在方案數(shù)據(jù)庫中建立解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,用于向用戶提供解決方案。
[0110]上述在方案數(shù)據(jù)庫中建立解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,是采用線下方式建立的,待方案數(shù)據(jù)庫中的對應(yīng)關(guān)系建立完畢后,即可采用線上方式向用戶提供對應(yīng)的解決方案。
[0111]圖4為本發(fā)明實施例提供的一種基于電子終端問題分類方法的解決方案提供過程示意圖,該過程包括以下步驟:
[0112]S401:接收用戶提問的電子終端問題。
[0113]S402:判斷所述電子終端問題是否命中線下統(tǒng)計出的方案數(shù)據(jù)庫各個標(biāo)桿問題中的一個或多個,確定所述電子終端問題與所述命中的各標(biāo)桿問題所對應(yīng)的一個或幾個解決方案的相似度。
[0114]采用線下方式在方案數(shù)據(jù)庫中建立有每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,接收到用戶提問的電子終端問題后,確定該電子終端問題與每個標(biāo)桿問題的文本相似度。具體的,確定該電子終端問題與每個標(biāo)桿問題的文本相似度時,將該電子終端問題和每個標(biāo)桿問題進(jìn)行分詞,根據(jù)得到的每個基礎(chǔ)詞,確定該電子終端問題與每個標(biāo)桿問題的文本相似度,從而確定該電子終端問題命中的各個標(biāo)桿問題。
[0115]確定了該電子終端問題與每個標(biāo)桿問題的文本相似度后,根據(jù)每個解決方案對應(yīng)的標(biāo)桿問題與該用戶提問的電子終端問題的文本相似度,可以任意選擇一個文本相似度,作為該用戶提問的電子終端問題與該解決方案的文本相似度,例如該解決方案對應(yīng)的標(biāo)桿問題1、標(biāo)桿問題2和標(biāo)桿問題3與該用戶提問的電子終端問題的文本相似度分別為A、B、C,則可以選擇A、B、C中的任意一個作為該解決方案與該用戶提問的電子終端問題的文本相似度,或者也可以計算A、B、C的平均值,將該平均值作為該解決方案與該用戶提問的電子終端問題的文本相似度,當(dāng)然也可以采用其他的方式。
[0116]S403:匯總所述電子終端問題與所述每個解決方案的相似度,確定該電子終端問題對應(yīng)的解決方案,并將該解決方案提供給用戶。
[0117]由于在本發(fā)明實施例中對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行了聚類,并在每個類別中確定了標(biāo)桿問題,從而建立了每個解決方案和標(biāo)桿問題的對應(yīng)關(guān)系,在進(jìn)行搜索時根據(jù)該對應(yīng)關(guān)系即可確定電子終端問題的解決方案,提高了解決方案提供的效率,滿足了向用戶提供解決方案的實時性需求。
[0118]為了提高向用戶提供的解決方案的準(zhǔn)確性,在本發(fā)明實施例中確定該用戶提問的電子終端問題與每個標(biāo)桿問題的文本相似度時,在對電子終端問題進(jìn)行分詞,得到每個基礎(chǔ)詞后,對每個基礎(chǔ)詞進(jìn)行過濾,根據(jù)過濾后的基礎(chǔ)詞,在每個類別中確定至少一個標(biāo)桿問題。該過濾過程可以將基礎(chǔ)詞中的停止詞過濾掉,其中停止詞為無語義的詞,例如“的”、“了”、“很”、“非?!钡鹊仍~。
[0119]另外,為了進(jìn)一步提高向用戶提供的解決方案的準(zhǔn)確性,當(dāng)針對每個解決方案,確定了該用戶提問的電子終端問題與該解決方案對應(yīng)的每個標(biāo)桿問題的文本相似度后,確定該解決方案與該用戶提問的電子終端問題的文本相似度時包括:
[0120]針對每個解決方案,統(tǒng)計該用戶提問的電子終端問題與該解決方案中的每個標(biāo)桿問題的文本相似度;確定文本相似度的最大值;將所述最大值作為該電子終端問題與該解決方案的相似度。
[0121]圖5為本發(fā)明實施例提供的一種解決方案提供過程示意圖,該過程包括以下步驟:
[0122]S501:接收用戶提問的電子終端問題。
[0123]S502:根據(jù)電子終端問題與方案數(shù)據(jù)庫中的每個標(biāo)桿問題的文本相似度。
[0124]S503:針對每個解決方案,統(tǒng)計該用戶提問的電子終端問題與該解決方案中的每個標(biāo)桿問題的文本相似度,將該解決方案中標(biāo)桿問題與所述電子終端問題的文本相似度的最大值,作為該電子終端問題與該解決方案的相似度,將該相似度最大值對應(yīng)的一個或幾個標(biāo)桿問題,作為該電子終端問題命中的標(biāo)桿問題。
[0125]S504:根據(jù)所述電子終端問題與每個解決方案的相似度,確定該電子終端問題對應(yīng)的解決方案,并將該解決方案提供給用戶。
[0126]下面通過一個具體的實施方式對本發(fā)明實施例進(jìn)行詳細(xì)說明。
[0127]圖6A為本發(fā)明實施例提供的采用線下電子終端問題分類方法及線上解決方案提供方法的示意圖,在該圖6A中上面的方框中是線上解決方案的提供過程,下面的方框是線下電子終端問題分類的過程。
[0128]具體的,方案數(shù)據(jù)庫中保存有歷史上用戶提問的電子終端問題,采用線下方式針對電子終端問題進(jìn)行分類時,首先提取方案數(shù)據(jù)庫中歷史上用戶提問的每個電子終端問題,采用Kmeans聚類方法,將同一解決方案解決的電子終端問題聚合到一個類別中,在本發(fā)明實施例中為了進(jìn)行區(qū)分,每個解決方案賦予唯一的編號SID。在每個類別中,確定至少一個標(biāo)桿問題SQ,在方案數(shù)據(jù)庫中建立每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系。
[0129]如下表所示,部分解決方案對應(yīng)的標(biāo)桿問題如下,在下表中存在三個標(biāo)桿問題對應(yīng)一個解決方案的情況,也有一個解決方案對應(yīng)一個標(biāo)桿問題的情況,具體需要根據(jù)方案數(shù)據(jù)庫中的保存的電子終端問題和其對應(yīng)的解決方案確定:
[0130]
【權(quán)利要求】
1.一種電子終端問題分類方法,其特征在于,該方法包括: 對方案數(shù)據(jù)庫中保存的用戶提問的每個電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中; 在每個類別中,確定至少一個標(biāo)桿問題; 建立方案數(shù)據(jù)庫中每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
2.如權(quán)利要求1所述的方法,其特征在于,所述在每個類別中,確定至少一個標(biāo)桿問題包括: 在每個類別中,根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題。
3.如權(quán)利要求1-2任一項所述的方法,其特征在于,所述根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題包括: 確定每兩個電子終端問題間的文本相似度; 判斷該文本相似度是否大于設(shè)定的閾值; 當(dāng)該文本相似度大于設(shè)定的閾值時,提取該兩個電子終端問題作為該類別的標(biāo)桿問題。
4.如權(quán)利要求1-3任一項所述的方法,其特征在于,所述在每個類別中,確定至少一個標(biāo)桿問題包括: 根據(jù)電子終端問題間的文本相似度,及設(shè)定時間長度內(nèi)每個電子終端問題被用戶提問的頻次,提取每個類別中的至少一個標(biāo)桿問題。
5.如權(quán)利要求1-4任一項所述的方法,其特征在于,所述提取每個類別中的至少一個標(biāo)桿問題包括: 在每個類別中,確定每兩個電子終端問題間的文本相似度; 識別文本相似度閾值大于設(shè)定閾值的每兩個電子終端問題; 根據(jù)設(shè)定時間長度內(nèi)該識別出的電子終端問題被用戶提問的頻次,提取至少一個標(biāo)桿問題。
6.一種基于電子終端問題分類的解決方案提供方法,其特征在于,所述方法包括: 接收用戶提問的電子終端問題; 判斷所述電子終端問題是否能命中線下統(tǒng)計出的方案數(shù)據(jù)庫各個標(biāo)桿問題中的一個或多個,確定所述電子終端問題與所述命中的各標(biāo)桿問題所對應(yīng)的一個或多個解決方案的相似度; 匯總所述電子終端問題與所述每個解決方案的相似度,確定該電子終端問題對應(yīng)的解決方案,并將該解決方案提供給用戶。
7.如權(quán)利要求6所述的方法,其特征在于,所述確定每個電子終端問題與命中的各標(biāo)桿問題對應(yīng)的一個或多個解決方案的相似度包括: 針對每個解決方案,統(tǒng)計該用戶提問的電子終端問題與該解決方案中的每個標(biāo)桿問題的文本相似度; 確定文本相似度的最大值; 將所述最大值作為該電子終端問題與該解決方案的相似度。
8.一種電子終端問題分類裝置,其特征在于,所述裝置包括: 方案數(shù)據(jù)庫,用于保存用戶提問的每個電子終端問題及其對應(yīng)的解決方案; 聚類模塊,用于對方案數(shù)據(jù)庫中的電子終端問題進(jìn)行聚類,將同一解決方案解決的電子終端問題聚合到一個類別中; 提取模塊,用于在每個類別中,確定至少一個標(biāo)桿問題; 所述方案數(shù)據(jù)庫,還用于根據(jù)提取模塊在每個類別中確定的至少一個標(biāo)桿問題,建立每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系,該對應(yīng)關(guān)系用于向用戶提供解決方案。
9.如權(quán)利要求8所述的裝置,其特征在于,所述提取模塊,具體用于在每個類別中,根據(jù)電子終端問題間的文本相似度,確定每個類別中的至少一個標(biāo)桿問題。
10.一種基于電子終端問題分類裝置的解決方案提供系統(tǒng),其特征在于,所述系統(tǒng)包括: 接收模塊,用于接收用戶提問的電子終端問題; 方案數(shù)據(jù)庫,用于存儲每個解決方案和至少一個標(biāo)桿問題的對應(yīng)關(guān)系; 方案匹配模塊,用于判斷所述電子終端是否命中線下統(tǒng)計出的方案數(shù)據(jù)庫中各標(biāo)桿問題中的一個或多個,確定所述電子終端問題與所述命中的各標(biāo)桿問題所對應(yīng)的一個或多個解決方案的相似度,匯 總所述電子終端問題與所述每個解決方案的相似度,確定該電子終端問題對應(yīng)的解決方案; 提供模塊,用于將該解決方案提供給用戶。
【文檔編號】G06F17/30GK104036015SQ201410289699
【公開日】2014年9月10日 申請日期:2014年6月24日 優(yōu)先權(quán)日:2014年6月24日
【發(fā)明者】李月雷, 呂習(xí)彪 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司