本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種構(gòu)建用戶詞庫的方法、及用于構(gòu)建用戶詞庫的裝置。
背景技術(shù):
隨著電子技術(shù)的發(fā)展,越來越多的智能設(shè)備(例如:電腦、智能手機、平板電腦、等等)走進了人們的生活,給人們帶來了諸多便利。通常,在智能設(shè)備中通常安裝有一輸入法程序,用戶可以使用輸入法程序快捷地進行文字輸入。
為了提高用戶的輸入效率,目前的輸入法程序提供了多種“細胞詞庫”,“細胞詞庫”是專業(yè)精細的詞庫功能,為開放共享、可在線升級的細分化詞庫的功能名稱。通過“細胞詞庫”功能,各個領(lǐng)域、行業(yè)、圈子的人群都能夠大大提高其詞庫覆蓋率。用戶可以自主選擇“細胞詞庫”,或者由智能設(shè)備基于用戶的歷史輸入記錄向用戶推薦合適的“細胞詞庫”,從而提高用戶詞庫的廣度,減少由于詞頻低的專業(yè)詞匯缺乏所帶來的輸入麻煩。目前用戶使用較多的細胞詞庫有:“電視劇名大全”、“旅游詞匯大全”、“計算機詞匯大全”等等。
“細胞詞庫”在一定程度上可以提高用戶的輸入效率,但是,由于不同用戶存在著不同的輸入偏好,細胞詞庫無法滿足不同用戶的實際需求,用戶的輸入效率還是有待進一步提高。
技術(shù)實現(xiàn)要素:
本申請實施例通過提供一種構(gòu)建用戶詞庫的方法、及用于構(gòu)建用戶詞庫的裝置,解決了現(xiàn)有的輸入法詞庫,無法滿足不同用戶存在不同輸入偏好的技術(shù)問題。
一方面,本申請?zhí)峁┝艘环N構(gòu)建用戶詞庫的方法,包括:
從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,所述關(guān)鍵詞用于表示所述用戶感興趣的事物;
將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,所述第一領(lǐng)域為所述用戶感興趣的事物所屬的領(lǐng)域。
優(yōu)選地,所述從用戶的聊天內(nèi)容中提取關(guān)鍵詞,包括:
獲取所述用戶在聊天場景中輸入的聊天內(nèi)容;
檢測所述聊天內(nèi)容中是否存在預設(shè)字段,其中,所述預設(shè)字段用于表達所述用戶對某件事物感興趣的心理狀態(tài);
若存在,則確定所述聊天內(nèi)容中包含所述關(guān)鍵詞;
從所述預設(shè)字段的上下文聊天內(nèi)容中提取所述關(guān)鍵詞。
優(yōu)選地,所述將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,包括:
基于所述關(guān)鍵詞,確定所述第一領(lǐng)域;
基于所述第一領(lǐng)域,判斷所述關(guān)鍵詞是否滿足一預設(shè)條件;
若所述關(guān)鍵詞滿足所述預設(shè)條件,則將所述關(guān)鍵詞添加到所述第一領(lǐng)域的用戶詞庫中。
優(yōu)選地,所述基于所述第一領(lǐng)域,判斷所述關(guān)鍵詞是否滿足一預設(shè)條件,包括:
判斷電子設(shè)備中是否安裝有屬于所述第一領(lǐng)域的應用程序;
若是,則所述關(guān)鍵詞滿足所述預設(shè)條件;
若否,則所述關(guān)鍵詞不滿足所述預設(shè)條件。
優(yōu)選地,所述基于所述第一領(lǐng)域,判斷所述關(guān)鍵詞是否滿足一預設(shè)條件,包括:
判斷所述第一領(lǐng)域的用戶詞庫中是否已收錄所述關(guān)鍵詞;
若是,則所述關(guān)鍵詞不滿足所述預設(shè)條件;
若否,則所述關(guān)鍵詞滿足所述預設(shè)條件。
優(yōu)選地,在所述將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中之后,還包括:
確定所述關(guān)鍵詞的頻次信息,其中,所述頻次信息用于表示所述關(guān)鍵詞在所述聊天內(nèi)容中出現(xiàn)的頻率或次數(shù);
將所述關(guān)鍵詞的頻次信息保存在所述第一領(lǐng)域的用戶詞庫中。
優(yōu)選地,在所述將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中之后,還包括:
獲取與所述關(guān)鍵詞相關(guān)的所述第一領(lǐng)域的其他關(guān)鍵詞;
將所述其他關(guān)鍵詞添加到所述第一領(lǐng)域的用戶詞庫中。
優(yōu)選地,所述方法還包括:
在檢測到用戶將屬于所述第一領(lǐng)域的應用程序全部卸載時,刪除所述第一領(lǐng)域的用戶詞庫。
另一方面,基于同一發(fā)明構(gòu)思,本申請?zhí)峁┝艘环N用于構(gòu)建用戶詞庫的裝置,包括:
提取模塊,用于從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,所述關(guān)鍵詞用于表示所述用戶感興趣的事物;
第一添加模塊,用于將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,所述第一領(lǐng)域為所述用戶感興趣的事物所屬的領(lǐng)域。
優(yōu)選地,所述提取模塊,包括:
獲取子模塊,用于獲取所述用戶在聊天場景中輸入的聊天內(nèi)容;
檢測子模塊,用于檢測所述聊天內(nèi)容中是否存在預設(shè)字段,其中,所述預設(shè)字段用于表達所述用戶對某件事物感興趣的心理狀態(tài);
確定子模塊,用于若存在,則確定所述聊天內(nèi)容中包含所述關(guān)鍵詞;
提取子模塊,用于從所述預設(shè)字段的上下文聊天內(nèi)容中提取所述關(guān)鍵詞。
優(yōu)選地,所述第一添加模塊,包括:
判斷子模塊,用于判斷所述關(guān)鍵詞是否滿足一預設(shè)條件;
添加子模塊,用于若所述關(guān)鍵詞滿足所述預設(shè)條件,則將所述關(guān)鍵詞添加到所述第一領(lǐng)域的用戶詞庫中。
優(yōu)選地,所述判斷子模塊,具體用于:
判斷所述第一領(lǐng)域的用戶詞庫中是否已收錄所述關(guān)鍵詞;若是,則所述關(guān)鍵詞不滿足所述預設(shè)條件;若否,則所述關(guān)鍵詞滿足所述預設(shè)條件。
優(yōu)選地,所述判斷子模塊,具體用于:
判斷電子設(shè)備中是否安裝有屬于所述第一領(lǐng)域的應用程序;若是,則所述關(guān)鍵詞滿足所述預設(shè)條件;若否,則所述關(guān)鍵詞不滿足所述預設(shè)條件。
優(yōu)選地,所述構(gòu)建用戶詞庫的裝置,還包括:
確定模塊,用于確定所述關(guān)鍵詞的頻次信息,其中,所述頻次信息用于表示所述關(guān)鍵詞在所述聊天內(nèi)容中出現(xiàn)的頻率或次數(shù);
保存模塊,用于將所述關(guān)鍵詞的頻次信息保存在所述第一領(lǐng)域的用戶詞庫中。
優(yōu)選地,所述構(gòu)建用戶詞庫的裝置,還包括:
獲取模塊,用于在所述將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中之后,獲取與所述關(guān)鍵詞相關(guān)的所述第一領(lǐng)域的其他關(guān)鍵詞;
第二添加模塊,用于將所述其他關(guān)鍵詞添加到所述第一領(lǐng)域的用戶詞庫中。
優(yōu)選地,所述構(gòu)建用戶詞庫的裝置,還包括:
刪除模塊,用于在檢測到用戶將屬于所述第一領(lǐng)域的應用程序全部卸載時,刪除所述第一領(lǐng)域的用戶詞庫。
再一方面,基于同一發(fā)明構(gòu)思,本申請?zhí)峁┝艘环N用于構(gòu)建用戶詞庫的裝置,包括有存儲器,以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進行以下操作的指令:
從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,所述關(guān)鍵詞用于表示所述用戶感興趣的事物;將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,所述第一領(lǐng)域為所述用戶感興趣的事物所屬的領(lǐng)域。
本申請實施例中提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu) 點:
1、在本申請實施例中,從用戶的聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞,再將提取到的關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中。所以,有效地解決了現(xiàn)有的輸入法詞庫,無法滿足不同用戶存在不同輸入偏好的技術(shù)問題,實現(xiàn)了基于用戶的聊天內(nèi)容,為該用戶建立不同領(lǐng)域的用戶詞庫,從而滿足不同用戶的輸入習慣,進而提高用戶的輸入效率的技術(shù)效果。
2、在本申請實施例中,從用戶的聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞,再將提取到的關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中。所以,即使用戶很少使用某領(lǐng)域的應用程序進行輸入操作,也可以基于用戶的聊天內(nèi)容,建立該領(lǐng)域的用戶詞庫,使得用戶使用在該領(lǐng)域的應用程序過程中進行輸入操作時(或用戶在瀏覽該領(lǐng)域的網(wǎng)頁過程中進行輸入操作時),可以調(diào)用該領(lǐng)域的用戶詞庫為用戶提供候選詞匯,從而提高輸入效率。
3、在本申請實施例中,對于初次安裝的某領(lǐng)域的首個應用程序,雖然沒有用戶使用該領(lǐng)域應用程序時的歷史輸入記錄,但仍可以基于本實施例中的構(gòu)建用戶詞庫的方法,從聊天內(nèi)容中提取到用戶在該領(lǐng)域的關(guān)鍵詞,從而建立該領(lǐng)域的用戶詞庫。這樣,在用戶使用初次安裝的某領(lǐng)域的首個應用程序過程中進行輸入操作時,可以調(diào)用該領(lǐng)域的用戶詞庫提供候選詞匯,從而提高輸入效率。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本申請實施例中一種構(gòu)建用戶詞庫的方法的流程圖;
圖2為本申請實施例中一種用于構(gòu)建用戶詞庫的裝置200的結(jié)構(gòu)框圖;
圖3為本申請實施例中一種用于構(gòu)建用戶詞庫的裝置800的結(jié)構(gòu)框圖。
具體實施方式
本申請實施例通過提供一種構(gòu)建用戶詞庫的方法、及用于構(gòu)建用戶詞庫的裝置,解決了現(xiàn)有的輸入法應用程序所提供的詞庫,無法滿足不同用戶存在不同輸入偏好的技術(shù)問題。
本申請實施例的技術(shù)方案為解決上述技術(shù)問題,總體思路如下:
一種構(gòu)建用戶詞庫的方法,包括:從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,所述關(guān)鍵詞用于表示所述用戶感興趣的事物;將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,所述第一領(lǐng)域為所述用戶感興趣的事物所屬的領(lǐng)域。
為了更好的理解上述技術(shù)方案,下面將結(jié)合說明書附圖以及具體的實施方式對上述技術(shù)方案進行詳細的說明。
實施例一
本實施例提供了一種構(gòu)建用戶詞庫的方法,如圖1所示,包括:
步驟s101:從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,關(guān)鍵詞用于表示用戶感興趣的事物。
在具體實施過程中,所述聊天內(nèi)容可以是用戶以前輸入的聊天內(nèi)容(即:歷史聊天內(nèi)容),也可以是用戶當前的正在輸入的聊天內(nèi)容。
在具體實施過程中,所述關(guān)鍵詞存在于用戶的聊天內(nèi)容中,用于表示用戶感興趣的事物。例如,用戶在聊天場景下輸入了“我喜歡吃米線”,則“米線”即為用戶感興趣的事物,則可以將“米線”作為關(guān)鍵詞進行提??;再例如,用戶在聊天場景下輸入了“我愛滑雪”,則“滑雪”即為用戶感興趣的事物,則可以將“滑雪”作為關(guān)鍵詞進行提取;再例如,用戶在聊天場景下輸入了“北京烤鴨真好吃”,則“北京烤鴨”即為用戶感興趣的事物,則可以將“北京烤鴨”作為關(guān)鍵詞進行提取;再例如,用戶在聊天場景下輸入了“碟中諜真好看”, 則“碟中諜”即為用戶感興趣的事物,則可以將“碟中諜”作為關(guān)鍵詞進行提??;再例如,用戶在聊天場景下輸入了“二泉映月真好聽”,則“二泉映月”即為用戶感興趣的事物,則可以將“二泉映月”作為關(guān)鍵詞進行提取。
作為一種可選的實施方式,步驟s101,包括:
獲取用戶在聊天場景中輸入的聊天內(nèi)容;檢測聊天內(nèi)容中是否存在預設(shè)字段,其中,預設(shè)字段用于表達用戶對某件事物感興趣的心理狀態(tài);若存在,則確定聊天內(nèi)容中包含所述關(guān)鍵詞;從預設(shè)字段的上下文(即:上文或下文)聊天內(nèi)容中提取所述關(guān)鍵詞。
在具體實施過程中,可以從電子設(shè)備(例如:電腦、智能手機、平板電腦等等)中已安裝的聊天類應用程序(例如:qq、微信、msn、阿里旺旺、雅虎通、陌陌、米聊、易信、飛信、釘釘、263云通信等即時通信軟件)的聊天數(shù)據(jù)中,獲取用戶的聊天內(nèi)容。
在具體實施過程中,所述預設(shè)字段用于表達用戶對某件事物感興趣的心理狀態(tài)。一般,用戶在聊天時,若對某件事物感興趣,會通過這些預設(shè)字段進行表達。例如,所述預設(shè)字段,可以是:“我喜歡……”、“我(最)愛……”、“……真棒”、“……好極了”、“……(真)不錯”、“……(真)好看”、“……(真)好吃”、“……(真)好玩”、“……(真)好聽”、“……(好)可愛”、等等,此處不再一一舉例。
在具體實施過程中,可以通過在用戶的聊天內(nèi)容中檢測是否存在任一上述預設(shè)字段,從而判斷在聊天內(nèi)容中是否存在用戶感興趣的事物,在檢測到有上述某個預設(shè)字段時,則確定在用戶的聊天內(nèi)容中存在用戶感興趣的事物,可以在該預設(shè)字段的上下文聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞。
舉例來講,用戶在聊天場景下輸入了“我喜歡吃米線”,“米線”即為用戶感興趣的事物,則提取關(guān)鍵詞“米線”;再例如,用戶在聊天場景下輸入了“我愛滑雪”,“滑雪”即為用戶感興趣的事物,則提取關(guān)鍵詞“滑雪”;再例如,用戶在聊天場景下輸入了“北京烤鴨真好吃”,“北京烤鴨”即為用戶感興趣的 事物,則提取關(guān)鍵詞“北京烤鴨”;再例如,用戶在聊天場景下輸入了“碟中諜真好看”,“碟中諜”即為用戶感興趣的事物,則提取關(guān)鍵詞“碟中諜”;再例如,用戶在聊天場景下輸入了“二泉映月真好聽”,“二泉映月”即為用戶感興趣的事物,則提取關(guān)鍵詞“二泉映月”。
步驟s102:將關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,第一領(lǐng)域為用戶感興趣的事物所屬的領(lǐng)域。
在具體實施過程中,可以基于用戶感興趣的事物對應的關(guān)鍵詞,確定用戶感興趣的事物所屬的領(lǐng)域(即:第一領(lǐng)域),再將該關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中。
舉例來講,在提取到關(guān)鍵詞“米線”時,由于“米線”是一種食品,則確定“米線”屬于餐飲領(lǐng)域,進一步推測用戶以后在使用餐飲類應用程序(例如:口碑外賣、美團外賣、餓了么、百度外賣、等等)時,或瀏覽餐飲類網(wǎng)頁時,可能會經(jīng)常輸入“米線”,所以將關(guān)鍵詞“米線”添加到餐飲領(lǐng)域的用戶詞庫中。
舉例來講,在提取到關(guān)鍵詞“滑雪”時,由于“滑雪”是一個旅游項目,則確定“滑雪”屬于旅游領(lǐng)域,進一步推測用戶以后在使用旅游類應用程序(例如:途牛旅游、攜程旅行、去哪兒旅行、阿里旅行、等等)時,或瀏覽旅游類網(wǎng)頁時,可能會經(jīng)常輸入“滑雪”,所以將關(guān)鍵詞“滑雪”添加到旅游領(lǐng)域的用戶詞庫中。
舉例來講,在提取到關(guān)鍵詞“碟中諜”時,由于“碟中諜”是一部電影,則確定“碟中諜”屬于視頻領(lǐng)域,進一步推測用戶在以后在使用視頻類應用程序(例如:優(yōu)酷視頻、騰訊視頻、愛奇藝視頻、搜狐視頻、等等)時,或瀏覽視頻類網(wǎng)頁時,可能會經(jīng)常輸入“碟中諜”,所以將關(guān)鍵詞“碟中諜”添加到視頻領(lǐng)域的用戶詞庫中。
舉例來講,在提取到關(guān)鍵詞“二泉映月”時,由于“二泉映月”是一首樂曲,則確定“二泉映月”屬于音樂領(lǐng)域,進一步推測用戶在以后在使用音樂類 應用程序(例如:qq音樂、酷狗音樂、蝦米音樂、百度音樂、等等)時,或瀏覽音樂類網(wǎng)頁時,可能會經(jīng)常輸入“二泉映月”,所以將關(guān)鍵詞“二泉映月”添加到音樂領(lǐng)域的用戶詞庫中。
據(jù)統(tǒng)計,用戶大部分的輸入操作都集中在聊天環(huán)境下,從聊天內(nèi)容中提取關(guān)鍵詞,而不是從用戶全部場景下的輸入內(nèi)容中提取關(guān)鍵詞,這樣可以降低數(shù)據(jù)處理量,提高對關(guān)鍵詞的提取效率。另外,由于用戶在聊天時會經(jīng)常談到自己感興趣的事物,聊天內(nèi)容可以比較真實地反映用戶的興趣愛好,所以從聊天內(nèi)容中提取關(guān)鍵詞,更有利于構(gòu)建能夠滿足用戶輸入偏好的用戶詞庫。
在本實施例中,從用戶的聊天內(nèi)容中提取出用戶在不同領(lǐng)域感興趣的事物對應的關(guān)鍵詞,以此為用戶構(gòu)建不同領(lǐng)域的用戶詞庫,這樣,在用戶使用某一領(lǐng)域的應用程序過程中進行文字輸入時(或在用戶瀏覽某一領(lǐng)域的網(wǎng)頁過程中進行文字輸入時),則可以調(diào)用該領(lǐng)域的用戶詞庫為用戶提供候選詞匯,從而滿足用戶的實際輸入需求,提高文字的輸入效率。
舉例來講,在檢測到用戶a打開一音樂類應用程序,并在該應用程序的ui(userinterface,用戶界面)的輸入?yún)^(qū)域內(nèi)進行文字輸入時(或在檢測到用戶a打開一音樂類網(wǎng)頁,并在該網(wǎng)頁的輸入?yún)^(qū)域內(nèi)進行文字輸入時),則調(diào)用用戶a的音樂領(lǐng)域的用戶詞庫,來為用戶a提供候選詞匯。
在本實施例中,從用戶的聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞,再將提取到的關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中,所以滿足了不同用戶的輸入習慣,從而提高了用戶的輸入效率。
在本實施例中,從用戶的聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞,再將提取到的關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中。這樣,即使用戶很少使用某領(lǐng)域的應用程序進行輸入操作,也可以基于用戶的聊天內(nèi)容,建立該領(lǐng)域的用戶詞庫,在用戶以后在該領(lǐng)域的應用程序中進行輸入時,可以調(diào)用該領(lǐng)域的用戶詞庫為用戶提供候選詞匯,從而提高輸入效率。
且,對于初次安裝某領(lǐng)域的首個應用程序(例如:a領(lǐng)域的app_1),雖 然沒有用戶使用a領(lǐng)域app的歷史輸入記錄,但仍可以基于本實施例中的構(gòu)建用戶詞庫的方法,從聊天內(nèi)容中提取到用戶在a領(lǐng)域的關(guān)鍵詞,從而建立a領(lǐng)域的用戶詞庫。這樣,在用戶使用app_1進行輸入操作時,則可以調(diào)用a領(lǐng)域的用戶詞庫提供候選詞匯,從而提高輸入效率。
此外,作為一種可選的實施方式,在步驟s102之前,還包括:
判斷關(guān)鍵詞是否滿足一預設(shè)條件;若滿足,則執(zhí)行步驟s102;否則,忽略該關(guān)鍵詞。
在具體實施過程中,所述判斷關(guān)鍵詞是否滿足一預設(shè)條件,包括以下兩種實施方式:
方式一:判斷第一領(lǐng)域的用戶詞庫中是否已收錄該關(guān)鍵詞;若是,則該關(guān)鍵詞不滿足預設(shè)條件;若否,則該關(guān)鍵詞滿足預設(shè)條件。該方式適用于用戶使用第一領(lǐng)域的應用程序過程中進行文字輸入的場景,也適用于用戶瀏覽第一領(lǐng)域的網(wǎng)頁過程中進行文字輸入的場景。
舉例來講,在提取到關(guān)鍵詞“米線”時,判斷餐飲領(lǐng)域的用戶詞庫中是否已收錄“米線”這個關(guān)鍵詞,若沒收錄,則將“米線”添加到餐飲領(lǐng)域的用戶詞庫中;若已收錄,則忽略“米線”這個關(guān)鍵詞,并跳轉(zhuǎn)執(zhí)行步驟s101,提取下一個關(guān)鍵詞。
在此方式中,若第一領(lǐng)域的用戶詞庫中已收錄該關(guān)鍵詞,則忽略該關(guān)鍵詞,從而避免收錄重復的關(guān)鍵詞,從而節(jié)約了存儲空間。
方式二:判斷電子設(shè)備中是否安裝有屬于第一領(lǐng)域的應用程序;若是,則該關(guān)鍵詞滿足預設(shè)條件;否則,該關(guān)鍵詞不滿足預設(shè)條件。該方式適用于用戶使用第一領(lǐng)域的應用程序過程中進行文字輸入的場景,不適用于用戶瀏覽第一領(lǐng)域的網(wǎng)頁過程中進行文字輸入的場景。
舉例來講,在提取到關(guān)鍵詞“滑雪”時,判斷用戶的電子設(shè)備中是否安裝有旅游領(lǐng)域的應用程序,若已安裝,則將“滑雪”添加到旅游領(lǐng)域的用戶詞庫中;若未安裝,則忽略“滑雪”這個關(guān)鍵詞,并跳轉(zhuǎn)執(zhí)行步驟s101,提取下一 個關(guān)鍵詞。
在此方式中,若電子設(shè)備沒有安裝第一領(lǐng)域的應用程序,則不建立第一領(lǐng)域的用戶詞庫,從而節(jié)約了存儲空間。
作為一種可選的實施方式,在步驟s102之后,還包括:
確定關(guān)鍵詞的頻次信息,其中,所述頻次信息用于表示關(guān)鍵詞在聊天內(nèi)容中出現(xiàn)的頻率或次數(shù);將關(guān)鍵詞的頻次信息保存在第一領(lǐng)域的用戶詞庫中。這樣,在用戶在第一領(lǐng)域的應用程序中進行文字輸入時(或用戶在第一領(lǐng)域的網(wǎng)頁上進行文字輸入時),可以將第一領(lǐng)域的用戶詞庫中的頻次高的關(guān)鍵詞作為候選詞優(yōu)先推薦給用戶。
舉例來講,在用戶的聊天內(nèi)容中提取到視頻領(lǐng)域的關(guān)鍵詞“大丈夫”、“毒戰(zhàn)”、“碟中諜”、“大宅門”,并將這些關(guān)鍵詞添加到視頻領(lǐng)域的用戶詞庫后,可以進一步確定每個關(guān)鍵詞的頻次信息(假設(shè):“大丈夫”出現(xiàn)2次、“毒戰(zhàn)”出現(xiàn)1次,“大宅門”出現(xiàn)5次、“碟中諜”出現(xiàn)20次),再將每個關(guān)鍵詞的頻次信息也保存在視頻領(lǐng)域的用戶詞庫中。這樣,在用戶打開一視頻類應用程序(或打開一視頻類網(wǎng)頁)并在視頻搜索欄中輸入“d”、“z”,時,基于對這兩個漢語拼音進行模糊搜索,從視頻類的用戶詞庫中確定的候選詞匯有“大丈夫”、“毒戰(zhàn)”、“碟中諜”、“大宅門”,進一步基于每個關(guān)鍵詞的頻次信息,確定每個關(guān)鍵詞在用戶的聊天內(nèi)容中出現(xiàn)的頻率或次數(shù),其中,頻次越高的候選詞被用戶選中的幾率越高,再按照頻率或次數(shù)由高到低的順序?qū)@些候選詞進行排序,排序結(jié)果為“碟中諜”、“大宅門”、“大丈夫”、“毒戰(zhàn)”,則在輸入法程序的候選詞顯示欄內(nèi)依次輸出“碟中諜”、“大宅門”、“大丈夫”、“毒戰(zhàn)”。
作為一種可選的實施方式,在步驟s102之后,還包括:獲取與關(guān)鍵詞相關(guān)的第一領(lǐng)域的其他關(guān)鍵詞;將其他關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中。
舉例來講,在所述關(guān)鍵詞為“米線”時,可以獲取與“米線”相關(guān)的其他關(guān)鍵詞,并將獲取到的其他關(guān)鍵詞添加到飲食領(lǐng)域的用戶詞庫中。其他關(guān)鍵詞可以是不同口味的米線(例如:“過橋米線”、“酸辣肥牛米線”、“紅湯牛肉米 線”、“飄香魚米線”,“清湯雞絲米線”、“酥肉砂鍋米線”、“泡椒雞雜米線”、等等),其他關(guān)鍵詞也可以是不同的米線商家名稱(例如:“云南蒙自米線店”、“四川樂山砂鍋米線”、“沈小福米線”、“劉三姐米線”、等等)。其中,這些其他關(guān)鍵詞的來源,可以是:預先設(shè)置的,或基于其他用戶的餐飲領(lǐng)域的用戶詞庫進行分析收集的。
作為一種可選的實施方式,在步驟s102之后,還包括:在檢測到用戶將屬于所述第一領(lǐng)域的應用程序全部卸載時,刪除所述第一領(lǐng)域的用戶詞庫。
在具體實施過程中,在檢測到用戶將第一領(lǐng)域的應用程序全部卸載時,可以彈出一窗口,詢問用戶是否刪除第一領(lǐng)域的用戶詞庫,若用戶同意刪除,則刪除第一領(lǐng)域的用戶詞庫,從而節(jié)約存儲空間。
上述本申請實施例中的技術(shù)方案,至少具有如下的技術(shù)效果或優(yōu)點:
1、在本申請實施例中,從用戶的聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞,再將提取到的關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中。所以,有效地解決了現(xiàn)有的輸入法應用程序所提供的詞庫,無法滿足不同用戶的輸入偏好的技術(shù)問題,實現(xiàn)了基于用戶的聊天內(nèi)容,為該用戶建立不同領(lǐng)域的用戶詞庫,從而滿足不同用戶的輸入習慣,進而提高用戶的輸入效率的技術(shù)效果。
2、在本申請實施例中,從用戶的聊天內(nèi)容中提取用戶感興趣的事物對應的關(guān)鍵詞,再將提取到的關(guān)鍵詞添加到對應領(lǐng)域的用戶詞庫中。所以,即使用戶很少使用某領(lǐng)域的應用程序進行輸入操作,也可以基于用戶的聊天內(nèi)容,建立該領(lǐng)域的用戶詞庫,使得用戶在使用該領(lǐng)域的應用程序過程中進行輸入操作時(或用戶在瀏覽該領(lǐng)域的網(wǎng)頁過程中進行輸入操作時),可以調(diào)用該領(lǐng)域的用戶詞庫為用戶提供候選詞匯,從而提高輸入效率。
3、在本申請實施例中,對于初次安裝的某領(lǐng)域的首個應用程序,雖然沒有用戶使用該領(lǐng)域應用程序時的歷史輸入記錄,但仍可以基于本實施例中的構(gòu)建用戶詞庫的方法,從聊天內(nèi)容中提取到用戶在該領(lǐng)域的關(guān)鍵詞,從而建立該領(lǐng)域的用戶詞庫。這樣,在用戶使用初次安裝的某領(lǐng)域的首個應用程序過程中 進行輸入操作時,可以調(diào)用該領(lǐng)域的用戶詞庫提供候選詞匯,從而提高輸入效率。
實施例二
本實施例提供了一種用于構(gòu)建用戶詞庫的裝置200,如圖2所示,包括:
提取模塊201,用于從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,所述關(guān)鍵詞用于表示所述用戶感興趣的事物;
第一添加模塊202,用于將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,所述第一領(lǐng)域為所述用戶感興趣的事物所屬的領(lǐng)域。
作為一種可選的實施方式,所述提取模塊201,包括:
獲取子模塊,用于獲取所述用戶在聊天場景中輸入的聊天內(nèi)容;
檢測子模塊,用于檢測所述聊天內(nèi)容中是否存在預設(shè)字段,其中,所述預設(shè)字段用于表達所述用戶對某件事物感興趣的心理狀態(tài);
確定子模塊,用于若存在,則確定所述聊天內(nèi)容中包含所述關(guān)鍵詞;
提取子模塊,用于從所述預設(shè)字段的上下文聊天內(nèi)容中提取所述關(guān)鍵詞。
作為一種可選的實施方式,其特征在于,所述第一添加模塊202,包括:
判斷子模塊,用于判斷所述關(guān)鍵詞是否滿足一預設(shè)條件;
添加子模塊,用于若所述關(guān)鍵詞滿足所述預設(shè)條件,則將所述關(guān)鍵詞添加到所述第一領(lǐng)域的用戶詞庫中。
作為一種可選的實施方式,所述判斷子模塊,具體用于:
判斷所述第一領(lǐng)域的用戶詞庫中是否已收錄所述關(guān)鍵詞;若是,則所述關(guān)鍵詞不滿足所述預設(shè)條件;若否,則所述關(guān)鍵詞滿足所述預設(shè)條件。
作為一種可選的實施方式,所述判斷子模塊,具體用于:
判斷電子設(shè)備中是否安裝有屬于所述第一領(lǐng)域的應用程序;若是,則所述關(guān)鍵詞滿足所述預設(shè)條件;若否,則所述關(guān)鍵詞不滿足所述預設(shè)條件。
作為一種可選的實施方式,所述用于構(gòu)建用戶詞庫的裝置,還包括:
確定模塊,用于在將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中之后,確定所述關(guān)鍵詞的頻次信息,其中,所述頻次信息用于表示所述關(guān)鍵詞在所述聊天內(nèi)容中出現(xiàn)的頻率或次數(shù);
保存模塊,用于將所述關(guān)鍵詞和所述關(guān)鍵詞的頻次信息保存到所述第一領(lǐng)域的用戶詞庫中。
作為一種可選的實施方式,所述用于構(gòu)建用戶詞庫的裝置,還包括:
獲取模塊,用于在所述將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中之后,獲取與所述關(guān)鍵詞相關(guān)的所述第一領(lǐng)域的其他關(guān)鍵詞;
第二添加模塊,用于將所述其他關(guān)鍵詞添加在所述第一領(lǐng)域的用戶詞庫中。
作為一種可選的實施方式,所述用于構(gòu)建用戶詞庫的裝置,還包括:
刪除模塊,用于在檢測到用戶將屬于所述第一領(lǐng)域的應用程序全部卸載時,刪除所述第一領(lǐng)域的用戶詞庫。
關(guān)于上述實施例中的一種用于構(gòu)建用戶詞庫的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進行了詳細描述,此處將不做詳細闡述說明。
圖3是根據(jù)一示例性實施例示出一種用于構(gòu)建用戶詞庫的裝置800的框圖。例如,裝置800可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
參照圖3,裝置800可以包括以下一個或多個組件:處理組件802,存儲器804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(i/o)的接口812,傳感器組件814,以及通信組件816。
處理組件802通??刂蒲b置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理元件802可以包括一個或多個處理器820來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個或多個模塊,便于處理組件802和其他組件之間的交互。例如,處理部件802可以包括多媒體模塊,以方便多媒體組件808和處理組件 802之間的交互。
存儲器804被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(sram),電可擦除可編程只讀存儲器(eeprom),可擦除可編程只讀存儲器(eprom),可編程只讀存儲器(prom),只讀存儲器(rom),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件806為裝置800的各種組件提供電力。電源組件806可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置800生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件808包括在所述裝置800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件808包括一個前置攝像頭和/或后置攝像頭。當設(shè)備800處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。
音頻組件810被配置為輸出和/或輸入音頻信號。例如,音頻組件810包括一個麥克風(mic),當裝置800處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器804或經(jīng)由通信組件816發(fā)送。在一些實施例中,音頻組件810還包括一個揚聲器,用于輸出音頻信號。
i/o接口812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件814包括一個或多個傳感器,用于為裝置800提供各個方面的狀態(tài)評估。例如,傳感器組件814可以檢測到設(shè)備800的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測裝置800或裝置800一個組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應用中使用。在一些實施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件816被配置為便于裝置800和其他設(shè)備之間有線或無線方式的通信。裝置800可以接入基于通信標準的無線網(wǎng)絡(luò),如wifi,2g或3g,或它們的組合。在一個示例性實施例中,通信部件816經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信部件816還包括近場通信(nfc)模塊,以促進短程通信。例如,在nfc模塊可基于射頻識別(rfid)技術(shù),紅外數(shù)據(jù)協(xié)會(irda)技術(shù),超寬帶(uwb)技術(shù),藍牙(bt)技術(shù)和其他技術(shù)來實現(xiàn)。
在示例性實施例中,裝置800可以被一個或多個應用專用集成電路(asic)、數(shù)字信號處理器(dsp)、數(shù)字信號處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是rom、隨機 存取存儲器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
一種非臨時性計算機可讀存儲介質(zhì),當所述存儲介質(zhì)中的指令由移動終端的處理器執(zhí)行時,使得移動終端能夠執(zhí)行一種構(gòu)建用戶詞庫的方法,包括:從用戶的聊天內(nèi)容中提取關(guān)鍵詞,其中,所述關(guān)鍵詞用于表示所述用戶感興趣的事物;將所述關(guān)鍵詞添加到第一領(lǐng)域的用戶詞庫中,其中,所述第一領(lǐng)域為所述用戶感興趣的事物所屬的領(lǐng)域。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實施方案。本發(fā)明旨在涵蓋本發(fā)明的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
應當理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。