本申請屬于字庫處理技術(shù)領(lǐng)域,具體地說,涉及一種輸入法的字庫配置方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的迅猛發(fā)展,社交軟件的種類變得越來越豐富,比較主流的包括QQ、微信、MSN等,可借助互聯(lián)網(wǎng)實(shí)現(xiàn)用戶之間的即時(shí)通訊。通常,社交軟件都會(huì)提供聊天對象名單,類似于手機(jī)的通訊錄,用戶可選擇聊天對象名單中的某人進(jìn)行聊天。
聊天對象名單中包含親戚、朋友、同學(xué)、同事等與用戶有社交關(guān)系的人,經(jīng)過統(tǒng)計(jì)發(fā)現(xiàn),用戶對于不同社交關(guān)系的聊天對象會(huì)采用不同的聊天方式,例如,與同事聊天時(shí),大多涉及工作相關(guān)的事務(wù),聊天的內(nèi)容比較嚴(yán)肅,詞條比較嚴(yán)謹(jǐn);與家人聊天時(shí),大多涉及家長里短,聊天的內(nèi)容比較隨意,詞條也比較口語化,甚至有些方言;而與朋友聊天時(shí),聊天的內(nèi)容大多涉及休閑娛樂,詞條則會(huì)比較活潑、輕松,甚至使用一些網(wǎng)絡(luò)熱詞。
所以,用戶在使用社交軟件時(shí),對于不同的聊天對象,經(jīng)常使用的詞是各不相同的,而現(xiàn)有的輸入法通常僅包含一個(gè)字庫,無論聊天對象是誰,輸入法使用的都是同一個(gè)字庫且對于詞條熱度采用的是同一個(gè)標(biāo)準(zhǔn),無法為不同的聊天對象提供個(gè)性化的字庫。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本申請所要解決的技術(shù)問題是提供了一種輸入法的字庫配置方法、裝置以及調(diào)用處理方法,為不同的聯(lián)系人配置專屬的分字庫,從而使輸入法更加符合用戶對于不同聯(lián)系人的聊天習(xí)慣。
為了解決上述技術(shù)問題,本申請公開了一種輸入法的字庫配置方法,包括:
根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;
將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中。
優(yōu)選地,根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容,進(jìn)一步包括:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
優(yōu)選地,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
優(yōu)選地,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
優(yōu)選地,所述統(tǒng)一標(biāo)識包括以下一個(gè)或多個(gè)的組合:用戶終端號碼、聯(lián)系人名字、備注名。
優(yōu)選地,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中,進(jìn)一步包括:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
優(yōu)選地,所述編碼方法,包括:拼音、形碼、音形結(jié)合、內(nèi)碼。
優(yōu)選地,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,進(jìn)一步包括:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
優(yōu)選地,對所述文字合集進(jìn)行分詞并提取常用詞,進(jìn)一步包括:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
優(yōu)選地,將使用熱度大于預(yù)定值的常用詞保存至所述聯(lián)系人關(guān)聯(lián)的分字庫,進(jìn)一步包括:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
優(yōu)選地,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
本申請還公開了一種輸入法的字庫配置裝置,包括:
查詢裝置,用于根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;
轉(zhuǎn)換裝置,用于將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
分詞存儲裝置,用于對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中。
優(yōu)選地,所述查詢裝置,進(jìn)一步用于:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
優(yōu)選地,所述轉(zhuǎn)換裝置,進(jìn)一步用于:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
優(yōu)選地,所述轉(zhuǎn)換裝置,進(jìn)一步用于:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
優(yōu)選地,所述統(tǒng)一標(biāo)識包括以下一個(gè)或多個(gè)的組合:用戶終端號碼、聯(lián)系人名字、備注名。
優(yōu)選地,所述分詞存儲裝置,進(jìn)一步用于:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
優(yōu)選地,所述編碼方法,包括:拼音、形碼、音形結(jié)合、內(nèi)碼。
優(yōu)選地,所述轉(zhuǎn)換裝置,進(jìn)一步用于:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
優(yōu)選地,所述分詞存儲裝置,進(jìn)一步用于:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
優(yōu)選地,所述分詞存儲裝置,進(jìn)一步用于:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
優(yōu)選地,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
本申請還公開了一種輸入法的字庫調(diào)用處理方法,包括:
啟動(dòng)輸入法,識別用戶終端中當(dāng)前社交軟件的聯(lián)系人;
調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,其中,所述聯(lián)系人關(guān)聯(lián)的分字庫的配置過程為:根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中;
獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中。
優(yōu)選地,根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述 聯(lián)系人之間的聊天內(nèi)容,進(jìn)一步包括:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
優(yōu)選地,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
優(yōu)選地,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
優(yōu)選地,所述統(tǒng)一標(biāo)識包括以下一個(gè)或多個(gè)的組合:用戶終端號碼、聯(lián)系人名字、備注名。
優(yōu)選地,調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,進(jìn)一步包括:
根據(jù)所述當(dāng)前社交軟件的聯(lián)系人的統(tǒng)一標(biāo)識,查找并調(diào)取所述聯(lián)系人關(guān)聯(lián)的分字庫。
優(yōu)選地,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中,進(jìn)一步包括:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
優(yōu)選地,所述編碼方法,包括:拼音、形碼、音形結(jié)合、內(nèi)碼。
優(yōu)選地,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中,進(jìn)一步包括:
根據(jù)用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,并將與所述用戶輸入的輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中。
優(yōu)選地,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中,進(jìn)一步包括:
根據(jù)用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,如果未查找到與所述用戶輸入的輸入法編碼相關(guān)的常用詞,則對所述用戶輸入的輸入法編碼進(jìn)行拆解,根據(jù)拆解所得的多組輸入法編碼,分別在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,并將與所述拆解所得的第一組輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中;
選定所述拆解所得的第一組輸入法編碼相關(guān)的常用詞后,將與所述拆解所得的第二組輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中。
優(yōu)選地,如果未查找到與所述用戶輸入的輸入法編碼相關(guān)的常用詞,則對所述用戶輸入的輸入法編碼進(jìn)行拆解,根據(jù)拆解所得的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,進(jìn)一步包括:
如果在所述聯(lián)系人相關(guān)聯(lián)的分子庫中未查找到與所述拆解所得的輸入法編碼相關(guān)的常用詞,則繼續(xù)將所述輸入法編碼拆解為單編碼,并將與所述拆解所得的單編碼相關(guān)的單字顯示在所述輸入法界面中。
優(yōu)選地,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,進(jìn)一步包括:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素 與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
優(yōu)選地,對所述文字合集進(jìn)行分詞并提取常用詞,進(jìn)一步包括:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
優(yōu)選地,將使用熱度大于預(yù)定值的常用詞保存至所述聯(lián)系人關(guān)聯(lián)的分字庫,進(jìn)一步包括:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
優(yōu)選地,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
優(yōu)選地,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中,之前還包括:
監(jiān)測輸入法界面的開啟指令;
在監(jiān)測到輸入法界面開啟指令后,且在獲取到用戶輸入的輸入法編碼前,在所述輸入法界面中按使用熱度順序顯示所述聯(lián)系人關(guān)聯(lián)的分字庫中的常用詞。
與現(xiàn)有技術(shù)相比,本申請可以獲得包括以下技術(shù)效果:
1)根據(jù)聯(lián)系人與用戶的聊天內(nèi)容,為不同的聯(lián)系人配置專屬的分字庫,用戶與聯(lián)系人聊天時(shí)可調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,從而使輸入法更加符合用戶對于不同聯(lián)系人的聊天習(xí)慣。
2)多個(gè)社交軟件中的同一聯(lián)系人復(fù)用同一分字庫,不僅節(jié)省了分字庫占用的空間資源,還可實(shí)現(xiàn)對社交軟件中聯(lián)系人的集中統(tǒng)一管理。
3)當(dāng)用戶與聯(lián)系人聊天時(shí),可直接調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,并 根據(jù)用戶輸入的編碼,將分字庫中匹配的相關(guān)常用詞按照使用熱度顯示在輸入法界面中供用戶選擇,大大提高了符合用戶與所述聯(lián)系人聊天習(xí)慣的常用詞的命中率,節(jié)省了聊天內(nèi)容的輸入時(shí)間。
當(dāng)然,實(shí)施本申請的任一產(chǎn)品必不一定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
附圖說明
此處所說明的附圖用來提供對本申請的進(jìn)一步理解,構(gòu)成本申請的一部分,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:
圖1是本申請實(shí)施例一的流程圖;
圖2是本申請實(shí)施例二的結(jié)構(gòu)示意圖;
圖3是本申請實(shí)施例三的流程圖。
具體實(shí)施方式
以下將配合附圖及實(shí)施例來詳細(xì)說明本申請的實(shí)施方式,藉此對本申請如何應(yīng)用技術(shù)手段來解決技術(shù)問題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。
本申請?zhí)峁┮环N輸入法的字庫配置方法、裝置以及調(diào)用方法,可應(yīng)用于用戶終端中為各個(gè)社交軟件的聯(lián)系人建立專屬的分字庫,并在用戶與聯(lián)系人聊天時(shí)調(diào)用該聯(lián)系人對應(yīng)的分字庫,從而可在輸入法界面中使用該聯(lián)系人對應(yīng)的分字庫中的詞語,使輸入法更符合用戶針對不同聯(lián)系人的用詞習(xí)慣。
另外,本申請除了應(yīng)用于上述社交軟件的聊天場景中,還可應(yīng)用于其它應(yīng)用場合,對此不作限定。
如圖1所示,本申請的實(shí)施例一提供一種輸入法的字庫配置方法,包括:
步驟101,根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;
步驟102,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
步驟103,對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中。
其中,步驟101中,各社交軟件的聯(lián)系人與用戶發(fā)生聊天時(shí),會(huì)產(chǎn)生聊天內(nèi)容,所述聊天內(nèi)容可以是各社交軟件自動(dòng)保存的聊天記錄,也可以是用戶終端主動(dòng)保存的聊天數(shù)據(jù),在此不做限定。另外,查找并提取聊天內(nèi)容可以僅依據(jù)用戶終端中當(dāng)前存儲的聊天內(nèi)容,也可周期性地對聊天內(nèi)容進(jìn)行查找并提取,且可隨時(shí)根據(jù)最新提取的或者多次提取的所有聊天內(nèi)容執(zhí)行后續(xù)步驟,以更新聯(lián)系人的分字庫。
步驟102中,由于聊天內(nèi)容包含的數(shù)據(jù)類型多種多樣,可在執(zhí)行轉(zhuǎn)換文字合集動(dòng)作之前,將聊天內(nèi)容中的圖片、表情、動(dòng)畫、視頻等等無法轉(zhuǎn)換為文字的數(shù)據(jù)過濾掉,以避免在文字合集中出現(xiàn)亂碼,從而保證文字合集的規(guī)整,方便步驟103進(jìn)行分詞。
步驟103執(zhí)行對文字合集的分詞后會(huì)獲得若干分詞,從這些分詞中提取出常用詞,并對常用詞進(jìn)行熱度排序,使用熱度大于預(yù)定值的常用詞才會(huì)被收錄到所述聯(lián)系人關(guān)聯(lián)的分詞庫中。
由于用戶終端中的社交軟件可能包含多個(gè),而社交軟件中的聯(lián)系人亦是多個(gè),在這種情景下:
本實(shí)施例中,步驟101進(jìn)一步包括:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
步驟101不僅需查找并提取單個(gè)社交軟件中每個(gè)聯(lián)系人與用戶的聊天內(nèi)容,還需將查找并提取聊天內(nèi)容的動(dòng)作應(yīng)用到每個(gè)社交軟件中,從而可獲得用戶終端中與用戶進(jìn)行過聊天的每個(gè)聯(lián)系人的所有的聊天內(nèi)容,所述聯(lián)系人的所有的聊天內(nèi)容中可能包含該聯(lián)系人在多個(gè)不同社交軟件中與用戶發(fā)生的聊天內(nèi)容。
本實(shí)施例中,針對同一聯(lián)系人在不同社交軟件中與用戶發(fā)生的聊天內(nèi)容轉(zhuǎn)換為文字合集的問題,步驟102提供了多種解決方式,如:
方式一:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將合并生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
方式二:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
同一聯(lián)系人可能包含在多個(gè)社交軟件中,例如“張三”既是用戶終端中QQ中的聯(lián)系人,也是微信中的聯(lián)系人,但“張三”的QQ號和微信號可能并不一致,這種情形下,根據(jù)社交軟件中的用戶號碼無法獲知哪些實(shí)質(zhì)是同一個(gè)聯(lián)系人。通過為聯(lián)系人設(shè)定統(tǒng)一標(biāo)識,可通過統(tǒng)一標(biāo)識識別出各個(gè)社交軟件中相同的聯(lián)系人,也就是雖然“張三”的QQ號和微信號并不同,但“張三”的統(tǒng)一標(biāo)識在QQ和微信中是相同的。
根據(jù)方式一,可通過統(tǒng)一標(biāo)識在QQ和微信中分別識別出“張三”的實(shí)際身份,然后將“張三”在QQ中的聊天內(nèi)容轉(zhuǎn)換為文字合集一,將其在微信中的聊天內(nèi)容轉(zhuǎn)換為文字合集二,并將文字合集一和文字合集二合并為“張三”的最終的文字合集;根據(jù)方式二,可將各個(gè)社交軟件中的每個(gè)聯(lián)系人的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將文字合集與聯(lián)系人進(jìn)行關(guān)聯(lián)保存,這樣文字合集與聯(lián)系人建立了綁定關(guān)系,之后再通過統(tǒng)一標(biāo)識識別出各個(gè)社交軟件中相同的聯(lián)系人,相同聯(lián)系人所綁定的文字合集進(jìn)行合并后即是該聯(lián)系人 最終的文字合集。最后,方式一和方式二將獲得的聯(lián)系人的最終的文字合集與聯(lián)系人以及聯(lián)系人的統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存,例如將“張三”的最終的文字合集與“張三”及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
由于步驟102中設(shè)定了聯(lián)系人的統(tǒng)一標(biāo)識,為了方便對各個(gè)社交軟件中的聯(lián)系人進(jìn)行集中統(tǒng)一的管理,步驟102還可根據(jù)所述統(tǒng)一標(biāo)識建立一統(tǒng)一通訊錄,所述統(tǒng)一通訊錄中的聯(lián)系人涵蓋了各個(gè)社交軟件中的所有聯(lián)系人,并且記錄了所述統(tǒng)一通訊錄中的聯(lián)系人與各個(gè)社交軟件中的聯(lián)系人的對應(yīng)關(guān)系,相應(yīng)地,后續(xù)生成的分字庫可直接與統(tǒng)一通訊錄中的聯(lián)系人進(jìn)行對應(yīng)關(guān)聯(lián)保存。所述統(tǒng)一通訊錄可以是用戶終端中自帶的通訊錄,例如手機(jī)通訊錄,也可以在用戶終端中單獨(dú)建立,在此不作限定,統(tǒng)一通訊錄中的聯(lián)系人范圍可以大于但必須包含各個(gè)社交軟件中所有聯(lián)系人的范圍,統(tǒng)一標(biāo)識可以添加在統(tǒng)一通訊錄中聯(lián)系人的詳細(xì)信息中。這樣用戶可在統(tǒng)一通訊錄中方便地查看某聯(lián)系人所屬的社交軟件有哪些,而且在后續(xù)輸入法調(diào)用分字庫時(shí)可根據(jù)統(tǒng)一通訊錄中聯(lián)系人與社交軟件中聯(lián)系人的對應(yīng)關(guān)系快速的查找出相應(yīng)的分字庫。
優(yōu)選地,所述統(tǒng)一標(biāo)識包括用戶終端號碼、聯(lián)系人名字、備注名等。針對上述的統(tǒng)一通訊錄,可以將用戶終端號碼(例如聯(lián)系人的手機(jī)號)設(shè)定為統(tǒng)一標(biāo)識,通過將聯(lián)系人的手機(jī)號與其在各個(gè)社交軟件中的用戶號碼進(jìn)行關(guān)聯(lián),即可實(shí)現(xiàn)對聯(lián)系人的集中統(tǒng)一管理。例如上述的聯(lián)系人“張三”,可在統(tǒng)一通訊錄中將“張三”的手機(jī)號與其QQ號和微信號進(jìn)行關(guān)聯(lián),步驟102在查找并提取“張三”的文字合集時(shí)即可根據(jù)“張三”的手機(jī)號快速識別出其在QQ中的聊天內(nèi)容和其在微信中的聊天內(nèi)容,并將生成的文字合集與“張三”的手機(jī)號進(jìn)行關(guān)聯(lián)保存。
本實(shí)施例中,為了方便后續(xù)輸入法對聯(lián)系人的分字庫進(jìn)行調(diào)用,步驟103進(jìn)一步包括:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
在保存常用詞至分字庫時(shí),不僅會(huì)保存常用詞本身,還會(huì)依照拼音、形碼、音形結(jié)合、內(nèi)碼等編碼方法,獲得所述常用詞對應(yīng)的各種編碼,并將獲 得的所述編碼與所述常用詞關(guān)聯(lián)保存到分詞庫中。這樣,分詞庫中每個(gè)常用詞都關(guān)聯(lián)有其拼音編碼、形碼編碼等編碼,使用輸入法時(shí),根據(jù)用戶輸入的編碼即可快速查找到相應(yīng)的常用詞并展示給用戶。
如上文所述,聊天內(nèi)容中包含的數(shù)據(jù)類型多種多樣,其中語音和文字中包含了大部分的重要聊天內(nèi)容,為了將這些重要聊天內(nèi)容轉(zhuǎn)換為文字合集。
本實(shí)施例中,步驟102進(jìn)一步包括:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
其中,所述聲音參數(shù)包括聲音的抑揚(yáng)頓挫、詞語之間的時(shí)間間隔等等,根據(jù)聲音參數(shù)將語音拆分為多個(gè)語音元素,語音元素可以是單字或者單詞或者短語,之后按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將語音轉(zhuǎn)換為文字。所述預(yù)設(shè)的語音元素與文字的映射關(guān)系可以存儲為用戶終端本地,也可存儲在網(wǎng)絡(luò)服務(wù)器中。
步驟103進(jìn)一步包括:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
其中,對所述文字合集進(jìn)行語義分析包括,分析出名詞、形容詞等,以及分析單字是否可依附于其前方或后方的詞語組成短語等,通過語義分析可獲得多個(gè)分詞,所述多個(gè)分詞中必然包含了大量“的”、“我”等語氣助詞或者非個(gè)性化的詞,將這些分詞歸類為停用詞,并從多個(gè)分詞中過濾掉,就獲得了常用詞。
對于保存至分字庫中的常用詞,每個(gè)常用詞在用戶聊天習(xí)慣中的使用情況是不同的,為了區(qū)分常用詞的使用熱度,并在用戶使用過程中提供更合理的推送順序,步驟103進(jìn)一步包括:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
所述使用頻率可在分詞時(shí)即進(jìn)行統(tǒng)計(jì),即統(tǒng)計(jì)常用詞在分詞中出現(xiàn)的次數(shù),根據(jù)使用頻率生成詞頻列表;而對于用戶的聊天習(xí)慣而言,并不是使用頻率高的常用詞就是用戶聊天時(shí)最想使用的詞,還需要基于用戶的聊天對象考慮常用詞的權(quán)重。例如,“張三”為用戶的同事,根據(jù)詞頻列表,“是的”的詞頻遠(yuǎn)遠(yuǎn)大于“媒體流”的詞頻,但對于同事來說,“媒體流”顯然具有更高的專業(yè)性和針對性,因此可通過權(quán)重來調(diào)整“媒體流”的權(quán)重,使其在使用熱度列表中的位置在“是的”的前方。
優(yōu)選地,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
更加專業(yè)的常用詞的常用度反而會(huì)更低,這種情景下常用詞的權(quán)重可與其常用度呈反比;或者,根據(jù)用戶使用輸入法時(shí)將常用詞設(shè)定為置于首位的次數(shù)成正比,用戶也可通過這種方式手動(dòng)調(diào)整常用詞的權(quán)重。
圖2所示,本申請實(shí)施例二提供了一種輸入法的字庫配置裝置,包括:
查詢裝置11,用于根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;
轉(zhuǎn)換裝置12,用于將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
分詞存儲裝置13,用于對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中。
其中,各社交軟件的聯(lián)系人與用戶發(fā)生聊天時(shí),會(huì)產(chǎn)生聊天內(nèi)容,所述聊天內(nèi)容可以是各社交軟件自動(dòng)保存的聊天記錄,也可以是用戶終端主動(dòng)保存的聊天數(shù)據(jù),在此不做限定。另外,查詢裝置11中查找并提取聊天內(nèi)容可以僅依據(jù)用戶終端中當(dāng)前存儲的聊天內(nèi)容,也可周期性地對聊天內(nèi)容進(jìn)行查找并提取,且可隨時(shí)根據(jù)最新提取的或者多次提取的所有聊天內(nèi)容執(zhí)行后 續(xù)步驟,以更新聯(lián)系人的分字庫。
由于聊天內(nèi)容包含的數(shù)據(jù)類型多種多樣,查詢裝置11還可用于在執(zhí)行轉(zhuǎn)換文字合集動(dòng)作之前,將聊天內(nèi)容中的圖片、表情、動(dòng)畫、視頻等等無法轉(zhuǎn)換為文字的數(shù)據(jù)過濾掉,以避免在文字合集中出現(xiàn)亂碼,從而保證文字合集的規(guī)整,方便分詞存儲裝置13進(jìn)行分詞。
分詞存儲裝置13執(zhí)行對文字合集的分詞后會(huì)獲得若干分詞,從這些分詞中提取出常用詞,并對常用詞進(jìn)行熱度排序,使用熱度大于預(yù)定值的常用詞才會(huì)被收錄到所述聯(lián)系人關(guān)聯(lián)的分詞庫中。
由于用戶終端中的社交軟件可能包含多個(gè),而社交軟件中的聯(lián)系人亦是多個(gè),在這種情景下:
本實(shí)施例中,查詢裝置11還用于:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
查詢裝置11不僅需查找并提取單個(gè)社交軟件中每個(gè)聯(lián)系人與用戶的聊天內(nèi)容,還需將查找并提取聊天內(nèi)容的動(dòng)作應(yīng)用到每個(gè)社交軟件中,從而可獲得用戶終端中與用戶進(jìn)行過聊天的每個(gè)聯(lián)系人的所有的聊天內(nèi)容,所述聯(lián)系人的所有的聊天內(nèi)容中可能包含該聯(lián)系人在多個(gè)不同社交軟件中與用戶發(fā)生的聊天內(nèi)容。
本實(shí)施例中,針對同一聯(lián)系人在不同社交軟件中與用戶發(fā)生的聊天內(nèi)容轉(zhuǎn)換為文字合集的問題,轉(zhuǎn)換裝置12提供了多種解決方式,如:
方式一:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將合并生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
方式二:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文 字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
同一聯(lián)系人可能包含在多個(gè)社交軟件中,例如“張三”既是用戶終端中QQ中的聯(lián)系人,也是微信中的聯(lián)系人,但“張三”的QQ號和微信號可能并不一致,這種情形下,根據(jù)社交軟件中的用戶號碼無法獲知哪些實(shí)質(zhì)是同一個(gè)聯(lián)系人。通過為聯(lián)系人設(shè)定統(tǒng)一標(biāo)識,可通過統(tǒng)一標(biāo)識識別出各個(gè)社交軟件中相同的聯(lián)系人,也就是雖然“張三”的QQ號和微信號并不同,但“張三”的統(tǒng)一標(biāo)識在QQ和微信中是相同的。
根據(jù)方式一,可通過統(tǒng)一標(biāo)識在QQ和微信中分別識別出“張三”的實(shí)際身份,然后將“張三”在QQ中的聊天內(nèi)容轉(zhuǎn)換為文字合集一,將其在微信中的聊天內(nèi)容轉(zhuǎn)換為文字合集二,并將文字合集一和文字合集二合并為“張三”的最終的文字合集;根據(jù)方式二,可將各個(gè)社交軟件中的每個(gè)聯(lián)系人的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將文字合集與聯(lián)系人進(jìn)行關(guān)聯(lián)保存,這樣文字合集與聯(lián)系人建立了綁定關(guān)系,之后再通過統(tǒng)一標(biāo)識識別出各個(gè)社交軟件中相同的聯(lián)系人,相同聯(lián)系人所綁定的文字合集進(jìn)行合并后即是該聯(lián)系人最終的文字合集。最后,方式一和方式二將獲得的聯(lián)系人的最終的文字合集與聯(lián)系人以及聯(lián)系人的統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存,例如將“張三”的最終的文字合集與“張三”及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
由于預(yù)設(shè)了聯(lián)系人的統(tǒng)一標(biāo)識,為了方便對各個(gè)社交軟件中的聯(lián)系人進(jìn)行集中統(tǒng)一的管理,轉(zhuǎn)換裝置12還可根據(jù)所述統(tǒng)一標(biāo)識建立一統(tǒng)一通訊錄,所述統(tǒng)一通訊錄中的聯(lián)系人涵蓋了各個(gè)社交軟件中的所有聯(lián)系人,并且記錄了所述統(tǒng)一通訊錄中的聯(lián)系人與各個(gè)社交軟件中的聯(lián)系人的對應(yīng)關(guān)系,相應(yīng)地,后續(xù)生成的分字庫可直接與統(tǒng)一通訊錄中的聯(lián)系人進(jìn)行對應(yīng)關(guān)聯(lián)保存。所述統(tǒng)一通訊錄可以是用戶終端中自帶的通訊錄,例如手機(jī)通訊錄,也可以在用戶終端中單獨(dú)建立,再次不作限定,統(tǒng)一通訊錄中的聯(lián)系人范圍可以大于但必須包含各個(gè)社交軟件中所有聯(lián)系人的范圍,統(tǒng)一標(biāo)識可以添加在統(tǒng)一 通訊錄中聯(lián)系人的詳細(xì)信息中。這樣用戶可在統(tǒng)一通訊錄中方便地查看某聯(lián)系人所屬的社交軟件有哪些,而且在后續(xù)輸入法調(diào)用分字庫時(shí)可根據(jù)統(tǒng)一通訊錄中聯(lián)系人與社交軟件中聯(lián)系人的對應(yīng)關(guān)系快速的查找出相應(yīng)的分字庫。
優(yōu)選地,所述統(tǒng)一標(biāo)識包括用戶終端號碼、聯(lián)系人名字、備注名等。針對上述的統(tǒng)一通訊錄,可以將用戶終端號碼(例如聯(lián)系人的手機(jī)號)設(shè)定為統(tǒng)一標(biāo)識,通過將聯(lián)系人的手機(jī)號與其在各個(gè)社交軟件中的用戶號碼進(jìn)行關(guān)聯(lián),即可實(shí)現(xiàn)對聯(lián)系人的集中統(tǒng)一管理。例如上述的聯(lián)系人“張三”,可在統(tǒng)一通訊錄中將“張三”的手機(jī)號與其QQ號和微信號進(jìn)行關(guān)聯(lián),步驟102在查找并提取“張三”的文字合集時(shí)即可根據(jù)“張三”的手機(jī)號快速識別出其在QQ中的聊天內(nèi)容和其在微信中的聊天內(nèi)容,并將生成的文字合集與“張三”的手機(jī)號進(jìn)行關(guān)聯(lián)保存。
本實(shí)施例中,為了方便后續(xù)輸入法對聯(lián)系人的分字庫進(jìn)行調(diào)用,分詞存儲裝置13,進(jìn)一步用于:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
在保存常用詞至分字庫時(shí),不僅會(huì)保存常用詞本身,還會(huì)依照拼音、形碼、音形結(jié)合、內(nèi)碼等編碼方法,獲得所述常用詞對應(yīng)的各種編碼,并將獲得的所述編碼與所述常用詞關(guān)聯(lián)保存到分詞庫中。這樣,分詞庫中每個(gè)常用詞都關(guān)聯(lián)有其拼音編碼、形碼編碼等編碼,使用輸入法時(shí),根據(jù)用戶輸入的編碼即可快速查找到相應(yīng)的常用詞并展示給用戶。
如上文所述,聊天內(nèi)容中包含的數(shù)據(jù)類型多種多樣,其中語音和文字中包含了大部分的重要聊天內(nèi)容,為了將這些重要聊天內(nèi)容轉(zhuǎn)換為文字合集。
本實(shí)施例中,轉(zhuǎn)換裝置12進(jìn)一步用于:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
其中,所述聲音參數(shù)包括聲音的抑揚(yáng)頓挫、詞語之間的時(shí)間間隔等等, 根據(jù)聲音參數(shù)將語音拆分為多個(gè)語音元素,語音元素可以是單字或者單詞或者短語,之后按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將語音轉(zhuǎn)換為文字。所述預(yù)設(shè)的語音元素與文字的映射關(guān)系可以存儲為用戶終端本地,也可存儲在網(wǎng)絡(luò)服務(wù)器中。
分詞存儲裝置13進(jìn)一步用于:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
其中,對所述文字合集進(jìn)行語義分析包括,分析出名詞、形容詞等,以及分析單字是否可依附于其前方或后方的詞語組成短語等,通過語義分析可獲得多個(gè)分詞,所述多個(gè)分詞中必然包含了大量“的”、“我”等語氣助詞或者非個(gè)性化的詞,將這些分詞歸類為停用詞,并從多個(gè)分詞中過濾掉,就獲得了常用詞。
對于保存至分字庫中的常用詞,每個(gè)常用詞在用戶聊天習(xí)慣中的使用情況是不同的,為了區(qū)分常用詞的使用熱度,并在用戶使用過程中提供更合理的推送順序,分詞存儲裝置13進(jìn)一步用于:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
所述使用頻率可在分詞時(shí)即進(jìn)行統(tǒng)計(jì),即統(tǒng)計(jì)常用詞在分詞中出現(xiàn)的次數(shù),根據(jù)使用頻率生成詞頻列表;而對于用戶的聊天習(xí)慣而言,并不是使用頻率高的常用詞就是用戶聊天時(shí)最想使用的詞,還需要基于用戶的聊天對象考慮常用詞的權(quán)重。例如,“張三”為用戶的同事,根據(jù)詞頻列表,“是的”的詞頻遠(yuǎn)遠(yuǎn)大于“媒體流”的詞頻,但對于同事來說,“媒體流”顯然具有更高的專業(yè)性和針對性,因此可通過權(quán)重來調(diào)整“媒體流”的權(quán)重,使其在使用熱度列表中的位置在“是的”的前方。
優(yōu)選地,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
更加專業(yè)的常用詞的常用度反而會(huì)更低,這種情景下常用詞的權(quán)重可與其常用度呈反比;或者,根據(jù)用戶使用輸入法時(shí)將常用詞設(shè)定為置于首位的次數(shù)成正比,用戶也可通過這種方式手動(dòng)調(diào)整常用詞的權(quán)重。
如圖3所示,本申請實(shí)施例三提供了一種輸入法的字庫調(diào)用處理方法,包括:
步驟201,啟動(dòng)輸入法,識別用戶終端中當(dāng)前社交軟件的聯(lián)系人;
步驟202,調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,其中,所述聯(lián)系人關(guān)聯(lián)的分字庫的配置過程為:根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中;
步驟203,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中。
其中,步驟201中,當(dāng)用戶處于社交軟件中某聯(lián)系人的聊天界面中時(shí),通過觸發(fā)指令啟動(dòng)輸入法,輸入法啟動(dòng)后,首先識別當(dāng)前聊天界面對應(yīng)的聯(lián)系人,然后根據(jù)聯(lián)系人與分字庫的關(guān)聯(lián)關(guān)系,找到相應(yīng)的分字庫。
之后的步驟202中,輸入法會(huì)調(diào)用找到的所述聯(lián)系人關(guān)聯(lián)的分字庫,以使用所述分字庫中的詞語。其中所述分字庫根據(jù)上文步驟101~103實(shí)現(xiàn)配置。
步驟203中,輸入法監(jiān)測用戶輸入的編碼,所述編碼可以是拼音、形碼、音形結(jié)合或內(nèi)碼,根據(jù)用戶輸入的編碼可在步驟202調(diào)用的所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配到相關(guān)的常用詞,匹配到的常用詞可能有多個(gè),當(dāng)匹配到的常用詞為多個(gè)時(shí),根據(jù)多個(gè)常用詞的使用熱度順序顯示在輸入法界面中,供用戶選擇。
本實(shí)施例中,為了實(shí)現(xiàn)輸入法順利地調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,步驟202中會(huì)對所述分字庫進(jìn)行預(yù)先配置,具體包括以下內(nèi)容:
為了適用用戶終端中多個(gè)社交軟件的情景,步驟202配置分字庫的過程 進(jìn)一步包括:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
為了實(shí)現(xiàn)多個(gè)社交軟件中的相同聯(lián)系人的分字庫的復(fù)用,步驟202在配置聯(lián)系人的分字庫中,采用了多種方式,如:
方式一:通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
方式二:針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
同一聯(lián)系人可能包含在多個(gè)社交軟件中,例如“張三”既是用戶終端中QQ中的聯(lián)系人,也是微信中的聯(lián)系人,但“張三”的QQ號和微信號可能并不一致,這種情形下,根據(jù)社交軟件中的用戶號碼無法獲知哪些實(shí)質(zhì)是同一個(gè)聯(lián)系人。通過為聯(lián)系人設(shè)定統(tǒng)一標(biāo)識,可通過統(tǒng)一標(biāo)識識別出各個(gè)社交軟件中相同的聯(lián)系人,也就是雖然“張三”的QQ號和微信號并不同,但“張三”的統(tǒng)一標(biāo)識在QQ和微信中是相同的。
根據(jù)方式一,可通過統(tǒng)一標(biāo)識在QQ和微信中分別識別出“張三”的實(shí)際身份,然后將“張三”在QQ中的聊天內(nèi)容轉(zhuǎn)換為文字合集一,將其在微信中的聊天內(nèi)容轉(zhuǎn)換為文字合集二,并將文字合集一和文字合集二合并為“張三”的最終的文字合集;根據(jù)方式二,可將各個(gè)社交軟件中的每個(gè)聯(lián)系人的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將文字合集與聯(lián)系人進(jìn)行關(guān)聯(lián)保存,這樣文字合集與聯(lián)系人建立了綁定關(guān)系,之后再通過統(tǒng)一標(biāo)識識別出各個(gè)社交軟 件中相同的聯(lián)系人,相同聯(lián)系人所綁定的文字合集進(jìn)行合并后即是該聯(lián)系人最終的文字合集。最后,方式一和方式二將獲得的聯(lián)系人的最終的文字合集與聯(lián)系人以及聯(lián)系人的統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存,例如將“張三”的最終的文字合集與“張三”及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
由于預(yù)設(shè)了聯(lián)系人的統(tǒng)一標(biāo)識,為了方便對各個(gè)社交軟件中的聯(lián)系人進(jìn)行集中統(tǒng)一的管理,步驟202還可根據(jù)所述統(tǒng)一標(biāo)識建立一統(tǒng)一通訊錄,所述統(tǒng)一通訊錄中的聯(lián)系人涵蓋了各個(gè)社交軟件中的所有聯(lián)系人,并且記錄了所述統(tǒng)一通訊錄中的聯(lián)系人與各個(gè)社交軟件中的聯(lián)系人的對應(yīng)關(guān)系,相應(yīng)地,生成的分字庫可直接與統(tǒng)一通訊錄中的聯(lián)系人進(jìn)行對應(yīng)關(guān)聯(lián)保存。所述統(tǒng)一通訊錄可以是用戶終端中自帶的通訊錄,例如手機(jī)通訊錄,也可以在用戶終端中單獨(dú)建立,再次不作限定,統(tǒng)一通訊錄中的聯(lián)系人范圍可以大于但必須包含各個(gè)社交軟件中所有聯(lián)系人的范圍,統(tǒng)一標(biāo)識可以添加在統(tǒng)一通訊錄中聯(lián)系人的詳細(xì)信息中。這樣用戶可在統(tǒng)一通訊錄中方便地查看某聯(lián)系人所屬的社交軟件有哪些,而且在輸入法調(diào)用分字庫時(shí)可根據(jù)統(tǒng)一通訊錄中聯(lián)系人與社交軟件中聯(lián)系人的對應(yīng)關(guān)系快速的查找出相應(yīng)的分字庫。
優(yōu)選地,所述統(tǒng)一標(biāo)識包括用戶終端號碼、聯(lián)系人名字、備注名等。針對上述的統(tǒng)一通訊錄,可以將用戶終端號碼(例如聯(lián)系人的手機(jī)號)設(shè)定為統(tǒng)一標(biāo)識,通過將聯(lián)系人的手機(jī)號與其在各個(gè)社交軟件中的用戶號碼進(jìn)行關(guān)聯(lián),即可實(shí)現(xiàn)對聯(lián)系人的集中統(tǒng)一管理。例如上述的聯(lián)系人“張三”,可在統(tǒng)一通訊錄中將“張三”的手機(jī)號與其QQ號和微信號進(jìn)行關(guān)聯(lián),步驟102在查找并提取“張三”的文字合集時(shí)即可根據(jù)“張三”的手機(jī)號快速識別出其在QQ中的聊天內(nèi)容和其在微信中的聊天內(nèi)容,并將生成的文字合集與“張三”的手機(jī)號進(jìn)行關(guān)聯(lián)保存。
為了快速地查找并調(diào)用聯(lián)系人關(guān)聯(lián)的分詞庫,步驟202配置分字庫的過程還包括:
根據(jù)所述當(dāng)前社交軟件的聯(lián)系人的統(tǒng)一標(biāo)識,查找并調(diào)取所述聯(lián)系人關(guān)聯(lián)的分字庫。根據(jù)聯(lián)系人的統(tǒng)一標(biāo)識,可直接在上述統(tǒng)一通訊錄中查找到相應(yīng)的聯(lián)系人,并根據(jù)統(tǒng)一通訊錄中的聯(lián)系人找到其關(guān)聯(lián)的分字庫。
為了在分字庫中建立常用詞的合理排序,以保證在輸入法調(diào)用分詞庫時(shí) 可將使用熱度高的常用詞排列在輸入法的前部供用戶選擇,步驟202配置分字庫的過程進(jìn)一步包括:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
如上文所述,聊天內(nèi)容中包含的數(shù)據(jù)類型多種多樣,其中語音和文字中包含了大部分的重要聊天內(nèi)容,為了將這些重要聊天內(nèi)容轉(zhuǎn)換為文字合集,步驟202配置分字庫的過程進(jìn)一步包括:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
其中,所述聲音參數(shù)包括聲音的抑揚(yáng)頓挫、詞語之間的時(shí)間間隔等等,根據(jù)聲音參數(shù)將語音拆分為多個(gè)語音元素,語音元素可以是單字或者單詞或者短語,之后按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將語音轉(zhuǎn)換為文字。所述預(yù)設(shè)的語音元素與文字的映射關(guān)系可以存儲為用戶終端本地,也可存儲在網(wǎng)絡(luò)服務(wù)器中。
為了實(shí)現(xiàn)分字庫中常用詞的提取,步驟202配置分字庫的過程進(jìn)一步包括:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
其中,對所述文字合集進(jìn)行語義分析包括,分析出名詞、形容詞等,以及分析單字是否可依附于其前方或后方的詞語組成短語等,通過語義分析可獲得多個(gè)分詞,所述多個(gè)分詞中必然包含了大量“的”、“我”等語氣助詞或者非個(gè)性化的詞,將這些分詞歸類為停用詞,并從多個(gè)分詞中過濾掉,就獲得了常用詞。
對于保存至分字庫中的常用詞,每個(gè)常用詞在用戶聊天習(xí)慣中的使用情況是不同的,為了區(qū)分常用詞的使用熱度,并在用戶使用過程中提供更合理的推送順序,步驟202配置分字庫的過程進(jìn)一步包括:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
所述使用頻率可在分詞時(shí)即進(jìn)行統(tǒng)計(jì),即統(tǒng)計(jì)常用詞在分詞中出現(xiàn)的次數(shù),根據(jù)使用頻率生成詞頻列表;而對于用戶的聊天習(xí)慣而言,并不是使用頻率高的常用詞就是用戶聊天時(shí)最想使用的詞,還需要基于用戶的聊天對象考慮常用詞的權(quán)重。例如,“張三”為用戶的同事,根據(jù)詞頻列表,“是的”的詞頻遠(yuǎn)遠(yuǎn)大于“媒體流”的詞頻,但對于同事來說,“媒體流”顯然具有更高的專業(yè)性和針對性,因此可通過權(quán)重來調(diào)整“媒體流”的權(quán)重,使其在使用熱度列表中的位置在“是的”的前方。
優(yōu)選地,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
更加專業(yè)的常用詞的常用度反而會(huì)更低,這種情景下常用詞的權(quán)重可與其常用度呈反比;或者,根據(jù)用戶使用輸入法時(shí)將常用詞設(shè)定為置于首位的次數(shù)成正比,用戶也可通過這種方式手動(dòng)調(diào)整常用詞的權(quán)重。
至此,步驟202完成了分字庫的配置過程。
本實(shí)施例中,為了在輸入法界面中為用戶提供更合理的常用詞顯示規(guī)則,步驟203進(jìn)一步包括:
根據(jù)用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,并將與所述用戶輸入的輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中。
其中所述使用熱度已經(jīng)記錄在分字庫配置過程中根據(jù)常用詞的詞頻及權(quán)重而生成的使用熱度列表中,當(dāng)監(jiān)測到用戶輸入的編碼后,在分子庫中匹配到多個(gè)相關(guān)常用詞時(shí),將使用熱度最高的常用詞排在首位,其余順序排列。
由于分詞庫中的常用詞不是無限的,因此,用戶輸入的輸入法編碼可能無法在分詞庫中匹配到相關(guān)的常用詞,而且當(dāng)用戶輸入的編碼過長時(shí),也無法在分詞庫中匹配到相應(yīng)的短句。這種場景下,步驟203,進(jìn)一步包括:
根據(jù)用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,如果未查找到與所述用戶輸入的輸入法編碼相關(guān)的常用詞,則對所述用戶輸入的輸入法編碼進(jìn)行拆解,根據(jù)拆解所得的多組輸入法編碼,分別在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,并將與所述拆解所得的第一組輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中;
選定所述拆解所得的第一組輸入法編碼相關(guān)的常用詞后,將與所述拆解所得的第二組輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中。
對所述用戶輸入的輸入法編碼進(jìn)行拆解的規(guī)則,可以是根據(jù)用戶輸入過程中加入的分隔符,或者其它方式,只要能將用戶輸入的長句編碼拆解為單詞編碼即可,拆解后,可根據(jù)相對較低的編碼繼續(xù)在分字庫中匹配常用詞,如果依然無法匹配到可繼續(xù)進(jìn)行拆解。
優(yōu)選地,如果在所述聯(lián)系人相關(guān)聯(lián)的分子庫中未查找到與所述拆解所得的輸入法編碼相關(guān)的常用詞,則繼續(xù)將所述輸入法編碼拆解為單編碼,并將與所述拆解所得的單編碼相關(guān)的單字顯示在所述輸入法界面中。同樣,在用戶對首個(gè)單編碼對應(yīng)的單字進(jìn)行選擇之后,繼續(xù)為后續(xù)的編碼顯示相關(guān)的單字或常用詞。
為了進(jìn)一步提高用戶體驗(yàn),在步驟203之前還包括:
監(jiān)測輸入法界面的開啟指令;
在監(jiān)測到輸入法界面開啟指令后,且在獲取到用戶輸入的輸入法編碼前,在所述輸入法界面中按使用熱度順序顯示所述聯(lián)系人關(guān)聯(lián)的分字庫中的常用詞。
也就是,輸入法啟動(dòng)后,如果未監(jiān)測到用戶輸入的編碼,則直接將所述聯(lián)系人關(guān)聯(lián)的分字庫中使用熱度最高的常用詞排在首位,其后按照使用熱度順序排列常用詞,這樣用戶無需輸入即可獲得常用詞的推薦。例如,“張三”為用戶的好朋友,其對應(yīng)的分字庫中“唉吆喂”是使用熱度最高的常用詞,則只要用戶啟動(dòng)輸入法,“唉吆喂”就排在輸入法的首位,用戶可直接選中使用。大大加快了用戶的打字速度。
以下以手機(jī)終端為例對本申請的技術(shù)方案做詳細(xì)說明。
手機(jī)通訊錄中包含多個(gè)聯(lián)系人的手機(jī)號,其中“張三”的手機(jī)號關(guān)聯(lián)了其QQ號和微信號,為了建立“張三”的分字庫,通過“張三”的手機(jī)號分別在QQ程序和微信程序中查找到“張三”的QQ號和微信號,并分別提取“張三”與用戶的QQ聊天記錄和微信聊天記錄,將提取的QQ聊天記錄和微信聊天記錄分別轉(zhuǎn)換為文字合集并合并,并將合并生成的文字合集與“張三”的手機(jī)號進(jìn)行關(guān)聯(lián)保存,之后對“張三”的文字合集進(jìn)行分詞并提取常用詞,將使用熱度大于預(yù)定值的常用詞保存在“張三”的分字庫中。至此完成了“張三”的分字庫的配置。
分字庫配置好后,當(dāng)用戶再次在QQ或者微信中發(fā)起與“張三”的聊天時(shí),啟動(dòng)輸入法即可直接調(diào)用“張三”關(guān)聯(lián)的分字庫,根據(jù)用戶在輸入法界面中輸入的編碼,可在“張三”的分字庫中匹配相應(yīng)的常用詞,當(dāng)匹配到多個(gè)常用詞時(shí),根據(jù)所述分字庫中為常用詞設(shè)定的使用熱度從高到低順序顯示相關(guān)的常用詞,用戶可快速地命中符合其與“張三”聊天習(xí)慣的常用詞,大大提高了聊天速度。
在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲器(DRAM)、其他類型的隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電 腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號和載波。
如在說明書及權(quán)利要求當(dāng)中使用了某些詞匯來指稱特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同名詞來稱呼同一個(gè)組件。本說明書及權(quán)利要求并不以名稱的差異來作為區(qū)分組件的方式,而是以組件在功能上的差異來作為區(qū)分的準(zhǔn)則。如在通篇說明書及權(quán)利要求當(dāng)中所提及的“包含”為一開放式用語,故應(yīng)解釋成“包含但不限定于”?!按笾隆笔侵冈诳山邮盏恼`差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問題,基本達(dá)到所述技術(shù)效果。此外,“耦接”一詞在此包含任何直接及間接的電性耦接手段。因此,若文中描述一第一裝置耦接于一第二裝置,則代表所述第一裝置可直接電性耦接于所述第二裝置,或通過其他裝置或耦接手段間接地電性耦接至所述第二裝置。說明書后續(xù)描述為實(shí)施本申請的較佳實(shí)施方式,然所述描述乃以說明本申請的一般原則為目的,并非用以限定本申請的范圍。本申請的保護(hù)范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。
還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素。
上述說明示出并描述了本申請的若干優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。
本申請公開了A1、一種輸入法的字庫配置方法,包括:
根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;
將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中。
A2、如A1所述的方法,根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容,進(jìn)一步包括:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
A3、如A求2所述的方法,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
A4、如A2所述的方法,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
A5、如A3或A4所述的方法,所述統(tǒng)一標(biāo)識包括以下一個(gè)或多個(gè)的組合:用戶終端號碼、聯(lián)系人名字、備注名。
A6、如A1所述的方法,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中,進(jìn)一步包括:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
A7、如A6所述的方案,所述編碼方法,包括:拼音、形碼、音形結(jié)合、內(nèi)碼。
A8、如A1所述的方法,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,進(jìn)一步包括:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
A9、如A1所述的方法,對所述文字合集進(jìn)行分詞并提取常用詞,進(jìn)一步包括:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
A10、如A1所述的方法,將使用熱度大于預(yù)定值的常用詞保存至所述聯(lián)系人關(guān)聯(lián)的分字庫,進(jìn)一步包括:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
A11、如A9所述的方法,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
本申請公開了B12、一種輸入法的字庫配置裝置,包括:
查詢裝置,用于根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;
轉(zhuǎn)換裝置,用于將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
分詞存儲裝置,用于對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中。
B13、如B12所述的裝置,所述查詢裝置,進(jìn)一步用于:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
B14、如B13所述的裝置,所述轉(zhuǎn)換裝置,進(jìn)一步用于:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
B15、如B13所述的裝置,所述轉(zhuǎn)換裝置,進(jìn)一步用于:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
B16、如B14或B15所述的裝置,所述統(tǒng)一標(biāo)識包括以下一個(gè)或多個(gè)的組合:用戶終端號碼、聯(lián)系人名字、備注名。
B17、如B12所述的裝置,所述分詞存儲裝置,進(jìn)一步用于:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
B18、如B17所述的裝置,所述編碼方法,包括:拼音、形碼、音形結(jié)合、內(nèi)碼。
B19、如B12所述的裝置,所述轉(zhuǎn)換裝置,進(jìn)一步用于:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
B20、如B12所述的裝置,所述分詞存儲裝置,進(jìn)一步用于:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
B21、如B12所述的裝置,所述分詞存儲裝置,進(jìn)一步用于:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
B22、如B21所述的裝置,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
本申請還公開了C23、一種輸入法的字庫調(diào)用處理方法,包括:
啟動(dòng)輸入法,識別用戶終端中當(dāng)前社交軟件的聯(lián)系人;
調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,其中,所述聯(lián)系人關(guān)聯(lián)的分字庫的配置過程為:根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容;將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;對所述文字合集進(jìn)行分詞并從分詞中提取常用詞,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中;
獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中。
C24、如C23所述的方法,根據(jù)用戶終端中各社交軟件的聯(lián)系人,查找并提取用戶與所述聯(lián)系人之間的聊天內(nèi)容,進(jìn)一步包括:
針對用戶終端中每個(gè)社交軟件,依照所述社交軟件的聯(lián)系人查找并提取用戶與每個(gè)聯(lián)系人之間的聊天內(nèi)容。
C25、如C24所述的方法,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成 的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
C26、如C24所述的方法,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存,進(jìn)一步包括:
針對每個(gè)社交軟件,將其中每個(gè)聯(lián)系人與用戶之間的聊天內(nèi)容轉(zhuǎn)換為文字合集,并將生成的文字合集與相應(yīng)的聯(lián)系人進(jìn)行關(guān)聯(lián)保存;
通過統(tǒng)一標(biāo)識識別所述用戶終端中各個(gè)社交軟件中相同的聯(lián)系人,其中各個(gè)社交軟件中相同的聯(lián)系人具有相同的統(tǒng)一標(biāo)識;
將各個(gè)社交軟件中所述相同的聯(lián)系人的文字合集后進(jìn)行合并,并將生成的文字合集與所述相同的聯(lián)系人及其統(tǒng)一標(biāo)識進(jìn)行關(guān)聯(lián)保存。
C27、如C25或C26所述的方法,所述統(tǒng)一標(biāo)識包括以下一個(gè)或多個(gè)的組合:用戶終端號碼、聯(lián)系人名字、備注名。
C28、如C25或C26所述的方法,調(diào)用所述聯(lián)系人關(guān)聯(lián)的分字庫,進(jìn)一步包括:
根據(jù)所述當(dāng)前社交軟件的聯(lián)系人的統(tǒng)一標(biāo)識,查找并調(diào)取所述聯(lián)系人關(guān)聯(lián)的分字庫。
C29、如C23所述的方法,將使用熱度大于預(yù)定值的常用詞保存至與所述文字合集關(guān)聯(lián)的所述聯(lián)系人的分字庫中,進(jìn)一步包括:
依照輸入法的編碼方法,解析得到所述分字庫中保存的所述常用詞的編碼,將所述編碼與所述常用詞對應(yīng)保存在所述分字庫中。
C30、如C29所述的方案,所述編碼方法,包括:拼音、形碼、音形結(jié)合、內(nèi)碼。
C31,如C29所述的方法,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中,進(jìn)一步包括:
根據(jù)用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,并將與所述用戶輸入的輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中。
C32、如C29所述的方法,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中,進(jìn)一步包括:
根據(jù)用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,如果未查找到與所述用戶輸入的輸入法編碼相關(guān)的常用詞,則對所述用戶輸入的輸入法編碼進(jìn)行拆解,根據(jù)拆解所得的多組輸入法編碼,分別在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,并將與所述拆解所得的第一組輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中;
選定所述拆解所得的第一組輸入法編碼相關(guān)的常用詞后,將與所述拆解所得的第二組輸入法編碼相關(guān)的常用詞按使用熱度順序顯示在所述輸入法界面中。
C33、如C32所述的方法,如果未查找到與所述用戶輸入的輸入法編碼相關(guān)的常用詞,則對所述用戶輸入的輸入法編碼進(jìn)行拆解,根據(jù)拆解所得的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分析庫中查找所述常用詞的編碼,進(jìn)一步包括:
如果在所述聯(lián)系人相關(guān)聯(lián)的分子庫中未查找到與所述拆解所得的輸入法編碼相關(guān)的常用詞,則繼續(xù)將所述輸入法編碼拆解為單編碼,并將與所述拆解所得的單編碼相關(guān)的單字顯示在所述輸入法界面中。
C34、如C23所述的方法,將所述聊天內(nèi)容轉(zhuǎn)換為文字合集,進(jìn)一步包括:
提取所述聊天內(nèi)容中的語音和文字;
根據(jù)聲音參數(shù)將所述語音拆分為多個(gè)語音元素,并按照預(yù)設(shè)的語音元素與文字的映射關(guān)系,將所述語音轉(zhuǎn)換為文字;
將轉(zhuǎn)換獲得的文字與所述聊天記錄中的文字合并為文字合集。
C35、如C23所述的方法,對所述文字合集進(jìn)行分詞并提取常用詞,進(jìn)一步包括:
對所述文字合集進(jìn)行語義分析,獲得多個(gè)分詞;
過濾所述多個(gè)分詞中的停用詞,獲得常用詞。
C36、如C23所述的方法,將使用熱度大于預(yù)定值的常用詞保存至所述聯(lián)系人關(guān)聯(lián)的分字庫,進(jìn)一步包括:
根據(jù)使用頻率標(biāo)注所述常用詞的詞頻,并生成詞頻列表;
根據(jù)預(yù)設(shè)規(guī)則設(shè)定所述常用詞的權(quán)重,并根據(jù)所述常用詞的權(quán)重調(diào)整所述詞頻列表以生成使用熱度列表。
C37、如C36所述的方法,所述預(yù)設(shè)規(guī)則包括:
與所述常用詞的常見度呈反比或者與用戶輸入文字時(shí)將所述常用詞設(shè)定為置于首位的次數(shù)呈正比。
C38、如C23所述的方法,獲取用戶輸入的輸入法編碼,在所述聯(lián)系人關(guān)聯(lián)的分字庫中匹配與用戶輸入的輸入法編碼相關(guān)的常用詞并將所述常用詞按使用熱度順序顯示在輸入法界面中,之前還包括:
監(jiān)測輸入法界面的開啟指令;
在監(jiān)測到輸入法界面開啟指令后,且在獲取到用戶輸入的輸入法編碼前,在所述輸入法界面中按使用熱度順序顯示所述聯(lián)系人關(guān)聯(lián)的分字庫中的常用詞。