專利名稱:一種操作用于內(nèi)容輸入的語料庫的方法和設備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機領(lǐng)域,尤其涉及一種操作用于內(nèi)容輸入的語料庫的技術(shù)。
背景技術(shù):
在現(xiàn)有技術(shù)中,一般根據(jù)用戶在利用諸如微軟拼音、搜狗拼音、紫光拼音等輸入法進行輸入的過程中的輸入相關(guān)行為更新用戶輸入法詞庫,未曾考慮到根據(jù)用戶在應用中的點擊、瀏覽和編輯等操作行為實時地更新用戶輸入法詞庫,若此用戶在執(zhí)行該等操作行為之后再進行與該等操作行為相關(guān)聯(lián)的輸入時,需要進行多次查詢選擇才可獲得其所需的輸入內(nèi)容。例如,用戶在地圖應用中通過點擊查找到一個偏僻的地名,如“新場”,然后試圖通過輸入法在搜索頁面中輸入該詞作為查詢序列,以查找該地方的相關(guān)信息,但由于用戶輸入法詞庫中的候選詞條并未包括該地名,因此用戶不得不在輸入法的候選詞條中分別查詢選定“新”和“場”兩個字,以完成該詞的輸入,從而增加用戶的輸入負擔,降低用戶使用體驗。因此,如何實現(xiàn)有效地更新用于內(nèi)容輸入的語料庫,成為目前亟待解決的問題之
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種操作用于內(nèi)容輸入的語料庫的方法與設備。根據(jù)本發(fā)明的一個方面,提供了一種計算機實現(xiàn)的操作用于內(nèi)容輸入的語料庫的方法,該方法包括以下步驟a獲取一個或多個應用的用戶操作信息;b根據(jù)所述用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容;c根據(jù)所述推薦內(nèi)容來更新所述語料庫,以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。根據(jù)本發(fā)明的另一方面,還提供了一種操作用于內(nèi)容輸入的語料庫的設備,該設備包括信息獲取裝置,用于獲取一個或多個應用的用戶操作信息;第一內(nèi)容獲取裝置,用于根據(jù)所述用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容;更新裝置,用于根據(jù)所述推薦內(nèi)容來更新所述語料庫,以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。與現(xiàn)有技術(shù)相比,本發(fā)明根據(jù)用戶在各應用中的操作信息,按照預定獲取規(guī)則,獲取相應的推薦文字(單字、詞、句子)、圖片、特殊字符等,并將其更新至該用戶的語料庫中以用于用戶進行相關(guān)內(nèi)容輸入的候選詞條。由此,當用戶在執(zhí)行該等操作行為之后再進行與該等操作行為相關(guān)聯(lián)的輸入時,可以快速從輸入法候選詞條中獲取其所需的詞條,提高用戶的內(nèi)容輸入效率,進而提升用戶體驗。
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯圖1示出根據(jù)本發(fā)明一個方面的操作用于內(nèi)容輸入的語料庫設備示意圖;圖2示出根據(jù)本發(fā)明一個優(yōu)選實施例的操作用于內(nèi)容輸入的語料庫的設備示意圖;圖3示出根據(jù)本發(fā)明另一個方面的操作用于內(nèi)容輸入的語料庫的方法流程4示出根據(jù)本發(fā)明一個優(yōu)選實施例的操作用于內(nèi)容輸入的語料庫的方法流程圖。附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進一步詳細描述。圖1示出根據(jù)本發(fā)明一個方面的操作用于內(nèi)容輸入的語料庫的設備示意圖。在此,所述內(nèi)容輸入包括不限于文字,如單字、詞、句子等、特殊字符、圖標、圖像等內(nèi)容的輸入。在此,所述語料庫用于存儲進行內(nèi)容輸入的候選詞條;其可為以下任一類型的語料庫1)在用戶設備上的本地語料庫;2)在網(wǎng)絡設備上的網(wǎng)絡語料庫;3)單用戶專用的私有語料庫;4)多用戶共享的公共語料庫,其可為同一用戶組中多個用戶共享的公共語料庫, 或可為非同一用戶組中的多個用戶共享的公共語料庫。本領(lǐng)域技術(shù)人員應能理解上述語料庫僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的語料庫如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。如圖1所示,操作設備1包括信息獲取裝置11、第一內(nèi)容獲取裝置12和更新裝置 13。在此,所述操作設備可為用戶設備,也可為網(wǎng)絡設備。在此,所述用戶設備可以是任何一種可與用戶通過鍵盤、鼠標、遙控器、觸摸板、或手寫設備等方式進行人機交互的電子產(chǎn)品,例如計算機、智能手機、PDA、或IPTV等。在此,所述網(wǎng)絡設備包括但不限于計算機、網(wǎng)絡主機、單個網(wǎng)絡服務器、多個網(wǎng)絡服務器集或多個服務器構(gòu)成的云。在此,云由基于云計算(Cloud Computing)的大量計算機或網(wǎng)絡服務器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機。以下參照圖1來對操作設備1的操作過程進行詳細描述首先,信息獲取裝置11獲取一個或多個應用的用戶操作信息。在此,所述應用包括但不限于本地應用、互聯(lián)網(wǎng)應用;其中,所述本地應用包括但不限于閱讀器、文本編輯器、游戲等;所述互聯(lián)網(wǎng)應用包括但不限于網(wǎng)絡百科、網(wǎng)絡地圖、網(wǎng)絡搜索等。在此,所述用戶操作信息包括但不限于操作類型、操作內(nèi)容;其中,所述操作類型包括但不限于點擊操作、劃選操作、瀏覽操作、編輯操作等;所述操作內(nèi)容包括但不限于純文本、鏈接文本、圖標、圖片等。在此,所述獲取的用戶操作信息包括但不限于1)某一用戶在該一個或多個應用上的用戶操作信息;2)某用戶組中各用戶在該一個或多個應用上的用戶操作信息;3) 一個或多個應用的所有用戶在該一個或多個應用上的用戶操作信息。其中,所述用戶操作信息可為用戶在一個或多個應用上的當前操作信息,也可為用戶在一個或多個應用上的歷史操作信息,或者二者結(jié)合。在此,獲取所述用戶操作信息的方式包括但不限于以下情形1)當用戶操作信息為用戶的當前操作信息時,則信息獲取裝置11通過約定的通信方式,應事件觸發(fā)實時地獲取一個或多個應用的用戶當前操作信息。在一示例中,用戶通過與用戶設備的交互方式,包括但不限于鼠標、鍵盤、遙控器、 觸摸屏、或手寫設備,在某一應用的用戶交互界面中進行的點擊、劃選、編輯等操作。以鼠標為例,用戶在用戶設備的顯示屏幕上利用鼠標點擊瀏覽器中顯示的網(wǎng)絡百科的一個詞條, 該用戶設備將該點擊操作及其操作內(nèi)容作為用戶消息通過約定的通信方式發(fā)送至信息獲取裝置11,信息獲取裝置11通過實時地監(jiān)聽的方式接收并解析該用戶消息,以獲取該用戶操作信息。其中,當操作設備1為該用戶設備時,所述約定的通信方式包括通過諸如總線等介質(zhì)的用戶設備的內(nèi)部通信協(xié)議,所述內(nèi)部通信協(xié)議包括但不限于存在于計算機中的各種形式通信,例如面向?qū)ο缶幊讨袑ο笾g的通信協(xié)議;操作系統(tǒng)內(nèi)不同程序或計算機不同模塊之間的消息傳送協(xié)議。當操作設備1為網(wǎng)絡設備時,所述約定的通信方式包括但不限于基于3GPP、LTE、WIMAX的移動通信、基于TCP/IP、UDP協(xié)議的計算機網(wǎng)絡通信以及基于藍牙、紅外傳輸標準的近距無線傳輸方式。2)當用戶操作信息為用戶的歷史操作信息時,則信息獲取裝置11可從本地或第三方設備的用戶歷史行為庫中,應事件觸發(fā)實時地、或按照預定周期地獲取一個或多個應用的用戶歷史操作信息。在此,所述用戶歷史行為庫中包括但不限于用戶標識信息或用戶組標識信息及其所對應的用戶歷史操作信息;其中,該用戶歷史操作信息包括但不限于操作類型、操作內(nèi)容等信息。在此,所述用戶歷史行為庫包括但不限于關(guān)系數(shù)據(jù)庫、Key-Value存儲系統(tǒng)、文件系統(tǒng)等。在一示例中,信息獲取裝置11通過調(diào)用設定的應用編程接口(API),按照預定周期向第三方設備發(fā)送獲取一個用戶組在諸如百度百科、維基百科、搜搜百科等瀏覽器網(wǎng)絡百科應用中的歷史操作信息的請求,其中,該請求中包含該用戶組ID為“公益協(xié)會”;該第三方設備接收并解析該請求,提取該請求中的該用戶組ID,并據(jù)此在用戶歷史行為庫中進行匹配查詢,以獲得與該請求相對應的該“公益協(xié)會”用戶組中全部用戶成員在瀏覽器網(wǎng)絡百科應用中的歷史操作信息,接著將查詢獲得的該等歷史操作信息返回至操作設備1,信息獲取裝置11通過實時監(jiān)聽的方式接收該等歷史操作信息。
本領(lǐng)域技術(shù)人員應能理解上述獲取用戶操作信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取用戶操作信息的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。接著,第一內(nèi)容獲取裝置12根據(jù)信息獲取裝置11獲取的用戶操作信息,按照預定獲取規(guī)則,獲取與該(等)用戶操作信息相對應的推薦內(nèi)容。在此,所述推薦內(nèi)容中包括但不限于一個或多個推薦詞條,以及各推薦詞條的推薦權(quán)重;其中,所述推薦詞條包括但不限于文字,如單字、詞、句子、特殊字符、圖標、圖片等。具體地,若用戶操作信息為用戶當前操作信息,則第一內(nèi)容獲取裝置12提取該用戶當前操作信息中的操作內(nèi)容,并執(zhí)行以下操作a)當該操作內(nèi)容為圖片時,第一內(nèi)容獲取裝置12直接將該圖片作為推薦詞條;b)當該操作內(nèi)容為文本時,例如純文本、鏈接文本等,則第一內(nèi)容獲取裝置12將該文本進行分詞處理以獲得一個或多個分詞結(jié)果,并將該一個或多個分詞結(jié)果作為推薦詞
^^ ο在此,所述實施例中的進行分詞處理的算法包括但不限于正向最大匹配,反向最大匹配,雙向最大匹配,語言模型方法,最短路徑算法等等。在一示例中,用戶操作信息為用戶當前在用戶設備的閱讀器中的劃選操作,且該用戶操作信息的操作內(nèi)容為一段純文本“暴風白兵對抗絕地武士”,;則第一內(nèi)容獲取裝置 12將該段純文本利用正向最大匹配分詞算法進行分詞處理,以獲得相應的分詞結(jié)果為“暴風白兵”、“對抗”、“絕地武士”,接著將該三條分詞結(jié)果作為三個推薦詞條。優(yōu)選地,第一內(nèi)容獲取裝置12根據(jù)通過對文本進行分詞處理獲得的多個分詞結(jié)果,在本地或第三方設備的用戶歷史行為庫中進行匹配查詢,以獲得該等分詞在用戶歷史操作信息的操作內(nèi)容中的累計歷史出現(xiàn)次數(shù),并將累計出現(xiàn)次數(shù)高于預定出現(xiàn)次數(shù)閾值的分詞作為推薦詞條;或第一內(nèi)容獲取裝置12根據(jù)該等分詞結(jié)果,在本地或第三方設備的用戶歷史行為庫中進行匹配查詢,以獲得該等分詞在最近預定時間段內(nèi)的用戶歷史操作信息的操作內(nèi)容中歷史出現(xiàn)頻次,并將歷史出現(xiàn)頻次高于預定出現(xiàn)頻次閾值的分詞作為推薦詞
^^ ο更優(yōu)選地,第一內(nèi)容獲取裝置12還可根據(jù)通過對文本進行分詞處理獲得的多個分詞結(jié)果,利用自然語言理解技術(shù)對該文本進行語義分析,以確定各分詞中的中心詞,并將該(等)中心詞作為推薦詞條。在一示例中,用戶操作信息為用戶當前在用戶設備的瀏覽器中的的劃選操作,且該用戶操作信息的操作內(nèi)容為一段文本;第一內(nèi)容獲取裝置12將該文本進行分詞處理,獲得多個分詞結(jié)果分別為“天宮一號”、“順利”、“升空”、,接著第一內(nèi)容獲取裝置12對該等分詞結(jié)果進行語義分析,確定該等分詞結(jié)果中“天宮一號”為中心詞,進而將該兩個中心詞作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。隨后,更新裝置13根據(jù)第一內(nèi)容獲取裝置12獲得的推薦內(nèi)容來更新語料庫,以將該(等)推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。
具體地,更新裝置13例如將第一內(nèi)容獲取裝置12獲得的推薦內(nèi)容中的一個或多個推薦詞條寫入語料庫中,以更新該語料庫。若檢測到該語料庫未建立,則先行初始化該語料庫,然后將該等推薦詞條寫入到該語料庫中。在此,所述更新語料庫的方式包括但不限于1)將推薦內(nèi)容中的所有推薦詞條寫入該語料庫,寫入的方式包括a)增量寫入,即更新裝置13將每條推薦詞條在語料庫中進行匹配查詢,若查詢確定該推薦詞條在語料庫中已存在,則無需再次寫入;若查詢確定該推薦詞條在語料庫中不存在,則將其寫入。b)覆蓋寫入;即更新裝置13將全部推薦詞條寫入語料庫中,其中在該語料庫中已存在的推薦詞條將被覆蓋寫入。2)更新裝置13可根據(jù)推薦內(nèi)容中各推薦詞條的推薦權(quán)重,僅將推薦權(quán)重超過預定權(quán)重閾值的推薦詞條寫入語料庫,或?qū)⑼扑]權(quán)重排序靠前的預定數(shù)量的推薦詞條寫入語料庫。3)更新裝置13還可根據(jù)已寫入到語料庫中的各推薦詞條的推薦權(quán)重,更新語料庫中相應候選詞條的候選權(quán)重。在此,所述語料庫中的每條候選詞條都具有與其相對應的候選權(quán)重,以用于在提供候選詞條時按照候選權(quán)重對該等候選詞條按序提供。例如,第一內(nèi)容獲取裝置12獲得的針對某一用戶的推薦詞條“天宮一號”且該推薦詞條的推薦權(quán)重為2, 更新裝置13將該推薦詞條在該用戶的語料庫中進行匹配查詢,確定該推薦詞條在該語料庫中已存在且與其相對應的候選權(quán)重為1,則基于預定的更新候選權(quán)重規(guī)則,將“天宮一號” 在該語料庫中的候選權(quán)重更新為1. 2( = 1+2*0. 1)。在此,需要說明的是,舉例中的各項數(shù)值作為說明作用的示例,僅供理解本發(fā)明, 不作為實際應用時的真實數(shù)據(jù)。如無特別說明,本文中其他地方出現(xiàn)的數(shù)值的功用與此處相同,為簡明起見,不再贅述。在此,更新裝置13可同時更新一個或多個語料庫,例如可僅更新用戶在用戶設備上的本地語料庫,也可同時更新該本地語料庫和該用戶在網(wǎng)絡設備上的網(wǎng)絡語料庫;又例如,可更新用戶組共享的公共語料庫,也可同時更新用戶組中各個用戶專用的私有語料庫。在一示例中,更新裝置13根據(jù)在第一內(nèi)容獲取裝置12獲得的針對某一用戶的推薦詞條“暴風白兵”、“對抗”和“絕地武士”,在該用戶的用戶設備的本地語料庫中進行查詢匹配,確定該語料庫中不存在詞條“暴風白兵”與“絕地武士”,但存在詞條“對抗”,則更新裝置13將該兩條推薦詞條寫入該本地語料庫。在另一示例中,第一內(nèi)容獲取裝置12獲得針對某用戶組的推薦詞條“次渠”、“玉江佳園”、“潞西路”及各詞條的推薦權(quán)重依次為2、1、與2 ;更新裝置13根據(jù)該等推薦詞條及其推薦權(quán)重,確定推薦詞條“次渠”和“潞西路”的推薦權(quán)重超過預定權(quán)重閾值1.5,則將該兩條推薦詞條通過諸如http、https等約定的通信協(xié)議發(fā)送至網(wǎng)絡設備,接著,該網(wǎng)絡設備的通過實時監(jiān)聽的方式接收來自操作設備1的該兩條推薦詞條,并將其寫入該網(wǎng)絡設備中該用戶組的公共語料庫中。本領(lǐng)域技術(shù)人員應能理解上述更新語料庫的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的更新語料庫的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。
優(yōu)選地,操作設備1的信息獲取裝置11、第一內(nèi)容獲取裝置12、更新裝置13之間是持續(xù)不斷地工作。具體地,信息獲取裝置11持續(xù)地獲取一個或多個應用的用戶操作信息;第一內(nèi)容獲取裝置12也持續(xù)地根據(jù)所述用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容;更新裝置13也持續(xù)地根據(jù)所述推薦內(nèi)容來更新所述語料庫,以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。在此,本領(lǐng)域技術(shù)人員應理解 “持續(xù)”是指各裝置不斷進行上述用于操作信息的獲取、推薦內(nèi)容的獲取及語料庫的更新, 直至滿足預定停止條件,例如信息獲取裝置11在較長時間內(nèi)停止用戶操作信息的獲取。優(yōu)選地(參照圖1),信息獲取裝置11獲取一個用戶對一個或多個應用的用戶操作信息;更新裝置13根據(jù)所述推薦內(nèi)容來更新該用戶的語料庫,以將所述推薦內(nèi)容作為該用戶進行內(nèi)容輸入的候選詞條。具體地,信息獲取裝置11例如應事件觸發(fā)實時地獲取一個用戶當前在一個應用上的用戶操作信息,或周期地從本地或第三方設備的用戶歷史行為庫中獲取該一個用戶在一個或多個應用上的用戶歷史操作信息;更新裝置13將第一內(nèi)容獲取裝置12獲取的推薦內(nèi)容更新至該用戶在用戶設備中或在網(wǎng)絡設備中的該用戶私有語料庫,或?qū)烧咄瑫r更新,以將該(些)推薦內(nèi)容作為該用戶進行內(nèi)容輸入的候選詞條。在一示例中,信息獲取裝置11通過調(diào)用用戶設備提供的應用編程接口(API),按照預定周期在用戶設備的本地用戶歷史行為庫中獲取該用戶在多個應用上的用戶歷史操作信息;接著,第一內(nèi)容獲取裝置12根據(jù)該等用戶歷史操作信息獲取相應的多個推薦詞條;隨后,更新裝置13將該些推薦詞條寫入該用戶在該用戶設備的用戶私有語料庫中,以將其作為該用戶進行內(nèi)容輸入的候選詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取用戶操作信息的方式和/或更新語料庫的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取用戶操作信息的方式和/或更新語料庫的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地(參照圖1),信息獲取裝置11獲取所述一個或多個應用的用戶歷史操作信息;第一內(nèi)容獲取裝置12對該等用戶歷史操作信息根據(jù)預定統(tǒng)計規(guī)則進行處理,以獲取與該等用戶歷史操作信息相對應的推薦內(nèi)容。具體地,首先,信息獲取裝置11可從本地或第三方設備的用戶歷史行為庫中,應事件觸發(fā)實時地、或周期地獲取一個或多個應用的用戶歷史操作信息。接著,第一內(nèi)容獲取裝置12對信息獲取裝置11獲取的用戶歷史操作信息根據(jù)預定統(tǒng)計規(guī)則進行處理,以獲取與該等用戶歷史操作信息相對應的推薦內(nèi)容。在此,所述根據(jù)預定統(tǒng)計規(guī)則獲取推薦內(nèi)容的方式包括但不限于以下情形1)當用戶歷史操作信息為多個用戶對應用的歷史操作信息時,并且,該等用戶的用戶歷史操作信息中的操作內(nèi)容為文本,則第一內(nèi)容獲取裝置12可通過對該等文本進行分詞處理,以獲得相應的分詞結(jié)果,進而統(tǒng)計每個分詞在分詞結(jié)果重復出現(xiàn)的累計次數(shù),以獲取累計次數(shù)排名靠前的預定數(shù)量的分詞作為推薦詞條;或?qū)@得的重復出現(xiàn)的累計次數(shù)超過預定次數(shù)閾值的分詞作為推薦詞條。2)當用戶歷史操作信息為一個用戶對應用的歷史操作信息時,則第一內(nèi)容獲取裝置12在該歷史操作信息中提取該用戶在預定時間段內(nèi)在進行的具有相同操作類型的操作內(nèi)容,并對該等操作內(nèi)容進行統(tǒng)計分析,以獲得相應的推薦詞條作為推薦內(nèi)容。
在一示例中,首先,信息獲取裝置11通過用戶設備提供的應用編程接口(API),按照預定周期從本地的用戶歷史行為庫中獲取某一用戶在用戶設備的閱讀器中閱讀文章時的歷史操作信息;第一內(nèi)容獲取裝置12在該歷史操作信息中提取該用戶在最近1小時內(nèi)操作類型為劃選操作的操作內(nèi)容,如在文章所劃選的文本內(nèi)容,然后對該等文本進行分詞處理以獲取相應的分詞結(jié)果,進而統(tǒng)計每個分詞在分詞結(jié)果重復出現(xiàn)的累計次數(shù),以獲取累計次數(shù)排名靠前的預定數(shù)量的分詞作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更優(yōu)選地(參照圖1),第一內(nèi)容獲取裝置12根據(jù)信息獲取裝置11獲取的用戶操作信息,并結(jié)合用戶相關(guān)信息,獲取與該用戶操作信息相對應的推薦內(nèi)容。在此,所述用戶相關(guān)信息包括但不限于1)用戶的個體屬性標簽;其中,所述用戶的個體屬性標簽包括但不限于用戶屬性,如年齡、性別、職業(yè)等、用戶偏好設置等。在一示例中,當用戶操作信息示出某一用戶的在用戶設備閱讀器中進行劃選操作,且操作內(nèi)容為一段文本;第一內(nèi)容獲取裝置12對該文本進行分詞處理以獲取分詞處理結(jié)果為“電影”、“藍精靈”、“挪威的森林”等,同時第一內(nèi)容獲取裝置12通過用戶設備提供的應用編程接口(API),在該用戶設備的用戶信息庫中查詢獲取該用戶的年齡為14歲,則第一內(nèi)容獲取裝置12將符合該用戶年齡的分詞結(jié)果“藍精靈”作為推薦詞條;在此,所述用戶信息存儲庫中包括但不限于用戶屬性,如年齡、性別、職業(yè)等,及用戶偏好設置;所述用戶信息庫包括但不限于關(guān)系數(shù)據(jù)庫、Key-Value存儲系統(tǒng)、文件系統(tǒng)等。2)用戶的群組屬性標簽;其中,所述用戶群組屬性標簽包括但不限于與一個用戶具有相同或相似用戶特征的其他用戶的用戶屬性、用戶偏好信息等。在此,所述群組屬性標簽的獲取方式包括但不限于1)根據(jù)用戶的標識信息,查詢前述用戶信息庫,獲得該用戶的群組屬性標簽;2)根據(jù)用戶的標識信息,查詢前述用戶信息庫,獲得該用戶的個體屬性標簽以及個體屬性標簽與該用戶相同或部分相同的其他用戶,并將該等與其他用戶相同的個體屬性標簽作為該用戶的群組屬性標簽;在一示例中,當用戶操作信息示出某一用戶的在用戶設備閱讀器中進行劃選操作,且操作內(nèi)容為一段文本;第一內(nèi)容獲取裝置12對該文本進行分詞處理以獲取分詞處理結(jié)果為“登山”、“徒步”、“日出”等,同時第一內(nèi)容獲取裝置12通過約定的通信方式向網(wǎng)絡設備發(fā)送獲取該用戶的群組屬性標簽的請求,該網(wǎng)絡設備接收并解析該請求,接著在網(wǎng)絡設備的用戶信息庫中進行匹配查詢,以獲得該用戶的群組屬性標簽為“體育”并將其返回至操作設備1,則第一內(nèi)容獲取裝置12接收該群組屬性標簽,并據(jù)此將分詞“登山”和“徒步” 作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更優(yōu)選地(參照圖1),第一內(nèi)容獲取裝置12根據(jù)信息獲取裝置11獲取的用戶操作信息,并結(jié)合該用戶操作信息所屬的應用,以獲取與該用戶操作信息相對應的推薦內(nèi)容。在一示例中,若用戶操作信息所屬的應用為電子地圖,則第一內(nèi)容獲取裝置12將提取用戶操作信息中操作內(nèi)容所包括的地理名稱信息,并將該等地理名稱作為推薦詞條, 以獲得推薦內(nèi)容。在另一示例中,若用戶操作信息所屬的應用為網(wǎng)絡百科,則第一內(nèi)容獲取裝置12 將提取用戶操作信息中操作內(nèi)容所包括的多個百科條目,并將該等百科條目作為推薦詞條,以獲得推薦內(nèi)容。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。圖2示出根據(jù)本發(fā)明一個優(yōu)選實施例的操作用于內(nèi)容輸入的語料庫的設備示意圖。其中,第一內(nèi)容獲取裝置12’包括關(guān)聯(lián)信息獲取單元121’和第二內(nèi)容獲取單元122’。在此,圖2中所示裝置11’和裝置13’的功能與前面參照圖1所描述的裝置11和裝置13的內(nèi)容相同,為簡明起見,將其以引用方式包含于此,而不做贅述。以下參照圖2來對該優(yōu)選實施例進行詳細描述具體地,關(guān)聯(lián)信息獲取單元121’根據(jù)信息獲取裝置11’獲取的用戶操作信息,并結(jié)合該用戶操作信息所屬的應用,獲取與該用戶操作信息相關(guān)的關(guān)聯(lián)信息;例如,當應用為電子地圖時,與用戶操作信息相關(guān)的關(guān)聯(lián)信息包括但不限于用戶所查找的地理位置的周邊地理信息;當應用為網(wǎng)絡百科時,與用戶操作信息相關(guān)的關(guān)聯(lián)信息包括但不限于與用戶當前點擊查看的百科詞條關(guān)聯(lián)的其他百科詞條。接著,第二內(nèi)容獲取單元122’根據(jù)關(guān)聯(lián)信息獲取單元121’獲取的關(guān)聯(lián)信息,按照預定獲取規(guī)則,獲取與該(等)關(guān)聯(lián)信息相對應的推薦內(nèi)容。在一示例中,用戶操作信息為在電子地圖應用中輸入查找“天安門”的地理位置, 則關(guān)聯(lián)信息獲取單元121’根據(jù)“天安門”的地理位置,在電子地圖中查詢獲得該地理位置周邊的相關(guān)地理信息,如“毛主席紀念堂”、“人民英雄紀念碑”、“故宮”、“景山公園”等;接著, 第二內(nèi)容獲取單元122’將距離“天安門”的地理坐標位置1公里以內(nèi)的地理信息“毛主席紀念堂”、“人民英雄紀念碑”、“故宮”作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取關(guān)聯(lián)信息的方式和/或獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取關(guān)聯(lián)信息的方式和/或獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。圖3示出根據(jù)本發(fā)明一個方面的操作用于內(nèi)容輸入的語料庫的方法流程圖。在此,所述內(nèi)容輸入包括不限于文字,如單字、詞、句子等、特殊字符、圖標、圖像等內(nèi)容的輸入。在此,所述語料庫用于存儲進行內(nèi)容輸入的候選詞條;其可為以下任一類型的語料庫1)在用戶設備上的本地語料庫;2)在網(wǎng)絡設備上的網(wǎng)絡語料庫;3)單用戶專用的私有語料庫;4)多用戶共享的公共語料庫,其可為同一用戶組中多個用戶共享的公共語料庫,或可為非同一用戶組中的多個用戶共享的公共語料庫。本領(lǐng)域技術(shù)人員應能理解上述語料庫僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的語料庫如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在此,所述操作設備可為用戶設備,也可為網(wǎng)絡設備。在此,所述用戶設備可以是任何一種可與用戶通過鍵盤、鼠標、遙控器、觸摸板、或手寫設備等方式進行人機交互的電子產(chǎn)品,例如計算機、智能手機、PDA、或IPTV等。在此,所述網(wǎng)絡設備包括但不限于計算機、網(wǎng)絡主機、單個網(wǎng)絡服務器、多個網(wǎng)絡服務器集或多個服務器構(gòu)成的云。在此,云由基于云計算(Cloud Computing)的大量計算機或網(wǎng)絡服務器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機。以下參照圖3來對操作設備1的操作過程進行詳細描述首先,在步驟Sl中,操作設備1獲取一個或多個應用的用戶操作信息。在此,所述應用包括但不限于本地應用、互聯(lián)網(wǎng)應用;其中,所述本地應用包括但不限于閱讀器、文本編輯器、游戲等;所述互聯(lián)網(wǎng)應用包括但不限于網(wǎng)絡百科、網(wǎng)絡地圖、網(wǎng)絡搜索等。在此,所述用戶操作信息包括但不限于操作類型、操作內(nèi)容;其中,所述操作類型包括但不限于點擊操作、劃選操作、瀏覽操作、編輯操作等;所述操作內(nèi)容包括但不限于純文本、鏈接文本、圖標、圖片等。在此,所述獲取的用戶操作信息包括但不限于1)某一用戶在該一個或多個應用上的用戶操作信息;2)某用戶組中各用戶在該一個或多個應用上的用戶操作信息;3) 一個或多個應用的所有用戶在該一個或多個應用上的用戶操作信息。其中,所述用戶操作信息可為用戶在一個或多個應用上的當前操作信息,也可為用戶在一個或多個應用上的歷史操作信息,或者二者結(jié)合。在此,獲取所述用戶操作信息的方式包括但不限于以下情形1)當用戶操作信息為用戶的當前操作信息時,則在步驟Sl中,操作設備1通過約定的通信方式,應事件觸發(fā)實時地獲取一個或多個應用的用戶當前操作信息。在一示例中,用戶通過與用戶設備的交互方式,包括但不限于鼠標、鍵盤、遙控器、 觸摸屏、或手寫設備,在某一應用的用戶交互界面中進行的點擊、劃選、編輯等操作。以鼠標為例,用戶在用戶設備的顯示屏幕上利用鼠標點擊瀏覽器中顯示的網(wǎng)絡百科的一個詞條, 該用戶設備將該點擊操作及其操作內(nèi)容作為用戶消息通過約定的通信方式發(fā)送至操作設備1,在步驟Sl中,操作設備1通過實時地監(jiān)聽的方式接收并解析該用戶消息,以獲取該用戶操作信息。其中,當操作設備1為該用戶設備時,所述約定的通信方式包括通過諸如總線等介質(zhì)的用戶設備的內(nèi)部通信協(xié)議,所述內(nèi)部通信協(xié)議包括但不限于存在于計算機中的各種形式通信,例如面向?qū)ο缶幊讨袑ο笾g的通信協(xié)議;操作系統(tǒng)內(nèi)不同程序或計算機不同模塊之間的消息傳送協(xié)議。當操作設備1為網(wǎng)絡設備時,所述約定的通信方式包括但不限于基于3GPP、LTE、WIMAX的移動通信、基于TCP/IP、UDP協(xié)議的計算機網(wǎng)絡通信以及基于藍牙、紅外傳輸標準的近距無線傳輸方式。
12
2)當用戶操作信息為用戶的歷史操作信息時,則在步驟Sl中,操作設備1可從本地或第三方設備的用戶歷史行為庫中,應事件觸發(fā)實時地、或按照預定周期地獲取一個或多個應用的用戶歷史操作信息。在此,所述用戶歷史行為庫中包括但不限于用戶標識信息或用戶組標識信息及其所對應的用戶歷史操作信息;其中,該用戶歷史操作信息包括但不限于操作類型、操作內(nèi)容等信息。在此,所述用戶歷史行為庫包括但不限于關(guān)系數(shù)據(jù)庫、Key-Value存儲系統(tǒng)、文件系統(tǒng)等。在一示例中,在步驟Sl中,操作設備1通過調(diào)用設定的應用編程接口(API),按照預定周期向第三方設備發(fā)送獲取一個用戶組在諸如百度百科、維基百科、搜搜百科等瀏覽器網(wǎng)絡百科應用中的歷史操作信息的請求,其中,該請求中包含該用戶組ID為“公益協(xié)會”; 該第三方設備接收并解析該請求,提取該請求中的該用戶組ID,并據(jù)此在用戶歷史行為庫中進行匹配查詢,以獲得與該請求相對應的該“公益協(xié)會”用戶組中全部用戶成員在瀏覽器網(wǎng)絡百科應用中的歷史操作信息,接著將查詢獲得的該等歷史操作信息返回至操作設備1, 在步驟Sl中,操作設備1通過實時監(jiān)聽的方式接收該等歷史操作信息。本領(lǐng)域技術(shù)人員應能理解上述獲取用戶操作信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取用戶操作信息的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。接著,在步驟S2中,操作設備1根據(jù)其在步驟Sl中獲取的用戶操作信息,按照預定獲取規(guī)則,獲取與該(等)用戶操作信息相對應的推薦內(nèi)容。在此,所述推薦內(nèi)容中包括但不限于一個或多個推薦詞條,以及各推薦詞條的推薦權(quán)重;其中,所述推薦詞條包括但不限于文字,如單字、詞、句子、特殊字符、圖標、圖片等。具體地,若用戶操作信息為用戶當前操作信息,則在步驟S2中,操作設備1提取該用戶當前操作信息中的操作內(nèi)容,并執(zhí)行以下操作a)當該操作內(nèi)容為圖片時,操作設備1在步驟S2中直接將該圖片作為推薦詞條;b)當該操作內(nèi)容為文本時,例如純文本、鏈接文本等,則操作設備1在步驟S2中將該文本進行分詞處理以獲得一個或多個分詞結(jié)果,并將該一個或多個分詞結(jié)果作為推薦詞
條 ο在此,所述實施例中的進行分詞處理的算法包括但不限于正向最大匹配,反向最大匹配,雙向最大匹配,語言模型方法,最短路徑算法等等。在一示例中,用戶操作信息為用戶當前在用戶設備的閱讀器中的劃選操作,且該用戶操作信息的操作內(nèi)容為一段純文本“暴風白兵對抗絕地武士”,;則在步驟S2中,操作設備1將該段純文本利用正向最大匹配分詞算法進行分詞處理,以獲得相應的分詞結(jié)果為 “暴風白兵”、“對抗”、“絕地武士”,接著將該三條分詞結(jié)果作為三個推薦詞條。優(yōu)選地,在步驟S2中,操作設備1根據(jù)通過對文本進行分詞處理獲得的多個分詞結(jié)果,在本地或第三方設備的用戶歷史行為庫中進行匹配查詢,以獲得該等分詞在用戶歷史操作信息的操作內(nèi)容中的累計歷史出現(xiàn)次數(shù),并將累計出現(xiàn)次數(shù)高于預定出現(xiàn)次數(shù)閾值的分詞作為推薦詞條;或在步驟S2中,操作設備1根據(jù)該等分詞結(jié)果,在本地或第三方設備的用戶歷史行為庫中進行匹配查詢,以獲得該等分詞在最近預定時間段內(nèi)的用戶歷史操作信息的操作內(nèi)容中歷史出現(xiàn)頻次,并將歷史出現(xiàn)頻次高于預定出現(xiàn)頻次閾值的分詞作為推薦詞條。更優(yōu)選地,在步驟S2中,操作設備1還可根據(jù)通過對文本進行分詞處理獲得的多個分詞結(jié)果,利用自然語言理解技術(shù)對該文本進行語義分析,以確定各分詞中的中心詞,并將該(等)中心詞作為推薦詞條。在一示例中,用戶操作信息為用戶當前在用戶設備的瀏覽器中的的劃選操作,且該用戶操作信息的操作內(nèi)容為一段文本;在步驟S2中,操作設備1將該文本進行分詞處理, 獲得多個分詞結(jié)果分別為“天宮一號”、“順利”、“升空”、,接著操作設備1對該等分詞結(jié)果進行語義分析,確定該等分詞結(jié)果中“天宮一號”為中心詞,進而將該兩個中心詞作為推薦詞
^^ ο本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。隨后,在步驟S3中,操作設備1根據(jù)其在步驟S2中獲得的推薦內(nèi)容來更新語料庫,以將該(等)推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。具體地,在步驟S3中,操作設備1例如將其在步驟S2中獲得的推薦內(nèi)容中的一個或多個推薦詞條寫入語料庫中,以更新該語料庫。若檢測到該語料庫未建立,則先行初始化該語料庫,然后將該等推薦詞條寫入到該語料庫中。在此,所述更新語料庫的方式包括但不限于1)將推薦內(nèi)容中的所有推薦詞條寫入該語料庫,寫入的方式包括a)增量寫入,即在步驟S3中,操作設備1將每條推薦詞條在語料庫中進行匹配查詢,若查詢確定該推薦詞條在語料庫中已存在,則無需再次寫入;若查詢確定該推薦詞條在語料庫中不存在,則將其寫入。b)覆蓋寫入;即在步驟S3中,操作設備1將全部推薦詞條寫入語料庫中,其中在該語料庫中已存在的推薦詞條將被覆蓋寫入。2)在步驟S3中,操作設備1可根據(jù)推薦內(nèi)容中各推薦詞條的推薦權(quán)重,僅將推薦權(quán)重超過預定權(quán)重閾值的推薦詞條寫入語料庫,或?qū)⑼扑]權(quán)重排序靠前的預定數(shù)量的推薦詞條寫入語料庫。3)在步驟S3中,操作設備1還可根據(jù)已寫入到語料庫中的各推薦詞條的推薦權(quán)重,更新語料庫中相應候選詞條的候選權(quán)重。在此,所述語料庫中的每條候選詞條都具有與其相對應的候選權(quán)重,以用于在提供候選詞條時按照候選權(quán)重對該等候選詞條按序提供。 例如,在步驟S2中,操作設備1獲得的針對某一用戶的推薦詞條“天宮一號”且該推薦詞條的推薦權(quán)重為2,在步驟S3中,操作設備1將該推薦詞條在該用戶的語料庫中進行匹配查詢,確定該推薦詞條在該語料庫中已存在且與其相對應的候選權(quán)重為1,則基于預定的更新候選權(quán)重規(guī)則,將“天宮一號”在該語料庫中的候選權(quán)重更新為1. 2( = 1+2*0. 1)。在此,需要說明的是,舉例中的各項數(shù)值作為說明作用的示例,僅供理解本發(fā)明, 不作為實際應用時的真實數(shù)據(jù)。如無特別說明,本文中其他地方出現(xiàn)的數(shù)值的功用與此處相同,為簡明起見,不再贅述。在此,在步驟S3中,操作設備1可同時更新一個或多個語料庫,例如可僅更新用戶在用戶設備上的本地語料庫,也可同時更新該本地語料庫和該用戶在網(wǎng)絡設備上的網(wǎng)絡語料庫;又例如,可更新用戶組共享的公共語料庫,也可同時更新用戶組中各個用戶專用的私有語料庫。在一示例中,在步驟S3中,操作設備1根據(jù)其在步驟S2中獲得的針對某一用戶的推薦詞條“暴風白兵”、“對抗”和“絕地武士”,在該用戶的用戶設備的本地語料庫中進行查詢匹配,確定該語料庫中不存在詞條“暴風白兵”與“絕地武士”,但存在詞條“對抗”,則在步驟S3中,操作設備1將該兩條推薦詞條寫入該本地語料庫。在另一示例中,在步驟S2中,操作設備1獲得針對某用戶組的推薦詞條“次渠”、 “玉江佳園”、“潞西路”及各詞條的推薦權(quán)重依次為2、1、與2 ;在步驟S3中,操作設備1根據(jù)該等推薦詞條及其推薦權(quán)重,確定推薦詞條“次渠”和“潞西路”的推薦權(quán)重超過預定權(quán)重閾值1. 5,則將該兩條推薦詞條通過諸如http、https等約定的通信協(xié)議發(fā)送至網(wǎng)絡設備, 接著,該網(wǎng)絡設備的通過實時監(jiān)聽的方式接收來自操作設備1的該兩條推薦詞條,并將其寫入該網(wǎng)絡設備中該用戶組的公共語料庫中。本領(lǐng)域技術(shù)人員應能理解上述更新語料庫的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的更新語料庫的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,操作設備1在步驟Si、步驟S2和步驟S3中是持續(xù)不斷地工作。具體地, 在步驟Sl中,操作設備1持續(xù)地獲取一個或多個應用的用戶操作信息;在步驟S2中,操作設備1也持續(xù)地根據(jù)所述用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容;在步驟S3中,操作設備1也持續(xù)地根據(jù)所述推薦內(nèi)容來更新所述語料庫, 以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。在此,本領(lǐng)域技術(shù)人員應理解“持續(xù)”是指操作設備1在各步驟中不斷進行上述用于操作信息的獲取、推薦內(nèi)容的獲取及語料庫的更新,直至滿足預定停止條件,例如操作設備1在較長時間內(nèi)停止用戶操作信息的獲取。優(yōu)選地(參照圖幻,在步驟Sl中,操作設備1獲取一個用戶對一個或多個應用的用戶操作信息;在步驟S3中,操作設備1根據(jù)所述推薦內(nèi)容來更新該用戶的語料庫,以將所述推薦內(nèi)容作為該用戶進行內(nèi)容輸入的候選詞條。具體地,在步驟Sl中,操作設備1例如應事件觸發(fā)實時地獲取一個用戶當前在一個應用上的用戶操作信息,或周期地從本地或第三方設備的用戶歷史行為庫中獲取該一個用戶在一個或多個應用上的用戶歷史操作信息;在步驟S3中,操作設備1將其在步驟S2中獲取的推薦內(nèi)容更新至該用戶在用戶設備中或在網(wǎng)絡設備中的該用戶私有語料庫,或?qū)烧咄瑫r更新,以將該(些)推薦內(nèi)容作為該用戶進行內(nèi)容輸入的候選詞條。在一示例中,在步驟Sl中,操作設備1通過調(diào)用用戶設備提供的應用編程接口 (API),按照預定周期在用戶設備的本地用戶歷史行為庫中獲取該用戶在多個應用上的用戶歷史操作信息;接著,在步驟S2中,操作設備1根據(jù)該等用戶歷史操作信息獲取相應的多個推薦詞條;隨后,在步驟S3中,操作設備1將該些推薦詞條寫入該用戶在該用戶設備的用戶私有語料庫中,以將其作為該用戶進行內(nèi)容輸入的候選詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取用戶操作信息的方式和/或更新語料庫的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取用戶操作信息的方式和/或更新語料庫的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地(參照圖3),在步驟Sl中,操作設備1獲取所述一個或多個應用的用戶歷
15史操作信息;在步驟S2中,操作設備1對該等用戶歷史操作信息根據(jù)預定統(tǒng)計規(guī)則進行處理,以獲取與該等用戶歷史操作信息相對應的推薦內(nèi)容。具體地,首先,在步驟Sl中,操作設備1可從本地或第三方設備的用戶歷史行為庫中,應事件觸發(fā)實時地、或周期地獲取一個或多個應用的用戶歷史操作信息。接著,在步驟S2中,操作設備1對其在步驟Sl中獲取的用戶歷史操作信息根據(jù)預定統(tǒng)計規(guī)則進行處理,以獲取與該等用戶歷史操作信息相對應的推薦內(nèi)容。在此,所述根據(jù)預定統(tǒng)計規(guī)則獲取推薦內(nèi)容的方式包括但不限于以下情形1)當用戶歷史操作信息為多個用戶對應用的歷史操作信息時,并且,該等用戶的用戶歷史操作信息中的操作內(nèi)容為文本,則在步驟S2中,操作設備1可通過對該等文本進行分詞處理,以獲得相應的分詞結(jié)果,進而統(tǒng)計每個分詞在分詞結(jié)果重復出現(xiàn)的累計次數(shù), 以獲取累計次數(shù)排名靠前的預定數(shù)量的分詞作為推薦詞條;或?qū)@得的重復出現(xiàn)的累計次數(shù)超過預定次數(shù)閾值的分詞作為推薦詞條。2)當用戶歷史操作信息為一個用戶對應用的歷史操作信息時,則在步驟S2中,操作設備1在該歷史操作信息中提取該用戶在預定時間段內(nèi)在進行的具有相同操作類型的操作內(nèi)容,并對該等操作內(nèi)容進行統(tǒng)計分析,以獲得相應的推薦詞條作為推薦內(nèi)容。在一示例中,首先,在步驟Sl中,操作設備1通過用戶設備提供的應用編程接口 (API),按照預定周期從本地的用戶歷史行為庫中獲取某一用戶在用戶設備的閱讀器中閱讀文章時的歷史操作信息;在步驟S2中,操作設備1在該歷史操作信息中提取該用戶在最近1小時內(nèi)操作類型為劃選操作的操作內(nèi)容,如在文章所劃選的文本內(nèi)容,然后對該等文本進行分詞處理以獲取相應的分詞結(jié)果,進而統(tǒng)計每個分詞在分詞結(jié)果重復出現(xiàn)的累計次數(shù),以獲取累計次數(shù)排名靠前的預定數(shù)量的分詞作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更優(yōu)選地(參照圖幻,在步驟S2中,操作設備1根據(jù)其在步驟Sl中獲取的用戶操作信息,并結(jié)合用戶相關(guān)信息,獲取與該用戶操作信息相對應的推薦內(nèi)容。在此,所述用戶相關(guān)信息包括但不限于1)用戶的個體屬性標簽;其中,所述用戶的個體屬性標簽包括但不限于用戶屬性,如年齡、性別、職業(yè)等、用戶偏好設置等。在一示例中,當用戶操作信息示出某一用戶的在用戶設備閱讀器中進行劃選操作,且操作內(nèi)容為一段文本;在步驟S2中,操作設備1對該文本進行分詞處理以獲取分詞處理結(jié)果為“電影”、“藍精靈”、“挪威的森林”等,同時在步驟S2中,操作設備1通過用戶設備提供的應用編程接口(API),在該用戶設備的用戶信息庫中查詢獲取該用戶的年齡為14 歲,則操作設備1將符合該用戶年齡的分詞結(jié)果“藍精靈”作為推薦詞條;在此,所述用戶信息存儲庫中包括但不限于用戶屬性,如年齡、性別、職業(yè)等,及用戶偏好設置;所述用戶信息庫包括但不限于關(guān)系數(shù)據(jù)庫、Key-Value存儲系統(tǒng)、文件系統(tǒng)等。2)用戶的群組屬性標簽;其中,所述用戶群組屬性標簽包括但不限于與一個用戶具有相同或相似用戶特征的其他用戶的用戶屬性、用戶偏好信息等。在此,所述群組屬性標簽的獲取方式包括但不限于
1)根據(jù)用戶的標識信息,查詢前述用戶信息庫,獲得該用戶的群組屬性標簽;2)根據(jù)用戶的標識信息,查詢前述用戶信息庫,獲得該用戶的個體屬性標簽以及個體屬性標簽與該用戶相同或部分相同的其他用戶,并將該等與其他用戶相同的個體屬性標簽作為該用戶的群組屬性標簽;在一示例中,當用戶操作信息示出某一用戶的在用戶設備閱讀器中進行劃選操作,且操作內(nèi)容為一段文本;在步驟S2中,操作設備1對該文本進行分詞處理以獲取分詞處理結(jié)果為“登山”、“徒步”、“日出”等,同時操作設備1通過約定的通信方式向網(wǎng)絡設備發(fā)送獲取該用戶的群組屬性標簽的請求,該網(wǎng)絡設備接收并解析該請求,接著在網(wǎng)絡設備的用戶信息庫中進行匹配查詢,以獲得該用戶的群組屬性標簽為“體育”并將其返回至操作設備 1,則操作設備1接收該群組屬性標簽,并據(jù)此將分詞“登山”和“徒步”作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更優(yōu)選地(參照圖幻,在步驟S2中,操作設備1根據(jù)其在步驟Sl中獲取的用戶操作信息,并結(jié)合該用戶操作信息所屬的應用,以獲取與該用戶操作信息相對應的推薦內(nèi)容。在一示例中,若用戶操作信息所屬的應用為電子地圖,則在步驟S2中,操作設備 1將提取用戶操作信息中操作內(nèi)容所包括的地理名稱信息,并將該等地理名稱作為推薦詞條,以獲得推薦內(nèi)容。在另一示例中,若用戶操作信息所屬的應用為網(wǎng)絡百科,則在步驟S2中,操作設備1將提取用戶操作信息中操作內(nèi)容所包括的多個百科條目,并將該等百科條目作為推薦詞條,以獲得推薦內(nèi)容。本領(lǐng)域技術(shù)人員應能理解上述獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。圖4示出根據(jù)本發(fā)明一個優(yōu)選實施例的操作用于內(nèi)容輸入的語料庫的方法流程圖。在此,圖4中所示操作設備1在步驟Si,和步驟S3’中的功能與前面參照圖3所描述的操作設備1在步驟Sl和步驟S3中的內(nèi)容相同,為簡明起見,將其以引用方式包含于此,而不做贅述。以下參照圖4來對該優(yōu)選實施例進行詳細描述具體地,在步驟S21’中,操作設備1根據(jù)其在步驟Si’中獲取的用戶操作信息,并結(jié)合該用戶操作信息所屬的應用,獲取與該用戶操作信息相關(guān)的關(guān)聯(lián)信息;例如,當應用為電子地圖時,與用戶操作信息相關(guān)的關(guān)聯(lián)信息包括但不限于用戶所查找的地理位置的周邊地理信息;當應用為網(wǎng)絡百科時,與用戶操作信息相關(guān)的關(guān)聯(lián)信息包括但不限于與用戶當前點擊查看的百科詞條關(guān)聯(lián)的其他百科詞條。接著,在步驟S22’中,操作設備1根據(jù)其在步驟S21’中獲取的關(guān)聯(lián)信息,按照預定獲取規(guī)則,獲取與該(等)關(guān)聯(lián)信息相對應的推薦內(nèi)容。在一示例中,用戶操作信息為在電子地圖應用中輸入查找“天安門”的地理位置, 則在步驟S21’中,操作設備1根據(jù)“天安門”的地理位置,在電子地圖中查詢獲得該地理位置周邊的相關(guān)地理信息,如“毛主席紀念堂”、“人民英雄紀念碑”、“故宮”、“景山公園”等; 接著,在步驟S22’中,操作設備1將距離“天安門”的地理坐標位置1公里以內(nèi)的地理信息 “毛主席紀念堂”、“人民英雄紀念碑”、“故宮”作為推薦詞條。本領(lǐng)域技術(shù)人員應能理解上述獲取關(guān)聯(lián)信息的方式和/或獲取推薦內(nèi)容的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取關(guān)聯(lián)信息的方式和/或獲取推薦內(nèi)容的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。此外,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復數(shù)。裝置權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
18
權(quán)利要求
1.一種計算機實現(xiàn)的操作用于內(nèi)容輸入的語料庫的方法,其中,該方法包括以下步驟a獲取一個或多個應用的用戶操作信息;b根據(jù)所述用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容;c根據(jù)所述推薦內(nèi)容來更新所述語料庫,以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述語料庫包括但不限于以下至少任一項 -在用戶設備上的本地語料庫;-在網(wǎng)絡設備上的網(wǎng)絡語料庫; -單用戶專用的私有語料庫; -多用戶共享的公共語料庫。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述步驟a包括 -獲取一個用戶對所述一個或多個應用的用戶操作信息;其中,所述步驟c包括-根據(jù)所述推薦內(nèi)容來更新該用戶的語料庫,以將所述推薦內(nèi)容作為該用戶進行內(nèi)容輸入的候選詞條。
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中,所述步驟a包括 -獲取所述一個或多個應用的用戶歷史操作信息。其中,所述步驟b包括-對所述用戶歷史操作信息根據(jù)預定統(tǒng)計規(guī)則進行處理,以獲取與所述用戶歷史操作信息相對應的推薦內(nèi)容。
5.根據(jù)權(quán)利要求1至4中任一項所述的方法,其中,所述步驟b包括-根據(jù)所述用戶操作信息,并結(jié)合所述用戶操作信息所屬的應用,以獲取與所述用戶操作信息相對應的推薦內(nèi)容。
6.根據(jù)權(quán)利要求5所述的方法,其中步驟b包括-根據(jù)所述用戶操作信息,并結(jié)合所述用戶操作信息所屬的應用,獲取與所述用戶操作信息相關(guān)的關(guān)聯(lián)信息;-根據(jù)所述關(guān)聯(lián)信息,按照預定獲取規(guī)則,獲取與所述關(guān)聯(lián)信息相對應的推薦內(nèi)容。
7.根據(jù)權(quán)利要求1至6中任一項所述的方法,其中,所述步驟b包括-根據(jù)所述用戶操作信息,并結(jié)合用戶相關(guān)信息,獲取與所述用戶操作信息相對應的推薦內(nèi)容。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述用戶相關(guān)信息包括以下至少任一項 -所述用戶的個體屬性標簽;-所述用戶的群組屬性標簽。
9.一種操作用于內(nèi)容輸入的語料庫的設備,其中,該設備包括 信息獲取裝置,用于獲取一個或多個應用的用戶操作信息;第一內(nèi)容獲取裝置,用于根據(jù)所述用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容;更新裝置,用于根據(jù)所述推薦內(nèi)容來更新所述語料庫,以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。
10.根據(jù)權(quán)利要求9所述的設備,其中,所述語料庫包括但不限于以下至少任一項-在用戶設備上的本地語料庫;-在網(wǎng)絡設備上的網(wǎng)絡語料庫;-單用戶專用的私有語料庫;-多用戶共享的公共語料庫。
11.根據(jù)權(quán)利要求9或10所述的設備,其中,所述信息獲取裝置用于獲取一個用戶對所述一個或多個應用的用戶操作信息;其中,所述更新裝置用于根據(jù)所述推薦內(nèi)容來更新該用戶的語料庫,以將所述推薦內(nèi)容作為該用戶進行內(nèi)容輸入的候選詞條。
12.根據(jù)權(quán)利要求9至11中任一項所述的設備,其中,所述信息獲取裝置用于獲取所述一個或多個應用的用戶歷史操作信息。其中,所述第一內(nèi)容獲取裝置用于對所述用戶歷史操作信息根據(jù)預定統(tǒng)計規(guī)則進行處理,以獲取與所述用戶歷史操作信息相對應的推薦內(nèi)容。
13.根據(jù)權(quán)利要求9至12中任一項所述的設備,其中,所述第一內(nèi)容獲取裝置用于根據(jù)所述用戶操作信息,并結(jié)合所述用戶操作信息所屬的應用,以獲取與所述用戶操作信息相對應的推薦內(nèi)容。
14.根據(jù)權(quán)利要求13所述的設備,其中,第一內(nèi)容獲取裝置包括關(guān)聯(lián)信息獲取單元,用于根據(jù)所述用戶操作信息,并結(jié)合所述用戶操作信息所屬的應用,獲取與所述用戶操作信息相關(guān)的關(guān)聯(lián)信息;第二內(nèi)容獲取單元,用于根據(jù)所述關(guān)聯(lián)信息,按照預定獲取規(guī)則,獲取與所述關(guān)聯(lián)信息相對應的推薦內(nèi)容。
15.根據(jù)權(quán)利要求9至14中任一項所述的設備,其中,所述第一內(nèi)容獲取裝置用于根據(jù)所述用戶操作信息,并結(jié)合用戶相關(guān)信息,獲取與所述用戶操作信息相對應的推薦內(nèi)容。
16.根據(jù)權(quán)利要求15所述的設備,其中,所述用戶相關(guān)信息包括以下至少任一項-所述用戶的個體屬性標簽;-所述用戶的群組屬性標簽。
全文摘要
本發(fā)明的目的是提供一種操作用于內(nèi)容輸入的語料庫的方法與設備。其中,根據(jù)一個或多個應用的用戶操作信息,按照預定獲取規(guī)則,獲取與所述用戶操作信息相對應的推薦內(nèi)容,進而根據(jù)所述推薦內(nèi)容來更新所述語料庫,以將所述推薦內(nèi)容作為用于內(nèi)容輸入的候選詞條。與現(xiàn)有技術(shù)相比,本發(fā)明根據(jù)用戶在各應用中的操作信息,按照預定獲取規(guī)則,獲取相應的推薦文字、圖片、特殊字符等,并將其更新至該用戶的語料庫中以用于用戶進行相關(guān)內(nèi)容輸入的候選詞條。由此,當用戶在執(zhí)行該等操作行為之后再進行與該等操作行為相關(guān)聯(lián)的輸入時,可以快速從輸入法候選詞條中獲取其所需的詞條,提高用戶的內(nèi)容輸入效率,進而提升用戶體驗。
文檔編號G06F17/30GK102426591SQ201110338640
公開日2012年4月25日 申請日期2011年10月31日 優(yōu)先權(quán)日2011年10月31日
發(fā)明者周曉, 戴帥湘, 陳曉昕 申請人:北京百度網(wǎng)訊科技有限公司