亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

候選項的排序方法和裝置、用于候選項排序的裝置與流程

文檔序號:12836839閱讀:185來源:國知局
候選項的排序方法和裝置、用于候選項排序的裝置與流程
本發(fā)明涉及輸入法
技術領域
,特別是涉及一種候選項的排序方法和裝置、及一種用于候選項排序的裝置。
背景技術
:對于中文、日文、韓文等用戶而言,一般都需要通過輸入法程序與計算機進行交互。例如,用戶可以通過鍵盤鍵入輸入串,然后由輸入法程序依據(jù)其預置的標準映射規(guī)則將該輸入串轉換為相應語言的候選項并展示,進而將用戶選擇的候選項上屏。在實際應用中,輸入法程序在展示候選項的時候,通常依據(jù)候選項對應的詞頻對候選項進行排序。然而,由于大多數(shù)用戶經常輸入短詞,使得短詞的詞頻較高,而長詞的詞頻較低,因此,按照詞頻對候選項進行排序,使得長詞可能不會顯示在候選項中。這樣,在用戶需要輸入長詞時,可能需要鍵入更多的輸入串或者執(zhí)行更多的候選項查找以及上屏操作等??梢钥闯觯F(xiàn)有的依據(jù)詞頻對候選項進行排序的方法,往往將詞頻較高的短詞排在候選項的前面,使得用戶在需要輸入長詞時,需要執(zhí)行更多的操作,導致用戶的輸入過程較為繁瑣,輸入效率較低。技術實現(xiàn)要素:鑒于上述問題,提出了本發(fā)明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的候選項的排序方法和裝置、及用于候選項排序的裝置,可以簡化用戶輸入長詞的操作過程,進而可以提高用戶輸入長詞的效率,以及提高用戶的使用體驗。為了解決上述問題,本發(fā)明公開了一種候選項的排序方法,包括:確定輸入串對應候選項的詞長信息;依據(jù)所述候選項的詞長信息,對所述候選項進行排序。可選地,所述依據(jù)所述候選項的詞長信息,對所述候選項進行排序的步驟,包括:依據(jù)所述詞長信息,確定所述候選項對應的排序得分;其中,所述詞長信息與所述排序得分成正比關系;依據(jù)所述排序得分,對所述候選項進行排序??蛇x地,所述依據(jù)所述候選項的詞長信息,對所述候選項進行排序的步驟,包括:在所述詞長信息超過詞長閾值時,將所述詞長信息調整為詞長閾值;依據(jù)調整后的詞長信息,對所述候選項進行排序??蛇x地,所述方法還包括:依據(jù)所述輸入串對應候選項及其對應上下文的詞長信息,對所述候選項進行排序??蛇x地,所述方法還包括:依據(jù)所述候選項的詞長信息和詞頻信息,對所述候選項進行排序。可選地,所述輸入串對應候選項,包括:匹配詞條和/或聯(lián)想詞條。可選地,通過如下步驟確定候選項對應詞條的詞頻信息:在本地緩存詞庫中,通過統(tǒng)計收集的語料中相鄰詞條的共同出現(xiàn)次數(shù),得到詞條對應的詞頻信息;和/或在用戶詞庫中,通過統(tǒng)計收集的語料中各詞條的上屏次數(shù),得到詞條對應的詞頻信息;和/或在系統(tǒng)詞庫和/或細胞詞庫中,通過計算收集的語料中各詞條的輸入概率的自然對數(shù),得到詞條對應的詞頻信息。另一方面,本發(fā)明公開了一種候選項的排序裝置,包括:詞長信息確定模塊,用于確定輸入串對應候選項的詞長信息;及第一排序模塊,用于依據(jù)所述候選項的詞長信息,對所述候選項進行排序??蛇x地,所述第一排序模塊,包括:得分計算子模塊,用于依據(jù)所述詞長信息,確定所述候選項對應的排序得分;其中,所述詞長信息與所述排序得分成正比關系;第一排序子模塊,用于依據(jù)所述排序得分,對所述候選項進行排序。再一方面,本發(fā)明公開了一種用于候選項排序的裝置,包括有存儲器,以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進行以下操作的指令:確定輸入串對應候選項的詞長信息;依據(jù)所述候選項的詞長信息,對所述候選項進行排序。本發(fā)明實施例包括以下優(yōu)點:本發(fā)明實施例在輸入過程中,可以根據(jù)輸入串對應候選項的詞長信息,對候選項進行排序。例如,可以按照詞長信息的長短順序進行排序,將具有較高的詞長信息的候選項排在前面,也即可以優(yōu)先展示長詞;或者,也可以按照詞長信息的長短進行倒序排序,將具有較高的詞長信息的候選項排在后面,也即可以優(yōu)先展示短詞等等??傊?,本領域技術人員可以根據(jù)實際需要根據(jù)在候選項的排序過程中采用詞長信息。例如,相對于現(xiàn)有技術僅根據(jù)詞頻信息對候選項進行排序,本發(fā)明實施例可以在現(xiàn)有的根據(jù)詞頻信息對候選項進行排序的基礎上,根據(jù)詞長信息對候選項進行二次排序,以解決現(xiàn)有技術中詞頻較低的長詞經常無法展示,導致用戶需要執(zhí)行更多的操作才能輸入長詞的問題。由于通過本發(fā)明實施例可以使得具有較長的詞長信息的候選項排在前面,使得用戶可以快速選擇長詞完成輸入,因此,本發(fā)明實施例可以簡化用戶輸入長詞的操作過程,進而可以提高用戶輸入長詞的效率,以及提高用戶的使用體驗。附圖說明圖1是本發(fā)明的一種候選項的排序方法實施例一的步驟流程圖;圖2是本發(fā)明的一種候選項的排序方法實施例二的步驟流程圖;圖3是本發(fā)明的一種候選項的排序方法實施例三的步驟流程圖;圖4是本發(fā)明的一種候選列表的展示示意圖;圖5是本發(fā)明的一種候選項的排序裝置實施例的結構框圖;圖6是本發(fā)明的一種用于候選項的排序的裝置800的框圖;及圖7是本發(fā)明的一種服務器的結構示意圖。具體實施方式為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和具體實施方式對本發(fā)明作進一步詳細的說明。本發(fā)明實施例的核心構思之一在于,在輸入過程中,可以根據(jù)輸入串對應候選項的詞長信息,對候選項進行排序。例如,可以按照詞長信息的長短順序進行排序,將具有較高的詞長信息的候選項排在前面,也即可以優(yōu)先展示長詞等。總之,本領域技術人員可以根據(jù)實際需要,在候選項的排序的過程中采用詞長信息。相對于現(xiàn)有技術僅根據(jù)詞頻信息對候選項進行排序,由于本發(fā)明實施例可以使得具有較長的詞長信息的候選項排在前面,使得用戶可以快速選擇長詞完成輸入,因此,本發(fā)明實施例可以簡化用戶輸入長詞的操作過程,進而可以提高用戶輸入長詞的效率,以及提高用戶的使用體驗。方法實施例一參照圖1,示出了本發(fā)明的一種候選項的排序方法實施例一的步驟流程圖,具體可以包括如下步驟:步驟101、確定輸入串對應候選項的詞長信息;步驟102、依據(jù)所述候選項的詞長信息,對所述候選項進行排序。本發(fā)明實施例可以應用于各種輸入方式的輸入法系統(tǒng),例如,拼音輸入、英文輸入、筆畫輸入、語音輸入和手寫輸入等。用戶可以通過上述任意輸入方式完成輸入串的輸入,也即,用戶可以通過實體鍵盤、虛擬鍵盤、手寫板、觸摸屏、聲音采集設備等進行輸入。其中,輸入串可以是由數(shù)字、符號、拼音、英文字母等中任一項或幾項構成的。為了便于描述, 本發(fā)明實施例均以拼音串作為輸入串進行說明,其它類型的輸入串相互參照即可。需要說明的是,所述輸入串對應候選項,具體可以包括:匹配詞條和/或聯(lián)想詞條。在輸入過程中,可以從本地詞庫和/或云詞庫中獲取輸入串對應的匹配詞條和/或聯(lián)想詞條作為輸入串對應的候選項,具體地,本發(fā)明實施例可以通過如下任一方式確定輸入串對應的候選項:方式一在本地詞庫和/或云詞庫中查找得到所述輸入串對應的匹配詞條,將所述匹配詞條作為候選項。其中,所述本地詞庫具體可以包括:本地緩存詞庫和/或用戶詞庫和/或系統(tǒng)詞庫和/或細胞詞庫等??梢岳斫猓霰镜卦~庫可以包括傳統(tǒng)技術中的任一種詞庫或其組合,也可以為由本領域技術人員根據(jù)預置規(guī)則獲取的任一種詞庫,并且所述本地詞庫的存儲位置可以存在于服務器端或客戶端,本發(fā)明實施例對于所述本地詞庫的類型以及存儲方式均不加以限制。所述云詞庫可存儲于云服務器中,所述云詞庫可以實時收集網絡熱詞和/或網絡新詞,以及收集不同用戶的輸入數(shù)據(jù)等,以對本地詞庫中的詞條進行擴充,滿足更多用戶的輸入需求。所述輸入串可以包括簡拼序列或者全拼序列。例如,輸入法程序接收到輸入串為“zhong”,該輸入串為全拼序列,通過在本地詞庫中進行查詞,可以得到該全拼序列對應的匹配詞條包括:“中”、“種”、“重”、“鐘”等,則可以將上述匹配詞條作為輸入串“zhong”對應的候選項。再如,輸入法程序接收到輸入串為“zho”,該輸入串可以作為拼音“zuihou”或者“zhihou”的簡拼序列,通過在本地詞庫中進行查詞,可以得到該簡拼序列對應的匹配詞條包括:“最后”、“之后”等,則可以將上述匹配詞條作為輸入串“zho”對應的候選項。方式二在本地詞庫和/或云詞庫中查找得到所述輸入串對應的聯(lián)想詞條,將所述聯(lián)想詞條作為候選項。其中,所述聯(lián)想詞條具體可以為通過用戶已輸入的內容,聯(lián)想到的用戶欲要輸入的詞條,這樣,用戶在輸入較少的輸入串時或是產生輸入串之前即可看到想要輸入的聯(lián)想詞條,并可以選擇將其中的一個聯(lián)想詞條進行上屏,由此,能夠省去用戶繼續(xù)輸入的操作,減少用戶的輸入成本,從而提高用戶的輸入效率,并提升用戶的使用體驗。可以理解,上述已輸入的內容可以為已上屏的內容,或者已輸入的輸入串等,本發(fā)明實施例對于已輸入的內容的具體形式不加以限制。在本發(fā)明的一種應用示例中,輸入法程序接收到已輸入的輸入串為“zho”,通過在詞庫中進行查詞,可以得到該輸入串對應的聯(lián)想詞條可以包括:“終生”、“中關村”、“中華人民共和國”、“中國”等,則可以將上述聯(lián)想詞條作為輸入串“zho”對應的候選項。在本發(fā)明的另一種應用示例中,輸入法平臺可以根據(jù)組詞算法或字詞短語自動計算得到聯(lián)想詞條并提供給用戶選擇。例如,可以根據(jù)已輸入內容中的最后一個字或詞來形成接下來的聯(lián)想詞條(所形成的聯(lián)想詞條不需要用戶輸入任何輸入串)。通常這些由輸入法平臺提供的聯(lián)想詞條與所述輸入內容中的最后一個字或詞在詞庫中有連接關系或可以組成詞。例如,已輸入內容為“違章查”,那么可以根據(jù)“查”形成接下來的聯(lián)想詞條“詢”,又如,已輸入內容為“京東”,那么可以根據(jù)“京東”形成接下來的聯(lián)想詞條“商城”等等。本發(fā)明實施例的候選項排序方法可以適用于具有聯(lián)想功能的輸入環(huán)境,使得在輸入過程中可以將聯(lián)想到的長詞排在前面,從而可以省去用戶繼續(xù)輸入的操作,減少用戶的輸入成本。方式三對所述輸入串進行糾錯后,通過上述任一方式獲取糾錯后的輸入串對應的候選項。其中,對所述輸入串進行糾錯具體可以采用現(xiàn)有的糾錯方法,本發(fā)明對于具體的糾錯方法不加以限制。例如,用戶原本想要輸入的輸入串為“woai”,可以由于鍵盤中按鍵“o”和按鍵“i”為臨近鍵位,用戶誤將“o”輸入為“i”, 則實際輸入的輸入串為“wiai”,本發(fā)明實施例通過對輸入串“wiai”進行糾錯,可以得到糾錯后的輸入串“woai”。然后,在通過上述任一方式獲取糾錯后的輸入串對應的候選項,并且根據(jù)候選項對應的詞頻信息和詞長信息進行排序,使得排序結果更加準確。在本發(fā)明的一種可選實施例中,所述方法還可以包括如下步驟:依據(jù)所述輸入串對應候選項及其對應上下文的詞長信息,對所述候選項進行排序。在實際應用中,有的用戶習慣每次只輸入短詞,如“今天”、“天氣”、“真是”等等,但是該用戶輸入的多個短詞之間的語意是有關聯(lián)的,為了能夠體現(xiàn)這種關聯(lián),本發(fā)明實施例還可以獲取輸入串對應的上文和/或下文,如果上文和/或下文與輸入串對應候選項組成的詞或者句子存在于本地詞庫或者云詞庫中,則認為上文和/或下文與輸入串對應候選項的語意是有關聯(lián)的,可以獲取上文和/或下文與輸入串對應候選項組成的詞或者句子的總詞長信息,并且根據(jù)該總詞長信息對候選項進行排序。在本發(fā)明的一種應用示例中,例如上文為“去海邊抓”,輸入串為“px”;首先,根據(jù)輸入串“px”利用系統(tǒng)詞庫、用戶詞庫等詞庫查詢,可以得到一系列候選如“排序、皮鞋、培訓、螃蟹”等;然后,在詞庫中查詢是否存在上文“去海邊抓”分別與上述候選項組成的詞,查詢得到詞庫中存在詞條“去海邊抓螃蟹”,則上文“去海邊抓”與候選項“螃蟹”組成的詞對應的總詞長為6,而候選項“排序”、“皮鞋”、“培訓”對應的總詞長仍然是2;最后,根據(jù)總詞長信息對候選項進行排序,可以將“螃蟹”排在前面。由此,本發(fā)明實施例在依據(jù)詞長對候選項進行排序的過程中,可以考慮候選項與上文和/或下文之間的語意關聯(lián),并且對具有語意關聯(lián)的上文和/或下文的詞長信息也參與排序過程,使得具有語意關聯(lián)的長詞可以排在前面,進而使得排序結果更加符合用戶的輸入習慣。在本發(fā)明的另一種可選實施例中,所述依據(jù)所述候選項的詞長信息,對所述候選項進行排序的步驟,具體可以包括:步驟s11、依據(jù)所述詞長信息,確定所述候選項對應的排序得分;其中, 所述詞長信息與所述排序得分成正比關系;步驟s12、依據(jù)所述排序得分,對所述候選項進行排序。具體地,可以直接將詞長信息作為排序得分,或者,可以將詞長信息按長度劃分為不同區(qū)間,各區(qū)間對應不同的得分等。例如,直接將詞長信息作為排序得分,使得詞長信息與所述排序得分成正比關系,則可以按照詞長信息的長短順序,對所述候選項進行排序,將具有較高的詞長信息的候選項排在前面,也即可以優(yōu)先展示長詞,以滿足用戶經常輸入長詞的需求;或者,也可以按照詞長信息的長短進行倒序排序,將具有較高的詞長信息的候選項排在后面,也即可以優(yōu)先展示短詞,以滿足用戶經常輸入短詞的需求等。進一步地,本發(fā)明實施例還可以綜合考慮詞頻信息以及詞長信息,對候選項進行排序。例如,可以先根據(jù)詞頻信息對候選項進行排序,再根據(jù)詞長信息對排序結果進行二次排序。或者,同時根據(jù)詞頻信息和詞長信息計算候選項的排序得分,根據(jù)排序得分對候選項進行排序等??梢岳斫猓趯嶋H應用中,本領域技術人員可以根據(jù)需求靈活選擇排序方式,本發(fā)明實施例對于根據(jù)詞長信息對候選項進行排序的具體方式不加以限制。應用示例一在本應用示例中,可以根據(jù)詞頻信息和詞長信息計算候選項的排序得分,再根據(jù)排序得分對候選項進行排序。具體地,可以通過如下公式計算候選項的排序得分score:score=詞長×詞頻(1)或者,score=詞長/詞頻(2)假設輸入法程序接收到輸入串“zho”,且輸入的目標文字是“中國科學技術大學”,首先,獲取輸入串“zho”對應的候選項,以及確定各候選項對應的詞頻信息和詞長信息,參照表1,示出了本發(fā)明的一種候選項和對應的詞頻信息以及詞長信息的具體示意。表1然后,分別計算上述表1中各候選項對應的排序得分,以詞頻與詞長的乘積作為排序得分為例,則可以計算各候選項的排序得分如下所示:score(“中國科學技術大學”)=27*8=216score(“中國科學技術”)=27*6=162score(“中國”)=40*2=80score(“中部”)=32*2=64最后,將上述候選項按照排序得分的長短進行展示。由此,得分較高的候選項“中國科學技術大學”可以排在較前的位置,用戶可以快速地選擇該候選項進行上屏,從而可以提高輸入長詞的效率。為了使得獲取的詞頻信息更加準確,并且可以適合不同的應用場景,本發(fā)明實施例對于不同詞庫中存儲的詞條,對應有不同的詞頻計算方案。具體地,本發(fā)明實施例可以提供如下確定所述預置詞庫中詞條對應的詞頻信息的方案:方案一在本地緩存詞庫中,通過統(tǒng)計收集的語料中相鄰詞條的共同出現(xiàn)次數(shù),得到詞條對應的詞頻信息。本地緩存詞庫的語料具體可以為收集的用戶輸入數(shù)據(jù)。通過統(tǒng)計用戶真實的輸入數(shù)據(jù),統(tǒng)計輸入的相鄰詞條共同出現(xiàn)的次數(shù),得到詞條對應的詞頻信息。參見表2,示出了本發(fā)明的一種收集的本地緩存詞庫的語料示意。表2輸入串1詞條1輸入串2詞條2共同出現(xiàn)次數(shù)didianzai地點在nalia哪里啊4566didianzai地點在naline哪里呢2813didianzai地點在naa哪啊2223如第一條數(shù)據(jù),表示詞條1“地點在”和詞條2“哪里啊”共同出現(xiàn)的次數(shù)為4566,則可以將該共同出現(xiàn)的次數(shù)作為詞條“哪里啊”對應的詞頻。當用戶上屏輸入“地點在”之后,又輸入輸入串“n”,輸入法程序就可以在本地緩存詞庫中查找到所有具有共同拼音串前綴“n”的聯(lián)想詞條,如“哪里啊”、“哪里呢”、“哪啊”等,并依據(jù)各聯(lián)想詞條的詞頻信息和詞長信息進行排序。方案二在用戶詞庫中,通過統(tǒng)計收集的語料中各詞條的上屏次數(shù),得到詞條對應的詞頻信息。用戶詞庫的語料具體可以為收集的用戶真實的輸入數(shù)據(jù),當用戶上屏輸入某詞條后,輸入法程序可以把用戶上屏輸入過的詞條記為用戶詞,并統(tǒng)計每個用戶詞的上屏次數(shù),這個上屏次數(shù)即為用戶詞對應的詞頻。方案三在系統(tǒng)詞庫和/或細胞詞庫中,通過計算收集的語料中各詞條的輸入概率的自然對數(shù),得到詞條對應的詞頻信息。系統(tǒng)詞庫的語料具體可以通過收集新聞語料、bbs(bulletinboardsystem,電子公告牌系統(tǒng))語料、微博語料等得到,由于系統(tǒng)詞庫的語料一般為tb(萬億字節(jié))級別,因此可以利用分布式計算平臺進行統(tǒng)計,具體地,先通過如下公式統(tǒng)計詞條在語料中出現(xiàn)的概率值:prob(w)=count(w)/n(3)其中,w表示某個詞條,n為詞條的總個數(shù)。為了防止輸入法組詞模型計算過程中由于概率值相乘過小導致浮點下溢的情況,可以對上述概率值取自然對數(shù)作為系統(tǒng)詞的詞頻,具體計算公式如下:lognprob(w)(4)其中,底數(shù)n可用于表示預置參數(shù),其可以為經過多次試驗得到的經驗值。在具體應用中,如果底數(shù)n大于1,而prob(w)的值小于1,故將會得到負的對數(shù)值,不便于后續(xù)的計算。如果底數(shù)n為很小的小數(shù),則會導致相差 很大的兩個數(shù)的對數(shù)值卻相差很小,比如用0.1做底數(shù)n時,在兩個數(shù)相差10倍時,這兩個數(shù)的對數(shù)值的差值大概為1,這樣不利于對計算結果進行比較。因此,n可以取0.9至1之間的小數(shù),優(yōu)選地,n可以取值為0.985。細胞詞庫可以采用與系統(tǒng)詞庫相同的方式統(tǒng)計詞頻。細胞詞庫也稱為領域詞庫,一個細胞詞庫就是一個細分類別的詞匯集合,細胞詞庫的類別可以是某個專業(yè)領域(如醫(yī)學領域詞庫),也可以是某個地區(qū)(如北京地名詞庫),也可以是某個游戲(如魔獸世界詞匯)等。在系統(tǒng)詞庫和細胞詞庫中,詞頻越小表示對應詞條出現(xiàn)的概率越大。因此,為了使得詞長信息與排序得分成正比關系,對于從系統(tǒng)詞庫和細胞詞庫中獲取的候選項,可以采用詞頻信息與詞長信息的比值作為排序得分,也即排序得分score=詞頻/詞長。綜上,本發(fā)明實施例在輸入過程中,可以根據(jù)輸入串對應候選項的詞長信息,對候選項進行排序。例如,可以按照詞長信息的長短順序進行排序,將具有較高的詞長信息的候選項排在前面,也即可以優(yōu)先展示長詞;或者,也可以按照詞長信息的長短進行倒序排序,將具有較高的詞長信息的候選項排在后面,也即可以優(yōu)先展示短詞等等??傊绢I域技術人員可以根據(jù)實際需要根據(jù)在候選項的排序過程中采用詞長信息。例如,相對于現(xiàn)有技術僅根據(jù)詞頻信息對候選項進行排序,本發(fā)明實施例可以在現(xiàn)有的根據(jù)詞頻信息對候選項進行排序的基礎上,根據(jù)詞長信息對候選項進行二次排序,以解決現(xiàn)有技術中詞頻較低的長詞經常無法展示,導致用戶需要執(zhí)行更多的操作才能輸入長詞的問題。由于通過本發(fā)明實施例可以使得具有較長的詞長信息的候選項排在前面,使得用戶可以快速選擇長詞完成輸入,因此,本發(fā)明實施例可以簡化用戶輸入長詞的操作過程,進而可以提高用戶輸入長詞的效率,以及提高用戶的使用體驗。方法實施例二本實施例在上述方法實施例一的基礎上,還可以在確定排序得分的過程中,對詞長信息進行調整,以避免由于詞長信息太高導致排序結果不合理的 情況。參照圖2,示出了本發(fā)明實施例的一種候選項的排序方法實施例二的步驟流程圖,具體可以包括如下步驟:步驟201、確定輸入串對應候選項的詞長信息;步驟202、在所述詞長信息超過詞長閾值時,將所述詞長信息調整為詞長閾值;步驟203、依據(jù)調整后的詞長信息,對所述候選項進行排序。在具體應用中,如果某個候選項的詞頻信息較低但是詞長信息卻很大,這樣也有可能計算得到較高的排序得分,但是由于詞頻信息較低,該候選項對應的詞條有可能是用戶不經常使用的詞條,卻因為排序得分較高而被排在候選項的前面,從而會影響排序結果的合理性。為了使得排序能夠均衡考慮詞長信息,最終得到較為合理的排序結果,本發(fā)明實施例還可以對詞長信息進行調整。在本發(fā)明實施例中,可以設置詞長閾值,在候選項的詞長信息超過詞長閾值時,將所述詞長信息調整為詞長閾值,以避免由于詞長信息較大導致得分偏高的現(xiàn)象。在本發(fā)明的一種應用示例中,設置詞長閾值為5,由此,調整后的排序得分的計算公式如下:score=詞頻×min(5,詞長+1)(5)或者,score=詞頻/min(5,詞長+1)(6)其中,公式(5)可用于針對本地緩存詞庫和/或用戶詞庫中獲取的候選項的詞長信息進行調整,公式(6)可用于針對系統(tǒng)詞庫和/或細胞詞庫中獲取的候選項的詞長信息進行調整。需要說明的是,上述設置詞長閾值為5,僅作為本發(fā)明的一種應用示例,在實際應用中,本發(fā)明實施例對于詞長閾值的具體數(shù)值不加以限制。當然,還可以按照上述調整方式對詞頻信息進行調整,以避免詞頻較高時影響排序結果的合理性。綜上,本發(fā)明實施例可以在確定排序得分的過程中,對詞長信息進行調整,避免將用戶不經常使用的詞條,卻因為詞長信息較長而被排在候選項的前面,影響排序結果的合理性的情況,以提高排序結果的合理性。方法實施例三本實施例在方法實施例一或方法實施例二的基礎上,還可以按照預置的展示方式,展示排序后的候選項,以提高排序的靈活性和多樣性。參照圖3,示出了本發(fā)明的一種候選項的排序方法實施例三的步驟流程圖,具體可以包括如下步驟:步驟301、確定輸入串對應的匹配詞條和/或聯(lián)想詞條;步驟302、將所述匹配詞條和/或聯(lián)想詞條作為所述輸入串對應的候選項;步驟303、確定所述候選項的詞長信息;步驟304、根據(jù)所述候選項的詞長信息,對所述候選項進行排序;步驟305、按照預置的展示方式,展示排序后的候選項。在本發(fā)明實施例中,可以將從本地詞庫和/或云詞庫中獲取的所述輸入串對應的候選項,依據(jù)所述排序得分,依次在預置的候選列表中進行展示。為了滿足不同用戶的需求,可以設置不同的展示方式,例如可以將聯(lián)想詞條和匹配詞條分開進行展示,則所述預置的候選列表可以包括第一候選列表和第二候選列表,在第一候選列表中展示匹配詞條,在第二候選列表中展示聯(lián)想詞條,并且可以根據(jù)需要設置候選列表的位置以及設置展示詞條的數(shù)目等。參照圖4,示出了本發(fā)明的一種候選列表的展示示意圖,其中,第一候選列表位于第二候選列表的上方,在第一候選列表中展示了如下候選項:“中”、“找”、“最后”、“周”、“之后”;在第二候選列表中展示了如下候選項:“中國科學技術大學”、“中國科學技術”、“中國”。可以理解,在實際應用中,本領域技術人員可以根據(jù)需要靈活設置候選列表的數(shù)目和位置,本發(fā)明實施例對于候選列表的數(shù)目和位置不加以限制。在本發(fā)明的一種可選實施例中,所述方法還可以包括如下步驟:在所述候選列表中展示的候選項的數(shù)目達到預設閾值時,對未展示的候選項停止進行展示。在具體應用中,可以設置預設閾值來限制候選列表中可展示的候選項的數(shù)目。在本發(fā)明的一種應用示例中,候選列表包括第一候選列表和第二候選 列表,且設置第二候選列表的預設閾值為3,假設接收到的輸入串為“d”,且該輸入串的上文為“陳奕迅”,首先,輸入法程序通過查詢本地詞庫和/或云詞庫,得到輸入串“d”對應的匹配詞條包括:“的”、“對”、“到”、“等”,并且按照本發(fā)明實施例的排序方法,將上述匹配詞條排序后加入第一候選列表;然后,輸入法程序根據(jù)輸入串“d”和上文“陳奕迅”查詢本地緩存詞庫,得到對應的聯(lián)想詞條包括:“的歌”,“的演唱會”,按照本發(fā)明實施例的排序方法,將聯(lián)想詞條“的歌”和“的演唱會”排序后加入第二候選列表;接下來,輸入法程序根據(jù)輸入串“d”和上文“陳奕迅”查詢用戶詞庫,假設用戶詞庫中不存在以“d”開頭的聯(lián)想詞條,則繼續(xù)查詢系統(tǒng)詞庫,假設系統(tǒng)詞庫存在以“d”開頭的聯(lián)想詞條包括:“多少”、“都是”,按照本發(fā)明實施例的排序方法,將聯(lián)想詞條“多少”和“都是”排序后加入第二候選列表,由于第二候選列表中最多可顯示3個候選項,此時第二候選列表中候選項的數(shù)目已達到預置閾值,則可以停止后續(xù)從其它詞庫如細胞詞庫中取詞的過程。最后,將第一候選列表和第二候選列表展示給用戶,第一候選列表中包括如下候選項:“的”、“對”、“到”、“等”;第二候選列表中包括如下候選項:“的歌”,“的演唱會”,“多少”。綜上,本發(fā)明實施例可以按照預置的展示方式展示排序后的候選項,具體地,可以根據(jù)需要設置候選列表的位置以及設置展示詞條的數(shù)目,還可以設置候選列表中展示的候選項的數(shù)目,從而可以提高排序的靈活性和多樣性。需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發(fā)明實施例并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明實施例,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本發(fā)明實施例所必須的。裝置實施例參照圖5,示出了本發(fā)明的一種候選項的排序裝置實施例的結構框圖,具體可以包括如下模塊:詞長信息確定模塊501,用于確定輸入串對應候選項的詞長信息;及第一排序模塊502,用于依據(jù)所述候選項的詞長信息,對所述候選項進行排序。在本發(fā)明的一種可選實施例中,所述第一排序模塊,具體可以包括:得分計算子模塊,用于依據(jù)所述詞長信息,確定所述候選項對應的排序得分;其中,所述詞長信息與所述排序得分成正比關系;第一排序子模塊,用于依據(jù)所述排序得分,對所述候選項進行排序。在本發(fā)明的另一種可選實施例中,所述第一排序模塊,具體可以包括:詞長調整子模塊,用于在所述詞長信息超過詞長閾值時,將所述詞長信息調整為詞長閾值;第二排序子模塊,用于依據(jù)調整后的詞長信息,對所述候選項進行排序。在本發(fā)明的又一種可選實施例中,所述裝置還可以包括:第二排序模塊,用于依據(jù)所述輸入串對應候選項及其對應上下文的詞長信息,對所述候選項進行排序。在本發(fā)明的再一種可選實施例中,所述裝置還可以包括:第三排序模塊,用于依據(jù)所述候選項的詞長信息和詞頻信息,對所述候選項進行排序在本發(fā)明的再一種可選實施例中,所述輸入串對應候選項,具體可以包括:匹配詞條和/或聯(lián)想詞條。在本發(fā)明的再一種可選實施例中,所述裝置還可以包括:詞頻信息確定模塊,用于確定候選項對應詞條的詞頻信息;所述詞頻信息確定模塊,包括:第一確定子模塊,用于在本地緩存詞庫中,通過統(tǒng)計收集的語料中相鄰詞條的共同出現(xiàn)次數(shù),得到詞條對應的詞頻信息;和/或第二確定子模塊,用于在用戶詞庫中,通過統(tǒng)計收集的語料中各詞條的上屏次數(shù),得到詞條對應的詞頻信息;和/或第三確定子模塊,用于在系統(tǒng)詞庫和/或細胞詞庫中,通過計算收集的語 料中各詞條的輸入概率的自然對數(shù),得到詞條對應的詞頻信息。對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。關于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經在有關該方法的實施例中進行了詳細描述,此處將不做詳細闡述說明。圖6是根據(jù)一示例性實施例示出的一種用于候選項排序的裝置800的框圖。例如,裝置800可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設備,游戲控制臺,平板設備,醫(yī)療設備,健身設備,個人數(shù)字助理等。參照圖6,裝置800可以包括以下一個或多個組件:處理組件802,存儲器804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(i/o)的接口812,傳感器組件814,以及通信組件816。處理組件802通常控制裝置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關聯(lián)的操作。處理元件802可以包括一個或多個處理器820來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個或多個模塊,便于處理組件802和其他組件之間的交互。例如,處理組件802可以包括多媒體模塊,以方便多媒體組件808和處理組件802之間的交互。存儲器804被配置為存儲各種類型的數(shù)據(jù)以支持在設備800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(sram),電可擦除可編程只讀存儲器(eeprom),可擦除可編程只讀存儲器(eprom),可編程只讀存儲器(prom),只讀存儲器(rom),磁存儲器,快閃存儲器,磁盤或光盤。電源組件806為裝置800的各種組件提供電力。電源組件806可以包括 電源管理系統(tǒng),一個或多個電源,及其他與為裝置800生成、管理和分配電力相關聯(lián)的組件。多媒體組件808包括在所述裝置800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關的持續(xù)時間和壓力。在一些實施例中,多媒體組件808包括一個前置攝像頭和/或后置攝像頭。當設備800處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。音頻組件810被配置為輸出和/或輸入音頻信號。例如,音頻組件810包括一個麥克風(mic),當裝置800處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器804或經由通信組件816發(fā)送。在一些實施例中,音頻組件810還包括一個揚聲器,用于輸出音頻信號。i/o接口812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。傳感器組件814包括一個或多個傳感器,用于為裝置800提供各個方面的狀態(tài)評估。例如,傳感器組件814可以檢測到設備800的打開/關閉狀態(tài),組件的相對定位,例如所述組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測裝置800或裝置800一個組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應用中使用。在一些實施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳 感器。通信組件816被配置為便于裝置800和其他設備之間有線或無線方式的通信。裝置800可以接入基于通信標準的無線網絡,如wifi,2g或3g,或它們的組合。在一個示例性實施例中,通信組件816經由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關信息。在一個示例性實施例中,所述通信組件816還包括近場通信(nfc)模塊,以促進短程通信。例如,在nfc模塊可基于射頻識別(rfid)技術,紅外數(shù)據(jù)協(xié)會(irda)技術,超寬帶(uwb)技術,藍牙(bt)技術和其他技術來實現(xiàn)。在示例性實施例中,裝置800可以被一個或多個應用專用集成電路(asic)、數(shù)字信號處理器(dsp)、數(shù)字信號處理設備(dspd)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質,例如包括指令的存儲器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質可以是rom、隨機存取存儲器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲設備等。一種非臨時性計算機可讀存儲介質,當所述存儲介質中的指令由移動終端的處理器執(zhí)行時,使得移動終端能夠執(zhí)行一種候選項的排序方法,所述方法包括:確定輸入串對應候選項的詞長信息;依據(jù)所述候選項的詞長信息,對所述候選項進行排序。圖7是本發(fā)明實施例中服務器的結構示意圖。該服務器1900可因配置或性能不同而產生比較大的差異,可以包括一個或一個以上中央處理器(centralprocessingunits,cpu)1922(例如,一個或一個以上處理器)和存儲器1932,一個或一個以上存儲應用程序1942或數(shù)據(jù)1944的存儲介質1930(例如一個或一個以上海量存儲設備)。其中,存儲器1932和存儲介質1930可以是短暫存儲或持久存儲。存儲在存儲介質1930的程序可以包括一個或一個以上模塊(圖示沒標出),每個模塊可以包括對服務器中的一系列指令操作。更進一步地,中央處理器1922可以設置為與存儲介質1930通信,在服務器1900上執(zhí)行存儲介質1930中的一系列指令操作。服務器1900還可以包括一個或一個以上電源1926,一個或一個以上有線或無線網絡接口1950,一個或一個以上輸入輸出接口1958,一個或一個以上鍵盤1956,和/或,一個或一個以上操作系統(tǒng)1941,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。本領域技術人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實施方案。本發(fā)明旨在涵蓋本發(fā)明的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本
技術領域
中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權利要求指出。應當理解的是,本發(fā)明并不局限于上面已經描述并在附圖中示出的精確結構,并且可以在不脫離其范圍進行各種修改和改變。本發(fā)明的范圍僅由所附的權利要求來限制以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。以上對本發(fā)明所提供的一種候選項的排序方法、一種候選項的排序裝置和一種用于候選項排序的裝置,進行了詳細介紹,本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本發(fā)明的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發(fā)明的限制。當前第1頁12
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1