。可根據(jù)關(guān)鍵字分詞在查找到的群組文本資料中的距離來(lái) 計(jì)算緊鄰關(guān)系得分,比如若關(guān)鍵字分詞為ABC,群組名稱(chēng)為ADBC、ADDBC、ADBDC的得分各不 相同,因?yàn)锳DBC中A與B間隔一個(gè)字符D的距離,ADDBC中A與B間隔兩個(gè)字符D的距離, ADBDC中A與B以及B與C之間各間隔一個(gè)字符D的距離。然后可以根據(jù)計(jì)算獲得的命 中得分、占比得分、順序得分和緊鄰關(guān)系得分來(lái)綜合計(jì)算文本相關(guān)度,比如可以計(jì)算命中得 分、占比得分、順序得分和緊鄰關(guān)系得分的加權(quán)和或者加權(quán)平均值來(lái)作為文本相關(guān)度。
[0042]在一個(gè)實(shí)施例中,可以根據(jù)關(guān)鍵字分詞中的附屬連詞來(lái)調(diào)整順序得分。具體比如, 關(guān)鍵字為"深圳人在河南"與"河南人在深圳",或者"深圳的河南人"與"河南的深圳人"中, "在"和"的"這樣的附屬連詞前后的分詞具有一定的附屬關(guān)系,分詞順序強(qiáng)相關(guān),需要據(jù)此 來(lái)調(diào)整順序得分,以調(diào)整順序得分在計(jì)算文本相關(guān)度時(shí)的比重,從而使得文本相關(guān)度能夠 一定程度上真實(shí)反映用戶(hù)查找群組的需求。
[0043]在一個(gè)實(shí)施例中可以根據(jù)關(guān)鍵字分詞中的分隔符來(lái)調(diào)整緊鄰關(guān)系得分和順序得 分。具體比如,若關(guān)鍵字為"花園(空格)城",與"花園城"相比,因分隔符的存在,用戶(hù)表 達(dá)的查找需求是不同的,此時(shí)可降低緊鄰關(guān)系得分和順序關(guān)系得分,從而降低緊鄰關(guān)系得 分和順序關(guān)系得分在計(jì)算文本相關(guān)度時(shí)的比重。
[0044]步驟108,根據(jù)多個(gè)維度各自的排序優(yōu)先級(jí)別和每個(gè)查找到的群組所對(duì)應(yīng)每一維 度的排序值對(duì)查找到的群組進(jìn)行排序。
[0045] 多個(gè)維度中每個(gè)維度各自具有排序優(yōu)先級(jí)別,且每個(gè)維度的排序優(yōu)先級(jí)別高低各 不相同,排序優(yōu)先級(jí)別高的維度在排序時(shí)優(yōu)先被考慮。具體地,總體上按照排序優(yōu)先級(jí)別從 高到低的順序而根據(jù)相應(yīng)的維度的排序值對(duì)查找到的群組進(jìn)行排序,當(dāng)多個(gè)群組對(duì)應(yīng)同一 維度的排序值相同時(shí),再按照該多個(gè)群組對(duì)應(yīng)的排序優(yōu)先級(jí)別僅次于該同一維度的維度的 排序值來(lái)對(duì)該多個(gè)群組進(jìn)行局部排序。
[0046] 在一個(gè)實(shí)施例中,多個(gè)維度的排序因子中排序優(yōu)先級(jí)別最低的維度的排序因子包 括排序優(yōu)先級(jí)別非最低的各個(gè)維度的排序因子。排序優(yōu)先級(jí)別非最低的維度是指多個(gè)維度 中除去排序優(yōu)先級(jí)別最低的維度的維度。本實(shí)施例中,排序優(yōu)先級(jí)別最低的維度的排序因 子包括其他維度的排序因子,這樣在計(jì)算對(duì)應(yīng)排序優(yōu)先級(jí)別最低的維度的排序值時(shí),綜合 考慮了其它各個(gè)維度的排序因子,可以更全面反映用戶(hù)查找群組的真實(shí)需求,從而提高查 找群組的效率。
[0047] 步驟110,返回經(jīng)過(guò)排序的群組查找結(jié)果。
[0048] 具體地,對(duì)查找到的群組排序后,可根據(jù)排序后的群組生成經(jīng)過(guò)排序的群組相關(guān) 信息的列表,將該經(jīng)過(guò)排序的群組相關(guān)信息的列表返回給發(fā)起群組查找請(qǐng)求的客戶(hù)端。客 戶(hù)端顯示該群組相關(guān)信息的列表,檢測(cè)用戶(hù)對(duì)列表中群組相關(guān)信息的選定操作,根據(jù)檢測(cè) 到的選定操作確定待加入的群組,從而向服務(wù)器發(fā)起加入群組的請(qǐng)求。服務(wù)器響應(yīng)于該加 入群組的請(qǐng)求,從而執(zhí)行加入待加入的群組的操作。
[0049] 上述群組查找方法,先根據(jù)群組查找請(qǐng)求所攜帶的關(guān)鍵字來(lái)查找到與關(guān)鍵字匹配 的群組,然后對(duì)于每個(gè)查找到的群組分別計(jì)算其對(duì)應(yīng)多個(gè)維度中每一維度的排序值。多個(gè) 維度各自具有排序優(yōu)先級(jí)別,綜合考慮多個(gè)維度各自的排序優(yōu)先級(jí)別以及每個(gè)查找到的群 組所對(duì)應(yīng)每一維度的排序值,來(lái)對(duì)查找到的群組進(jìn)行排序,從而返回經(jīng)過(guò)排序的群組查找 結(jié)果。這樣用戶(hù)得到的群組查找結(jié)果體現(xiàn)了多個(gè)維度的排序優(yōu)先級(jí)別和每個(gè)維度的排序因 子,可以從多個(gè)角度對(duì)查找到的群組做全面的質(zhì)量估計(jì),將高質(zhì)量、與用戶(hù)需求更為貼近的 群組優(yōu)先推薦給用戶(hù),使用戶(hù)能夠快速查找到所需群組,從而提高了群組查找的效率。
[0050] 在一個(gè)實(shí)施例中,在計(jì)算排序值時(shí),對(duì)多個(gè)維度的排序因子中屬于判斷型的排序 因子采用二值化量化,和/或?qū)Χ鄠€(gè)維度的排序因子中屬于計(jì)數(shù)型的排序因子采用正相關(guān) 函數(shù)進(jìn)行量化,和/或?qū)Χ鄠€(gè)維度的排序因子中屬于區(qū)間值型的排序因子采用二次貝塞爾 曲線進(jìn)行量化。對(duì)排序因子進(jìn)行量化是為了統(tǒng)一排序值的取值范圍,使得各個(gè)排序值能夠 在相同基準(zhǔn)下比較。
[0051] 具體地,判斷型的排序因子是非此即彼的數(shù)據(jù)類(lèi)型,可二值化為排序值最大值和 排序值最小值兩個(gè)值。排序值最大值和排序值最小值分別是事先設(shè)定的對(duì)應(yīng)各個(gè)維度的排 序值的最大值和最小值。屬于判斷型的排序因子包括但不限于群組標(biāo)志位、群組管理員是 否在線、是否被舉報(bào)存在安全風(fēng)險(xiǎn)的群組安全屬性、經(jīng)服務(wù)器自動(dòng)分析而確定的群組是否 存在安全風(fēng)險(xiǎn)的群組安全屬性、是否為預(yù)設(shè)指定群組等。
[0052] 計(jì)數(shù)型的排序因子是數(shù)量逐漸累積的數(shù)據(jù)類(lèi)型,可采用正相關(guān)函數(shù)進(jìn)行量化,該 正相關(guān)函數(shù)的因變量隨著自變量的增大而增大。該正相關(guān)函數(shù)自變量的取值范圍為[0, +…),因變量的取值范圍為[排序值最小值,排序值最大值),自變量為0時(shí)該正相關(guān)函 數(shù)的因變量為排序值最小值,且該正相關(guān)函數(shù)的因變量隨著自變量的增大而逐漸逼近最大 值。屬于計(jì)數(shù)型的排序因子包括但不限于通過(guò)統(tǒng)計(jì)發(fā)言數(shù)量而獲得的群組活躍度。 a
[0053] 在一個(gè)實(shí)施例中,該正相關(guān)函數(shù)為(卜1:),),其中a為預(yù)設(shè)的排序值最大 值,f為可調(diào)因子,根據(jù)需要通過(guò)設(shè)定可調(diào)因子f?而調(diào)整該正相關(guān)函數(shù)的曲線趨勢(shì)。當(dāng)a=100,f=0. 35時(shí),該正相關(guān)函數(shù)的曲線如圖2所示。采用該正相關(guān)函數(shù)進(jìn)行量化,優(yōu)于直 接用線性函數(shù)進(jìn)行量化,因?yàn)樵撌褂迷摵瘮?shù)曲線當(dāng)自變量在值較小的一段范圍內(nèi)變化時(shí)因 變量變化明顯,通過(guò)調(diào)節(jié)f就可以使這一段范圍能夠就可能覆蓋計(jì)數(shù)型排序因子的數(shù)量主 要集中的區(qū)段。而超過(guò)這段范圍后,自變量變化對(duì)因變量變化的影響很小,從而可以避免數(shù) 量過(guò)大的異常數(shù)據(jù)的干擾。
[0054] 區(qū)間值型的排序因子是可劃分為一個(gè)或多個(gè)數(shù)值區(qū)段的數(shù)據(jù)類(lèi)型,包括但不限于 群組成員數(shù)量、群組成員容量、群組活躍等級(jí)、群組地理位置、加入群組的難易等級(jí)、群組資 料完整度、群組有效管理數(shù)、群組信息豐富度、群組關(guān)系稠密度、群組性別分布數(shù)據(jù)、群組年 齡分布數(shù)據(jù)和文本相關(guān)度。其中群組成員數(shù)量、群組成員容量、群組資料完整度、群組關(guān)系 稠密度和文本相關(guān)度也可以作為計(jì)數(shù)型排序因子而利用上述正相關(guān)函數(shù)進(jìn)行量化。
[0055] 對(duì)于區(qū)間值型的排序因子,可以采用二次貝塞爾曲線進(jìn)行量化。具體地二次貝塞 爾曲線量化公式為a-tyPc+sa-otPi+t2^,te[0,i]。其中p。的坐標(biāo)為(量化前最小 值,排序值最小值),己的坐標(biāo)為(量化前最大值,排序值最大值),Pi為可調(diào)坐標(biāo)點(diǎn),用于 調(diào)節(jié)二次貝塞爾曲線的形狀,可根據(jù)需要設(shè)定。二次貝塞爾曲線如圖3所示。
[0056] 在一個(gè)實(shí)施例中,區(qū)間值型排序因子也可以采用同計(jì)數(shù)型排序相同的正相關(guān)函數(shù) 進(jìn)行量化,性能略低于采用二次貝塞爾曲線進(jìn)行量化的性能,比如可采用上述正相關(guān)函數(shù)
進(jìn)行量化。
[0057] 在一個(gè)實(shí)施例中,步驟106包括步驟11)~步驟12):
[0058] 步驟11),根據(jù)排序優(yōu)先級(jí)別非最低的各個(gè)維度的排序因子分別計(jì)算每個(gè)查找到 的群組對(duì)應(yīng)每個(gè)排序優(yōu)先級(jí)別非最低的維度的排序值。
[0059] 排序優(yōu)先級(jí)別非最低的各個(gè)維度的排序因子可各不相同。若多個(gè)維度按照排序優(yōu) 先級(jí)別從高到低分別為第一維度、第二維度、第三維度和第四維度,那么第一、第二和第三 維度為排序優(yōu)先級(jí)別非最低的各個(gè)維度,此時(shí)分別計(jì)算每個(gè)查找到的群組對(duì)應(yīng)第一維度、 對(duì)應(yīng)第二維度和對(duì)應(yīng)第三維度的排序值。
[0060] 步驟12),根據(jù)每個(gè)查找到的群組所對(duì)應(yīng)排序優(yōu)先級(jí)別非最低的各個(gè)維度的排序 值的加權(quán)和以及排序優(yōu)先級(jí)別最低的維度的排序因子計(jì)算每個(gè)查找到的群組所對(duì)應(yīng)排序 優(yōu)先級(jí)別最低的維度的排序值。
[0061] 具體地,可將每個(gè)查找到的群組對(duì)應(yīng)第一、第二和第三維度的排序值進(jìn)行加權(quán)求 和,并結(jié)合排序優(yōu)先級(jí)別最低的維度的排序因子來(lái)計(jì)算該查找到的群組所對(duì)應(yīng)第四維度的 排序值。本實(shí)施例中,計(jì)算對(duì)應(yīng)排序優(yōu)先級(jí)別最低的維度的排序值時(shí),綜合考慮了對(duì)應(yīng)其它 各個(gè)維度的排序值,可以更全面反映用戶(hù)查找群組的真實(shí)需求,從而提高查找群組的效率。
[0062] 在一個(gè)實(shí)施例中,該群組查找方法還包括:當(dāng)檢測(cè)到查找到的群組當(dāng)前與排序因 子相關(guān)的群組屬性與已記錄的相應(yīng)群組屬性不一致時(shí),減少與不一致的群組屬性相關(guān)的排 序因子對(duì)應(yīng)的排序值在計(jì)算加權(quán)和時(shí)的權(quán)重。
[0063] 本實(shí)施例中,在步驟12)之前,檢測(cè)查找到的群組當(dāng)前與排序因子相關(guān)的群組屬 性是否與已記錄的相應(yīng)群組屬性不一致,若是則減少該群組屬性相關(guān)的排序因子的維度所 對(duì)應(yīng)的排序值來(lái)計(jì)算加權(quán)和。當(dāng)前是指執(zhí)行該步驟的當(dāng)下,已記錄的群組屬性是指服務(wù)器 上存儲(chǔ)的歷史群組屬性。比如若一個(gè)維度的排序因子為同城排序,在判斷是否同城時(shí)需要 利用發(fā)起群組查找請(qǐng)求的終端的地理位置和查找到的群組的群組地理位置。在計(jì)算排序優(yōu) 先級(jí)別最低的維度的排序值前,判斷該查找到的群組的群組地理位置是否與已記錄的群組 管理員標(biāo)定的地理位置不一致,若不一致則降低同城排序的維度所對(duì)應(yīng)的排序值在計(jì)算排 序優(yōu)先級(jí)別最低的維度對(duì)應(yīng)的排序值時(shí)的比重。本實(shí)施例中,與排序因子相關(guān)的群組屬性 與已記錄的相應(yīng)群組屬性不一致,說(shuō)明該群組屬性不可靠,因此需要降低其比重以保證排 序優(yōu)先級(jí)別最低的維度對(duì)應(yīng)的排序值能夠更加準(zhǔn)確反映出群組的綜合質(zhì)量,使得最終的排 序結(jié)果更加準(zhǔn)確,從而提高查找群組的效率。
[0064]如圖4所示,在一個(gè)實(shí)施例中,步驟108具體包括步驟402~步驟404 :
[0065] 步驟402,根據(jù)多個(gè)維度各自的排序優(yōu)先級(jí)別、排序優(yōu)先級(jí)別非最高的各個(gè)維度所 對(duì)應(yīng)的排序值最大值和查找到的群組的對(duì)應(yīng)每一維度的排序值分別計(jì)算每個(gè)查找到的群 組所對(duì)應(yīng)的歸一化排序值。
[0066] 排序優(yōu)先級(jí)別非最高的各個(gè)維度所對(duì)應(yīng)的排序值最大值是事先設(shè)定的對(duì)應(yīng)該維 度的排序值數(shù)值的最大取值。對(duì)查找到的群組的對(duì)應(yīng)每一維度的排序值結(jié)合多個(gè)維度各自 的排序優(yōu)先級(jí)別進(jìn)行歸一化處理獲得歸一化排序值,該歸一化排序值能夠同時(shí)體現(xiàn)多個(gè)維 度各自的排序優(yōu)先級(jí)別和對(duì)應(yīng)每一維度的排序值。具體地,排序優(yōu)先級(jí)別非最低的各個(gè)維 度所對(duì)應(yīng)的排序值的增量導(dǎo)致的歸一化排序值的增量大于僅次于該維度的維度所對(duì)應(yīng)的 排序值最大值。這樣歸一化排序值就能夠直接體現(xiàn)多個(gè)維度各自的排序優(yōu)先級(jí)別。
[0067]更具體地,可使用公式
來(lái)計(jì)算查找到的群 組所對(duì)應(yīng)的歸一化排序值。其中scoretotal為歸一化排序值;N為維度數(shù)量;scorei為當(dāng)按 照維度的排序優(yōu)先級(jí)別從高到低的順序?qū)個(gè)維度排序時(shí),查找到的群組的第i個(gè)維度所 對(duì)應(yīng)的排序值;max1+1則