一種數(shù)據(jù)處理方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種數(shù)據(jù)處理方法和系統(tǒng)。其方法包括:采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息以聚合成一糾錯(cuò)信息集合;從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合;從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。本發(fā)明解決了驗(yàn)證已發(fā)送給用戶的信息以提高發(fā)送給用戶的信息的準(zhǔn)確性的問題,進(jìn)而還減輕了服務(wù)器數(shù)據(jù)處理壓力。
【專利說明】一種數(shù)據(jù)處理方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)處理領(lǐng)域,更具體地涉及一種數(shù)據(jù)處理方法和系統(tǒng)。
【背景技術(shù)】
[0002]服務(wù)器可以收集與用戶有關(guān)的預(yù)測信息或?qū)崟r(shí)信息,并有針對性地向用戶提供(推送)這些信息以作參考,即提供發(fā)布信息。但由于收集的信息可能存在錯(cuò)誤或誤差,使得提供給用戶的發(fā)布信息的內(nèi)容與實(shí)際情況不符,而服務(wù)器也不能對信息的準(zhǔn)確性進(jìn)行驗(yàn)證,導(dǎo)致這些信息失去了對用戶的參考作用。
[0003]以向用戶發(fā)布天氣信息為例,氣象臺可以通過衛(wèi)星、雷達(dá)等手段來采集用戶所處位置的氣象數(shù)據(jù),如:溫度、濕度、氣壓、風(fēng)向、風(fēng)力、海拔等參數(shù),氣象數(shù)據(jù)經(jīng)過大型計(jì)算機(jī)模型計(jì)算后,可以得出用戶所處位置的預(yù)報(bào)天氣和實(shí)況天氣。氣象發(fā)布服務(wù)器收集這些預(yù)報(bào)天氣和實(shí)況天氣,并作為發(fā)送給對應(yīng)的用戶的提示性信息,以給用戶用作參考。但是天氣現(xiàn)象瞬息萬變導(dǎo)致氣象數(shù)據(jù)隨之改變,氣象數(shù)據(jù)的變化可能會造成計(jì)算出不同的預(yù)報(bào)天氣和實(shí)況天氣,并且向用戶發(fā)送預(yù)報(bào)天氣和實(shí)況天氣還存在一定的延時(shí),會出現(xiàn)用戶得到的預(yù)報(bào)天氣和實(shí)況天氣與其所處位置的實(shí)際天氣情況不符等問題,導(dǎo)致該預(yù)報(bào)天氣和實(shí)況天氣準(zhǔn)確性較低,而氣象臺并不能及時(shí)發(fā)現(xiàn)并更正該預(yù)報(bào)天氣和實(shí)況天氣。
【發(fā)明內(nèi)容】
[0004]鑒于上述缺陷,本發(fā)明提供一種數(shù)據(jù)處理方法、系統(tǒng)和裝置??梢越鉀Q現(xiàn)有技術(shù)無法驗(yàn)證已發(fā)送給用戶的信息的準(zhǔn)確性的問題,以提高發(fā)送給用戶的信息的準(zhǔn)確性。進(jìn)一步,還可以解決減輕服務(wù)器數(shù)據(jù)處理壓力的問題。
[0005]為了解決上述技術(shù)問題,本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn):
[0006]一種數(shù)據(jù)處理方法,其中,包括:采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息;將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合;從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合;從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。
[0007]其中,采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息,包括:連續(xù)兩次采集相同用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。
[0008]其中,從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,包括:根據(jù)所述候選信息的位置特征值和內(nèi)容特征值,從一個(gè)或多個(gè)作為備用的發(fā)布信息中,匹配出具有與所述候選信息的位置特征值相同的位置特征值、同時(shí)具有與所述候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
[0009]其中,將該集合中的糾錯(cuò)信息作為候選信息,以匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,包括:將具有相同的位置特征值的所述預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合;根據(jù)所述候選信息的位置特征值,從所述一個(gè)或多個(gè)備用信息集合中,查找到具有與所述候選信息的位置特征值相同的位置特征值的備用信息集合;根據(jù)所述候選信息的內(nèi)容特征值與查找到的該備用信息集合中的發(fā)布信息的內(nèi)容特征值進(jìn)行匹配,找到與所述候選信息的內(nèi)容特征值相同或最接近的備用的發(fā)布信息,以作為匹配上的發(fā)布信息。
[0010]其中,內(nèi)容特征值還包括:一個(gè)或多個(gè)狀態(tài);如果所述候選信息與備用的發(fā)布信息的內(nèi)容特征值相同且其狀態(tài)相同、或者內(nèi)容特征值相同且其狀態(tài)最接近、或者內(nèi)容特征值最接近,則所述備用的發(fā)布信息作為匹配上的發(fā)布信息;和/或,如果存在多個(gè)匹配上的發(fā)布信息時(shí),選擇其中發(fā)布信息的來源的信用值最高的發(fā)布信息作為匹配上的發(fā)布信息;其中,來源的所述信用值,根據(jù)該來源提供的作為備用的發(fā)布信息在歷史上作為匹配上的發(fā)布信息的次數(shù)的多少確定,次數(shù)越多則信用值越高;每作為匹配上的發(fā)布信息一次,則該發(fā)布信息的來源的信用值被更新。
[0011]一種數(shù)據(jù)處理系統(tǒng),其中,包括:采集模塊,采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息;第一聚合模塊,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合;選取模塊,從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合;匹配模塊,從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。
[0012]其中,采集模塊,包括:連續(xù)兩次采集相同用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。
[0013]其中,匹配模塊,包括:根據(jù)所述候選信息的位置特征值和內(nèi)容特征值,從一個(gè)或多個(gè)作為備用的發(fā)布信息中,匹配出具有與所述候選信息的位置特征值相同的位置特征值、同時(shí)具有與所述候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
[0014]其中,還包括:第二聚合模塊,將具有相同的位置特征值的所述預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合;并且,所述匹配模塊包括--第一匹配子模塊,根據(jù)所述候選信息的位置特征值,從所述一個(gè)或多個(gè)備用信息集合中,查找到具有與所述候選信息的位置特征值相同的位置特征值的備用信息集合;第二匹配子模塊,根據(jù)所述候選信息的內(nèi)容特征值與查找到的該備用信息集合中的發(fā)布信息的內(nèi)容特征值進(jìn)行匹配,找到與所述候選信息的內(nèi)容特征值相同或最接近的備用的發(fā)布信息,以作為匹配上的發(fā)布信息。
[0015]其中,內(nèi)容特征值還包括:一個(gè)或多個(gè)狀態(tài);如果所述候選信息與備用的發(fā)布信息的內(nèi)容特征值相同且其狀態(tài)相同、或者內(nèi)容特征值相同且其狀態(tài)最接近、或者內(nèi)容特征值最接近,則所述備用的發(fā)布信息作為匹配上的發(fā)布信息;和/或,匹配模塊還包括:如果存在多個(gè)匹配上的發(fā)布信息時(shí),選擇其中發(fā)布信息的來源的信用值最高的發(fā)布信息作為匹配上的發(fā)布信息;其中,來源的所述信用值,根據(jù)該來源提供的作為備用的發(fā)布信息在歷史上作為匹配上的發(fā)布信息的次數(shù)的多少確定,次數(shù)越多則信用值越高;每作為匹配上的發(fā)布信息一次,則該發(fā)布信息的來源的信用值被更新。[0016]與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案存在以下有益效果:
[0017]本發(fā)明通過用戶針對其接收的發(fā)布信息而上傳的糾錯(cuò)信息所反映當(dāng)前實(shí)際情況的信息,確定發(fā)送給用戶的各種發(fā)布信息(包括:實(shí)時(shí)信息、預(yù)測信息)是否與實(shí)際情況發(fā)生偏離,并利用收集的備用的多個(gè)可以發(fā)送給用戶的發(fā)布信息中最符合該當(dāng)前實(shí)際情況的信息,替換發(fā)生偏離的用戶接收的發(fā)布信息。以此來提高用戶收到的發(fā)布信息的正確性。
[0018]其中,本發(fā)明服務(wù)器連續(xù)兩次采集同一用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔,還可以避免用戶不斷的向服務(wù)器發(fā)送糾錯(cuò)信息,導(dǎo)致服務(wù)器數(shù)據(jù)處理壓力高的問題,以減輕服務(wù)器處理壓力。
[0019]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【專利附圖】
【附圖說明】
[0020]此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0021]圖1是根據(jù)本發(fā)明一實(shí)施例的數(shù)據(jù)處理方法的流程圖;
[0022]圖2是根據(jù)本發(fā)明一實(shí)施例的數(shù)據(jù)處理系統(tǒng)的結(jié)構(gòu)圖;
[0023]圖3是根據(jù)本發(fā)明的一實(shí)施例的更具體的數(shù)據(jù)處理方法的流程圖;以及
[0024]圖4是根據(jù)本發(fā)明一實(shí)施例的糾錯(cuò)信息集合示意圖。
【具體實(shí)施方式】
[0025]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0026]如圖1所示,為本發(fā)明的一實(shí)施例的數(shù)據(jù)處理方法的流程圖。其包括,步驟S110,采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息;步驟S120,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合;步驟S130,從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合;步驟140,從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。
[0027]由此,依據(jù)上述實(shí)施例的方式進(jìn)行數(shù)據(jù)處理,向用戶傳播/傳送發(fā)布信息的服務(wù)器,可以與獲得發(fā)布信息的用戶之間進(jìn)行交互,實(shí)現(xiàn)對發(fā)布信息的糾錯(cuò)。該服務(wù)器可以采集到用戶在收到該服務(wù)器傳來的發(fā)布信息后,向該服務(wù)器上報(bào)的反饋數(shù)據(jù),即糾錯(cuò)信息。這些糾錯(cuò)信息與該發(fā)布信息對應(yīng),都包含了描述信息內(nèi)容所適用的地理位置、區(qū)域的信息即位置特征,如:信息內(nèi)容涉及的區(qū)域指示為“XX市”、“XX區(qū)”、“XXX縣”等,還包含了描述信息內(nèi)容中主要給用戶參考使用的信息即內(nèi)容特征,如:“晴天”、“大雨”、“西北風(fēng)”等。其中,該服務(wù)器連續(xù)兩次采集同一個(gè)用戶上報(bào)反饋的糾錯(cuò)信息的時(shí)間間隔要超過一個(gè)預(yù)先設(shè)定的時(shí)間間隔,即不在過短的時(shí)間間隔中連續(xù)兩次采集同一個(gè)用戶上報(bào)的糾錯(cuò)信息,以避免惡意上報(bào)增加服務(wù)器壓力。進(jìn)而,該服務(wù)器可以將采集的這些糾錯(cuò)信息進(jìn)行劃分,其中,可以將位置特征值相同并且內(nèi)容特征值也相同的糾錯(cuò)信息聚合到一起,形成糾錯(cuò)信息集合如圖4所示,集合1、集合2、集合3等。再從這些集合中,將位置特征值相同的幾個(gè)集合中的糾錯(cuò)信息的數(shù)量做比較,選取數(shù)量最大的并且超過預(yù)設(shè)閾值的集合。在選取的集合中,可以提取任一個(gè)糾錯(cuò)信息,作為候選信息,利用候選信息的位置特征和內(nèi)容特征去與該服務(wù)器預(yù)先收集的、可以替換之前發(fā)給用戶的發(fā)布信息的其他發(fā)布信息做匹配,一旦匹配上,就將匹配上的發(fā)布信息發(fā)送給用戶。從而糾正之前發(fā)給用戶的存在錯(cuò)誤或誤差的發(fā)布信息,以實(shí)現(xiàn)發(fā)布信息的糾錯(cuò)、使得傳播的信息更準(zhǔn)確,更有價(jià)值于用戶參考或使用。
[0028]依據(jù)本發(fā)明的上述一個(gè)實(shí)施例,其利用用戶根據(jù)實(shí)際情況對獲得的發(fā)布信息做出的糾錯(cuò)反饋,與預(yù)先收集的作為許多備用的發(fā)布信息如:實(shí)時(shí)信息和/或預(yù)測信息,進(jìn)行匹配,找到完全相符或最接近于用戶反饋的糾錯(cuò)情況的備用的發(fā)布信息,以便將找到的該信息發(fā)送給用戶,更新原來發(fā)給用戶的與實(shí)際情況不相符的發(fā)布信息。本發(fā)明通過該方式以此來提高用戶收到的各種發(fā)布信息,如:實(shí)時(shí)信息和預(yù)測信息等的正確性。使提供給用戶的發(fā)布信息的參考價(jià)值得以體現(xiàn)。
[0029]在本發(fā)明中,對涉及的名詞的說明:
[0030]發(fā)布信息,指發(fā)布或推送給用戶的各種實(shí)時(shí)信息或預(yù)測信息,以便用戶參考使用。
[0031]實(shí)時(shí)信息:根據(jù)一個(gè)或多個(gè)參數(shù)計(jì)算出的具有時(shí)效性的信息,至少包括兩類特征即位置特征和內(nèi)容特征,對應(yīng)各特征的值即位置特征值和內(nèi)容特征值。
[0032]預(yù)測信息:根據(jù)一個(gè)或多個(gè)參數(shù)計(jì)算出的具有時(shí)效性的預(yù)測性的信息,至少包括兩類特征即位置特征和內(nèi)容特征,對應(yīng)各特征的值即位置特征值和內(nèi)容特征值。
[0033]位置特征:發(fā)布信息(具體如:實(shí)時(shí)信息、預(yù)測信息)中,能指示該發(fā)布信息的內(nèi)容所針對的地理位置(區(qū)域)的信息。
[0034]內(nèi)容特征:發(fā)布信息(具體如:實(shí)時(shí)信息、預(yù)測信息)中,能指示該發(fā)布信息的內(nèi)容中主要給用戶參考用或使用的信息。
[0035]備用信息即后備信息:預(yù)先收集的作為后備使用、以待替換之前已發(fā)送給用戶的發(fā)布信息的發(fā)布信息(如:實(shí)時(shí)信息和/或預(yù)測信息)。
[0036]備用信息集合:位置特征值相同的后備用的發(fā)布信息的集合,即具有相同的位置特征值的備用信息的集合。
[0037]糾錯(cuò)信息:當(dāng)用戶獲得的發(fā)布信息,如實(shí)時(shí)信息和/或預(yù)測信息,與實(shí)際不符時(shí),由用戶根據(jù)實(shí)際情況上報(bào)(如上報(bào)給服務(wù)器)的糾正錯(cuò)誤的信息,上報(bào)的糾錯(cuò)信息可以包括兩類特征即位置特征和內(nèi)容特征,對應(yīng)各特征的值即位置特征值和內(nèi)容特征值。
[0038]進(jìn)一步,位置特征可以有下一級的位置特征,而內(nèi)容特征值可以對應(yīng)有一個(gè)或多個(gè)狀態(tài)。
[0039]為了更好的理解本發(fā)明,以發(fā)布天氣信息為例對本發(fā)明進(jìn)行說明。
[0040]實(shí)時(shí)信息可以是實(shí)況天氣,該實(shí)況天氣是根據(jù)收集的氣象信息計(jì)算出某一地點(diǎn)正在發(fā)生的天氣。計(jì)算出的實(shí)況天氣可被服務(wù)器收集。例如:北京地區(qū)的當(dāng)前天氣為小雨;其位置特征即地點(diǎn),位置特征值為“北京地區(qū)”;其內(nèi)容特征即天氣,內(nèi)容特征值為“雨”,內(nèi)容特征值的狀態(tài)為“小”。
[0041]預(yù)測信息可以是預(yù)報(bào)天氣,該預(yù)報(bào)天氣是根據(jù)收集的氣象信息預(yù)測的某一地點(diǎn)的天氣。計(jì)算出的預(yù)報(bào)天氣可被服務(wù)器收集。例如:北京地區(qū)明天的天氣為晴;其位置特征即地點(diǎn),位置特征值為“北京地區(qū)”;其內(nèi)容特征即天氣,內(nèi)容特征值為“晴”,該特征值的狀態(tài)
U 丁.,,
尤O
[0042]備用信息可以是服務(wù)器實(shí)時(shí)地獲取一個(gè)或多個(gè)氣象臺測算的實(shí)況天氣和/或預(yù)報(bào)天氣,這些實(shí)況天氣/預(yù)報(bào)天氣作為服務(wù)器預(yù)先收集的用以后備使用的實(shí)況天氣/預(yù)報(bào)天氣。并且,按照位置特征值,如地點(diǎn),劃分出相應(yīng)的集合。
[0043]一個(gè)或多個(gè)氣象臺測算的實(shí)況天氣和/或預(yù)報(bào)天氣例如:北京氣象臺測算出北京地區(qū)當(dāng)前天氣為晴,國家氣象臺測算出北京地區(qū)的當(dāng)前天氣為多云,上海氣象臺測算出北京地區(qū)的當(dāng)前天氣為微風(fēng),國家氣象臺測算出上海地區(qū)的當(dāng)前天氣為晴,北京氣象臺測算出上海地區(qū)的當(dāng)前天氣為多云??梢詫⑽恢锰卣髦禐椤氨本┑貐^(qū)”的“北京地區(qū)當(dāng)前天氣為晴”、“北京地區(qū)的當(dāng)前天氣為多云”和“北京地區(qū)的當(dāng)前天氣為微風(fēng)”都作為北京地區(qū)天氣的備用的實(shí)況天氣和/或預(yù)報(bào)天氣,即一個(gè)備用信息集合;將位置特征值為“上海地區(qū)”的“上海地區(qū)的當(dāng)前天氣為晴”、“上海地區(qū)的當(dāng)前天氣為多云”都作為上海地區(qū)天氣的備用的實(shí)況天氣和/或預(yù)報(bào)天氣,即另一個(gè)備用信息集合。
[0044]糾錯(cuò)信息可以是用戶由于收到發(fā)布給其的某一地點(diǎn)的實(shí)況天氣或預(yù)報(bào)天氣與該地點(diǎn)的當(dāng)前實(shí)際的天氣狀況不符,而根據(jù)該地點(diǎn)的實(shí)際天氣情況提出的糾正錯(cuò)誤天氣情況的信息,即糾錯(cuò)天氣。例如:用戶所處的地點(diǎn)當(dāng)天天氣實(shí)際是小雨,而用戶收到的發(fā)布給其的天氣預(yù)報(bào)為該地點(diǎn)當(dāng)天晴,則天氣預(yù)報(bào)與用戶的體驗(yàn)的實(shí)際天氣狀況不符,用戶可以向服務(wù)器發(fā)送所處地點(diǎn)的天氣“小雨”作為“晴”的糾錯(cuò)天氣。
[0045]進(jìn)一步地,實(shí)況天氣、預(yù)報(bào)天氣、作為備用的實(shí)況天氣/預(yù)報(bào)天氣、糾錯(cuò)天氣均包括:地域(位置特征)和天氣(內(nèi)容特征)。其中,地域值(位置特征值)可以是北京地區(qū)、天津地區(qū)、上海地區(qū)等;天氣值(內(nèi)容特征值)可以是雨、晴、風(fēng)等。
[0046]進(jìn)一步地,地域值還可以包括下一級的區(qū)域如:北京地區(qū)還可以包括海淀區(qū)、朝陽區(qū)等。天氣值還可以包括該對應(yīng)天氣的一個(gè)或多個(gè)狀態(tài),如:雨可以包括小、中、大等狀態(tài),風(fēng)狀態(tài)可以包括大、微等狀態(tài)。天氣值也可以無具體的狀態(tài),如:內(nèi)容特征值為晴、陰等可以沒有具體的狀態(tài)。
[0047]圖1是根據(jù)本發(fā)明一實(shí)施例的更具體的數(shù)據(jù)處理方法的流程圖。
[0048]在步驟S310處,預(yù)先收集作為備用的發(fā)布信息。
[0049]可以由服務(wù)器實(shí)時(shí)地獲取各個(gè)計(jì)算出的實(shí)時(shí)信息和/或預(yù)測信息,以便收集起來。這些實(shí)時(shí)信息和/或預(yù)測信息,都作為預(yù)先收集的備用的發(fā)布信息,可以選擇其中一個(gè)發(fā)布給用戶。該服務(wù)器是向用戶傳播可供用戶參考或使用的信息內(nèi)容的服務(wù)器,即向用戶傳播發(fā)布信息的服務(wù)器。實(shí)時(shí)信息和預(yù)測信息可以是由計(jì)算機(jī)(各種具有計(jì)算性能的主機(jī)),將得到的地理區(qū)域的參數(shù)、環(huán)境參數(shù)(如氣象參數(shù):風(fēng)力、溫度、風(fēng)向、濕度、雨、晴等)等,進(jìn)行計(jì)算而獲得。服務(wù)器可以從這些計(jì)算機(jī)中獲取計(jì)算出的實(shí)時(shí)信息和預(yù)測信息,作為發(fā)布信息提供給用戶參考或使用。
[0050]其中,每個(gè)發(fā)布信息,可以包括兩類特征:位置特征和內(nèi)容特征,對應(yīng)相應(yīng)的位置特征值和內(nèi)容特征值,即每個(gè)發(fā)布信息具有位置特征值和內(nèi)容特征值。
[0051]在一個(gè)實(shí)施方式中,可以將具有相同的位置特征值的預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合。每個(gè)備用信息集合具有同樣的位置特征值。每個(gè)備用信息集合包含一個(gè)或多個(gè)位置特征值相同、而內(nèi)容特征值相同或不同的作為備用的發(fā)布信息。
[0052]以發(fā)布天氣為例,發(fā)布?xì)庀蟮姆?wù)器實(shí)時(shí)獲取各個(gè)氣象臺測算的實(shí)況天氣和/或預(yù)報(bào)天氣,將這些來自各個(gè)氣象臺測算的實(shí)況天氣和預(yù)報(bào)天氣收集起來,作為一個(gè)或多個(gè)備用的發(fā)布天氣。每個(gè)發(fā)布天氣至少包括地域值(位置特征值)、天氣值(內(nèi)容特征值)兩部分。
[0053]進(jìn)一步,可以將具有相同地域值的實(shí)況天氣或預(yù)報(bào)天氣進(jìn)行聚合,將聚合得到的具有相同地域值的實(shí)況天氣或預(yù)報(bào)天氣的集合作為備用實(shí)況天氣或預(yù)報(bào)天氣集合,因而,備用天氣集合中的實(shí)況天氣或預(yù)報(bào)天氣都具有相同地域值。例如:服務(wù)器收集的所有實(shí)況天氣/預(yù)報(bào)天氣,可以按照將地域值為北京地區(qū)的實(shí)況天氣/預(yù)報(bào)天氣聚合一起,形成一個(gè)備用天氣集合X,將地域值為天津地區(qū)的實(shí)況天氣/預(yù)報(bào)天氣聚合一起,形成另一個(gè)備用天氣集合Y。
[0054]其中,可以預(yù)定一個(gè)默認(rèn)的氣象臺,服務(wù)器將采集的該氣象臺測算的實(shí)況天氣/預(yù)報(bào)天氣按照預(yù)定規(guī)則發(fā)送給用戶。該預(yù)定規(guī)則,可以發(fā)布實(shí)況天氣或預(yù)報(bào)天氣的時(shí)間規(guī)貝U,如:在預(yù)定某時(shí)刻發(fā)送,或者每隔預(yù)定時(shí)間間隔發(fā)送,或者在用戶更新天氣時(shí)發(fā)送。
[0055]在步驟S320處,采集來自用戶上報(bào)的糾錯(cuò)信息。
[0056]具體的,用戶會針對接收到的發(fā)布信息,對比實(shí)際情況,若發(fā)布信息與實(shí)際情況不符,則用戶可以向服務(wù)器上報(bào)(反饋)針對該發(fā)布信息的糾錯(cuò)信息。服務(wù)器采集到的來自一個(gè)或多個(gè)這樣的用戶上報(bào)的糾錯(cuò)信息。這些糾錯(cuò)信息,每個(gè)都包括位置特征、內(nèi)容特征,以及相應(yīng)的位置特征值、內(nèi)容特征值。
[0057]例如:用戶收到發(fā)布的天氣存在錯(cuò)誤,則用戶向服務(wù)器發(fā)送用于糾正錯(cuò)誤天氣的糾錯(cuò)天氣,由服務(wù)器采集(接收)到,該糾錯(cuò)天氣包括地域即位置特征和天氣即內(nèi)容特征。用戶發(fā)送糾錯(cuò)天氣,一個(gè)例子:北京地區(qū)的用戶收到發(fā)布的實(shí)況天氣是小雨,而北京地區(qū)的當(dāng)前天氣實(shí)際為晴,則該用戶可以在其客戶端顯示北京地區(qū)天氣的界面中輸入真實(shí)的天氣“晴”,并上報(bào)服務(wù)器。服務(wù)器采集來自該用戶上報(bào)的糾錯(cuò)天氣,該糾錯(cuò)天氣具有位置特征值“北京地區(qū)”和內(nèi)容特征值“晴”。
[0058]進(jìn)一步地,可以預(yù)設(shè)時(shí)間間隔閾值,以保證服務(wù)器連續(xù)兩次采集到同一個(gè)用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。設(shè)定該采集時(shí)間間隔閾值,可以避免同一個(gè)用戶不斷、反復(fù)向服務(wù)器發(fā)送糾錯(cuò)信息,造成服務(wù)器數(shù)據(jù)處理壓力。例如:用戶惡意攻擊服務(wù)器,連續(xù)向服務(wù)器發(fā)送大量的糾錯(cuò)天氣,降低服務(wù)器的數(shù)據(jù)處理能力,甚至?xí)斐煞?wù)器癱瘓,無法正常為用戶提供天氣提示服務(wù)。
[0059]具體地,可以在用戶用來上報(bào)糾錯(cuò)信息的客戶端中預(yù)先設(shè)定一時(shí)間間隔閾值,如30分鐘。同一個(gè)用戶“甲”,在當(dāng)天13:00上報(bào)了 一次糾錯(cuò)天氣,接著“甲”又在13:40上報(bào)了一次糾錯(cuò)天氣,兩次上報(bào)糾錯(cuò)天氣的時(shí)間大于或等于該預(yù)定時(shí)間間隔閾值30分鐘,才能夠正常上報(bào)糾錯(cuò)天氣即服務(wù)器才會去采集第二次上報(bào)的糾錯(cuò)天氣。否則,在第一次上報(bào)糾錯(cuò)天氣后,若“甲”在13:10第二次上報(bào)糾錯(cuò)天氣,由于小于該閾值30分鐘的時(shí)間間隔,就無法第二次上報(bào)糾錯(cuò)天氣。這樣,服務(wù)器采集同一用戶兩次上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔,能防止惡意的上報(bào)行為對服務(wù)器造成的負(fù)擔(dān)。
[0060]在步驟S330處,聚合具有相同位置特征值和內(nèi)容特征值的糾錯(cuò)信息,以形成糾錯(cuò)信息集合。
[0061]具體而言,向用戶發(fā)送發(fā)布信息的服務(wù)器可以采集一個(gè)或多個(gè)用戶上報(bào)的糾錯(cuò)信息,每個(gè)糾錯(cuò)信息具有位置特征值和內(nèi)容特征值,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合,由此,可以得到一個(gè)或多個(gè)具有同樣的位置特征值、同時(shí)具有同樣的內(nèi)容特征值的糾錯(cuò)信息的集合,即糾錯(cuò)信息集合(糾錯(cuò)集合),糾錯(cuò)信息集合也包括該同樣的位置特征值、內(nèi)容特征值。如圖4所示,用戶1、2……n-l、n,上報(bào)了糾錯(cuò)信息,將糾錯(cuò)信息中位置特征的特征值相同即同為BJ并且內(nèi)容特征的特征值相同即同為“晴”的來自用戶1、2、4的糾錯(cuò)信息,聚合到集合I中;將糾錯(cuò)信息中位置特征值相同即為BJ并且內(nèi)容特征值相同為“小雨”的來自用戶3、5的糾錯(cuò)信息,聚合到集合2中;將糾錯(cuò)信息中位置特征值同為TJ并且內(nèi)容特征值相同為“中雨”的來自用戶6、η-1、η的糾錯(cuò)信息,聚合到集合3中;……以此類推。
[0062]例如:服務(wù)器采集到38條糾錯(cuò)天氣,有20個(gè)糾錯(cuò)天氣都是指“北京地區(qū)”和天氣“晴”,則聚合這些糾錯(cuò)天氣,得到北京地區(qū)為晴的糾錯(cuò)天氣的集合I ;有3個(gè)糾錯(cuò)天氣都是指“北京地區(qū)”和天氣“陰”,則聚合這些糾錯(cuò)天氣,得到北京地區(qū)為陰的糾錯(cuò)天氣的集合II ;有15個(gè)糾錯(cuò)天氣都是“天津地區(qū)”和天氣“小雨”,則聚合得到天津地區(qū)為小雨的糾錯(cuò)天氣的集合III。這樣,可以獲得大量用戶反映的同一地點(diǎn)的真實(shí)天氣情況。
[0063]在步驟S340處,從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合。
[0064]可以在各個(gè)具有相同位置特征值的糾錯(cuò)信息集合中,將各個(gè)糾錯(cuò)信息集合中的糾錯(cuò)信息的數(shù)量進(jìn)行比較,獲得包含糾錯(cuò)信息數(shù)量最多的糾錯(cuò)信息集合,再將該最多的數(shù)量與預(yù)設(shè)閾值進(jìn)行比較,若該數(shù)量大于預(yù)設(shè)閾值,則將該糾錯(cuò)信息集合中的糾錯(cuò)信息作為候選信息,若該數(shù)量小于或等于預(yù)設(shè)閾值則結(jié)束數(shù)據(jù)處理流程。
[0065]還可以將各個(gè)具有相同的位置特征值的糾錯(cuò)信息集合各自的糾錯(cuò)信息的數(shù)量先與預(yù)設(shè)的閾值比較,若全部小于預(yù)設(shè)閾值,則結(jié)束流程;若有幾個(gè)集合中的數(shù)量大于預(yù)設(shè)閾值,則將這幾個(gè)集合的數(shù)量再進(jìn)行比較,將數(shù)量最多的糾錯(cuò)信息集合選取出來,以該集合中的糾錯(cuò)信息作為候選信息。
[0066]預(yù)設(shè)閾值可以根據(jù)實(shí)際情況設(shè)置,比如,具有相同位置特征值的糾錯(cuò)信息的總數(shù)
量的一半。
[0067]例如:600個(gè)用戶上報(bào)的糾錯(cuò)天氣,地域值為北京地區(qū)、天津地區(qū),天氣值包括晴、小雨、陰。其中上報(bào)的多個(gè)糾錯(cuò)天氣中,天津地區(qū)的天氣晴的30條,聚合為糾錯(cuò)集合A ;4條天津地區(qū)的天氣陰,聚合為糾錯(cuò)集合B ;北京地區(qū)天氣小雨的糾錯(cuò)集合C,有來自500個(gè)用戶的500條糾錯(cuò)天氣;北京地區(qū)天氣為晴的糾錯(cuò)集合D中有來自16個(gè)用戶的16條糾錯(cuò)天氣;北京地區(qū)天氣陰的糾錯(cuò)集合E中有來自50個(gè)用戶的50條糾錯(cuò)天氣。A、B是兩個(gè)具有相同位置特征值即天津地區(qū)的糾錯(cuò)集合。C、D、E是三個(gè)具有相同位置特征值即北京地區(qū)的糾錯(cuò)集合,在C、D、E三個(gè)集合中,糾錯(cuò)天氣數(shù)量最多的為包含500個(gè)糾錯(cuò)天氣的糾錯(cuò)集合C。預(yù)設(shè)閾值可以為具有相同地域值的糾錯(cuò)信息的總數(shù)的一半,即預(yù)設(shè)閾值為283 (566/2=283),那么包含糾錯(cuò)天氣數(shù)量 最多的集合C中,500條糾錯(cuò)天氣大于預(yù)設(shè)閾值283。進(jìn)而,還可以提取該集合C中的某一糾錯(cuò)天氣作為候選天氣c (候選信息)。
[0068]在步驟S350處,從選取的該糾錯(cuò)信息集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。
[0069]候選信息由于是選取出來的糾錯(cuò)信息,具有位置特征、內(nèi)容特征和相應(yīng)的位置特征值、內(nèi)容特征值。
[0070]由此,可以根據(jù)該候選信息的位置特征值和內(nèi)容特征值,從步驟SllO收集的一個(gè)或多個(gè)作為備用的發(fā)布信息中,匹配出具有與該候選信息的位置特征值相同的位置特征值、同時(shí)具有與該候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
[0071]在一個(gè)實(shí)施方式中,還可以根據(jù)該候選信息的位置特征值,從步驟SllO聚合形成的一個(gè)或多個(gè)備用信息集合中,查找到具有與該候選信息的位置特征值相同的位置特征值的備用信息集合。進(jìn)而,根據(jù)該候選信息的內(nèi)容特征值,在查找到的該備用信息集合中,與作為備用的多個(gè)發(fā)布信息的內(nèi)容特征值進(jìn)行匹配。找到具有與該候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
[0072]由于內(nèi)容特征值還可以包括一個(gè)或多個(gè)狀態(tài)。在一個(gè)或多個(gè)備用的發(fā)布信息中,查找匹配作為備用的發(fā)布信息的過程中,先找到具有與候選信息相同的位置特征值的各個(gè)備用的發(fā)布信息或者備用信息集合,進(jìn)而,再將候選信息中的內(nèi)容特征值與作為匹配對象的各個(gè)備用的發(fā)布信息的內(nèi)容特征值進(jìn)行匹配。該匹配分為內(nèi)容特征值完全相同和最接近兩種情形。
[0073]如果該候選信息與某備用的發(fā)布信息的內(nèi)容特征值相同且其狀態(tài)也相同,即找到了與候選信息具有完全相同的內(nèi)容特征值的備用的發(fā)布信息(即內(nèi)容特征值完全相同),則將該備用的發(fā)布信息作為匹配上的發(fā)布信息。
[0074]當(dāng)沒有匹配到任何一個(gè)備用的發(fā)布信息與該候選信息具有完全相同的內(nèi)容特征值時(shí),可以考慮尋找內(nèi)容特征值最接近的備用的發(fā)布信息。進(jìn)而,如果該候選信息與某備用的發(fā)布信息的內(nèi)容特征值且其狀態(tài)最接近、或者內(nèi)容特征值最接近,即為找到了與候選信息具有最接近的內(nèi)容特征值的備用的發(fā)布信息(即內(nèi)容特征值最接近),則將該備用的發(fā)布信息可以作為匹配上的發(fā)布信息。
[0075]進(jìn)一步,如果存在多個(gè)匹配上的發(fā)布信息時(shí),選擇其中發(fā)布信息的來源的信用值最高的發(fā)布信息作為匹配上的發(fā)布信息。其中,來源的所述信用值,根據(jù)該來源提供的作為備用的發(fā)布信息在歷史上作為匹配上的發(fā)布信息的次數(shù)的多少確定,次數(shù)越多則信用值越高;并且,每作為匹配上的發(fā)布信息一次,則該發(fā)布信息的來源的信用值就被更新。
[0076]具體地,可以根據(jù)發(fā)布信息(實(shí)時(shí)信息/預(yù)測信息)的來源(或者說提供者)歷史提供的發(fā)布信息被確定為與候選信息相匹配的結(jié)果的次數(shù)的多少,來確定該來源的信用值。次數(shù)多則信用值高、次數(shù)低則信用值低。信用值高低是相對的,在匹配出的多個(gè)備用的發(fā)布信息中,選用信用值相對為最高的作為匹配的結(jié)果。每次作為匹配上的作為結(jié)果的備用的發(fā)布信息,其來源的信用值會得到更新,如在原有的次數(shù)η上增加一次η+1。
[0077]比如:若來源或提供者Rl以往所提供過的發(fā)布信息,有10次被確定為與候選信息匹配的結(jié)果使用以更新發(fā)布給用戶的存在誤差的信息,可以設(shè)置信用值為10 ;來源或提供者R2以往提供過的發(fā)布信息,有8次被確定為與候選信息匹配的結(jié)果使用,可設(shè)置信用值為8 ;來源或提供者R3,有7次,可設(shè)置信用值為7。那么,如果當(dāng)前的候選信息完全匹配這三個(gè)Rl、R2、R3本次所提供的發(fā)布信息,可以根據(jù)信用值10、8、7,確定最高信用值為10的Rl所提供的發(fā)布信息為對應(yīng)候選信息的匹配結(jié)果,發(fā)送給用戶以更新存在誤差的信息。并且,對于Rl的信用值的次數(shù),更新為11次。
[0078]—個(gè)例子:備用天氣集合X是北京地區(qū)的天氣集合,而備用天氣集合Y是天津地區(qū)的天氣集合。候選天氣c根據(jù)其“北京地區(qū)”地域值找到對應(yīng)的集合X。候選天氣c根據(jù)天氣值“雨”找到集合X中有甲、乙、丙3個(gè)實(shí)況天氣/預(yù)報(bào)天氣的天氣值為“雨”,狀態(tài)依次為大、中、小。由于候選天氣c的天氣值“雨”的狀態(tài)為“小”,則確定作為后備用的實(shí)況天氣/預(yù)報(bào)天氣“丙”是匹配上的結(jié)果,可以作為更新存在誤差的之前發(fā)送給用戶的天氣信息。另夕卜,若甲、乙、丙3個(gè)實(shí)況天氣/預(yù)報(bào)天氣的天氣“雨”依次狀態(tài)是大、中、中,與候選天氣c僅有值相配而該值的狀態(tài)不相配,則可以將乙、丙狀態(tài)“中”雨,作為最接近“小”雨的實(shí)況天氣/預(yù)報(bào)天氣,由于有兩個(gè)相同的匹配上的對象,則考慮到乙的提供者的信用值比丙的高的情況,將利用乙作為匹配的結(jié)果,作為更新之前發(fā)送給用戶的存在誤差的天氣信息,進(jìn)一步,還給乙的來源或提供者的信用值進(jìn)行更新,如增加I次。
[0079]本發(fā)明還提供了一種數(shù)據(jù)處理系統(tǒng)。圖2是根據(jù)本發(fā)明一實(shí)施例的數(shù)據(jù)處理系統(tǒng)的結(jié)構(gòu)圖。該數(shù)據(jù)處理系統(tǒng)中包括:
[0080]收集模塊210,預(yù)先收集作為備用的發(fā)布信息。可以由服務(wù)器實(shí)時(shí)地獲取各個(gè)計(jì)算出的實(shí)時(shí)信息和/或預(yù)測信息,以便收集起來。這些實(shí)時(shí)信息和/或預(yù)測信息,都作為預(yù)先收集的備用的發(fā)布信息,可以選擇其中一個(gè)發(fā)布給用戶。其中,每個(gè)發(fā)布信息,可以包括兩類特征:位置特征和內(nèi)容特征,對應(yīng)相應(yīng)的位置特征值和內(nèi)容特征值,即每個(gè)發(fā)布信息具有位置特征值和內(nèi)容特征值。
[0081]在一個(gè)實(shí)施方式中,收集模塊210還包括第二聚合模塊2101,其將具有相同的位置特征值的所述預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合。具體地,可以將具有相同的位置特征值的預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合。每個(gè)備用信息集合具有同樣的位置特征值。每個(gè)備用信息集合包含一個(gè)或多個(gè)位置特征值相同、而內(nèi)容特征值相同或不同的作為備用的發(fā)布信息。
[0082]收集模塊210實(shí)現(xiàn)的操作處理以及例子,具體對應(yīng)如步驟S310所述。
[0083]采集模塊220,采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息。具體的,用戶會針對接收到的發(fā)布信息,對比實(shí)際情況,若發(fā)布信息與實(shí)際情況不符,則用戶可以向服務(wù)器上報(bào)針對該發(fā)布信息的糾錯(cuò)信息。服務(wù)器采集到的來自一個(gè)或多個(gè)這樣的用戶上報(bào)的糾錯(cuò)信息。這些糾錯(cuò)信息,每個(gè)都包括位置特征、內(nèi)容特征,以及相應(yīng)的位置特征值、內(nèi)容特征值。進(jìn)一步地,連續(xù)兩次采集相同用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。也就是說,可以預(yù)設(shè)時(shí)間間隔閾值,以保證服務(wù)器連續(xù)兩次采集到同一個(gè)用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。設(shè)定該采集時(shí)間間隔閾值,可以避免同一個(gè)用戶不斷、反復(fù)向服務(wù)器發(fā)送糾錯(cuò)信息,造成服務(wù)器數(shù)據(jù)處理壓力。采集模塊220實(shí)現(xiàn)的操作處理以及例子,具體對應(yīng)如步驟S320所述。
[0084]第一聚合模塊230,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合。具體而言,服務(wù)器可以采集一個(gè)或多個(gè)用戶上報(bào)的糾錯(cuò)信息,每個(gè)糾錯(cuò)信息具有位置特征值和內(nèi)容特征值,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合,由此,可以得到一個(gè)或多個(gè)具有同樣的位置特征值、同時(shí)具有同樣的內(nèi)容特征值的糾錯(cuò)信息的集合,即糾錯(cuò)信息集合(糾錯(cuò)集合),糾錯(cuò)信息集合也包括該同樣的位置特征值、內(nèi)容特征值。第一聚合模塊230實(shí)現(xiàn)的操作處理以及例子,具體對應(yīng)如步驟S330所述。
[0085]選取模塊240,從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合。一種方式,可以在各個(gè)具有相同位置特征值的糾錯(cuò)信息集合中,將各個(gè)糾錯(cuò)信息集合中的糾錯(cuò)信息的數(shù)量進(jìn)行比較,獲得包含糾錯(cuò)信息數(shù)量最多的糾錯(cuò)信息集合,再將該最多的數(shù)量與預(yù)設(shè)閾值進(jìn)行比較,若該數(shù)量大于預(yù)設(shè)閾值,則將該糾錯(cuò)信息集合中的糾錯(cuò)信息作為候選信息,若該數(shù)量小于或等于預(yù)設(shè)閾值則結(jié)束數(shù)據(jù)處理流程。另一種方式,還可以將各個(gè)具有相同的位置特征值的糾錯(cuò)信息集合各自的糾錯(cuò)信息的數(shù)量先與預(yù)設(shè)的閾值比較,若全部小于預(yù)設(shè)閾值,則結(jié)束流程;若有幾個(gè)集合中的數(shù)量大于預(yù)設(shè)閾值,則將這幾個(gè)集合的數(shù)量再進(jìn)行比較,將數(shù)量最多的糾錯(cuò)信息集合選取出來,以該集合中的糾錯(cuò)信息作為候選信息。其中,預(yù)設(shè)閾值可以根據(jù)實(shí)際情況設(shè)置,比如,具有相同位置特征值的糾錯(cuò)信息的總數(shù)量的一半。選取模塊240實(shí)現(xiàn)的操作處理以及例子,具體對應(yīng)如步驟S340所述。
[0086]匹配模塊250,從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。其中,候選信息是選取出來的糾錯(cuò)信息,具有位置特征、內(nèi)容特征和相應(yīng)的位置特征值、內(nèi)容特征值??梢愿鶕?jù)該候選信息的位置特征值和內(nèi)容特征值,從收集模塊210收集的一個(gè)或多個(gè)作為備用的發(fā)布信息中,匹配出具有與該候選信息的位置特征值相同的位置特征值、同時(shí)具有與該候選信息的內(nèi)容特征值相同(完全相同)或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
[0087]在一個(gè)實(shí)施方式中,還包括第一匹配子模塊2501,根據(jù)該候選信息的位置特征值,從收集模塊210的第二聚合模塊2101聚合形成的一個(gè)或多個(gè)備用信息集合中,查找到具有與所述候選信息的位置特征值相同的位置特征值的備用的發(fā)布信息或備用信息集合。進(jìn)而,根據(jù)該候選信息的內(nèi)容特征值,在查找到的該備用信息集合中,與作為備用的多個(gè)發(fā)布信息的內(nèi)容特征值進(jìn)行匹配。找到具有與該候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
[0088]由于內(nèi)容特征值還可以包括一個(gè)或多個(gè)狀態(tài),匹配模塊250還可以包括第二匹配子模塊2502,根據(jù)該候選信息的內(nèi)容特征值與查找到的具有與該候選信息具有相同位置特征值的多個(gè)備用的發(fā)布信息的內(nèi)容特征值、或者查找到的具有與該候選信息具有相同位置特征值的備用信息集合中的發(fā)布信息的內(nèi)容特征值,進(jìn)行匹配,找到與所述候選信息的內(nèi)容特征值相同(完全相同)或最接近的備用的發(fā)布信息,以作為匹配上的發(fā)布信息。
[0089]在一個(gè)或多個(gè)備用的發(fā)布信息中,查找匹配作為備用的發(fā)布信息的過程,可以是先找到具有與候選信息相同的位置特征值的各個(gè)備用的發(fā)布信息或者備用信息集合,進(jìn)而,再將候選信息中的內(nèi)容特征值與作為匹配對象的各個(gè)備用的發(fā)布信息的內(nèi)容特征值進(jìn)行匹配。該匹配分為內(nèi)容特征值完全相同和最接近兩種情形。
[0090]一種情形,如果該候選信息與某備用的發(fā)布信息的內(nèi)容特征值相同且其狀態(tài)也相同,即找到了與候選信息具有完全相同的內(nèi)容特征值的備用的發(fā)布信息(即內(nèi)容特征值完全相同),則將該備用的發(fā)布信息作為匹配上的發(fā)布信息。[0091]另一種情形,當(dāng)沒有匹配到任何一個(gè)備用的發(fā)布信息與該候選信息具有完全相同的內(nèi)容特征值時(shí),可以考慮尋找內(nèi)容特征值最接近的備用的發(fā)布信息。進(jìn)而,如果該候選信息與某備用的發(fā)布信息的內(nèi)容特征值且其狀態(tài)最接近、或者內(nèi)容特征值最接近,即為找到了與候選信息具有最接近的內(nèi)容特征值的備用的發(fā)布信息(即內(nèi)容特征值最接近),則將該備用的發(fā)布信息可以作為匹配上的發(fā)布信息。
[0092]進(jìn)一步,如果存在多個(gè)匹配上的發(fā)布信息時(shí),選擇其中發(fā)布信息的來源的信用值最高的發(fā)布信息作為匹配上的發(fā)布信息。其中,來源的所述信用值,根據(jù)該來源提供的作為備用的發(fā)布信息在歷史上作為匹配上的發(fā)布信息的次數(shù)的多少確定,次數(shù)越多則信用值越高;并且,每作為匹配上的發(fā)布信息一次,則該發(fā)布信息的來源的信用值就被更新。
[0093]具體地,可以根據(jù)發(fā)布信息(實(shí)時(shí)信息/預(yù)測信息)的來源(或者說提供者)歷史提供的發(fā)布信息被確定為與候選信息相匹配的結(jié)果的次數(shù)的多少,來確定該來源的信用值。次數(shù)多則信用值高、次數(shù)低則信用值低。信用值高低是相對的,在匹配出的多個(gè)備用的發(fā)布信息中,選用信用值相對為最高的作為匹配的結(jié)果。每次作為匹配上的作為結(jié)果的備用的發(fā)布信息,其來源的信用值會得到更新,如在原有的次數(shù)η上增加一次η+1。
[0094]匹配模塊250實(shí)現(xiàn)的操作處理以及例子,具體對應(yīng)如步驟S350所述。
[0095]由于圖2所描述的本發(fā)明的系統(tǒng)所包括的各個(gè)模塊的【具體實(shí)施方式】與本發(fā)明的方法中的步驟的【具體實(shí)施方式】是相對應(yīng)的,由于已經(jīng)對圖1進(jìn)行了詳細(xì)的描述,所以為了不模糊本發(fā)明,在此不再對各個(gè)模塊的具體細(xì)節(jié)進(jìn)行描述。
[0096]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0097]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0098]類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0099]本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的客戶端中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)客戶端中??梢园褜?shí)施例中的模塊組合成一個(gè)模塊,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者客戶端的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
[0100]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0101 ] 本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的加載有排序網(wǎng)址的客戶端中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0102]應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種數(shù)據(jù)處理方法,其中,包括: 采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息; 將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合; 從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合; 從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。
2.根據(jù)權(quán)利要求1所述的方法,其中,采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息,包括: 連續(xù)兩次采集相同用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,包括: 根據(jù)所述候選信息的位置特征值和內(nèi)容特征值,從一個(gè)或多個(gè)作為備用的發(fā)布信息中,匹配出具有與所述候選信息的位置特征值相同的位置特征值、同時(shí)具有與所述候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
4.根據(jù)權(quán)利要求1或2所述的方法,其中,將該集合中的糾錯(cuò)信息作為候選信息,以匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,包括: 將具有相同的位置特征值的所述預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合; 根據(jù)所述候選信息的位置特征值,從所述一個(gè)或多個(gè)備用信息集合中,查找到具有與所述候選信息的位置特征值相同的位置特征值的備用信息集合; 根據(jù)所述候選信息的內(nèi)容特征值與查找到的該備用信息集合中的發(fā)布信息的內(nèi)容特征值進(jìn)行匹配,找到與所述候選信息的內(nèi)容特征值相同或最接近的備用的發(fā)布信息,以作為匹配上的發(fā)布信息。
5.根據(jù)權(quán)利要求3或4所述的方法,其中, 內(nèi)容特征值還包括:一個(gè)或多個(gè)狀態(tài);如果所述候選信息與備用的發(fā)布信息的內(nèi)容特征值相同且其狀態(tài)相同、或者內(nèi)容特征值相同且其狀態(tài)最接近、或者內(nèi)容特征值最接近,則所述備用的發(fā)布信息作為匹配上的發(fā)布信息; 和/或, 如果存在多個(gè)匹配上的發(fā)布信息時(shí),選擇其中發(fā)布信息的來源的信用值最高的發(fā)布信息作為匹配上的發(fā)布信息;其中,來源的所述信用值,根據(jù)該來源提供的作為備用的發(fā)布信息在歷史上作為匹配上的發(fā)布信息的次數(shù)的多少確定,次數(shù)越多則信用值越高;每作為匹配上的發(fā)布信息一次,則該發(fā)布信息的來源的信用值被更新。
6.一種數(shù)據(jù)處理系統(tǒng),其中,包括: 采集模塊,采集用戶針對獲取的發(fā)布信息所上報(bào)的糾錯(cuò)信息; 第一聚合模塊,將位置特征值相同且內(nèi)容特征值相同的多個(gè)糾錯(cuò)信息作為相同的糾錯(cuò)信息,聚合成一糾錯(cuò)信息集合; 選取模塊,從位置特征值相同而內(nèi)容特征值不同的多個(gè)糾錯(cuò)信息集合中,選取糾錯(cuò)信息的數(shù)量最多且該數(shù)量大于預(yù)設(shè)閾值的集合; 匹配模塊,從選取的該集合中提取一糾錯(cuò)信息作為候選信息,匹配預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,并將匹配上的發(fā)布信息,發(fā)送給所述用戶。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其中,采集模塊,包括: 連續(xù)兩次采集相同用戶上報(bào)的糾錯(cuò)信息的時(shí)間間隔大于或等于預(yù)定時(shí)間間隔。
8.根據(jù)權(quán)利要求6或7所述的系統(tǒng),其中,匹配模塊,包括: 根據(jù)所述候選信息的位置特征值和內(nèi)容特征值,從一個(gè)或多個(gè)作為備用的發(fā)布信息中,匹配出具有與所述候選信息的位置特征值相同的位置特征值、同時(shí)具有與所述候選信息的內(nèi)容特征值相同或最接近的內(nèi)容特征值的備用的發(fā)布信息,作為匹配上的發(fā)布信息。
9.根據(jù)權(quán)利要求6或7所述的系統(tǒng),其中,還包括: 第二聚合模塊,將具有相同的位置特征值的所述預(yù)先收集的一個(gè)或多個(gè)作為備用的發(fā)布信息,聚合成一個(gè)或多個(gè)備用信息集合; 所述匹配模塊包括: 第一匹配子模塊,根據(jù)所述候選信息的位置特征值,從所述一個(gè)或多個(gè)備用信息集合中,查找到具有與所述候選信息的位置特征值相同的位置特征值的備用信息集合; 第二匹配子模塊,根據(jù)所述候選信息的內(nèi)容特征值與查找到的該備用信息集合中的發(fā)布信息的內(nèi)容特征值進(jìn)行匹配,找到與所述候選信息的內(nèi)容特征值相同或最接近的備用的發(fā)布信息,以作為匹配上的發(fā)布信息。
10.根據(jù)權(quán)利要求8或9所述的系統(tǒng),其中, 內(nèi)容特征值還包括:一個(gè)或多個(gè)狀態(tài);如果所述候選信息與備用的發(fā)布信息的內(nèi)容特征值相同且其狀態(tài)相同、或者內(nèi)容特征值相同且其狀態(tài)最接近、或者內(nèi)容特征值最接近,則所述備用的發(fā)布信息作為匹配上的發(fā)布信息; 和/或, 匹配模塊還包括:如果存在多個(gè)匹配上的發(fā)布信息時(shí),選擇其中發(fā)布信息的來源的信用值最高的發(fā)布信息作為匹配上的發(fā)布信息;其中,來源的所述信用值,根據(jù)該來源提供的作為備用的發(fā)布信息在歷史上作為匹配上的發(fā)布信息的次數(shù)的多少確定,次數(shù)越多則信用值越高;每作為匹配上的發(fā)布信息一次,則該發(fā)布信息的來源的信用值被更新。
【文檔編號】G06F17/30GK103761281SQ201410012408
【公開日】2014年4月30日 申請日期:2014年1月10日 優(yōu)先權(quán)日:2014年1月10日
【發(fā)明者】項(xiàng)漢忠 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司