專利名稱:原創(chuàng)內(nèi)容的搜索方法和搜索服務(wù)器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索技術(shù)領(lǐng)域,特別涉及一種原創(chuàng)內(nèi)容的搜索方法和搜索服務(wù)器。
背景技術(shù):
隨著互聯(lián)網(wǎng)的發(fā)展,用戶可以通過多種途徑上傳或者獲取互聯(lián)網(wǎng)上的各種資源,使得互聯(lián)網(wǎng)上的資源越來越多,更新越來越快,資源的質(zhì)量也參差不齊,目前,資源搜索方法大多只展現(xiàn)搜索結(jié)果的鏈接,而不能對優(yōu)秀資源(如原創(chuàng)內(nèi)容等)和低質(zhì)量資源進行標識以進行區(qū)別顯示,使得用戶無法對資源進行分辨,這一方面會導(dǎo)致由于一些低質(zhì)量的資源而大大降低用戶的閱讀體驗,另一方面會由于無法對原創(chuàng)和非原創(chuàng)資源進行標識區(qū)分,使得對原創(chuàng)的優(yōu)秀資源難以進行有效的保護,損害原創(chuàng)用戶的利益,不利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。
發(fā)明內(nèi)容
本發(fā)明的旨在至少解決上述技術(shù)缺陷之一。為此,本發(fā)明第一個目的在于提出一種原創(chuàng)內(nèi)容的搜索方法,該方法能夠為用戶提供高質(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價值,同時有效的保護了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。本發(fā)明第二個目的在于提出一種搜索服務(wù)器。為實現(xiàn)上述目的,根據(jù)本發(fā)明第一方面的實施例的原創(chuàng)內(nèi)容的搜索方法包括以下步驟:搜索服務(wù)器接收客戶端發(fā)送的搜索詞;所述搜索服務(wù)器根據(jù)所述搜索詞獲得N個搜索結(jié)果,所述N為大于I的正整數(shù);所述搜索服務(wù)器對所述N個搜索結(jié)果進行分析以確定所述N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及所述搜索服務(wù)器對所述M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至所述客戶端。根據(jù)本發(fā)明實施例的原創(chuàng)內(nèi)容的搜索方法,通過對搜索結(jié)果進行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,并對原創(chuàng)內(nèi)容發(fā)布源進行特殊標記后提供至客戶端,能夠為用戶提供高質(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價值,同時有效的保護了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。為實現(xiàn)上述目的,根據(jù)本發(fā)明第二方面的搜索服務(wù)器包括:接收模塊,用于接收客戶端發(fā)送的搜索詞;搜索模塊,用于根據(jù)所述搜索詞獲得N個搜索結(jié)果,所述N為大于I的正整數(shù);分析模塊,用于對所述N個搜索結(jié)果進行分析以確定所述N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及搜索結(jié)果提供模塊,用于對所述M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至所述客戶端。根據(jù)本發(fā)明實施例的搜索服務(wù)器,通過分析模塊對搜索結(jié)果進行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,進而對原創(chuàng)內(nèi)容發(fā)布源進行特殊標記后提供至客戶端,能夠為用戶提供高質(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng) 內(nèi)容的價值,同時有效的保護了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。
本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:圖1為根據(jù)本發(fā)明一個實施例的原創(chuàng)內(nèi)容的搜索方法的流程圖;圖2為根據(jù)本發(fā)明又一個實施例的原創(chuàng)內(nèi)容的搜索方法的流程圖;圖3為根據(jù)本發(fā)明另一個實施例的原創(chuàng)內(nèi)容的搜索方法的流程圖;圖4為根據(jù)本發(fā)明一個實施例的搜索服務(wù)器的結(jié)構(gòu)框圖;圖5為根據(jù)本發(fā)明又一個實施例的搜索服務(wù)器的結(jié)構(gòu)框圖;圖6為根據(jù)本發(fā)明另一個實施例的搜索服務(wù)器的結(jié)構(gòu)框圖;圖7為根據(jù)本發(fā)明一個實施例的原創(chuàng)內(nèi)容特殊標記效果圖;圖8為根據(jù)本發(fā)明一個實施例的原創(chuàng)機構(gòu)顯示結(jié)果示意圖;圖9為根據(jù)本發(fā)明一個實施例的原創(chuàng)作者相關(guān)信息的顯示結(jié)果示意圖。
具體實施例方式
下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術(shù)語“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連。對于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語在本發(fā)明中的具體含義。此外,在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。下面參考附圖描述根據(jù)本發(fā)明實施例的原創(chuàng)內(nèi)容的搜索方法。一種原創(chuàng)內(nèi)容的搜索方法,包括以下步驟:搜索服務(wù)器接收客戶端發(fā)送的搜索詞;搜索服務(wù)器根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于I的正整數(shù);搜索服務(wù)器對N個搜索結(jié)果進行分析以確定N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N;以及搜索服務(wù)器對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。圖1為根據(jù)本發(fā)明一個實施例的原創(chuàng)內(nèi)容的搜索方法的流程圖。如圖1所示,根據(jù)本發(fā)明實施例原創(chuàng)內(nèi)容的搜索方法包括以下步驟。
S101,搜索服務(wù)器接收客戶端發(fā)送的搜索詞。S102,搜索服務(wù)器根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于I的正整數(shù)。S103,搜索服務(wù)器對N個搜索結(jié)果進行分析以確定N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N。具體地,搜索服務(wù)器可按照搜索結(jié)果的主題內(nèi)容進一步對這N個搜索結(jié)果進行分組,進而可在M組具有不同主題內(nèi)容的搜索結(jié)果中的每組分別確定一個具有原創(chuàng)內(nèi)容的搜索結(jié)果,可將發(fā)布時間最早的一個搜索結(jié)果作為具有原創(chuàng)內(nèi)容的搜索結(jié)果,并據(jù)此確定原創(chuàng)內(nèi)容發(fā)布源,其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL (UniformResourcel Locator,統(tǒng)一資源定位符)。S104,搜索服務(wù)器對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。其中,特殊標記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標識,在本發(fā)明的一個實施例中,搜索服務(wù)器還可在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中進行原創(chuàng)標記,以及在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中標記作者和發(fā)表時間,并且,這M個原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級,在提供至客戶端時,可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對于用戶輸入的搜索詞“ X X X X ”,搜索服務(wù)器將原創(chuàng)內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動添加特殊標記“[舒立觀察]”,以及為第一個搜索結(jié)果中添加原創(chuàng)標記“財新網(wǎng)的原創(chuàng)文章”,并標記出作者和發(fā)表時間。根據(jù)本發(fā)明實施 例的原創(chuàng)內(nèi)容的搜索方法,通過對搜索結(jié)果進行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,并對原創(chuàng)內(nèi)容發(fā)布源進行特殊標記后提供至客戶端,能夠為用戶提供高質(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價值,同時有效的保護了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。在本發(fā)明的一個實施例中,搜索服務(wù)器還將發(fā)布原創(chuàng)內(nèi)容的機構(gòu)的信息以及發(fā)布的原創(chuàng)內(nèi)容提供給客戶端進行顯示,圖8為搜索服務(wù)器提供給客戶端顯示的關(guān)于南京日報搜索結(jié)果的展示圖,由此,能夠?qū)⒃瓌?chuàng)機構(gòu)明確展現(xiàn)給用戶,并使得用戶能夠直接瀏覽原創(chuàng)機構(gòu)發(fā)布的原創(chuàng)內(nèi)容,既有效保護了原創(chuàng)機構(gòu)的知識產(chǎn)權(quán),又方便了用戶獲取原創(chuàng)資源,將原創(chuàng)價值最大化。圖2為根據(jù)本發(fā)明又一個實施例的原創(chuàng)內(nèi)容的搜索方法的流程圖。如圖2所示,根據(jù)本發(fā)明實施例的原創(chuàng)內(nèi)容的搜索方法包括以下步驟。S201,搜索服務(wù)器接收客戶端發(fā)送的搜索詞。S202,搜索服務(wù)器根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于I的正整數(shù)。S203,搜索服務(wù)器對N個搜索結(jié)果進行文本相似度分析。具體地,可通過深度學習技術(shù)計算搜索結(jié)果的文本相似度,并可認為文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的主題內(nèi)容一致,進而可根據(jù)主題內(nèi)容對N個搜索結(jié)果進行分組。S204,獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量。具體地,對于主題內(nèi)容一致的搜索結(jié)果組,也就是相似度滿足預(yù)設(shè)閾值的搜索結(jié)果組,可獲取其中搜索結(jié)果的數(shù)量Q,并進一步判斷每組中搜索結(jié)果的數(shù)量Q是否大于預(yù)設(shè)數(shù)量。S205,如果判斷大于預(yù)設(shè)數(shù)量,則搜索服務(wù)器從Q個搜索結(jié)果中抽取M個原創(chuàng)內(nèi)容發(fā)布源中的一個,其中,M為正整數(shù)且小于N。其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL,具體地,如果有M組的搜索結(jié)果的數(shù)量Q大于預(yù)設(shè)數(shù)量,則可在這M組中每組分別抽取一個遠程內(nèi)容發(fā)布源。例如,可設(shè)定預(yù)設(shè)數(shù)量為10,對于搜索到的40個搜索結(jié)果,如果文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果有A、B、C三組,搜索結(jié)果數(shù)量分別8、12、14,則可在B組合C組中分別抽取一個原創(chuàng)內(nèi)容發(fā)布源。S206,根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對M個原創(chuàng)內(nèi)容發(fā)布源進行修正。在本發(fā)明的一個實施例中,可通過權(quán)威網(wǎng)站引入高質(zhì)量的原創(chuàng)數(shù)據(jù),輔以機器識別交叉驗證,檢驗引入數(shù)據(jù)的原創(chuàng)度,經(jīng)過多倫篩選修正,最終抽取出100%的原創(chuàng)內(nèi)容,并獲取相應(yīng)的原創(chuàng)內(nèi)容發(fā)布源,保證了原創(chuàng)內(nèi)容發(fā)布源的準確性。S207,搜索服務(wù)器對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。其中,特殊標記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標識,在本發(fā)明的一個實施例中,搜索服務(wù)器還可在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中進行原創(chuàng)標記,以及在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中標記作者和發(fā)表時間,并且,這M個原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級,在提供至客戶端時,可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對于用戶輸入的搜索詞“ X X X X ”,搜索服務(wù)器將原創(chuàng)內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動添加特殊標記“[舒立觀察]”,以及為第一個搜索結(jié)果中添加原創(chuàng)標記“財新網(wǎng)的原創(chuàng)文章”,并標記出作者和發(fā)表時間。應(yīng)當理解,在本發(fā)明的一個實施例中,步驟S206是可選的。根據(jù)本發(fā)明實施例的原創(chuàng)內(nèi)容的搜索方法,通過對搜索結(jié)果進行相似度分析,以獲取一定數(shù)量的內(nèi)容相似的搜索結(jié)果,進而從中抽取原創(chuàng)內(nèi)容發(fā)布源,能夠更準確的獲取原創(chuàng)內(nèi)容發(fā)布源,保證原創(chuàng)內(nèi)容判斷的準確性,進而為用戶提供更優(yōu)質(zhì)的原創(chuàng)內(nèi)容。圖3為根據(jù)本發(fā)明另一個實施例的原創(chuàng)內(nèi)容的搜索方法的流程圖。如圖3所示,根據(jù)本發(fā)明實施例的原創(chuàng)內(nèi)容的搜索方法包括以下步驟。S301,搜索服務(wù)器接收客戶端發(fā)送的搜索詞。S302,搜索服務(wù)器根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于I的正整數(shù)。S303,搜索服務(wù)器對N個搜索結(jié)果進行文本相似度分析。具體地,可通過深度學習技術(shù)計算搜索結(jié)果的文本相似度,并可認為文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的主題內(nèi)容一致,進而可根據(jù)主題內(nèi)容對N個搜索結(jié)果進行分組。S304,獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量。具體地, 對于主題內(nèi)容一致的搜索結(jié)果組,也就是相似度滿足預(yù)設(shè)閾值的搜索結(jié)果組,獲取其中搜索結(jié)果的數(shù)量Q,并進一步判斷每組中搜索結(jié)果的數(shù)量Q是否大于預(yù)設(shè)數(shù)量。S305,如果判斷大于預(yù)設(shè)數(shù)量,則搜索服務(wù)器從Q個搜索結(jié)果中抽取M個原創(chuàng)內(nèi)容發(fā)布源中的一個,其中,M為正整數(shù)且小于N。其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL,具體地,如果有M組的搜索結(jié)果的數(shù)量Q大于預(yù)設(shè)數(shù)量,則可在這M組中每組分別抽取一個遠程內(nèi)容發(fā)布源。例如,可設(shè)定預(yù)設(shè)數(shù)量為10,對于搜索到的40個搜索結(jié)果,文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果有A、B、C三組,搜索結(jié)果數(shù)量分別8、12、14,則可在B組合C組中分別抽取一個原創(chuàng)內(nèi)容發(fā)布源。S306,根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對M個原創(chuàng)內(nèi)容發(fā)布源進行修正。在本發(fā)明的一個實施例中,可通過權(quán)威網(wǎng)站引入高質(zhì)量的原創(chuàng)數(shù)據(jù),輔以機器識別交叉驗證,檢驗引入數(shù)據(jù)的原創(chuàng)度,經(jīng)過多倫篩選修正,最終抽取出100%的原創(chuàng)內(nèi)容,并獲取相應(yīng)的原創(chuàng)內(nèi)容發(fā)布源,保證了原創(chuàng)內(nèi)容發(fā)布源的準確性。S307,搜索服務(wù)器對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。其中,特殊標記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標識,在本發(fā)明的一個實施例中,搜索服務(wù)器還可在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中進行原創(chuàng)標記,以及在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中標記作者和發(fā)表時間,并且,這M個原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級,在提供至客戶端時,可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對于用戶輸入的搜索詞“XX XX”,搜索服務(wù)器將原創(chuàng) 內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動添加特殊標記“[舒立觀察]”,以及為第一個搜索結(jié)果中添加原創(chuàng)標記“財新網(wǎng)的原創(chuàng)文章”,并標記出作者和發(fā)表時間。S308,搜索服務(wù)器分別從M個原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱。具體地,搜索服務(wù)器可根據(jù)每個原創(chuàng)內(nèi)容發(fā)布源中標記的作者分別從M個原創(chuàng)內(nèi)容發(fā)布源中獲取每個原創(chuàng)內(nèi)容發(fā)布源的作者名稱,以便獲取更多原創(chuàng)內(nèi)容發(fā)布源的作者的相關(guān)內(nèi)容。S309,搜索服務(wù)器根據(jù)作者名稱進行檢索以獲取與作者名稱相關(guān)的內(nèi)容并提供
至客戶端。舉例來說,搜索服務(wù)器可根據(jù)作者名稱進一步檢索原創(chuàng)內(nèi)容發(fā)布源的作者的簡介、圖片、原創(chuàng)文章、社交網(wǎng)絡(luò)信息、相關(guān)新聞等內(nèi)容,并提供至客戶端,以提升原創(chuàng)作者的認知度,進而將更多原創(chuàng)內(nèi)容推薦給用戶,例如,當搜索服務(wù)器在關(guān)于“ XXXX ”的原創(chuàng)內(nèi)容中獲取其作者為“胡舒立”時,如圖9所示,可進一步獲取“胡舒立”的相關(guān)信息:百科名牌、圖像、簡介、相關(guān)原創(chuàng)文章等。應(yīng)當理解,在本發(fā)明的一個實施例中,步驟S306是可選的。根據(jù)本發(fā)明實施例的原創(chuàng)內(nèi)容的搜索方法,能夠進一步展現(xiàn)原創(chuàng)作者的相關(guān)信息和其他原創(chuàng)文章,可將原創(chuàng)作者的高質(zhì)量原創(chuàng)文章推薦給用戶,更有利于原創(chuàng)價值的體現(xiàn)。為了實現(xiàn)上述實例,本發(fā)明還提出一種搜索服務(wù)器?!N搜索服務(wù)器,包括:接收模塊,用于接收客戶端發(fā)送的搜索詞;搜索模塊,用于根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于I的正整數(shù);分析模塊,用于對N個搜索結(jié)果進行分析以確定N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N;以及搜索結(jié)果提供模塊,用于對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。
圖4為根據(jù)本發(fā)明一個實施例的搜索服務(wù)器的結(jié)構(gòu)框圖。如圖4所示,根據(jù)本發(fā)明實施例的搜索服務(wù)器包括:接收模塊100、搜索模塊200、分析模塊300和搜索結(jié)果提供模塊400。具體地,接收模塊100用于接收客戶端發(fā)送的搜索詞。搜索模塊200用于根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于I的正整數(shù)。分析模塊300用于對N個搜索結(jié)果進行分析以確定N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N。更具體地,分析模塊300可按照搜索結(jié)果的主題內(nèi)容進一步對這N個搜索結(jié)果進行分組分析,進而可在M組具有不同主題內(nèi)容的搜索結(jié)果中的每組分別確定一個具有原創(chuàng)內(nèi)·容的搜索結(jié)果,可將發(fā)布時間最早的一個搜索結(jié)果作為具有原創(chuàng)內(nèi)容的搜索結(jié)果,并據(jù)此確定原創(chuàng)內(nèi)容發(fā)布源,其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL。搜索結(jié)果提供模塊400用于對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。其中,特殊標記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標識,在本發(fā)明的一個實施例中,搜索服務(wù)器還可在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中進行原創(chuàng)標記,以及在M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中標記作者和發(fā)表時間,并且,這M個原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級,在提供至客戶端時,可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對于用戶輸入的搜索詞“XX XX”,搜索服務(wù)器將原創(chuàng)內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動添加特殊標記“[舒立觀察]”,以及為第一個搜索結(jié)果中添加原創(chuàng)標記“財新網(wǎng)的原創(chuàng)文章”,并標記出作者和發(fā)表時間。根據(jù)本發(fā)明實施例的搜索服務(wù)器,通過分析模塊對搜索結(jié)果進行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,進而對原創(chuàng)內(nèi)容發(fā)布源進行特殊標記后提供至客戶端,能夠為用戶提供高質(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價值,同時有效的保護了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。在本發(fā)明的一個實施例中,搜索服務(wù)器還將發(fā)布原創(chuàng)內(nèi)容的機構(gòu)的信息以及發(fā)布的原創(chuàng)內(nèi)容提供給客戶端進行顯示,圖8為搜索服務(wù)器提供給客戶端顯示的關(guān)于南京日報搜索結(jié)果的展示圖,由此,能夠?qū)⒃瓌?chuàng)機構(gòu)明確展現(xiàn)給用戶,并使得用戶能夠直接瀏覽原創(chuàng)機構(gòu)發(fā)布的原創(chuàng)內(nèi)容,既有效保護了原創(chuàng)機構(gòu)的知識產(chǎn)權(quán),又方便了用戶獲取原創(chuàng)資源,將原創(chuàng)價值最大化。圖5為根據(jù)本發(fā)明又一個實施例的搜索服務(wù)器的結(jié)構(gòu)框圖。如圖5所示,根據(jù)本發(fā)明實施例的搜索服務(wù)器包括:接收模塊100、搜索模塊200、分析模塊300、搜索結(jié)果提供模塊400、文本相似度分析子模塊310、判斷子模塊320、抽取子模塊330和修正子模塊340,其中,分析模塊300具體包括文本相似度分析子模塊310、判斷子模塊320、抽取子模塊330和修正子模塊340。具體地,文本相似度分析子模塊310用于對N個搜索結(jié)果進行文本相似度分析。更具體地,文本相似度分析子模塊310可通過深度學習技術(shù)計算搜索結(jié)果的文本相似度,并可認為文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的主題內(nèi)容一致,進而可根據(jù)主題內(nèi)容對N個搜索結(jié)果進行分組。判斷子模塊320用于獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量。更具體地,對于主題內(nèi)容一致的搜索結(jié)果組,也就是相似度滿足預(yù)設(shè)閾值的搜索結(jié)果組,判斷子模塊320可獲取其中搜索結(jié)果的數(shù)量Q,并進一步判斷每組中搜索結(jié)果的數(shù)量Q是否大于預(yù)設(shè)數(shù)量。抽取子模塊330用于當判斷子模塊320判斷搜索數(shù)量Q大于預(yù)設(shè)數(shù)量時,從Q個搜索結(jié)果中抽取M個原創(chuàng)內(nèi)容發(fā)布源,其中,Q為預(yù)設(shè)數(shù)量。更具體地,如果有M組的搜索結(jié)果的數(shù)量Q大于預(yù)設(shè)數(shù)量,則抽取子模塊330可在這M組中每組分別抽取一個遠程內(nèi)容發(fā)布源。例如,可設(shè)定預(yù)設(shè)數(shù)量為10,對于搜索到的40個搜索結(jié)果,文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果有A、B、C三組,搜索結(jié)果數(shù)量分別8、12、14,則抽取子模塊330可在B組合C組中分別抽取一個原創(chuàng)內(nèi)容發(fā)布源。修正子模塊340用于根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對M個原創(chuàng)內(nèi)容發(fā)布源進行修正。在本發(fā)明的一個實施例中,可通過權(quán)威網(wǎng)站引入高質(zhì)量的原創(chuàng)數(shù)據(jù),輔以機器識別交叉驗證,檢驗引入數(shù)據(jù)的原創(chuàng)度,經(jīng)過多倫篩選修正,最終抽取出100%的原創(chuàng)內(nèi)容,并獲取相應(yīng)的原創(chuàng)內(nèi)容發(fā)布源,保 證了原創(chuàng)內(nèi)容發(fā)布源的準確性。應(yīng)當理解,在本發(fā)明的一個實施例中,修正子模塊340是可選的。根據(jù)本發(fā)明實施例的搜索服務(wù)器,通過對搜索結(jié)果進行相似度分析,以獲取一定數(shù)量的內(nèi)容相似的搜索結(jié)果,進而從中抽取原創(chuàng)內(nèi)容發(fā)布源,能夠更準確的獲取原創(chuàng)內(nèi)容發(fā)布源,保證原創(chuàng)內(nèi)容判斷的準確性,進而為用戶提供更優(yōu)質(zhì)的原創(chuàng)內(nèi)容。圖6為根據(jù)本發(fā)明另一個實施例的搜索服務(wù)器的結(jié)構(gòu)框圖。如圖6所示,根據(jù)本發(fā)明實施例的搜索服務(wù)器在圖5所示的基礎(chǔ)上還包括:擴展內(nèi)容提供模塊500。具體地,擴展內(nèi)容提供模塊500分別從M個原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱,并根據(jù)作者名稱進行檢索以獲取與作者名稱相關(guān)的內(nèi)容并提供至客戶端。更具體地,擴展內(nèi)容提供模塊500可根據(jù)每個原創(chuàng)內(nèi)容發(fā)布源中標記的作者分別從M個原創(chuàng)內(nèi)容發(fā)布源中獲取每個原創(chuàng)內(nèi)容發(fā)布源的作者名稱,以便獲取更多原創(chuàng)內(nèi)容發(fā)布源的作者的相關(guān)內(nèi)容。舉例來說,擴展內(nèi)容提供模塊500可根據(jù)作者名稱進一步檢索原創(chuàng)內(nèi)容發(fā)布源的作者的簡介、圖片、原創(chuàng)文章、社交網(wǎng)絡(luò)信息、相關(guān)新聞等內(nèi)容,并提供至客戶端,以提升原創(chuàng)作者的認知度,進而將更多原創(chuàng)內(nèi)容推薦給用戶,例如,當搜索服務(wù)器在關(guān)于“ XXXX ”的原創(chuàng)內(nèi)容中獲取其作者為“胡舒立”時,如圖9所示,可進一步獲取“胡舒立”的相關(guān)信息:百科名牌、圖像、簡介、相關(guān)原創(chuàng)文章等。根據(jù)本發(fā)明實施例的搜索服務(wù)器,能夠進一步展現(xiàn)原創(chuàng)作者的相關(guān)信息和其他原創(chuàng)文章,可將原創(chuàng)作者的高質(zhì)量原創(chuàng)文章推薦給用戶,更有利于原創(chuàng)價值的體現(xiàn)。在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對所述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。盡管已經(jīng)示出和描述了本發(fā)明的實施例,對于本領(lǐng)域的普通技術(shù)人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同限定。
權(quán)利要求
1.一種原創(chuàng)內(nèi)容的搜索方法,其特征在于,包括以下步驟: 搜索服務(wù)器接收客戶端發(fā)送的搜索詞; 所述搜索服務(wù)器根據(jù)所述搜索詞獲得N個搜索結(jié)果,所述N為大于I的正整數(shù); 所述搜索服務(wù)器對所述N個搜索結(jié)果進行分析以確定所述N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及 所述搜索服務(wù)器對所述M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至所述客戶端。
2.如權(quán)利要求1所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,所述搜索服務(wù)器對所述N個搜索結(jié)果進行分析以確定所述N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源進一步包括: 所述搜索服務(wù)器對所述N個搜索結(jié)果進行文本相似度分析; 獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量; 如果判斷大于所述預(yù)設(shè)數(shù)量,則所述搜索服務(wù)器從所述Q個搜索結(jié)果中抽取所述M個原創(chuàng)內(nèi)容發(fā)布源中的一個。
3.如權(quán)利要求2所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,還包括: 根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對所述M個原創(chuàng)內(nèi)容發(fā)布源進行修正。
4.如權(quán)利要求1-3任一項所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,所述搜索服務(wù)器對所述M個原創(chuàng)內(nèi)容發(fā)布源進 行特殊標記進一步包括: 所述搜索服務(wù)器在所述M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中進行原創(chuàng)標記。
5.如權(quán)利要求4所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,還包括: 所述搜索服務(wù)器在所述M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中標記作者和發(fā)表時間。
6.如權(quán)利要求1-5任一項所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,所述M個原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級。
7.如權(quán)利要求1-6任一項所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,還包括: 所述搜索服務(wù)器分別從所述M個原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱;以及 所述搜索服務(wù)器根據(jù)所述作者名稱進行檢索以獲取與所述作者名稱相關(guān)的內(nèi)容并提供至所述客戶端。
8.一種搜索服務(wù)器,其特征在于,包括: 接收模塊,用于接收客戶端發(fā)送的搜索詞; 搜索模塊,用于根據(jù)所述搜索詞獲得N個搜索結(jié)果,所述N為大于I的正整數(shù); 分析模塊,用于對所述N個搜索結(jié)果進行分析以確定所述N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及 搜索結(jié)果提供模塊,用于對所述M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至所述客戶端。
9.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,所述分析模塊進一步包括: 文本相似度分析子模塊,用于對所述N個搜索結(jié)果進行文本相似度分析; 判斷子模塊,用于獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量; 抽取子模塊,用于當所述判斷子模塊判斷所述搜索數(shù)量Q大于所述預(yù)設(shè)數(shù)量時,從所述Q個搜索結(jié)果中抽取所述M個原創(chuàng)內(nèi)容發(fā)布源,其中,Q為預(yù)設(shè)數(shù)量。
10.如權(quán)利要求9所述的搜索服務(wù)器,其特征在于,還包括: 修正子模塊,用于根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對所述M個原創(chuàng)內(nèi)容發(fā)布源進行修正。
11.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,所述搜索結(jié)果提供模塊在所述M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中進行原創(chuàng)標記。
12.如權(quán)利要求11所述的搜索服務(wù)器,其特征在于,所述搜索結(jié)果提供模塊在所述M個原創(chuàng)內(nèi)容發(fā)布源對應(yīng)的搜索結(jié)果中標記作者和發(fā)表時間。
13.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,所述M個原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級。
14.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,還包括: 擴展內(nèi)容提供模塊,用于分別從所 述M個原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱,并根據(jù)所述作者名稱進行檢索以獲取與所述作者名稱相關(guān)的內(nèi)容并提供至所述客戶端。
全文摘要
本發(fā)明提出一種原創(chuàng)內(nèi)容的搜索方法和搜索服務(wù)器,其中方法包括搜索服務(wù)器接收客戶端發(fā)送的搜索詞;搜索服務(wù)器根據(jù)搜索詞獲得N個搜索結(jié)果,N為大于1的正整數(shù);搜索服務(wù)器對N個搜索結(jié)果進行分析以確定N個搜索結(jié)果中的M個原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N;以及搜索服務(wù)器對M個原創(chuàng)內(nèi)容發(fā)布源進行特殊標記之后并提供至客戶端。根據(jù)本發(fā)明實施例的方法,通過對搜索結(jié)果進行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,并對原創(chuàng)內(nèi)容發(fā)布源進行特殊標記后提供至客戶端,能夠為用戶提供高質(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價值,同時有效的保護了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識產(chǎn)權(quán)保護的發(fā)展。
文檔編號G06F17/30GK103235821SQ20131015366
公開日2013年8月7日 申請日期2013年4月27日 優(yōu)先權(quán)日2013年4月27日
發(fā)明者熊詠志, 張剛, 劉悅 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司