本發(fā)明涉及一種議題顯示系統(tǒng)和議題顯示方法,且特別是一種能夠自動判斷與產(chǎn)生出衍生議題的議題顯示系統(tǒng)和議題顯示方法。
背景技術(shù):
基于網(wǎng)絡(luò)的普及,人們經(jīng)常使用網(wǎng)絡(luò)獲得信息。當(dāng)一件事件或社會現(xiàn)象正在發(fā)生時,網(wǎng)絡(luò)上會出現(xiàn)相當(dāng)多具有相關(guān)內(nèi)容的網(wǎng)頁,例如:當(dāng)一件食品安全事件發(fā)生時,在新聞媒體或社群媒體上會大量出現(xiàn)食品安全的相關(guān)內(nèi)容。不但如此,人們也基于網(wǎng)絡(luò)上所發(fā)布的信息在網(wǎng)絡(luò)上進(jìn)行討論,如此則形成網(wǎng)絡(luò)輿論。
現(xiàn)有的網(wǎng)絡(luò)輿論分析系統(tǒng)為搜索引擎式的,其以關(guān)鍵詞組進(jìn)行搜索,并根據(jù)搜索結(jié)果將有關(guān)鍵詞組的各篇新聞文章列出,或者顯示文字與文字關(guān)聯(lián)圖。然而,在網(wǎng)絡(luò)社群輿情議題的觀察期間,有時會出現(xiàn)討論議題方向出現(xiàn)改變。然而,難以以關(guān)鍵詞組來分析出議題與后續(xù)的衍生的議題及其變化。衍生議題的切分需利用人工方式,造成輿論分析的費(fèi)時與低效率,且不具即時性。并且,以原設(shè)定關(guān)鍵詞搜索網(wǎng)絡(luò)文章,可能遺漏衍生議題文章,有涵蓋性不足的缺點。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種議題顯示系統(tǒng)和議題顯示方法,避免了以人工逐一辨識并匯整相關(guān)議題,有助于輿情分析結(jié)果的即時性與全面性的輿情觀察。
本發(fā)明實施例提供了一種議題顯示系統(tǒng),包括輸入單元、顯示單元以及運(yùn)算處理單元。輸入單元接收使用者設(shè)定對應(yīng)一議題的一初始關(guān)鍵詞。顯示單元基于時間特性顯示議題在時間區(qū)間內(nèi)的至少一衍生議題。運(yùn)算處理單元耦接輸入單元與顯示單元,獲得時間區(qū)間內(nèi)的多個網(wǎng)頁主題內(nèi)容的多個標(biāo)簽,并根據(jù)所述標(biāo)簽共同出現(xiàn)的關(guān)聯(lián)性獲得所述網(wǎng)頁主題內(nèi)容的當(dāng)期關(guān)鍵詞組,其中,當(dāng)期關(guān)鍵詞組包括至少一當(dāng)期關(guān)鍵詞,接著運(yùn)算處理單元分析當(dāng)期關(guān)鍵詞之間以社群聲量為基礎(chǔ)計算的關(guān)聯(lián)強(qiáng)度,并將初始關(guān)鍵詞的重復(fù)度與根據(jù)社群聲量計算所得的關(guān)聯(lián)強(qiáng)度進(jìn)行比較,以決定是否產(chǎn)生至少一衍生議題,并且當(dāng)決定產(chǎn)生至少一衍生議題時,運(yùn)算處理單元使顯示單元顯示議題和至少一衍生議題。
本發(fā)明實施例提供了一種議題顯示方法,執(zhí)行于一議題顯示系統(tǒng),議題顯示系統(tǒng)包括輸入單元、顯示單元以及運(yùn)算處理單元。所述方法包括:使用者利用輸入單元設(shè)定對應(yīng)一議題的初始關(guān)鍵詞;運(yùn)算處理單元獲得一時間區(qū)間內(nèi)的多個網(wǎng)頁主題內(nèi)容的多個標(biāo)簽,并根據(jù)所述標(biāo)簽共同出現(xiàn)的關(guān)聯(lián)性獲得所述網(wǎng)頁主題內(nèi)容的當(dāng)期關(guān)鍵詞組,其中,當(dāng)期關(guān)鍵詞組包括至少一當(dāng)期關(guān)鍵詞,接著運(yùn)算處理單元分析關(guān)鍵詞之間以社群聲量為基礎(chǔ)計算的關(guān)聯(lián)強(qiáng)度,并將初始關(guān)鍵詞的重復(fù)度與根據(jù)社群聲量計算所得的關(guān)聯(lián)強(qiáng)度進(jìn)行比較,以決定是否產(chǎn)生至少一衍生議題,并且當(dāng)決定產(chǎn)生至少一衍生議題時,運(yùn)算處理單元使顯示單元顯示議題和至少一衍生議題;以及運(yùn)算處理單元利用顯示單元基于時間特性顯示議題和至少一衍生議題。
綜上所述,本發(fā)明實施例提供一種議題顯示系統(tǒng)和議題顯示方法,由議題的初始關(guān)鍵詞獲得多個網(wǎng)頁主題內(nèi)容,并進(jìn)一步獲得網(wǎng)頁主題內(nèi)容的當(dāng)期關(guān)鍵詞組。接著,獲得初始關(guān)鍵詞與當(dāng)期關(guān)鍵詞組的社群聲量,并計 算初始關(guān)鍵詞與當(dāng)期關(guān)鍵詞組之間的關(guān)聯(lián)強(qiáng)度,由此判斷是否產(chǎn)生衍生議題。據(jù)此,可以基于時間特性顯示議題的演進(jìn)。
為使能更進(jìn)一步了解本發(fā)明的特征和技術(shù)內(nèi)容,請參閱以下有關(guān)本發(fā)明的詳細(xì)說明與附圖,但是這些說明和附圖僅用于說明本發(fā)明,而非對本發(fā)明的權(quán)利范圍作任何的限制。
附圖說明
圖1是本發(fā)明實施例提供的議題顯示系統(tǒng)的示意圖。
圖2是本發(fā)明實施例提供的議題顯示分析的概念的流程圖。
圖3A是本發(fā)明實施例提供的議題顯示系統(tǒng)顯示一網(wǎng)頁主題內(nèi)容的示意圖。
圖3B是本發(fā)明實施例提供的設(shè)定追蹤的議題的互動界面的示意圖。
圖4是本發(fā)明實施例提供的字詞關(guān)系圖的示意圖。
圖5A是本發(fā)明實施例提供的在時間區(qū)間T1的當(dāng)期關(guān)鍵詞的關(guān)聯(lián)強(qiáng)度的示意圖。
圖5B是本發(fā)明實施例提供的在時間區(qū)間T2的關(guān)聯(lián)強(qiáng)度的示意圖。
圖5C是本發(fā)明實施例提供的在時間區(qū)間T3的關(guān)聯(lián)強(qiáng)度的示意圖。
圖6是本發(fā)明實施例提供的圖形化顯示議題以及衍生議題的示意圖。
圖7是本發(fā)明實施例提供的議題顯示方法的流程圖。
【符號說明】
1:議題顯示系統(tǒng)
11:輸入單元
12:運(yùn)算處理單元
13:顯示單元
2:使用者
3:網(wǎng)絡(luò)
S101、S102、S103、S104、S105、S106、S107、S108、S109、S110、S210、S220、S230、S240:步驟流程
30:主題網(wǎng)頁文章
31、34:網(wǎng)頁按鈕
32:議題
33:初始關(guān)鍵詞
35:點贊
36:分享
37:評價
401、402、403、404、405、406、407、408、409、410、411、412、413、414:字詞
T1、T2、T3:時間區(qū)間
501、502、503、504、505、506、507、508、509:關(guān)鍵詞
A1:議題
A2、A3、A4、A5、A6、A7、A8、A9、A10、A11:衍生議題
具體實施方式
〔議題顯示系統(tǒng)和議題顯示方法的實施例〕
請參照圖1,圖1是本發(fā)明實施例提供的議題顯示系統(tǒng)的示意圖。議題顯示系統(tǒng)1包括輸入單元11、顯示單元13以及運(yùn)算處理單元12。輸入單元11與顯示單元13耦接運(yùn)算處理單元12。此議題顯示系統(tǒng)1可例如設(shè)置于一連接網(wǎng)絡(luò)的網(wǎng)絡(luò)服務(wù)器,但本發(fā)明并不因此限制。使用者2可操作輸入單元11的人機(jī)互動界面或者利用終端裝置通過網(wǎng)絡(luò)連線此網(wǎng)絡(luò)服務(wù)器的輸入單元11。輸入單元11可以網(wǎng)頁方式或是特定的應(yīng)用程序界面來呈現(xiàn),但本發(fā)明并不因此限定。所述終端裝置可以是個人電腦、智能手機(jī)、平板電腦等,但本發(fā)明并不限定終端裝置的類型。運(yùn)算處理單元12則與網(wǎng)絡(luò)3連線,以搜集網(wǎng)絡(luò)3上的多個網(wǎng)址的網(wǎng)頁主題內(nèi)容。顯示單元13用以基于時間特性顯示議題和時間區(qū)間內(nèi)的至少一衍生議題。例如,顯示單元13根據(jù)時間軸顯示議題和至少一衍生議題之間的關(guān)聯(lián)性。議題顯示系統(tǒng)1的詳細(xì)的運(yùn)算處理細(xì)節(jié)將于下進(jìn)一步說明。
以下將以網(wǎng)頁呈現(xiàn)的人機(jī)互動界面作為輸入單元11和顯示單元的例子,以說明議題顯示系統(tǒng)1的操作方式。請同時參照圖1與圖2,圖2是本發(fā)明實施例提供的議題顯示分析的概念的流程圖。首先,使用者選取網(wǎng)頁的議題(步驟S101)。當(dāng)使用者利用議題顯示系統(tǒng)1觀看某一網(wǎng)頁的網(wǎng)頁主題內(nèi)容時,如圖3A的主題網(wǎng)頁文章30,此議題顯示系統(tǒng)1可提供并顯示一個加入追蹤的網(wǎng)頁按鈕31,參照圖3A,用以提供使用者設(shè)定加入追蹤的議題(S102)。議題顯示系統(tǒng)1可將欲追蹤的網(wǎng)頁導(dǎo)引至設(shè)定追蹤 的議題的互動界面的網(wǎng)頁,參照圖3B。使用者可設(shè)定議題的初始關(guān)鍵詞33。上述的初始關(guān)鍵詞33并不限定為一個關(guān)鍵詞,可以是多個關(guān)鍵詞。根據(jù)使用者2設(shè)定對應(yīng)議題32的初始關(guān)鍵詞33,當(dāng)使用者2按下新增的網(wǎng)頁按鈕34時,議題顯示系統(tǒng)1則儲存對應(yīng)議題32的初始關(guān)鍵詞33。或者,在另一實施例中,當(dāng)使用者2按下新增的網(wǎng)頁按鈕34時,初始關(guān)鍵詞33可通過輸入單元11接收使用者設(shè)定的上述主題網(wǎng)頁文章30,且運(yùn)算處理單元13分析此主題網(wǎng)頁文章30的內(nèi)容而獲得。然而,本發(fā)明并不限定議題顯示系統(tǒng)1獲得初始關(guān)鍵詞的方式。
上述的步驟S101與步驟S102是使用者操作議題顯示系統(tǒng)1的輸入單元11。使用者2可以針對多個議題設(shè)定追蹤。后續(xù)步驟S103至步驟S110是議題顯示系統(tǒng)1自動進(jìn)行運(yùn)算處理。
接著,議題顯示系統(tǒng)1設(shè)定議題關(guān)鍵詞組(包括至少一個關(guān)鍵詞)(步驟S103)。然后,議題顯示系統(tǒng)1針對網(wǎng)絡(luò)3上的網(wǎng)頁資料進(jìn)行過濾與獲取(步驟S104)。接著,運(yùn)算處理單元13可先根據(jù)當(dāng)期關(guān)鍵詞組讀取的網(wǎng)頁主題內(nèi)容,根據(jù)標(biāo)題、內(nèi)容比對或文章連結(jié)追溯方式,將網(wǎng)頁主題內(nèi)容分群(步驟S105)。將網(wǎng)頁主題內(nèi)容分群可使有相同或類似主題的文章各自成群,以有助于簡化后續(xù)分析的運(yùn)算過程或縮短運(yùn)算時間。議題顯示系統(tǒng)1可根據(jù)議題的相關(guān)性建立追蹤模型,以及提供過去相關(guān)主題既有分析信息。例如:議題顯示系統(tǒng)1使顯示的網(wǎng)頁主題內(nèi)容自動顯示此網(wǎng)頁主題內(nèi)容被點贊35、分享36或評價37的次數(shù),參照圖3A。當(dāng)使用者2后續(xù)瀏覽網(wǎng)頁時,議題顯示系統(tǒng)1也能自動顯示每個網(wǎng)頁主題內(nèi)容相關(guān)的分析主題、點贊、分享、評價等評基本信息。
如果將網(wǎng)頁主題內(nèi)容分群,則可根據(jù)分群后每一群的網(wǎng)頁主題內(nèi)容來分析至少一當(dāng)期關(guān)鍵詞之間的社群聲量,并將當(dāng)期關(guān)鍵詞組所包括的至少一當(dāng)期關(guān)鍵詞與初始關(guān)鍵詞計算重復(fù)度(或重疊率),以及將至少一當(dāng)期關(guān)鍵詞的社群聲量與初始關(guān)鍵詞的社群聲量做比較。然而,本發(fā)明并不因此限定,將網(wǎng)頁主題內(nèi)容分群的步驟S105也可以被省略。接下來將說明 議題顯示系統(tǒng)1的運(yùn)算處理單元12針對所設(shè)定的議題進(jìn)行運(yùn)算處理的過程(步驟S106至步驟S110)。
步驟S106,建立網(wǎng)頁主題內(nèi)容的標(biāo)簽。詳細(xì)的說,運(yùn)算處理單元13獲得一個可設(shè)定的(或者固定的)時間區(qū)間內(nèi)的多個網(wǎng)頁主題內(nèi)容的多個標(biāo)簽(Tags)。所述時間區(qū)間例如是以一天、一周或一個月做為單位,但本發(fā)明并不因此限定。通常而言,網(wǎng)絡(luò)3上的每一個網(wǎng)址可以對應(yīng)至少一個網(wǎng)頁主題內(nèi)容。例如:某一個網(wǎng)址顯示一則新聞,此新聞的網(wǎng)頁主題內(nèi)容就是新聞的全文。若此新聞已有設(shè)定標(biāo)簽(Tags),則直接使用已設(shè)定的標(biāo)簽。若標(biāo)簽尚未設(shè)定,則運(yùn)算處理單元13通過關(guān)鍵詞分群計算,分析此網(wǎng)頁主題內(nèi)容(新聞)的全文,以解析出多個字詞,由此獲取此新聞的一個或兩個以上的主要概念,并將其作為標(biāo)簽。
在本實施例中,運(yùn)算處理單元13根據(jù)已知的字詞數(shù)據(jù)庫或演算法,找出字詞之間的關(guān)聯(lián)性。所述字詞可能是此網(wǎng)頁主題內(nèi)容的主要概念,也可能不是。例如:利用標(biāo)準(zhǔn)化谷歌距離(normalized google distance)工具找出字詞之間的關(guān)聯(lián)與關(guān)聯(lián)強(qiáng)度?;蛘?,利用字詞數(shù)據(jù)庫中的字詞的共生性(co-occurrence),以作為定義關(guān)聯(lián)強(qiáng)度的根據(jù)。然后,決定關(guān)聯(lián)強(qiáng)度的閾值(threshold),在當(dāng)某兩個字詞的關(guān)聯(lián)強(qiáng)度在此閾值之上,則此兩個字詞被設(shè)定為有關(guān)連。當(dāng)某兩個字詞的關(guān)聯(lián)強(qiáng)度在此閾值之下,則此兩個字詞被設(shè)定為無關(guān)連。由此,形成字詞之間的關(guān)系圖。例如圖4所示的字詞關(guān)系圖,此網(wǎng)頁主題內(nèi)容具有字詞401、402、403、404、405、406、407、408、409、410、411、412、413、414,有關(guān)聯(lián)的字詞以連線表示。字詞402、403為有關(guān)聯(lián)。字詞407、408為有關(guān)聯(lián)。字詞404與字詞412有關(guān)聯(lián)。字詞410、411、412、413、414為有關(guān)聯(lián)。
然后,運(yùn)算處理單元13利用K-core演算法找出此網(wǎng)頁主題內(nèi)容的主要概念,以建立此網(wǎng)頁主題內(nèi)容的標(biāo)簽。K-core演算法是所屬技術(shù)領(lǐng)域普通技術(shù)人員的公知常識,不在此贅述。以圖4為例,當(dāng)字詞410-414代表網(wǎng)頁主題內(nèi)容的主要概念,因此經(jīng)由字詞410-414設(shè)定此網(wǎng)頁主題內(nèi)容的 一個標(biāo)簽(Tags)。根據(jù)上述,運(yùn)算處理單元13可針對多個網(wǎng)頁主題內(nèi)容設(shè)置對應(yīng)的標(biāo)簽。因此,每一個網(wǎng)頁主題內(nèi)容被對應(yīng)于一個或多個標(biāo)簽。運(yùn)算處理單元13可以利用內(nèi)部的資料儲存部件(圖未繪示)或者外部的儲存單元,如揮發(fā)式存儲器(如隨機(jī)存取存儲器(RAM))或者是非揮發(fā)式存儲器(如硬盤),以儲存這些標(biāo)簽。
接著,進(jìn)行步驟S107,進(jìn)行標(biāo)簽之間的關(guān)聯(lián)強(qiáng)度計算。運(yùn)算處理單元13根據(jù)所述標(biāo)簽共同出現(xiàn)的關(guān)聯(lián)性獲得所述網(wǎng)頁主題內(nèi)容的當(dāng)期關(guān)鍵詞組。其中,當(dāng)期關(guān)鍵詞組包括至少一當(dāng)期關(guān)鍵詞。詳細(xì)的說,運(yùn)算處理單元13判斷所述網(wǎng)頁主題內(nèi)容各標(biāo)簽在所述網(wǎng)頁主題內(nèi)容中出現(xiàn)的次數(shù)超過一出現(xiàn)次數(shù)的閾值時,則將所述標(biāo)簽決定為至少一當(dāng)期關(guān)鍵詞。以臺灣出現(xiàn)的黑心油(地溝油,gutter oil)事件為例,針對在一個初始時間區(qū)間T1內(nèi)的所有有關(guān)于黑心油的網(wǎng)頁的主題內(nèi)容,運(yùn)算處理單元13可分析所述網(wǎng)頁主題內(nèi)容,而發(fā)現(xiàn)標(biāo)簽如,黑心油、公司A、飼料油、公司B、公司C、消基會這些標(biāo)簽出現(xiàn)的次數(shù)超過出現(xiàn)次數(shù)的閾值時,則黑心油、公司A、飼料油、公司B、公司C、消基會這些標(biāo)簽就是當(dāng)期關(guān)鍵詞。所述出現(xiàn)次數(shù)的閾值可以根據(jù)實際應(yīng)用而決定,本發(fā)明并不對此限制。
接著,進(jìn)行步驟S108,判斷是否產(chǎn)生衍生議題。運(yùn)算處理單元13分別針對兩個方面決定是否產(chǎn)生衍生議題。其一是比較當(dāng)期關(guān)鍵詞與初始關(guān)鍵詞(重復(fù)度的評估),甚至是比較當(dāng)期關(guān)鍵詞組與前一期(或前兩期)關(guān)鍵詞組。其二是,基于社群聲量進(jìn)行當(dāng)期關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度的計算,以評估當(dāng)期關(guān)鍵詞組的網(wǎng)絡(luò)聲量是否高于前一期的關(guān)鍵詞組的網(wǎng)絡(luò)聲量。上述兩者是判斷衍生議題的兩個需同時存在的必要條件,根據(jù)上述兩者則可決定原本的議題是否隨著時間進(jìn)程而產(chǎn)生至少一衍生議題。若沒有產(chǎn)生衍生議題,則進(jìn)行步驟S110,產(chǎn)生議題演進(jìn)路徑示意圖。如果產(chǎn)生衍生議題,則進(jìn)行步驟S109,判斷是否要新增關(guān)鍵詞組。也就是當(dāng)獲得新的標(biāo)簽,則判斷是否要將新的標(biāo)簽新增到當(dāng)期關(guān)鍵詞組。如果要新增當(dāng)期關(guān)鍵詞組則回到步驟S103再次設(shè)定議題關(guān)鍵詞。若不需新增當(dāng)期關(guān)鍵詞組, 則進(jìn)行步驟S110,以圖形化顯示議題演進(jìn)路徑。根據(jù)上述,議題顯示系統(tǒng)1可以自動化搜索與判斷衍生議題;其中,當(dāng)期出現(xiàn)的衍生議題所產(chǎn)生的衍生關(guān)鍵詞會加入當(dāng)期關(guān)鍵詞組并進(jìn)行重復(fù)度和關(guān)聯(lián)強(qiáng)度的計算,直到?jīng)]有產(chǎn)生新衍生議題為止。
接下來將詳細(xì)說明步驟S108的演算方式。在本實施例中,基于圖5A、圖5B與圖5C顯示的時間區(qū)間T1、T2、T3的關(guān)鍵詞組與關(guān)聯(lián)強(qiáng)度,來說明如何判斷時間區(qū)間T1、時間區(qū)間T2與時間區(qū)間T3的當(dāng)期關(guān)鍵詞以及其關(guān)聯(lián)強(qiáng)度的差異,以判斷是否產(chǎn)生衍生議題。
關(guān)于關(guān)鍵詞的重復(fù)度(或重疊率),利用比較圖5A和圖5B來說明。假設(shè),初始關(guān)鍵詞是黑心油(501)、公司A(502)。在時間區(qū)間T2,除了黑心油(501)、公司A(502)、飼料油(503)、公司B(504)、公司C(505)、消基會(506),當(dāng)期關(guān)鍵詞更包括抵制(507)。相較于時間區(qū)間T1,運(yùn)算處理單元13可根據(jù)至少一當(dāng)期關(guān)鍵詞(501-507)與初始關(guān)鍵詞(黑心油(501)、公司A(502))的重疊率,以判斷時間區(qū)間T2內(nèi)的網(wǎng)頁主題內(nèi)容是否已產(chǎn)生至少一衍生議題。
在一實施例中,將圖5B與圖5A的比較可知,在時間區(qū)間T1的當(dāng)期關(guān)鍵詞(501-506)與初始關(guān)鍵詞(黑心油、公司A)的重疊率相近于在時間區(qū)間T2的當(dāng)期關(guān)鍵詞(501-507)與初始關(guān)鍵詞(黑心油(501)、公司A(502))的重疊率。在另一實施例中,運(yùn)算處理單元13也可判斷當(dāng)期關(guān)鍵詞與前一期關(guān)鍵詞的重疊率,例如將時間區(qū)間T2的當(dāng)期關(guān)鍵詞(501-507)與時間區(qū)間T1的當(dāng)期關(guān)鍵詞(501-506)做比較,發(fā)現(xiàn)只有一個當(dāng)期關(guān)鍵詞“抵制(507)”沒有重疊,而另外六個關(guān)鍵詞(501-506)都重疊。根據(jù)同樣方法,比較圖5B與圖5C,在時間區(qū)間T3的當(dāng)期關(guān)鍵詞多了消基會(506)、抵制(507)、公司D(508)與公司E(509),也就是說,時間區(qū)間T3的當(dāng)期關(guān)鍵詞與時間區(qū)間T2的當(dāng)期關(guān)鍵詞彼此重疊的是黑心油(501)、公司A(502)、飼料油(503)、公司B(504)、公司C(505)、消基會(506)。
關(guān)于關(guān)聯(lián)強(qiáng)度,以臺灣出現(xiàn)的黑心油(地溝油,gutter oil)事件為例,若以黑心油(501)和公司A(502)做為所選議題的初始關(guān)鍵詞,且得到在時間區(qū)間T1的黑心油(501)、公司A(502)、飼料油(503)、公司B(504)、公司C(505)、消基會(506)這些標(biāo)簽作為當(dāng)期關(guān)鍵詞。則黑心油(501)、公司A(502)、飼料油(503)、公司B(504)、公司C(505)、消基會(506)這些當(dāng)期關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度系分別根據(jù)這些當(dāng)期關(guān)鍵詞在時間區(qū)間T1內(nèi)的網(wǎng)頁主題內(nèi)容中出現(xiàn)的次數(shù)以及這些當(dāng)期關(guān)鍵詞在同一個網(wǎng)頁主題內(nèi)容出現(xiàn)的次數(shù),再加入這些網(wǎng)頁主題內(nèi)容對應(yīng)的社群聲量值來計算而得。所述社群聲量值是人們對應(yīng)于當(dāng)期關(guān)鍵詞產(chǎn)生在網(wǎng)絡(luò)上的活動的評估,例如是以點贊的次數(shù)、分享的次數(shù)或者評價的次數(shù)來決定。例如:社群聲量值可以根據(jù)點贊的次數(shù)、分享的次數(shù)或者評價的次數(shù)進(jìn)行權(quán)重加總而得到。然而,本發(fā)明并不限定社群聲量值的計算方式。
以圖5A為例,關(guān)聯(lián)強(qiáng)度以各個當(dāng)期關(guān)鍵詞之間的連線的粗細(xì)表示。例如黑心油(501)與公司A(502)這兩個當(dāng)期關(guān)鍵詞在同一個網(wǎng)頁主題內(nèi)容中出現(xiàn)的次數(shù)越多則代表黑心油(501)與公司A(502)這兩個當(dāng)期關(guān)鍵詞的關(guān)聯(lián)強(qiáng)度越強(qiáng)。并且,當(dāng)針對黑心油(501)與公司A(502)這兩個當(dāng)期關(guān)鍵詞的社群聲量越高,則黑心油(501)與公司A(502)這兩個當(dāng)期關(guān)鍵詞的關(guān)聯(lián)強(qiáng)度也越強(qiáng)。當(dāng)黑心油(501)與公司A(502)之間的關(guān)聯(lián)強(qiáng)度越強(qiáng),黑心油(501)與公司A(502)之間的連線越粗。此外,在圖5B中,針對時間區(qū)間T2,出現(xiàn)新的當(dāng)期關(guān)鍵詞(抵制507),且抵制(507)與消基會(506)具有強(qiáng)關(guān)聯(lián)強(qiáng)度。在圖5C中,針對時間區(qū)間T3,具有強(qiáng)關(guān)聯(lián)強(qiáng)度的當(dāng)期關(guān)鍵詞是公司C(505)、消基會(506)、抵制(507)、公司D(508)與公司E(509)。而時間區(qū)間T3的其他當(dāng)期關(guān)鍵詞包括黑心油(501)、公司A(502)、飼料油(503)與公司B(504)的關(guān)聯(lián)強(qiáng)度比較弱。
根據(jù)上述,運(yùn)算處理單元1可分析當(dāng)期關(guān)鍵詞之間以社群聲量為基礎(chǔ)計算的關(guān)聯(lián)強(qiáng)度,并與初始關(guān)鍵詞的重復(fù)度以及依社群聲量計算所得的關(guān) 聯(lián)強(qiáng)度做比較,以決定是否產(chǎn)生至少一衍生議題。以上述的圖5A、圖5B與圖5C來說明,比較圖5B與圖5A可知,時間區(qū)間T1的當(dāng)期關(guān)鍵詞和時間區(qū)間T2的當(dāng)期關(guān)鍵詞重復(fù)度相當(dāng)高,并且時間區(qū)間T1的當(dāng)期關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度與時間區(qū)間T2的當(dāng)期關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度類似,所以可決定在時間區(qū)間T2并沒有產(chǎn)生衍生議題。比較圖5C、圖5B與圖5A可知,時間區(qū)間T3的當(dāng)期關(guān)鍵詞和時間區(qū)間T2的當(dāng)期關(guān)鍵詞重復(fù)度降低(相較于時間區(qū)間T1),并且時間區(qū)間T3的當(dāng)期關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度與時間區(qū)間T1的當(dāng)期關(guān)鍵詞之間的關(guān)聯(lián)強(qiáng)度明顯不同,所以可決定在時間區(qū)間T3已產(chǎn)生衍生議題。代表所述衍生議題的衍生關(guān)鍵詞就是公司C(505)、消基會(506)、抵制(507)、公司D(508)與公司E(509)。
在另一實施例中,判斷是否產(chǎn)生衍生議題的詳細(xì)方式可以是利用關(guān)鍵詞的社群聲量加總的差異決定,例如:當(dāng)當(dāng)期關(guān)鍵詞組中所有當(dāng)期關(guān)鍵詞的社群聲量加總高于初始關(guān)鍵詞的社群聲量加總時,運(yùn)算處理單元13判斷時間區(qū)間內(nèi)的網(wǎng)頁文章已產(chǎn)生至少一衍生議題且主要討論議題已轉(zhuǎn)變。
在又一實施例中,運(yùn)算處理單元13可僅根據(jù)社群聲量高的至少一當(dāng)期關(guān)鍵詞是否改變,以判斷時間區(qū)間內(nèi)的網(wǎng)頁主題內(nèi)容是否已產(chǎn)生至少一衍生議題。以圖5B和圖5C的比較為例,假設(shè)在時間區(qū)間T2內(nèi)社群聲量高的當(dāng)期關(guān)鍵詞是黑心油(501)、公司A(502)、飼料油(503)、公司B(504)、公司C(505)、消基會(506)與抵制(507)。然而,在時間區(qū)間T3,社群聲量高的當(dāng)期關(guān)鍵詞已改變?yōu)楣綜(505)、消基會(506)、抵制(507)、公司D(508)與公司E(509)。所以可決定已產(chǎn)生至少一衍生議題。最后,當(dāng)運(yùn)算處理單元13決定產(chǎn)生至少一衍生議題時,運(yùn)算處理單元13使顯示單元12顯示議題和至少一衍生議題,如圖6所示。初始設(shè)定的議題是A1,衍生議題是A2。衍生議題A2的衍生議題是A3、A4、A5。衍生議題A3的衍生議題是A5和A6。衍生議題A5的衍生議題是A6,依此類推至衍生議題A7、A8、A9、A10、A11。據(jù)此,可以圖形化顯示議題以及至少一衍生議題的演進(jìn)過程。議題顯示系統(tǒng)1也可以進(jìn)一 步提供互動界面讓使用者點選議題(A1)和衍生議題(A2-A11)以查詢相關(guān)細(xì)部信息。
接著,請參照圖7,圖2的概念可以歸納為圖7的方法流程。本實施例的議題顯示方法執(zhí)行于圖1的議題顯示系統(tǒng)1,所述方法包括:使用者利用輸入單元設(shè)定對應(yīng)一議題的初始關(guān)鍵詞(步驟S210);然后,運(yùn)算處理單元(13)獲得一時間區(qū)間內(nèi)的多個網(wǎng)頁主題內(nèi)容的多個標(biāo)簽,并根據(jù)所述標(biāo)簽共同出現(xiàn)的關(guān)聯(lián)性獲得所述網(wǎng)頁主題內(nèi)容的當(dāng)期關(guān)鍵詞組,其中當(dāng)期關(guān)鍵詞組包括至少一當(dāng)期關(guān)鍵詞(步驟S220),接著分析關(guān)鍵詞間以社群聲量為基礎(chǔ)計算的關(guān)聯(lián)強(qiáng)度,并與初始關(guān)鍵詞的重復(fù)度以及根據(jù)社群聲量計算所得的關(guān)聯(lián)強(qiáng)度做比較,以決定是否產(chǎn)生至少一衍生議題(步驟S230),以及當(dāng)決定產(chǎn)生至少一衍生議題時,使顯示單元(11)顯示議題和至少一衍生議題;然后,運(yùn)算處理單元(13)利用顯示單元(11)基于時間特性顯示議題和至少一衍生議題(步驟S240)。
設(shè)定初始關(guān)鍵詞的步驟(S210),可對參照前述圖2的步驟S101與步驟S102的說明。針對運(yùn)算處理單元(13)的運(yùn)算步驟S220,可參照圖2的步驟S103至步驟S106的說明。步驟S230可參照圖2的步驟S107與步驟S108的說明。步驟S240可參照前述對于圖6的說明。
〔實施例的效果〕
綜上所述,本發(fā)明實施例所提供的一種議題顯示系統(tǒng)和議題顯示方法,可由議題的初始關(guān)鍵詞獲得多個網(wǎng)頁主題內(nèi)容,并進(jìn)一步獲得網(wǎng)頁主題內(nèi)容的當(dāng)期關(guān)鍵詞組。接著,獲得初始關(guān)鍵詞與當(dāng)期關(guān)鍵詞組的社群聲量,并計算初始關(guān)鍵詞與當(dāng)期關(guān)鍵詞組之間的關(guān)聯(lián)強(qiáng)度,由此判斷是否產(chǎn)生衍生議題。因此,可以基于時間特性顯示議題的演進(jìn)。由此,對使用者而言可呈現(xiàn)一個以網(wǎng)頁為基礎(chǔ)的議題演進(jìn)互動界面。另一個角度而言,本發(fā)明實施例所提供的一種議題顯示系統(tǒng)和議題顯示方法可以達(dá)到自動化 搜索與判斷衍生新議題,并自動加入衍生新議題關(guān)鍵詞,以達(dá)到擴(kuò)大議題搜索與判斷的效果。
以上所述僅為本發(fā)明的實施例,其并非用以限制本發(fā)明的專利范圍。