專利名稱:信息通信終端、信息通信系統(tǒng)、信息通信方法、信息通信程序及存儲該程序的記錄媒體的制作方法
技術領域:
本發(fā)明涉及應用于IP (Internet Protocol)電話、IP電視電話等通信技術以 及應用了如下數(shù)據(jù)處理技術的信息通信終端、信息通信系統(tǒng)、信息通信方法、 信息通信程序以及存儲了該程序的記錄媒體,該數(shù)據(jù)處理技術是取得網(wǎng)絡上 的服務器所保存的信息和用戶終端上的信息并顯示在用戶終端的畫面上。
背景技術:
隨著近年的信息技術的發(fā)展,將語音通信、WWW (World Wide Web)等 多種信息有機的結合在一起的信息應用方法得到*。用戶使用用戶終端等可 以進行如下交換
(A) 從因特網(wǎng)、專用網(wǎng)上的服務器到用戶終端的文本、語音以及圖像信 息的下載;
(B) 通過因特網(wǎng)、專用網(wǎng)在用戶終端間(兩個以上終端)交換文本、語 音以及圖像信息。
作為(A)的例子,可以舉出利用瀏覽器的因特網(wǎng)上的網(wǎng)頁瀏覽。
另外,作為(B)的例子,可以舉出利用IP電話終端的語音會話、利用 IP電視電話終端的語音 圖像通信。
以往,終端用戶在語音圖像信息的交換中想要通過下載來取得與會話相關 的文本'語音 圖像信息時,用戶向自身終端輸入關鍵字(keyword),查找存 儲有信息的位置。由于該操作是與會話并行進行,因此注意如下兩點來進行與 對話對象的通信
容易產(chǎn)生關鍵字的輸入錯誤,輸入需要時間; 檢索存儲有信息的位置時需要時間。
鑒于以上情況的現(xiàn)有技術中存在如下技術。
作為第一種技術,其特征是,從通信終端向交換設備供應商側發(fā)送的語音
信息的內(nèi)容中通過語音識別等模塊識別關鍵字,向終端反饋對應該關鍵字的分 發(fā)用信息。在該技術中,
(1) 以通過通信路徑供給分發(fā)用信息的信息共享模塊為前提,以通過交 換設備供應商的通話中繼為前提。因此,
(a) 不能應用于終端之間直接通信的類型的通信;
(b) 需要在用于進行通話的交換設備上構筑廣告信息數(shù)據(jù)庫,因此要做 廣告分發(fā)中介的運營商盡管只想提供附加信息,但在進行呼叫設定或信息交換 時需要交換設備,對于設備供應商而言構筑、應用專用交換設備需要耗費成本;
(c) 需要在交換設備內(nèi)解析用戶的語音信息,因此用戶的隱私信息的管 理依賴于交換設備供應商的運營方針。
(2) 另外,第一種技術的特征是,不是向利用者公開進行了語音識別的 關鍵字本身,而是提示與關鍵字相關聯(lián)的附加信息,另外,暫時只提示一個附 加信息。因此,無法選擇利用者自身真正想要得到的信息。因此,不具有在語 音識別結果中用戶自身選擇用戶真正需要的信息的架構。
第二種技術是進行主叫源終端和被叫目的地終端之間的通話連接的處理
方法,其主要特征是,對來自主叫者終端或者被叫目的地終端的通話語音進行 語音識別,并以語音識別結果為關鍵字來進行數(shù)據(jù)通信網(wǎng)內(nèi)的信息檢索,將檢 索結果發(fā)送至主叫源數(shù)據(jù)通信終端或者被叫目的地數(shù)據(jù)通信終端。在這樣的現(xiàn) 有技術中,
(1) 由于第一種技術中以電話交換系統(tǒng)為前提,以通過交換設備供應商 的通話中繼為前提,因此存在同樣的問題;
(2) 第一種技術的特征是在與關鍵字匹配的階段、或者只在用戶期望的 時刻、或者只在用戶期望的時間內(nèi)顯示與關鍵字相關聯(lián)的信息。不是顯示關鍵 字本身,而是除了只顯示附加信息,還暫時提示一個附加信息。因此不具有在 語音識別結果中用戶自身選擇用戶真正需要的信息的架構。
第三種技術是如下的一種系統(tǒng)其以通過網(wǎng)絡對通話連接的多個通話者終 端提供話題信息為目的,并具有語音識別^^莫塊、從識別結果中抽出關鍵字信息 的取得模塊、以及按照用戶屬性來存儲管理適合于用戶屬性的話題信息的話題 信息存儲模塊,從用戶屬性以及關鍵字選擇適合的話題。該發(fā)明是以管理用戶
屬性信息、鑒于用戶的嗜好和會話的內(nèi)容、提高提供信息的精度為目的的發(fā)明。 在這樣的現(xiàn)有技術中,
(1)由于以電話交換系統(tǒng)為前提,以通過交換設備供應商的通話中繼為 前提,因此存在與第一種技術相同的問題點;
(2 )由于需要將用戶的嗜好信息預先登錄到交換設備供應商的用戶信息 數(shù)據(jù)庫,因此交換設備運營商會知道用戶信息;
(3) 由于需要在交換設備上預先構筑用戶信息數(shù)據(jù)庫、話題信息數(shù)據(jù)庫, 因此提供信息被交換設備供應商所限定;
(4) 第三種技術的特征是,不是向利用者公開進行了語音識別的關鍵字 本身,而是提示與該關鍵字相關聯(lián)的話題信息。另外,另一特征是暫時只提示 一個附加信息。因此,無法選擇利用者自身真正想要得到的信息。因此,不具 有在語音識別結果中用戶自身選擇用戶真正需要的信息的架構。
(1) 第三種技術與第一種技術一樣,以基于交換設備供應商設置的通信 處理系統(tǒng)的通話中繼為前提,以通過交換設備供應商設置的通信處理系統(tǒng)來進 行語音識別為前"l是。在這樣的現(xiàn)有技術中,
(2) 沒有提及提供廣告信息的模塊。
(3) 是一種提示檢索結果而不向終端提示關鍵字本身的方法,另外,沒 有公開在終端的信息提供模塊。因此,不清楚從用戶發(fā)話中抽出了多個關鍵字 時的信息提示方法。還有一次顯示龐大的檢索結果的情況,不能保證進行用戶 所期望的檢索。
然而,在現(xiàn)有技術中存在如下課題
(1)用戶在語音圖像信息的交換中(例如,使用IP電話終端、IP電視電 話終端、移動電話終端的會話中等),以往如果不是通過自身的鍵盤等來輸入 或檢索存儲有信息的位置,則無法得到附加信息 廣告信息。
另夕卜,僅僅通過簡單的會話來得到用戶感興趣的信息而不妨礙與通話對象 的平滑的通信是比較困難的。
另外,不依賴于語音識別精度地向利用者提供適合的信息是比較困難的。
另外,在存在多個與會話相關聯(lián)的附加信息.廣告信息時,選擇利用者真 正想要得到的信息是比較困難的。
(2 )(用戶隱私的確保)在現(xiàn)有技術中都是通過在交換設備側分析在終端 間交換的語音圖像信息來抽出關鍵字,技術上無法保證終端間的"通信內(nèi)容的 秘密",因此用戶的隱私保護依賴于交換設備運營商的方針,無法消除用戶的 不安感。
另外,難以提供如下模塊即使不提供會話內(nèi)容的所有信息,用戶也可以
得到適合的附加信息 廣告信息。
(3)以往的語音交換是以電話專用的交換系統(tǒng)為前提,或者有關現(xiàn)有技 術的文獻中也以在專用設備上設置信息提供模塊為前提,如果不具備專用的語 音交換設備就不能實現(xiàn)"按照會話內(nèi)容的信息提供作業(yè)"。
另外,在近年的使用了 SIP ( Session Initiation Protocol)或H.323的IP電 話或IPTV電話的實現(xiàn)方式中,未必以使用電話專用的交換系統(tǒng)來實現(xiàn)語音-圖 像通信系統(tǒng)終端間的呼叫設定(地址信息的交換)或呼叫設定后的語音 圖形 信息的信息交換為前提,但是設備供應商構筑或運營專用交換設備耗費成本, 按照設備供應商的運營方針不得不由用戶來負擔其費用。
另夕卜,在當前的利用了語音或圖像的通信服務中,沒有具備顯示與會話相 關聯(lián)的廣告的功能。因此,喪失了用戶取得與通話內(nèi)容相關聯(lián)的服務或商品信 息并按照需要來利用這些信息的機會。另夕卜,對于廣告主來說同樣也喪失了提 供服務并出售商品的機會。
發(fā)明內(nèi)容
本發(fā)明的一種形式是一種信息通信終端,其與多個信息通信終端至少交換 語音信息,包括語音識別模塊,其用于信息通信終端識別所述語音信息,并 根據(jù)識別的語音信息確定多個單詞;存儲媒體,其存儲設定有用于抽出關鍵字 的條件的關鍵字抽出條件設定數(shù)據(jù);關鍵字抽出模塊,其用于讀出關鍵字抽出 條件設定數(shù)據(jù),并從多個單詞中抽出多個關鍵字;相關信息取得模塊,其用于 取得與多個關鍵字相關聯(lián)的相關信息;以及相關信息輸出模塊,其用于向監(jiān)視
器輸出相關信息。
本發(fā)明的另一種形式是一種通過網(wǎng)絡與多個信息通信終端連接的信息通 信系統(tǒng),包括語音識別模塊,其用于信息通信終端至少識別通過網(wǎng)絡發(fā)送的 語音信息,并從識別的語音信息確定多個單詞;存儲々某體,其存儲設定有用于
抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù);關鍵字抽出模塊,其用于讀出
關鍵字抽出條件設定數(shù)據(jù),并從多個單詞中抽出多個關鍵字;相關信息取得模 塊,其用于取得與多個關鍵字相關聯(lián)的相關信息;以及相關信息輸出模塊,其 用于向監(jiān)視器輸出相關信息。
本發(fā)明的另 一形式是一種信息通信方法,其使用信息通信終端與其他信息 通信終端至少交換語音信息,上述信息通信終端具有語音識別模塊、存儲媒體、 關鍵字抽出模塊、相關信息取得模塊、相關信息輸出模塊、以及監(jiān)視器,上述 信息通信方法包括如下步驟語音識別模塊從語音信息識別多個單詞;存儲Jf某 體存儲含有用于抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù);關鍵字抽出模 塊從存儲媒體中讀出關鍵字抽出條件設定數(shù)據(jù),并從多個單詞中抽出多個關4建 字;相關信息取得模塊取得與多個關鍵字相關聯(lián)的相關信息;以及相關信息輸 出模塊向監(jiān)視器輸出相關信息。
本發(fā)明的另 一形式是信息通信程序,其使用信息通信終端與其他信息通信 終端至少交換語音信息,上述信息通信終端具有語音識別模塊、存儲媒體、關 鍵字抽出模塊、相關信息取得模塊、相關信息輸出模塊、以及監(jiān)視器,上述信 息通信程序使計算機執(zhí)行包括如下命令的一連串的命令使語音識別模塊從語 音信息識別多個單詞;使存儲媒體存儲含有用于抽出關鍵字的條件的關鍵字抽 出條件設定數(shù)據(jù);使關鍵字抽出模塊從存儲媒體中讀出關鍵字抽出條件設定數(shù) 據(jù),并從多個單詞中抽出多個關鍵字;使相關信息取得模塊取得與多個關鍵字 相關聯(lián)的相關信息;以及使相關信息輸出模塊輸出相關信息。
本發(fā)明的另 一形式是一種記錄有信息通信程序的計算才幾可讀的存儲媒體, 上述信息通信程序是使用信息通信終端與其他通信終端至少交換語音信息的 信息通信程序,上述信息通信終端具有語音識別模塊、存儲々某體、關鍵字抽出 模塊、相關信息取得模塊、相關信息輸出模塊、以及監(jiān)視器,上述存儲媒體記 錄有使計算機執(zhí)行如下命令的程序使語音識別模塊從語音信息識別多個單 詞;使存儲媒體存儲含有用于抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù); 使關鍵字抽出模塊從存儲媒體中讀出關鍵字抽出條件設定數(shù)據(jù),并從多個單詞 中抽出多個關鍵字;使相關信息取得模塊取得與多個關鍵字相關聯(lián)的相關信 息;以及使相關信息輸出模塊輸出相關信息。
圖1是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的整體結構的結 構圖。
圖2是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的啟動順序的流 程圖。
圖3是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的關鍵字顯示順 序的流程圖。
圖4A是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的取得條件受理 /信息顯示順序的流程圖。
圖4B是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的取得條件受理 /信息顯示順序的流程圖。
圖5是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的共享信息接收/. 顯示順序的流程圖。
圖6A是用于說明本發(fā)明的第 一 實施方式的信息通信系統(tǒng)的共享信息接收 /信息顯示順序的流程圖。
圖6B是用于說明本發(fā)明的第 一 實施方式的信息通信系統(tǒng)的共享信息接收 /信息顯示順序的流程圖。
圖6C是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的共享信息接收 /信息顯示順序的流程圖。
圖7是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的廣告信息提供 順序的流程圖。
圖8是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的取得方法信息 提供順序的流程圖。
圖9是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的相關信息提供 順序的流程圖。
圖10是用于說明本發(fā)明的第一實施方式的信息通信系統(tǒng)的檢索信息提供 順序的流程圖。
圖11是用于說明本發(fā)明的第一實施方式的履歷信息登錄順序的流程圖。 圖12表示本發(fā)明的第一實施方式的信息通信終端的畫面輸出圖像的例子。
圖13表示本發(fā)明的第一實施方式的信息通信終端的畫面輸出圖像的例子。
圖14表示本發(fā)明的第一實施方式的動作條件設定數(shù)據(jù)的例子。 圖15表示本發(fā)明的第 一 實施方式的關鍵字抽出條件設定數(shù)據(jù)的例子。 圖16表示本發(fā)明的第一實施方式的默認取得順序設定數(shù)據(jù)的例子。 圖17表示本發(fā)明的第一實施方式的抽出關鍵字履歷數(shù)據(jù)的例子。 圖18表示本發(fā)明的第一實施方式的相關信息取得履歷數(shù)據(jù)的例子。 圖19表示本發(fā)明的第一實施方式的本地位置數(shù)據(jù)的例子。 圖20表示本發(fā)明的第一實施方式的位置數(shù)據(jù)的例子。 圖21表示本發(fā)明的第一實施方式的履歷數(shù)據(jù)的例子。 圖22表示本發(fā)明的第一實施方式的廣告數(shù)據(jù)的例子。 圖23是用于說明本發(fā)明的第二實施方式的數(shù)據(jù)通信系統(tǒng)的整體結構的結 構圖。
圖24是用于說明本發(fā)明的第二實施方式的關鍵字顯示順序的流程圖。 圖25是用于說明本發(fā)明的第二實施方式的共享信息接收/信息顯示順序的 流程圖。
圖26是用于說明本發(fā)明的第三實施方式的信息通信系統(tǒng)的整體結構的結 構圖。
圖27表示本發(fā)明的第三實施方式的信息通信系統(tǒng)的感情信息履歷數(shù)據(jù)的 例子。
圖28表示本發(fā)明的第三實施方式的信息通信系統(tǒng)的動作條件設定數(shù)據(jù)的 例子。
圖29是用于說明本發(fā)明的第三實施方式的信息通信系統(tǒng)的感情信息交換 順的流程圖。
圖30是用于說明本發(fā)明的第四實施方式的數(shù)據(jù)通信系統(tǒng)的整體結構的結 構圖。
圖31是用于說明本發(fā)明的第四實施方式的啟動順序的流程圖。
圖32是用于說明本發(fā)明的第四實施方式的警告顯示順序的流程圖。
圖33是用于說明本發(fā)明的第四實施方式的通話切斷順序的流程圖。
圖34是用于說明本發(fā)明的第四實施方式的錄音順序的流程圖。 圖35是用于說明本發(fā)明的第四實施方式的警告信息提供順序的流程圖。 圖36表示本發(fā)明的第四實施方式的動作條件設定數(shù)據(jù)的例子。 圖37表示本發(fā)明的第四實施方式的警告條件設定數(shù)據(jù)的例子。 圖38表示本發(fā)明的第四實施方式的抽出關鍵字履歷數(shù)據(jù)的例子。 圖39是用于說明本發(fā)明的第五實施方式的信息通信系統(tǒng)的整體結構的結 構圖。
圖40是用于說明本發(fā)明的第五實施方式的信息通信系統(tǒng)的關鍵字顯示順 序的流程圖。
圖41是用于說明本發(fā)明的第五實施方式的關鍵字抽出服務器進行的服務 器側關鍵字抽出順序的流程圖。
圖42表示本發(fā)明的第五實施方式的動作條件設定數(shù)據(jù)的例子。
圖43表示本發(fā)明的第五實施方式的抽出關鍵字履歷數(shù)據(jù)的例子。
圖44表示本發(fā)明的第五實施方式的相關信息取得履歷數(shù)據(jù)的例子。
圖45表示本發(fā)明的第五實施方式的履歷數(shù)據(jù)的例子。
圖46是用于說明本發(fā)明第五實施方式的第 一 實施例的關鍵字抽出服務器 的整體結構的結構圖。
圖47是用于說明本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽 出服務器的整體結構的結構圖。
圖48是用于"i兌明本發(fā)明第五實施方式的第一實施例的構成知識網(wǎng)絡記錄 部內(nèi)的知識網(wǎng)絡的節(jié)點(詞匯)的一例。
圖49表示本發(fā)明第五實施方式的第一實施例的知識網(wǎng)絡記錄部內(nèi)的知識 網(wǎng)絡的一例。
圖50是用于說明本發(fā)明第五實施方式的第 一實施例的關鍵字抽出服務器 的同音同寫法異義語意思判斷處理的動作的流程圖。
圖51是用于說明本發(fā)明第五實施方式的第一實施例的關鍵字抽出服務器 的同音同寫法異義語意思判斷處理中的同音同寫法異義語意思判斷算法的流程圖。
圖52表示本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽出服務
器中將知識網(wǎng)絡的各詞匯的ID號碼、寫法以及讀音相對應起來的要素信息例。 圖53表示本發(fā)明第五實施方式的第一實施例的變更例的知識網(wǎng)絡記錄部
內(nèi)的知識網(wǎng)絡的具體例。
圖54表示在本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽出服
務器中的輸入文本數(shù)據(jù)例以及從輸入文本數(shù)據(jù)例抽出了單詞集合的輸入單詞
集合例。
圖55表示在本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽出服 務器中,使用圖52以及圖53所示的知識網(wǎng)絡,并使用圖54所示的輸入文本 數(shù)據(jù)例以及從輸入文本數(shù)據(jù)例抽出了單詞集合的輸入單詞集合例以判斷同音 同寫法異義語意思的結果的例子。
圖56表示本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽出服務 器中的輸入文本數(shù)據(jù)例以及從輸入文本數(shù)據(jù)例抽出了單詞集合的輸入單詞集 合例的另一例子。
圖57表示在本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽出服 務器中,使用圖58所示的知識網(wǎng)絡,并使用圖56所示的輸入文本數(shù)據(jù)例以及 從輸入文本數(shù)據(jù)例抽出了單詞集合的輸入單詞集合例以判斷同音同寫法異義 語意思的結果的例子。
圖58表示在本發(fā)明第五實施方式的第一實施例的變更例的關鍵字抽出服 務器中知識網(wǎng)絡數(shù)據(jù)存儲部內(nèi)的知識網(wǎng)絡的另 一具體例。
圖59是用于說明本發(fā)明第五實施方式的第二實施例的關鍵字抽出服務器 的整體結構的結構圖。
圖60表示本發(fā)明第五賣施方式的第二實施例的單詞詞典的表的一例。
圖61表示本發(fā)明第五實施方式的第二實施例的單詞相關度詞典的表的一例。
圖62是表達圖63所示的知識網(wǎng)絡的單詞相關度詞典的表的一例。
圖63表示本發(fā)明第五實施方式的第二實施例的知識網(wǎng)絡的模式圖的一例。
圖64是表達圖63所示的知識網(wǎng)絡的單詞詞典的表的一例。
17 圖65表示本發(fā)明第五實施方式的第二實施例的文本數(shù)據(jù)的 一例。
圖66是本發(fā)明第五實施方式的第二實施例的文本數(shù)據(jù)的確認結果的說明圖。
圖67是本發(fā)明第五實施方式的第二實施例的單詞列(窗口 )的一例的說 明圖。
圖68表示用于說明本發(fā)明第五實施方式的第二實施例的評價結果的圖表 的一例。
圖69表示用于說明本發(fā)明第五實施方式的第二實施例的評價結果中抽出 了點數(shù)為上位B ( = 5)個的例子的圖表。
圖70表示在本發(fā)明第五實施方式的第二實施例的評價結果中抽出了點數(shù) 為閾值C ( =1.00)以上的單詞的例子的圖表。
圖71是用于說明本發(fā)明第五實施方式的第二實施例的話題語的抽出結果 的模式圖。
圖72是用于說明本發(fā)明第五實施方式的第二實施例的話題抽出方法的流 程圖。
圖73表示用于說明本發(fā)明第五實施方式的第二實施例的變更例的、針對 時間的窗口尺寸=5的窗口變化的圖表。
圖74表示用于說明本發(fā)明第五實施方式的第二實施例的變更例的、抽出 了窗口尺寸-5且點數(shù)為上位B ( = 2)個的話題語的一例的圖表。
圖75表示用于說明本發(fā)明第五實施方式的第二實施例的變更例的、抽出 了窗口尺寸-5且閾值C ( =1.00)以上的話題語的一例的圖表。
圖76是用于說明本發(fā)明第五實施方式的第三實施例的關鍵字抽出服務器 的整體結構的結構圖。
圖77表示在本發(fā)明第五實施方式的第三實施例的關鍵字抽出服務器中使 用的知識網(wǎng)絡數(shù)據(jù)的節(jié)點屬性數(shù)據(jù)的例子。
圖78表示在本發(fā)明第五實施方式的第三實施例的關鍵字抽出服務器中使 用的知識網(wǎng)絡數(shù)據(jù)的鏈接屬性數(shù)據(jù)的例子。
圖79是用于說明以視覺方式表達了圖77以及圖78所示的節(jié)點屬性數(shù)據(jù) 和鏈接屬性數(shù)據(jù)的關系的知識網(wǎng)絡數(shù)據(jù)的模式圖。
圖80是表示本發(fā)明第五實施方式的第三實施例的文本解析方法的流程圖。
圖81表示本發(fā)明第五實施方式的第三實施例的輸入文本數(shù)據(jù)的一例。
圖82是本發(fā)明第五實施方式的第三實施例的單詞抽出處理中的單詞抽出 條件設定數(shù)據(jù)的一例的"i兌明圖。
圖83是本發(fā)明第五實施方式的第三實施例的單詞抽出單元輸出的單詞的 抽出結果的一例的說明圖。
圖84表示本發(fā)明第五實施方式的第三實施例的單詞間最短距離計算處理 中的最短距離計算條件設定數(shù)據(jù)的一例。
圖85表示本發(fā)明第五實施方式的第三實施例的單詞間最短距離單元輸出 的最短距離數(shù)據(jù)的一例。
圖86表示本發(fā)明第五實施方式的第三實施例的第一文本解析方法中的關 鍵字抽出條件設定數(shù)據(jù)的 一例。
圖87表示本發(fā)明第五實施方式的第三實施例的第一文本解析方法中的單 詞評價數(shù)據(jù)的一例。
圖88表示通過本發(fā)明第五實施方式的第三實施例的第一文本解析方法輸 出的關鍵字抽出結果的一例。
圖89表示本發(fā)明第五實施方式的第三實施例的相關語抽出條件設定數(shù)據(jù) 的一例。
圖90表示通過本發(fā)明第五實施方式的第三實施例的第一文本解析方法輸 出的相關語抽出結果的 一例。
圖91表示本發(fā)明第五實施方式的第三實施例的第二文本解析方法中的關 鍵字抽出條件設定數(shù)據(jù)的 一例。
圖92表示通過本發(fā)明第五實施方式的第三實施例的第二文本解析方法輸 出的單詞評價數(shù)據(jù)的 一例。
圖93表示通過本發(fā)明實施方式的第二文本解析方法輸出的關鍵字輸出結 果的一例。
圖94表示通過本發(fā)明第五實施方式的第三實施例的第二文本解析方法輸 出的相關語抽出結果的 一例。
圖95是用于說明本發(fā)明的其他實施方式的信息通信系統(tǒng)的整體結果的結 構圖。
圖96是用于說明本發(fā)明的其他實施方式的信息通信系統(tǒng)的整體結構的結構圖。
具體實施方式
(第一實施方式) -整體結構的說明-
如圖l所示,本發(fā)明的第一實施方式的信息通信系統(tǒng)具備包括語音圖像 通信終端在內(nèi)的信息通信終端100、相關信息服務器104、檢索服務器105、 位置服務器102以及廣告信息服務器103。各結構系統(tǒng)通過網(wǎng)絡101可以互相 進4亍通信。
存在多臺信息通信終端100。信息通信終端IOO具有使用語音圖像交換模 塊l來實時交換語音、圖像信息的IP電話、IPTV電話功能。
作為呼叫控制的具體方式,假設與H.323、 SIP等協(xié)議對應。信息通信終 端100從通過IP電話、IPTV電話來交換的語音信息中抽出關鍵字,從;險索服 務器105或相關信息服務器104取得與關鍵字相關聯(lián)的信息并顯示在畫面上。
作為相關信息服務器104,假設在因特網(wǎng)提供信息的Web服務器整體。
更具體地,假設具有如下功能的相關信息服務器104,該功能是當指定 信息的位置(ex.URL-相關信息服務器104的位置+相關信息服務器104內(nèi) 的信息的位置)時,反饋文本數(shù)據(jù)、HTML數(shù)據(jù)、語音流數(shù)據(jù)、圖像流數(shù)據(jù)等 信息。信息通信終端IOO將從相關信息服務器104取得的這些信息顯示在監(jiān)視 器2上。
作為檢索服務器105,例如可以使用通過檢索服務等而提供的檢索服務器。
更具體地,假設具有如下功能的服務器對檢索服務器105的位置 (ex.URL)發(fā)送關鍵字時,反饋檢索結果(-與相關信息服務器104的位置 (ex.URL)相關聯(lián)的信息的部分內(nèi)容,該相關信息服務器104存儲有與關鍵 字相關聯(lián)的信息)的列表。
假設信息通信終端IOO將從檢索服務器105取得的檢索結果列表顯示在畫
面上。未圖示的用戶通過從列表中指定想要取得信息的相關信息服務器104 的位置可以將信息顯示在畫面上。
位置服務器102是與信息通信終端100成對地使用的系統(tǒng),保存位置數(shù)據(jù)
35和履歷數(shù)據(jù)36。
所謂位置數(shù)據(jù)35,是表示存儲有關鍵字和與關鍵字相關聯(lián)的信息的位置 (ex.URL)的組合的數(shù)據(jù),假設由位置服務器102的未圖示的運營商來編輯 管理。
運營商對于各個關鍵字,登錄將認為最合適的信息作為在會話中發(fā)生了關 鍵字時應提供的信息來存儲的位置(ex.URL)。假設在位置服務器102上的存 儲媒體34中登錄應隨時更新的數(shù)據(jù)來作為位置數(shù)據(jù)35,該應隨時更新的數(shù)據(jù) 例如有存儲有時事關鍵字和關鍵字解說信息的位置(ex.URL)等(關于不 需要更新的數(shù)據(jù),假設主要在信息通信終端100上的存儲媒體20中作為本地 位置數(shù)據(jù)26來登錄)。
在信息通信終端100中設定了允許利用位置服務器102時(后述的外部服 務器利用可否設定為['T,允許]時),信息通信終端IOO可以根據(jù)關鍵字從位 置服務器102取得相關信息服務器104的位置(ex.URL),然后從相關信息服 務器104取得信息并顯示在畫面上。由此,在會話中發(fā)生了關鍵字時,用戶可 以瀏覽位置服務器102的運營商判斷為最適合于關鍵字的信息。
另外,所謂履歷數(shù)據(jù)36,是表示"關鍵字"以及"各信息通信終端100 與關鍵字相關聯(lián)地顯示在畫面上的信息的位置"的組合的數(shù)據(jù),是由允許收集 履歷數(shù)據(jù)36的(外部服務器利用可否設定為["1"允許]的)信息通信終端100 按照相關信息的顯示登錄在位置服務器102中。
信息通信終端IOO也可以從位置服務器102取得與關鍵字相關聯(lián)最常被參 照的相關信息服務器104的位置(ex.URL),然后從相關信息服務器104取得 信息并顯示在畫面上。(如后所述,在外部服務器利用可否設定為["0"禁止] 時,參照在一臺信息通信終端100內(nèi)封閉的履歷數(shù)據(jù)(相關信息取得履歷數(shù)據(jù) 22),取得最常被參照的相關信息服務器104的位置(ex.URL))
廣告信息服務器103是與信息通信終端100成對地使用的系統(tǒng),保存廣告 數(shù)據(jù)41。
所謂廣告數(shù)據(jù)41,是表示關鍵字和與關鍵字相關聯(lián)的廣告信息的組合的 數(shù)據(jù),假設由廣告信息服務器103的運營商來編輯管理。
運營商從廣告主取得顯示廣告的"關鍵字"和廣告信息(顯示的廣告內(nèi)容),
并登錄到廣告數(shù)據(jù)41。作為廣告信息,假設文本數(shù)據(jù)、HTML數(shù)據(jù)、語音流 數(shù)據(jù)、圖像流數(shù)據(jù)等信息。
為["1"需要]時),信息通信終端100可以根據(jù)關鍵字從廣告信息服務器103 取得廣告信息,并顯示在畫面上。
<信息通信終端100的結構和動作的說明>
信息通信終端100包括語音圖像交換模塊1、監(jiān)視器2、鍵盤 鼠標3、 啟動模塊4、語音輸入模塊5、語音識別模塊6、關鍵字受理模塊7、關鍵字抽 出模塊8、信息取得條件受理模塊9、信息取得方法決定模塊10、相關信息取 得模塊11、廣告信息取得模塊12、關鍵字輸出模塊13、相關信息輸出模塊14、 共享信息發(fā)送模塊15、共享信息受理模塊16、履歷登錄模塊17、控制模塊18、 通信模塊19以及存儲媒體20。下面對各模塊進行說明。
語音圖像交換模塊1使用通信模塊19,與其他信息通信終端100進行圖 像、語音信息的實時交換。 一般是提供被稱為IP電話、IP電視電話的功能的 模塊。具體而言,假設對應于H.323、 SIP等呼叫控制協(xié)議,對應于R261/H. 263/H.263+/H.264/MPEG - 4等視頻編解碼器、G711/G.728/G.729/G.722/G.722. l等音頻編解碼器。另外,假設在呼叫控制上還對應于不使用專用呼叫代理(c all agent)、網(wǎng)守(gate keeper)的所謂的P2P的呼叫控制。
監(jiān)視器2是由控制模塊18控制的,向信息通信終端100的用戶顯示語音 圖像交換模塊1交換的圖像、以及關鍵字輸出模塊13和相關信息取得模塊11 輸出的信息的系統(tǒng)。具體而言,假設一種利用了液晶、布朗管(BraunTube) 的顯示系統(tǒng)。
鍵盤 鼠標3是由控制模塊18控制的, 一種在信息通信終端100的用戶 向關鍵字受理模塊7輸入取得相關信息的條件(關鍵字、取得方法等)時使用 的系統(tǒng)。另夕卜,也用于信息通信終端100的用戶啟動語音圖像通信方式的情況。
啟動模塊4是通過信息通信終端IOO的用戶用鍵盤.鼠標3進行輸入而啟
動的,按照動作條件設定數(shù)據(jù)23的設定內(nèi)容啟動語音圖像交換模塊1、語音
輸入模塊5、信息取得條件受理模塊9以及共享信息受理模塊16時使用的模 塊。
語音輸入模塊5是取得語音圖像交換模塊1與其他信息通信終端100進行 交換的語音信息并轉交給語音識別模塊6的模塊。優(yōu)選具有除了取得語音信息 以外,還取得有關語音圖像交換模塊1進行的通話的信息(語音附加信息)并 轉交給語音識別模塊6的功能。假設語音附加信息是通話ID、通話者ID、發(fā) 話者ID中的任意一個或者包括所有這些信息。
語音識別模塊6是從語音輸入模塊5取得的語音信息中確定通話中所包含 的單詞和其詞類,并將單詞信息(單詞、詞類)和語音附加信息轉交給關鍵字 抽出模塊8的模塊。
語音識別模塊6的所有功能并不限于都存儲在信息通信終端100上,也可 以假設一部分功能存儲在計算能力更高的其他終端上。
關鍵字抽出模塊8根據(jù)關鍵字抽出條件設定數(shù)據(jù)24,從由語音識別模塊6 取得的單詞信息(單詞、詞類)中抽出關鍵字,根據(jù)抽出的關鍵字和語音附加 信息生成抽出關鍵字履歷數(shù)據(jù)21,并存儲該抽出關鍵字履歷數(shù)據(jù)21后轉交給 關鍵字受理模塊7。通過使用該模塊,信息通信終端IOO的用戶可以縮小顯示 在監(jiān)視器2上的關鍵字。
關鍵字受理模塊7是使用關鍵字輸出模塊13向監(jiān)視器2輸出從關鍵字抽 出模塊8取得的抽出關鍵字的模塊。另夕卜,還具有如下功能在動作條件設定 數(shù)據(jù)23中設定有廣告顯示與否為["1"需要]時,使用廣告信息取得模塊12 取得與抽出關鍵字相關聯(lián)的廣告信息,并使用關鍵字輸出模塊13輸出到監(jiān)視 器2。
具有如下功能在動作條件設定數(shù)據(jù)23中設定有信息取得條件輸入與否 為["0"不需要]時,不受理由信息通信終端100的用戶輸入的取得條件,使 用信息取得方法決定模塊10以及相關信息取得模塊11取得相關信息,并輸出 至監(jiān)視器2;另外,進一步在動作條件設定數(shù)據(jù)23中設定有外部服務器利用 與否為["1"允許]時,使用履歷登錄模塊17向位置服務器2登錄與輸出至監(jiān) 視器2的相關信息有關的履歷數(shù)據(jù)36。
信息取得條件受理模塊9具有如下功能受理由信息通信終端100的用戶
輸入的取得條件(對象關鍵字、相關信息取得方法),使用信息取得方法決定
模塊10決定所取得的相關信息的位置(URL等),并根據(jù)所決定的位置(URL 等),使用相關信息取得模塊11取得相關信息并輸出至監(jiān)視器2;另外,進一 步在動作條件設定數(shù)據(jù)23中設定有外部服務器利用與否為["1"允許]時,使 用履歷登錄模塊17向位置服務器102登錄與輸出至監(jiān)視器2的相關信息有關 的履歷數(shù)據(jù)36;在動作條件設定數(shù)據(jù)23中設定有共享條件為["1"需要]時, 使用共享信息發(fā)送模塊15,與通話對象共享相關信息的取得方法或取得的相 關信息本身。
信息取得方法決定模塊IO是如下一種模塊根據(jù)由信息通信終端100的 用戶進行的相關信息取得條件(對象關鍵字、相關信息取得方法)的輸入、或 者根據(jù)保存在存儲々某體20中的默認取得順序設定數(shù)據(jù)25,訪問本地位置數(shù)據(jù) 26、動作條件設定數(shù)據(jù)23、位置服務器102,由此決定所取得的相關信息的位 置(URL等)。由關鍵字受理模塊7以及信息取得條件受理模塊9來調用信息 取得方法決定模塊10。
相關信息取得模塊11是根據(jù)信息取得方法決定模塊IO所決定的相關信息 的位置(URL等)、或者由信息通信終端100的用戶輸入的相關信息的位置 (URL等)來取得相關信息的模塊。成為取得象的相關信息有保存在信 息通信終端100中的用戶個人信息(地址簿數(shù)據(jù)27、預定表數(shù)據(jù)28、郵件收 發(fā)數(shù)據(jù)29等)、與網(wǎng)絡101連接的相關信息服務器104的相關信息、以及;險索 服務器105的檢索結果信息等。在從相關信息服務器104、檢索服務器105取 得信息時使用通信模塊19。
由關鍵字受理模塊7、信息取得條件受理模塊9以及共享信息受理模塊16 來調用相關信息取得模塊11。
廣告信息取得模塊12是在動作條件設定數(shù)據(jù)23中設定有廣告顯示與否為 ["1"需要]時,使用通信模塊19從廣告信息服務器103取得與關鍵字相關聯(lián) 的廣告信息的模塊。由關鍵字受理模塊7以及信息取得條件受理模塊9來調用 廣告信息取得模塊12。
關鍵字輸出模塊13是將關鍵字抽出模塊8抽出的關鍵字或廣告信息取得
模塊12取得的廣告信息輸出至監(jiān)視器2的模塊。由關鍵字受理模塊7、信息
取得條件受理模塊9來調用關鍵字輸出模塊13。
相關信息輸出模塊14是將相關信息取得模塊11取得的相關信息輸出至監(jiān) 視器2的模塊。由關鍵字受理模塊7、信息取得條件受理模塊9以及共享信息 受理模塊16來調用相關信息輸出模塊14。
共享信息發(fā)送模塊15是使用通信模塊19向通話對象的信息通信終端100 發(fā)送信息取得方法決定模塊10所決定的相關信息取得方法(位置等)、或者相 關信息取得模塊11所取得的相關信息的模塊。假設通話對象的信息通信終端 IOO為多臺。
共享信息受理模塊16使用通信模塊19接收通話對象的共享信息發(fā)送模塊 15發(fā)送的相關信息的取得方法(位置等)、或者相關信息取得模塊11所取得 的相關信息,并根據(jù)接收到的相關信息取得方法,使用相關信息取得模塊11 取得相關信息,輸出至監(jiān)視器2。
履歷登錄模塊17是在動作條件設定數(shù)據(jù)23中設定有外部服務器利用與否 為["1"需要]時,使用通信模塊19向位置服務器102登錄履歷數(shù)據(jù)36的模 塊,該履歷數(shù)據(jù)36與使用相關信息輸出模塊14輸出至監(jiān)視器2的相關信息有 關。由關鍵字受理模塊7、信息取得條件受理模塊9來調用履歷登錄模塊17。
控制模塊18向關鍵字受理模塊7傳遞鍵盤 鼠標3的輸入信息,向監(jiān)視 器2輸出語音圖像交換模塊1所交換的圖像、以及關鍵字輸出模塊13和相關 信息取得模塊11輸出的信息。
而且,控制模塊18按照來自語音圖像交換模塊1、廣告信息取得模塊12、 信息取得方法決定模塊10、相關信息輸出模塊14、共享信息發(fā)送模塊15、共 享信息受理模塊16、以及履歷登錄模塊17的請求,利用通信模塊19。
劣外,控制模塊18控制關鍵字受理模塊7、關鍵字抽出模塊8、信息取得 條件受理模塊9、信息取得方法決定模塊10、相關信息取得模塊11、以及共 享信息受理才莫塊16向存儲媒體的讀寫。例如,可以使用Windows (注冊商標) 等操作系統(tǒng)。
通信模塊19由控制模塊18控制,在語音圖像交換模塊l、廣告信息取得 模塊12、信息取得方法決定模塊10、相關信息輸出模塊14、共享信息發(fā)送模
塊15、共享信息受理才莫塊16、履歷登錄模塊17通過網(wǎng)絡101與其他信息通信 終端IOO或相關信息服務器104、位置服務器102、廣告信息服務器103、檢 索服務器105交換信息時使用該通信模塊19。具體而言,假設用于以物理的 方式發(fā)送數(shù)據(jù)的系統(tǒng)(調制解調器)和其控制軟件。
存儲媒體20由控制模塊18控制,通過關鍵字受理模塊7、關鍵字抽出模 塊8、信息取得條件受理模塊9、信息取得方法決定模塊10、相關信息取得模 塊11、以及共享信息受理模塊16來進行信息的保存和讀出。存儲媒體20存 儲設定數(shù)據(jù)文件20a、履歷數(shù)據(jù)文件20b、位置數(shù)據(jù)文件20c、個人信息數(shù)據(jù) 文件20d。
設定數(shù)據(jù)文件20a存儲動作條件設定數(shù)據(jù)23、關鍵字抽出條件設定數(shù)據(jù) 24、以及默認取得順序設定數(shù)據(jù)25。履歷數(shù)據(jù)文件20b存儲抽出關鍵字履歷 數(shù)據(jù)21以及相關信息取得履歷數(shù)據(jù)22。位置數(shù)據(jù)文件20c存儲本地位置數(shù)據(jù) 26。個人信息數(shù)據(jù)文件20d存儲地址簿數(shù)據(jù)27、預定表數(shù)據(jù)28、郵件收發(fā)數(shù) 據(jù)29。
抽出關鍵字履歷數(shù)據(jù)21是表示由語音識別模塊6和關鍵字抽出模塊8從 語音信息抽出的關鍵字的履歷的數(shù)據(jù),假設由抽出年月日時刻、通話ID、請 求通話者ID、用于分別識別多個通話者的多種通話者ID、發(fā)話者ID、以及抽 出關鍵字構成。各項目的內(nèi)容或設定的一個例子可以參照圖17所示的抽出關 鍵字履歷數(shù)據(jù)。
此外,通話者ID數(shù)不限定于特定的數(shù)目,只要是與語音圖像交換模塊1 可同時通話的信息通信終端100的數(shù)目即可。
相關信息取得履歷數(shù)據(jù)22是表示由廣告信息取得模塊12、相關信息取得 模塊ll進行的信息取得的履歷的數(shù)據(jù),假設由受理年月日時刻、通話ID、請 求通話者ID、請求關鍵字、取得條件("0" ~ "8")、共享條件、請求數(shù)據(jù)位 置、以及取得數(shù)據(jù)位置構成。各項目的內(nèi)容或設定的一個例子可以參照圖18 所示的相關信息取得履歷數(shù)據(jù)。
在動作條件設定凄t據(jù)23中存儲有信息通信終端100的動作上的設定數(shù)據(jù)。 假設動作條件設定數(shù)據(jù)23由請求通話者ID、信息取得條件輸入與否、廣告顯 示與否、外部服務器利用與否、默認共享條件設定、以及廣告信息服務器103
的位置(履歷用)構成。各項目的內(nèi)容或設定的一個例子可以參照圖14所示 的動作條件設定數(shù)據(jù)。
關鍵字抽出條件設定數(shù)據(jù)24是如下一種數(shù)據(jù)用于在由語音識別模塊6 從語音信息識別的單詞中,由關鍵字抽出模塊8按照詞類設定應作為抽出對象 的單詞。假設關鍵字抽出條件設定數(shù)據(jù)24例如由請求通話者ID、固有名詞抽 出與否、名詞抽出與否、以及動詞抽出與否構成。各項目的內(nèi)容或設定的一個 例子可以參照圖15所示的關鍵字抽出條件設定數(shù)據(jù)。
另夕卜,假設項目數(shù)可以與語音識別模塊6分類詞類數(shù)相同,還假設不僅通 過設定詞類,而且通過設定特定的固有名詞或意思分類來設定作為關鍵字應抽 出的單詞。
默認取得順序設定數(shù)據(jù)25是在沒有由用戶輸入了相關信息取得條件時設 定在信息取得方法決定模塊IO應用的取得條件的默認順序的數(shù)據(jù)。默認取得 順序設定數(shù)據(jù)25至少由請求通話者ID、第一默認取得條件、第二默認取得條 件、第三默認取得條件、第四默認取得條件、第五默認取得條件、第六默認取 得條件、以及第七默認取得條件構成。
各項目的內(nèi)容或設定的一個例子可以參照圖16所示的默認取得順序設定 數(shù)據(jù)。另外,第一~第七默認取得條件不限定于七個,在定義了新的取得條件 時,也可以是與應用的取得條件數(shù)相同的數(shù)目。
本地位置數(shù)據(jù)26是在取得條件為["4"從用戶終端的存儲媒體20中的本 地位置數(shù)據(jù)26取得]時,信息取得方法決定模塊10為了決定用于取得關鍵字 相關信息的位置而使用的數(shù)據(jù)。本地位置數(shù)據(jù)26由登錄年月日時刻、有效年 月日時刻、關鍵字、以及數(shù)據(jù)位置構成。
此外,所謂上述取得條件"4"中的"用戶終端"是指圖1所示的信息通 信終端100。
各項目的內(nèi)容或設定的一個例子可以參照圖19所示的本地位置數(shù)據(jù)。另 外,作為具體的設定例,例如可以假設作為關鍵字設定按照門戶網(wǎng)站(portal site)目錄.的標題、作為位置登錄門戶網(wǎng)站目錄的URL。
地址簿數(shù)據(jù)27例如是vCard(RFC 2425:MIME Content - Type for Directory Information, RDC 2426:vCard MIME Directory Profile)或發(fā)件人的地址信息等
個人的地址簿數(shù)27。在取得條件為["3"從用戶終端的存儲媒體20中的個人 信息取得]時,成為信息取得方法決定模塊10的檢索對象。
預定表數(shù)據(jù)28例如是vCal, iCal(RJFC 2445:Intemet Calendaring and Scheduling Core Object Specification (iCalendar), RFC 2446:iCalendar Transport -Independent Interoperability Protocol(iTIP): Scheduling Events, Busy Time, To -dos and Journal Entries, RFC 2447:iCalendar Message - based Interoperability Protocol (iMIP))等個人的調度數(shù)據(jù)。在取得條件為["3"從用戶終端的存儲媒 體20中的個人信息取得]時,成為信息取得方法決定模塊10的檢索對象。
郵件收發(fā)數(shù)據(jù)29是信息通信終端100的發(fā)件人收發(fā)的郵件信息。在取得 條件為["3"從用戶終端的存儲媒體20中的個人信息取得]時,成為信息取得 方法決定模塊10的檢索對象。
<位置服務器102的結構和動作的說明>
位置服務器102包括位置信息提供模塊30、履歷信息登錄模塊31、控 制模塊32、通信模塊33以及存儲媒體34。
位置信息提供模塊30根據(jù)由位置服務器102通過網(wǎng)絡101從信息通信終 端100接收的請求關鍵字和請求關鍵字取得條件,決定相關聯(lián)的信息的數(shù)據(jù)位 置,并返回信息通信終端100。
履歷信息登錄模塊31通過網(wǎng)絡101從信息通信終端100的履歷登錄模塊 17接收請求關鍵字、取得條件、取得數(shù)據(jù)位置的值,并將這些信息存儲到存 儲Jf某體34中作為履歷數(shù)據(jù)36。
控制模塊32控制位置信息提供模塊30以及履歷信息登錄模塊31對通信 模塊33的利用,控制存儲媒體34。作為控制模塊32,例如可以使用Windows (注冊商標)、Linux (注冊商標)、Sun-OS (注冊商標)等操作系統(tǒng)。
通信模塊33由控制模塊32控制,在位置信息提供模塊30、履歷信息登 錄模塊31通過網(wǎng)絡101與信息通信終端100交換信息時使用該通信模塊33。 具體而言,假設用于以物理的方式發(fā)送數(shù)據(jù)的系統(tǒng)(調制解調器等)和其控制 軟件。
存儲媒體34由控制模塊32控制,由位置信息提供模塊30以及履歷信息 登錄模塊31來保存、讀出信息。另外,在存儲々某體34中存儲位置數(shù)據(jù)35和
履歷數(shù)據(jù)36。
位置數(shù)據(jù)35是在位置信息提供模塊30根據(jù)由位置服務器102通過網(wǎng)絡 101從信息通信終端IOO接收的請求關鍵字和請求關鍵字取得條件來決定相關 聯(lián)的信息的數(shù)據(jù)位置時使用的信息。位置數(shù)據(jù)35由登錄年月日時刻、有效年 月日時刻、關鍵字以及數(shù)據(jù)位置構成。
各項目的內(nèi)容或設定的一個例子可以參照圖20所示的位置數(shù)據(jù)。另外, 作為具體的設定例,假設作為關鍵字設定在時事問題等中使用的用語,作為位 置登錄各用語的講解網(wǎng)頁或新聞網(wǎng)頁的URL。
履歷數(shù)據(jù)36是表示由各信息通信終端100的相關信息取得模塊11進行的 信息取得履歷的數(shù)據(jù),假設由受理年月日時刻、請求關鍵字、取得條件、以及 取得數(shù)據(jù)位置構成。各項目的內(nèi)容或設定的一個例子可以參照圖21所示的履 歷數(shù)據(jù)。
履歷數(shù)據(jù)36的記錄(record)是在信息通信終端100的動作條件設定數(shù)據(jù) 23中設定外部服務器利用與否為['T,允許]時,根據(jù)由履歷登錄模塊17向位 置服務器102發(fā)送的數(shù)據(jù)來登錄記錄。
另外,在取得條件為"7"的情況下位置服務器102決定關于關鍵字最常 被參照的位置時使用。
<廣告信息服務器103的結構和動作的說明>
廣告信息服務器103包括廣告信息提供模塊37、控制模塊38、通信模 塊39、以及存儲媒體40。
廣告信息提供模塊37用于廣告信息服務器103通過網(wǎng)絡101從信息通信 終端IOO接收抽出關鍵字,并將與抽出關鍵字相關聯(lián)的廣告信息反饋給信息通 信終端100。
控制模塊38控制廣告信息提供模塊37對通信模塊39的利用,控制存儲 媒體40。例如,可以使用Windows (注冊商標)、Linux (注冊商標)、SunOS (注冊商標)等操作系統(tǒng)。
通信模塊39由控制模塊38控制,在廣告信息提供模塊37通過網(wǎng)絡101 與信息通信終端100交換信息時使用該通信模塊39。具體而言,假設用于以 物理的方式發(fā)送數(shù)據(jù)的系統(tǒng)(調制解調器等)和其控制軟件。
存儲媒體40由控制模塊38控制,由廣告信息提供模塊37保存、讀出數(shù) 據(jù)。另外,在存儲纟泉體40中存儲廣告信息41。
廣告數(shù)據(jù)41是與關鍵字相關聯(lián)的商品或服務的廣告信息,假設由登錄年 月日時刻、有效年月日時刻、關鍵字、以及廣告信息構成。各項目的內(nèi)容或設 定例可以參照圖22所示的廣告數(shù)據(jù)。
假設廣告信息中包含與商品、服務的catchcopy或廣告信息相關聯(lián)的信息 的數(shù)據(jù)位置、或未圖示的廣告操作員(operator)的通話者ID。用戶可以用鍵 盤 鼠標3來指定輸出至監(jiān)^見器2的廣告信息,由此取得與廣告信息相關聯(lián)的 信息,并顯示在監(jiān)^f見器2上,或使用信息通信終端100實施對通話者追加了廣 告操作員的通話。
另夕卜,通過與廣告信息相關聯(lián)的信息或與廣告操作員的通話,可以購買并 利用廣告信息中所顯示的商品或服務。
<相關信息服務器104的結構和動作的說明>
相關信息服務器104包括相關信息提供模塊42、控制模塊43、通信模 塊44、以及存儲4某體45。
相關信息提供模塊42用于相關信息服務器104通過網(wǎng)絡101從相關信息 取得模塊11接受取得數(shù)據(jù)位置、請求關鍵字(可有可無)的值,并將與取得 數(shù)據(jù)位置相應的相關信息反饋給信息通信終端100。
控制模塊43控制相關信息提供模塊42對通信模塊44的利用,控制存儲 媒體45。例如,可以使用Windows (注冊商標)、Linux (注冊商標)、SunOS (注冊商標)等操作系統(tǒng)。
通信模塊44由控制模塊43控制,在相關信息提供模塊42通過網(wǎng)絡101 與信息通信終端100交換信息時使用該通信模塊44。具體而言,假設用于以 物理的方式發(fā)送數(shù)據(jù)的系統(tǒng)(調制解調器等)和其控制軟件。
存儲媒體45由控制模塊43控制,由相關信息提供模塊42讀出信息。存 儲媒體45中存儲成為相關信息提供模塊42生成的相關信息的基礎的數(shù)據(jù)。
<檢索服務器105的結構和動作的說明〉
檢索服務器105包括檢索結果提供模塊47、控制模塊48、通信模塊49、 以及存儲媒體50。檢索結果提供模塊47用于檢索服務器105通過網(wǎng)絡101從信息通信終端 100的相關信息取得模塊11接收取得數(shù)據(jù)位置、請求關鍵字的值,并向信息 通信終端100反饋基于請求關鍵字的檢索結果來作為相關信息。
控制模塊48控制檢索結果提供模塊47對通信模塊49的利用,控制存儲 媒體。例如,可以使用Windows (注冊商標)、Linux (注冊商標)、Sun-OS (注冊商標)等操作系統(tǒng)。
通信模塊49是由控制模塊48來控制,在檢索結果提供模塊47通過網(wǎng)絡 101與信息通信終端100交換信息時使用該通信模塊49。具體而言,假設用于 以物理的方式發(fā)送數(shù)據(jù)的系統(tǒng)(調制解調器等)和其控制軟件。
存儲媒體50是由控制模塊48來控制,由檢索結果提供模塊47讀出信息。 在存儲媒體50中存儲成為檢索結果提供模塊47生成的相關信息(檢索結果信 息)的基礎的數(shù)據(jù)。
-處理流程的"i兌明-
使用圖2~圖11,對使用第一實施方式的信息通信終端100進行的相關信 息的取得方式的處理流程進行說明。 <啟動順序>
首先,參照圖2說明信息通信終端100的啟動順序。信息通信終端100 的用戶通過鍵盤.鼠標3來執(zhí)行啟動模塊4。此時,也可以輸入已經(jīng)啟動了的 用戶的請求通話者ID。首先,啟動模塊4啟動語音圖像交換模塊1,開始與通 話對象進行通話。接著,啟動模塊4以請求通話者ID為關鍵詞信息,通過控 制模塊18從存儲士某體20讀入動作條件設定數(shù)據(jù)23的信息取得條件輸入與否 的值。
這里,作為第一條件分支,在信息取得條件輸入與否的值為'T'需要的 情況下,啟動模塊4啟動語音輸入模塊5(跳轉到(1 )關鍵字顯示順序(圖3 ))、 信息取得條件受理模塊9 (跳轉到(2)取得條件受理/信息顯示順序(圖4))、 以及共享信息受理模塊16 (跳轉到(3)共享信息接收/顯示順序(圖5))。
當設定有信息取得條件輸入與否的值為["1"需要]時,用戶可以根據(jù)顯 示在監(jiān)視器2上的關鍵字,選擇作為相關信息的取得對象的關鍵字,可以輸入 相關信息的取得條件。另外,可以與通話對象共享所取得的相關信息。
作為條件分支2,在信息取得條件輸入與否的值為"0"不需要的情況下,
啟動模塊4啟動語音輸入模塊5 (跳轉到(4)關鍵字顯示/信息顯示順序(圖 6))、和共享信息受理才莫塊16 (跳轉到(3)共享信息接收/顯示順序(圖5))。
在設定有信息取得條件輸入與否的值為["0"不需要]時,用戶無法根據(jù) 顯示在監(jiān)視器2上的關鍵字選擇作為相關信息的取得對象的關鍵字,無法輸入 相關信息的取得條件,自動地顯示針對抽出的關鍵字的相關信息、或通話對象 所共享的相關信息。
另外,假設對啟動模塊4啟動的各模塊轉交請求通話者ID。
<關鍵字顯示順序>
下面,對關鍵字顯示順序進行說明。圖3所示的關鍵字顯示順序(圖2 中的(1))表示根據(jù)通話的語音信息60,由語音識別模塊6、關鍵字抽出模塊 8來抽出關鍵字并顯示在監(jiān)視器2之前的順序。
語音輸入模塊5取得語音圖像交換模塊1正在交換的語音信息60以及語 音附加信息61,并轉交給語音識別模塊6。這里,所謂語音附加信息61,是 有關語音圖像交換模塊l進行的通話的信息,是通話ID、通話者ID、發(fā)話者 ID中的任意一個、或者包括所有這些信息。
語音識別模塊6 —接收語音信息60以及語音附加信息61,就根據(jù)語音信 息60確定包含在通話中的單詞和其詞類,生成至少包含詞類的單詞信息62, 并將單詞信息62和語音附加信息61轉交給關鍵字抽出模塊8。
關鍵字抽出模塊8 —接收單詞信息62和語音附加信息61,就以從啟動模 塊4取得的請求通話者ID為關鍵詞信息,通過控制模塊18從存儲媒體20讀 入關鍵字抽出條件設定數(shù)據(jù)24。關鍵字抽出條件設定數(shù)據(jù)24中設定有按照詞 類的抽出與否。
接著,關鍵字抽出模塊8從單詞信息只抽出在關鍵字抽出條件設定數(shù)據(jù) 24中設定為["1"抽出]的詞類的單詞來作為關鍵字,根據(jù)抽出的關鍵字和語 音附加信息61生成抽出關鍵字履歷數(shù)據(jù)21,并通過控制模塊18存儲到存儲 媒體20中。關鍵字的抽出可以通過第五實施例中記載的單詞信息的統(tǒng)計解析 或語言解析來進行。
抽出關鍵字履歷數(shù)據(jù)21至少由抽出年月日時刻、通話ID、請求通話者ID、
通話者ID、發(fā)話者ID、以及抽出關4定字構成,在通話ID、通話者ID、發(fā)話 者ID中設定有語音附加信息61的值。
另外,在請求通話者ID中設定從啟動模塊4取得的請求通話者ID。另外, 抽出年月日時刻中設定關鍵字抽出模塊8抽出了關鍵字的年月日時刻。另夕卜, 抽出關鍵字中設定關鍵字抽出模塊8抽出的關鍵字。
接著,關鍵字抽出模塊8將存儲的抽出關鍵字履歷數(shù)據(jù)21轉交給關鍵字 受理模塊7。
關鍵字受理模塊7 —從關鍵字抽出模塊8接收抽出關鍵字履歷數(shù)據(jù)21, 就以從啟動模塊4取得的請求通話ID為關鍵詞信息,通過控制模塊18從存儲 媒體20讀出動作條件設定數(shù)據(jù)23的廣告顯示與否的值。
這里,作為第一分支,對設定有動作條件設定數(shù)據(jù)23的廣告顯示與否的 值為["1"需要]時的情況進行說明。
關鍵字受理模塊7以從啟動模塊4取得的請求通話者ID為關鍵詞信息, 通過控制模塊18從存儲媒體20讀入動作條件設定數(shù)據(jù)23的廣告信息服務器 103的4立置的^直。
接著,關鍵字受理模塊7將抽出關鍵字履歷數(shù)據(jù)21和廣告信息服務器103 的位置的值轉交給廣告信息取得模塊12。
廣告信息取得模塊12 —接收抽出關鍵字履歷數(shù)據(jù)21和廣告信息服務器 103的位置的值,就根據(jù)廣告信息服務器103的位置的值,通過控制模塊18 來使用通信模塊19,向廣告信息服務器103發(fā)送抽出關鍵字履歷數(shù)據(jù)21中的 抽出關鍵字,從廣告信息服務器103取得廣告信息64,并將該廣告信息64反 饋給關鍵字受理模塊7。
此外,在廣告服務器的廣告信息64的發(fā)送請參照廣告信息提供順序(參 照后面所示的圖7)。
接著,關鍵字受理模塊7將廣告信息64和抽出關鍵字履歷數(shù)據(jù)21轉交給 關鍵字輸出模塊13。
關鍵字輸出模塊13 —接收廣告信息64和抽出關鍵字履歷數(shù)據(jù)21,就通 過控制模塊18至少將抽出關鍵字履歷數(shù)據(jù)21中的抽出關鍵字、通話ID以及 廣告信息64通過控制模塊18輸出至監(jiān)視器2。
接著,關鍵字受理模塊7生成與取得的廣告信息64有關的相關信息取得 履歷數(shù)據(jù)22,通過控制模塊18向存儲媒體20存儲所生成的相關信息取得履 歷數(shù)據(jù)22。
相關信息取得履歷凄t據(jù)22至少由受理年月日時刻、通話ID、請求通話者 ID、請求關鍵字取得條件、共享條件、請求數(shù)據(jù)位置以及取得數(shù)據(jù)位置構成。
受理年月日時刻中設定關鍵字受理模塊7受理了抽出關鍵字履歷數(shù)據(jù)21 的受理年月日時刻。通話ID中設定抽出關鍵字履歷數(shù)據(jù)21中的通話ID。請 求通話者ID中設定從啟動模塊4取得的請求通話者ID。請求關鍵字取得條件 中設定NULL。共享條件中設定"0"不需要。請求數(shù)據(jù)位置中設定NULL。 取得數(shù)據(jù)位置中設定廣告信息服務器103的位置的值。
接著,對第二分支中的、設定有動作條件設定數(shù)據(jù)23的廣告顯示與否的 值為["0"不需要]的情況進行說明。
關鍵字受理模塊7將抽出關鍵字履歷數(shù)據(jù)21轉交給關鍵字輸出模塊13。
關鍵字輸出模塊13 —接收抽出關鍵字履歷數(shù)據(jù)21,就通過控制模塊18 至少將抽出關鍵字履歷數(shù)據(jù)21中的抽出關鍵字和通話ID輸出至監(jiān)視器2。
接著,假設顯示在監(jiān)視器2上的廣告信息中包含與廣告信息64相關聯(lián)的 信息的數(shù)據(jù)位置、廣告操作員的通話者ID。用戶通過用鍵盤 鼠標指定輸出 至監(jiān)視器2的廣告信息64,可以取得與廣告信息64相關聯(lián)的信息,并顯示在 監(jiān)視器2上,或使用信息通信終端100來實施對通話者追加了廣告操作員的通 話。另外,假設通過與廣告信息64相關聯(lián)的信息或與廣告操作員的通話,可 以購買、利用顯示在廣告信息64中的商品或服務。
最后,關鍵字受理模塊7以從啟動模塊4取得的請求通話者ID為關鍵詞 信息,通過控制模塊18讀出存儲媒體20的動作條件設定數(shù)據(jù)23的信息取得 條件輸入與否的值,在"1"需要的情況下(在該順序中只能有["1"需要]), 調用語音輸入模塊5。
以上循環(huán)反復進行至語音圖像交換結束為止。
<取得條件受理/信息顯示順序>
參照圖4A以及圖4B說明圖2中的(2)所示的取得條件受理/信息顯示 順序。表示首先針對顯示的關鍵字,用戶選擇作為相關信息68的取得對象
的關鍵字,輸入相關信息68的取得條件,信息取得方法決定模塊10決定所取
得的相關信息68的位置(URL等),相關信息取得模塊11根據(jù)所決定的位置 (URL等)來取得相關信息68,直至在監(jiān)視器上顯示相關信息68為止的順序。
信息取得條件受理模塊9通過控制模塊18受理來自鍵盤 鼠標3的取得 條件輸入65。取得條件輸入65至少包含請求關鍵字、通話ID、請求關鍵字的 取得條件、以及共享條件。
請求關鍵字取得條件取如下值中的任意一個值
另外,假設在請求關鍵字取得條件為["1"從用戶指定的位置取得]時還 包含請求數(shù)據(jù)位置。另外,共享條件取["0"不需要]、["1"需要]、[NULL (未設定)]中的任意一個值。另外,在請求關鍵字和通話ID中分別設定關鍵 字輸出模塊13向監(jiān)視器2輸出的抽出關鍵字和通話ID。另外,在設定有動作 條件設定數(shù)據(jù)23的外部服務器利用與否為["0"禁止]時,作為請求關鍵字取 得條件受理如下請求關鍵字取得條件
接著,信息取得條件受理模塊9將受理年月日時刻、取得條件輸入65和 從啟動模塊4取得的請求通話者ID轉交給信息取得方法決定模塊10。
受理年月日時刻中設定信息取得條件受理模塊9受理了請求關鍵字取得 條件的受理年月日時刻。
這里,作為第一分支,對取得條件輸入65的請求關鍵字取得條件的值為 ["0"未指定]以外的值的情況進行說明。
信息取得方法決定模塊10生成取得方法信息67,并反饋給信息取得條件
受理模塊9。
這里,取得方法信息67至少包含受理年月日時刻、請求通話者ID、請求 關鍵字、通話ID、請求關鍵字取得條件、共享條件以及取得數(shù)據(jù)位置。
取得數(shù)據(jù)位置中,按照從信息取得條件受理模塊9取得的請求關鍵字取得 條件設定值,設定信息取得方法決定模塊10通過如下處理來決定的數(shù)據(jù)位置。
(1) 在請求關鍵字取得條件為["1"從用戶指定的位置取得]的情況下, 信息取得方法決定模塊10在取得數(shù)據(jù)位置中設定請求數(shù)據(jù)位置的值。
(2) 在請求關#:字取得條件為["2"從用戶終端的存儲々某體20取得對于 同一關鍵字最常被參照的位置]的情況下,信息取得方法決定模塊10以請求通 話者ID為關鍵詞信息,通過控制模塊18累計請求關鍵字的值與取得條件輸入 65中的請求關鍵字相同的存儲媒體20的相關信息取得履歷數(shù)據(jù)22的記錄, 在取得數(shù)據(jù)位置中設定頻度最高的取得數(shù)據(jù)位置的值。
其中,這里信息取得方法決定模塊10累計的相關信息取得履歷數(shù)據(jù)22 的記錄是設定請求關鍵字取得條件為NULL以外的記錄(廣告以外的記錄)。 在沒有符合的相關信息取得履歷數(shù)據(jù)22時,在取得數(shù)據(jù)位置中設定NULL。
(3) 在請求關鍵字取得條件為["3"從用戶終端的存儲々某體20中的個人 信息取得]的情況下,信息取得方法決定模塊IO通過控制模塊18,用請求關鍵 字檢索地址簿數(shù)據(jù)27、預定表數(shù)據(jù)28和郵件收發(fā)數(shù)據(jù)29,在取得數(shù)據(jù)位置中 設定檢索結果的路徑(pass)。在沒有符合的數(shù)據(jù)時,在取得數(shù)據(jù)位置中設定 NULL。
(4) 在請求關鍵字取得條件為["4"從用戶終端的存儲媒體20中的本地 位置數(shù)據(jù)26取得]的情況下,信息取得方法決定模塊10以請求通話者ID為關 鍵詞信息,通過控制模塊18讀出請求關鍵字的值與取得條件輸入65中的請求 關鍵字相同的存儲媒體20的本地位置數(shù)據(jù)26的記錄,在取得數(shù)據(jù)位置中設定 記錄中的數(shù)據(jù)位置的值。此時,只將受理年月日時刻包含在記錄的登錄年月曰 時刻、有效年月日時刻之間的記錄作為讀出對象。
在沒有符合的本地位置數(shù)據(jù)26時,在取得數(shù)據(jù)位置中設定NULL。
(5) 在請求關鍵字取得條件為["5"從檢索服務器105取得]的情況下,
信息取得方法決定模塊10以請求通話者ID為關4走詞信息,通過控制模塊18
讀出動作條件設定數(shù)據(jù)23中的檢索服務器105的位置的值,并在取得數(shù)據(jù)位 置中設定該值。
(6 )在請求關鍵字取得條件為["6"從位置服務器102的位置數(shù)據(jù)35取 得]的情況下,信息取得方法決定模塊10以請求通話者ID為關鍵詞信息,通 過控制模塊18讀出動作條件設定數(shù)據(jù)23中的位置服務器102的位置(取得用) 的值。
接著,信息取得方法決定模塊IO根據(jù)位置服務器102的位置(取得用) 的值,通過控制模塊18來使用通信模塊19,向位置服務器102發(fā)送請求關鍵 字和請求關鍵字取得條件("6"),從位置服務器102取得數(shù)據(jù)位置,并在取得 數(shù)據(jù)位置中設定該值。
此外,來自位置服務器102的數(shù)據(jù)位置發(fā)送請參照取得方法信息提供順序 (參照后面所示的圖8)。
(7)在請求關鍵字取得條件為["7"從位置服務器102取得對于同一關 鍵字最常被參照的位置]的情況下,信息取得方法決定模塊10以請求通話者ID 為關鍵詞信息,通過控制模塊18,讀出動作條件設定數(shù)據(jù)23中的位置服務器 102的位置(取得用)的值,并將該值設定為取得數(shù)據(jù)位置。
接著,信息取得方法決定模塊IO根據(jù)位置服務器102的位置(取得用) 的值,通過控制模塊18來使用通信模塊19,向位置服務器102發(fā)送請求關鍵 字和請求關鍵字取得條件("7"),從位置服務器102取得數(shù)據(jù)位置,并將該值 設定為取得數(shù)據(jù)位置。
此外,來自位置服務器102的數(shù)據(jù)位置發(fā)送請參照取得方法信息提供順序 (參照后面所示的圖8)。
下面,作為第二條件分支,對取得條件輸入65的請求關鍵字取得條件的 值為["0"未指定]的情況進行說明。
首先,信息取得方法決定模塊10以請求通話者ID為關鍵詞信息,通過控 制模塊18,讀出默認取得順序設定數(shù)據(jù)25中的默認取得條件'T, ~ "7"的 值,從默認取得條件1中設定的取得條件的值開始按照順序執(zhí)行上述(1 ) ~ (7 ),直至將取得數(shù)據(jù)位置的值確定在NULL以外。
然后,信息取得方法決定模塊10生成取得方法信息67,并反饋給信息取 得條件受理模塊9。
這里,取得方法信息67至少包含受理年月日時刻、請求關鍵字、通話ID、 請求關鍵字取得條件、共享條件、以及取得數(shù)據(jù)位置。
到此為止,第二條件分支的處理結束。
然后,信息取得條件受理模塊9向相關信息取得模塊11轉交由信息取得 方法決定模塊IO反饋的取得方法信息67。
相關信息取得模塊11 一接收取得方法信息67的值,就根據(jù)取得方法信息 67中的請求關鍵字和取得數(shù)據(jù)位置來生成相關信息68。
此時,在取得數(shù)據(jù)位置為用戶的信息通信終端100內(nèi)時,通過控制模塊 18從存儲媒體20取得相關信息68。另夕卜,在取得數(shù)據(jù)位置為用戶的信息通信 終端100以外時,通過控制模塊18來使用通信模塊19,取得相關信息68。
此外,來自相關信息服務器104的相關信息68的發(fā)送請參照相關信息提 供順序(參照后面所示的圖9),來自檢索服務器105的相關信息的發(fā)送請參 照檢索信息提供順序(參照后面所示的圖10)。
然后,相關信息取得模塊11將所取得的相關信息68反饋給信息取得條件 受理模塊9。
信息取得條件受理模塊9將從相關信息取得模塊11反饋的相關信息68轉 交給相關信息輸出模塊14。相關信息輸出模塊14一接收相關信息68,就通過 控制模塊18將相關信息68輸出至監(jiān)視器2。
然后,在取得條件輸入65中的共享條件為NULL時,信息取得條件受理 模塊9以請求通話者ID為關鍵詞信息,通過控制模塊18讀出動作條件設定數(shù) 據(jù)23中的默認共享條件設定的值。在取得條件輸入65中的共享條件、或者默 認共享條件設定的取得條件輸入65的取得條件的值為["1"需要]時,信息取 得條件受理^t塊9向共享信息發(fā)送模塊15轉交取得方法信息67或相關信息 68。
共享信息發(fā)送模塊15 —接收取得方法信息67或相關信息68,就通過控 制模塊18來使用通信模塊19,向通話目的地的信息通信終端IOO發(fā)送取得方 法信息67或相關信息68 (在圖4B中的"E"表示)。
然后,信息取得條件受理模塊9生成與取得的相關信息68有關的相關信
息取得履歷數(shù)據(jù)22,并通過控制模塊18在存儲媒體20中存儲所生成的相關 信息取得履歷數(shù)據(jù)22。
相關信息取得履歷數(shù)據(jù)22至少由受理年月日時刻、通話ID、請求通話者 ID、請求關鍵字取得條件、共享條件、請求數(shù)據(jù)位置、以及取得數(shù)據(jù)位置構成。
在通話ID、請求關鍵字取得條件以及請求數(shù)據(jù)位置中設定取得條件輸入 65的通話ID、請求關鍵字取得條件以及請求數(shù)據(jù)位置。另外,在受理年月日 時刻、請求通話者ID以及取得數(shù)據(jù)位置中設定取得方法信息67的受理年月曰 時刻、請求通話者ID以及取得數(shù)椐位置。
另外,在取得條件輸入65的共享條件為NULL以外時,在共享條件中設 定取得條件輸入65的共享條件。在取得條件輸入65的共享條件為NULL時, 在共享條件中設定讀出的默認共享條件設定的值。
接著,信息取得條件受理模塊9以請求通話者ID為關鍵詞信息,通過控 制模塊18讀出動作條件設定數(shù)據(jù)23中的外部服務器利用與否的值。在外部服 務器利用與否的值為["1"允許]時,信息取得條件受理模塊9將相關信息取 得履歷數(shù)據(jù)22轉交給履歷登錄模塊17。
履歷登錄模塊17 —接收相關信息取得履歷數(shù)據(jù)22,就以相關信息取得履 歷數(shù)據(jù)22中的請求通話者ID為關鍵詞信息,通過控制模塊18讀出動作條件 設定數(shù)據(jù)23中的位置服務器102的位置(履歷用)的值。
然后,履歷登錄模塊17根據(jù)位置服務器102的位置(履歷用)的值,通 過控制模塊18來使用通信模塊19,向位置服務器102發(fā)送相關信息取得履歷 數(shù)據(jù)22中的請求關鍵字、取得條件以及取得數(shù)據(jù)位置。
此外,向位置服務器102的履歷數(shù)據(jù)36的登錄請參照履歷信息登錄順序 (參照后面所示的圖11 )。
信息取得條件受理模塊9通過控制模塊18等待來自鍵盤 鼠標3的取得 條件輸入65。
將以上處理重復進行至語音圖像交換結束為止。
<共享信息接收顯示順序>
參照圖5對圖2中的(3)所示的共享信息接收顯示順序進行說明。在該
圖5中表示直到接收從通話目的地的信息通信終端100的共享信息發(fā)送模塊 15發(fā)送來的(對應于圖4B中的"E")取得方法信息67或相關信息68,根據(jù) 取得方法信息67,相關信息取得模塊11取得相關信息68,將相關信息68顯 示在監(jiān)視器2上為止的順序。
共享信息接收^t塊16通過控制模塊18來使用通信模塊19,接收從通話 目的地的信息通信終端100的共享信息發(fā)送模塊15發(fā)送來的取得方法信息67 或相關信息68。在沒有接收到相關信息68時,共享信息受理模塊16將取得 方法信息67和從啟動模塊4取得的請求通話者ID轉交給相關信息取得模塊 11。
相關信息取得模塊11 一接收取得方法信息67的值,就根據(jù)取得方法信息 67中的請求關鍵字和取得數(shù)據(jù)位置的值,來取得相關信息68。
此時,在取得數(shù)據(jù)位置為用戶的信息通信終端100內(nèi)時,通過控制模塊 18,從存儲媒體20取得相關信息68。另外,在取得數(shù)據(jù)位置為用戶的信息通 信終端100以外時,通過控制模塊18來使用通信模塊19,取得相關信息68。
此夕卜,來自相關信息服務器104的相關信息的發(fā)送請參照相關信息提供順 序(參照后面所示的圖9),來自檢索服務器105的相關信息的發(fā)送請參照檢 索信息提供順序(參照后面所示的圖10)。
然后,相關信息取得模塊11將所取得的相關信息68反饋給共享信息受理 模塊16。
共享信息受理模塊16將從相關信息取得模塊11反饋的相關信息68轉交 給相關信息輸出模塊14。
相關信息輸出模塊14 一接收相關信息68,就通過控制模塊18將相關信 息68輸出至監(jiān)視器2。
接著,共享信息受理模塊16生成與取得的相關信息68有關的相關信息取 得履歷數(shù)據(jù)22,并通過控制模塊18在存儲媒體20中存儲所生成的相關信息 取得履歷數(shù)據(jù)22。
相關信息取得履歷數(shù)據(jù)22至少由受理年月日時刻、通話ID、請求通話者 ID。請求關^t字取得條件。共享條件、請求數(shù)據(jù)位置、以及取得數(shù)據(jù)位置構成。 在相關信息取得履歷數(shù)據(jù)22的受理年月日時刻、通話ID、請求關鍵字取
得條件、共享條件以及取得數(shù)據(jù)位置中設定取得方法信息67的值。另外,在
請求通話者ID中設定從啟動模塊4取得的請求通話者ID的值。在請求數(shù)據(jù)位 置中設定NULL。
然后,共享信息受理模塊16通過控制模塊18,等待來自通話目的地的信 息通信終端100的共享信息發(fā)送模塊15的取得方法信息67或相關信息68的 發(fā)送。
將以上處理重復進行至語音圖像交換結束為止。 <關鍵字顯示/信息顯示順序>
參照圖6A~6C,對在圖2中的(4)所示的關鍵字顯示/信息顯示順序進 行說明。
在圖6A 6C中表示直到通過語音識別模塊6和關鍵字抽出模塊8,從 通話的語音信息60中抽出關鍵字,并顯示在監(jiān)視器2上,同時針對顯示的關 鍵字,信息取得方法決定模塊11決定相關信息68的位置(URL等),并根據(jù) 決定的位置(URL等),相關信息取得模塊11取得相關信息68,將相關信息 68顯示在監(jiān)視器2上為止的順序。
語音輸入模塊5取得語音圖像交換模塊1正在交換的語音信息60以及語 音附加信息61,并轉交給語音識別模塊6。這里,所謂語音附加信息61,是 與語音圖像交換模塊1正在進行的通話有關的信息,包含通話ID、通話者ID、 發(fā)話者ID中的任意一個或者包含所有信息。
語音識別模塊6 —接收語音信息60和語音附加信息61,就根據(jù)語音信息 60來確定包含在通話中的單詞和其詞類,并生成至少包含單詞和詞類的單詞 信息,將單詞信息和語音附加信息61轉交給關鍵字抽出模塊8。
關鍵字抽出模塊8 —接收單詞信息和語音附加信息61,就以從啟動模塊4 取得的請求通話者ID為關鍵詞信息,通過控制模塊18從存儲媒體20讀入關 鍵字抽出條件設定數(shù)據(jù)24。在關鍵字抽出條件設定數(shù)據(jù)24中設定有按照各詞 類的抽出與否。此外,關鍵字的抽出可以通過在第五實施例中所記載的單詞信 息的統(tǒng)計解析或語音解析來進行。
接著,關鍵字抽出模塊8從單詞信息只抽出在關鍵字抽出條件設定數(shù)據(jù) 24中設定為["1"抽出]的詞類的單詞來作為關鍵字,根據(jù)抽出的關鍵字和語
音附加信息61生成抽出關4走字履歷數(shù)據(jù)21,并通過控制模塊18存儲到存儲
媒體20中。
抽出關鍵字履歷數(shù)據(jù)21至少由抽出年月日時刻、通話ID、請求通話者ID、 通話者ID、發(fā)話者ID以及抽出關鍵字構成,在通話ID、通話者ID、發(fā)話者 ID中設定語音附加信息61的值。另夕卜,在請求通話者ID中設定從啟動模塊4 取得的請求通話者ID。另外,在抽出年月日時刻中設定關鍵字抽出模塊8抽 出了關鍵字的年月日時刻。另夕卜,在抽出關鍵字中設定關鍵字抽出模塊8抽出 的關鍵字。
然后,關鍵字抽出模塊8將存儲的抽出關鍵字履歷數(shù)據(jù)21轉交給關鍵字 受理模塊7。
關鍵字受理模塊7 —從關鍵字抽出模塊8接收抽出關鍵字履歷數(shù)據(jù)21, 就以從啟動模塊4取得的請求通話者ID為關鍵詞信息,通過控制模塊18從存 儲^(某體20讀出動作條件設定數(shù)據(jù)23的廣告顯示與否的值。
這里,關于第一條件分支,下面說明動作條件設定數(shù)據(jù)23的廣告顯示與 否的值被設定為["1"需要]的情況。
關鍵字受理模塊7以從啟動模塊4取得的請求通話者ID為關鍵詞信息, 通過控制模塊18從存儲媒體20讀入動作條件設定數(shù)據(jù)23的廣告信息服務器 103的位置的值。
然后,關鍵字受理模塊7將抽出關鍵字履歷數(shù)據(jù)21和廣告信息服務器103 的位置的值轉交給廣告信息取得模塊12。
廣告信息取得模塊12 —接收抽出關鍵字履歷數(shù)據(jù)21和廣告信息服務器 103的位置的值,就根據(jù)廣告信息服務器103的位置的值,通過控制模塊18 來使用通信模塊19,向廣告信息服務器103發(fā)送抽出關鍵字履歷數(shù)據(jù)21中的 抽出關鍵字,從廣告信息服務器103取得廣告信息64,并反饋給關鍵字受理 模塊7。
此外,在廣告服務器中的廣告信息的發(fā)送請參照廣告信息提供順序(參照 后面所示的圖7)。
然后,關鍵字受理模塊7將廣告信息64和抽出關鍵字履歷數(shù)據(jù)21轉交給 關鍵字輸出模塊13。
關鍵字輸出模塊13 —接收廣告信息64和抽出關鍵字履歷數(shù)據(jù)21,就通 過控制模塊18至少將抽出關鍵字履歷數(shù)據(jù)21中的抽出關4建字、通話ID以及 廣告信息64輸出至監(jiān)視器2。
接著,關鍵字受理模塊7生成與取得的廣告信息64有關的相關信息取得 履歷數(shù)據(jù)22,并通過控制模塊18在存儲媒體20中存儲所生成的相關信息取 得履歷數(shù)據(jù)22。
相關信息取得履歷數(shù)據(jù)22至少由受理年月日時刻、通話ID、請求通話者 ID、請求關鍵字取得條件、共享條件、請求數(shù)據(jù)位置、以及取得數(shù)據(jù)位置構成。
在受理年月日時刻中設定關鍵字受理模塊7受理了抽出關鍵字履歷數(shù)據(jù) 21的受理年月日時刻。在通話ID中設定抽出關鍵字履歷數(shù)據(jù)21中的通話ID。 在請求通話考ID中設定從啟動模塊4取得的請求通話者ID。在請求關鍵字取 得條件中設定NULL。在共享條件中設定"0"不需要。在請求數(shù)據(jù)位置中設 定NULL。在取得數(shù)據(jù)位置中設定廣告信息服務器103的位置的值。
接著,作為第二條件分支,下面說明動作條件設定數(shù)據(jù)23的廣告顯示與 否的值被設定為["0"不需要]的情況。
首先,關鍵字受理模塊7將抽出關鍵字履歷數(shù)據(jù)21轉交給關鍵字輸出模 塊13。
關鍵字輸出模塊13 —接收抽出關鍵字履歷數(shù)據(jù)21,就通過控制模塊18 至少將抽出關鍵字履歷數(shù)據(jù)21中的抽出關鍵字和通話ID輸出至監(jiān)視器2。 以上,第二條件分支的處理結束。
關鍵字受理模塊7以從啟動模塊4取得的請求通話者ID為關鍵詞信息, 通過控制模塊18讀出存儲媒體20的動作條件設定數(shù)據(jù)23的信息取得條件輸 入與否的值,在["0"不需要]時(在該順序中只能是["0"不需要]),生成取 得條件輸入65。取得條件輸入65至少包含請求關^:字。通話ID、請求關鍵字 取得條件、以及共享條件。
在請求關鍵字和通話ID中設定抽出關鍵字履歷數(shù)據(jù)21中的抽出關鍵字和 通話ID。在請求關鍵字取得條件中設定"0"未指定。另外,在請求關鍵字取 得條件中設定NULL。
然后,關鍵字受理模塊7將受理年月日時刻、所生成的取得條件輸入65、
以及從啟動模塊4取得的請求通話者ID轉交給信息取得方法決定模塊10。在
受理年月日時刻中設定關鍵字受理模塊7受理了抽出關鍵字履歷數(shù)據(jù)21的受
理年月日時刻。
信息取得方法決定模塊10以請求通話者ID為關鍵詞信息,通過控制模塊 18讀出默認取得順序設定數(shù)據(jù)25中的默認取得條件"1" ~ "7"的值,并從 設定在默認取得條件1中的取得條件的值開始按照順序執(zhí)行上述(1 ) ~ (7), 直至將取得數(shù)據(jù)位置的值確定在NULL以外。
然后,信息取得方法決定模塊10生成取得方法信息67,并反饋給關鍵字 受理模塊7。
這里,取得方法信息67至少包含受理年月日時刻、請求關鍵字、通話ID、 請求關鍵字取得條件、共享條件、以及取得數(shù)據(jù)位置。
然后,關鍵字受理一莫塊7將從信息取得方法決定模塊10反饋的取得方法 信息67轉交給相關信息取得模塊11。
相關信息取得模塊11 一接收取得方法信息67的值,就根據(jù)取得方法信息 67中的請求關鍵字和取得數(shù)據(jù)位置的值,取得相關信息68。
此時,在取得數(shù)據(jù)位置為用戶的信息通信終端100內(nèi)時,通過控制模塊 18從存儲媒體20取得相關信息68。另夕卜,在取得數(shù)據(jù)位置為用戶的信息通信 終端100以外時,通過控制模塊18來使用通信模塊19,取得相關信息68。
此夕卜,來自相關信息服務器104的相關信息的發(fā)送請參照相關信息提供順 序(參照后面所示的圖9 ),來自檢索服務器105的相關信息68的發(fā)送請參照 檢索信息提供順序(參照后面所示的圖10)。
然后,相關信息取得模塊11將所取得的相關信息68反饋給關鍵字受理模塊7。
關鍵字受理模塊7將從相關信息取得模塊11反饋的相關信息68轉交給相 關信息輸出模塊14。相關信息輸出模塊14一接收相關信息68,就通過控制模 塊18將相關信息68輸出至監(jiān)視器2。
然后,關鍵字受理模塊7生成與取得的相關信息68有關的相關信息取得 履歷數(shù)據(jù)22,并通過控制模塊18在存儲媒體20中存儲所生成的相關信息取 得履歷數(shù)據(jù)22。
相關信息取得履歷數(shù)據(jù)22至少由受理年月日時刻、通話ID、請求通話者 ID、請求關鍵字取得條件、共享條件、請求數(shù)據(jù)位置、以及取得數(shù)據(jù)位置構成。
在通話ID、請求關鍵字取得條件和請求數(shù)據(jù)位置中設定取得條件輸入65 的通話ID、請求關鍵字取得條件和請求數(shù)據(jù)位置。另外,在受理年月日時刻、 請求通話者ID和取得數(shù)據(jù)位置中設定取得方法信息67的受理年月日時刻、請 求通話者ID和取得數(shù)據(jù)位置。另外,在共享條件中設定讀出的默認共享條件 設定的值。
然后,關鍵字受理模塊7以請求通話者ID為關鍵詞信息,通過控制模塊 18讀出動作條件設定數(shù)據(jù)23中的外部服務器利用與否的值。在外部服務器利 用與否的值為['T,允許]時,關鍵字受理模塊7將相關信息取得履歷數(shù)據(jù)22 轉交給履歷登錄模塊17。
履歷登錄模塊17 —接收相關信息取得履歷數(shù)據(jù)22,就以相關信息取得履 歷數(shù)據(jù)22中的請求通話者ID為關鍵詞信息,通過控制模塊18讀出動作條件 設定數(shù)據(jù)23中的位置服務器102的位置(履歷用)的值。
然后,履歷登錄模塊17根據(jù)位置服務器102的位置(履歷用)的值,通 過控制模塊18來使用通信模塊19,向位置服務器102發(fā)送相關信息取得履歷 數(shù)據(jù)22中的請求關鍵字、取得條件和取得數(shù)據(jù)位置。
最后,關鍵字受理模塊7調用語音輸入模塊5。
將以上處理重復進行至語音圖像交換結束為止。
<廣告信息提供順序>
接著,下面參照圖7對廣告信息提供順序進行說明。在該圖7中表示直 到廣告信息服務器103通過網(wǎng)絡101從信息通信終端IOO接收抽出關鍵字,并 將與抽出關鍵字相關聯(lián)的廣告信息64反饋給信息通信終端100位置的順序。 此外,圖7中的"AO"對應于圖3中的"A0",同樣,圖7中的"A1"對應 于圖3中的"A1"。
廣告信息服務器103的廣告信息提供模塊37通過控制模塊18來使用通信 模塊19,接收從信息通信終端100的廣告信息取得模塊12發(fā)送來的抽出關鍵 字。
然后,廣告信息提供模塊37以抽出關鍵字為關鍵詞信息,通過控制模塊
18檢索存儲媒體40中的廣告數(shù)據(jù)41的記錄,讀出廣告數(shù)據(jù)41的記錄的關鍵 字與抽出關鍵字一致的記錄的廣告信息64。
然后,廣告信息提供模塊37通過控制才莫塊18來使用通信模塊19,向信 息通信終端100的廣告信息取得模塊12發(fā)送讀出的廣告信息64。
廣告信息提供模塊37通過控制模塊18,等待來自信息通信終端100的廣 告信息取得模塊12的抽出關鍵字的發(fā)送。
將以上處理重復進行至語音圖像交換結束為止。
<取得方法信息提供順序>
圖8的取得方法信息提供順序表示直到位置服務器102通過網(wǎng)絡101從信 息通信終端IOO接收請求關鍵字和請求關鍵字取得條件并向信息通信終端100 反饋與請求關鍵字以及請求關鍵字取得條件相關聯(lián)的信息的數(shù)據(jù)位置為止的 順序。此外,圖8中的"BO"對應于圖4A中的"BO",同樣,圖8中的"B1" 對應于圖4A中的"B1"。
位置服務器102的位置信息提供模塊30通過控制模塊32來使用通信模塊 33,接收從信息通信終端100的信息取得方法決定模塊IO發(fā)送來的請求關鍵 字和請求關鍵字取得條件。
作為第一條件分支,下面說明接收到的請求關鍵字取得條件為["6"從位 置服務器102的位置數(shù)據(jù)35取得]的情況。
位置服務器102的位置信息提供模塊30以請求關鍵字為關鍵詞信息,通 過控制模塊32檢索存4射某體34中的位置數(shù)據(jù)35的記錄,讀出位置數(shù)據(jù)35 的記錄的關鍵字與請求關鍵字一致的記錄的數(shù)據(jù)位置。這里,位置信息提供模 塊30只將從信息通信終端100接收到請求關鍵字和請求關鍵字取得條件的時 刻包含在記錄的登錄年月日時刻、有效年月日時刻之間的記錄作為讀出對象。
接著,作為第二條件分支,說明接收到的請求關鍵字取得條件為["7 "從 位置服務器102取得對于通榆關鍵字最常被參照的位置]的情況。
位置服務器102的位置信息提供模塊30累計請求關鍵字的值與從信息通 信終端100接收到的請求關鍵字相同的存儲々某體34的履歷數(shù)據(jù)36的記錄,讀 出頻度最高的取得數(shù)據(jù)位置的值。
以上,第二條件分支的處理結束。
然后,位置信息提供模塊30通過控制模塊32來使用通信模塊33,向信 息通信終端100的信息取得方法決定模塊IO發(fā)送讀出的數(shù)據(jù)位置的值。
位置信息提供模塊30通過控制模塊32來使用通信模塊33,等待來自信 息通信終端100的信息取得方法決定模塊10的請求關鍵字和請求關鍵字取得 條件。
4目關信息提供順序〉
圖9所示的相關信息提供順序表示直到相關信息服務器104通過網(wǎng)絡101 從信息通信終端100的相關信息取得模塊11接收取得數(shù)據(jù)位置和請求關鍵字 (可有可無)的值并向信息通信終端100反饋符合取得數(shù)據(jù)位置的相關信息 68為止的順序。
此外,圖9中的"CO"對應于圖4B中的"C0",同樣,圖9中的"CI" 對應于圖4B中的"C1"。
相關信息服務器104的相關信息提供模塊42通過控制模塊43來使用通信 模塊44,接收從信息通信終端100的相關信息取得模塊11發(fā)送來的取得數(shù)據(jù) 位置、請求關鍵字(可有可無)的值。
然后,相關信息提供模塊42生成符合取得數(shù)據(jù)位置的相關信息68,通過 控制模塊43來使用通信模塊44,向信息通信終端100的相關信息取得模塊11 發(fā)送讀出的相關信息68。
然后,相關信息提供模塊42通過控制模塊43,等待來自信息通信終端100 的相關信息取得模塊11的取得數(shù)據(jù)位置的發(fā)送。
4企索信息提供順序>
圖10所示的檢索信息提供順序表示直到檢索服務器105通過網(wǎng)絡101從 信息通信終端100的相關信息取得模塊11接收取得數(shù)據(jù)位置和請求關鍵字的 值并將基于請求關鍵字的檢索結果作為相關信息68反饋給信息通信終端100 為止的順序。
此外,圖10中的"C2"對應于圖4B中的"C2",同樣,圖10中的"C3" 對應于圖4B中的"C3"。
檢索服務器105的檢索結果提供模塊47通過控制模塊48來使用通信模塊 49,接收從信息通信終端100的相關信息取得模塊11發(fā)送來的取得數(shù)據(jù)位置
和請求關鍵字。
然后,檢索結果提供模塊47生成基于請求關鍵字的檢索結果來作為相關
信息68,通過控制模塊48來使用通信模塊49,向信息通信終端100的相關信 息取得模塊11發(fā)送所生成的相關信息68。
檢索結果提供模塊47通過控制模塊48來接收來自信息通信終端100的相 關信息取得模塊11的取得數(shù)據(jù)位置和請求關鍵字的值的發(fā)送。
<履歷信息登錄順序>
圖11所示的履歷信息登錄順序表示直到位置服務器102通過網(wǎng)絡101從 信息通信終端IOO的履歷登錄模塊17接收請求關鍵字、取得條件以及取得數(shù) 據(jù)位置的值并將這些信息存儲到存儲々某體20為止的順序。此外,圖11中的"D" 對應于圖4B中的"D"。
位置服務器102的履歷信息登錄模塊31通過控制模塊32來使用通信模塊 33,接收從信息通信終端IOO的履歷登錄模塊17發(fā)送來的請求關鍵字、取得 條件以及取得數(shù)據(jù)位置的值。
然后,履歷信息登錄模塊31根據(jù)請求關鍵字、取得條件以及取得數(shù)據(jù)位 置的值來生成履歷數(shù)據(jù)36。這里,履歷數(shù)據(jù)36由受理年月日時刻、請求關鍵 字、取得條件以及取得數(shù)據(jù)位置構成,在受理年月日時刻中設定履歷信息登錄 模塊31從信息通信終端100的履歷登錄模塊17接收到請求的關鍵字、取得條 件以及取得數(shù)據(jù)位置的值的時刻。關于其他的值,設定從信息通信終端100 的履歷登錄模塊17接收到的值。
然后,履歷信息登錄模塊31通過控制模塊32將生成的履歷數(shù)據(jù)36作為 履歷數(shù)據(jù)3 6存儲在存儲媒體20中。
-信息通信終端IOO的畫面輸出圖像-
在圖12中,表示本發(fā)明實施方式的信息通信終端IOO的畫面輸出圖像的 一個例子。在該圖12中,表示語音圖像交換模塊1和關鍵字輸出模塊13輸出 的抽出關鍵字、關鍵字輸出模塊13輸出的廣告信息64、以及來自鍵盤.鼠標 3的取得條件輸入65的顯示例。
另外,圖13表示信息通信終端IOO的畫面輸出圖像的一個例子,表示相 關信息輸出模塊14輸出的相關信息68的一個顯示例。
根據(jù)以上說明的第一實施方式,在信息通信系統(tǒng)中,可以具備從會話語音 信息中抽出關鍵字的語音識別模塊和關鍵字抽出模塊、以及用于取得關鍵字的 相關信息的相關信息取得模塊。
另外,即使用戶不通過自身鍵盤等來輸入、或者不檢索存儲有信息的位置 等,也通過語音識別在終端上顯示用于檢索附加信息.廣告信息的關鍵字的一 覽表,在顯示了非常感興趣的關鍵字時,通過用戶選擇關鍵字可以得到附加信 息 廣告信息。
另外,不是在終端上直接顯示附加信息'廣告信息本身,而是暫時以關鍵 字的形式顯示,并通過利用者自身的選擇來顯示其信息,因此在識別到多個關 鍵字的情況下也可以選擇利用者真正想要得到的信息。
另夕卜,在語音識別結果根本沒有識別到關鍵字時、或者識別到錯誤的關鍵 字時,再次催促用戶說出關鍵字,不依賴于語音信息的識別算法的性能,用戶 可以取得基于包含在會話中的關鍵字的、與會話的關系密切的信息。
另外,通過在終端側配置,還可以使每個終端具有語音識別的校準數(shù)據(jù)等, 與在交換設備側進行相比,可以期待更高精度的語音識別。
另外,不將^i舌的語音數(shù)據(jù)提供給交換設備供應商,也可以抽出關鍵字。
另外,由于用戶只在顯示了相關性高的關鍵字時,可以通過選擇其關鍵字 來得到附加信息,廣告信息,因此沒必要提供所有的會話相關信息。
另外,不需要實施語音圖像通信(IP電話、IP電視電話)的呼叫控制和 信息交換的專用交換設備、在專用交換設備內(nèi)的關鍵字抽出、來自專用交換設 備的附帶信息的分發(fā)。
另夕卜,在純P2P型的IP電話方式或P2P側的IP電話方式中,也可以實現(xiàn) 向系統(tǒng)提供基于關鍵字的附帶信息。
另夕卜,想要將語音圖像通信服務和附帶信息服務兩者提供給用戶的運營商 并不一定需要構筑、運用專用交換設備。
另外,由于在信息通信系統(tǒng)內(nèi)實施語音識別,不進行在專用交換設備內(nèi)的 語音識別,因此在系統(tǒng)根據(jù)關鍵字取得附帶信息時也可以設定為不向終端外發(fā) 送系統(tǒng)或用戶的標識符。
另外,對于希望保護自己的隱私信息的用戶,可以保證與通常的"從因特 網(wǎng)到用戶終端的文本、語音、圖像信息的下載"同等的隱私保護。
另外,在信息通信系統(tǒng)中可以瀏覽存儲在因特網(wǎng)等專用交換網(wǎng)外的設備中
的附帶信息或廣告信息。
另外,可以提供在進行呼叫設定或信息交換時不需要交換設備的所謂純
P2P型的IP電話方式或在進行信息交換時不需要交換設備的P2P型的IP電話
方式中能夠應用的信息通信終端、信息通信系統(tǒng)、信息通信方法、信息通信程
序以及記錄了信息通信程序的記錄媒體。 (第二實施方式) -整體結構的說明-
第二實施方式的信息通信系統(tǒng)與圖1所示的信息通信系統(tǒng)的不同點在于,
信息通信終端100還具有語音識別結果交換模塊70。
在后述的動作條件設定數(shù)據(jù)23中設定有語音識別結果發(fā)送與否為["1" 需要]時,語音識別結果交換模塊70使用通信模塊19與通話目的地的信息通 信終端100交換語音識別模塊6輸出的單詞信息62。
由語音識別模塊6輸出的語音附加信息61來決定發(fā)送目的地的信息通信 終端IOO。還棄li殳通話對象的信息通信終端IOO為多臺的情況。另外,語音識 別結果交換模塊70將從通話對象的信息通信終端IOO取得的、作為通話目的 地文本數(shù)據(jù)的單詞信息62轉交給關鍵字抽出模塊8。
關鍵字抽出模塊8根據(jù)后述的關鍵字抽出條件設定數(shù)據(jù)24,由從語音識 別結果交換模塊70取得的單詞信息(單詞、詞類)中抽出關鍵字,根據(jù)抽出 的關鍵字和語音附加信息生成后述的抽出關鍵字履歷數(shù)據(jù)21,并將其進行存 儲后轉交給關鍵字受理模塊7。此外,關鍵字的抽出也可以通過記載在第五實 施例中的單詞信息的統(tǒng)計解析或語音接寫來進行。通過使用該模塊,信息通信 終端100的用戶可以縮小顯示在監(jiān)視器2上的關鍵字的范圍。
控制模塊18按照來自語音圖像交換模塊1、語音識別結果交換模塊70、 廣告信息取得模塊12、信息取得方法決定模塊10、相關信息輸出模塊14、共 享信息發(fā)送模塊15、共享信息受理模塊16、以及履歷登錄模塊17的請求,利 用通信模塊19。
通信模塊19是由控制模塊18來控制,在語音圖像交換模塊1、語音識別
結果交換模塊70、廣告信息取得模塊12、信息取得方法決定模塊10、相關信 息輸出模塊14、共享信息發(fā)送模塊15、共享信息受理模塊16、以及履歷登錄 模塊17通過網(wǎng)絡101與其他信息通信終端IOO或相關信息服務器104、位置 服務器102、廣告信息服務器103交換信息時使用。
其他結構實質上與圖1所示的信息通信系統(tǒng)相同,因此省略重復的說明。
-處理流程的說明-
使用圖24以及圖25,說明使用了第二實施方式中的信息通信終端100的 相關信息的取得處理流程。圖2的(1)所示的關鍵字顯示順序以及圖2的(4 ) 所示的關鍵字顯示/信息顯示順序的一部分處理與第一實施方式的處理流程不 同,而其他流程實質上相同,因此省略重復的說明。
<關鍵字顯示順序〉
圖24的關鍵字顯示順序(圖2中的(1))表示直到通過語音識別模塊6 和關鍵字抽出模塊8從通話的語音信息60抽出關鍵字并顯示在監(jiān)視器2上為 止的順序。
首先,通過語音輸入模塊5,取得在語音圖像交換模塊1正在進行通信的 語音信息60以及語音附加信息61,并轉交給語音識別模塊6。這里,所謂語 音附加信息61,是與在語音圖像交換模塊1正在進行的通話有關的信息,包 含通話ID和通話者ID。
在語音識別才莫塊6中, 一接收語音信息60以及語音附加信息61,就根據(jù) 語音信息60確定包含在通話中的單詞和其詞類,生成至少包含詞類的單詞信 息62,在語音識別結果發(fā)送與否被設定為["1"需要]時,將語音信息62以及 語音附加信息61轉交給語音識別結果交換^t塊70和關鍵字抽出模塊8。
在語音識別結果交換模塊70中, 一接收單詞信息62以及語音附加信息 61,就通過控制模塊18來使用通信模塊19,向通話目的地的信息通信終端100 發(fā)送單詞信息62以及從啟動模塊4取得的請求通話者ID。此時,在發(fā)送目的 地的信息通信終端100中,記載在語音附加信息61中的第一 ~第五通話者ID 都成為對象。另外,在語音識別結果交換模塊70中,通過控制模塊18來使用 通信模塊19,接收從通話目的地的信息通信終端100的語音識別結果交換模 塊70發(fā)送來的單詞信息62以及請求通話者ID,并轉交給關鍵字抽出模塊8。
在語音識別結果發(fā)送與否^皮設定為["0"不需要]時,不將單詞信息62以 及語音附加信息61發(fā)送給語音識別結果交換模塊70,而只發(fā)送給關鍵字抽出 模塊8。
關鍵字抽出模塊8從語音識別模塊6接收單詞信息62以及語音附加信息 61 , 一從語音識別結果交換模塊70接收通話目的地的單詞信息62和通話目的 地的請求通話者ID,就以從啟動模塊4取得的請求通話者ID為關鍵詞信息, 通過控制模塊18從存儲媒體20讀入關鍵字抽出條件設定數(shù)據(jù)24。在關鍵字 抽出條件設定數(shù)據(jù)24中設定按照詞類的抽出與否。此外,關鍵字的抽出可以 通過記載在第五實施例的單詞信息的統(tǒng)計解析或語言解析來進行。
然后,通過關鍵字抽出模塊8,從單詞信息只抽出在關鍵字抽出設定數(shù)據(jù) 24中設定為['T抽出]的詞類的單詞來作為關鍵字,根據(jù)抽出的關鍵字以及 語音附加信息61生成抽出關鍵字履歷數(shù)據(jù)21,并通過控制模塊18存儲到存 儲媒體20中。
抽出關鍵字履歷數(shù)據(jù)21至少由抽出年月日時刻、通話ID、請求通話者ID、 通話者ID、發(fā)話者ID、以及抽出關4建字構成,在通話者ID中設定語音附加 信息61的值。
另外,在抽出的關鍵字為從語音識別模塊6取得的單詞信息62時,在發(fā) 話者ID中設定從啟動模塊4取得的請求通話者ID,在抽出的關鍵字為從語音 識別結果交換模塊70取得的單詞信息時,在發(fā)話者ID中設定從語音識別結果 交換模塊70取得的通話目的地的請求通話者ID。
另夕卜,在請求通話者ID中^L定從啟動模塊4取得的請求通話者ID。另夕卜, 在抽出年月日時刻中設定在關鍵字抽出模塊8抽出了關鍵字的年月日時刻。另 外,在抽出關鍵字中設定在關鍵字抽出模塊8中抽出的關鍵字。然后,通過關 鍵字抽出模塊8,將存儲的抽出關鍵字履歷數(shù)據(jù)21轉交給關4建字受理模塊7。 之后的處理與第一實施方式的處理流程相同。
<關鍵字顯示/信息顯示順序>
參照圖25對圖2中的(4)所示的關鍵字顯示/信息顯示順序進行說明。 在圖25中,表示直到通過語音識別模塊6和關鍵字抽出模塊8,從通話 的語音信息60抽出關鍵字,并顯示在監(jiān)視器2上,同時針對顯示的關鍵字,
決定在信息取得方法決定模塊10取得的相關信息68的位置(URL等),相關 信息取得模塊11根據(jù)決定的位置(URL等)來取得相關信息68并將相關信 息68顯示在監(jiān)視器2為止的順序。
首先,通過語音輸入模塊5,取得在語音圖像交換模塊l正在進行通信的 語音信息60以及語音附加信息61,并轉交給語音識別模塊6。這里,所謂語 音附加信息61,是與在語音圖像交換模塊1正在進行的通話有關的信息,包 含通話ID和通話者ID。
在語音識別名模塊6中, 一接收語音信息60以及語音附加信息61,就根 據(jù)語音信息60來確定包含在通話中的單詞和其詞類,生成至少包含單詞以及 詞類的單詞信息62,在語音識別結果發(fā)送與否被設定為["1"需要]時,將語 音信息62以及語音附加信息61轉交給語音識別結果交換模塊70以及關鍵字 抽出模塊8。
在語音識別結果交換模塊70中, 一接收單詞信息62以及語音附加信息 61,就通過控制模塊18來使用通信模塊19,向通話目的地的信息通信終端100 發(fā)送單詞信息62以及從啟動模塊4取得的請求通話者ID。此時,在發(fā)送目的 地的信息通信終端100中,記載在語音附加信息61中的通話者ID全部成為對 象。另外,在語音識別結果交換模塊70中,通過控制模塊18來使用通信模塊 19,接收從通話目的地的信息通信終端100的語音識別結果交換模塊70發(fā)送 來的單詞信息62以及請求通話者ID,并轉交給關鍵字抽出模塊8。
在語音識別結果發(fā)送與否;l皮設定為["0"不需要]時,不將單詞信息62以 及語音附加信息61發(fā)送給語音識別結果交換模塊70,而只發(fā)送給關鍵字抽出 模塊8。
在關鍵字抽出模塊8中,在從語音識別模塊6接收單詞信息62以及語音 附加信息61,從語音識別結果交換模塊70接收通話目的地的單詞信息62和 通話目的地的請求通話者ID時,以從啟動模塊4取得的請求通話者ID為關鍵 詞信息,通過控制模塊18從存儲媒體20讀入關鍵字抽出條件設定數(shù)據(jù)24。 在關鍵字抽出條件設定數(shù)據(jù)24中設定有按照詞類的抽出與否。
然后,通過關鍵字抽出模塊8,從單詞信息只抽出在關鍵字抽出條件設定 數(shù)據(jù)24中設定為["1"抽出]的詞類的單詞來作為關鍵字,根據(jù)抽出的關鍵字以及語音附加信息61來生成抽出關鍵字履歷數(shù)據(jù)21,并通過控制模塊18存 儲到存儲媒體20中。
抽出關鍵字履歷數(shù)據(jù)21至少由抽出年月日時刻、通話ID、請求通話者ID、 通話者ID、發(fā)話者ID、以及抽出關鍵字構成,在通話ID中設定語音附加信 息61的值。
另外,在抽出的關鍵字為從語音識別模塊6取得的單詞信息62時,在發(fā) 話者ID中設定從啟動模塊4取得的請求通話者ID,在抽出的關鍵字為從語音 識別結果交換模塊70取得的單詞信息時,在發(fā)話者ID中設定從語音識別結果 交換模塊70取得的通話目的地的請求通話者ID。
在請求通話者ID中設定從啟動模塊4取得的請求通話者ID。在抽出年月 日時刻中設定關鍵字抽出模塊8抽出了關鍵字的年月日時刻。在抽出關鍵字中 設定關鍵字抽出模塊8抽出的關鍵字。
然后,通過關鍵字抽出模塊8,將存儲的抽出關鍵字履歷數(shù)據(jù)21轉交給 關鍵字受理模塊7。之后的處理流程與第一實施方式的處理相同。
-信息通信終端IOO的畫面輸出圖像-
使用圖12以及圖13對第二實施方式的信息通信終端IOO的畫面輸出圖像 的一例進行說明。在圖12表示進行與語音圖像交換模塊1有關的操作的通話 操作窗口 201、顯示通過關鍵字輸出模塊13輸出的抽出關鍵字以及關鍵字輸 出模塊13輸出的廣告信息64的關鍵字 廣告信息顯示窗口 202、以及輸入來 自鍵盤 鼠標3的取得條件的取得條件輸入窗口 203的顯示例。
首先, 一啟動語音圖像交換模塊1就顯示通話操作窗口 201,用戶可以進 行通話對象的確認、保留或切斷通話等操作。
然后,在通話中從會話的語音信息取得關鍵字以及廣告信息時,顯示關鍵 字 廣告顯示窗口 202,用戶可以選擇想要取得的相關信息。
當由用戶選擇了關鍵字時,進一步顯示取得條件輸入窗口 203。用戶可以 從顯示在該取得條件輸入窗口 203的信息中選擇相關信息的取得條件。
例如,在從顯示在關鍵字.廣告顯示窗口 202的關鍵字中用戶選擇"電影 院,,時,顯示取得條件輸入窗口 203。進一步從該取得條件輸入窗口 203中選 擇"從x x x門戶顯示"時,取得條件被設定為圖16中的["6"從位置服務
器102的位置數(shù)據(jù)35取得],從位置數(shù)據(jù)35取得有關電影院的詳細信息。
另外,圖13表示由信息通信終端IOO輸出至畫面的、在圖12中從位置數(shù) 據(jù)35取得的有關電影院的詳細信息的畫面輸出圖像的一例。
在第二實施方式中,關鍵字抽出模塊8被設置在各信息通信終端上,但是 也可以被設置在網(wǎng)絡上的其他終端(例如檢索服務器等)上。通過將關鍵字抽 出模塊8設置在各信息通信終端以外,可以減輕各信息通信終端的負荷。
以往,已知將基于終端間通話語音的信息和通過通信網(wǎng)內(nèi)的檢索來取得的 信息進行組合的技術。在該技術中,對于來自電視電話的主叫者終端或被叫目 的地終端的通話語音,可以通過這些終端100所連接的交換機進行語音識別, 并以語音識別結果為檢索關鍵字,進行數(shù)據(jù)通信網(wǎng)內(nèi)的信息檢索,將檢索結果 發(fā)送至主叫源數(shù)據(jù)通信終端或者被叫目的地數(shù)據(jù)通信終端。例如,考慮對于以 下會話提供列車的路徑信息的情況
例會話者A "約會地點是渋谷"、會話者B "7點可以嗎?,,、會話者A "明白"
即,對于約會地點、渋谷、7點這樣的^S舌,考慮在會話中提出列車的路 徑信息的情況。為了根據(jù)該會話信息檢索適合的路徑信息,需要目的地以及到 達時刻的信息。
然而,由于上述信息貫穿多個會話者的發(fā)言,因此需要取得各自的語音識 別結果,根據(jù)上述會話的某一方的發(fā)話內(nèi)容無法取得這些信息。另外,存在如 下問題
(1) 以在專用語音交換設備上設置信息提供單元為前提,在不具有該專 用語音交換設備的狀況下無法實現(xiàn)按照會話內(nèi)容的信息提供。
(2) 在未登錄會話者的語音特征信息(校準數(shù)據(jù))時,用于識別語音數(shù) 據(jù)的語音識別單元的精度下降。因此,在上述技術中使用語音識別單元時,在 通話之前必須預先登錄會話者的語音特征信息。另外,在主叫者終端或者被叫 目的地終端中的某一個終端進行語音識別時,必須預先交換并登錄各個會話者 的語音特征信息。但是,為了預先登錄該通話對象的語音特征信息需要很多事 前工作,還需要大量的數(shù)據(jù)。
(3) 另外,在識別通話對象的語音時,從通過通信線路接收到的語音進
行識別處理,而經(jīng)由通信線路后語音質量惡化,若用該惡化的語音進行語音識 別,則語音識別精度下降。
(4) 另外,由于語音識別需要按照會話者的校準,因此將多個會話者的 語音在一個語音識別裝置進行語音識別的情況下,在多個會話者同時發(fā)話時語 音識別精度下降。
(5) 另外,若只針對使用進行語音識別的電視電話的會話者預先登錄語 音特征信息而進行語音識別,則只通過初始的登錄處理就可以得到高精度的語 音識別結果,但是只根據(jù)一方的會話者的發(fā)話內(nèi)容難以確定必要的信息。
另一方面,根據(jù)第二實施方式的信息通信終端,由于從通過網(wǎng)絡連接的外 部相關信息服務器取得信息,因此不使用設置有信息提供模塊的專用語音交換 設備而可以取得必要的信息。
另外,由于使用對于每一信息通信終端設置的語音識別交換模塊而進行語 音識別處理,因此不需要專用的語音交換設備,可以取得信息。
另外,不需要事前取得以及登錄通話對象的語音特征信息,而且不受由于 經(jīng)由通信線路而引起的語音數(shù)據(jù)的惡化的影響,可以高精度地進行語音識別。
另外,在多個發(fā)話者同時發(fā)話時也可以對各個發(fā)話者的發(fā)話內(nèi)容進行高精 度的語音識別。
另外,通過在信息通信終端之間交換進行了語音識別的語音信息,可以將 多個會話者的發(fā)話內(nèi)容進行組合并確定必要的信息。 (第三實施方式) -整體結構的說明-
如圖26所示,第三實施方式的信息通信系統(tǒng)與圖23所示的信息通信系統(tǒng) 的不同點在于,信息通信終端100還具有感情信息處理模塊51以及語音輸出 模塊57。感情信息處理模塊51包括感情識別模塊52、感情信息發(fā)送模塊53、 感情信息接收模塊54、以及感情信息顯示模塊55。
感情識別模塊52根據(jù)從語音輸入模塊5取得的語音信息確定包含在語音 中的感情,并作為感情信息轉交給感情信息發(fā)送^t塊53以及感情信息顯示模 塊55。作為感情信息,可以舉出將包含在語音中的喜怒哀樂分成10階段來評 價的數(shù)據(jù)。感情識別^t塊52并不限定于其所有功能都存儲在信息通信終端上,
還假設一部分功能被存儲在計算能力更高的其他終端上的情況。
感情信息發(fā)送模塊53通過語音圖像交換模塊1、通信模塊19向通話目的
地信息通信終端100發(fā)送由感情識別模塊52生成的感情信息。但是,在信息 通信終端100的利用者在存儲J 某體20的動作條件設定凄t據(jù)23中設定禁止向通 話目的地信息通信終端IOO發(fā)送感情信息時,不實施感情信息的發(fā)送。另夕卜, 還假設通話目的地信息發(fā)送終端100為多臺的情況。
感情信息接收模塊54通過語音圖像交換模塊1、通信模塊19接收由通話 目的地信息通信終端100的感情信息發(fā)送模塊53發(fā)送的感情信息,并將接收 到的感情信息轉交給感情信息顯示模塊55。還假設通話目的地的信息通信終 端IOO為多臺的情況。
感情信息顯示模塊55通過控制模塊18向監(jiān)視器2顯示從感情識別模塊 52取得的感情信息(=自己的感情信息)、以及從感情信息接收模塊54取得 的感情信息(=通話對象的感情信息)。
控制模塊18控制向語音圖像交換模塊1傳遞鍵盤 鼠標3的輸入信息; 啟動語音圖像交換模塊1;向監(jiān)視器2輸出語音圖像交換模塊1交換的圖像以 及感情信息顯示模塊55輸出的圖像;語音圖像交換模塊1利用通信模塊19; 以及語音圖像交換模塊1、感情信息發(fā)送模塊53、感情信息顯示模塊55向存 儲媒體20的讀寫。
監(jiān)視器2是由控制模塊18來控制,向信息通信終端100的用戶顯示語音
圖像交換模塊l交換的圖像和文字信息、感情信息顯示模塊55輸出的感情信 會
語音輸入模塊5取得自身終端的語音信息,并通過控制模塊18轉交給語 音圖像交換模塊1和感情識別模塊52。具體而言,假設麥克風和語音AD轉 換器。
' 語音輸出模塊57通過控制模塊18來再生從語音圖像交換模塊1取得的語 音信息。具體而言,布H殳揚聲器和語音AD轉換器。
存儲媒體20是由控制模塊18來控制,由語音圖像交換模塊l、感情信息 發(fā)送模塊53以及感情信息顯示模塊55來進行信息的保存和讀出。在履歷數(shù)據(jù) 文件20b中設定感情信息履歷數(shù)據(jù)56。
感情信息履歷數(shù)據(jù)56是表示通過自身信息通信終端、通話目的地信息通
信終端的感情識別才莫塊52從語音信息抽出的感情信息的履歷的數(shù)據(jù),假設由 受理年月日時刻、通話者ID、以及感情信息構成。圖27表示這些各項目的內(nèi) 容或設定的一個例子。
另外,在設定數(shù)據(jù)文件20a的動作條件設定數(shù)據(jù)23中存儲信息通信終端 100的動作上的設定數(shù)據(jù)。假設動作條件設定數(shù)據(jù)23由自身終端通話者ID設 定數(shù)據(jù)、感情信息發(fā)送可否設定數(shù)據(jù)構成。圖28表示這些各項目的內(nèi)容或設 定的一個例子。
其他結構實質上與圖1以及圖23所示的信息通信系統(tǒng)相同,因此省略重 復的說明。
-處理流程的"i兌明-
使用圖29,對使用第三實施方式的信息通信終端100而進行的感情信息 的交換方式的處理流程。
首先,由信息通信終端100的用戶使用鍵盤 鼠標3來啟動語音圖像交換 模塊1 。此時,語音圖像交換模塊1通過控制模塊18從存儲媒體20讀出動作 條件設定數(shù)據(jù)23的自身終端通話者ID。
然后,由信息通信終端100的用戶使用鍵盤 鼠標3向語音圖像交換模塊 1輸入通話對象目的地的通話者ID。語音圖像交換模塊1使用輸入的通話對象 目的地的通話者ID和自身終端通話者ID,開始與通話對象目的地的通話(圖 像、語音、文字信息、文件的實時交換)。
然后,通過語音輸入模塊5取得自身信息通信終端100的用戶的發(fā)話語音, 并向語音圖像交換模塊1和感情識別模塊52轉交語音信息(自身終端)。
在語音圖像交換模塊1中, 一接收語音信息(自身終端),就通過控制模 塊18來經(jīng)由通信才莫塊19,向通話對象目的地的信息通信終端100發(fā)送語音信 息(自身終端)(圖29中的A0)。
另夕卜,在語音圖像交換模塊1中,在通過控制模塊18來經(jīng)由通信模塊19, 從通話對象目的地的信息通信終端100接收語音信息(自身終端)時(圖29 中的A1),向語音輸出模塊57轉交接收到的語音信息(通話目的地)。在語音 輸出模塊57中,再生所取得的語音信息(通話目的地)。這里,"在自身終端
的AO和在通話目的地終端的Al"、"在通話目的地終端的AO和在自身終端的 Al"在通信的執(zhí)行上是成對的。
在感情識別模塊52中,從語音圖像交換模塊1接收到語音信息(自身終 端)時,測定包含在語音信息(自身終端)中的感情,并生成感情信息(自身 終端)。然后,通過感情識別模塊52向感情信息發(fā)送模塊53和感情信息顯示 模塊55轉交感情信息(自身終端)。
在感情信息發(fā)送模塊53中, 一接收感情信息(自身終端),就通過控制模 塊18從存儲々某體20讀出動作條件設定數(shù)據(jù)23的感情信息發(fā)送可否的值。
這里,在值為"1"(可以)時,通過感情信息發(fā)送模塊53向語音圖像交 換模塊1轉交感情信息(自身終端)。進一步在語音圖像交換模塊1中, 一接 收感情信息(自身終端),就通過控制模塊18來經(jīng)由通信模塊19,向通話對 象目的地的信息通信終端IOO發(fā)送感情信息(自身終端)和從存儲媒體20讀 出的自身終端的通話者ID (圖2中的BO)。
另外,在感情信息發(fā)送可否的值為"0"(不可以)時,通過感情信息發(fā)送 模塊53來廢棄感情信息(自身終端)。
在語音圖像交換模塊l中,通過控制模塊18來經(jīng)由通信模塊19,從通話 對象目的地的信息通信終端100接收到感情信息(通話目的地)以及通話目的 地終端的通話者ID時(圖2中的Bl ),向感情信息接收模塊54轉交接收到的 感情信息(通話目的地)以及通話目的地終端的通話者ID。
然后,由感情信息接收模塊54進一步向感情信息顯示模塊55轉交所取得 的感情信息(通話目的地)以及通話目的地終端的通話者ID。這里,"在自身 終端的B0和在通話目的地終端的Bl"、"在通話目的地終端的B0和在自身終 端的B1"在通信的執(zhí)行上是成對的。
然后,在感情信息顯示模塊55中從感情識別模塊52接收到感情信息(自 身終端)時,通過控制模塊18從存儲媒體20讀出動作條件設定數(shù)據(jù)23的自 身終端通話者ID。
然后,由感情信息顯示模塊55生成感情信息履歷數(shù)據(jù)56,并通過控制模 塊18來保存到存儲媒體20中。在感情信息履歷數(shù)據(jù)56的"受理年月日時刻" 中設定從感情識別模塊52接收到感情信息(自身終端)的時刻,在"通話者
ID"中設定所讀出的自身終端的通話者ID,在"感情信息"中設定從感情識
別模塊52取得的感情信息(自身終端)。
然后,在感情信息顯示模塊55中,通過控制模塊18向監(jiān)視器2顯示保存 的感情信息履歷數(shù)據(jù)56。
另夕卜,在感情信息顯示模塊55中,從感情信息接收模塊54接收到感情信 息(通話目的地)以及通話目的地終端的通話者ID時,生成感情信息履歷數(shù) 據(jù)56,并通過控制模塊18保存到存儲媒體20中。
此時,在感情信息履歷數(shù)據(jù)56的"受理年月日時刻,,中設定從感情信息 接收模塊54接收到感情信息(通話目的地)的時刻,在"通話者ID"中設定 從感情信息接收模塊54取得的通話目的地終端的通話者ID,在"感情信息" 中設定從感情信息接收模塊54取得的感情信息(通話目的地)。
然后,在感情信息顯示模塊55中,通過控制模塊18向監(jiān)視器2顯示保存 的感情信息履歷數(shù)據(jù)56。
最后,由信息通信終端100的用戶使用^l建盤 鼠標3來才喿作語音圖像交換 模塊l,由此結束與通話對象目的地的通話(圖像、語音、文字信息、文件的 實時交換),在必要時進一步結束語音圖像交換模塊1。
已知使用PC等終端來取得語音或圖像等信息,并根據(jù)取得的該語音信息 進一步分析會話者的感情信息的技術。利用該技術,提供如下服務在配置在 專用的交換機上的感情識別裝置中,通過分析在通信終端間交流的會話的語音 信息來生成感情信息,通話者從通信終端瀏覽在該感情識別裝置上的通話對象 的感情信息。
但是,在該服務中用于分析的語音信息是通過通信線路來取得,因此受音 頻的影響而音質惡化,感情識別的精度下降。
另一方面,已知將從話筒等輸入的語音轉換成字符串,并從其轉換結果分 析感情信息的技術。通過該技術,分析不經(jīng)由通信線路而輸入的語音,可以生 成識別精度高的感情信息。
然而,由于沒有提供取得已分析的通信對象的感情信息的單元,因此在 P2P (PeertoPeer)型通信中,未能取得還包含附加信息的感情信息。
對此,根據(jù)第三實施方式的信息通信終端100,由于使用對每一信息通信
終端100設置的感情識別模塊52而進行感情識別處理,因此在經(jīng)由通信線路 的通話中也可以高識別精度地取得通話對象的感情信息。另外,不受由于經(jīng)由 通信線路而引起的語音數(shù)據(jù)的惡化的影響,可以高精度地進行感情識別。
另夕卜,從通過網(wǎng)絡連接的其他信息通信終端取得感情信息,由此不使用專
用交換i殳備,而可以取得適當?shù)母郊有畔⒑透星樾畔ⅰS纱?,在P2P(Peerto Peer)型通信中,可以取得包含符合會話內(nèi)容或感情信息的適當?shù)母郊有畔⒌?感情信息。
(第三實施方式的變更例)
在第三實施方式的變更例中,說明使用圖26所示的信息通信終端100的 相關信息取得模塊11而取得與輸入的語音信息相關聯(lián)的相關信息的例子。
在由語音輸入模塊5輸入自身信息通信終端用戶的發(fā)話語音時,向語音識 別模塊6轉交語音信息(自身終端)。
在語音識別模塊6中, 一接收語音信息(自身終端),就確定包含在語音 信息(自身終端)中的單詞,并轉換為輸入文本數(shù)據(jù)。將被轉換的輸入文本數(shù) 據(jù)轉交給語音識別結果交換模塊70以及相關信息取得模塊11。
在語音識別結果交換模塊70中, 一接收輸入文本數(shù)據(jù),就向通話目的地 的信息通信終端100發(fā)送該輸入文本數(shù)據(jù),同時從通話目的地的信息通信終端 100接收在通話目的地進行轉換的通話目的地文本數(shù)據(jù)。將輸入文本數(shù)據(jù)以及 接收到的通話目的地文本數(shù)據(jù)從語音識別結果交換模塊70轉交給關鍵字抽出 模塊8。
在關鍵字抽出模塊8中, 一接收輸入文本數(shù)據(jù)以及通話目的地文本數(shù)據(jù),
鍵字。將抽出的關鍵字轉交給相關信息取得模塊ll。
在相關信息取得模塊11中一接收關鍵字,就向相關信息服務器104發(fā)送 該關鍵字的相關信息的請求。
在相關信息服務器104中, 一接收相關信息的請求,就通過控制模塊43 從存儲媒體45取得必要的相關信息。取得的相關信息被發(fā)送至請求源的信息 通信終端100的相關信息取得模塊11。
在相關信息取得模塊11接收到的相關信息被顯示在監(jiān)視器2上。
根據(jù)第三實施方式的變更例的信息通信終端100,可以取得通信對象的感
情信息,同時還可以取得與會話內(nèi)容相關聯(lián)的相關信息。 (第四實施方式) -整體結構的說明-
如圖30所示,第四實施方式的信息通信系統(tǒng)與圖1、圖23以及圖26所 示的信息通信系統(tǒng)的不同點在于,具有警告信息服務器106。
在本實施方式中,警告信息服務器106是與信息通信終端100成對地使用 的裝置,保存警告數(shù)據(jù)80。
所謂警告數(shù)據(jù)80,是表示在信息通信終端100應監(jiān)視的關鍵字集合 (keyword set)、在檢測到包含在該集合中的關鍵字時在監(jiān)視器2上顯示警告 的條件、以及在監(jiān)視器2上顯示的警告數(shù)據(jù)80的數(shù)據(jù),假設由警告信息服務 器106的運營商來編輯管理。
運營商例如從警察等隨時接收關于使用電話的詐騙的、與多種關鍵字有關 的信息,并登錄在警告數(shù)據(jù)80中。
在信息通信終端100中設定有允許取得警告信息80時(在后述的警告數(shù) 據(jù)取得與否為["1"需要]時),信息通信終端100可以從警告信息服務器106 取得警告數(shù)據(jù)80,并更新信息通信終端100的警告條件設定數(shù)據(jù)75。其他結 構實質上與第一以及第二實施方式中說明的結構相同,因此省略重復的記載。
<信息通信終端100的結構和動作的說明>
信息通信終端100還具有警告顯示模塊71、警告信息取得模塊72、通信 切斷模塊73以及錄音模塊74。
警告顯示模塊71監(jiān)視關鍵字抽出模塊8保存的抽出關鍵字履歷數(shù)據(jù)21, 在保存有在警告條件設定數(shù)據(jù)75中的警告對象關鍵字集合中包含的關鍵字 時,對其進行計數(shù),在檢測次數(shù)滿足警告對象條件時,將警告顯示信息輸出至 監(jiān)視器。另外,具有在一定時間內(nèi)沒有檢測到來自通信對象的關鍵字的情況下 也將警告數(shù)據(jù)80輸出至監(jiān)視器2的功能。此外,在本實施方式中,作為警告 對象條件記載"是否超過檢測次數(shù)的闊值(警告對象監(jiān)測次數(shù))",但是也可以 通過邏輯式來記載條件。
警告信息取得模塊72是在動作條件設定數(shù)據(jù)23中設定有警告數(shù)據(jù)取得與
否為["1"需要]時,使用通信模塊19從警告信息服務器106取得警告數(shù)據(jù)80 的模塊。由警告顯示模塊71來調用警告信息取得模塊72。
通信切斷模塊73監(jiān)視關鍵字抽出模塊8保存的抽出關鍵字履歷數(shù)據(jù)21 , 在保存有在警告條件設定數(shù)據(jù)75中的警告對象關鍵字集合中包含在關鍵字 時,對其進行計數(shù),在檢測次數(shù)滿足警告對象條件時,自動切斷通信。
錄音模塊74監(jiān)視關鍵字抽出模塊8保存的抽出關鍵字履歷數(shù)據(jù)21,在保 存有在警告條件設定數(shù)據(jù)75中的警告對象關鍵字集合中包含的關鍵字時,對 其進行計數(shù),在檢測次數(shù)滿足警告對象條件時,開始通話中的語音信息的錄音。
控制模塊18向關鍵字受理模塊7傳遞鍵盤 鼠標3的輸入信息,以及向 監(jiān)視器2輸出語音圖像交換模塊1交換的圖像以及關鍵字輸出模塊13、相關 信息取得模塊11、警告顯示模塊71輸出的信息。
另夕卜,控制模塊18進行語音圖像交換模塊1、語音識別結果交換模塊70、 廣告信息取得模塊12、信息取得方法決定模塊10、相關信息輸出模塊14、共 享信息發(fā)送模塊15、共享信息受理模塊16、履歷登錄模塊17、以及警告信息 取得模塊72對通信模塊19的利用。
而且,控制模塊18控制關鍵字受理模塊7、關鍵字抽出模塊8、信息取得 條件受理模塊9、信息取得方法決定模塊10、相關信息取得模塊11、共享信 息受理模塊16、以及警告顯示模塊71向存儲媒體的讀寫。
通信模塊19是由控制模塊18來控制,在語音圖像交換模塊1、語音識別 結果交換模塊70、廣告信息取得模塊12、信息取得方法決定模塊10、相關信 息輸出模塊14、共享信息發(fā)送模塊15、共享信息受理模塊16、履歷登錄模塊 17、以及警告信息取得模塊72通過網(wǎng)絡101與其他信息通信終端100或相關 信息服務器104、位置服務器102、廣告信息服務器103、警告信息服務器106 交換信息時使用該通信^t塊19。具體而言,假設用于以物理的方式發(fā)送數(shù)據(jù) 的系統(tǒng)(調制解調器)和其控制軟件。
存儲媒體20是由控制模塊18來控制,由關鍵字受理模塊7、關鍵字抽出 模塊8、信息取得條件受理模塊9、信息取得方法決定模塊10、相關信息取得 模塊ll、共享信息受理模塊16、警告顯示模塊71來保存、讀出信息。存儲媒 體20中存儲設定數(shù)據(jù)文件20a、履歷數(shù)據(jù)文件20b、位置數(shù)據(jù)文件20c、個人
信息數(shù)據(jù)文件20d、以及保存錄音數(shù)據(jù)82的錄音數(shù)據(jù)文件20e。在設定數(shù)據(jù)文 件20a中設定有警告條件設定數(shù)據(jù)75。
在動作條件設定數(shù)據(jù)23中存儲信息通信終端100的動作上的設定數(shù)據(jù)。 假設動作條件設定數(shù)據(jù)23由請求通話者ID、信息取得條件輸入與否、語音識 別結果發(fā)送與否、廣告顯示與否、警告數(shù)據(jù)取得與否、通^f言切斷與否、錄音與 否、外部服務器利用與否、默認共享條件設定、以及廣告信息服務器103的位 置(履歷用)構成。在圖36表示這些各項目的內(nèi)容或設定的一個例子。
警告條件設定數(shù)據(jù)75是用于監(jiān)視由關鍵字抽出模塊8從語音信息抽出的 關鍵字的數(shù)據(jù),假設由請求通話者ID、關鍵字未檢測警告設定時間、關鍵字 未檢測警告信息、第一有效年月日時刻、第一警告對象關鍵字集合、第一警告 對象檢測次數(shù)、第一警告顯示信息、第二有效年月日時刻、第二警告對象關鍵 字集合、第二警告對象檢測次數(shù)、第二警告對象關鍵字檢測警告信息、第三有 效年月日時刻、第三警告對象關鍵字集合、第三警告對象4企測次數(shù)、以及第三 警告對象關鍵字檢測警告信息構成。在圖37表示這些各項目的內(nèi)容或設定的 一個例子。
警告對象關鍵字集合、警告對象檢測次數(shù)、以及警告顯示信息不限定于3 個,也可以是與需要的警告數(shù)相同的數(shù)量。另外,警告對象檢測次數(shù)不限定于 次數(shù),也可以通過邏輯式來記述警告信息的顯示條件。
通話錄音數(shù)據(jù)82是用錄音模塊74對由語音輸入模塊5取得的語音信息、 以及在動作條件設定數(shù)據(jù)23的錄音與否被設定為["1"需要]時通過通信模塊 19從通話目的地的信息通信終端100取得的語音信息進行錄音的數(shù)據(jù)。其他 結構以及動作實質上與第一以及第二實施方式中的信息通信終端100相同,因 此省略i兌明。
<警告信息服務器106的結構和動作的說明>
警告信息服務器106包括警告信息提供模塊76、控制模塊77、通信模塊 78、以及存儲媒體79。
警告信息4是供模塊76用于警告信息服務器106通過網(wǎng)絡101從信息通信 終端100取得警告信息請求81,并將警告數(shù)據(jù)80反饋給信息通信終端100。
控制模塊77控制警告信息提供模塊76對通信模塊78的利用,控制存儲
媒體79。
通信模塊78是由控制模塊77來控制,在警告信息提供模塊37通過網(wǎng)絡 101與信息通信終端100交換信息時使用該通信模塊78。具體而言,假設用于 以物理的方式發(fā)送數(shù)據(jù)的裝置(調制解調器等)和其控制軟件。
存儲媒體79是由控制模塊77來控制,由警告信息提供模塊76來保存、 讀出信息。另外,在存儲媒體79中作為數(shù)據(jù)存儲警告數(shù)據(jù)80。
警告數(shù)據(jù)80是用于監(jiān)視信息通信終端100通過關鍵字抽出模塊8從語音 信息抽出的關鍵字的數(shù)據(jù),假設由登錄年月日時刻、有效年月日時刻、警告對 象關鍵字集合、警告對象檢測次數(shù)、以及警告顯示信息構成。
在圖38表示警告數(shù)據(jù)80的各項目的內(nèi)容或設定的一個例子??梢缘卿浻?與需要的警告數(shù)相同數(shù)目的警告對象關鍵字集合、警告對象檢測次數(shù)、警告顯 示信息。另外,警告對象檢測次數(shù)不限定于次數(shù),也可以通過邏輯式記述警告 信息的顯示條件。
-處理流程的說明—
使用圖31 ~圖35,說明使用第四實施方式中的信息終端的相關信息的取 得方式的處理流程。此外,由于圖31的(1)、 (2)以及(4)所示的處理與第 一以及第二實施方式的處理相同,因此省略重復的說明。
<啟動順序〉
如圖31所示,信息通信終端100的用戶使用鍵盤 鼠標3來執(zhí)行啟動模 塊4。此時,可以輸入執(zhí)行了啟動的用戶的請求通話者ID。首先,由啟動模塊 4啟動語音圖像交換模塊1,開始與通話對象的通話。然后,由啟動模塊4, 以通話者ID為關鍵詞信息,通過控制模塊18從存儲媒體20取得動作條件設 定數(shù)據(jù)23的信息取得條件輸入與否的值。
這里,作為基于信息取得條件輸入與否的值的第一條件分支,在信息取得 條件輸入與否的值為["1"需要]時,由啟動模塊4啟動語音輸入模塊5 (跳轉 到(1)關鍵字顯示順序(圖24))、信息取得條件受理模塊9 (跳轉到(2)取 得條件受理/信息顯示順序(圖4))、共享信息受理纟莫塊16 (跳轉到(3)共享 信息接4t/顯示順序(圖5 ))、警告顯示模塊71 (跳轉到(5 )警告顯示順序(圖 32))、通信切斷模塊73 (跳轉到(6)通信切斷順序(圖33))、以及錄音模塊
74 (跳轉到(7 )錄音順序(圖34 ))。
在信息取得條件輸入與否的值被設定為["1"需要]時,用戶可以根據(jù)顯 示在監(jiān)視器2上的關鍵字選擇作為相關信息取得對象的關鍵字,或輸入相關信 息的取得條件。另外,可以與通話對象共享所取得的相關信息。
然后,作為基于信息取得條件輸入與否的值的第二條件分支,在信息取得 條件輸入與否的值被設定為["0"不需要]時,由啟動模塊4啟動語音輸入模 塊5 (跳轉到(4)關鍵字顯示/信息顯示順序(圖25))、共享信息受理模塊16 (跳轉到(3)共享信息接^/顯示順序(圖5))、以及警告顯示模塊71 (跳轉 到(5)警告顯示順序(圖32)X
在信息取得條件輸入與否的值被設定為["0"不需要]時,用戶無法根據(jù) 顯示在監(jiān)視器2上的關鍵字選擇作為相關信息取得對象的關鍵字,或無法輸入 相關信息的取得條件,自動地顯示針對抽出的關鍵字的相關信息、或通話對象 共享的相關信息。
另外,向由啟動模塊4啟動的各模塊轉交請求通話者ID。
<警告顯示順序>
參照圖32對圖31中的(5)所示的警告顯示順序進行說明。 警告顯示順序(圖32)表示直到由啟動模塊4啟動警告顯示模塊17后監(jiān) 視關鍵字抽出模塊8所保存的抽出關鍵字履歷數(shù)據(jù)21,在包含在抽出關鍵字 履歷數(shù)據(jù)21中的關鍵字滿足警告對象條件時向監(jiān)視器2輸出警告數(shù)據(jù)80為止 的順序。
首先,警告顯示模塊7以從啟動模塊4取得的請求通話者ID為關鍵詞信 息,通過控制模塊18從存儲媒體20讀入動作條件設定數(shù)據(jù)23的警告數(shù)據(jù)取 得與否的值。
在動作條件設定數(shù)據(jù)23的警告數(shù)據(jù)取得與否的值被設定為["1"需要]時, 由警告顯示模塊71通過控制模塊18從存儲媒體讀入動作條件設定數(shù)據(jù)23的 警告信息服務器位置的值,并轉交給警告信息取得模塊72。
接著,警告信息取得模塊72—接收警告信息服務器位置的值,就根據(jù)警 告信息服務器位置的值,通過控制模塊18來使用通信模塊19,向警告信息服 務器106發(fā)送警告信息請求81,從警告信息服務器106取得警告數(shù)據(jù)80,并 反饋給警告顯示模塊7L
關于在警告信息服務器106的警告數(shù)據(jù)80的發(fā)送,參照圖35的警告信息 提供順序在后面進行敘述。
然后,由警告顯示模塊71生成與取得的警告數(shù)據(jù)80有關的警告條件設定 數(shù)據(jù)75,并通過控制模塊18向存儲媒體20中存儲所生成的警告條件設定數(shù) 據(jù)75。
另夕卜,由警告顯示模塊71以從啟動模塊4取得的請求通話者ID為關鍵詞 信息,存儲所取得的警告數(shù)據(jù)80的有效年月日時刻、警告對象關鍵字集合、 警告對象檢測次數(shù)、以及警告顯示信息來作為警告條件設定數(shù)據(jù)75的有效年 月日時刻、警告對象關鍵字集合、警告對象檢測次數(shù)、以及警告顯示信息。
在動作條件設定數(shù)據(jù)23的警告數(shù)據(jù)取得與否的值被設定為["0"不需要] 時,在警告顯示模塊71中,不取得來自警告信息服務器106的警告數(shù)據(jù)80。
另夕卜,在警告顯示模塊71中,以請求通話者ID為關鍵詞信息,通過控制 模塊18從存儲媒體20取得保存完畢的警告條件設定數(shù)據(jù)75。
此時,由警告顯示模塊71讀出警告條件設定數(shù)據(jù)75中的關鍵字未檢測警 告設定時間、關鍵字未檢測警告信息、以及有效年月日時刻在當前時刻之后的 警告對象關鍵字集合、警告對象檢測次數(shù)、以及警告顯示信息。
(*)然后,由警告顯示模塊71以請求通話者ID為關鍵詞信息,通過控 制模塊18從存儲媒體20取得由啟動模塊4啟動警告顯示模塊71后保存的抽 出關鍵字履歷數(shù)據(jù)21。
在取得的抽出關鍵字履歷數(shù)據(jù)21中,在發(fā)話者ID為從啟動模塊4取得的
請求通話者ID以外的記錄所存在的時間不超過關^:字未檢測警告設定時間
時,警告顯示模塊71通過控制模塊18向監(jiān)視器2輸出關鍵字未檢測警告信息。 然后,由警告顯示模塊71檢索抽出關鍵字履歷數(shù)據(jù)21的抽出關鍵字,并 對抽出關鍵字包含在警告對象關鍵字集合中的抽出關鍵字履歷數(shù)據(jù)21的數(shù)進 行計數(shù)。
在計數(shù)結果為符合的警告對象關鍵字集合的警告對象檢測次數(shù)以上時,警 告顯示模塊71通過控制模塊18向監(jiān)視器2輸出符合的警告對象關鍵字集合的 警告數(shù)據(jù)80。
在警告顯示模塊71中,將上述(* )之后的處理重復進行至語音圖像交換 模塊l結束為止。
<通信切斷順序>
參照圖33對圖31的(6)所示的通信切斷順序進行說明。 通信切斷順序(圖33 )表示直到由啟動模塊4啟動通信切斷模塊73后監(jiān)
視關鍵字抽出模塊8保存的抽出關鍵字履歷數(shù)據(jù)21,并在抽出關鍵字履歷數(shù)
據(jù)21中包含的關鍵字滿足警告對象條件時切斷通信為止的順序。
首先,由通信切斷模塊73以從啟動模塊4取得的請求通話者ID為關鍵詞
信息,通過控制模塊18從存儲媒體20讀入動作條件設定數(shù)據(jù)23的通信切斷
與否的值。
在動作條件設定數(shù)據(jù)23的通信切斷與否的值被設定為["1"需要]時,根 據(jù)請求通話者ID,通信切斷模塊73通過控制模塊18向通信模塊19發(fā)送通信 切斷請求83,并切斷通信。
在動作條件設定數(shù)據(jù)23的通信切斷與否的值被設定為["0"不需要]時, 不發(fā)送通信切斷請求83。
<錄音順序>
參照圖34對圖31的(7)所示的錄音順序進行說明。
錄音順序(圖34)表示直到由啟動模塊4啟動錄音模塊74后監(jiān)視關鍵字 抽出模塊8保存的抽出關鍵字履歷數(shù)據(jù)21,并在抽出關鍵字履歷數(shù)據(jù)21中包 含的關鍵字滿足警告對象條件時,錄音通話中的語音信息60為止的順序。
首先,錄音模塊74以從啟動模塊4取得的請求通話者ID為關鍵詞信息, 取得從語音輸入模塊5輸入的語音信息60。
然后,以從啟動模塊4取得的請求通話者ID為關鍵詞信息,通過控制模 塊18從存儲Ji某體20讀入動作條件設定數(shù)據(jù)23的錄音與否的值。
在動作條件設定數(shù)據(jù)23的錄音與否的值被設定為["1"需要]時,根據(jù)請 求通話者ID,錄音模塊74通過控制模塊18使用通信模塊19,向通話目的地 的信息通信終端IOO發(fā)送語音信息請求84,從通話目的地的信息通信終端100 取得語音信息60,并反饋給錄音模塊74。
錄音模塊74在存儲媒體20的通話錄音數(shù)據(jù)82中存儲從語音輸入模塊5
輸入的語音信息60以及/人通話目的地的信息通信終端100取得的語音信息 60。
將以上處理重復進行至語音圖像交換結束為止。 <警告信息提供順序>
接著,參照圖35對警告信息提供順序進行說明。圖35表示直到警告信息 服務器106通過網(wǎng)絡101接收來自信息通信終端100的警告信息請求81并將 警告數(shù)據(jù)80反饋給信息通信終端100為止的順序。
在警告信息服務器106的警告信息提供模塊76中,通過控制模塊77使用 通信模塊78,接收從信息通信終端100的警告信息取得模塊72發(fā)送來的警告 信息請求81。
然后,警告信息提供模塊76通過控制模塊77檢索存儲媒體79中的警告 數(shù)據(jù)80的記錄,并讀出警告數(shù)據(jù)80的記錄中的有效年月日時刻在當前時刻之 后的警告對象關鍵字集合、警告對象檢測次數(shù)、以及警告數(shù)據(jù)80。
然后,警告信息提供模塊76通過控制模塊77使用通信模塊78,向信息 通信終端100的警告信息取得模塊72發(fā)送讀出的有效年月日時刻、警告對象 關鍵字集合、警告對象檢測次數(shù)、以及警告數(shù)據(jù)80。
在警告信息提供模塊76中,通過控制模塊77等待來自信息通信終端100 的警告信息取得模塊72的警告信息請求81的發(fā)送。
將以上處理重復進行至語音圖像交換模塊1結束為止。
-信息通信終端IOO的畫面輸出圖像-
圖12表示本實施方式信息通信終端IOO的畫面輸出圖像的一例。
首先,已啟動語音圖像交換模塊l就顯示通話操作窗口 201,用戶可以進 行通話對象的確認、保留或切斷通話等操作。
然后,在通話中從會話的語音信息取得關鍵字以及廣告信息時,顯示關鍵 字.廣告顯示窗口 202,用戶可以選擇想要取得的相關信息的關鍵字。
由用戶選擇關鍵字后進一步顯示取得條件輸入窗口 203。用戶可以從該取 得條件輸入窗口 203中顯示的取得條件中選擇相關信息的取得條件。
例如,用戶從關鍵字 廣告顯示窗口 202顯示的關鍵字中選擇"電影院" 時,顯示取得條件輸入窗口 203。進一步從該取得條件輸入窗口 203中選擇"從
xxx門戶顯示"時,將取得條件設定為圖18中的["6"從位置服務器102
的位置數(shù)據(jù)35取得],并從位置數(shù)據(jù)35取得有關電影院的詳細信息。
另外,圖13表示由信息通信終端100將在圖12中從位置數(shù)據(jù)35取得的
有關電影院的詳細信息輸出至畫面的畫面輸出圖像的一例。
此外,在警告顯示順序中也可以設定為由啟動模塊4啟動警告顯示模塊
71后,監(jiān)視關鍵字抽促模塊8保存的抽出關鍵字履歷數(shù)據(jù)21,在抽出關鍵字
履歷數(shù)據(jù)21中包含的關鍵字滿足警告對象條件時,由通信切斷模塊73切斷通
另外,在同樣的情況下也可以設定為由錄音模塊74開始通話的語音信息 的錄音。
近年來,以匯款騙局為代表的不法人員的騷擾電話時有發(fā)生。這些騷擾電 話的通信對象為不確定的多數(shù)并且事前并不能得知對象。此外,這些騷擾電話 的手法多是進行冒充或假裝為虛構的交通事故而后請求匯款等,巧妙地利用時 間緊迫。因此,在被叫者側難以識別是騷擾電話或進行處置。
作為對騷擾電話的對策方法,有"號碼請求服務"或"騷擾電話拒絕服務"。 "號碼請求服務"是拒絕沒有來電顯示的電話的呼叫的服務。通過該服務, 用戶為了進行通話被強制顯示主叫者號碼。因此被叫者通過被叫事先至少可以 確認主叫者的電話號碼。
"騷擾電話拒絕服務"是接到騷擾電話后通過從被叫者的電話機登錄該騷 擾電話的主叫者號碼,來拒絕之后的來自該主叫者的電話的服務。通過該服務, 可以拒絕接收來自特定騷擾電話的主叫者的電話。
然而,"號碼請求服務,,通過進行號碼通知來容易地回避,另外,存在如 近年的撥入欺詐等,不是簡單的號碼通知的問題而是以會話內(nèi)容來欺詐的電話 等被叫者自身無法識別為騷擾電話的問題。
另外,"騷擾電話拒絕服務"只能防止已經(jīng)知道主叫者號碼的特定主叫者 的騷擾電話,存在不能對應如近年的撥入欺詐等來自不確定數(shù)量的騷擾電話等 初次接收的主叫者號碼的電話的問題。
在接收者能夠識別到接收到的電話為騷擾電話時,可以考慮切斷通話、錄 音通話內(nèi)容來作為證據(jù)、以及為了確認真?zhèn)谓o其他人打電話等典型的對策,但
是"號碼請求服務"或"騷擾電話拒絕服務,,都只能制止通話,不能考慮應該 在通話開始后進行的這些對策。
對此,根據(jù)第四實施方式的信息通信終端100,可以根據(jù)從通話對象發(fā)出 的會話內(nèi)容抽出的關鍵字來識別是否為騷擾電話,因此針對來自不確定的主叫 者的電話,接受者也可以在通話中識別是否為騷擾電話。
另夕卜,在顯示識別為騷擾電話的警告時,接收者可以及時采取對策。而且, 從確定為騷擾電話信息的外部警告信息服務器取得用于識別為騷擾電話的關 鍵字等來使用,因此也可以對應巧妙的騷擾電話的手段。 (第五實施方式)
-整體結構的說明-
如圖39所示,第五實施方式的信息通信系統(tǒng)與第一 第四實施方式的信 息通信系統(tǒng)的不同點在于,具備與網(wǎng)絡101連接的關鍵字抽出服務器107。
在本發(fā)明中,關鍵字抽出服務器107是與信息通信終端100成對地使用的 裝置,從通過信息通信終端100進行的會話內(nèi)容抽出關鍵字。更具體地,具備 信息通信終端100的語音識別模塊6從信息通信終端IOO取得文本化的會話的 單詞信息并抽出關鍵字的服務器側關鍵字抽出模塊(省略圖示),并向信息通 信終端IOO返回從單詞信息抽出的關鍵字信息。作為關鍵字抽出方式,假設抽 出單詞的特定詞類的方式、通過單詞信息的統(tǒng)計解析或語言解析來抽出的方
式。只要是抽出恰當?shù)年P鍵字的方式就可以。 <信息通信終端100的結構和動作的說明>
信息通信終端100與第一 -第四實施方式的信息通信終端100的不同點在 于,還具有關鍵字抽出委托模塊90。
關鍵字抽出委托模塊90是在信息通信終端IOO的處理性能低時(后述的 "外部關鍵字抽出服務器利用與否"為['T,需要]時),使用抽出關鍵字服務 器107從單詞信息抽出關鍵字并向關鍵字抽出模塊8轉交結果的模塊。具體而 言,根據(jù)來自關鍵字抽出模塊8的請求,使用通信模塊19向關鍵字抽出服務 器107發(fā)送單詞信息,由此委托關鍵字的抽出。關鍵字抽出服務器107—接收 關鍵字抽出服務器107抽出的關鍵字,就向關鍵字抽出模塊8轉交該關鍵字。
控制模塊18還控制關鍵字抽出委托模塊90。在關鍵字抽出委托模塊90
通過網(wǎng)絡101與其他信息通信終端100或位置服務器102、廣告信息服務器 103、相關信息服務器104、以及檢索服務器105交換信息時也使用通信模塊 19。
存儲在履歷數(shù)據(jù)文件20b中的抽出關鍵字履歷數(shù)據(jù)21是表示由語音識別 模塊6和關鍵字抽出模塊8從語音信息抽出的關鍵字的履歷的數(shù)據(jù),假設由抽 出年月日時刻、通話ID、請求通話者ID、用于識別各個通話者的多種通話者 ID、發(fā)話者ID、抽出關鍵字、以及抽出關鍵字類別("0"或"1")構成。各 項目的內(nèi)容或設定的一個例子可以參照圖43所示的抽出關鍵字履歷數(shù)據(jù)。
相關信息取得履歷數(shù)據(jù)22是表示由廣告信息取得模塊12、相關信息取得 模塊11進行的信息取得履歷的數(shù)據(jù),假設由受理年月日時刻、通話ID、請求 通話者ID、請求關鍵字、請求關鍵字類別("0"或'T,)、取得條件("0" ~ "8")、共享條件、請求數(shù)據(jù)位置、以及取得數(shù)據(jù)位置構成。各項目的內(nèi)容或 設定的一個例子可以參照圖44所示的相關信息取得履歷數(shù)據(jù)。
假設動作條件設定數(shù)據(jù)23由請求通話者ID、信息取得條件輸入與否、廣 告顯示與否、外部服務器利用與否、外部關鍵字抽出服務器利用與否、默認共 享條件設定、廣告信息服務器位置、檢索服務器位置、位置服務器位置(取得 用)、位置服務器位置(履歷用)、以及關鍵字抽出服務器位置構成。各項目的 內(nèi)容或設定的一個例子可以參照圖42所示的動作條件設定數(shù)據(jù)。
關鍵字抽出條件設定數(shù)據(jù)24是用于將在語音識別模塊6根據(jù)語音信息識 別的單詞中關鍵字抽出模塊8應作為抽出對象的單詞按詞類設定的數(shù)據(jù)。假設 關鍵字抽出條件設定數(shù)據(jù)24例如由請求通話者ID、固有名詞抽出與否、名詞 抽出與否、以及動作抽出與否構成。各項目的內(nèi)容或設定的一個例子實質上與 之前說明的圖15所示的關鍵字抽出條件設定數(shù)據(jù)相同。
此外,項目數(shù)可以與由語音識別模塊6分類的詞類數(shù)相同。還假設不僅通 過設定詞類分類,還通過設定特定的固有名詞或意思分類,來設定作為關鍵字 應抽出的單詞。例如,假設在抽出關鍵字類別為"1"時(當關鍵字為不包含 在作為會話內(nèi)容語音識別結果的單詞信息中的相關信息時),設定不作為關鍵 字抽出等控制。其他結構實質上與第一-第四實施方式的信息通信終端100 的結構相同,因此省略重復的說明。
<位置服務器102的結構和動作的說明>
位置服務器102包括位置信息提供模塊30、履歷信息登錄模塊31、控制 模塊32、通信模塊33、以及存儲模塊34。
位置信息提供模塊30根據(jù)位置服務器102通過網(wǎng)絡101從信息通信終端
ioo接收到的請求關鍵字、請求關鍵字類別("o" ~ "r)、以及請求關鍵字
取得條件決定相關的信息的數(shù)據(jù)位置,并向信息通信終端100返回。
履歷信息登錄模塊31通過網(wǎng)絡101從信息通信終端100的履歷登錄模塊
17接收請求關鍵字、請求關鍵字類別、取得條件、以及取得數(shù)據(jù)位置的值,
并將這些信息作為履歷數(shù)據(jù)36存儲到存儲媒體34中。
履歷數(shù)據(jù)36是表示由各信息通信終端100的相關信息取得模塊11進行的
信息取得履歷的數(shù)據(jù),假設由受理年月日時刻、請求關鍵字、請求關鍵字類別、
取得條件、以及取得數(shù)據(jù)位置構成。各項目的內(nèi)容或設定的一個例子可以參照
圖45所示的履歷數(shù)據(jù)。
<關鍵字抽出服務器107的結構和動作的說明>
關鍵字抽出服務器107等待來自信息通信終端IOO的關鍵字抽出委托模塊 90的抽出對象單詞信息91的發(fā)送。此外,雖然在圖39中省略了圖示,但至 少具有服務器側關鍵字抽出模塊、控制模塊、以及通信模塊。關鍵字抽出服務
器107的詳細結構將在后面進行敘述。 -處理流程的說明-
使用圖40~圖41,說明使用了第五實施方式的信息終端的相關信息取得 方式的處理流程。第五實施方式的處理流程與第一~第四實施方式的處理流程 的不同點在于圖2的(1 )所示的關鍵字顯示順序中的處理,其他流程實質上 是相同。
<關鍵字顯示順序>
圖40以及圖41所示的關鍵字顯示順序(圖2中的(1 ))表示直到由語音 識別模塊6、關鍵字抽出模塊8從通話的語音信息60抽出關鍵字并顯示在監(jiān) 視器2上為止的順序。
語音輸入模塊5取得語音圖像交換模塊1正在交換的語音信息60以及語 音附加信息61,并轉交給語音識別模塊6。這里,所謂語音附加信息61,是有關語音圖像交換模塊1正在進行的通話的信息,包含通話ID和通話者ID。
在語音識別模塊6中, 一接收語音信息60以及語音附加信息61,就根據(jù) 語音信息60確定包含在通話中的單詞和其詞類,生成至少包含單詞或詞類的 單詞信息62,并將單詞信息62以及語音附加信息61轉交給語音識別結果交 換模塊70和關鍵字抽出模塊8。
在語音識別結果交換模塊70中, 一接收單詞信息62以及語音附加信息 61,就通過控制模塊18使用通信模塊19,向通話目的地的信息通信終端100 發(fā)送單詞信息62和從啟動才莫塊4取得的請求通話者ID。此時,在發(fā)送目的地 的信息通信終端100中,記載在語音附加信息61中的所有通話者ID成為對象。
另外,語音識別結果交換模塊70銅鼓哦通訊模塊19接收從通話目的地的 信息通信終端100的語音識別結果交換模塊70發(fā)送來的單詞信息62以及請求 通話者ID,并轉交給關鍵字抽出模塊8。
關鍵字抽出模塊8當從語音識別模塊6接收單詞信息62以及語音附加信 息61,從語音識別結果交換模塊70接收通話目的地的單詞信息62以及通話 目的地的請求通話者ID時,以從啟動模塊4取得的請求通話者ID為關鍵詞信 息,通過控制模塊18從存儲媒體20讀入動作條件設定數(shù)據(jù)23的外部關鍵字 抽出服務器利用與否的值。
此外,在外部關鍵字服務器利用與否的值被設定為["0"禁止]時,抽出 關鍵字模塊8從存儲媒體20取得關鍵字抽出條件設定數(shù)據(jù)24。然后,關鍵字 抽出模塊8從單詞信息只抽出在關鍵字抽出條件設定數(shù)據(jù)24中設定為["1" 抽出]的詞類的單詞,根據(jù)抽出的關鍵字以及語音附加信息61生成抽出關鍵字 履歷數(shù)據(jù)21 ,并通過控制模塊18存儲到存儲媒體20中。
抽出關鍵字履歷數(shù)據(jù)21至少包含抽出年月日時刻、通話ID、請求通話者 ID、通話者ID、發(fā)話者ID、抽出關鍵字、以及抽出關鍵字類別。在通話ID、 通話者ID中設定語音附加信息的值。在抽出關鍵字類別中例如設定["0"包 含在單詞中的關鍵字]。
另外,在抽出的關鍵字為從語音識別模塊6取得的單詞信息62時,在發(fā) 話者ID中設定從啟動模塊4取得的請求通話者ID,在抽出的關鍵字為從語音 識別結果交換;模塊70取得的單詞信息時,在發(fā)話者ID中設定從語音識別結果 交換模塊70取得的通話目的地的請求通話者ID。在請求通話者ID中設定從 啟動模塊4取得的請求通話者ID。在抽出年月日時刻中設定在關鍵字抽出模 塊8抽出了關鍵字的年月日時刻。在抽出關鍵字中設定在關鍵字抽出模塊8 抽出的關鍵字。
然后,關鍵字抽出模塊8將存儲的抽出關鍵字履歷數(shù)據(jù)21轉交給關鍵字 受理模塊7。
此外,關鍵字抽出模塊8不僅從單詞信息62取得特定詞類的單詞來作為 關鍵字,而且還可以通過單詞信息的統(tǒng)計解析或語言解析來抽出關鍵字。此時, 可以通過參照關鍵字數(shù)據(jù)庫,由關鍵字模塊抽出與會話相關聯(lián)的(未必包含在 單詞信息中)關鍵字來作為關鍵字。在這樣的情況下,在關鍵字履歷數(shù)據(jù)的抽 出關鍵字類別中設定["1"不包含在單詞信息中的關鍵字]。
而且,考慮通過在關鍵字抽出條件設定數(shù)據(jù)24中設定作為抽出對象的"抽 出關鍵字類別",控制關鍵字抽出模塊8例如在抽出關鍵字類別為"1"時(關 鍵字為不包含在作為會話內(nèi)容的語音識別結果的單詞信息中的相關信息時)不 作為關鍵字而抽出。
另一方面,如圖40所示,在外部關鍵字服務器利用與否的值被設定為["l" 允許]時,關鍵字抽出模塊8以從啟動模塊4取得的請求通話者ID為關鍵詞信 息,通過控制模塊18從存儲媒體20讀入動作條件設定數(shù)據(jù)23的關鍵字抽出 服務器位置的值。
關鍵字抽出模塊8將取得的關鍵字抽出服務器位置的值、從語音識別模塊 6接收到的單詞信息和語音附加信息、以及從語音識別結果交換模塊70接收 到的通話目的地的單詞信息和通話目的地的通話者ID轉交給關鍵字抽出委托 模塊90。
然后,關鍵字抽出委托模塊90根據(jù)接收到的單詞信息和語音附加信息、 以及通話目的地的請求通話者ID生成抽出對象單詞信息91 (由單詞、詞類、 發(fā)話者ID對構成)。這里,在從語音識別模塊6接收到的單詞信息的情況下, 在抽出對象單詞信息91的發(fā)話者ID中設定與此對應的語音附加信息中的發(fā)話 者ID,在從語音識別結果交換模塊70接收到的通話目的地的單詞信息的情況 下,在抽出對象單詞信息91的發(fā)話者ID中設定通話目的地的請求通話者ID。
關鍵字抽出委托模塊90根據(jù)接收到的關鍵字抽出服務器位置的值,通過
控制模塊18使用通信模塊19,向107發(fā)送抽出對象單詞信息91,從關鍵字抽 出服務器107取得抽出關鍵字信息92,并向關鍵字抽出模塊8返回。在抽出 關鍵字信息92中包含關鍵字、詞類、發(fā)話者ID、抽出關鍵字類別等。
關鍵字抽出模塊8 —接收抽出關鍵字信息92,就從存儲媒體20讀入關鍵 字抽出條件設定數(shù)據(jù)24。在關鍵字抽出條件設定數(shù)據(jù)24中設定有按詞類的抽 出與否。然后,關鍵字抽出模塊8從抽出關鍵字信息92中只選擇在關鍵字抽 出條件設定數(shù)據(jù)24中設定為["1"抽出]的詞類的單詞,根據(jù)選擇的關鍵字和 語音附加信息生成抽出關4建字履歷數(shù)據(jù)21,并通過控制才莫塊18存儲到存儲々某 體20中。
關鍵字抽出模塊8將存儲的抽出關鍵字履歷數(shù)據(jù)21轉交給關鍵字受理模 塊7。之后的處理實質上與圖3所示的處理流程相同。 <服務器側關鍵字抽出順序>
如圖41所示,關鍵字抽出服務器107接收從信息通信終端100的關鍵字 抽出委托模塊90發(fā)送來的抽出對象單詞信息91。這里,抽出對象單詞信息91 至少由單詞、詞類、發(fā)話者ID對構成。關鍵字抽出服務器107從接收到的一 個以上的抽出對象單詞信息91抽出關鍵字。作為關鍵字抽出方式,假設抽出 單詞的特定詞類的方式或通過單詞的統(tǒng)計解析或語言解析來抽出的方式,但是 只要是抽出適合的關鍵字的方式,任何方式都可以。在后者的情況下,也可以 通過在關鍵字抽出服務器107中進一步保存與關鍵字有關的數(shù)據(jù)庫,來抽出與 會話相關聯(lián)的(不包含在抽出對象單詞信息91中)關鍵字。
然后,關鍵字抽出服務器107針對抽出的關鍵字生成抽出關鍵字信息92。 抽出關鍵字信息92中至少包含關鍵字、詞類、發(fā)話者ID、以及抽出關鍵字類 別。在抽出關鍵字信息92的詞類、發(fā)話者ID中設定符合的抽出對象單詞信息 91中的詞類、發(fā)話者ID的值。在抽出的關鍵字包含在抽出對象單詞信息91 時,在抽出關鍵字類別中設定"0",在抽出的關鍵字不包含在抽出對象單詞信 息91時,在抽出關鍵字類別中設定'T,。此外,在抽出關鍵字類別為"1"時, 在詞類中設定在關鍵字抽出服務器107判別的值,發(fā)話者ID為未設定。
然后,關鍵字抽出服務器107向信息通信終端100的關鍵字抽出委托模塊
90發(fā)送所生成的抽出關鍵字信息92。
一般,在通過統(tǒng)計解析或語言解析從單詞信息抽出關鍵字時,需要處理裝 置具有龐大的運算處理能力。在第五實施方式的信息通信終端100中,在信息 通信終端IOO和關鍵字抽出模塊107雙方抽出關鍵字。按照信息通信終端100 的處理性能,可以通過信息通信終端IOO在信息通信終端100的關鍵字抽出模 塊8進行處理的情況(信息通信終端100的處理性能較高時)和在關鍵字抽出 服務器107進行處理的情況(信息通信終端100的處理性能較低時)之間切換 關鍵字抽出。即,在信息通信終端100中設定為使用關鍵字抽出服務器107 時(后述的"關鍵字抽出服務器107利用與否"為["1"需要]時),信息通信 終端IOO可以利用關鍵字抽出服務器107從單詞信息抽出關鍵字。
此外,切換不限定于基于設定值的靜態(tài)切換,也可以按照信息通信終端 100的負荷狀況來動態(tài)地切換。
另外,在第五實施方式中,關鍵字抽出模塊8抽出與會話相關聯(lián)的(未必 包含在語音識別結果中)關鍵字來作為關鍵字。例如,在進行有關飲食的會話 時,提供具體的店鋪名來作為關鍵字,由此可以向會話者提供附加信息。此時, 由于關鍵字未必包含在單詞信息中,因此可以使用標志(后述的"抽出關鍵字 類別"、"請求關鍵字類別")來識別關鍵字,并進行信息提供。
-關鍵字抽出服務器的詳細-(第一實施例)
<關鍵字抽出服務器的整體結構>
如圖46所示,第五實施方式的第一實施例的關鍵字抽出服務器107包括 服務器側關鍵字抽出模塊110、控制模塊112、通信模塊113、以及存儲模塊 114。
服務器側關鍵字抽出模塊110從關鍵字抽出服務器107通過網(wǎng)絡101接收 到的信息中抽出關鍵字,并向信息通信終端IOO返回。
服務器側關鍵字抽出模塊IIO具有異義語意思判斷模塊111。異義語意思 判斷模塊lll包括異義語判斷部121,其用于讀出單詞集合,并參照詞匯信息 判斷單詞集合內(nèi)是否存在同音或同寫法異義語;以及意思決定部122,其用于 讀出鏈接信息,并參照鏈接信息,根據(jù)與單詞一起輸入的其他單詞和該單詞之
間的距離來決定被判斷為同音或同寫法異義語的單詞的意思。
異義語判斷部121包括知識網(wǎng)絡數(shù)據(jù)確認部1211,其參照詞匯信息、 以及鏈接信息;異義語存在確認部1212,其用于參照知識網(wǎng)絡數(shù)據(jù)確認部1211 的確認結果,判斷是否存在同音或同寫法異義語;以及詞匯取得部1213,在 存在同音或同寫法異義語時,參照詞匯信息,取得所有的具有與被判斷為同音 或同寫法異義語的單詞相同的寫法或讀音的詞匯。
意思決定部122包括距離判斷部1221,其用于比較詞匯取得部1213取 得的各個詞匯和單詞集合內(nèi)的同音同寫法異義語以外的詞匯,檢查詞匯間的距 離是否在規(guī)定的距離內(nèi);距離計數(shù)部1222,其按照各個詞匯,對詞匯間的距 離進行計數(shù);以及計數(shù)數(shù)最大值決定部1223,其用于將最終計數(shù)數(shù)為最大的 詞匯決定為同音或同寫法異義語的詞匯。
控制模塊112控制服務器側關鍵字抽出模塊110對通信模塊113的利用。 具體而言,假設Windows (注冊商標)、Linux (注冊商標)、Sun-OS (注冊 商標)等操作系統(tǒng)。
通信模塊113是由控制模塊112來控制,在服務器側關鍵字抽出模塊110 通過網(wǎng)絡101與信息通信終端100交換信息時使用該通信^t塊113。具體而言, 假設用于以物理的方式發(fā)送數(shù)據(jù)的裝置(調制解調器等)和其控制軟件。
存儲媒體114是由控制模塊來控制,由服務器側關鍵字抽出模塊IIO讀出 信息。存儲々某體114具有知識網(wǎng)絡數(shù)據(jù)存儲部116,其用于存儲表示將詞匯和 詞匯的讀音對應起來的詞匯信息、以及詞匯間的距離的鏈接信息。
知識網(wǎng)絡數(shù)據(jù)存儲部116包括存儲詞匯的詞匯存儲部1161、存儲詞匯 的讀音的詞匯讀音存儲部1162、存儲鏈接信息的鏈接信息存儲部1163、以及 知識網(wǎng)絡1164。
關鍵字抽出服務器107也可以進一步具有輸入輸出裝置115,其用于輸入 以語音或文本的方式輸入的單詞的集合,輸出決定了意思的單詞的ID,該輸 入輸出裝置115包括輸入部1151,其用于輸入作為語音識別或自然語言處理 結果的單詞的結婚(抽出對象單詞信息91);以及輸出部1152,其用于接收已 確定了處理結果意思的單詞集合。通過具有輸入輸出裝置115,用戶不經(jīng)由通 信模塊113也可以直接輸入抽出對象單詞信息91。因此,可以將關鍵字抽出
服務器107作為從網(wǎng)絡101獨立的單獨的"同音同寫法異義語意思判斷裝置,, 來使用。
<知識網(wǎng)絡的結構>
在圖46所示的關鍵字抽出服務器107中,利用知識網(wǎng)絡檢查同音或同寫 法異義語的多個詞匯和同時輸入的單詞間的距離,選擇與同時輸入的單詞關系 更密切的同音或同寫法異語的詞匯,由此選擇遵循上下文的正確的詞匯。
在知識網(wǎng)絡中,即^f吏是同音或同寫法,如果其意思不同就處理為不同的詞 匯,因此可以判斷同音或同寫法異義語。因此,通過知識網(wǎng)絡可以判斷某單詞 是否為同音異義語或同寫法異義語。
另外,知識網(wǎng)絡中,即使是同音或同寫法,如果其意思不同就處理為不同 的詞匯,而且根據(jù)同時輸入的單詞集合與同音或同寫法異義語的距離來判斷, 因此可以識別正確的意思。因此,可以正確地識別同音異義語或同寫法異義語 的意思。
在圖46所示的關鍵字抽出服務器107中,當然可以進行針對不同寫法的 處理,但是在同寫法異義語的情況下,即使是相同寫法,由于按照意思賦予不 同ID來對應,因此針對同寫法也可以進行處理。
在知識網(wǎng)絡中,節(jié)點例如表示詞匯,如圖48所示,通過鏈接來連接有關 聯(lián)的節(jié)點(詞匯)之間。在圖48中表示將ID設定為1、寫法為"東西線"、 寫法的讀音為"S 5 ^V、甘A/'的"東西線"作為詞匯的例子。按照各詞匯賦 予唯一ID,對于同寫法的詞匯也按照意思賦予不同ID。
如圖49所示,知識網(wǎng)絡由詞匯信息和連接信息構成。關系密切的詞匯通 過連接來連接。在圖49的例子中,詞匯"東西線"鏈接到詞匯"JR東西線,,, 詞匯"JR東西線"鏈接到詞匯"大阪"以及詞匯"JR西日本,,,進一步,詞 匯"大P反"鏈接到詞匯"關西"以及詞匯"章魚燒",進一步,詞匯"JR西日 本"鏈接到詞匯"環(huán)狀線",詞匯"環(huán)狀線,,鏈接到詞匯"京橋,,以及詞匯"難 波"。
在知識網(wǎng)絡中,利用知識網(wǎng)絡4全查同音或同寫法異義語的多個詞匯與同時 輸入的單詞之間的距離,選擇與同時輸入的單詞關系更密切的同音或同寫法異 義語的詞匯,來選擇遵循上下文的正確的詞匯。-處理流程的說明-<整體處理流程>
第一實施例的關鍵字抽出服務器107的處理流程如圖50所示。
(a) 在通信模塊113通過網(wǎng)絡101取得抽出對象單詞信息91時,在步驟 S10中,輸入輸出模塊115的輸入部1151輸入抽出對象單詞信息91,并轉交 給異義語判斷部121。
(b) 轉移至步驟Sll,在異義語判斷部121中,發(fā)行用于調查所輸入的 單詞的集合內(nèi)是否含有同音或同寫法異義語的查詢(query )。
(c) 轉移至步驟S12,在知識網(wǎng)絡數(shù)據(jù)存儲部116中,執(zhí)行用于檢查所 輸入的單詞的集合內(nèi)是否含有同音或同寫法異義語的查詢,并將結果返回給異 義語判斷部121。
(d) 轉移至步驟S13,在異義語判斷部121中,若存在同音或同寫法異 義語,則開始用于確定其意思的處理。
(e) 轉移至步驟S14,在意思決定部122中,發(fā)行用于檢查同音或同寫 法異義語的意思的候補和集合內(nèi)的其他單詞是否在規(guī)定的hop以內(nèi)的查詢。
(f) 轉移至步驟S15,在知識網(wǎng)絡數(shù)據(jù)存儲部116中,執(zhí)行用于檢查同音 或同寫法異義語的意思的候補和集合內(nèi)的其他單詞是否在規(guī)定的hop以內(nèi)的
查詢,并將結果返回給意思決定部122。
(g) 轉移至步驟S16,在意思決定部122中,對同音或同寫法異義語的 每個意思候補在規(guī)定hop內(nèi)的輸入單詞集合數(shù)進行計數(shù)。
(h) 轉移至步驟S17,在意思決定部122中,從候補中將計數(shù)最大的意 思作為同音或同寫法異義語的意思,并返回給輸入輸出裝置115。
(i) 轉移至步驟S18,在輸入輸出裝置115中,獲得決定了ID的單詞集合。
<同音同寫法異義語意思判斷方法〉
第一實施例的同音同寫法異義語意思判斷方法包括如下步驟在異義語判 斷部121中參照存儲知識網(wǎng)絡數(shù)據(jù)存儲部116內(nèi)的詞匯信息、以及鏈接信息; 在異義語判斷部121中,判斷是否存在同音或同寫法異義語;再異義語判斷部 121中,存在同音或同寫法異義語時,參照詞匯信息,取得所有的具有與被判
斷為同音或同寫法異義語的單詞相同的寫法或讀音的詞匯;在意思決定部122 中,比較取得了 ID的各個詞匯和單詞集合內(nèi)的同音或同寫法異義語以外的詞 匯,檢查詞匯間的距離是否在規(guī)定距離內(nèi);在意思決定部122中,按照各個詞 匯詞,對詞匯間的距離進行計數(shù);以及在意思決定部122中,將最終計數(shù)凄t最 大的詞匯決定為同音或同寫法異義語的詞匯。
或者,在異義語判斷部121內(nèi)的知識網(wǎng)絡數(shù)據(jù)確認部1211中執(zhí)行參照詞 匯信息以及鏈接信息的步驟,在異義語判斷部121內(nèi)的異義語存在確認部1212 中執(zhí)行判斷是否存在同音或同寫法異義語的步驟,在異義語判斷部121內(nèi)的詞 匯取得部1213中執(zhí)行取得所有詞匯的步驟。
或者,在意思決定部122內(nèi)的距離判斷部1221中執(zhí)行檢查詞匯間的距離 是否在規(guī)定距離內(nèi)的步驟,在意思決定部122內(nèi)的距離計數(shù)部1222中執(zhí)行對 詞匯間的距離進行計數(shù)的步驟。
或者,在意思決定部122內(nèi)的計數(shù)數(shù)最大值決定部1223中執(zhí)行將計數(shù)數(shù) 最大的詞匯決定為同音或同寫法異義語的詞匯。
<同音同寫法異義語意思判斷算法〉
同音同寫法異義以意思判斷算法如圖51的流程圖。 作為前提l,預先準備知識網(wǎng)絡。
作為前提2,同寫法異義語用別的"關鍵字"來識別。具體而言,分別ID 而進行判斷。
(a) 首先,在步驟SIOI,對輸入輸出裝置115輸入包含同音或同寫法異 義語的那個關鍵字。
(b) 轉移至步驟S102。在異義語判斷部121中,判斷N各關鍵字內(nèi)是否 存在同音或同寫法異義語。
(c) 在步驟S102中,如果是"否",則結束處理。
(d) 在步驟S102中,如果是"是",則轉移至步驟S103,判斷同音或同 寫法異義語和其以外的單詞是否在^op內(nèi)。
(e) 在步驟S103中,如果是"否",則回到步驟S102。
(f) 在步驟S103中,如果是"是",則對同音或同寫法異義語的各ID(意 思)賦予得分,選擇合計數(shù)最多的同音或同寫法異義語的ID來作為對應會話 內(nèi)容的意思。在S103中,將hop數(shù)設定為2hop,但不限定于該值,可以按照 詞匯網(wǎng)絡來變更hop數(shù)。
以往,在語音輸入或文本輸入中,難以正確地識別同音異義語或同寫法異 義語的意思,無法判斷某單詞是否為同音異義語或同寫法異義語,或難以正確 地識別同音異義語或同寫法異義語的意思。
對此,提出了利用詞匯的共現(xiàn)(co-occurrence)的方法,但是在利用詞匯
的共現(xiàn)時,同寫法異義語被視為相同,對于每一寫法只能定義一個意思,無法 對一個單詞賦予多個意思。
另外,作為詞匯網(wǎng)絡,已知如下轉換裝置保存讀音的詞匯和寫法的詞匯 以及寫法間的意思上的距離,在文章中出現(xiàn)了同音異義語時,觀察文章中的單 詞間的距離,在轉換候補的上位提示距離更近的意思。但是,在該轉換裝置中, 對于同音,在該同音為同寫法且意思不同時,無法識別正確的意思。
對此,根據(jù)第一實施例的關鍵字抽出服務器107,在語音輸入或文本輸入 中,可以判斷某單詞是否為同音異義語或同寫法異義語,可以正確地識別同音 異義語或同寫法異義語的意思。 (第一實施例的變更例)
如圖47所示,第一實施例的變更例的關鍵字抽出服務器107包括知識 網(wǎng)絡數(shù)據(jù)存儲部116,其用于存儲將詞匯以及詞匯的讀音對應起來的詞匯信息、 以及表示詞匯間的距離的鏈接信息;異義語判斷部121,其用于讀出單詞集合, 并參照詞匯信息判斷在單詞集合內(nèi)是否存在同音或同寫法異義語;意思決定部 122,其用于讀出鏈接信息,并參照鏈接信息,根據(jù)與單詞一起輸入的其他單 詞和該單詞之間的距離來決定被判斷為同音或同寫法異義語的單詞的意思;以
及文本解析部124,其用于從文本抽出單詞,并生成文本單詞集合。
或者,也可以具有語音解析部123,其用于從語音抽出單詞,并生成語音 單詞集合。
或者,如圖47所示,語音解析部123具有語音單詞抽出部1231,其用于 從語音抽出單詞;以及語音單詞集合生成部1232,其用于生成語音單詞集合。
或者,具有語音單詞集合生成部1241,其用于從文本抽出單詞;以及文 本單詞集合生成部1242,其用于生成文本單詞集合。此外,在將第一實施例
的變更例的關鍵字抽出服務器107插入到其他裝置時,只接收單詞集合即可,
語音解析部123以及文本接寫部124不是構成的必要條件。
根據(jù)第一實施例的變更例的關鍵字抽出服務器107 (同音同寫法異義語意 思判斷裝置),在語音輸入或文本輸入中,可以判斷某單詞是否為同音異義語 或同寫法異義語,而且可以正確地識別同音異義語或同寫法異義語的意思。 <知識網(wǎng)絡>
說明在第一實施例的變更例的關鍵字抽出服務器107中知識網(wǎng)絡數(shù)據(jù)存 儲部116內(nèi)的知識網(wǎng)絡的具體例。各節(jié)點(詞匯)的ID號碼、寫法以及讀音 如圖52所示。
如圖53所示,通過知識網(wǎng)絡,用ID1表示的詞匯"東西線"鏈接到詞匯 "東京地鐵東西線,,,詞匯"東京地鐵東西線,,鏈接到詞匯"高田馬廠"、以及 "大街,,,詞匯"大街,,鏈接到詞匯"NTT"、"東京站"、以及"KDDI",詞匯 "NTT,,鏈接到詞匯"NTTDocomo",詞匯"KDDI"鏈接到詞匯"NTTDocomo"、 以及"移動電話",詞匯"移動電話"進一步鏈接到詞匯"NTTDocomo"、以 及"網(wǎng)絡",詞匯"網(wǎng)絡"鏈接到詞匯"系統(tǒng)",詞匯"系統(tǒng)"進一步鏈接到詞 匯"硬件"、以及"軟件"。
同樣,用ID2表示的詞匯"東西線"鏈接到詞匯"JR東西線",詞匯"JR 東西線,,鏈接到詞匯"JR西日本"、以及"關西",詞匯"關西,,鏈接到詞匯 "JR西日本"、"日本"、"章魚燒"、以及"什錦煎餅",詞匯"日本"鏈接到 詞匯"東京站",詞匯"章魚燒"、以及詞匯"什錦煎餅,,鏈接到詞匯"食物和 飲料",詞匯"食物和飲料,,鏈接到詞匯"壽司",詞匯"壽司,,鏈接到詞匯"藏 壽司"、以及"旋轉壽司,,,詞匯"藏壽司"、以及"旋轉壽司,,之間也可以鏈 接。
<輸入文本數(shù)據(jù)>
圖54表示在第一實施例的變更例的關鍵字抽出服務器107中,使用圖53 所示的知識網(wǎng)絡的具體例從文本解析部124的輸入文本數(shù)據(jù)例以及輸入文本 數(shù)據(jù)例中抽出了單詞集合的輸入單詞集合例。輸入文本數(shù)據(jù)例被輸入至文本解 析部124內(nèi)的語音單詞集合生成部1241,抽出單詞集合,并在文本單詞集合 生成部1242中生成輸入單詞集合例。輸入單詞集合例被轉交給輸入輸出裝置
115。
如圖54所示,輸入文本數(shù)據(jù)例由人A、 B的會話內(nèi)容構成。"A:今天出 差,去大手町。因為時間充足,想坐東西線走。B:因為有座,可以坐東西線 走。今天為什么去大手町? A:研究使用移動電話的訂購系統(tǒng),并簽協(xié)議。B: 好像最近在壽司店也^f吏用這種系統(tǒng)。A:對,就是那個。不是有叫藏壽司店的 嗎?就是這方面的提案。"。從上述文章抽出單詞集合,可以得到由"大手町.東 西線.大手町.移動電話.系統(tǒng).壽司.系統(tǒng).藏壽司"構成的輸入單詞集合 例。
<同音同寫法異義語意思判斷方法以及判斷結果> (例1)
(a) 同音同寫法異義語判斷
首先,在知識網(wǎng)絡凝:據(jù)存儲部116內(nèi)存在圖52的詞匯以及圖53的知識網(wǎng) 絡的狀況下,在異義語判斷部121中,使用知識網(wǎng)絡判斷在輸入的單詞集合內(nèi) 是否存在同音同寫法異義語。由于存在寫法"東西線".讀音"S 5 SV、甘A/, 這兩個單詞,因此判斷為"東西線,,為同音同寫法異義語。
(b) 意思判斷
"東西線"具有兩種意思,ID1表示東京地鐵東西線,ID2表示JR東西 線。為了判斷圖54所示的輸入文本數(shù)據(jù)例中的"東西線"為哪一種意思,在 意思決定部122中進行如下處理。
檢查ID1和ID2的各"東西線"與單詞集合內(nèi)的其他單詞"大街,,."東西 線"."大街"."移動電話"."系統(tǒng)"."壽司,,."系統(tǒng)"."藏壽司"是否分別在 2hop以內(nèi)。
選擇2hop內(nèi)的到達合計數(shù)最多的ID來作為輸入單詞集合中的同音同寫法 異義語的意思。
圖55中表示在第一實施例的變更例的關鍵字抽出服務器107中,使用 圖53所示的知識網(wǎng)絡的具體例,使用圖54所示的輸入文本數(shù)據(jù)例以及從輸入 文本數(shù)據(jù)例抽出了單詞集合的輸入單詞集合例,判斷同音同寫法異義語的結 果。
在圖55中,記載有ID、寫法、各ID的屬性、集合內(nèi)的出現(xiàn)單詞。在各
ID的東西線和出現(xiàn)單詞相交的位置記載有表示是否在2hop以內(nèi)到達的標志 (flag),在'T,的情況下意味著距離2hop以內(nèi),在"0"的情況下意味著距 離3hop以上。
在圖55的最右列中,2hop以內(nèi)的到達合計數(shù)表示幾個單詞在2hop以內(nèi)。 選擇在2hop內(nèi)的到達合計數(shù)最多的ID來作為輸入單詞集合中的同音同寫法異 義語的意思。
最后,將所決定的ID輸出至輸入輸出裝置115并結束處理。
此外,成為輸入源的資源不限定于如圖54所示的輸入文本數(shù)據(jù)例的上下 文,也可以是一般的會話、部分單詞集合、語音等。
另外,在意思決定部122中,在檢查各詞匯間的關系時,并不一定是2hop, 可以按照知識網(wǎng)絡的結構適宜選擇。 (例2 )
<知識網(wǎng)絡>
使用圖58說明在第一實施例的變更例的關鍵字抽出服務器107中知識網(wǎng) 絡數(shù)據(jù)存儲部116內(nèi)的知識網(wǎng)絡的其他具體例。知識網(wǎng)絡如圖58所示。各詞 匯的ID號碼、寫法以及讀音語圖52相同,因此在這里省略說明。
在圖58的知識網(wǎng)絡中,詞匯"東西線(l)"鏈接到詞匯"JR西日本"以 及"關西,,,詞匯"JR西日本"鏈接到詞匯"JR京都線,,,詞匯"關西,,鏈接 到詞匯"關西人"。詞匯"東西線(2),,鏈接到詞匯"地鐵東西線",詞匯"地 鐵東西線"進一步鏈接到詞匯"京都市營地鐵東西線"、"禮幌市營地鐵東西線" 以及"地鐵東西線"。詞匯"東西線(3)"鏈接到詞匯"東京地鐵東西線",詞 匯"東京地鐵東西線,,進一步鏈接到"總武線"、"早稻田"、"千葉縣"、以及 "高田馬廠"。同樣,詞匯"東西線(7)"鏈接到詞匯"鐵路"、以及"東西線"。
<輸入文本數(shù)據(jù)>
使用圖58所示的知識網(wǎng)絡的具體例,在圖56中表示輸入輸出裝置115的 輸入文本數(shù)據(jù)例以及從輸入文本數(shù)據(jù)例抽出了單詞集合的輸入單詞集合例。
作為對象的文章是關于7月23日的關東地方的地震的記載,是"17: 30 左右,在早稻田站《東西線的恢復未定。JR也不通。西武線正?!?,和朋友一 起徒步移動至高田馬場。在警察局得到《在千葉縣西北部以外的地方,好像發(fā)
生了第二次5級地震》的信息。但是其真?zhèn)尾幻?。
從上述文章抽出單詞集合,可以得到輸入單詞集合"早稻田 東西線 西 武線.高田馬場.千葉縣"。
(同音同寫法異義語意思判斷方法以及判斷結果)
(a) 首先,在步驟1中,判斷各單詞是否存在同音或同寫法異義語。結
果"東西線"被判斷為同音同寫法異義語。
(b) 在步驟2中,檢查同音或同寫法異義語和其以外的單詞是否在2hop以內(nèi)。
(c) 在步驟3中,選擇合計數(shù)最多的同音同寫法異義語的ID。 在圖57中表示在第一實施例的變更例的關鍵字抽出服務107中,使用
圖58所示的知識網(wǎng)絡的具體例,使用圖56所示的輸入文本數(shù)據(jù)例以及從輸入 文本數(shù)據(jù)例抽出了單詞集合的輸入單詞集合例,判斷同音同寫法異義語的結 果。
在圖57中的數(shù)值在2hop以內(nèi)時賦予標志"1",不在2hop以內(nèi)時賦予標 志"0"。在圖57的最右列中,在2h叩內(nèi)的到達合計數(shù)表示幾個單詞在2hop 以內(nèi)。選擇在2hop內(nèi)的到達合計數(shù)最多的ID來作為輸入單詞集合中的同音同 寫法異義語的意思。
結果,選擇意味著"東京地鐵東西線,,的ID3。從會話的上下文也可以判 斷為關于東京都內(nèi)的地鐵東西線的會話,判斷結果正確。
這樣,根據(jù)第一實施例的關鍵字抽出服務器107 (同音同寫法異義語意思 判斷裝置),從語音信息或文字信息可以判斷同音異義語或同寫法異義語,可 以正確地識別同音異義語或同寫法異義語的意思。 (第二實施例)
<關鍵字抽出服務器的整體結構>
如圖59所示,第五實施方式的第二實施例的關鍵字抽出服務器107包括 文本數(shù)據(jù)取得部751,其用于取得文本數(shù)據(jù);單詞抽出部752,其用于讀出以 網(wǎng)絡形式記述了多個單詞以及其多個單詞間的路徑的詞典,從文本數(shù)據(jù)抽出記 述在詞典中的多個單詞;評價部754,其用于根據(jù)抽出的單詞,使用詞典評價 記述在詞典中的多個單詞;以及話題抽出部755,其用于從記述在詞典中的多
個單詞中抽出評^介相對高的單詞。文本數(shù)據(jù)取得部751、單詞抽出部752、評 價部754、以及話題抽出部755包含在話題抽出處理才莫塊117中。
在關鍵字抽出服務器107上通過控制模塊112連接有輸入輸出模塊115、 主存儲裝置118、以及程序存儲裝置119。知識網(wǎng)絡數(shù)據(jù)存儲部116包含在存 儲媒體114中。
首先,對存^^某體114的知識網(wǎng)絡數(shù)據(jù)存儲部116所存儲的"詞典"進行 說明。"詞典"包括記述了多個單詞的單詞詞典(節(jié)點)和定義.記述了單詞 詞典的多個單詞間路徑(鏈接)的單詞相關度詞典。在單詞詞典中,如圖60 所示,分別用1、 2、 3、 4、 5這樣的可以唯一識別的ID來表示"單詞A"、"單 詞B"、"單詞C"、"單詞D"、以及"單詞E"。在單詞相關度詞典中,如圖61 所示,(1, 3)表示在"單詞A,,和"單詞C"之間存在相關性(意思上的關 系),(2, 5 )表示在"單詞B"和"單詞E"之間存在相關性(意思上的關系)。
作為單詞詞典以及單詞相關度詞典的制作方法, 一般使用多個國語詞典等
由單詞的定義和其解說構成的文獻。例如,可以舉出如下順序將詞典的標題 語"A"以及在標題語"A,,的解說中出現(xiàn)的單詞"B"作為單詞詞典的節(jié)點, 認為在"A,,和"B"之間存在相關性(意思上的關系)并制作路徑(鏈接)。 如此制作的單詞詞典以及單詞相關度詞典可以說是定義了同時利用某單詞和 別的單詞的共現(xiàn)關系。
在第二實施例中,用記述在如圖61所示的單詞相關度詞典的路徑來連接 記述在如圖60所示的單詞詞典中的多個單詞間的單詞網(wǎng)絡結構稱為"知識網(wǎng) 絡"。在圖2表示第二實施例的知識網(wǎng)絡的一例。在知識網(wǎng)絡中,用節(jié)點來表 示單詞,用鏈接來表示單詞間的相關性(意思上的關系)。在圖62中,用四角 表示的圖形表示節(jié)點,用線表示的圖形表示鏈接。對于各節(jié)點賦予可以唯一識 別的ID。用無向標志來表示鏈接。
此外,為了簡^更說明,使用由少數(shù)節(jié)點和鏈接構成的知識網(wǎng)絡,但是實際 上單詞數(shù)(節(jié)點數(shù))達到數(shù)十萬~數(shù)百萬左右,鏈接數(shù)達到數(shù)百萬~數(shù)千萬左 右。在啟動話題抽出程序時讀出單詞詞典以及單詞相關度詞典。
圖63是以文件形式存儲圖62所示的知識網(wǎng)絡時的表現(xiàn)例,表示記述了知 識網(wǎng)絡的單詞群(節(jié)點)的單詞詞典的例子。單詞詞典具有ID和關鍵字的欄。
圖64表示記述了圖62所示的知識網(wǎng)絡的鏈接的單詞相關度詞典的一例。列舉 了構成鏈接的單詞的ID間相關性的(起點,終點)=(1, 2)表示在(鈴鹿, Fl)的單詞間形成了鏈接。
通過如下梯:作來制作分別在圖63以及圖64表示的單詞詞典以及單詞相關 度詞典例如,解析"A壽司具有代表性的旋轉壽司連鎖店。有以'金^r魚, 為特惠商品的壽司店。本店位置在……"這樣的文章,認為"A壽司,,分別與 "旋轉壽司"以及"壽司,,有關聯(lián)(意思上的關系),從"A壽司,,分別向"旋 轉壽司,,以及"壽司"擴展鏈接。這里,不考慮定義.參照,將鏈接表現(xiàn)為無 向標志。
圖59所示的輸入部1151例如具有鍵盤、或按照需要具有圖像輸入部以及 語音輸入部。鍵盤對文本數(shù)據(jù)取得部751輸入文本數(shù)據(jù)。鍵盤還可以進行對關 鍵字抽出服務器107的操作或對網(wǎng)頁的輸入、電子郵件創(chuàng)建時的輸入。
圖^象輸入部是將印刷在紙上的圖像交換為關鍵字抽出服務器107上靜止 的圖像的裝置或將影像交換為關鍵字抽出服務器107上的動畫的裝置。作為圖 像輸入部,可以使用掃描儀、照相機、或攝像機等。圖像輸入部的輸出成為文 字識別部173的輸入。
作為語音輸入部,可以使用麥克風或遠程的PC的語音輸入等。語音輸入 部的輸出成為語音識別部174的輸入。例如,如圖7所示的會話的語音被輸入 至語音輸入部。
圖59所示的關鍵字抽出服務器107具有網(wǎng)頁(Web)瀏覽器部171、郵件 客戶端部172、文字識別部173、語音識別部174以及話題抽出模塊175。
網(wǎng)頁瀏覽器部171以HTTP為首,對FTP、 Gopher等各種因特網(wǎng)上的協(xié) 議提供用戶接口。網(wǎng)頁瀏覽器部171還提供解釋作為網(wǎng)頁服務器處理結果的 HTML并進行畫面的構思圖(rendering)的功能。通過利用者的復制和粘貼等 明示的才喿作,將作為構思圖結果的、顯示在瀏覽器上的HTML的顯示信息輸 入至文本數(shù)據(jù)取得部751。另外,網(wǎng)頁瀏覽器171也可以不通過利用者的明示 的操作而自動地向文本數(shù)據(jù)取得不751輸入顯示在瀏覽器上的文本數(shù)據(jù)。
置。與一般的郵件客戶端相比,郵件客戶端部172取得包含在收發(fā)的郵件中的
文本數(shù)據(jù),并轉交給文本數(shù)據(jù)取得部751。
文字識別部173是識別由圖像輸入部輸入的文字的OCR等裝置。文字識 別部173例如由從掃描儀讀入的圖像取得文本數(shù)據(jù),或從電視影像等字幕或反 射式放映機(telop)等取得文本數(shù)據(jù),并轉交給文本數(shù)據(jù)取得部751。
語音識別部174識別由語音輸入部輸入的語音(通話),確定包含在語音 中的文本數(shù)據(jù)。例如,識別輸入至語音輸入部的語音,并如圖66所示地確定 文本數(shù)據(jù)。相對于圖65所示的實際通話,圖66所示的、由語音識別部174 識別的文本數(shù)據(jù)包含"^吳識別。 一般,在當前的語音識別程序中,由于音響環(huán)境 或對會話的語言模型(model)的不足,假設誤識別較多。語音識別部174向 文本數(shù)據(jù)取得部751轉交作為語音識別結果的單詞信息(單詞、詞類)。
此外,語音識別部174并不限定于其所有功能都存儲在語音影像通信終端 上,也可以功能的一部分存儲在計算能力更高的其他終端上。
圖59所示的話題抽出模塊175具有文本數(shù)據(jù)取得部751、單詞抽出部752、 路徑抽出模塊753、評價部754以及話題抽出部755。作為文本數(shù)據(jù)取得部751 的安裝方式,可以^i殳以服務器型經(jīng)由特定的端口來等待文本數(shù)據(jù)的方式、通 過剪貼板(clipboard)來接收文本數(shù)據(jù)的方式、通過調用應用程序接口 (API) 來接收文本數(shù)據(jù)的方式、以及通過文件來接收的方式。
文本數(shù)據(jù)取得部751從網(wǎng)頁瀏覽器部71、郵件客戶端部172、文字識別部 173以及語音識別部174等取得文本數(shù)據(jù)。文本數(shù)據(jù)取得部751向單詞抽出部 752轉交所取得的文本數(shù)據(jù)。
圖59所示的單詞抽出部752從文本數(shù)據(jù)取得部751接收文本數(shù)據(jù)。單詞 抽出部752從知識網(wǎng)絡數(shù)據(jù)存儲部116讀出單詞詞典,并在主存儲裝置118上 進行展開。單詞抽出部752使用單詞詞典,用詞素解析等方法來解析文本數(shù)據(jù), 并從文本數(shù)據(jù)抽出包含在單詞詞典中的單詞。所謂"詞素解析",是指針對單 詞詞典檢索文本數(shù)據(jù),并取得詞類信息(詞類)、開頭可否信息(需要開頭)、 前方連接信息(前方連接)、后方連接信息(后方連接)等信息的處理。在圖 67表示從圖66所示的文本數(shù)據(jù)抽出的多個單詞(單詞列)。單詞抽出部752 向存儲媒體114的單詞列存儲部163轉交抽出的單詞列。
在單詞列存儲部163中,以先進先出(FIFO: First In First Out)型列表結
構積累一定個數(shù)的從單詞抽出部752輸出的單詞列。例如,將圖67所示的單 詞列直接保存為列表(窗口 )。除了 FIFO,也可以不根據(jù)單詞的個數(shù)而輸入單 詞后保存一定期間。通過設定值可以變更列表的尺寸(以下,稱為"窗口尺寸")。 如果使存儲在單詞列存儲部163中的窗口尺寸變長,則就會評價更長的文 章(文本數(shù)據(jù)),如果使窗口尺寸變短,則最近輸入的一定范圍內(nèi)的單詞列成 為評價對象,因此可以進行追隨話題的形式的評價。例如,相對于輸入的單詞 列數(shù)=9,使窗口尺寸足夠大,使窗口尺寸=30 (意思為窗口尺寸=w )。實際 上,按照評價對象的文本數(shù)據(jù)的長度等,設定適當?shù)拇翱诔叽?,由此可以縮短 評價對象的單詞列的范圍。
圖59所示的路徑抽出部753從存儲在單詞列存儲部163中的窗口內(nèi)的多 個單詞中,以任意的順序、例如窗口的升序或降序選擇兩個(窗口內(nèi)的第j(= 正整數(shù))個單詞、第k (=正整數(shù))個單詞)單詞。其中,不選擇同一單詞的 組合,并且不選擇一旦評價的組合。例如,針對在圖67所示的窗口內(nèi)的單詞 列,如果列舉任意的第j (=正整數(shù))個單詞、第k (=正整數(shù))個單詞的組 合,則可以舉出"大手町"-"大手町"、"大手町"-"鈴鹿"、"大手町"-
"東西線"、"大手町"-"什錦煎餅,,........"鈴鹿,,-"大手町,,........
"B壽司"-"B壽司"。其中,"大手町"-"大手町"、"鈴鹿,,-"鈴鹿"、 "B壽司"-"B壽司"的計算為對象外。另外,在一旦選擇了 "大手町,,-"鈴鹿"時,相當于其規(guī)路的"鈴鹿"-"大手町"的計算成為對象外。若用 函數(shù)表示,則僅在以下函數(shù)(fl)的情況下作為計算對象。 j!=k&&j>k……(fl)
即使計算了同一單詞或規(guī)路,也不會對本發(fā)明的實施方式的話題抽出方法 帶來根本的影響,通過省略同一單詞間或規(guī)路的計算,可以削減計算量。
而且,路徑抽出部753從知識網(wǎng)絡數(shù)據(jù)存儲部116讀出單詞詞典以及單詞 相關度詞典,并在主存儲裝置118上進行展開。路徑抽出部753將選擇的兩個 單詞中的一個作為起點節(jié)點、另一個作為終點節(jié)點,計算在知識網(wǎng)絡上連接起 點節(jié)點和終點節(jié)點間的路徑的距離(路徑長度),根據(jù)路徑長度抽出最短路徑。 作為路徑長度的計算基準,有時考慮鏈路的權重,這里簡單地設所有的鏈路的 權重都是l。即,最短路徑長度=跳數(shù)。作為最短路徑的抽出方法,可以利用
從起點開始全部4企索、或dijkstra法、Warshall-Floyd法等已知的方法。
路徑檢索結果,當在一個起點節(jié)點和終點節(jié)點間存在多個最短路徑時,反 饋其所有最短路徑。具體而言,假設如下函數(shù)(G)。
LisKint口 > getAUShortestPath(Network network,int f,int t) ...... ( f2 )
這里,f:起點節(jié)點的ID、 t:終點節(jié)點的ID、 int口保存表示最短路徑 的節(jié)點的ID的排列、List〈nt口〉考慮到在起點節(jié)點和終點節(jié)點間存在多個 最短路徑的情況的最短路徑的排列。
例如,在圖63所示的知識網(wǎng)絡中,在指定起點節(jié)點的ID為f=18 (Docomo)、終點節(jié)點的ID為t-21 (網(wǎng)絡)時,反饋((18, 19, 21), (18, 20, 21))。這表示在"Docomo"-"網(wǎng)絡,,間存在路徑1 = (Docomo, NTT, 網(wǎng)絡)、路徑2= (Docomo,移動電話,網(wǎng)絡)這兩個最短路徑。"Docomo" -"網(wǎng)絡"間的最短路徑長度為2。此外,將計算過的起點節(jié)點以及終點節(jié)點 間的最短路徑信息進行高速緩存,在下次計算時再利用,由此可以進行高速化。
圖59所示的評價部754讀出通過存儲在設定信息存儲部161中的設定信 息而定義的閾值(路徑判斷用閾值)A,判斷由路徑抽出部753計算的最短路 徑是否在路徑判斷用閾值A以上。在最短路徑長度比路徑判斷用閾值A長時, 認為無關聯(lián)的單詞而作為話題計算的對象外,僅在最短路徑長度為路徑判斷用 閾值A以下時認為有關聯(lián)的單詞,插入到評價對象中。這是因為,在單詞間 的距離在知識網(wǎng)絡上離一定距離以上時,是相互無關聯(lián)的單詞,只抽出話題密 集的部分。另外,使比路徑判斷用閾值A長的情況下的最短路徑為計算對象 外,由此可以削減計算量。另外,評價部754可以采用不進行一定路徑長度以 上的檢索的安裝來代替將最短路徑長度與路徑判斷用閾值A進行比較。
而且,評價部754計算位于最短路徑的端部的起點節(jié)點以及終點節(jié)點的評 價值。按照距離分配評{介值的方法有各種方法,例如,也可以不特別賦予權重, 作為相同的權重而計算評價值。此時,用式(1)表示起點節(jié)點的評價值*、 終點節(jié)點的評價值tp。
*=tp =1 ...…(1 )
或者,也可以按照起點節(jié)點以及終點節(jié)點的各個鏈路數(shù)來計算評價值。此 時,設起點節(jié)點的鏈路數(shù)為lj、終點節(jié)點的鏈路數(shù)為lk,則用式(2)、 (3)分
別表示起點節(jié)點的評價值*、終點節(jié)點的評價值tp。
M……(2) tp=lk……(3)
或者,也可以按照起點節(jié)點和終點節(jié)點間的最短路徑長度來計算評價值。 例如,起點節(jié)點以及終點節(jié)點間的最短路徑長度越短,計算出的評價值越高。 此時,在起點節(jié)點以及終點節(jié)點間的最短路徑長度分別為1、 2、 3、 4時,以 及比4大時,分別用式(4) ~ (8)表示起點節(jié)點的評價值fj)、終點節(jié)點的評 價值tp。
fj =tp=l……(4)
$=tp=0.5……(5)
$=tp=0.25……(6)
Q)=tp=0.125……(7)
fj)=tp=0……(8)
或者,也可以按照起點節(jié)點以及終點節(jié)點間的路徑長度以指數(shù)的形式計算 評價值。此時,設起點節(jié)點以及終點節(jié)點間的距離為D,權重參數(shù)為P,則用 式(9)表示起點節(jié)點的評價值*、終點節(jié)點的評價值tp。
$=tp=l/Dp ... (9)
而且,評價部754按照需要使用起點節(jié)點的評價值Q)、終點節(jié)點的評價值 tp,對最短路徑上存在的所有單詞(節(jié)點)分別賦予點數(shù)(點)。例如,在 "Docomo"-"網(wǎng)絡"之間的最短路徑上存在的單詞(節(jié)點)在路徑1的情 況下為"Docomo"、 "NTT,,以及"網(wǎng)絡",在路徑2的情況下為"Docomo"、 "移動電話"以及"網(wǎng)絡"。作為點數(shù)計算處理,例如對最短路徑上存在的所 有單詞(節(jié)點)同樣賦予點數(shù)。此時,分別對所有單詞(節(jié)點)賦予的點數(shù)(point) 如式(10)所示。
Point =1……(10)
或者,也可以按照從起點節(jié)點以及終點節(jié)點到評價對象節(jié)點的距離來賦予 點數(shù)。設起點節(jié)點和終點節(jié)點間的最短路徑長度(最短跳數(shù))為hop、從起點
節(jié)點到評價對象單詞(節(jié)點)的距離為L,則用起點節(jié)點的評價值QD、終點節(jié)
點的評價值tp表示的、對單詞(節(jié)點)賦予的點數(shù)point如式(11)所示。
point=(^*(hop - L)/hop+tp*(L/hop))……(11)
此外,在式(11)中,越是離起點節(jié)點以及終點節(jié)點的距離長的單詞(節(jié) 點),賦予越低的點數(shù),相反,也可以為越是離起點節(jié)點以及終點節(jié)點的距離 長的單詞(節(jié)點),賦予越高的點數(shù)。此時,越是位于起點節(jié)點和終點節(jié)點的 中間的單詞(節(jié)點),賦予越高的點數(shù)。
另外,在起點節(jié)點和終點節(jié)點間存在多個最短路徑的情況下,設最短路徑 數(shù)為R時,也可以如式(12)所示地按照最短路徑數(shù)來分割并賦予點數(shù)。
point=(Q)*(hop - L)/hop+tp*(L/hop)) /R……(12 )
在第二實施例中,對于單詞列中位于任意的起點節(jié)點和終點節(jié)點之間的最 短路徑上的各個單詞(節(jié)點),利用式(12)來賦予點數(shù)。這里,設權重參數(shù) P = 3,用式(13)來計算起點節(jié)點的評價值fj)、終點節(jié)點的評價值tp。
&=tp=l/D3……(13)
而且,評價部754按照各單詞(節(jié)點),累計在各最短路徑中賦予的點數(shù)。 圖68表示評價結果。在圖68中,縱軸(1 )表示在最短路徑上存在的節(jié)點, 橫軸表示起點節(jié)點以及終點節(jié)點。橫軸在"大手町,,-"大手町"、"大手町"
- "鈴鹿"、"大手町"-"東西線"、"大手町"-"什錦煎餅"........"鈴
鹿,,-"大手町"........"B壽司,,-"B壽司"這樣的任意兩個單詞的組
合中,分別除去同一單詞的組合、去路歸路中的歸路的組合以及最短路徑長度 為5以上的組合。
圖68的縱軸(2)表示"大手町,,-"東西線"間的最短路徑。由于"大 手町,,-"東西線,,相鄰,因此對于"大手町,,以及"東西線"分別賦予點數(shù) 1.00。同樣,圖68的縱軸(3)表示"大手町,,-"移動電話,,間的最短路徑。 "大手町,,-"移動電話"間的最短路徑長度為3,對在最短路徑上存在的"大 手町"、"NTT"、"網(wǎng)絡"、"移動電話"賦予點數(shù)0.4。
從圖68可知,由于縱軸(2)的"大手町"-"東西線,,間在知識網(wǎng)絡上 相鄰,因此賦予較高的點數(shù),由于縱軸(3)的"大手町"-"移動電話"間 的最短路徑長度為3,因此賦予較低的點數(shù)。即,越是更密集的單詞(距離短 的單詞多),賦予越高的點數(shù),因此對確定知識網(wǎng)絡上單詞集中的區(qū)域有用。 縱軸(4)表示按照各節(jié)點的各最短路徑中賦予的點數(shù)的合計。
圖59所示的話題抽出部755從記述在詞典中的單詞中抽出在文本數(shù)據(jù)中 重要、且評價高的單詞,即抽出成為與文本數(shù)據(jù)的相關度高的話題的單詞(以 下稱為"話題語")。作為話題語的抽出方法,有各種方法,例如可以舉出如下 方法讀出用存儲在設定信息存儲部161中的設定信息來定義的個數(shù)B,并抽 出對單詞(節(jié)點)賦予的合計點數(shù)中上位的B個單詞(B為正整數(shù))。
圖69表示根據(jù)圖68所示的評價結果,抽出了對單詞(節(jié)點)賦予的合計 點數(shù)^上位B-5個單詞的結果。在圖69中,最左邊的列表示新輸入至單詞 列存儲部163的單詞(輸入后),剩下的列表示輸入了其單詞時抽出的話題語。 例如,當輸入語為"網(wǎng)絡"的行時,抽出"大手町"、"網(wǎng)絡"、"移動電話"、
"東西線"、以及"NTT"。此外,表示了每當輸入新單詞時的話題語,但是在 將文本數(shù)據(jù)統(tǒng)一評價時,抽出直至輸入最末尾的"B壽司"時的"大手町"、
"網(wǎng)絡"、"旋轉壽司"、"A壽司"、以及"移動電話"。
或者,話題抽出部755也可以讀出用存儲在設定信息存儲部161中的設定 信息來定義的閾值(話題抽出用閾值)C,并抽出點數(shù)為話題抽出用閾值C以 上的單詞。
圖70表示根據(jù)圖68所示的評價結果,抽出了賦予的合計點數(shù)為話題抽出 用閾值C-1.00以上的單詞的例子。例如,在輸入語為"網(wǎng)絡"的行時,抽出 "大手町"、"網(wǎng)絡"、"移動電話"、以及"東西線"。
圖71表示圖69以及圖70所示的計算結果的概要示意圖。在圖71中,對 于節(jié)點用O表示的部分是表示圖67所示的單詞列在知識網(wǎng)絡上的位置的部 分。另外,用虛線包圍的區(qū)域是從單詞列存儲部163輸入的單詞密集的區(qū)域。 在圖67所示的單詞列中,從"大手町"、"東西線,,可以類推與場所有關的話 題??梢灾缹τ诔蔀閷ο蟮陌讣?移動電話"、"網(wǎng)絡"、"旋轉壽司"、"A 壽司"成為話題。在圖67所示的單詞列中,"鈴鹿"、"什錦煎餅"是由于語音 輸入程序的誤識別而導致的單詞,與會話沒有直接的關聯(lián)。
圖59所示的話題輸出部756將由話題抽出部755抽出的話題語顯示在輸 出部1152上,或輸出至在話題存儲部166中存儲的文件。在輸出至文件時, 例如可以用RSS (Rich site summary)等形式來表示。
輸出部1152是負責關鍵字抽出服務器107的輸出并可顯示話題語的裝置。
作為輸出部1152,可以使用CRT顯示器、液晶顯示器等顯示裝置。
程序存儲裝置119具有存儲話題抽出程序的話題抽出程序存儲部195(文 件)、存儲網(wǎng)頁瀏覽器的網(wǎng)頁瀏覽器存儲部191、存儲郵件客戶端的郵件客戶 端存儲部192、存儲文字識別程序的文字識別程序存儲部193、以及存儲語音 識別程序的語音識別程序存儲部194。
話題抽出程序是在個人計算機(PC)或工作站(WS)等關鍵字抽出服務 器107上運行的程序。在將話題抽出程序作為在PC、 WS等專用終端上運行 的獨立的進程來執(zhí)行時,通過圖形用戶界面(GUI)上的圖符的啟動或來自命 令總線的命令輸入來啟動。另外,在作為其他程序的一部分安裝在程序庫時, 在其他程序的啟動的背景下,構成話題抽出程序的程序庫被初始化。另外,也 可以是從遠程的程序,利用遠程過程調用(RPC)等來調用的服務器型的方式。 話題抽出程序是與網(wǎng)頁瀏覽器、郵件客戶端、文字識別程序、語音識別程序等 進行組合而使用。
話題抽出程序使關鍵字抽出服務器107執(zhí)行如下命令(a)由文本數(shù)據(jù)取 得部751取得文本數(shù)據(jù);(b )使單詞抽出部752從文本數(shù)據(jù)中抽出記述了多個 單詞以及多個單詞間的關聯(lián)的詞典中所記述的多個單詞;(c)使評價部754根 據(jù)抽出的單詞,使用詞典評價在詞典中記述的多個單詞;(d)使話題抽出部 755從在詞典中記述的多個單詞中抽出評價高的話題語;以及(e)使話題輸 出部156向輸出部1152等輸出所抽出的話題語、或向存儲々某體114的話題存 儲部166中存儲所抽出的話題語。
網(wǎng)頁瀏覽器是以HTTP協(xié)議為首,對FTP、 Gopher (644)等各種因特網(wǎng) 上的協(xié)議提供用戶接口的客戶端程序。使網(wǎng)頁瀏覽器部171執(zhí)行將顯示在瀏覽 器上的文本數(shù)據(jù)轉交給文本數(shù)據(jù)取得部751的命令。
郵件客戶端是支持POP3以及APOP等郵件用的協(xié)議的客戶端程序。使郵 件客戶端部172執(zhí)行針對一般的郵件客戶端取得收發(fā)的郵件中包含的文本數(shù) 據(jù)并轉交給文本數(shù)據(jù)取得部751的命令。
文字識別程序是使文字識別部173執(zhí)行如下的命令的程序,該命令為根 據(jù)由圖像輸入部輸入的圖像信息識別文本數(shù)據(jù),并將識別結果(文本數(shù)據(jù))轉 交給文本數(shù)據(jù)取得部751。
語音識別程序是使語音識別部174執(zhí)行如下命令的程序,該命令為根據(jù) 從語音輸入部取得的語音信息來確定包含在通話中的單詞,并將單詞信息(單 詞、詞類)轉交給文本數(shù)據(jù)取得部751。 一般在進行語音識別的基礎上,需要 預先插入應識別的單詞、語法、語言模型等。在后述的單詞詞典中保存的單詞 是為了也可以用語音識別程序來進行語音識別而預先插入的單詞。
存儲i某體114包括知識網(wǎng)絡數(shù)據(jù)存儲部116,其存儲單詞詞典以及單詞 相關度詞典;設定信息存儲部161,其存儲抽出話題時所需要的各種設定信息; 文本數(shù)據(jù)存儲部162,其按照需要適宜存儲來自網(wǎng)頁瀏覽器部171、郵件客戶 端部172、文字識別部173以及語音識別部174的文本數(shù)據(jù);單詞列存儲部163, 其按照需要適宜存儲由單詞抽出部752抽出的單詞列;路徑存儲部164,其按 照需要適宜存儲由路徑抽出部753計算的最短路徑;評價結果存儲部165,其 按照需要適宜存儲由評價部754進行評價的結果、對各節(jié)點賦予的點數(shù);以及 話題存儲部166,其按照需要適宜存儲由話題抽出部755抽出的話題。
主存儲裝置118暫時存儲在計算機中的程序執(zhí)行處理中利用的數(shù)據(jù)等,或 發(fā)揮作為作業(yè)區(qū)域來利用的暫時的數(shù)據(jù)存儲器的功能。作為主存儲裝置118,
例如可以采用半導體存儲器、^磁盤、光盤、光^f茲盤或/f茲帶等。 -處理流程-
下面,參照圖72的流程圖,對第二實施例中的使用關鍵字抽出服務器107 進行的話題抽出方法進行說明。此外,下面敘述的話題抽出方法為一個例子, 當然也可以用其以外的方法來實現(xiàn)。下面,為了說明的簡便,說明將話題抽出 程序作為程序庫來插入到語音識別程序中的情況。此外,在本發(fā)明的實施方式 中,說明將文本數(shù)據(jù)統(tǒng)一評價的方法。
(a)在步驟S20中,對輸入部1151的語音輸入部輸入圖5所示的語音。 語音識別部174如圖66所示地識別輸入至語音輸入部的語音,并將語音識別 結果(文本數(shù)據(jù))作為文件轉交給文本數(shù)據(jù)取得部751。在操作系統(tǒng)(OS )的 命令上,將文本數(shù)據(jù)的文件作為自變量來啟動話題抽出程序。在啟動話題抽出 程序的背景下進行初始化處理。例如,作為之后的點數(shù)計算的初始化,將存儲 在評價結果存儲部165中的按照單詞(節(jié)點)的點數(shù)清零。文本數(shù)據(jù)取得部 751將從語音識別部174接收到的文本數(shù)據(jù)轉交給單詞抽出部752。
96
(b) 在步驟S21中,單詞抽出部752讀出存儲在知識網(wǎng)絡數(shù)據(jù)存儲部116 中的單詞詞典,使用單詞詞典來解析從文本數(shù)據(jù)取得部751接收到的文本數(shù) 據(jù),如圖67所示從文本數(shù)據(jù)抽出在單詞詞典中記述的單詞。抽出的單詞被保 存在單詞列存儲部163的窗口內(nèi)。
(c) 在步驟S22中,路徑抽出部753從保存在單詞列存儲部163的窗口 內(nèi)的單詞中以任意的順序選擇兩個單詞。其中,不進行雙重處理,即不選擇同 一單詞,不進行評價過的單詞間的評價。在選擇的兩個單詞中將一個單詞作為 起點節(jié)點,將另一個單詞作為終點節(jié)點。路徑抽出部753讀出存儲在知識網(wǎng)絡 數(shù)據(jù)存儲部116中的如圖64所示的單詞詞典、以及如圖62所示的單詞相關度 詞典,使用如圖63所示的知識網(wǎng)絡來^^索 抽出起點節(jié)點和終點節(jié)點間的網(wǎng) 絡結構上的最短路徑。
(d) 在步驟S23中,評價部754從設定信息存儲部161中讀出路徑判斷 用閾值A,判斷由路徑抽出部753計算的起點節(jié)點和終點節(jié)點間的最短路徑是 否比路徑判斷用閾值A長。在判斷為最短路徑長度比路徑判斷用閾值A長時, 進入步驟S28,另一方面,在最短路徑長度為路徑判斷用閾值A以下時,進入 步驟S24。
(e) 在步驟S24中,評價部754使用式(1) ~ (9)等,計算位于最短 路徑的端部上的起點節(jié)點以及終點節(jié)點的各自的評價值。例如,如式(4) ~
(8)所示,起點節(jié)點和終點節(jié)點間的最短路徑長度越短,計算出的評價值越 高。
(f) 在步驟S25中,評價部754按照需要使用起點節(jié)點以及終點節(jié)點的 各自的評價值,使用式(IO) ~ (13),如圖68所示地對于在最短路徑上存在 的各個單詞(節(jié)點)分別賦予點數(shù)。此外,在步驟S25中不使用起點節(jié)點以及 終點節(jié)點的各自的評價值時,通過省略步驟S24的處理來可以縮短計算時間。
(g) 在步驟S26中,評價部754判斷是否對于在最短路徑上存在的所有 單詞(節(jié)點)賦予了點數(shù)。在判斷為對所有單詞(節(jié)點)賦予了點數(shù)時,進入 步驟S27。另一方面,在判斷為沒有對所有單詞(節(jié)點)賦予了點數(shù)時,回到 步驟S25的處理,對于沒有賦予點數(shù)的單詞(節(jié)點)賦予點數(shù)。結果,對在最 短路徑上存在的所有單詞(節(jié)點)賦予點數(shù)。(h) 在步驟S27中,評價部754判斷是否對注目的起點節(jié)點和終點節(jié)點 間的所有最短路徑進行了計算。在判斷為對所有最短^各徑進行了計算時,進入 步驟S28。另一方面,在注目的起點節(jié)點和終點節(jié)點間抽出了多個最短路徑, 判斷為沒有對所有最短路徑進行了計算時,回到步驟S25的處理,對在未計算 的最短路徑上存在的節(jié)點賦予點數(shù)。結果,對在所有最短路徑上存在的單詞(節(jié) 點)進行處理。
(i) 在步驟S28中,評價部754判斷是否對在單詞列存儲部163的窗口 內(nèi)保存的單詞的所有組合進行了處理。其中,不進行雙重處理,即同一單詞的 組合、評價過的單詞間的組合是對象外。在判斷為對所有組合進行了計算時, 進入步驟S29。另一方面,在判斷為沒有對所有組合進行了計算時,回到步驟 S22的處理,對未計算的兩個單詞的組合進行處理。結果,對所有的單詞的組 合進纟于處理。
(j)在步驟S29中,如圖68的縱軸(4)所示,評價部754累計對各單 詞(節(jié)點)賦予^點數(shù)。
(k)在步驟S30中,判斷話題抽出部755按照用存儲在設定信息存儲部 161中的設定信息來定義的設定值,作為話題語的抽出方法是否使用抽出點數(shù) 為上位的B個單詞。在判斷為使用抽出上位B個單詞的方法時,進入步驟S31 。 在步驟S31中,話題抽出部755讀出用存儲在設定信息存儲部161中的設定信 息來定義的個數(shù)B,如圖69所示,抽出上位B ( =5)個單詞來作為話題語。
(1)另一方面,在步驟S30中,在判斷為不使用抽出上位B個單詞的方 法時,進入步驟S32。在步驟S32中,從設定信息存儲部161讀出話題抽出用 閾值C,并如圖70所示,抽出對單詞(節(jié)點)賦予的合計點數(shù)為話題抽出用 閾值C ( =1.00)以上的單詞來作為話題語。
(m)在步驟S33中,話題輸出部156向輸出部1152或文件等輸出由話 題抽出部755抽出的、成為話題的單詞。
為了有助于對話內(nèi)容的理解、對話內(nèi)容的相關信息的檢索、以及對話內(nèi)容 的充實,研究了解釋連續(xù)發(fā)出的聲音的語音識別結果、或來自光學式文字讀取 裝置(OCR)等的圖像的文字識別結果等字符串,抽出表示其內(nèi)容的話題語的 話題語抽出技術。
作為第 一話題語抽出方法,已知使用特定的話題轉換語或話題轉換規(guī)則, 控制話題的變化的方法。在該方法中,預先準備"首先"、"第一"、"接著"等 成為話題轉換的契機的單詞來作為話題轉換語詞典,使用話題轉換規(guī)則從語法 的角度解釋接著輸入的字符串,并抽出成為話題的單詞。
作為第二話題抽出方法,已知使用單詞的出現(xiàn)頻度或出現(xiàn)間隔的方法。在
該方法中,利用單詞的出現(xiàn)頻度、出現(xiàn)間隔來抽出輸入文獻中的重要單詞。
作為第三話題抽出方法,已知使用按照專業(yè)領域的專業(yè)用語詞典的方法, 在該方法中,預先選定領域以及對領域的依賴度高的關鍵字,將在評價區(qū)間中 檢測到的關鍵字表示最高的依賴度的領域作為話題。
但是,在使用話題轉換語等的第一方法中,需要成為話題轉換的契機的單 詞的輸入,但是在一般的會話等中并不一定說出該單詞。另外,在抽出話題語 時使用語法規(guī)則,但是并不一定以這種形式說出。另外,忽視預先準備的語法 規(guī)則以外的語法規(guī)則而動作,因此即使輸入了包含誤識別的字符串也進行動 作。其中,并不是以對應于誤識別為前途,因此在表示話題轉換的單詞被誤識 別或跳過識別等情況下不能巧妙地對應。另外,需要預先準備成為話題轉換的 契機的話題轉換詞典,還需要用于抽出話題的語法定義。
在第二話題抽出方法、即在使用單詞的出現(xiàn)頻率的方法中,在假定重復出 現(xiàn)的單詞為重要的詞語的情況下使用單詞的出現(xiàn)頻度或出現(xiàn)間隔,但沒有評價 單詞間的關聯(lián),所以只要同 一詞語沒有重復多次出現(xiàn)就不能抽出重要的詞語。
另外,在第三話題抽出方法、即利用專業(yè)用語詞典的方法中,評價對于預 先決定的某話題輸入了多少與話題有關的單詞,關于誤識別沒有特別地考慮。
對此,根據(jù)第二實施例的關鍵字抽出服務器107,對于輸入的單詞列,使 用知識網(wǎng)絡賦予按照單詞間的距離的點數(shù),因此可以抽出輸入的單詞列集中的 部分(=若直接地說明的話,是語群的重心)。
而且,知識網(wǎng)絡可以不基于啟發(fā)式(heuristic)的知識,通過國語詞典或 網(wǎng)頁上的文獻等的解析來生成。對于輸入的單詞列,僅用知識網(wǎng)絡來評價,因 此不需要預先決定語法規(guī)則等抽出規(guī)則。
而且,不從集中部分中抽出較長的一部分,因此如圖像識別結果或語音識 別結果等,在文本數(shù)據(jù)中包含誤識別時也可以消除誤識別。
(第二實施例的變更例)
在上述的第二實施例中,說明了將語音識別程序的輸出暫時輸出至文件后 統(tǒng)一評價的方法,但是在第二實施例的變更例中,說明逐次評價語音識別程序 的輸出并實時地顯示當前的話題的話題抽出方法。
在上述第二實施例中,對所有語音識別部174的輸出進行識別后暫時輸出 至文件,但在變更例中每次識別文本數(shù)據(jù)后,將識別的文本數(shù)據(jù)轉交給文本數(shù)
據(jù)取得部751。文本數(shù)據(jù)取得部751將接收到的文本數(shù)據(jù)逐次轉交給單詞抽出 部752。單詞抽出部752使用詞素等來解析接收到的文本數(shù)據(jù),從文本數(shù)據(jù)中 逐次抽出包含在單詞詞典中的單詞。將單詞逐次轉交給單詞列存儲部163 。
圖73表示每次對單詞列存儲部163輸入新單詞時的單詞列存儲部163內(nèi) 的窗口的情形。在圖73中,縱軸表示在某瞬間保存在單詞列存儲部163中的 單詞列。橫軸表示每次輸入新單詞時的時間變化。例如,在圖73中,表示在 該瞬間在單詞列存儲部163內(nèi)含有"大手町"、"鈴鹿"、"東西線"。由于是 FIFO,且窗口尺寸為5,因此從最原始的"大手町,,起從窗口跳出,可知輸入 了新的單詞"網(wǎng)絡"。
路徑抽出部753隨時抽出保存在圖73所示的窗口內(nèi)的兩個單詞的最短路 徑,評價部754計算最短路徑上的單詞的點數(shù),話題抽出部755抽出話題語。
圖74表示每當輸入新的輸入語時的、抽出了合計點數(shù)為上位B = 2個話 題語的結果。在圖74中,最左邊的列為新輸入至單詞列存儲部163的單詞(輸 入語),剩下的列表示輸入了其單詞時抽出的話題語。從圖74可知,當輸入的 單詞為"鈴鹿"時,抽出"鈴鹿"以及"大手町",但是當輸入了 "東西線"、 "什錦煎餅"、以及"移動電話,,時抽出"大手町"以及"東西線",當輸入了 "網(wǎng)絡"、以及"旋轉壽司,,時抽出"網(wǎng)絡"以及"移動電話",當輸入了 "A 壽司,,以及"B壽司,,時抽出"A壽司"以及"旋轉壽司"。即,可知每次輸 入單詞時,作為話題的單詞隨著輸入的文本數(shù)據(jù)而變化。
同樣,圖75是在同樣地進行了計算時顯示點數(shù)為話題抽出用閾值C = 1.00 以上的單詞的例子。從圖75也可以知道每次輸入單詞時,作為話題的單詞隨 著輸入的文本數(shù)據(jù)而變化。
另外,從圖74以及圖75可知,抽出圖63所示的知識網(wǎng)絡中單詞密集的
區(qū)域的單詞,但是難以抽出與輸入的其他單詞的距離長的"鈴鹿"、"什錦煎餅" 等來作為話題(基于閾值評價時不抽出)
根據(jù)第二實施例的變更例,逐次解析輸入的文本數(shù)據(jù),并抽出成為話題的 單詞,由此可以抽出成為實時話題的單詞。
在后面也會進行^l述,也可以將第二實施例的話題抽出程序插入到因特網(wǎng)
協(xié)議(IP)電話終端上。實質的話題計算處理相同,^a是在IP電話終端上進
行發(fā)話的語音信息的語音識別,并評價作為其結果的語音識別結果的單詞列, 在會話結束時顯示"今天的話題"。在IP電話中以會話開始處理為契機將語音 識別結果轉交給文本數(shù)據(jù)取得部751,以會話結束為契機進行評價。從會話開
始到會話結束的期間,在單詞列存儲部163中積累語音識別結果的文本數(shù)據(jù), 其會話結束為契機啟動話題抽出部755。
另外,在會話中,也可以逐次啟動話題抽出部755,并將話題信息隨時顯 示在IP電話終端上的顯示器上。 (第三實施例)
-關鍵字抽出服務器的整體結構-
如圖76所示,第三實施例的關鍵字抽出服務器107包括知識網(wǎng)絡數(shù)據(jù) 存儲部116,其用于存儲知識網(wǎng)絡數(shù)據(jù);單詞抽出部142,其用于從文本數(shù)據(jù) 中抽出包含在知識網(wǎng)絡數(shù)據(jù)中的單詞;以及關鍵字抽出部143,其使用知識網(wǎng) 絡數(shù)據(jù),計算抽出的單詞間的最短距離,并從評價對象中除去表示一定距離以 上的最短距離數(shù)據(jù),由此評價抽出的單詞間的相關性,并從評價結果中抽出關
第三實施例中的"知識網(wǎng)絡數(shù)據(jù),,是指關于多個單詞,將用距離來表示兩 個單詞間的意思上的關系的數(shù)據(jù)集中起來的數(shù)據(jù)。例如將圖77中例示的節(jié)點 屬性數(shù)據(jù)和圖78中例示的鏈路屬性數(shù)據(jù)提供給知識網(wǎng)絡。
如圖77所示,節(jié)點屬性數(shù)據(jù)中包含用于唯一確定單詞(節(jié)點)的號碼(節(jié) 點號碼)、單詞的名字(節(jié)點名)、以及與在一般的網(wǎng)絡分析中使用的所有節(jié)點 平均距離有關的信息。例如,記述了如下值節(jié)點號碼為"1"的節(jié)點名為"大 手町",大手町的所有節(jié)點平均距離為"3.478"。作為節(jié)點屬性數(shù)據(jù),除了存 儲所有節(jié)點平均距離的信息之外,還存儲鏈路數(shù)、距離中心性、介質中心性等、 或者表示網(wǎng)絡數(shù)據(jù)中的單詞的性質的指標值,由此可以用于關鍵字和相關語抽 出的順序決定。
如圖78所示,鏈路屬性數(shù)據(jù)中包含通過指定鏈路源的節(jié)點號碼和鏈路目 的地的節(jié)點號碼來表現(xiàn)單詞和單詞的連接關系(鏈路)的數(shù)據(jù)。例如,在鏈路
源節(jié)點號碼為"1"、鏈路目的地節(jié)點號碼為"16"時,表示在圖78所示的"大 手町(節(jié)點號碼1 )"和"東京站(節(jié)點號碼16),,之間存在鏈路。
圖79以視覺的方式表現(xiàn)圖77以及圖78中例示的節(jié)點屬性數(shù)據(jù)和鏈路屬 性數(shù)據(jù)的例子。用知識網(wǎng)絡數(shù)據(jù)表現(xiàn)的"單詞間的意思上的關系"包含詞典上 的關系、概念上的上下關系、同義關系、以及近義關系等,但是在本實施方式 中,不限定意思上的關系的種類。例如,也可以是在圖79的同一個知識網(wǎng) 絡數(shù)據(jù)上,大手町和NTT之間存在"地理上的關系",系統(tǒng)和硬件之間存在"概 念上的包含關系"。
此外,第三實施例中的單詞間的"最短距離,,表示從知識網(wǎng)絡上的某節(jié)點 到達某節(jié)點時經(jīng)由的其他節(jié)點的數(shù)。下面,說明在經(jīng)由O個節(jié)點時的最短距離 為"1"、在經(jīng)由一個節(jié)點時的最短路徑為"2"的情況,但是也可以在各節(jié)點 的節(jié)點屬性數(shù)據(jù)和鏈路數(shù)據(jù)中保存按照節(jié)點或鏈路不同的固有值,并經(jīng)由特定 的節(jié)點時加上其固有值。
另外,在第三實施例中,以知識網(wǎng)絡數(shù)據(jù)為無向標志的情況為例進行說明,
但是實際上也可以是有向標志。此時,面向連接關系(鏈路)而評價最短距離 的計算或相關語的抽出。
單詞抽出部142、關鍵字抽出部143以及相關語抽出部144可以由如圖76 所示的關鍵字抽出服務器107的服務器側關鍵字抽出模塊110的一部分構成。 服務器側關鍵字抽出模塊110通過控制模塊112與具有輸入部1151以及輸出 部1152的輸入輸出部115、以及將在服務器側關鍵字抽出模塊110的處理中 所需要的各種程序或數(shù)據(jù)等進行存儲的存儲纟某體114連接。
存4諸i某體114包括知識網(wǎng)絡數(shù)據(jù)存儲部116、文本數(shù)據(jù)存儲部181、單詞 抽出結果數(shù)據(jù)存儲部182、最短距離數(shù)據(jù)存儲部183、評價結果存儲部184、 關鍵字抽出結果數(shù)據(jù)存儲部185以及文本解析結果數(shù)據(jù)存儲部186。
服務器側關鍵字抽出模塊110還具有文本輸入部141以及相關語抽出部 144。文本輸入部141將/人輸入部1151輸入的文本數(shù)據(jù)存儲到文本數(shù)據(jù)存儲部 181中。文本數(shù)據(jù)可以是以文件形式提供,也可以是存儲到圖76所示的關4A 字抽出服務器107外的其他存儲裝置中。
作為文本數(shù)據(jù)的內(nèi)容,包括將網(wǎng)頁上的字符串信息、收發(fā)郵件的字符串信 息、即時消息的4議信息、如通過電話的通話內(nèi)容的語音識別結果的語音數(shù)據(jù) 與文本數(shù)據(jù)進行交換而得到的信息。另外,作為文本數(shù)據(jù),也可以利用通過光 學文字識別功能(OCR)取得的圖像上的字符串信息、或者將動畫信息與字符 串信息進行交換的信息。文本數(shù)據(jù)中也可以包含語法上的錯誤標記或單詞的打 字錯誤、誤識別等。
單詞抽出部142從存儲在文本數(shù)據(jù)存儲部181中的文本數(shù)據(jù)中抽出包含在 圖77~圖70中例示的知識網(wǎng)絡中的單詞,并作為單詞抽出結果存儲到單詞抽 出結果數(shù)據(jù)存儲部182中。
關鍵字抽出部143包括最短距離計算部231以及關鍵字評價部232。最短 距離計算部231讀出單詞抽出部142抽出的單詞抽出結果數(shù)據(jù),計算抽出的單 詞間的最短距離,并將計算結果作為最短距離數(shù)據(jù)存儲到最短距離數(shù)據(jù)存儲部 183中。
關鍵字評價部232利用最短距離計算部231計算出的最短距離數(shù)據(jù)的關 系,對評價抽出的單詞的相關性的單詞評價數(shù)據(jù)進行計算,并將計算結果作為 單詞評價數(shù)據(jù)存儲到評價結果存儲部184中。關于本實施方式的相關性的評 價,在后述的第一以及第二文本解析方法中詳細說明,可以用如下方法中的任 意一種方法
(1) 使用最短距離計算部231計算出的最短距離數(shù)據(jù),計算對不同最短 距離累計了與其他抽出的單詞的最短距離的出現(xiàn)次數(shù)的"不同最短距離累計次 數(shù),,;
(2) 計算最短距離數(shù)據(jù)的"平均距離和縮短距離"。
而且,關鍵字評價部232使用單詞評價數(shù)據(jù)抽出基于抽出單詞間的最短距 離數(shù)據(jù)的關鍵字,并將關鍵字抽出結果存儲到關鍵字抽出結果數(shù)據(jù)存儲部185 中。
相關語抽出部144讀出關鍵字抽出部143所抽出的關4建字抽出結果數(shù)據(jù),
103
與知識網(wǎng)絡數(shù)據(jù)進行對照,由此抽出與抽出的關鍵字的距離相對近的相關語, 并將抽出的關鍵字和抽出的相關語作為文本解析結果來存儲到文本解析結果 數(shù)據(jù)存儲部186中。其他實際上與其他實施方式中的關鍵字抽出服務器107
相同,因此省略"i兌明。
-第一文本解析方法-
使用圖80的流程圖對第三實施例的第一文本解析方法進行說明。 <文本數(shù)據(jù)輸入處理S41>
在圖80的步驟S41中,當啟動圖76所示的關鍵字抽出服務器107時,文 本輸入部141在文本數(shù)據(jù)存儲部181中存儲通過通信模塊113取得的抽出對象 單詞信息、或者通過輸入部1151取得的如圖81所示的文本數(shù)據(jù)。
<單詞抽出處理S42>
在圖80的步驟S42中,單詞抽出部142讀出存儲在文本數(shù)據(jù)存儲部181 中的、在圖81中例示的文本數(shù)據(jù),并從文本數(shù)據(jù)中抽出包含在知識網(wǎng)絡數(shù)據(jù) 存儲部116的節(jié)點屬性數(shù)據(jù)(參照圖77)中的單詞。然后,將抽出結果作為 單詞抽出結果數(shù)據(jù)來存儲到圖76的單詞抽出結果數(shù)據(jù)存儲部182中。
按照在圖82中例示的單詞抽出條件設定數(shù)據(jù)中的處理執(zhí)行單位(步驟) 的設定值以及設定信息執(zhí)行單詞抽出部142執(zhí)行的單詞抽出結果數(shù)據(jù)的輸出 以及后述的關鍵字抽出部143的調用的定時。例如,在包含在文本數(shù)據(jù)中的單 詞為10個、處理執(zhí)行單位(步驟)的設定值為2時,意味著單詞抽出部142 每兩個單詞執(zhí)行5次的單詞抽出結果數(shù)據(jù)輸出和關鍵字抽出部143的調用,在 圖82的設定數(shù)據(jù)列中,說明指定'T,來作為設定值的情況。
按照圖82的設定數(shù)據(jù)的情況下,由單詞抽出部142從圖81的"A:今天 出差,去大手町。因為有時間想坐東西線…"這樣的文本數(shù)據(jù)中一個一個抽出 在圖77~圖79中例示的知識網(wǎng)絡數(shù)據(jù)中存在的單詞。
具體而言,單詞抽出部142首先從圖81的文本數(shù)據(jù)中抽出"大手町",并 如圖83 (a)所示作為抽出單詞節(jié)點號碼"1"來存儲到單詞抽出結果數(shù)據(jù)存 儲部182中。同樣,單詞抽出部142在每一步驟從圖81的文本數(shù)據(jù)中一個一 個抽出"東西線"、"大手町"、"移動電話"、"系統(tǒng)"、"壽司"、"系統(tǒng)"、"藏壽 司",并輸出如圖83 (b)-圖83 (h)所示的單詞抽出結果凄史據(jù)。
此外,由單詞抽出部142進行的單詞抽出可以通過使用一般的緩存檢索的
文本數(shù)據(jù)的全文4全索處理來進行,也可以通過對將文本數(shù)據(jù)進行了詞素分析而 得到的結果應用 一致判定處理來進行。
<關鍵字抽出處理S43>
當每次輸出圖83 (a) ~圖83 (h)所示的單詞抽出結果凄史據(jù)時,在圖80 的步驟S43中,關鍵字抽出部143調用最短距離計算部231,并計算抽出的單 詞間的最短距離。之后,關鍵字抽出部143調用關鍵字評價部232,根據(jù)抽出 的單詞間的最短距離的關系進行關鍵字的評價以及抽出。然后,將關鍵字的抽 出結果作為關鍵字抽出數(shù)據(jù)來存儲到關鍵字抽出結果數(shù)據(jù)存儲部185中。下 面,對具體的處理例進行說明。
(單詞間最短距離計算處理S431 ) 在圖80的步驟S431中,最短距離計算部231從存儲媒體114中讀出在圖 84中例示的單詞間最短距離計算處理的設定數(shù)據(jù)。然后,按照處理執(zhí)行單位 (步驟),計算新抽出的單詞和已經(jīng)抽出的單詞間的最短距離,并將計算結果 作為最短距離數(shù)據(jù)來存儲到最短距離數(shù)據(jù)存儲部183中。
在圖84例示的設定數(shù)據(jù)中包含距離計算窗口寬度的設定值及其相關信 息、計算對象最短距離的設定值及其相關信息。距離計算窗口寬度是指將最短 距離數(shù)據(jù)保存在存儲媒體114中的單詞的最大數(shù)。圖85 (a)表示例如在距離 計算窗口寬度的設定值為5時,由最短距離計算部231初次啟動時確保的最短 距離數(shù)據(jù)存儲區(qū)域的例子。在最短距離數(shù)據(jù)中包含成為距離計算對象的單詞 (節(jié)點名)、節(jié)點號碼以及5個單詞中的其中任意兩個單詞間的最短距離計算 結果。
此外,為了減輕最短距離計算的處理負荷,在不影響后述的關鍵字評價部 232的處理的范圍內(nèi),最好指定圖84所示的計算對象最短距離的設定值。在 最短距離計算部231指定的最短距離為計算對象最短距離的設定值以上時,最 短距離計算部231中止計算,輸出N(不可到達)作為計算結果。由此,在步 驟S43中從后述的單詞的相關性評價的對象中除去單詞間的最短距離為一定 值以上的最短距離數(shù)據(jù),因此即使在文本數(shù)據(jù)中包含誤用單詞等,也可以抑制 抽出其誤用單詞來作為關鍵字。
具體而言,在單詞抽出部142輸出圖83(a)所示的單詞抽出結果數(shù)據(jù)時, 最短距離計算部231抽出圖83 (a)的抽出單詞節(jié)點號碼"1"和抽出單詞"大 手町"的信息。然后,參照圖77~圖79所示的知識網(wǎng)絡數(shù)據(jù),計算新抽出的 單詞和已經(jīng)抽出的單詞間的最短距離。由于在圖85 (a)的最短距離數(shù)據(jù)內(nèi)沒 有已經(jīng)抽出的單詞,因此最短距離計算部231將圖85 (a)所示的最短距離數(shù) 據(jù)存儲到最短距離數(shù)據(jù)存儲部183中。
接著,在單詞抽出部142輸出圖83 (b)所示的單詞抽出結果數(shù)據(jù)時,最 短距離計算部231抽出圖83 (b)的抽出單詞節(jié)點號碼"2"、抽出單詞"東西 線"的信息、以及圖85 (a)的最短距離數(shù)據(jù)。最短距離計算部231通過與圖 77~圖79所示的知識網(wǎng)絡數(shù)據(jù)進行對照,計算新抽出的單詞"東西線"和在 圖85 (a)中已經(jīng)抽出的"大手町"之間的最短距離。如圖79所示,從"大 手町"到"東西線"的最短距離為"2",因此最短距離計算部231計算出"2" 的值來作為距離計算結果,并將圖85 (b)所示的最短距離數(shù)據(jù)存儲到最短距 離數(shù)據(jù)存儲部183中。
最短距離計算部231對圖83 (c)以及圖83 (d)所示的單詞抽出結果數(shù) 據(jù)也進行同樣的處理,輸出圖85 (c)以及圖85 (d)所示的最短距離數(shù)據(jù)。
接著,在單詞抽出部142輸出圖83 (e)所示的單詞抽出結果數(shù)據(jù)時,最 短距離計算部231抽出圖83 (e)的抽出單詞節(jié)點號碼"5"、抽出單詞"系統(tǒng),, 的信息、以及圖85 (d)的最短距離數(shù)據(jù)。最短距離計算部231通過與圖77-圖79所示的知識網(wǎng)絡數(shù)據(jù)進行對照,計算新抽出的單詞"系統(tǒng)"和在圖85(d) 中已經(jīng)抽出的"大手町"、"東西線"、"大手町"、"移動電話"之間的最短距離。 在圖79中,"系統(tǒng),,和"東西線"之間的最短距離為6。這里,圖84所示的 計算對象最短距離的設定值為4,"系統(tǒng),,和"東西線"之間的最短距離為4 以上,因此最短距離計算部231中止東西線和系統(tǒng)的單詞間的最短距離的計 算,輸出"N,,的值來作為計算結果,并將圖85 (e)所示的最短距離數(shù)據(jù)存 儲到最短距離數(shù)據(jù)存儲部183中。
這樣,最短距離計算部231對圖83 (f) ~圖83 (h)所示的單詞抽出結 果數(shù)據(jù)也進行同樣的處理,并輸出圖85 (f) ~圖85 (h)所示的最短距離數(shù) 據(jù)。此外,在步驟數(shù)大于距離計算窗口寬度時,從最原始的最短距離數(shù)據(jù)開始寫入。
最短距離計算算法可以使用已知的Dijkstra法或Warshall-Floyd法。另夕卜, 在不使用這些算法時,也可以根據(jù)單詞抽出結果數(shù)據(jù)中的成為計算對象的兩個 節(jié)點號碼,從起點的節(jié)點號碼和終點的節(jié)點號碼的兩側起計算鏈路屬性的最短 距離。
(關鍵字評價處理S432 )
在圖80的步驟S432中,關4建字評價部232從存儲媒體114讀出在圖86 中例示的關鍵字評價處理的設定數(shù)據(jù)。然后,按照處理執(zhí)行單位(步驟),讀 出最短距離計算部231輸出的、圖85 (a) ~圖85 (h)所示的最短距離數(shù)據(jù) 以及最短距離計算部231之前輸出的、圖87 (a) ~圖87 (h)所示的單詞評 價數(shù)據(jù),計算之前輸出的單詞和新輸出的單詞間的相關性評價值。
在第一文本解析方法中,說明如下情況使用最短距離計算部231計算出 的最短距離數(shù)據(jù)來作為用于評價單詞的相關性的"相關性評價值",使用對不 同最短距離累積了抽出的單詞間的最短距離出現(xiàn)次數(shù)的"不同最短距離累積次 數(shù)"。
在圖86例示的設定數(shù)據(jù)中包含用于生成圖87 (a) ~圖87 (h)所示的單 詞評價數(shù)據(jù)的評價窗口寬度的設定值及其相關信息、以及圖88(a) ~圖88 (h)所示的關鍵字抽出結果數(shù)據(jù)的計算中所需要的設定值(抽出對象累積次 數(shù)(最短距離0 ~ 2))的信息。此外,關鍵字評價部232為了參照必要的最短 距離數(shù)據(jù),將評價窗口寬度的設定值設為圖84的距離計算窗口寬度的設定值 以下。圖86所示的設定數(shù)據(jù)表示評價窗口寬度的設定值為5、抽出對象累積 次數(shù)(最短距離0)的設定值為1、抽出對象累積次數(shù)(最短距離1)的設定 值為1、抽出對象累積次數(shù)(最短距離2)的設定值為2的情況。
圖87(a)表示例如在評價窗口寬度的設定值為5時,由關鍵字評價部232 初次啟動時確保的單詞評價數(shù)據(jù)存儲區(qū)域的例子。作為單詞評價數(shù)據(jù),包含單 詞(節(jié)點名)、節(jié)點號碼、以及按照5個單詞中的任意兩個單詞間的最短距離 的累積次數(shù)計算結果。
在單詞評價數(shù)據(jù)中也可以存儲所有節(jié)點平均距離、鏈路數(shù)、距離中心性、 介質中心性等在一般的網(wǎng)絡分析中使用的指標值來作為節(jié)點屬性數(shù)據(jù),并根據(jù)
各單詞的指標值來切換關鍵字抽出條件。另夕卜,也可以設置抽出的關鍵字的個 數(shù)的上限,按照指標值的大小順序抽出關鍵字。
例如,在最短距離計算部231輸出圖85 (a)所示的最短距離數(shù)據(jù)時,關 鍵字評價部232按照距離來分類新抽出的單詞和之前已經(jīng)抽出的單詞間的最 短距離數(shù)據(jù)。由于在圖85(a)的最短距離數(shù)據(jù)內(nèi)沒有記錄最短距離數(shù)據(jù)的值, 因此關鍵字評價部232將圖87 (a)所示的計算結果作為單詞評價數(shù)據(jù)來存儲 到評價結果存儲部184中。
接著,關鍵字評價部232讀出圖87 (a)所示的單詞評價數(shù)據(jù),抽出最短 距離數(shù)據(jù)的累積次數(shù)的計算結果的值中的任意一個為圖86中例示的抽出對象 累積次數(shù)(最短距離0~2)的設定值以上的單詞來作為關鍵字。在圖87 (a) 的例子中,由于沒有記錄最短距離數(shù)據(jù),因此如圖88(a)所示,關鍵字評價 部232將"抽出關鍵字節(jié)點號碼無"、"抽出關鍵字無"這樣的關鍵字抽出 結果數(shù)據(jù)存儲到關鍵字抽出結果數(shù)據(jù)存儲部185中。
在最短距離計算部231輸出圖85 (b)所示的最短距離數(shù)據(jù)時,關鍵字評 價部232讀出圖85 (b)的單詞評價數(shù)據(jù),并按照距離來分類新抽出的單詞和 之前已經(jīng)抽出的單詞間的最短距離。在圖85 (b)的最短距離數(shù)據(jù)中分別一個 一個地存儲有表示節(jié)點名"大手町,,和"東西線"之間的最短距離的"2"的 值。因此關鍵字評價部232在最短距離2的區(qū)域分別存儲"1"的值來作為節(jié) 點名"大手町,,以及"東西線,,的單詞評價數(shù)據(jù),并作為圖87 (b)所示的單 詞評價數(shù)據(jù)來存儲到評價結果存儲部184中。
接著,關鍵字評價部232讀出圖87 (b)所示的單詞評價數(shù)據(jù),并抽出最 短距離數(shù)據(jù)的累積次數(shù)的計算結果的任意一個值為圖86中例示的抽出對象累 積次數(shù)(最短距離0~2)的設定值以上的單詞來作為關鍵字。在圖87 (b)的 例子中,輸入了 "1"的值來作為節(jié)點名"大手町,,和"東西線,,之間的最短 距離2的累積次數(shù),但是由于該值比圖86的抽出對象累積次數(shù)(距離2)的 設定值"2"小,因此不能作為關鍵字來抽出。結果,如圖88 (b)所示,關 鍵字評價部232將"抽出關鍵字節(jié)點號碼無"、"抽出關鍵字無"這樣的關 鍵字抽出結果存儲到關鍵字抽出結果數(shù)據(jù)存儲部185中。
而且,最短距離計算部231對圖87 (c) ~圖87 (h)所示的單詞抽出結
果數(shù)據(jù)也進行同樣的處理,輸出圖88 (c) ~圖88 (h)所示的關鍵字抽出結 果數(shù)據(jù)。此外,在步驟數(shù)大于距離計算窗口寬度時,從最原始的最短距離數(shù)據(jù) 開始寫入。
〈相關語抽出處理S44〉
在圖80的步驟S44中,相關語抽出部144讀出圖88 (a) ~ (h)所示的 關鍵字抽出結果數(shù)據(jù)中的"抽出關鍵字節(jié)點號碼",并檢索圖77 圖79所示 的知識網(wǎng)絡數(shù)據(jù)的節(jié)點屬性數(shù)據(jù)和鏈路屬性數(shù)據(jù),由此抽出與抽出關鍵字的距 離相對近的單詞來作為相關語。然后,將相關語的抽出結果作為文本解析結果 數(shù)據(jù)來存儲到文本解析結果數(shù)據(jù)存儲部186中。
此外,使相關語抽出部144讀入圖89中例示的相關語抽出條件設定數(shù)據(jù), 由此可以對作為抽出對象的相關語進行限制。作為限制的例子,可以舉出表示 離相關語抽出對象的關鍵字的最大距離的"抽出對象距離數(shù)"、以及表示按照 離關鍵字的每一距離的相關語的輸出最大個數(shù)的"按距離的相關語輸出上限 數(shù),,等。在圖89中,表示抽出對象距離數(shù)為"2"、距離l相關語輸出上限數(shù) 為"1"、距離2相關語輸出上限數(shù)為"1"的情況。
如圖卯(a)所示,文本解析數(shù)據(jù)包括表示關鍵字和相關語的識別信息的 單詞識別、抽出關鍵字節(jié)點號碼、抽出關鍵字名、以及鏈接目的地節(jié)點號碼等。 文本解析數(shù)據(jù)也可以包括各關鍵字或相關語的鏈接目的地的節(jié)點號碼來作為 用輸出對象的關鍵字和抽出相關語來收縮知識網(wǎng)絡數(shù)據(jù)的數(shù)據(jù)。
另外,也可以存儲所有節(jié)點平均距離或鏈路數(shù)、距離中心性、介質中心性 等在一般的網(wǎng)絡分析中使用的指標值來作為節(jié)點屬性數(shù)據(jù),并按照相關語抽出 優(yōu)先順序即指標值的大小順序來抽出關鍵字。也可以通過輸出部1152以如圖 79所示的網(wǎng)絡圖的形式輸出存儲在文本解析結果數(shù)據(jù)存儲部186中的文本解 析數(shù)據(jù)。
例如,在關鍵字抽出部143輸出圖88(a)所示的關鍵字抽出結果數(shù)據(jù)時, 相關語抽出部144根據(jù)圖89所示的相關語抽出條件設定數(shù)據(jù),抽出關鍵字以 及相關語的信息,并將如圖卯(a)所示的文本解析結果數(shù)據(jù)存儲到文本解析 結果教:據(jù)存儲部186中。在圖88(a)中,由于不存在關鍵字,因此對單詞識 別、抽出關鍵字節(jié)點號碼、抽出關鍵字、鏈接目的地節(jié)點號碼不輸入任何信息。
在圖88 (b)所示的關鍵字抽出結果數(shù)據(jù)的情況下,針對圖90 (b)所示的文 本解析數(shù)據(jù),也不抽出關鍵字以及相關語。
然后,在關鍵字抽出部143輸出圖88(c)所示的關鍵字抽出結果數(shù)據(jù)時, 相關語抽出部144從圖88 (c)所示的關鍵字抽出結果數(shù)據(jù)中抽出關鍵字節(jié)點 號碼"1"的抽出關鍵字"大手町"以及關^:字節(jié)點號碼"2"的抽出關鍵字"東 西線,,的信息。成為抽出對象的"大手町"和"東西線,,之間的最大距離為2, 滿足圖89所示的抽出對象距離數(shù)的設定值的條件,因此相關語抽出部144抽 出"大手町"和"東西線"的相關語。這里,說明按照相關語抽出優(yōu)先順序即 圖77~圖79所示的知識網(wǎng)絡數(shù)據(jù)的所有節(jié)點平均距離從小到大的順序作為輸 出對象的情況。在圖89的相關語抽出條件設定數(shù)據(jù)中,最短距離為2時的相 關語輸出上限數(shù)為1,因此相關語抽出部144從圖79所示的知識網(wǎng)絡中抽出 "東京地鐵東西線",并將如圖90 (c)所示的文本解析結果數(shù)據(jù)存儲到文本 解析結果數(shù)據(jù)存儲部186中。通過重復進行同樣的處理,相關語抽出部144 計算圖90(d) ~ (h)所示的文本解析結果數(shù)據(jù)。 -第二文本解析方法-
使用圖80的流程圖以及圖91 ~圖94說明第三實施例的第二文本解析方 法。此外,圖80的步驟S41、 S42、 S431的各處理實質上與上述第一文本解 析方法相同,因此這里對步驟S432中的關鍵字評價處理和步驟S44中的相關 語抽出處理進行說明。
<關鍵字評價處理S432>
在步驟S432中,關鍵字評價部232按照處理執(zhí)行單位(步驟)讀出單詞 間最短距離計算模塊輸出的圖85 (a) ~圖85 (h)所示的最短距離數(shù)據(jù)以及 已經(jīng)輸出完畢的圖92 (a) ~圖92 (h)所示的單詞評《介數(shù)據(jù),根據(jù)圖91所示 的設定數(shù)據(jù),計算新抽出的單詞和之前已經(jīng)抽出的單詞間的相關性評價值,并 在每一步驟中將新的單詞評價數(shù)據(jù)存儲到評價結果存儲部184中。
單詞評價數(shù)據(jù)中也可以存儲所有節(jié)點平均距離或鏈路數(shù)、距離中心性、介 質中心性等在一般的網(wǎng)絡分析中使用的指標值來作為節(jié)點屬性數(shù)據(jù),并根據(jù)各 單詞的指標值來切換關鍵字的抽出條件。另夕卜,也可以對抽出的關鍵字的個數(shù) 設置上限值,并按照指標值的大小順序來抽出關鍵字。
這里,使用圖91 ~圖94說明作為相關性評價值計算最短距離計算部231 計算出的最短距離數(shù)據(jù)的"平均距離"以及基于平均距離的"縮短距離"的情 況。
如圖91所示,對設定數(shù)據(jù)指定了評價窗口寬度的設定值及其相關信息、 使用圖85 (a) ~圖85 (h)所示的最短距離數(shù)據(jù)計算最短距離的平均距離時 所需要的"平均對象距離計算結果數(shù),,的設定值、以及后述的關鍵字抽出中所 需要的"抽出對象平均距離"以及"抽出對象縮短距離,,的設定值。關鍵字評 價部232在滿足圖91所示的關鍵字抽出處理的設定數(shù)據(jù)中設定的"抽出對象 平均距離"或"抽出對象縮短距離,,時,即"該單詞相對于評價窗口內(nèi)其他單 詞的平均距離(最短距離數(shù)據(jù)的平均距離)足夠近,判斷為單詞的相關性高時,, 或者"該單詞相對于評價窗口內(nèi)其他單詞的平均距離以及該單詞相對于知識網(wǎng) 絡上的所有單詞的平均的差值(縮短距離)足夠大,判斷為評價窗口內(nèi)的單詞 的相關性高時",抽出該單詞作為關鍵字。
在圖91所示的例子中,表示評價窗口值為5、平均對象距離計算結果數(shù) 為2、抽出對象平均距離為1.5、抽出對象縮短距離為3.0的情況。此外,關鍵 字評價部232為了參照所需要的最短距離數(shù)據(jù),將評價窗口寬度的設定值設為 圖84的距離計算窗口寬度的設定值以下。
例如,圖92(a)表示在評價窗口寬度的設定值為5時,由關鍵字評價部 232初次啟動時確保的單詞評價數(shù)據(jù)存儲區(qū)域。單詞評價數(shù)據(jù)包括單詞(節(jié)點 名)、節(jié)點號碼、5個單詞中的任意兩個單詞間的平均距離和縮短距離的計算 結果。
在計算最短距離平均時,關鍵字評價部232讀出圖91中例示的平均距離 對象距離計算結果數(shù)的信息。并且,在評價窗口內(nèi)存在的最短距離計算結果比 設定值多時,將上位(距離短)的平均對象計算結果數(shù)的最短距離計算結果按 照順序作為平均距離的計算對象。另外,在計算上,將距離計算結果為O的計 算結果作為平均計算對象,從平均計算對象中除去距離計算結果為N的計算 結果。
例如,在最短距離計算部231輸出圖85 (a)所示的最短距離數(shù)據(jù)時,關 鍵字評價部232才艮據(jù)圖91中例示的平均對象距離計算結果數(shù)的設定值,計算
新抽出的單詞和之前已經(jīng)抽出的單詞間的最短距離數(shù)據(jù)的平均值。由于在圖
85 (a)的最短距離數(shù)據(jù)內(nèi)沒有記錄最短距離數(shù)據(jù)的值,因此平均距離為N。 由于作為平均距離存儲有N的值,因此不計算縮短距離。結果,關鍵字評價 部232將圖92 (a)所示的單詞評價數(shù)據(jù)存儲到評價結果存儲部184中。
接著,關鍵字評價部232讀出圖92 (a)所示的單詞評價數(shù)據(jù),并根據(jù)圖 91所示的抽出對象平均距離以及抽出對象縮短距離的設定值,抽出關鍵字。 在圖92(a)的例子中,平均距離為N,并且沒有記錄縮短距離,因此如圖93 (a)所示,關鍵字評價部232將"抽出關鍵字節(jié)點號碼無"、"抽出關鍵字 無"這樣的關鍵字抽出結果數(shù)據(jù)存儲到關鍵字抽出結果數(shù)據(jù)存儲部185中。
在最短距離計算部231輸出圖85 (b)所示的最短距離數(shù)據(jù)時,關鍵字評 價部232讀出圖91中例示的平均對象距離計算結果數(shù)的設定值,并計算新抽 出的單詞和之前已經(jīng)抽出的單詞間的最短距離數(shù)據(jù)的平均值。由于在圖85(b) 的最短距離數(shù)據(jù)內(nèi)分別存儲有節(jié)點名"大手町,,和"東西線,,之間的最短距離 數(shù)據(jù)"2"的值,因此關鍵字評價部232計算各個平均距離以及縮短距離,并 將圖92 (b)所示的單詞評價數(shù)據(jù)存儲到評價結果存儲部184中,該單詞評價 數(shù)據(jù)中分別存儲了 "2.000"以及"1.478"的值來作為節(jié)點名"大手町,,的平 均距離以及縮短距離,分別存儲了 "2.000"以及"3.217"的值來作為節(jié)點名 "東西線,,的平均距離以及縮短距離。
接著,關鍵字評價部232讀出圖92 (b)所示的單詞評價數(shù)據(jù),并根據(jù)圖 91的抽出對象平均距離以及抽出對象縮短距離的設定值,抽出關鍵字。在圖 92(a)的例子中,節(jié)點名"東西線"的縮短距離為"3.127",是圖91的抽出 對象縮短距離的設定值3.0以上,因此作為關鍵字來抽出,如圖93(b)所示, 將"抽出關鍵字節(jié)點號碼2"、"抽出關鍵字東西線"這樣的關鍵字抽出結 果數(shù)據(jù)存儲到關鍵字抽出結果數(shù)據(jù)存儲部185中。
最短距離計算部231在每一步驟中使用圖85 (c) ~圖85 (h)所示的最 短距離數(shù)據(jù)而計算平均距離以及縮短距離,之后如圖92(c) ~圖92(h),計 算單詞評價數(shù)據(jù),并根據(jù)圖92 (c) ~圖92 (h)所示的單詞評價數(shù)據(jù),輸出 圖93 (c) ~圖93 (h)所示的關鍵字抽出結果數(shù)據(jù)。此外,在步驟數(shù)大于距 離計算窗口寬度時,從最原始的最短距離數(shù)據(jù)開始寫入。
〈相關語抽出步驟S44〉
在圖80的步驟S44中,相關語抽出部144讀出圖93 (a) ~圖93 (h)所 示的關鍵字抽出結果數(shù)據(jù)中的"抽出關鍵字節(jié)點號碼",并檢索圖77~圖78 所示的知識網(wǎng)絡數(shù)據(jù)的節(jié)點屬性數(shù)據(jù)和鏈路屬性數(shù)據(jù),由此將抽出關鍵字周圍 的單詞作為相關語來抽出。然后,將相關語的抽出結果作為文本解析結果數(shù)據(jù) 來存儲到文本解析結果數(shù)據(jù)存儲部186中。
例如,在關鍵字抽出部143輸出圖93(a)所示的關鍵字抽出結果數(shù)據(jù)時, 相關語抽出部144才艮據(jù)圖89所示的與相關語抽出條件有關的設定數(shù)據(jù)抽出關 鍵字以及相關語的信息,并將如圖94 (a)所示的文本解析結果數(shù)據(jù)存儲到文 本解析結果數(shù)據(jù)存儲部186中。在圖93 (a)中,由于不存在關鍵字,對單詞 識別、抽出關鍵字節(jié)點號碼、抽出關鍵字、鏈接目的地號碼中不輸入任何信息。
然后,在關鍵字抽出部143輸出圖93(b)所示的關鍵字抽出結果數(shù)據(jù)時, 相關語抽出部144從圖93 (b)所示的關鍵字抽出結果數(shù)據(jù)中抽出關鍵字節(jié)點 號碼"2"的抽出關4建字"東西線"的信息。在圖93 (b)中,由于關鍵字只 有一個,因此不抽出相關語。結果,相關語抽出部144將如圖94 (b)所示的 文本解析結果存儲到文本解析結果數(shù)據(jù)存儲部186中。
然后,在關鍵字抽出部143輸出圖93(c)所示的關鍵字抽出結果數(shù)據(jù)時, 相關語抽出部144從圖93 (c)所示的關鍵字抽出結果數(shù)據(jù)中抽出關鍵字節(jié)點 號碼"1"的抽出關4建字"大手町"和關鍵字節(jié)點號碼"2"的抽出關4建字"東 西線"的信息。成為抽出對象的"大手町"和"東西線,,之間的最大距離為2, 且滿足圖89所示的抽出對象距離數(shù)的設定值的條件,因此相關語抽出部144 抽出"大手町"和"東西線"的相關語。在圖89的相關語抽出條件設定數(shù)據(jù) 中,最短距離為2時的相關語輸出上限數(shù)為1,因此相關語抽出部144從圖79 所示的知識網(wǎng)絡中抽出東京地鐵東西線,并將如圖94 (c)所示的文本解析結 果數(shù)據(jù)存儲到文本解析結果數(shù)據(jù)存儲部186中。通過反復進行同樣的處理,相 關語抽出部144計算圖94 (d) ~圖94 (h)所示的文本解析結果數(shù)據(jù)。
在使用了電子郵件、即時消息、電話等的通信中幫助對話內(nèi)容的理解、對 話內(nèi)容的相關信息的檢索、以及對話內(nèi)容的充實的基礎上,(l)包含在收發(fā)信 息中的重要單詞(關鍵字)的提示、以及(2)關鍵字的相關語的提示有效。
另一方面,有時在通信中收發(fā)的文本信息或語音的識別結果中包含由于誤 用、打字錯誤或誤識別而導致的錯誤的單詞(以下稱為"誤用單詞")。因此, 為了高精度地執(zhí)行上述(1)以及(2), (3)最好能夠抑制抽出誤用單詞來作 為關鍵字或相關語。
作為可提示單詞的相關語的解析方法中,已知如下技術預先準備存儲有 單詞和單詞間的意思上的關系或共現(xiàn)關系的數(shù)據(jù),解析相對于輸入單詞位于最
短距離、且具有閾值以上的重要度的單詞(相關語)。而且,還有如下技術 通過使用兩種存儲有單詞和單詞間的意思上的關系和共現(xiàn)關系的數(shù)據(jù),來提高 相關語的抽出精度。
另外,預先準備多個用例文,求出構成輸入文的單詞和構成準備的用例文 的單詞之間的最短距離,并評價輸入文與用例文之間的類似度,由此選擇特定 的用例文。并且,還已知如下技術將選擇的特定的用例文的構成單詞和對應 的輸入文中的單詞進行轉換,并訂正輸入文中的誤用單詞。
然而,在這些信息檢索方法中,無法評價輸入單詞本身的重要度或作為用 語的正確性。因此無法抑制從重要度低的單詞或誤用單詞中抽出相關語。
已知通過比較預先準備的用例文和輸入文可以訂正包含在輸入文中的誤 用單詞的技術。但是,必須預先準備與輸入文對應的用例文,因此難以解析如
用于一般的對話的復雜的信息。另外,由于不具有從輸入文中抽出關鍵字或從 抽出的關鍵字提示相關語的功能,因此無法從包含在輸入文中的龐大的信息中 排除誤用單詞,無法抽出并提示在對話內(nèi)容的理解以及檢索中所需要的信息。 對此,根據(jù)第三實施例,由關鍵字抽出部143的最短距離計算部231計算
包含在文本數(shù)據(jù)中的單詞間的最短距離,關鍵字評價部232根據(jù)該最短距離的 數(shù)據(jù)評價單詞間的相關性。在該最短距離數(shù)據(jù)的計算處理中,通過對距離為一
定距離以上的最短距離數(shù)據(jù)中輸入"N(不可到達)"的值,不考慮將意思上 的關系的距離遠的單詞、即重要度低的單詞或誤用單詞作為單詞相關性的評價 對象。由此,從文本數(shù)據(jù)中可以優(yōu)先抽出意思上的關系近的單詞(重要性高的 單詞)來作為關鍵字,并且可以抑制抽出誤用單詞來作為關鍵字。結果,可以 排除包含在文本數(shù)據(jù)中的誤識別、誤轉換、誤用、打字錯誤,能夠構筑可以評 價作為用語的正確性的文本解析系統(tǒng)以及解析方法。
另外,相關語抽出部144根據(jù)圖88 (a) ~圖88 (h)以及圖93 (a) ~ 圖93 (h)所示的關鍵字抽出結果,還可以抽出圖90 (a) ~圖90 (h)以及 圖94(a) ~圖94 (h)所示的相關語。
而且,根據(jù)本發(fā)明的第三實施例,使知識網(wǎng)絡數(shù)據(jù)存儲部116預先存儲知 識網(wǎng)絡數(shù)據(jù),由此不需要準備用于抽出關鍵字或相關語的用例文,因此針對使 用了電子郵件、即時消息、電話等的通信中的收發(fā)信息,可以提示重要度高、 且作為用語正確的關鍵字或相關語,有利于對話內(nèi)容的理解、對話內(nèi)容的相關 信息的檢索、以及對話內(nèi)容的充實。
(其他實施方式)如上所述,通過第一-第五實施方式記載了本發(fā)明,但是應理解為構成本 公開的一部分的論述以及附圖并不限定本發(fā)明。根據(jù)本公開,對于本領域技術 人員來說各種代替實施方式、實施例以及運用技術是顯而易見的。
在第五實施方式的第二實施例中例示了包含異義語意思判斷模塊111和 話題抽出處理模塊117的關鍵字抽出服務器107,在第三實施例中例示了包含 異義語意思判斷模塊111和相關語抽出處理模塊140的關鍵字抽出服務器107。 但是,不言而喻即使是關鍵字抽出服務器107只包含話題抽出處理模塊117或 只包含相關語抽出處理模塊140的結構也可以達到一定的目的。
另夕卜,在第五實施方式的第一~第三實施例的信息通信終端100中,如圖 95所示,在關鍵字抽出模塊8中保存異義語意思判斷模塊111、話題抽出處理 模塊117、以及相關語抽出處理模塊140。由此在關鍵字抽出模塊8根據(jù)關鍵 字抽出條件設定數(shù)據(jù)23,在從語音識別模塊6取得的單詞信息(單詞、詞類) 中抽出關鍵字時,通過使用表示多個單詞間的意思上的關系的、稱為"知識網(wǎng) 絡,,的詞典,可以抽出更貼近對話內(nèi)容的話題,可以提示關鍵字以及相關語。
例如,另外,如圖96所示,將執(zhí)行實質上語圖26所示的感情信息處理模 塊51相同的處理的感情信息處理服務器108連接到網(wǎng)絡101,并在信息通信 終端100中配置感情西向你抽出委托模塊99。由此,感情信息抽出委^^莫塊 99可以從通過網(wǎng)絡101連接的信息處理服務器中抽出感情信息的處理結果。
這樣,不言而喻本發(fā)明包含在此未記載的各種實施方式。因此本發(fā)明的技 術范圍根據(jù)上述說明僅由權利要求范圍的特定事項所限定。
產(chǎn)業(yè)上的應用可能性
本發(fā)明的信息通信終端、信息通信系統(tǒng)、信息通信方法、信息通信程序、
以及記錄的信息通信程序的記錄媒體可應用于與如下技術有關的產(chǎn)業(yè):IP電
話、IP電視電話等通信技術、以及取得網(wǎng)絡上的服務器所保存的信息和用戶 終端上的信息并顯示在用戶終端畫面上的數(shù)據(jù)處理技術。
權利要求
1.一種與多個信息通信終端至少交換語音信息的信息通信終端,其特征在于,所述信息通信終端包括語音識別模塊,其用于識別所述語音信息,并從識別到的語音信息中確定多個單詞;存儲媒體,其存儲設定了用于抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù);關鍵字抽出模塊,其用于讀出所述關鍵字抽出條件設定數(shù)據(jù),并從所述多個單詞中抽出多個關鍵字;相關信息取得模塊,其用于取得與所述多個關鍵字相關的相關信息;以及相關信息輸出模塊,其用于向監(jiān)視器輸出所述相關信息。
2. 根據(jù)權利要求1所述的信息通信終端,其特征在于,還包括關鍵字輸出模塊,其用于向所述監(jiān)視器輸出所述多個關鍵字;以及信息取得條件受理模塊,其用于受理從所述多個關鍵字中所選擇的關鍵字 以及所述相關信息的信息取得條件的輸入,相關信息取得模塊讀出所選擇的關鍵字以及所輸入的所述信息取得條件, 并取得所述相關信息。
3. 根據(jù)權利要求2所述的信息通信終端,其特征在于, 還包括信息共享模塊,其用于與其他信息通信終端共享所述信息取得條件以及所述相關信息中的至少一個。
4. 根據(jù)權利要求1 ~3中任意一項所述的信息通信終端,其特征在于, 還包括語音識別結果交換模塊,其用于與其他信息通信終端交換語音識別結果,該語音識別結果包含從所述語音信息確定的所述多個單詞。
5. 根據(jù)權利要求1 ~4中任意一項所述的信息通信終端,其特征在于, 還包括感情識別模塊,其用于識別從所述語音信息取得的感情信息; 感情信息發(fā)送^f莫塊,其用于向其他信息通信終端發(fā)送所述感情信息;以及 感情信息接收模塊,其用于接收從所述其他信息通信終端發(fā)送的感情信臺
6. 根據(jù)權利要求1 ~5中任意一項所述的信息通信終端,其特征在于, 還包括警告顯示模塊,其用于比較存儲在所述記錄媒體中的警告對象關鍵字集合和抽出的所述多個關鍵字,并計算包含在所述警告對象關鍵字集合中的 關鍵字的出現(xiàn)次數(shù),在所述出現(xiàn)次數(shù)為預先設定的次數(shù)以上時顯示警告。
7. 根據(jù)權利要求1~6中任意一項所述的信息通信終端,其特征在于, 還包括通信切斷模塊,其用于比較存儲在所述記錄媒體中的警告對象關鍵字集合和抽出的所述多個關鍵字,并計算包含在所述警告對象關鍵字集合中的 關鍵字的出現(xiàn)次數(shù),在所述出現(xiàn)次數(shù)為預先設定的次數(shù)以上時切斷與所述多個 信息通信終端的通信。
8. 根據(jù)權利要求1 7中任意一項所述的信息通信終端,其特征在于, 還包括語音信息錄音模塊,其用于比較存儲在所述記錄媒體中的警告對象關鍵字集合和抽出的所述多個關鍵字,并計算包含在所述警告對象關鍵字集合 中的關鍵字的出現(xiàn)次數(shù),在所述出現(xiàn)次數(shù)為預先設定的次數(shù)以上時,開始所述 語音信息的錄音。
9. 根據(jù)權利要求1~8中任意一項所述的信息通信終端,其特征在于, 所述關鍵字抽出模塊具有異義語意思判斷模塊,該異義語意思判斷模塊包括異義語判斷部,其使用知識網(wǎng)絡數(shù)據(jù)判斷在多個單詞中是否存在同音或同 寫法異義語,所述知識網(wǎng)絡數(shù)據(jù)存儲將詞匯以及詞匯的讀音對應起來的詞匯信 息、以及表示詞匯的距離關系的鏈路信息;以及意思決定部,其用于根據(jù)多個單詞間的距離決定判斷為異義語的單詞的意思。
10. 根據(jù)權利要求9所述的信息通信終端,其特征在于, 所述異義語判斷部包括知識網(wǎng)絡數(shù)據(jù)確認部,其參照所述詞匯信息以及所述鏈路信息; 異義語存在確認部,其參照所述知識網(wǎng)絡數(shù)據(jù)確認部的確認結果,判斷是 否存在同音或同寫法異義語;以及詞匯取得部,其在存在同音或同寫法異義語時,參照所述詞匯信息,取得具有與判斷為同音或同寫法異義語的單詞相同的寫法或讀音的所有詞匯。
11. 根據(jù)權利要求io所述的信息通信終端,其特征在于,所述意思決定部包括距離判斷部,其用于比較所述詞匯取得部所取得的各個詞匯和單詞集合內(nèi)的同音或同寫法異義語以外的詞匯,檢查詞匯間的距離是否在規(guī)定的距離內(nèi); 距離計數(shù)部,其用于按照各個詞匯,對詞匯間的距離進行計數(shù);以及 計數(shù)數(shù)最大值決定部,其用于將計數(shù)數(shù)為最大的詞匯決定為同音或同寫法異義語的詞匯。
12. 根據(jù)權利要求1 ~ 11中任意一項所述的信息通信終端,其特征在于, 具有話題抽出處理模塊,其將輸入至所述關鍵字抽出模塊的所述多個單詞和以網(wǎng)絡形式記述了多個單詞以及多個單詞間的路徑的知識網(wǎng)絡數(shù)據(jù)對應起 來,對在所述知識網(wǎng)絡中的最短路徑上存在的單詞賦予點數(shù),并抽出所述點數(shù)相對高的單詞來作為話題語。
13. 根據(jù)權利要求12所述的信息通信終端,其特征在于, 在所述單詞間存在多個所述最短路徑時,所述話題語抽出處理模塊對在所述多個最短路徑上存在的各個單詞賦予所述點數(shù)。
14. 根據(jù)權利要求12或13所述的信息通信終端,其特征在于, 所述話題語抽出處理模塊比較所述最短路徑和預先設定的閾值,僅對距離比所述閾值短的所述最短路徑上存在的單詞賦予所述點數(shù)。
15. 根據(jù)權利要求12或13所述的信息通信終端,其特征在于,與位于所述最短路徑的端部的單詞間的距離越短,所述話題抽出處理模塊 對所述最短路徑上存在的單詞賦予越高的點數(shù)。
16. 根據(jù)權利要求12或13所述的信息通信終端,其特征在于, 所述話題抽出處理才莫塊讀出預先設定的閾值,抽出所述點數(shù)為閾值以上的單詞。
17. 根據(jù)權利要求15或16所述的信息通信終端,其特征在于, 所述話題抽出處理才莫塊讀出預先設定的個數(shù),從所述最短路徑上存在的單詞中抽出所述個數(shù)數(shù)量的、所述點數(shù)為上位的單詞。
18. 根據(jù)權利要求12或13所述的信息通信終端,其特征在于,所述話題抽出處理模塊按照最短路徑的距離計算位于最短路徑的端部的 單詞的評價值,并對所述最短路徑上存在的所述單詞賦予考慮了所述評價值的 點數(shù)。
19. 根據(jù)權利要求18所述的信息通信終端,其特征在于, 所述最短路徑的距離越短,所述話題抽出處理模塊對所述最短距離上存在的單詞賦予越高的點數(shù)。
20. 根據(jù)權利要求18或19所述的信息通信終端,其特征在于,與位于所述最短路徑的端部的單詞間的距離越短,所述話題抽出處理模塊 對所述最短路徑上存在的所述單詞賦予越高的點數(shù)。
21. 根據(jù)權利要求1 20中任意一項所述的信息通信終端,其特征在于, 所述關鍵字抽出模塊使用知識網(wǎng)絡數(shù)據(jù),計算所抽出的單詞間的最短距離數(shù)據(jù),除去表示一定距離以上的最短距離數(shù)據(jù),計算所抽出的單詞間的相關性, 并根據(jù)所述相關性的計算結果抽出所述關鍵字,所述知識網(wǎng)絡數(shù)據(jù)為對于多個 單詞將用距離來表示兩個單詞間的意思上的關系的數(shù)據(jù)集中起來的數(shù)據(jù)。
22. 根據(jù)權利要求21所述的信息通信終端,其特征在于, 所述關鍵字抽出模塊對于抽出的各個單詞,對不同最短距離累積與其他抽出的單詞間的最短距離的出現(xiàn)次數(shù),由此計算所述單詞間的相關性,并抽出最短距離的累積值為設定值以上的單詞來作為所述關鍵字。
23. 根據(jù)權利要求21所述的信息通信終端,其特征在于, 所述關鍵字抽出模塊對于抽出的各個單詞,計算最短距離數(shù)據(jù)的平均距離,從而計算所述單詞間的相關性,并抽出所述平均距離為設定值以下的單詞 來作為所述關鍵字。
24. 根據(jù)權利要求21所述的信息通信終端,其特征在于,所述關鍵字抽出模塊對于抽出的各個單詞,計算所述知識網(wǎng)絡數(shù)據(jù)中所表 示的單詞間的平均距離和最短距離數(shù)據(jù)的平均距離的差,從而計算單詞間的相關性,并抽出所述差為設定值以上的單詞來作為所述關鍵字。
25. 根據(jù)權利要求24所述的信息通信終端,其特征在于,所述關鍵字抽出模塊讀出所述關鍵字,并參照所述知識網(wǎng)絡數(shù)據(jù),由此抽 出離所述關鍵字的距離為設定值以下的相關語。
26. 根據(jù)權利要求25所述的信息通信終端,其特征在于,所述相關語抽出模塊讀出所述相關語的抽出個數(shù)的上限值,抽出與所述上 限值對應的數(shù)量的所述相關語。
27. —種信息通信系統(tǒng),其通過網(wǎng)絡連接了多個信息通信終端,其特征在于,信息通信系統(tǒng)包括語音識別才莫塊,其用于至少識別通過所述網(wǎng)絡發(fā)送的語音信息,并從識別 到的語音信息中確定多個單詞;存儲媒體,其存儲設定了用于抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù);關鍵字抽出模塊,其用于讀出所述關鍵字抽出條件設定數(shù)據(jù),并從所述多 個單詞中抽出多個關鍵字;相關信息取得模塊,其用于取得與所述多個關鍵字相關的相關信息;以及 相關信息輸出模塊,其用于向監(jiān)視器輸出所述相關信息。
28. 根據(jù)權利要求27所述的信息通信系統(tǒng),其特征在于, 所述信息終端具有警告信息取得模塊,該警告信息取得模塊用于讀出存儲在所述記錄媒體中的動作條件設定數(shù)據(jù),在所述關鍵字抽出模塊抽出的所述多 個關鍵字中存在特定的關鍵字時通過網(wǎng)絡取得用于顯示警告的警告信息。
29. 根據(jù)權利要求27所述的信息通信系統(tǒng),其特征在于, 所述信息終端還具有關鍵字抽出委托單元,該關鍵字抽出委托單元讀出存儲在所述記錄媒體中的動作設定條件數(shù)據(jù)以及所述關鍵字抽出條件設定數(shù)據(jù), 并委托通過所述網(wǎng)絡連接的關鍵字抽出服務器抽出所述關鍵字。
30. 根據(jù)權利要求27 29中任意一項所述的信息通信系統(tǒng),其特征在于, 所述關鍵字抽出單元具有異義語意思判斷模塊, 所述異義語意思判斷模塊包括異義語判斷部,其使用知識網(wǎng)絡數(shù)據(jù)判斷從包含通過網(wǎng)絡發(fā)送的所述語音 信息以及文本數(shù)據(jù)中的任意一個的信息中抽出的多個單詞之中是否存在同音 或同寫法異義語,所述知識網(wǎng)絡數(shù)據(jù)為存儲將多個詞匯和詞匯的讀音對應起來的詞匯信息、以及表示詞匯的距離關系的鏈路信息的數(shù)據(jù);以及意思決定部,其用于才艮據(jù)多個單詞間的距離決定判斷為異義語的單詞的意田、
31. 根據(jù)權利要求27~30中任意一項所述的信息通信系統(tǒng),其特征在于, 所述關鍵詞抽出單元具有話題抽出處理模塊,該話題抽出處理模塊用于將從包含通過所述網(wǎng)絡發(fā)送的所述語音信息以及文本數(shù)據(jù)中的任意 一個的信息 之中抽出的所述多個單詞與所述知識網(wǎng)絡數(shù)據(jù)對應起來,對于在所述知識網(wǎng)絡 中的最短路徑上存在的單詞賦予點數(shù),并抽出所述點數(shù)相對高的單詞來作為話 題語。
32. 根據(jù)權利要求27~31中任意一項所述的信息通信系統(tǒng),其特征在于, 所述關鍵字抽出單元使用所述知識網(wǎng)絡數(shù)據(jù)計算抽出的所述多個單詞間的最短距離數(shù)據(jù),除去表示一定距離以上的最短距離數(shù)據(jù),計算抽出的單詞間 的相關性,并根據(jù)所述相關性的計算結果抽出所述關鍵字。
33. —種信息通信方法,該方法用于使用信息通信終端與其他信息通信終 端至少交換語音信息,所述信息通信終端具有語音識別模塊、記錄媒體、關鍵 字抽出模塊、相關信息取得模塊、相關信息輸出模塊以及監(jiān)視器,所述信息通 信方法的特征在于,包括如下步驟所述語音識別模塊從所述語音信息識別多個單詞; 所述記錄媒體存儲包含用于抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù);所述關鍵字抽出模塊從所述存儲媒體中讀出所述關鍵字抽出條件設定數(shù) 據(jù),并從所述多個單詞中抽出多個關鍵字;所述相關信息取得模塊取得與所述多個關鍵字相關聯(lián)的相關信息;以及 所述相關信息輸出模塊向監(jiān)視器輸出所述相關信息。
34. —種信息通信程序,該程序用于使用信息通信終端與其他信息通信終 端至少交換語音信息,所述信息通信終端具有語音識別模塊、記錄媒體、關鍵 字抽出模塊、相關信息取得模塊、相關信息輸出模塊以及監(jiān)視器,所述信息通信程序的特征在于,使計算機執(zhí)行如下一連串的命令 使所述語音識別模塊從所述語音信息識別多個單詞; 使所述記錄媒體存儲包含用于抽出關鍵字的條件的關鍵字抽出條件設定 數(shù)據(jù);使所述關鍵字抽出模塊從所述存儲媒體中讀出所述關鍵字抽出條件設定 數(shù)據(jù),并從所述多個單詞中抽出多個關鍵字;使所述相關信息取得模塊取得與所述多個關鍵字相關聯(lián)的相關信息;以及 使所述相關信息輸出模塊輸出所述相關信息。
35. —種計算機可讀取的記錄媒體,其存儲了用于使用信息通信終端與其 他信息通信終端至少交換語音信息的信息通信程序,所述信息通信終端具有語 音識別模塊、記錄媒體、關鍵字抽出模塊、相關信息取得模塊、相關信息輸出 模塊以及監(jiān)視器,所述記錄媒體的特征在于,記錄有使計算機執(zhí)行如下命令的程序使所述語音識別模塊從語音信息識別多個單詞;使所述記錄媒體存儲包含用于抽出關鍵字的條件的關鍵字抽出條件設定 數(shù)據(jù);使所述關鍵字抽出模塊從所述存儲媒體中讀出所述關鍵字抽出條件設定 數(shù)據(jù),并從所述多個單詞中抽出多個關鍵字;使所述相關信息取得模塊取得與所述多個關鍵字相關聯(lián)的相關信息;以及 使所述相關信息輸出模塊輸出所述相關信息。
全文摘要
本發(fā)明提供一種信息通信終端。信息通信終端(100)包括語音識別模塊(6),其識別語音信息、并從識別到的語音信息確定多個單詞;存儲媒體(20),其存儲設定了用于抽出關鍵字的條件的關鍵字抽出條件設定數(shù)據(jù)(24);關鍵字抽出模塊(8),其讀出關鍵字抽出條件設定數(shù)據(jù)(24),并從多個單詞中抽出多個關鍵字;相關信息取得模塊(11),其取得與多個關鍵字相關的相關信息;相關信息輸出模塊(14),其向監(jiān)視器(2)輸出相關信息。
文檔編號G06F17/30GK101112078SQ20068000365
公開日2008年1月23日 申請日期2006年2月8日 優(yōu)先權日2005年2月8日
發(fā)明者向垣內(nèi)岳彌, 境美樹, 新井克也, 村山隆彥, 橫關大子郎, 西原琢夫, 酒井理江, 高田慎也 申請人:日本電信電話株式會社