專利名稱:信息檢索裝置、信息檢索系統(tǒng)以及信息檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及從數(shù)據(jù)庫(kù)中取出用戶所希望的數(shù)據(jù)的信息檢
索裝置。
背景技術(shù):
在汽車導(dǎo)航裝置中,為了對(duì)在全國(guó)數(shù)量龐大的設(shè)施名、地 名進(jìn)行檢索并設(shè)定目的地,而使用上述那樣的信息檢索界面。在此信 息檢索中,首先經(jīng)由汽車導(dǎo)航裝置的觸摸面板或遙控器,用戶輸入設(shè) 施名的一部分。之后,通過(guò)按壓檢索按鈕而顯示包含用戶所輸入的字 符串的設(shè)施名一覽,并通過(guò)從此一覽中選擇一個(gè)就能夠設(shè)定目的地。
0005但是,由于設(shè)施數(shù)在全國(guó)數(shù)量龐大,所以在用戶所輸入的 設(shè)施名的一部分中,符合條件的設(shè)施名的件數(shù)大多數(shù)量龐大。為此, 即便顯示設(shè)施名一覽,為了查看所有候補(bǔ)也需要滾動(dòng)等操作。因而, 在發(fā)現(xiàn)用戶所希望的設(shè)施前將花費(fèi)時(shí)間。但是,在上述專利文獻(xiàn)l、專利文獻(xiàn)2所列舉的技術(shù)中, 在設(shè)施類型或者內(nèi)容類型的種類很多的情況下,用戶就需要從許多的 類型中選定候補(bǔ),所以有時(shí)候進(jìn)行類型選定對(duì)用戶而言變得很困難。 另外,在用戶不知道作為范圍縮小手段而提示的屬性的情況下,就無(wú) 法進(jìn)行范圍縮小。例如,在想要將"xx郵局"這樣的設(shè)施設(shè)定成目的地 的情況下,關(guān)于此設(shè)施是屬于"金融機(jī)關(guān)"還是屬于"公共機(jī)關(guān)",有時(shí) 通過(guò)用戶的意識(shí)難以區(qū)別,而存在產(chǎn)生混同之類的問(wèn)題。原因是日本 的郵局還具有金融機(jī)關(guān)的功能,另外,在2007年前是國(guó)家來(lái)營(yíng)運(yùn)所 以公共機(jī)關(guān)的含義也很強(qiáng)。這樣,根據(jù)設(shè)施的不同就有其類型對(duì)用戶 而言難懂的設(shè)施。在專利文獻(xiàn)3所列舉的技術(shù)中,提示給用戶的關(guān)鍵字,有 時(shí)候?qū)τ脩舳噪y懂。另外,還有不知道在用戶自身所希望的數(shù)據(jù)之 中是否含有關(guān)鍵字的可能性。另外,在關(guān)鍵字的數(shù)量過(guò)多的情況下, 其將會(huì)在畫(huà)面上顯示許多,所以用戶選定關(guān)鍵字的作業(yè)就有困難。圖2的輸入受理部2獲得來(lái)自輸入部1的輸出,并將所輸 入的結(jié)果保存在輸入內(nèi)容存儲(chǔ)部3中。輸入內(nèi)容存儲(chǔ)部3是例如在存 儲(chǔ)器102上所設(shè)定的存儲(chǔ)區(qū)域。在輸入內(nèi)容存儲(chǔ)部3中,保存從輸入 部l發(fā)送來(lái)的各種各樣的輸入內(nèi)容,但在這里僅說(shuō)明作為本發(fā)明特征 的設(shè)施名存儲(chǔ)部31和屬性詞存儲(chǔ)部32。設(shè)施名存儲(chǔ)部31存儲(chǔ)用戶通 過(guò)五十音圖輸入所輸入的字符串。屬性詞存儲(chǔ)部32存儲(chǔ)用戶所選擇 的屬性詞。設(shè)施名數(shù)據(jù)庫(kù)8保存在汽車導(dǎo)航裝置100中所登錄的設(shè)施 名的各種信息。在圖4a、 4b中表示設(shè)施名的各種信息的保存形態(tài)。 圖4a是表示設(shè)施名數(shù)據(jù)庫(kù)8的設(shè)施名表的說(shuō)明圖,圖4b是表示設(shè)施 名數(shù)據(jù)庫(kù)8的屬性詞表的說(shuō)明圖。圖4a表示構(gòu)成設(shè)施名數(shù)據(jù)庫(kù)8的i殳施名表8a,圖4b表示 構(gòu)成設(shè)施名數(shù)據(jù)庫(kù)8的屬性詞表8b。圖4a的設(shè)施名表8a中所示的 3010是唯一地決定各設(shè)施名的ID編號(hào)。3020是設(shè)施名稱。3030是各 設(shè)施的訓(xùn)讀假名。3040 ~ 3060是各設(shè)施的住所、電話號(hào)碼,綿度經(jīng)度。 3070、 3080是各設(shè)施所屬的類型,大類型表示粗略的設(shè)施類型,小類 型表示更為詳細(xì)的類型。這些大類型/小類型被用于在汽車導(dǎo)航裝置 100上一般所裝備的用類型來(lái)檢索設(shè)施的功能中,并被用于將用戶所 選擇的類型與3070、 3080中的類型一致的設(shè)施名提示給用戶的用途。圖2所示的輸出部9將由提示屬性創(chuàng)建部7所獲得的屬性 詞從顯示裝置104的畫(huà)面或者聲音輸出裝置111的喇叭進(jìn)行輸出。設(shè)施名檢索部6檢索與字符串"MIS ATU"部分一致的設(shè)施 名,取得13件設(shè)施名候補(bǔ)。另外,當(dāng)在屬性詞之中、僅抽取與設(shè)施 名候補(bǔ)的關(guān)聯(lián)度3100大于0的值的屬性詞時(shí),16個(gè)屬性詞被抽取出 來(lái),設(shè)施名候補(bǔ)與屬性詞的關(guān)聯(lián)度3100為圖5所示的值。此外,圖5 表示設(shè)施名檢索部6的檢索結(jié)果,并表示設(shè)施名候補(bǔ)4010、屬性詞 3090以及關(guān)聯(lián)度3100的關(guān)系。設(shè)想提示屬性創(chuàng)建部7從上述16個(gè)屬性詞30卯中選定3 個(gè)屬性詞3090作為范圍縮小屬性。如以下那樣來(lái)定義各記號(hào)。首先在圖6的步驟5010中設(shè)定所顯示的屬性個(gè)數(shù)。在這 里,將預(yù)先所設(shè)定的屬性個(gè)數(shù)(M)設(shè)定成3。圖7a、 7b中表示獨(dú)立度PIND的計(jì)算例。圖7a表示第1實(shí) 施方式,是表示在提示屬性創(chuàng)建部所進(jìn)行的獨(dú)立度PIND的計(jì)算結(jié)果的 一個(gè)例子的說(shuō)明圖,其表示獨(dú)立度較高的例子。圖7b表示第l實(shí)施 方式,是表示在提示屬性創(chuàng)建部所進(jìn)行的獨(dú)立度PmD的計(jì)算結(jié)果的一 個(gè)例子的說(shuō)明圖,其表示獨(dú)立度較低的例子。
圖7a將"購(gòu)物"、"業(yè)余活動(dòng)"、"公共機(jī)關(guān)"三個(gè)組合起來(lái)作為屬 性詞。在此情況下,兩個(gè)以上的屬性詞與同一設(shè)施名持有關(guān)聯(lián)度3100 的僅僅是6010所示的"美佐津市立溫泉療養(yǎng)所(MISATU SILITU ONSENSRYOUYOUJYO)"。另一方面,在圖7b所示的"醫(yī)院"、"牙 科"、"綜合醫(yī)院,,的屬性詞組合中,在13個(gè)i殳施之中6030、 6031所 示的設(shè)施上與多個(gè)屬性詞對(duì)應(yīng)起來(lái)。其結(jié)果,若對(duì)獨(dú)立度進(jìn)行比較則 圖7a的獨(dú)立度(6020)—方就為高于圖7b的獨(dú)立度(6040)的值。用所有的設(shè)施名候補(bǔ)對(duì)其進(jìn)行合計(jì)。此合計(jì)值較大意味著 通過(guò)屬性詞組合大多設(shè)施被覆蓋,通過(guò)選擇屬性詞而從范圍縮小遺漏 的設(shè)施數(shù)較少。用設(shè)施數(shù)對(duì)此合計(jì)值進(jìn)行歸一化,并定義為網(wǎng)羅度 Pexh。式7
乂-i式9
<formula>formula see original document page 25</formula>
0073此關(guān)聯(lián)度的平均值DEAs(aO較高的屬性詞意味著關(guān)聯(lián)度 3100 —般說(shuō)來(lái)較高。關(guān)聯(lián)度3100是表示對(duì)于設(shè)施名的屬性詞的想起 的容易度的值。因而,關(guān)聯(lián)度的平均值DEAs(aO較高的屬性詞對(duì)用戶 而言就易于判斷1個(gè)設(shè)施是否屬于該屬性詞。另一方面,若關(guān)聯(lián)度的平均值DEAs(aj)較低,則表示在用戶選擇所希望的設(shè)施時(shí)選擇該屬性
詞是否為宜對(duì)用戶而言難懂。式10 1 n在
圖10a、 10b中表示理解容易度的計(jì)算例。圖10a表示1
實(shí)施方式,是表示在提示屬性創(chuàng)建部所進(jìn)行的理解容易度PEAS的計(jì)算
結(jié)果的一個(gè)例子的說(shuō)明圖,其表示理解容易度較高的例子。圖10b表
示笫1實(shí)施方式,是表示在提示屬性創(chuàng)建部所進(jìn)行的理解容易度PEAS
的計(jì)算結(jié)果的一個(gè)例子的說(shuō)明圖,其表示理解容易度較低的例子。
圖10a將"超市,,、"業(yè)余活動(dòng),,、"郵局"三個(gè)組合起來(lái)作為屬性詞。 若僅抽取出關(guān)聯(lián)度3100大于0的值并計(jì)算其平均值,則如DEAS(9010) 那樣對(duì)于各屬性詞就為1.0、 0.863、 1.0,均為接近于l的值。另一方 面,圖10b將"汽車"、"住宿設(shè)施"、"公共機(jī)關(guān)"三個(gè)組合起來(lái)作為屬 性詞。在此例子中,較低的關(guān)聯(lián)度3100到處可見(jiàn)。例如在設(shè)施"寵物 旅館美佐津(PETTO HOTERU MISATU )"中,針對(duì)"住宿設(shè)施"的 關(guān)聯(lián)度3100較低為0.4。這表示對(duì)于寵物旅館,是否將其視為住宿設(shè) 施對(duì)用戶而言難以判斷。若反映這種情況,僅抽取關(guān)聯(lián)度3100大于0 的值并計(jì)算其平均值(卯30),則對(duì)于各屬性詞就為0.875、 0.6、 0.575, 與圖10a相比為豐支低的值。進(jìn)而,若計(jì)算理解容易度,則圖10a的值(9020)高于圖10b 的值(9040)。其結(jié)果,通過(guò)選定理解容易度較高的屬性詞組合,就能 夠選定對(duì)用戶而言更易于區(qū)別的屬性詞組合。
26
<第2實(shí)施方式>(詞素)對(duì)本發(fā)明的第2實(shí)施方式進(jìn)行說(shuō)明。在本實(shí)施方式中,采用對(duì)設(shè) 施名進(jìn)行了分割的詞素作為第1實(shí)施例中的屬性詞。
(設(shè)施名-詞素間的數(shù)據(jù)的保持方式/靜態(tài)表) 圖17表示第2實(shí)施方式,是表示設(shè)施名、詞素(屬性詞)以及關(guān) 聯(lián)度的關(guān)系的說(shuō)明圖。在圖17中,表示對(duì)與上述第1實(shí)施方式的圖4 所記栽的設(shè)施名3020有關(guān)的詞素的關(guān)聯(lián)度進(jìn)行了定義的表。圖中 16020是詞素一覽。圖中16030表示各設(shè)施名16010與各詞素之間的 關(guān)聯(lián)度。作為此關(guān)聯(lián)度16030的決定方法,在設(shè)施名之中包含有詞素 的情況下設(shè)為1,在不包含的情況下設(shè)為0為最單純的方法。但是, 在此圖中賦予從0到1的連續(xù)值。在設(shè)施名之中包含該詞素越是被更 多的用戶所想起則此值賦予越大的值。
例如,對(duì)于設(shè)施"美佐津市立醫(yī)院",在名稱中含有"醫(yī)院" 為全體用戶所知。反映這一點(diǎn),關(guān)聯(lián)度16030賦予最大的1。另一方 面,對(duì)于設(shè)施"東西DENDEN游樂(lè)園(TOZAI DENDEN RANDDO )", 假設(shè)1成的用戶認(rèn)為"東西(TOZAI)"不存在于名稱中,而認(rèn)為是 "DENDEN游樂(lè)園(DENDEN RANDDO ),,等。即,知道在i殳施名中 存在"東西(TOZAI)"的為9成。反映這一點(diǎn),關(guān)聯(lián)度16030賦予 0.9。
將要實(shí)施的汽車導(dǎo)航裝置100與圖2相同。關(guān)于此圖2, 由于在第1實(shí)施方式已進(jìn)行過(guò)說(shuō)明,所以在這里省略說(shuō)明。
用戶從顯示裝置104的畫(huà)面上所顯示的五十音圖,通過(guò)觸 摸面板輸入字符串"TOZAI DE"。此字符串通過(guò)上述第1實(shí)施方式的 圖3所示的輸入部1、輸入受理部2的動(dòng)作,被保存在輸入內(nèi)容存儲(chǔ) 部3之中的設(shè)施名存儲(chǔ)部31。此外,由于屬性詞尚未特別進(jìn)行選擇, 所以屬性詞存儲(chǔ)部32為空。
設(shè)施名檢索部6對(duì)所輸入的字符串"TOZAI DE"與設(shè)施名 數(shù)據(jù)庫(kù)8中所保存的設(shè)施名的訓(xùn)讀假名進(jìn)行比較,以檢索設(shè)施名部分 一致的設(shè)施名。
圖19表示第2實(shí)施方式,是對(duì)于設(shè)施名候補(bǔ)從針對(duì)各詞 素組合的得分高的起按順序進(jìn)行了排列的說(shuō)明圖。圖19是對(duì)于圖18 的設(shè)施名候補(bǔ),進(jìn)行針對(duì)各詞素組合的得分計(jì)算,并從得分高的起按 順序進(jìn)行了排列的圖。此外,加權(quán)系數(shù)按照18020所示的值進(jìn)行計(jì)算。得分最高的詞素 組合為18010所示的"出島(DEJIMA),,、"電力(DENRYOKU),,、 "設(shè)計(jì)(SEKKEI)"。因而,提示屬性創(chuàng)建部7將這3個(gè)詞素輸出到 輸出部9。
據(jù)此,輸出部9進(jìn)行顯示裝置104畫(huà)面上的顯示的更新、 和聲音引導(dǎo)的輸出。圖22a表示第2實(shí)施方式,是在汽車導(dǎo)航裝置的 顯示裝置上所輸出的屬性詞的畫(huà)面示意圖,其表示屬性詞經(jīng)過(guò)更新的 狀態(tài)。圖22b表示第2實(shí)施方式,是在汽車導(dǎo)航裝置的顯示裝置上所 輸出的屬性詞的畫(huà)面示意圖,其表示設(shè)施名候補(bǔ)一覽顯示的例子。在 圖22a中表示經(jīng)過(guò)更新的顯示裝置104的畫(huà)面。在顯示區(qū)域2040上 顯示被選定的屬性詞即"療養(yǎng)所 (HOYOUJYO)"、"醫(yī)院 (BYOUYIN),,、"銀行(GINKOU),,,并且還顯示設(shè)施數(shù)。另夕卜, 如顯示區(qū)域21020所示的那樣,還可以顯示用戶已經(jīng)選定的詞素。
另外,在用戶從圖20畫(huà)面繼續(xù)輸入了設(shè)施名的情況下(例 如,輸入了"N,,的情況下),每次就變更用于范圍縮小而顯示的詞素。 由于此方法在第1實(shí)施方式中也進(jìn)行了說(shuō)明故省略。
(其他屬性的關(guān)聯(lián)度的計(jì)算)步驟22045檢索與上述步驟22040所取出的m個(gè)屬性詞組合不 符合的設(shè)施,并對(duì)此設(shè)施賦予與其他屬性的關(guān)聯(lián)度。
式22
<formula>formula see original document page 41</formula>l在步驟22100、 22110中,在得分計(jì)算的結(jié)果為通過(guò)迄今 為止的計(jì)算超過(guò)最大得分的情況下,更新最大得分,且作為將要提示的屬性詞組合而保存的屬性詞組合也進(jìn)行更新。
0185步驟22120是循環(huán)終點(diǎn)。對(duì)于所有的屬性詞組合計(jì)算得分 S,并反復(fù)22040 ~ 22110的處理直到成為最大得分的屬性詞組合^皮求 得。(選擇了范圍縮小屬性的情況)
對(duì)如果用戶選擇了"其他"的情況下(即,按下圖30的按鈕29020 情況下)的處理進(jìn)行說(shuō)明。
0192j此按下由輸入部1進(jìn)行受理,并通過(guò)輸入受理部2在屬性 詞存儲(chǔ)部32中保存"其他"。<第4實(shí)施方式>
("其他"使用、未使用的選定)
就第4實(shí)施方式進(jìn)行說(shuō)明。本實(shí)施方式是并用上述第1實(shí)施方式 中所說(shuō)明的屬性詞的選定、和上述第3實(shí)施方式中所說(shuō)明的采用了其 他屬性的屬性詞的選定,并對(duì)兩者之中哪個(gè)得分較高進(jìn)行評(píng)價(jià),來(lái)選 定將要顯示的屬性詞的實(shí)施方式。由于此實(shí)施方式能夠作為在第1實(shí)施方式所說(shuō)明的汽車導(dǎo) 航裝置100中,變更提示屬性創(chuàng)建部7的處理,又追加了設(shè)施名數(shù)據(jù) 庫(kù)8的數(shù)據(jù)的形式來(lái)進(jìn)行說(shuō)明,所以省略除此以外的部分的說(shuō)明。在圖32中表示屬性的種類與屬性詞的對(duì)應(yīng)表。圖32表示第4實(shí)施方式,是表示屬性集與屬性詞之關(guān)系的說(shuō)明圖。在這里,作 為屬性的種類使用屬性集這樣的呼稱(31010)。將與各個(gè)屬性集31010 相對(duì)應(yīng)的屬性詞登錄在31020中。在這里作為一個(gè)例子,設(shè)有與i殳施 的類型相關(guān)聯(lián)的屬性集31010即"genre"、和設(shè)施名的詞素的屬性集 31010即"morpheme"兩個(gè)種類。此對(duì)應(yīng)表與屬性詞一起被保存在i殳施 名數(shù)據(jù)庫(kù)8中。此外,在相互的屬性集中也有可能包含同一屬性詞, 所以實(shí)際上是以能夠用ID編號(hào)等作為唯一的屬性詞而識(shí)別的方式進(jìn) 行管理。在步驟32030中對(duì)兩方的得分進(jìn)行比較。此外,由于預(yù)想在這里所述的步驟32010、 32020的得分 計(jì)算中,得分的大小相互不同,所以還可以對(duì)在得分計(jì)算之際將使用 的加權(quán)系數(shù)預(yù)先以適合的方式進(jìn)行調(diào)整。圖34表示第6實(shí)施方式,是表示汽車導(dǎo)航裝置100的功 能要素的框圖。此汽車導(dǎo)航裝置100是從第1實(shí)施方式中的汽車導(dǎo)航 裝置100的構(gòu)成即圖2追加了已確定設(shè)施名存儲(chǔ)部5、關(guān)聯(lián)度更新部 10的形態(tài)。接著,關(guān)聯(lián)度更新部10基于已確定設(shè)施名存儲(chǔ)部5中所 保存的內(nèi)容,更新設(shè)施名數(shù)據(jù)庫(kù)8中所存儲(chǔ)的關(guān)聯(lián)度。在圖36中表 示此更新的方法。圖36表示第6實(shí)施方式,是表示針對(duì)設(shè)施名和屬 性詞的關(guān)聯(lián)度的更新的一個(gè)例子的說(shuō)明圖。首先,關(guān)聯(lián)度更新部10對(duì)于已確定設(shè)施名抽取纟皮賦予關(guān) 聯(lián)度的屬性詞。其中,用戶所選擇的屬性詞根據(jù)從實(shí)際上被用戶所選 擇而推測(cè)為用戶自身感到與設(shè)施的關(guān)聯(lián)更高的屬性詞。因而,將已確 定設(shè)施與屬性詞間的關(guān)聯(lián)度加大。另一方面,用戶未選擇的屬性詞被
推測(cè)為用戶自身感到與設(shè)施的關(guān)聯(lián)較低的屬性詞。因而,將已確定設(shè) 施與屬性詞間的關(guān)聯(lián)度減小。<笫6實(shí)施方式的變形例>
(對(duì)用戶經(jīng)常去往的設(shè)施的關(guān)聯(lián)度進(jìn)行加法運(yùn)算)
另外,關(guān)于關(guān)聯(lián)度的更新方法,還有基于用戶在某期間實(shí)際去過(guò) 的設(shè)施的選擇頻率來(lái)更新的方法。根據(jù)這一結(jié)果,可知用戶經(jīng)常去往與表示在上位的屬性詞 即"汽車,,或"業(yè)余活動(dòng),,相關(guān)聯(lián)的設(shè)施。因而,被預(yù)測(cè)通過(guò)與這些經(jīng)常 去往的設(shè)施相關(guān)聯(lián)的屬性詞優(yōu)先作為范圍縮小屬性詞(attribute wordof narrowing)進(jìn)行提示,用戶的使用便利性將會(huì)改善。利用此計(jì)算出的加法值,對(duì)設(shè)施名數(shù)據(jù)庫(kù)8中所保存的關(guān) 聯(lián)度進(jìn)行加法運(yùn)算。 [0244式28
V(/,+ (if>(/,")>0) r(/, (3) (otherwise)即,在原本被設(shè)定于數(shù)據(jù)庫(kù)8的關(guān)聯(lián)度之中、僅以值大于 0的關(guān)聯(lián)度為對(duì)象對(duì)加法值e(a)進(jìn)行加法運(yùn)算。使用這樣所計(jì)算出的 re(L,a),提示屬性創(chuàng)建部7來(lái)進(jìn)行提示給用戶的屬性詞的選定。圖43a表示第9實(shí)施方式,是表示利用詞素的屬性詞的提示情形的說(shuō)明圖,表示被抽取出的設(shè)施名候補(bǔ)。圖43b表示詞素對(duì)應(yīng)于"出島(DEJIMA),,的設(shè)施名候補(bǔ)。圖43c表示詞素對(duì)應(yīng)于"Denden"的設(shè)施名候補(bǔ)。
作為以下說(shuō)明的前提,設(shè)用戶通過(guò)字符輸入輸入"TozaiDe",并作為設(shè)施名候補(bǔ)列舉出圖43(a)所示的18件為設(shè)施名的候補(bǔ)。進(jìn)而,進(jìn)行從這設(shè)施名的候補(bǔ)選擇兩個(gè)詞素作為范圍縮小屬性詞的處理,在"出島(DEJIMA) "、 "Denden"這兩個(gè)詞素的組合中,得分為最大。
0264在此情況下,在上述第2實(shí)施方式中,"出島"、"Denden"這兩個(gè)詞素在畫(huà)面上作為范圍縮小屬性而得以提示。但是,在如上述那樣的短詞素中,用戶有可能無(wú)法認(rèn)識(shí)到該詞素被包含在設(shè)施名中。因而,將較長(zhǎng)的字符串作為范圍縮小屬性詞進(jìn)行提示,就有可能防止詞素沒(méi)有被用戶認(rèn)識(shí)到這樣的事態(tài)。分析部46020將用戶所發(fā)話的聲音數(shù)據(jù)變換成特征向量串。特征向量串是用多維向量量來(lái)表示聲音的各時(shí)刻的特征量,并按時(shí)序?qū)ζ溥M(jìn)行了排列。例如,使用每10ms程度對(duì)輸入聲音數(shù)據(jù)進(jìn)行分割,將各時(shí)刻的聲音數(shù)據(jù)變換成被稱為MFCC(Mel Fr叫uencyCepstrum Coefficient)參量(特征參量)的多維向量量,并按時(shí)序?qū)ζ溥M(jìn)
行了排列的特征向量串。在音響模塊存儲(chǔ)部46030中保存與從特征參量所抽取出的各音素(phoneme)相對(duì)應(yīng)的模塊。作為此模塊的表現(xiàn)形態(tài)使用以3狀態(tài)對(duì)各音素進(jìn)行了定義的HMM(Hidden Marcov Model)。聲音識(shí)別部46050對(duì)輸入聲音的特征向量串與語(yǔ)言才莫塊中所存儲(chǔ)的單詞串進(jìn)行比較,計(jì)算表示其一致程度的計(jì)分(score),并輸出計(jì)分較高的單詞串。在這里,還可以僅僅輸出計(jì)分最高的單詞串,也可以輸出計(jì)分較高的上位多個(gè)單詞串。單詞串輸出部46060從由聲音識(shí)別部所獲得的單詞串中選定發(fā)送給輸入部1的單詞串。在這里,設(shè)在由聲音識(shí)別部所獲得的單詞串之中,基于計(jì)分計(jì)算可靠度,僅僅輸出可靠度較高的單詞串。
0285以后的處理與上述笫1~第10實(shí)施方式中的處理一樣。即,設(shè)施名檢索部6創(chuàng)建與從單詞串輸出部所輸入的單詞串 一致的設(shè)施名一覽。提示屬性創(chuàng)建部按照各實(shí)施方式中的方法,創(chuàng)建提示給用戶的范圍縮小屬性詞組合。輸出部9將屬性詞組合輸出到畫(huà)面上。另外,輸出部9還可以通過(guò)喇叭來(lái)提示屬性詞,并發(fā)出"從OO、 xx、 △△之中的某一項(xiàng)進(jìn)行范圍縮小"之類的聲音引導(dǎo)。用戶既可以接受聲音引導(dǎo)用觸摸面板來(lái)指定屬性詞,又可以用聲音來(lái)指定屬性詞。在用聲音指定屬性詞的情況下,單詞串輸出部46060將#4居用戶發(fā)話所識(shí)別出的屬性詞對(duì)輸入部1進(jìn)行輸出,并進(jìn)行遵循各實(shí)施方式的方法的范圍縮小的處理。
[0287但是,有利用聲音進(jìn)行輸入的情況、所輸入的單詞串為多個(gè)的情況、及存在多個(gè)單詞串候補(bǔ)的情況。以下,就這一情況進(jìn)行說(shuō)明。例如,考慮用戶發(fā)話"東西DENDEN游樂(lè)園(TOZAIDENDENRANDDO),,,聲音識(shí)別處理的結(jié)果是僅僅將可靠度較高的"東西(TOZAI) /游樂(lè)園(RANDDO),,這兩個(gè)單詞從單詞串輸出部46060發(fā)送到輸入部l的情況。此時(shí),在設(shè)施名檢索部6中,通過(guò)檢索具有"東西(TOZAI)"、"游樂(lè)園(RANDDO)"這兩個(gè)詞素的設(shè)施名,并獲得一覽的方法就能夠?qū)崿F(xiàn)。另夕卜,設(shè)用戶發(fā)話"東西DENDEN游樂(lè)園(TOZAI DENDEN RANDDO),,,聲音識(shí)別處理的結(jié)果是獲得可靠度較高的"東海(TOKAI)/游樂(lè)園(RANDDO )"、"東西(TOZAI)/游樂(lè)園(RANDDO)"這樣的各由兩個(gè)單詞組成的兩個(gè)單詞串??紤]從單詞串輸出部46060對(duì)輸入部l發(fā)送這兩個(gè)單詞串的情況。此時(shí),在設(shè)施名檢索部6中,通過(guò)檢索具有"東西(TOZAI)"、"游樂(lè)園(RANDDO)"這兩個(gè)詞素的設(shè)施名、和具有"東海(TOKAI)"、"游樂(lè)園(RANDDO)"這兩個(gè)詞素的設(shè)施名雙方,并獲得一覽的方法就能夠?qū)崿F(xiàn)。
[0288另外,由于單詞串輸出部46060輸出的單詞串^皮分成詞素單位,所以與圖17所記載的各設(shè)施名l6010所關(guān)聯(lián)起來(lái)的詞素中的某一項(xiàng)相一致。因而,例如單詞串輸出部46060還一并輸入識(shí)別單詞串和表示各識(shí)別單詞的可靠性的可靠度(confidence measure),從圖17中記載的表中尋找與識(shí)別單詞一致的詞素,并將該詞素與設(shè)施名的關(guān)聯(lián)度、和識(shí)別單詞的可靠度相乘,對(duì)于1個(gè)設(shè)施名取得其之和,由此就能夠計(jì)算各設(shè)施名的可靠度,通過(guò)這一方法還可以帶可靠度獲得設(shè)施名的一覽。
[0289如以上所說(shuō)明那樣,通過(guò)進(jìn)行聲音輸入就能夠受理用戶的多種多樣的輸入,能夠更加提高使用方便性。工業(yè)上的可利用性
[0290如以上那樣,本發(fā)明能夠適用于用字符信息來(lái)進(jìn)行檢索的汽車導(dǎo)航裝置及數(shù)據(jù)庫(kù)系統(tǒng)。
權(quán)利要求
1. 一種信息檢索裝置,其特征在于包括輸入部,輸入字符;數(shù)據(jù)庫(kù),保存名稱、與該名稱相關(guān)聯(lián)的屬性詞以及表示上述名稱與屬性詞的關(guān)聯(lián)程度的關(guān)聯(lián)度;名稱檢索部,從數(shù)據(jù)庫(kù)中檢索包含上述所輸入的字符的名稱,并將上述檢索到的名稱作為名稱候補(bǔ)而輸出;提示屬性創(chuàng)建部,從上述數(shù)據(jù)庫(kù)中抽取與從上述名稱檢索部所輸出的上述名稱候補(bǔ)相關(guān)聯(lián)的屬性詞;以及輸出部,提示上述提示屬性創(chuàng)建部所抽取出的屬性詞、和來(lái)自上述名稱檢索部的名稱候補(bǔ),其中,上述提示屬性創(chuàng)建部具有第一得分計(jì)算部,其進(jìn)行如下處理對(duì)于上述所抽取出的屬性詞組合,從上述數(shù)據(jù)庫(kù)中取得與該屬性詞關(guān)聯(lián)起來(lái)的上述名稱候補(bǔ)的上述關(guān)聯(lián)度;運(yùn)算表示上述所抽取出的屬性詞間的差異程度的獨(dú)立度;運(yùn)算表示根據(jù)上述所抽取出的屬性詞組合的名稱候補(bǔ)的網(wǎng)羅性的網(wǎng)羅度,對(duì)每個(gè)上述屬性詞運(yùn)算表示相關(guān)聯(lián)的名稱候補(bǔ)的件數(shù)的均勻性的均勻度;以及基于上述運(yùn)算出的獨(dú)立度、網(wǎng)羅度和均勻度之中至少一個(gè)來(lái)計(jì)算屬性詞組合的得分,并且,按照上述得分高的順序?qū)⑸鲜鰧傩栽~組合輸出到上述輸出部。
2. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于 上述數(shù)據(jù)庫(kù)中所保存的屬性詞是構(gòu)成上述名稱候補(bǔ)的名稱之一部分的詞素。
3. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于 上述提示屬性創(chuàng)建部具有第二得分計(jì)算部,其進(jìn)行如下處理 將表示與上述抽取出的屬性詞組合沒(méi)有關(guān)聯(lián)的屬性作為第二屬性詞而生成,并運(yùn)算該第二屬性詞與名稱候補(bǔ)的關(guān)聯(lián)度;基于上述抽取出的屬性詞組合與上述名稱候補(bǔ)的關(guān)聯(lián)度、和上述 笫二屬性詞與上述名稱候補(bǔ)的關(guān)聯(lián)度,來(lái)運(yùn)算表示上述抽取出的屬性 詞間的名稱候補(bǔ)的差異程度的獨(dú)立度;基于上述抽取出的屬性詞組合與上述名稱候補(bǔ)的關(guān)聯(lián)度、和上述 第二屬性詞與上述名稱候補(bǔ)的關(guān)聯(lián)度,來(lái)運(yùn)算表示根據(jù)上述抽取出的 屬性詞組合的名稱候補(bǔ)的網(wǎng)羅性的網(wǎng)羅度;基于上述抽取出的屬性詞組合與上述名稱候補(bǔ)的關(guān)聯(lián)度、和上述 第二屬性詞與上述名稱候補(bǔ)的關(guān)聯(lián)度,來(lái)運(yùn)算表示在上述屬性詞間關(guān) 聯(lián)的名稱候補(bǔ)的件數(shù)的均勻性的均勻度;以及基于上述運(yùn)算出的獨(dú)立度、網(wǎng)羅度和均勻度之中至少一個(gè)來(lái)計(jì)算 上述屬性詞組合的得分,并且,按照上述第二得分計(jì)算部所求出的得分高的順序?qū)⑸鲜鰧?性詞組合輸出到上述輸出部。
4. 按照權(quán)利要求3所述的信息檢索裝置,其特征在于上述提示屬性創(chuàng)建部對(duì)上述笫一得分計(jì)算部所求出的得分、和上 述第二得分計(jì)算部所求出的得分進(jìn)行比較,并將得分較高一方的屬性詞組合輸出到上述輸出部。
5. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于上述數(shù)據(jù)庫(kù)中所存儲(chǔ)的屬性詞依照屬性詞的種類而進(jìn)行分類, 上述提示屬性創(chuàng)建部按上述屬性詞的每個(gè)種類來(lái)計(jì)算對(duì)于上述 屬性詞組合的得分,并將最大得分的屬性詞組合輸出到輸出部。
6. 按照權(quán)利要求1所述的信息檢索裝置,其特征在于還包括 第二輸入部,選擇被輸出到上述輸出部的上述名稱候補(bǔ)和屬性詞;已確定名稱存儲(chǔ)部,存儲(chǔ)上述第二輸入部所選擇的名稱候補(bǔ)與屬 性詞、和上述第二輸入部未選擇的屬性詞;以及關(guān)聯(lián)度更新部,基于上述已確定名稱存儲(chǔ)部中所存儲(chǔ)的名稱候補(bǔ) 與屬性詞來(lái)更新上述數(shù)據(jù)庫(kù)中所保存的關(guān)聯(lián)度,上述關(guān)聯(lián)度更新部,將上述已確定名稱存儲(chǔ)部中所存儲(chǔ)的名稱候 補(bǔ)與屬性詞之中、上述第二輸入部所選擇的名稱候補(bǔ)的名稱與屬性詞 的關(guān)聯(lián)度增大,將上述第二輸入部未選擇的屬性詞與名稱候補(bǔ)的名稱 的關(guān)聯(lián)度減少,并更新上述數(shù)據(jù)庫(kù)中所保存的上述關(guān)聯(lián)度的值。
7. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于 上述數(shù)據(jù)庫(kù)具有對(duì)上述名稱的每一個(gè)、或者將多個(gè)名稱匯總后分類的群賦予了數(shù)值的表,上述提示屬性創(chuàng)建部使用與上述名稱候補(bǔ)對(duì)應(yīng)的關(guān)聯(lián)度乘以上 述數(shù)值后的值作為新的關(guān)聯(lián)度。
8. 按照權(quán)利要求1所述的信息檢索裝置,其特征在于還包括 通信部,接收上述關(guān)聯(lián)度,用上述接收到的關(guān)聯(lián)度來(lái)更新上述數(shù)據(jù)庫(kù)中所保存的關(guān)聯(lián)度。
9. 按照權(quán)利要求2所述的信息檢索裝置,其特征在于 上述提示屬性創(chuàng)建部,計(jì)算上述得分較高的屬性詞,用上述屬性詞前后的字符串來(lái)檢索上述名稱候補(bǔ),用上述名稱候補(bǔ)生成上述屬性詞更長(zhǎng)地一致的字符串, 將上述所生成的字符串作為屬性詞輸出到輸出部。
10. 按照權(quán)利要求2所述的信息檢索裝置,其特征在于上述數(shù)據(jù)庫(kù)中所保存的屬性詞包含并保持上述名稱之一部分即 詞素、和上述名稱中的上述詞素的位置信息。
11. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于包括 聲音取入部,取得聲音信號(hào);以及聲音識(shí)別部,輸出從上述取得的聲音信號(hào)識(shí)別出的詞匯, 將從上述聲音識(shí)別部所輸出的上述詞匯輸入到上述輸入部。
12. 按照權(quán)利要求1所述的信息檢索裝置,其特征在于 上述提示屬性創(chuàng)建部,計(jì)算表示基于上述屬性詞組合的關(guān)聯(lián)度綜合性高的理解容易度,基于上述運(yùn)算出的獨(dú)立度、網(wǎng)羅度、均勻度和理解容易度之中至 少一個(gè)來(lái)計(jì)算屬性詞組合的得分。
13. 按照權(quán)利要求12所述的信息檢索裝置,其特征在于 上述理解容易度是表示上述屬性詞與上述名稱的對(duì)應(yīng)關(guān)系的易懂性的指標(biāo)。
14. 按照權(quán)利要求1所述的信息檢索裝置,其特征在于上述獨(dú)立度是表示上述抽取出的屬性詞彼此間屬性詞差異的指標(biāo)o
15. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于上述網(wǎng)羅度是表示通過(guò)上述抽取出的屬性詞組合,在上述名稱候 補(bǔ)之中何等程度的比例可以選擇的指標(biāo)。
16. 按照權(quán)利要求l所述的信息檢索裝置,其特征在于 上述均勻度是表示與上述抽取出的屬性詞對(duì)應(yīng)的名稱候補(bǔ)數(shù)的均勻程度的指標(biāo)。
17. —種信息檢索系統(tǒng),包括信息檢索裝置,從數(shù)據(jù)庫(kù)中檢索包含所輸入的字符的名稱;和服務(wù)器,經(jīng)由網(wǎng)絡(luò)而連接到上述信息檢索裝置上,所述信息檢索系統(tǒng)的特征在于上述信息檢索裝置具備輸入部,輸入字符;數(shù)據(jù)庫(kù),保存上述名稱、與該名稱相關(guān)聯(lián)的屬性詞以及表示上述 名稱與屬性詞的關(guān)聯(lián)程度的關(guān)聯(lián)度;名稱檢索部,從數(shù)據(jù)庫(kù)中檢索包含上述所輸入的字符的名稱,并 將上述檢索到的名稱作為名稱候補(bǔ)而輸出;提示屬性創(chuàng)建部,從上述數(shù)據(jù)庫(kù)中抽取與從上述名稱檢索部所輸 出的上述名稱候補(bǔ)相關(guān)聯(lián)的屬性詞;輸出部,提示上述提示屬性創(chuàng)建部所抽取出的屬性詞、和來(lái)自上 述名稱檢索部的名稱候補(bǔ);通信部,與上述服務(wù)器進(jìn)行通信,以及關(guān)聯(lián)度更新部,利用從上述服務(wù)器接收到的關(guān)聯(lián)度來(lái)更新上述數(shù) 據(jù)庫(kù)中所保存的關(guān)聯(lián)度,其中,上述提示屬性創(chuàng)建部具有第一得分計(jì)算部,其進(jìn)行如下處理對(duì)于上述所抽取出的屬性詞組合,從上述數(shù)據(jù)庫(kù)中取得與該屬性詞關(guān)聯(lián)起來(lái)的上述名稱候補(bǔ)的上述關(guān)聯(lián)度;運(yùn)算表示上述所抽取出的屬性詞間的差異程度的獨(dú)立度; 運(yùn)算表示根據(jù)上述所抽取出的屬性詞組合的名稱候補(bǔ)的網(wǎng)羅性的網(wǎng)羅度;對(duì)每個(gè)上述屬性詞運(yùn)算表示相關(guān)聯(lián)的名稱候補(bǔ)的件數(shù)的均勻性 的均勻度;以及基于上述運(yùn)算出的獨(dú)立度、網(wǎng)羅度和均勻度之中至少一個(gè)來(lái)計(jì)算 屬性詞組合的得分,并且,按照上述得分高的順序?qū)⑸鲜鰧傩栽~組合輸出到上述輸出部。
18. 按照權(quán)利要求17所述的信息檢索系統(tǒng),其特征在于 上述數(shù)據(jù)庫(kù)中所保存的屬性詞是構(gòu)成上述名稱候補(bǔ)的名稱之一部分的詞素。
19. 一種從數(shù)據(jù)庫(kù)中檢索包含被輸入到計(jì)算機(jī)的字符的名稱的信 息檢索方法,其特征在于包括以下步驟驟,該數(shù)據(jù)庫(kù)保存上述名稱、與該名稱相關(guān)聯(lián)的屬性詞以及表示上述名稱與屬性詞的關(guān)聯(lián)程度的關(guān)聯(lián)度;將上述檢索到的名稱作為名稱候補(bǔ)而輸出的步驟; 從上述數(shù)據(jù)庫(kù)中抽取與上述名稱候補(bǔ)相關(guān)聯(lián)的屬性詞的步驟; 將上述所抽取出的屬性詞和上述名稱候補(bǔ)輸出到上述計(jì)算機(jī)的輸出部的步驟,其中,從上述數(shù)據(jù)庫(kù)中抽取與上述名稱候補(bǔ)相關(guān)聯(lián)的屬性詞的步 驟具有以下步驟對(duì)于上述所抽取出的屬性詞組合,從上述數(shù)據(jù)庫(kù)中取得與該屬性 詞關(guān)聯(lián)起來(lái)的上述名稱候補(bǔ)的上述關(guān)聯(lián)度;運(yùn)算表示上述所抽取出的屬性詞間的差異程度的獨(dú)立度;運(yùn)算表示根據(jù)上述所抽取出的屬性詞組合的名稱候補(bǔ)的網(wǎng)羅性 的網(wǎng)羅度;對(duì)每個(gè)上述屬性詞運(yùn)算表示相關(guān)聯(lián)的名稱候補(bǔ)的件數(shù)的均勻性 的均勻度;基于上述運(yùn)算出的獨(dú)立度、網(wǎng)羅度和均勻度之中至少一個(gè)來(lái)計(jì)算 屬性詞組合的得分;以及按照上述得分高的順序?qū)⑸鲜鰧傩栽~組合輸出至上述輸出部。
20.按照權(quán)利要求19所述的信息檢索方法,其特征在于:上述數(shù)據(jù)庫(kù)中所保存的屬性詞是構(gòu)成上述名稱候補(bǔ)的名稱之一 部分的詞素。
全文摘要
本發(fā)明提供信息檢索裝置、信息檢索系統(tǒng)以及信息檢索方法。本發(fā)明的目的是減低與檢索結(jié)果的范圍縮小有關(guān)的用戶的勞力。為此,計(jì)算機(jī)從數(shù)據(jù)庫(kù)中檢索包含所輸入的字符的名稱,其中該數(shù)據(jù)庫(kù)保存上述名稱、與該名稱相關(guān)聯(lián)的屬性詞以及表示上述名稱與屬性詞的關(guān)聯(lián)程度的關(guān)聯(lián)度;將檢索到的名稱作為名稱候補(bǔ)進(jìn)行輸出;在從數(shù)據(jù)庫(kù)中抽取與名稱候補(bǔ)相關(guān)聯(lián)的屬性詞之際,運(yùn)算表示所抽取出的屬性詞間的差異程度的獨(dú)立度、表示根據(jù)所抽取出的屬性詞組合的名稱候補(bǔ)的網(wǎng)羅性的網(wǎng)羅度、和表示對(duì)每個(gè)屬性詞相關(guān)聯(lián)的名稱候補(bǔ)的件數(shù)的均勻性的均勻度,并基于獨(dú)立度、網(wǎng)羅度和均勻度之中的至少一個(gè)來(lái)計(jì)算屬性詞組合的得分,按照得分高的順序?qū)⑸鲜鰧傩栽~組合輸出至輸出部。
文檔編號(hào)G01C21/36GK101532848SQ200910004359
公開(kāi)日2009年9月16日 申請(qǐng)日期2009年2月12日 優(yōu)先權(quán)日2008年3月11日
發(fā)明者小洼浩明, 本間健, 高橋久 申請(qǐng)人:株式會(huì)社查納位資訊情報(bào)