亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種便攜式同傳設(shè)備的制作方法

文檔序號(hào):12924073閱讀:231來(lái)源:國(guó)知局
本實(shí)用新型屬于同傳翻譯
技術(shù)領(lǐng)域
:,特別是一種便攜式同傳設(shè)備。
背景技術(shù)
::隨著國(guó)人的生活標(biāo)準(zhǔn)和經(jīng)濟(jì)能力的提高,常規(guī)跟團(tuán)游已滿(mǎn)足不了出國(guó)旅行人群希望深度體驗(yàn)當(dāng)?shù)仫L(fēng)土人情,美食購(gòu)物等個(gè)性化需求,各大旅行社如攜程、途牛、同程,驢媽媽相繼推出半自由行、定制游、特色游,自由行等產(chǎn)品。2015年中國(guó)出境游人次達(dá)到1.28億人次,在線自助游份額首次超過(guò)跟團(tuán)游,達(dá)51.4%。語(yǔ)言不通和文化差異是影響旅途體驗(yàn)和成交率主要因素之一,在海關(guān)過(guò)境,問(wèn)路,找洗手間,當(dāng)?shù)卮蜍?chē),餐廳點(diǎn)菜,商場(chǎng)購(gòu)物,入駐酒店或遇到護(hù)照丟失等緊急狀況等各種情況帶來(lái)種種不便,也限制著跟當(dāng)?shù)厝说幕?dòng)交流和感受異國(guó)文化的體驗(yàn)。近年來(lái),市場(chǎng)上出現(xiàn)了各種翻譯工具,如以機(jī)器翻譯為主的百度翻譯、谷歌翻譯、有道翻譯官和以真人傳譯為主的小尾巴翻譯官,思兔寶等應(yīng)用程序(APP),都希望通過(guò)互聯(lián)網(wǎng)共享經(jīng)濟(jì)模式和技術(shù),讓出境游不再因?yàn)檎Z(yǔ)言問(wèn)題而困擾。然而,這些工具成本高,一般只有涉外商旅人群能夠接受,無(wú)法滿(mǎn)足休閑和探親等旅游市場(chǎng)的需求。為了滿(mǎn)足大眾化消費(fèi)者對(duì)境外翻譯的需求,需要同時(shí)解決準(zhǔn)確度,規(guī)?;杀镜认嗷ブ萍s因素帶來(lái)的限制。技術(shù)實(shí)現(xiàn)要素:本實(shí)用新型實(shí)施方式提出一種便攜式同傳設(shè)備,從而降低成本。本實(shí)用新型的技術(shù)方案包括:一種便攜式同傳設(shè)備,包括:語(yǔ)言設(shè)置單元,用于設(shè)置源語(yǔ)言類(lèi)型和目標(biāo)語(yǔ)言類(lèi)型;語(yǔ)音采集單元,用于采集待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù);通信單元,用于將所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)和所述目標(biāo)語(yǔ)言類(lèi)型傳輸?shù)皆贫?,并從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端文本翻譯數(shù)據(jù),或從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端語(yǔ)音翻譯數(shù)據(jù);呈現(xiàn)單元,用于展示所述云端文本翻譯數(shù)據(jù),或播放所述云端語(yǔ)音翻譯數(shù)據(jù)。在一個(gè)實(shí)施方式中,還包括:本地翻譯單元,用于當(dāng)判定通信單元與云端之間無(wú)通信連接時(shí),將所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)識(shí)別為文本,將所述文本翻譯成符合目標(biāo)語(yǔ)言類(lèi)型的本地端文本翻譯數(shù)據(jù),并將所述本地端文本翻譯數(shù)據(jù)語(yǔ)音合成為本地端語(yǔ)音翻譯數(shù)據(jù);其中所述呈現(xiàn)單元,還用于展示所述本地端文本翻譯數(shù)據(jù),或播放所述本地端語(yǔ)音翻譯數(shù)據(jù)。在一個(gè)實(shí)施方式中,還包括:緩存,用于保存所述云端文本翻譯數(shù)據(jù)、所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)、所述云端語(yǔ)音翻譯數(shù)據(jù)、所述本地端文本翻譯數(shù)據(jù)、所述本地端語(yǔ)音翻譯數(shù)據(jù)和符合所述目標(biāo)語(yǔ)言類(lèi)型的常用語(yǔ)音數(shù)據(jù)。在一個(gè)實(shí)施方式中,還包括:顯示屏,用于顯示下列信息中的至少一個(gè):目標(biāo)語(yǔ)言類(lèi)型;網(wǎng)絡(luò)狀態(tài);電源剩余電量。在一個(gè)實(shí)施方式中,還包括:無(wú)線網(wǎng)絡(luò)接入單元,用于提供無(wú)線網(wǎng)絡(luò)接入業(yè)務(wù)。在一個(gè)實(shí)施方式中,通信單元,還用于從其他的便攜式同傳設(shè)備接收語(yǔ)音通知數(shù)據(jù)或文本通知數(shù)據(jù);呈現(xiàn)單元,還用于展示所述文本通知數(shù)據(jù),或播放所述語(yǔ)音通知數(shù)據(jù)。在一個(gè)實(shí)施方式中,還包括:地理位置信息獲取單元,用于獲取所述便攜式同傳設(shè)備的地理位置信息;其中所述呈現(xiàn)單元,還用于當(dāng)所述便攜式同傳設(shè)備的地理位置信息符合預(yù)定的報(bào)警條件時(shí),播放預(yù)存儲(chǔ)的語(yǔ)音報(bào)警數(shù)據(jù)。在一個(gè)實(shí)施方式中,通信單元,還用于將所述便攜式同傳設(shè)備的地理位置信息上傳到云端;所述便攜式同傳設(shè)備還包括:人工連線單元,用于在被觸發(fā)后向云端發(fā)出語(yǔ)音呼叫,并與云端基于所述地理位置信息分配的人工座席建立語(yǔ)音通信。在一個(gè)實(shí)施方式中,所述語(yǔ)音播放單元,還用于當(dāng)所述便攜式同傳設(shè)備的地理位置信息符合預(yù)定的內(nèi)容播放條件時(shí),播放預(yù)存儲(chǔ)的文本或語(yǔ)音內(nèi)容數(shù)據(jù)。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備為便攜式麥克風(fēng)。從上述技術(shù)方案可以看出,語(yǔ)言設(shè)置單元,用于設(shè)置源語(yǔ)言類(lèi)型和目標(biāo)語(yǔ)言類(lèi)型;語(yǔ)音采集單元,用于采集待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù);通信單元,用于將所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)和所述目標(biāo)語(yǔ)言類(lèi)型傳輸?shù)皆贫?,并從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端文本翻譯數(shù)據(jù),或從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端語(yǔ)音翻譯數(shù)據(jù);呈現(xiàn)單元,用于展示所述云端文本翻譯數(shù)據(jù),或播放所述云端語(yǔ)音翻譯數(shù)據(jù)。因此,通過(guò)便攜式的同傳設(shè)備可以實(shí)現(xiàn)語(yǔ)音翻譯,可以顯著降低成本。而且,便攜式同傳設(shè)備中還可以包含無(wú)線網(wǎng)絡(luò)接入單元,便于用戶(hù)上網(wǎng)。而且,便攜式同傳設(shè)備還可以接收各種信息,并且可以監(jiān)控位置。在不能聯(lián)網(wǎng)的情況下,便攜式同傳設(shè)備仍然可以提供預(yù)存的常用語(yǔ)音數(shù)據(jù),從而便于用戶(hù)使用。附圖說(shuō)明圖1為根據(jù)本實(shí)用新型便攜式同傳設(shè)備的功能模塊圖。圖2為根據(jù)本實(shí)用新型的便攜式同傳設(shè)備的結(jié)構(gòu)圖。圖3為本實(shí)用新型的便攜式同傳系統(tǒng)結(jié)構(gòu)圖。具體實(shí)施方式為使本實(shí)用新型的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對(duì)本實(shí)用新型作進(jìn)一步的詳細(xì)描述。為了描述上的簡(jiǎn)潔和直觀,下文通過(guò)描述若干代表性的實(shí)施方式來(lái)對(duì)本實(shí)用新型的方案進(jìn)行闡述。實(shí)施方式中大量的細(xì)節(jié)僅用于幫助理解本實(shí)用新型的方案。但是很明顯,本實(shí)用新型的技術(shù)方案實(shí)現(xiàn)時(shí)可以不局限于這些細(xì)節(jié)。為了避免不必要地模糊了本實(shí)用新型的方案,一些實(shí)施方式?jīng)]有進(jìn)行細(xì)致地描述,而是僅給出了框架。下文中,“包括”是指“包括但不限于”,“根據(jù)......”是指“至少根據(jù)......,但不限于僅根據(jù)......”。由于漢語(yǔ)的語(yǔ)言習(xí)慣,下文中沒(méi)有特別指出一個(gè)成分的數(shù)量時(shí),意味著該成分可以是一個(gè)也可以是多個(gè),或可理解為至少一個(gè)。圖1為根據(jù)本實(shí)用新型便攜式同傳(同聲傳譯)設(shè)備的功能模塊圖。同傳設(shè)備即具有同聲傳譯功能的設(shè)備。如圖1所示,便攜式同傳設(shè)備包括:語(yǔ)言設(shè)置單元,用于設(shè)置源語(yǔ)言類(lèi)型和目標(biāo)語(yǔ)言類(lèi)型;語(yǔ)音采集單元,用于采集待翻譯的語(yǔ)音數(shù)據(jù);通信單元,用于將所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)和所述目標(biāo)語(yǔ)言類(lèi)型傳輸?shù)皆贫?,并從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端文本翻譯數(shù)據(jù),或從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端語(yǔ)音翻譯數(shù)據(jù);呈現(xiàn)單元,用于展示所述云端文本翻譯數(shù)據(jù),或播放所述云端語(yǔ)音翻譯數(shù)據(jù)。比如,用戶(hù)通過(guò)語(yǔ)言設(shè)置單元設(shè)置源語(yǔ)言類(lèi)型為中文,而且目標(biāo)語(yǔ)言類(lèi)型為英文。語(yǔ)音采集單元采集用戶(hù)發(fā)出的待翻譯的語(yǔ)音數(shù)據(jù)(中文),通信單元將待翻譯的語(yǔ)音數(shù)據(jù)和目標(biāo)語(yǔ)言類(lèi)型(即英文)傳輸?shù)皆贫?,并從云端接收基于待翻譯的語(yǔ)音數(shù)據(jù)被翻譯成符合目標(biāo)語(yǔ)言類(lèi)型的語(yǔ)音翻譯數(shù)據(jù),和/或從云端接收基于待翻譯的語(yǔ)音數(shù)據(jù)被翻譯成符合目標(biāo)語(yǔ)言類(lèi)型的文本翻譯數(shù)據(jù)。語(yǔ)音翻譯數(shù)據(jù)是英文的語(yǔ)音,而且是針對(duì)待翻譯的語(yǔ)音數(shù)據(jù)(中文)的中到英翻譯。文本翻譯數(shù)據(jù)是英文的文本,而且是針對(duì)待翻譯的語(yǔ)音數(shù)據(jù)(中文)的中到英翻譯。其中,目標(biāo)語(yǔ)言類(lèi)型還可以為多個(gè)。比如,用戶(hù)通過(guò)語(yǔ)言設(shè)置單元設(shè)置目標(biāo)語(yǔ)言類(lèi)型為英文和意大利文。而且,語(yǔ)音采集單元采集用戶(hù)發(fā)出的待翻譯的語(yǔ)音數(shù)據(jù)(中文),通信單元將待翻譯的語(yǔ)音數(shù)據(jù)和目標(biāo)語(yǔ)言類(lèi)型(即英文和意大利文)傳輸?shù)皆贫?,并從云端接收基于待翻譯的語(yǔ)音數(shù)據(jù)被翻譯成符合目標(biāo)語(yǔ)言類(lèi)型的語(yǔ)音翻譯數(shù)據(jù)和(或)文本翻譯數(shù)據(jù)。語(yǔ)音翻譯數(shù)據(jù)包括英文語(yǔ)音和意大利語(yǔ)音,而且分別是針對(duì)待翻譯的語(yǔ)音數(shù)據(jù)(中文)的中到英和中到意的相應(yīng)翻譯。文本翻譯數(shù)據(jù)包括英文文本和意大利文本,而且分別是針對(duì)待翻譯的語(yǔ)音數(shù)據(jù)(中文)的中到英和中到意的相應(yīng)翻譯。便攜式同傳設(shè)備具體可以實(shí)施為麥克風(fēng),比如頭戴式麥克風(fēng),手持麥克風(fēng),耳夾式麥克風(fēng),等等。便攜式同傳設(shè)備還可以實(shí)施為與手機(jī)相適配的麥克風(fēng)。類(lèi)似的,便攜式同傳設(shè)備還可以實(shí)施為手機(jī)、手環(huán)、胸卡等任意的便攜式設(shè)備。通信單元具體可以實(shí)施為藍(lán)牙通信模塊,紅外通信模塊或無(wú)線移動(dòng)通信模塊。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:電源,用于為所述語(yǔ)言設(shè)置單元、語(yǔ)音采集單元、通信單元和呈現(xiàn)單元提供電功率。具體地,電源可以實(shí)施為各種鋰電池(比如,鋰金屬電池或鋰離子電池)。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:電源開(kāi)關(guān),用于接通或關(guān)閉所述電源。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:本地翻譯單元,用于當(dāng)判定通信單元與云端之間無(wú)通信連接時(shí),將所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)識(shí)別為文本,將所述文本翻譯成符合目標(biāo)語(yǔ)言類(lèi)型的本地端文本翻譯數(shù)據(jù),并將所述本地端文本翻譯數(shù)據(jù)語(yǔ)音合成為本地端語(yǔ)音翻譯數(shù)據(jù);呈現(xiàn)單元,還用于展示所述本地端文本翻譯數(shù)據(jù),或播放所述本地端語(yǔ)音翻譯數(shù)據(jù)。在這里,在本地通過(guò)嵌入式語(yǔ)音識(shí)別軟件、翻譯引擎、語(yǔ)音合成軟件聯(lián)合處理數(shù)據(jù)。考慮到有時(shí)候便攜式同傳設(shè)備無(wú)法聯(lián)網(wǎng),因此優(yōu)選設(shè)置一個(gè)小翻譯引擎,在終端而非云端實(shí)現(xiàn)語(yǔ)音辨識(shí)(ASRAutomaticSpeechRecognition),翻譯和語(yǔ)音合成播放(TTStext-to-speech)。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:緩存,用于保存所述云端文本翻譯數(shù)據(jù)、所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)、所述云端語(yǔ)音翻譯數(shù)據(jù)、所述本地端文本翻譯數(shù)據(jù)、所述本地端語(yǔ)音翻譯數(shù)據(jù)和符合所述目標(biāo)語(yǔ)言類(lèi)型的常用語(yǔ)音數(shù)據(jù)。在緩存中存儲(chǔ)符合目標(biāo)語(yǔ)言類(lèi)型的常用語(yǔ)音數(shù)據(jù)之后,即使通信單元暫時(shí)不能與云端建立通信連接,語(yǔ)音播放單元仍然可以從緩存中獲取并播放符合目標(biāo)語(yǔ)言類(lèi)型的常用語(yǔ)音數(shù)據(jù),從而滿(mǎn)足用戶(hù)的基本需求。比如,常用語(yǔ)音數(shù)據(jù)可以包含關(guān)鍵信息,比如用戶(hù)酒店地址、用戶(hù)國(guó)籍、用戶(hù)血型等等。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:顯示屏,用于顯示下列信息中的至少一個(gè):目標(biāo)語(yǔ)言類(lèi)型;網(wǎng)絡(luò)狀態(tài);電源剩余電量。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:無(wú)線網(wǎng)絡(luò)接入單元,用于提供無(wú)線網(wǎng)絡(luò)接入業(yè)務(wù)。因此,便攜式同傳設(shè)備還可以提供基于無(wú)線網(wǎng)絡(luò)接入單元提供移動(dòng)WIFI服務(wù),非常適于各種出國(guó)旅游人士。便攜式同傳設(shè)備的通信單元可以接入該無(wú)線網(wǎng)絡(luò)接入單元提供的無(wú)線網(wǎng)絡(luò),從而與云端建立互聯(lián)網(wǎng)連接。在一個(gè)實(shí)施方式中,通信單元,還用于從其他的便攜式同傳設(shè)備接收語(yǔ)音通知數(shù)據(jù)或文本通知數(shù)據(jù);呈現(xiàn)單元,還用于展示所述文本通知數(shù)據(jù),或播放所述語(yǔ)音通知數(shù)據(jù)。比如,其他的便攜式同傳設(shè)備可以為導(dǎo)游攜帶的麥克風(fēng),通過(guò)從導(dǎo)游接收并播放語(yǔ)音通知數(shù)據(jù),可以及時(shí)獲取導(dǎo)游提供的各種信息,比如景點(diǎn)介紹,緊急集合地點(diǎn)和時(shí)間,等等。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備還包括:地理位置信息獲取單元,用于獲取所述便攜式同傳設(shè)備的地理位置信息;其中所述呈現(xiàn)單元,還用于當(dāng)所述便攜式同傳設(shè)備的地理位置信息符合預(yù)定的報(bào)警條件時(shí),播放預(yù)存儲(chǔ)的語(yǔ)音報(bào)警數(shù)據(jù)。比如,當(dāng)?shù)乩砦恢眯畔⑴卸ㄟh(yuǎn)離導(dǎo)游的距離超過(guò)三百米的時(shí)候,語(yǔ)音播放單元自動(dòng)播放預(yù)存儲(chǔ)的語(yǔ)音報(bào)警數(shù)據(jù)。在一個(gè)實(shí)施方式中,通信單元,還用于將所述便攜式同傳設(shè)備的地理位置信息上傳到云端;所述便攜式同傳設(shè)備還包括:人工連線單元,用于在被觸發(fā)后向所述云端發(fā)出語(yǔ)音呼叫,并與云端基于所述地理位置信息被分配的人工座席建立語(yǔ)音通信?;谕瑐髟O(shè)備的地理位置信息,人工連線的翻譯人員系統(tǒng)自動(dòng)分配熟悉場(chǎng)景和商家需求的在線人工座席,例如化妝品店,手表,保健品,嬰兒用品店,高爾夫店,米其林餐廳等當(dāng)?shù)厣碳?。在一個(gè)實(shí)施方式中,呈現(xiàn)單元,還用于當(dāng)所述便攜式同傳設(shè)備的地理位置信息符合預(yù)定的內(nèi)容播放條件時(shí),播放預(yù)存儲(chǔ)的文本或語(yǔ)音內(nèi)容數(shù)據(jù)。該功能為了方便游客在適當(dāng)?shù)牡胤阶詣?dòng)收聽(tīng)導(dǎo)游內(nèi)容,而無(wú)需導(dǎo)游說(shuō)話。如:景點(diǎn)介紹,提示和廣告內(nèi)容等。在一個(gè)實(shí)施方式中,便攜式同傳設(shè)備進(jìn)一步具有藍(lán)牙模塊,通過(guò)藍(lán)牙模塊和手機(jī)建立藍(lán)牙連接,從而便攜式同傳設(shè)備基于該藍(lán)牙連接與手機(jī)上的app聯(lián)合工作,以實(shí)現(xiàn)跨語(yǔ)言對(duì)話。圖2為根據(jù)本實(shí)用新型的便攜式同傳設(shè)備的結(jié)構(gòu)圖。在圖2中,以麥克風(fēng)為便攜式設(shè)備的具體實(shí)施方式。在圖2中,標(biāo)號(hào)11和12分別為左右揚(yáng)聲器;標(biāo)號(hào)2為麥克風(fēng);標(biāo)號(hào)3為小顯示屏;標(biāo)號(hào)4為電源開(kāi)關(guān);標(biāo)號(hào)15和16為翻譯語(yǔ)言切換開(kāi)關(guān),其中標(biāo)號(hào)15標(biāo)識(shí)的開(kāi)關(guān)用于設(shè)置對(duì)方語(yǔ)言,標(biāo)號(hào)15標(biāo)識(shí)的開(kāi)關(guān)用于設(shè)置己方語(yǔ)言;標(biāo)號(hào)6為按住說(shuō)話按鈕;標(biāo)號(hào)7為音量開(kāi)關(guān);標(biāo)號(hào)8為重新播放按鈕;標(biāo)號(hào)9為人工連線按鈕。用戶(hù)首先打開(kāi)電源開(kāi)關(guān),便攜式同傳設(shè)備自動(dòng)聯(lián)網(wǎng)。用戶(hù)按下相應(yīng)按鈕選擇需要翻譯語(yǔ)言語(yǔ)種(比如:中、英翻譯),并放到說(shuō)話者近前。當(dāng)用戶(hù)說(shuō)話完成,松開(kāi)“按住說(shuō)話”按鈕,語(yǔ)音數(shù)據(jù)傳回云端。云端把語(yǔ)音轉(zhuǎn)換為文字,并把語(yǔ)言翻譯成對(duì)方語(yǔ)言。從云端傳回翻譯后的語(yǔ)音到便攜式同傳設(shè)備,并通過(guò)揚(yáng)聲器自動(dòng)播放(延時(shí)<1s)。切換翻譯語(yǔ)言,完成無(wú)障礙雙語(yǔ)對(duì)話。如果需要可以按“人工連線”按鈕,通過(guò)客服人員的專(zhuān)業(yè)手機(jī)人工服務(wù)并在10秒內(nèi)反饋正確解釋。后臺(tái)自動(dòng)存儲(chǔ)該筆數(shù)據(jù)。其中,“翻譯語(yǔ)言切換開(kāi)關(guān)”和“按住說(shuō)話開(kāi)關(guān)”以靠近大多數(shù)人手指為準(zhǔn),便于操作;其他不常操作的按鈕,可以放在設(shè)備上部適當(dāng)位置。便攜式同傳設(shè)備的寬度建議在4~5cm,以輕松單手握持為準(zhǔn),伸展后長(zhǎng)度18cm以上,折疊后長(zhǎng)度在10cm內(nèi),便于攜帶??膳浜现悄苁謾C(jī),將便攜式同傳設(shè)備做成手機(jī)套形式?;蛘咴谄渌麍?chǎng)景做成機(jī)器人或者臺(tái)式機(jī)的模式(如餐廳、酒店、購(gòu)物場(chǎng)所等),外觀設(shè)計(jì)可多樣化。而且,通過(guò)人工按鈕衍生出問(wèn)答和遞交旅游各個(gè)典型場(chǎng)景服務(wù)的全方位智能機(jī),為用戶(hù)實(shí)現(xiàn)境外打的、交通、購(gòu)物、住宿等全方位線下服務(wù)。總之,打開(kāi)電源開(kāi)關(guān)動(dòng)連網(wǎng);選擇語(yǔ)言按住說(shuō)話,放到說(shuō)話者近前;說(shuō)話完成,松開(kāi)“按住說(shuō)話”按鈕;設(shè)備把自動(dòng)翻譯成對(duì)方語(yǔ)言并播放;如果用戶(hù)需要,可按“人工連線”進(jìn)行智能三方通話。后臺(tái)自動(dòng)存儲(chǔ)該筆數(shù)據(jù)。針對(duì)美國(guó)市場(chǎng),地下按鈕中文和英語(yǔ)語(yǔ)音可以實(shí)現(xiàn)切換,消費(fèi)者在吵雜環(huán)境可以文字輸入同傳翻譯出語(yǔ)音和文字。如果翻譯不準(zhǔn)確,消費(fèi)者按人工糾錯(cuò)按鈕。專(zhuān)業(yè)同傳翻譯后,將把正確的重新發(fā)布。系統(tǒng)紀(jì)錄人工信息并學(xué)習(xí)。消費(fèi)者可把自己想去的店輸入系統(tǒng)。下面描述云端如何實(shí)現(xiàn)具體翻譯。本實(shí)用新型中,基于計(jì)算機(jī)語(yǔ)意識(shí)別能力的核心技術(shù),云端能夠幫助計(jì)算機(jī)更加智能地識(shí)別信息背后的準(zhǔn)確含義。通過(guò)將信息進(jìn)行深層、多層次分析,不但了解了其代碼,還識(shí)別了信息所要表達(dá)的意圖,使計(jì)算機(jī)更智能、更人性化地與人類(lèi)溝通。優(yōu)選地,云端主要運(yùn)用了分析語(yǔ)言線性結(jié)構(gòu)+關(guān)鍵詞(即語(yǔ)塊)的技術(shù)手段,從語(yǔ)言的線性結(jié)構(gòu)和關(guān)鍵詞中精確地提煉出信息的真正意圖。一個(gè)待分析的語(yǔ)句包括線性結(jié)構(gòu)和關(guān)鍵詞(即語(yǔ)塊)。其中,語(yǔ)意識(shí)別的關(guān)鍵在于識(shí)別出語(yǔ)句的線性結(jié)構(gòu)。語(yǔ)言的意義隱藏在語(yǔ)句的線性結(jié)構(gòu)當(dāng)中,語(yǔ)句的線性結(jié)構(gòu)相當(dāng)于語(yǔ)言的常量。語(yǔ)意乃至意義和思維都隱藏在語(yǔ)句的線性結(jié)構(gòu)中的,通過(guò)分析語(yǔ)句的線性結(jié)構(gòu),可達(dá)到識(shí)別意圖的目的。關(guān)鍵詞相當(dāng)于語(yǔ)言的變量。通過(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留,能得到較為準(zhǔn)確的檢索或翻譯結(jié)果。而且,雙語(yǔ)、單語(yǔ)均可利用結(jié)構(gòu)分析來(lái)精確識(shí)別語(yǔ)意。通過(guò)對(duì)浩如煙海的文獻(xiàn)資料逐句進(jìn)行線性結(jié)構(gòu)+關(guān)鍵詞分析,我們可以獲得充分的語(yǔ)句線性結(jié)構(gòu)和關(guān)鍵詞(即語(yǔ)塊)。舉例說(shuō)明:1、鄉(xiāng)村旅游作為中國(guó)旅游業(yè)的重要組成部分和促進(jìn)旅游業(yè)發(fā)展的重要支撐。(示例1)2、中國(guó)經(jīng)濟(jì)作為世界經(jīng)濟(jì)的重要組成部分和促進(jìn)全球金融穩(wěn)定的重要支撐。(示例2)通過(guò)分析上面兩個(gè)例子,可以發(fā)現(xiàn):“鄉(xiāng)村旅游”、“中國(guó)旅游業(yè)”和“旅游業(yè)發(fā)展”相當(dāng)于示例1的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x作為x的重要組成部分和促進(jìn)x的重要支撐”(其中x表示空白)相當(dāng)于示例1的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中。類(lèi)似地,“中國(guó)經(jīng)濟(jì)”、“世界經(jīng)濟(jì)”、“全球金融穩(wěn)定”相當(dāng)于示例2的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x作為x的重要組成部分和促進(jìn)x的重要支撐”(其中x表示空白)相當(dāng)于示例2的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中??梢园l(fā)現(xiàn),這兩個(gè)示例的線性結(jié)構(gòu)完全相同,區(qū)別僅僅在于變量不同??梢詫ⅰ皒作為x的重要組成部分和促進(jìn)x的重要支撐”(其中x表示空白)定義為一種線性結(jié)構(gòu),而“鄉(xiāng)村旅游”、“中國(guó)旅游業(yè)”、“旅游業(yè)發(fā)展”、“中國(guó)經(jīng)濟(jì)”、“世界經(jīng)濟(jì)”和“全球金融穩(wěn)定”定義為關(guān)鍵詞(即語(yǔ)塊)。其中,我們可以將一些常用的固有名詞和/或動(dòng)名詞確定為常量,但是變量并不局限于固有名詞和/或動(dòng)名詞。在某些情況下,變量也可以是一種常用的短語(yǔ),甚至比較長(zhǎng)的句子。另外,在確定常量和線性結(jié)構(gòu)時(shí),劃分方式可能并不是唯一的。對(duì)于變量最少的劃分方式,其所對(duì)應(yīng)的線性結(jié)構(gòu)稱(chēng)為最小線性結(jié)構(gòu)。一般地,變量越少,可以認(rèn)為所對(duì)應(yīng)的線性結(jié)構(gòu)所表達(dá)的信息越充分,則對(duì)應(yīng)搜索的信息越精確。再舉例說(shuō)明:1、阿凡達(dá)熱潮席卷中國(guó)。(示例3)2、炒股熱潮席卷世界。(示例4)通過(guò)分析上面兩個(gè)例子,可以發(fā)現(xiàn),“阿凡達(dá)”和“中國(guó)”相當(dāng)于示例3的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x熱潮席卷x”(其中x表示空白)相當(dāng)于示例3的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中。類(lèi)似地,“炒股”和“世界”相當(dāng)于示例4的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x熱潮席卷x”(其中x表示空白)相當(dāng)于示例4的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中??梢园l(fā)現(xiàn),這兩個(gè)示例的線性結(jié)構(gòu)相同,區(qū)別僅僅在于變量不同。可以將“x熱潮席卷x”(其中x表示空白)定義為一種線性結(jié)構(gòu),而“阿凡達(dá)”、“中國(guó)”、“炒股”和“世界”定義為關(guān)鍵詞(即語(yǔ)塊)。再次舉例說(shuō)明:1、他們呼吁歐委會(huì)客觀、公正地對(duì)待中國(guó)企業(yè)的市場(chǎng)經(jīng)濟(jì)待遇申請(qǐng)。(示例5)2、國(guó)際足聯(lián)呼吁愛(ài)爾蘭客觀、公正地對(duì)待世界杯預(yù)選賽與法國(guó)隊(duì)的比賽結(jié)果。(示例6)3、國(guó)際社會(huì)呼吁六方會(huì)談客觀、公正地對(duì)待朝鮮問(wèn)題。(示例7)4、中國(guó)呼吁日本政府客觀、公正地對(duì)待二戰(zhàn)歷史問(wèn)題。(示例8)通過(guò)分析上面四個(gè)例子,可以發(fā)現(xiàn):“他們”、“歐委會(huì)”和“中國(guó)企業(yè)的市場(chǎng)經(jīng)濟(jì)待遇申請(qǐng)”相當(dāng)于示例5的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x呼吁x客觀、公正地對(duì)待x”(其中x表示空白)相當(dāng)于示例5的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中。類(lèi)似地,“國(guó)際足聯(lián)”、“愛(ài)爾蘭”和“世界杯預(yù)選賽與法國(guó)隊(duì)的比賽結(jié)果”相當(dāng)于示例6的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x呼吁x客觀、公正地對(duì)待x”(其中x表示空白)相當(dāng)于示例6的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中。類(lèi)似地,“國(guó)際社會(huì)”、“六方會(huì)談”和“朝鮮問(wèn)題”相當(dāng)于示例6的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x呼吁x客觀、公正地對(duì)待x”(其中x表示空白)相當(dāng)于示例6的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中。類(lèi)似地,“中國(guó)”、“日本政府”和“二戰(zhàn)歷史問(wèn)題”相當(dāng)于示例7的變量,因?yàn)橥ㄟ^(guò)替換相應(yīng)部分(即變量),其語(yǔ)意基本均可保留。而“x呼吁x客觀、公正地對(duì)待x”(其中x表示空白)相當(dāng)于示例7的線性結(jié)構(gòu),也就是語(yǔ)言的常量,因?yàn)檎Z(yǔ)言的意義隱藏在該線性結(jié)構(gòu)當(dāng)中??梢园l(fā)現(xiàn),這四個(gè)示例的線性結(jié)構(gòu)相同,區(qū)別僅僅在于變量不同??梢詫ⅰ皒呼吁x客觀、公正地對(duì)待x”(其中x表示空白)”定義為一種線性結(jié)構(gòu),而“他們”、“歐委會(huì)”、“中國(guó)企業(yè)的市場(chǎng)經(jīng)濟(jì)待遇申請(qǐng)”、“國(guó)際足聯(lián)”、“愛(ài)爾蘭”、“世界杯預(yù)選賽與法國(guó)隊(duì)的比賽結(jié)果”、“國(guó)際社會(huì)”、“六方會(huì)談”、“朝鮮問(wèn)題”、“中國(guó)”、“日本政府”和“二戰(zhàn)歷史問(wèn)題”定義為關(guān)鍵詞(即語(yǔ)塊)?;谏鲜龇治?,通過(guò)對(duì)大量文獻(xiàn)(包括網(wǎng)絡(luò)文章、博客、教科書(shū)、各種電子文檔等)進(jìn)行上述切分,我們就可以得到充分的線性結(jié)構(gòu)庫(kù)和關(guān)鍵詞(即語(yǔ)塊)庫(kù)。下面再詳細(xì)描述云端基于語(yǔ)意識(shí)別的翻譯方法。首先:將篇章級(jí)的詞語(yǔ)利用符號(hào)切分為字符串,并從切出的字符串中提取出語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊。在這里,首先將篇章級(jí)的詞語(yǔ)(比如,一篇文章或者一篇社論)利用符號(hào)切分為若干個(gè)字符串,并從切出的字符串中依次提取出語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊(具體的提取步驟可以參照前述示例分析)。此處“篇章級(jí)”并不意味著對(duì)詞語(yǔ)的數(shù)目有任何特定的限定。實(shí)質(zhì)上,只要有一些詞匯,并且這些詞匯之間所組成的語(yǔ)句具有意義,就可以認(rèn)為這些詞匯構(gòu)成了“篇章級(jí)”。更具體地,可以根據(jù)句號(hào)、問(wèn)號(hào)、嘆號(hào)、逗號(hào)、頓號(hào)、分號(hào)、冒號(hào)、引號(hào)、括號(hào)、破折號(hào)、省略號(hào)、著重號(hào)、連接號(hào)、間隔號(hào)、書(shū)名號(hào)、專(zhuān)名號(hào)、注釋號(hào)、隱諱號(hào)、虛缺號(hào)、斜線號(hào)、標(biāo)識(shí)號(hào)、代替號(hào)、連珠號(hào)和/或箭頭號(hào)等標(biāo)點(diǎn)符號(hào),將篇章級(jí)的詞語(yǔ)切分為字符串。比如,可以將任意的兩個(gè)標(biāo)點(diǎn)符號(hào)之間的文字提取為字符串(對(duì)于文章的起始,只需要一個(gè)標(biāo)點(diǎn)符號(hào))。在確定關(guān)鍵字(語(yǔ)塊)時(shí),我們可以使用一個(gè)基于篇章的局部子串統(tǒng)計(jì)表(hashtable)作為臨時(shí)輔助詞典。也就是說(shuō),如果出現(xiàn)在臨時(shí)輔助詞典中,我們就可以將其確定為語(yǔ)塊。不過(guò),某些沒(méi)有出現(xiàn)在局部子串統(tǒng)計(jì)表中的,也可以將其確定為語(yǔ)塊。還可以用基于多路徑規(guī)劃的切分路徑樹(shù)作為切分模型,首先將英文(ASCII)、簡(jiǎn)體中文(GBK/GB18030)、繁體中文(臺(tái)灣BIG5、香港BIG5-HKSCS)等字符編碼統(tǒng)一轉(zhuǎn)換為UTF-8編碼格式之后再進(jìn)行切分,并在多個(gè)正確切分結(jié)果的基礎(chǔ)上提取語(yǔ)塊。提取完語(yǔ)塊之后,剩余的部分就是線性結(jié)構(gòu)。然后:分別對(duì)提取出的語(yǔ)言線性結(jié)構(gòu)以及語(yǔ)塊進(jìn)行倒排。在這里,倒排具體包括:對(duì)于每個(gè)合格的語(yǔ)塊,將該語(yǔ)塊所在的文檔號(hào)、段落號(hào)、句子號(hào)、詞序號(hào)、以及HTML信息等壓縮為一個(gè)結(jié)構(gòu),放入該語(yǔ)塊所在的動(dòng)態(tài)文件中;其中語(yǔ)塊可以為任意的字符串,主要包括如下類(lèi)別:詞典詞條、專(zhuān)名、專(zhuān)名的內(nèi)部詞匯、各類(lèi)詞組/搭配關(guān)系、n-grams、連續(xù)的stopwords、詞+數(shù)字、任意的ASCII串、郵編與電話號(hào)碼等。而對(duì)于每個(gè)合格的語(yǔ)言線性結(jié)構(gòu),可以將該語(yǔ)言線性結(jié)構(gòu)所在的文檔號(hào)、段落號(hào)、句子號(hào)、詞序號(hào)、以及HTML信息等壓縮為一個(gè)結(jié)構(gòu),放入該語(yǔ)塊所在的動(dòng)態(tài)文件中。接著:創(chuàng)建語(yǔ)言線性結(jié)構(gòu)子索引以及語(yǔ)塊子索引,并將語(yǔ)言線性結(jié)構(gòu)子索引和語(yǔ)塊子索引予以合并,以形成整體索引。在這里,將內(nèi)存中的全部語(yǔ)塊索引項(xiàng)(indexterms)寫(xiě)入語(yǔ)塊詞匯表(vocabulary)文件,將invertedhits合并后寫(xiě)入inv_lists文件,并將二者之間的關(guān)聯(lián)信息寫(xiě)入詞典(dictionary)文件。這三個(gè)文件構(gòu)成一個(gè)完整、獨(dú)立的索引段(indexrun),即語(yǔ)塊子索引。而且,將內(nèi)存中的全部線性結(jié)構(gòu)索引項(xiàng)(indexterms)寫(xiě)入線性結(jié)構(gòu)詞匯表(vocabulary)文件,將invertedhits合并后寫(xiě)入inv_lists文件,并將二者之間的關(guān)聯(lián)信息寫(xiě)入線性結(jié)構(gòu)詞典(dictionary)文件。這三個(gè)文件構(gòu)成一個(gè)完整、獨(dú)立的索引段(indexrun),即線性結(jié)構(gòu)子索引。最后,將語(yǔ)言線性結(jié)構(gòu)子索引和語(yǔ)塊子索引予以合并,以形成整體索引。最后:從用戶(hù)的檢索輸入字符串中提取出語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊,并根據(jù)所述的整體索引向用戶(hù)反饋與從用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配的信息。在這里,首先從用戶(hù)的檢索輸入字符串中提取出線性結(jié)構(gòu)和語(yǔ)塊。比如,假如用戶(hù)輸入“我很喜歡吃煙臺(tái)產(chǎn)的大蘋(píng)果?!眲t提取出語(yǔ)塊“我”、“煙臺(tái)產(chǎn)的大蘋(píng)果”,以及線性結(jié)構(gòu)x很喜歡吃x(其中x為空白),然后在整體索引中檢索出匹配線性結(jié)構(gòu)“x很喜歡吃x”,以及語(yǔ)塊“我”、“煙臺(tái)產(chǎn)的大蘋(píng)果”的信息,并且按照匹配程度由高到低的順序向用戶(hù)呈現(xiàn)。在一個(gè)實(shí)施方式中,當(dāng)從所述用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)與整體索引中的語(yǔ)言線性結(jié)構(gòu)的重復(fù)字?jǐn)?shù)越多時(shí),可以認(rèn)為這種匹配程度越高。在一個(gè)實(shí)施方式中,還可以預(yù)先設(shè)置語(yǔ)言線性結(jié)構(gòu)重復(fù)權(quán)重和語(yǔ)塊重復(fù)權(quán)重;基于所述語(yǔ)言線性結(jié)構(gòu)重復(fù)權(quán)重計(jì)算從所述用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)與整體索引中的語(yǔ)言線性結(jié)構(gòu)的第一重疊指數(shù),并基于語(yǔ)塊重復(fù)權(quán)重計(jì)算從所述用戶(hù)的檢索輸入中提取出的語(yǔ)塊與整體索引中的語(yǔ)塊的第二重疊指數(shù);當(dāng)所述第一重疊指數(shù)與第二重疊指數(shù)的和越高,所述匹配程度越高。其中,向用戶(hù)反饋與從用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配的信息具體可以包括:在所述整體索引中分別檢索該輸入字符串的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊,以確定整體索引中與該輸入字符串的語(yǔ)言線性結(jié)構(gòu)相對(duì)應(yīng)的語(yǔ)言線性結(jié)構(gòu),以及確定整體索引中與該輸入字符串的語(yǔ)塊相對(duì)應(yīng)的語(yǔ)塊;向用戶(hù)反饋整體索引中該相對(duì)應(yīng)的語(yǔ)言線性結(jié)構(gòu)和該相對(duì)應(yīng)的語(yǔ)塊所涉及的信息。可以將本發(fā)明的流程應(yīng)用于多種具體的實(shí)際應(yīng)用中,比如信息檢索以及多語(yǔ)言翻譯。當(dāng)應(yīng)用于多語(yǔ)言翻譯時(shí),假設(shè)用戶(hù)的檢索輸入字符串為用第一語(yǔ)言表述的檢索輸入字符串。此時(shí),從用戶(hù)的檢索輸入字符串中提取出該輸入字符串用第一語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊;然后再確定與該用第一語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相對(duì)應(yīng)的用第二語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊;根據(jù)所述的整體索引向用戶(hù)反饋與用第二語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配且同樣用第二語(yǔ)言表述的信息。其中,第一語(yǔ)言可以為中文,第二語(yǔ)言為英文、日文、韓文、阿拉伯文、西班牙文、葡萄牙文、法文或俄羅斯文,等等??蛇x的,第一語(yǔ)言為英文、日文、韓文、阿拉伯文、西班牙文、葡萄牙文、法文或俄羅斯文,第二語(yǔ)言為中文等。舉例:用戶(hù)期望將中文“我要去上?!狈g成英文。此時(shí),用戶(hù)輸入的檢索輸入字符串為“我要去上?!?,并用中文表述。首先,從用戶(hù)的檢索輸入字符串中提取出該輸入字符串用中文表述的語(yǔ)言線性結(jié)構(gòu)(即:x要去x,其中x為空白)和中文表述的語(yǔ)塊(我,上海);然后再確定與該用中文表述的語(yǔ)言線性結(jié)構(gòu)相對(duì)應(yīng)的用英語(yǔ)表述的語(yǔ)言線性結(jié)構(gòu)(即xwanttogoto),以及確定與該用中文表述的語(yǔ)塊相對(duì)應(yīng)的用英語(yǔ)表述的語(yǔ)塊(即I,Shanghai)。最后,將語(yǔ)塊和線性結(jié)構(gòu)組合成翻譯的語(yǔ)句IwanttogotoShanghai,并呈現(xiàn)給用戶(hù)。進(jìn)一步地,還可以再根據(jù)整體索引向用戶(hù)反饋與線性結(jié)構(gòu)(xwanttogoto)語(yǔ)塊(I,Shanghai)相匹配且用第二語(yǔ)言表述的信息,從而便于用戶(hù)檢索與IwanttogotoShanghai相關(guān)的英文信息。在上述過(guò)程中,示范性地應(yīng)用了一種高性能的單遍內(nèi)存倒排算法,而不生成任何臨時(shí)磁盤(pán)文件。因此,在導(dǎo)出內(nèi)存內(nèi)容之前,除了MAP數(shù)據(jù),系統(tǒng)沒(méi)有任何文件I/O開(kāi)銷(xiāo)。同時(shí),它也不需要對(duì)indexterms編號(hào),并且不對(duì)indexterm(編號(hào)或者內(nèi)存字符串指針)做任何排序運(yùn)算。另外,該方法使用所有可用的空閑物理內(nèi)存進(jìn)行倒排。這些性質(zhì)保證了這個(gè)倒排方法可具有非凡的時(shí)空效率,可支持一系列高效的動(dòng)態(tài)索引合并和索引更新的方法。同時(shí),具備該特性的倒排索引還完全適用于分布式處理。在上述過(guò)程中,另一個(gè)關(guān)鍵特征是其查找數(shù)據(jù)結(jié)構(gòu)具備caching功能,這個(gè)特性可支持幾乎任意大的索引詞表(即vocabulary文件)。vocabulary文件本身是放在磁盤(pán)上,能夠保存的索引項(xiàng)的數(shù)目不受限制(在64-bit文件系統(tǒng)上),可多達(dá)數(shù)億條。通過(guò)caching功能,該算法可以在4~6GB內(nèi)存的x64服務(wù)器上達(dá)到與包括多臺(tái)同等或更高配置的服務(wù)器的集群查詢(xún)系統(tǒng)相近的索引詞表查詢(xún)性能。而且,indexterms可以為任意的字符串,主要包括如下類(lèi)別(termcategories):詞典詞條、專(zhuān)名、專(zhuān)名的內(nèi)部詞匯、各類(lèi)詞組/搭配關(guān)系、n-grams、連續(xù)的stopwords、詞+數(shù)字、任意的ASCII串、郵編與電話號(hào)碼等?;谏鲜鲈敿?xì)說(shuō)明,本發(fā)明實(shí)施方式還提出了一種基于語(yǔ)意識(shí)別的自然語(yǔ)言處理系統(tǒng)。圖3為本實(shí)用新型的便攜式同傳系統(tǒng)結(jié)構(gòu)圖。如圖3所示,該系統(tǒng)包括信息收集裝置301、資料存儲(chǔ)裝置302、自然語(yǔ)言處理裝置303、索引存儲(chǔ)裝置304和檢索服務(wù)裝置305。其中:信息收集裝置301,用于對(duì)互聯(lián)網(wǎng)進(jìn)行掃描檢測(cè),爬取互聯(lián)網(wǎng)上的信息;資料存儲(chǔ)裝置302,用于存儲(chǔ)由信息收集裝置爬取到的互聯(lián)網(wǎng)信息,并優(yōu)選提供互聯(lián)網(wǎng)信息的快速定位查找;自然語(yǔ)言處理裝置303,用于利用符號(hào)對(duì)存儲(chǔ)于資料存儲(chǔ)裝置302中的篇章級(jí)的詞語(yǔ),切分為字符串,并從切出的字符串中提取出語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊;并分別對(duì)提取出的語(yǔ)言線性結(jié)構(gòu)以及語(yǔ)塊進(jìn)行倒排;以及用于創(chuàng)建語(yǔ)言線性結(jié)構(gòu)子索引以及語(yǔ)塊子索引,并將語(yǔ)言線性結(jié)構(gòu)子索引和語(yǔ)塊子索引予以合并,以形成整體索引;索引存儲(chǔ)裝置304,用于存儲(chǔ)由自然語(yǔ)言處理裝置303生成的整體索引;檢索服務(wù)裝置305,用于將如圖1所示的麥克風(fēng)提供的待翻譯的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為檢索輸入字符串,并從檢索輸入字符串中提取出語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊,并根據(jù)索引存儲(chǔ)裝置存儲(chǔ)的所述的整體索引向用戶(hù)反饋與從用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配的信息。其中,信息收集裝置301進(jìn)一步可以接受報(bào)刊、廣電和各個(gè)媒體會(huì)員等所提供的上傳信息(比如新聞資源)服務(wù)。而且,檢索服務(wù)裝置305可以針對(duì)普通用戶(hù)免費(fèi)查詢(xún)新聞,以及針對(duì)專(zhuān)業(yè)用戶(hù)注冊(cè)并付費(fèi)之后開(kāi)通高端服務(wù)。優(yōu)選地,自然語(yǔ)言處理裝置303,用于根據(jù)句號(hào)、問(wèn)號(hào)、嘆號(hào)、逗號(hào)、頓號(hào)、分號(hào)、冒號(hào)、引號(hào)、括號(hào)、破折號(hào)、省略號(hào)、著重號(hào)、連接號(hào)、間隔號(hào)、書(shū)名號(hào)、專(zhuān)名號(hào)、注釋號(hào)、隱諱號(hào)、虛缺號(hào)、斜線號(hào)、標(biāo)識(shí)號(hào)、代替號(hào)、連珠號(hào)和箭頭號(hào),將所述篇章級(jí)的詞語(yǔ)切分為字符串。優(yōu)選地,自然語(yǔ)言處理裝置303,用于使用基于篇章的局部子串統(tǒng)計(jì)表作為臨時(shí)輔助詞典,用基于多路徑規(guī)劃的切分路徑樹(shù)作為切分模型,將所述篇章級(jí)的詞的等字符編碼統(tǒng)一轉(zhuǎn)換為UTF-8編碼格式;并對(duì)轉(zhuǎn)換為UTF-8編碼格式后的篇章級(jí)的詞語(yǔ)利用符號(hào)切分為字符串。而且,檢索服務(wù)裝置305,可以用于依據(jù)匹配程度由高到低的順序,向用戶(hù)反饋與從用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配的信息。在一個(gè)實(shí)施方式中,檢索服務(wù)裝置305,用于依據(jù)語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊的匹配程度由高到低的順序,向用戶(hù)反饋與從用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配的信息。其中,優(yōu)選地,當(dāng)從所述用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)與整體索引中的語(yǔ)言線性結(jié)構(gòu)的重復(fù)字?jǐn)?shù)越多時(shí),所述匹配程度越高。在一個(gè)實(shí)施方式中,檢索服務(wù)裝置305,進(jìn)一步用于預(yù)先設(shè)置語(yǔ)言線性結(jié)構(gòu)重復(fù)權(quán)重和語(yǔ)塊重復(fù)權(quán)重;并基于所述語(yǔ)言線性結(jié)構(gòu)重復(fù)權(quán)重計(jì)算從所述用戶(hù)的檢索輸入中提取出的語(yǔ)言線性結(jié)構(gòu)與整體索引中的語(yǔ)言線性結(jié)構(gòu)的第一重疊指數(shù),并基于語(yǔ)塊重復(fù)權(quán)重計(jì)算從所述用戶(hù)的檢索輸入中提取出的語(yǔ)塊與整體索引中的語(yǔ)塊的第二重疊指數(shù);其中當(dāng)所述第一重疊指數(shù)與第二重疊指數(shù)的和越高,所述匹配程度越高。在一個(gè)實(shí)施方式中,檢索服務(wù)裝置305,用于在所述整體索引中分別檢索該輸入字符串的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊,以確定整體索引中與該輸入字符串的語(yǔ)言線性結(jié)構(gòu)相對(duì)應(yīng)的語(yǔ)言線性結(jié)構(gòu),以及確定整體索引中與該輸入字符串的語(yǔ)塊相對(duì)應(yīng)的語(yǔ)塊;向用戶(hù)反饋整體索引中該相對(duì)應(yīng)的語(yǔ)言線性結(jié)構(gòu)和該相對(duì)應(yīng)的語(yǔ)塊所涉及的信息。在一個(gè)實(shí)施方式中,檢索服務(wù)裝置305,用于從用戶(hù)的檢索輸入字符串中提取出該輸入字符串用第一語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊;確定與該用第一語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相對(duì)應(yīng)的用第二語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊;根據(jù)所述的整體索引向用戶(hù)反饋與用第二語(yǔ)言表述的語(yǔ)言線性結(jié)構(gòu)和語(yǔ)塊相匹配且同樣用第二語(yǔ)言表述的信息??蛇x地,第一語(yǔ)言為英文、日文、韓文、阿拉伯文、西班牙文、葡萄牙文、法文或俄羅斯文等,第二語(yǔ)言為中文。第一語(yǔ)言還可以為中文,第二語(yǔ)言為英文、日文、韓文、阿拉伯文、西班牙文、葡萄牙文、法文或俄羅斯文,等。綜上所述,語(yǔ)言設(shè)置單元,用于設(shè)置源語(yǔ)言類(lèi)型和目標(biāo)語(yǔ)言類(lèi)型;語(yǔ)音采集單元,用于采集待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù);通信單元,用于將所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)和所述目標(biāo)語(yǔ)言類(lèi)型傳輸?shù)皆贫?,并從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端文本翻譯數(shù)據(jù),或從所述云端接收基于所述待翻譯的源語(yǔ)言語(yǔ)音數(shù)據(jù)被翻譯成符合所述目標(biāo)語(yǔ)言類(lèi)型的云端語(yǔ)音翻譯數(shù)據(jù);呈現(xiàn)單元,用于展示所述云端文本翻譯數(shù)據(jù),或播放所述云端語(yǔ)音翻譯數(shù)據(jù)。因此,通過(guò)便攜式的同傳設(shè)備可以實(shí)現(xiàn)語(yǔ)音翻譯,可以顯著降低成本。而且,同傳設(shè)備中還可以包含無(wú)線網(wǎng)絡(luò)接入單元,便于用戶(hù)上網(wǎng)。而且,同傳設(shè)備還可以接收各種信息,并且可以監(jiān)控位置。在不能聯(lián)網(wǎng)的情況下,同傳設(shè)備仍然可以提供預(yù)存的常用語(yǔ)音數(shù)據(jù),從而便于用戶(hù)使用。以上所述,僅為本實(shí)用新型的較佳實(shí)施例而已,并非用于限定本實(shí)用新型的保護(hù)范圍。凡在本實(shí)用新型的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本實(shí)用新型的保護(hù)范圍之內(nèi)。當(dāng)前第1頁(yè)1 2 3 當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1