10年專業(yè)筆譯品牌?
10年數(shù)萬場(chǎng)口譯
專業(yè)留學(xué)移民翻譯
多語言網(wǎng)站翻譯
89種語言服務(wù)
3.1 傳統(tǒng)翻譯方法
所謂的傳統(tǒng)翻譯方法主要指如下四種基本的翻譯方法:(1)基于規(guī)則(rule-based)的語音翻譯方法;(2)基于事例(example-based)和模板(template-based)的語音翻譯方法;(3)基于中間語義表示的(inter-lingual)語音翻譯方法;(4)基于統(tǒng)計(jì)模型的(statistical)翻譯方法。由于這四種翻譯方法是在文本機(jī)器翻譯中提出來的,并切有的已被廣泛地應(yīng)用于商業(yè)化翻譯軟件和實(shí)驗(yàn)系統(tǒng)中,因此,我們將其稱之為主流的翻譯方法。關(guān)于這些方法的優(yōu)缺點(diǎn)已經(jīng)有很多論著中給予了評(píng)述,這里我們不再贅述。
3.2 非傳統(tǒng)翻譯方法
所謂的非傳統(tǒng)翻譯方法是指除上述四種基本的方法以外,近幾年來提出和被嘗試的其它各種新的翻譯策略。盡管這些翻譯方法不像傳統(tǒng)的翻譯方法那樣被廣泛地承認(rèn)和采用,但它們畢竟是眾多的研究者向著實(shí)用、高效的翻譯目標(biāo)逼近的見證,而且其中的許多思想和策略同樣值得我們借鑒。我們將這些翻譯方法稱之為非主流的翻譯方法。
1997年Wakita等人曾提出了一種局部抽取可正確翻譯成分的語音翻譯方法[Wakita et al., 1997],其基本思想是以基于事例的翻譯方法為基礎(chǔ),翻譯模塊首先對(duì)輸入語句進(jìn)行句法和語義解析,然后在解析結(jié)果中尋找那些具有一定的長度(詞匯達(dá)到一定的個(gè)數(shù))、結(jié)構(gòu)上符合句法、與事例庫中某一例句(或片斷)的語義距離小于給定門限的那些片斷或語塊,最后通過基于事例的翻譯方法只翻譯那些符合條件的片斷或語塊。實(shí)際上這種方法采用的是一種“回避困難”的權(quán)宜之計(jì)。我們注意到,這種翻譯方法并不是從整個(gè)輸入語句的全局來進(jìn)行語塊或片斷的切分[Furuse et al, 1998],而只是局部地計(jì)算片斷與事例庫中短語(或片斷)的語義距離,這樣有可能抽取出的翻譯片斷與原輸入語句的含義并不相符,而且,有時(shí)候整個(gè)輸入語句中抽取不出任何可翻譯的片斷,整個(gè)翻譯系統(tǒng)也就無任何輸出。另外,這種翻譯方法與語義計(jì)算密切相關(guān),因此,需要有一部高質(zhì)量的語義詞典和能夠真正反映片斷之間相似性的語義距離測(cè)度模型,而這些對(duì)于中文計(jì)算來說,往往都是比較困難的。
1999年日本德島大學(xué)(The University of Tokushima)教授任福繼博士提出了一種基于超函數(shù)的翻譯方法(Super-Function Based Machine Translation, SFBMT),這種翻譯方法的基本出發(fā)點(diǎn)是:在目前機(jī)器翻譯系統(tǒng)不能做到“信、達(dá)、雅”翻譯目標(biāo)的情況下,用戶與其對(duì)系統(tǒng)翻譯正確率和譯文可讀性等提出不現(xiàn)實(shí)的過高要求,還不如提高系統(tǒng)的運(yùn)行速度、減少系統(tǒng)開銷、提高系統(tǒng)可控性和易修改性等性能來得現(xiàn)實(shí)。例如,一個(gè)以英語為母語的機(jī)器翻譯系統(tǒng)用戶并不會(huì)在意系統(tǒng)把“吃藥”翻譯成“take medicine”還是“eat medicine”。因此,基于這種考慮,任福繼教授提出了利用超函數(shù)(Supper-Function, SF)建立原語言輸入與目標(biāo)語言輸出之間映射關(guān)系的實(shí)現(xiàn)思路。具體地講,這種方法不像其它基于分析的機(jī)器翻譯系統(tǒng)一樣對(duì)原語言句子進(jìn)行徹底的句法和語義分析,而是通過構(gòu)造SF來建立原語言句子模板和目標(biāo)語言句子模板的對(duì)應(yīng)關(guān)系 [Ren, 1999a]。問題的關(guān)鍵是如何獲取SF。[Ren, 1999b] 和 [Ren et al., 2000]介紹了一種機(jī)器輔助的從雙語對(duì)照語料中獲取SF的基本方法。實(shí)際上,這種基于SF的直接翻譯方法,在本質(zhì)上與統(tǒng)計(jì)模型和模板方法是完全一直的。
日本ATR-SLT (Spoken Language Translation Laboratories)研究所的Yamamoto等人提出了一種基于輸入語句改寫的口語翻譯模型,稱之為Sandglass翻譯模型[Yamamoto et al, 2001, 2002;Zong, 2001; 宗,2002b]。這種翻譯方法的一種解釋是當(dāng)翻譯引擎不能實(shí)現(xiàn)輸入句子的正確翻譯時(shí),讓系統(tǒng)的原語言預(yù)處理模塊自己實(shí)現(xiàn)輸入句子的自動(dòng)改寫,并不斷為翻譯引擎提供原來語句另外可能的表達(dá)形式。其基本思想是借鑒和模擬人在進(jìn)行口語翻譯時(shí)的基本模式。另一種解釋是,由于翻譯模塊能夠處理的語言現(xiàn)象往往是有限的,如果系統(tǒng)原語言預(yù)處理模塊能夠生成輸入語句的其它多種表達(dá)形式,那么這些表達(dá)形式中只要有一個(gè)落入到系統(tǒng)可以處理的有限的句型集之內(nèi),系統(tǒng)就可以得到原輸入語句的正確翻譯結(jié)果。Sandglass翻譯模型的直接效果是把復(fù)雜的原語言解析任務(wù)從翻譯模塊中分離出來,讓原語言本身來表達(dá)輸入語句的含義,翻譯模塊可以采用簡(jiǎn)單的轉(zhuǎn)換方法,例如:模板直接匹配等方法,實(shí)現(xiàn)有限集內(nèi)原語言到目標(biāo)語言的翻譯轉(zhuǎn)換。
實(shí)際上,Sandglass口語翻譯模型面臨許多新的問題和技術(shù)難點(diǎn),而且,人們最容易提出這樣一個(gè)問題:如果系統(tǒng)能夠?qū)υ斎胝Z句進(jìn)行分析和改寫,那么,為什么不直接將其翻譯呢?
后來,人們提出了基于簡(jiǎn)化表達(dá)式的語音翻譯方法[Zong et al., 2000b]等多種方法??偲饋碚f,非傳統(tǒng)方法基本上都是在傳統(tǒng)方法的基礎(chǔ)上進(jìn)行的改造。
3.3 人機(jī)互助的混合翻譯方法
人機(jī)互助的混合翻譯方法是指多種翻譯策略并用的多引擎交互式口語翻譯方法。目前從事的語音翻譯研究都是針對(duì)推進(jìn)式的對(duì)話方式(push-to-talk dialogue),即兩個(gè)持不同語言的說話人之間的對(duì)話過程是按每人一句進(jìn)行的,也就是說當(dāng)一方說完以后,系統(tǒng)把該說話人的語句翻譯完畢并發(fā)送給對(duì)方,對(duì)方聽完來自彼端說話人的翻譯語音后才開始發(fā)音。在這種情況下,翻譯人員(翻譯器)可以有機(jī)會(huì)與說話人溝通,在實(shí)施翻譯之前翻譯(器)可以主動(dòng)地與說話人對(duì)話,弄清說話人使用的詞匯,確認(rèn)說話者的意圖。我們認(rèn)為,在這種對(duì)話翻譯系統(tǒng)中,中間翻譯角色必須具備與說話人對(duì)話的能力,即翻譯者與說話人之間應(yīng)該是交互式的,而不是單向的。但從目前研究情況來看,除了JANUS系統(tǒng)外,幾乎都不是人機(jī)交互式的,人們只是在原語言識(shí)別和分析技術(shù)上下功夫,一廂情愿地希望能夠通過改進(jìn)識(shí)別技術(shù)和翻譯策略來提高系統(tǒng)翻譯的正確率和魯棒性,但實(shí)際上這有點(diǎn)兒徒勞無功,因?yàn)楫吘谷苏f話是無法控制的,說話人愿意怎么講就怎么講,想到哪里就說到哪里,根本不像書面語那樣經(jīng)過深思熟慮,并且有表達(dá)符號(hào)標(biāo)記,而且說話人可能隨時(shí)對(duì)前面說過的話進(jìn)行修正,在這種情況下讓系統(tǒng)無論“聽懂”還是“聽不懂”硬去翻譯,根本不給系統(tǒng)提問的機(jī)會(huì),這有點(diǎn)兒不合情理,好像翻譯器和說話人也都是不負(fù)責(zé)任的,說話人不管系統(tǒng)是否理解,只管說,系統(tǒng)則不管理解的對(duì)與錯(cuò),只管翻。以這種方式實(shí)現(xiàn)的語音翻譯系統(tǒng)的正確率和魯棒性至今沒有根本性的改進(jìn)和提高也似乎是情理之中的事情。
近幾年中人們提出了一些交互式翻譯的設(shè)想[Waibel, 1996; Boitet, 1996; Blanchon, 1996; Seligman, 1997, 1998],但通過對(duì)這些交互式口語翻譯系統(tǒng)的分析我們發(fā)現(xiàn),其交互過程都是針如何校對(duì)語音識(shí)別器的錯(cuò)誤結(jié)果進(jìn)行的,這種實(shí)現(xiàn)思想的出發(fā)點(diǎn)都是認(rèn)為機(jī)器翻譯模塊只能接受100%正確的輸入語句。而實(shí)際上這是不現(xiàn)實(shí)的,一方面,語音識(shí)別器不可能做到無錯(cuò)誤識(shí)別,尤其說話人在復(fù)雜環(huán)境下;另一方面,說話人與系統(tǒng)之間的交互過程勢(shì)必要影響系統(tǒng)的實(shí)時(shí)性,更重要的是說話人是否愿意使用這樣一個(gè)繁瑣的需要不停地校對(duì)錯(cuò)誤的用戶界面,用戶所能夠忍受的極限有多大?進(jìn)一步分析,即使機(jī)器翻譯模塊接收到的輸入是完全正確的,系統(tǒng)就一定能夠得到正確的輸出嗎?顯然未必。那么,問題就在于系統(tǒng)是否能夠真正“理解”說話人的意圖,如果系統(tǒng)一旦發(fā)現(xiàn)輸入語句中存在無法消除的歧義,系統(tǒng)如何與說話人進(jìn)行交互,向說話人獲取系統(tǒng)想要得到的知識(shí)。因此,基于這樣的考慮我們提出了基于對(duì)話管理的交互式語音翻譯方法[Zong et al., 2002],在這個(gè)交互式翻譯框架下,我們提出了基于填充槽的翻譯方法(Slot-based translation)。
譯雅馨深圳翻譯認(rèn)為,基于對(duì)話管理的交互式口語翻譯方法基本上模擬了人的翻譯過程,該方法不但可以方便地集成傳統(tǒng)翻譯方法和非傳統(tǒng)翻譯方法中的多種翻譯策略,而且可以將語音-語音翻譯和文本-語音翻譯有效地統(tǒng)一起來,有利于推進(jìn)口語翻譯系統(tǒng)的盡早實(shí)用化。
3.4 分析方法與統(tǒng)計(jì)方法的比較
分析方法與統(tǒng)計(jì)方法一直是自然語言處理中采用的兩大主流方法,實(shí)際上,在我們上面介紹的三種翻譯方法中,分析方法與統(tǒng)計(jì)方法都是不可缺少的兩種基本方法。在過去自然語言處理研究中,尤其是機(jī)器翻譯研究的幾十年中,關(guān)于這兩種方法的優(yōu)劣比較和結(jié)合策略等問題的爭(zhēng)論從來都沒有停止過。2002年日本ATR-SLT的Sumita博士介紹,在ATR進(jìn)行的語音翻譯實(shí)驗(yàn)中,基于事例的翻譯方法的正確率要遠(yuǎn)遠(yuǎn)高于基于統(tǒng)計(jì)的翻譯方法[Sumita, 2002]