我仍舊認(rèn)為,以Google Translate目前的水平,依然尚未達(dá)到中文媒體所吹捧的那種“可以替代人工翻譯”的程度。不管是針對文學(xué)作品,還是學(xué)術(shù)論文,甚至日常的辦公(比如網(wǎng)站的英文對照)來說。取得突破性進(jìn)步并不是我們忽略瑕疵和不完美的理由。關(guān)于這一點(diǎn),Google同樣在其博客中給出了對比說明(見下圖):
注:頂上虛線為完美的翻譯;紅線為人工翻譯水平;綠線為谷歌神經(jīng)機(jī)器翻譯(GNMT)水平,藍(lán)線為基于短語的機(jī)器翻譯(PBMT)。
在給出的五個語言對中,我們可以明顯地看到,同屬于印歐語系的英語、法語和西班牙語在互譯時,GNMT水平則更加接近于人工翻譯水平。而漢語屬于漢藏語系,所以不管是漢譯英還是英譯漢,GNMT和人工翻譯之間尚有一定的差距。
具體來講,我認(rèn)為GNMT的困難之處仍有以下幾個方面,這也可能是Google正在試圖解決可以繼續(xù)提升的方向(以下以中英翻譯為例):
1. 成語、諺語、歇后語的翻譯。Google需要將中英詞典中現(xiàn)成的詞條集成到自己的翻譯數(shù)據(jù)庫。這個對于Google來說難度不大。(知乎網(wǎng)友拿《百年孤獨(dú)》的開頭調(diào)教GNMT,簡直太傻,他大概沒想到Google Translate的爬蟲可能早已爬過這句的各種譯法并利用算法做了最佳優(yōu)化。)
2. 流行語的翻譯。這也是這次社交網(wǎng)絡(luò)上網(wǎng)友們各種奇葩例子所詬病的。不過據(jù)說GNMT用的是和AlphaGo同樣的一套智能系統(tǒng),所以這個對于Google來說難度也不大。畢竟那條Alpha狗具有超強(qiáng)的自我學(xué)習(xí)能力,輔之以Google龐大的信息庫,超越人類,指日可待。(有網(wǎng)友發(fā)現(xiàn),“圖樣圖森破”的翻譯已經(jīng)更新了。LOL)
3. 詩詞的翻譯。在目前翻譯版本參差不齊和數(shù)據(jù)不全的情況下,這可能是一個難點(diǎn)。不過新版的GNMT提供了在線更正/更新功能供用戶使用。有一點(diǎn)類似于維基百科的貢獻(xiàn)與共享模式。眾人拾柴火焰高,大家一起建立翻譯記憶庫(Translation Memory)。
4. 翻譯時同義詞、近義詞的選擇(尤其是形容詞)困難??赡軡h語作為一種表意語言,所以英譯中時這個問題會更加突出和困難。尤其在文學(xué)作品的翻譯中,這一點(diǎn)將會被更加明顯地放大。這屬于GNMT需要分析翻譯對象所處的上下文語境(Context)的情況之一。
5. 中文語言中介詞的模糊使用導(dǎo)致的翻譯困難。不同于詞性和語法清晰的英文,中文在太多的情景下,介詞是模糊使用甚至省略的。亦可以說是中文狀語要遠(yuǎn)遠(yuǎn)比英文狀語表現(xiàn)地曖昧(包括時間、地點(diǎn)、方式等等)。所以這也是另一種需要分析上下文語境的情況。
6. 中英文時態(tài)和語態(tài)的差異給翻譯帶來的困難。眾所周知,中文的動詞本身不會因?yàn)闀r態(tài)的不同而產(chǎn)生變形,表達(dá)過去、現(xiàn)在和將來更多的是靠不同的助詞或者嘆詞或者時間名詞來完成(比如強(qiáng)調(diào)過去式或者完成式可能需要用“了”,而口頭強(qiáng)調(diào)將來式通常并不會生硬地去講“我將要如何”而是直接用“明天”一詞輔助。)語態(tài)就更不用說,講“挨罵”一定比“被罵”地道的多,使用頻率也高。
7. 中英文句子結(jié)構(gòu)和語法的差異帶給GNMT的翻譯困難。中文是有語法的,但是講中文的時候我們又很少顧及語法。而英文不管是句子結(jié)構(gòu),還是語法,遠(yuǎn)比中文要來得嚴(yán)格縝密。這樣大結(jié)構(gòu)的差異則會帶給Google Translate巨大的困難。所以如果你用新的GNMT分別測試簡短的句子和復(fù)雜的長句,翻譯表現(xiàn)則有云泥之別。
因此,Google Translate雖然在取得里程碑式的突破技術(shù)的同時,但要想達(dá)到人工翻譯的水平,甚而向“完美的翻譯”(Perfect Translation)看齊,仍有很長的路要走,很多的困難亟待解決。但是,以當(dāng)前的科技(比如人工智能)發(fā)展速度推測,機(jī)器的進(jìn)步和提升一定會越來越快,進(jìn)而對相關(guān)行業(yè)產(chǎn)生顛覆性影響,比如可以遇見的便是,語言學(xué)習(xí)的必要性會越來越低,語言教師和翻譯人員的需求同樣會降低,再或者翻譯公司和語言培訓(xùn)機(jī)構(gòu)的倒閉,再近一點(diǎn),計(jì)算機(jī)輔助翻譯工具(CAT:Computer Aided Translation,比如當(dāng)前流行的Trados、MemoQ、雪人等)的消失和各大高校MTI專業(yè)的不再吃香。
這也是歷史發(fā)展的必然趨勢,和18世紀(jì)蒸汽機(jī)的發(fā)明引起的第一次工業(yè)革命最終解放手工勞動有著相同的原理。
機(jī)器翻譯遠(yuǎn)未達(dá)到替代人工的程度
作者:江蘇翻譯小編(南京翻譯公司)
發(fā)布時間:2018-08-28 23:12????
瀏覽量: