一、機(jī)器翻譯研究的歷史階段
機(jī)器翻譯分為三個(gè)階段:第一個(gè)階段是基于規(guī)則的機(jī)器翻譯。那個(gè)階段會(huì)先把文章中打亂的句子變成單詞,之后再查字典,然后進(jìn)行翻譯,翻譯之后,可能中文跟英文并不完全對(duì)應(yīng),需要再按照語法規(guī)則進(jìn)行調(diào)整,最主要是調(diào)序的問題。第二個(gè)階段是基于統(tǒng)計(jì)的機(jī)器翻譯,在 15、16 年之前,我們都是使用這個(gè)方法。第三個(gè)階段是最近幾年的基于多層人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)機(jī)器翻譯。
在近些年間,機(jī)器翻譯在這三個(gè)階段其實(shí)有兩個(gè)重大的變化,一是語法上的,喬姆斯基的生成語法理論,第二就是深度學(xué)習(xí)。原來大家一直對(duì)語義分析犯愁,但是深度學(xué)習(xí)已經(jīng)開始對(duì)語義分析進(jìn)行探險(xiǎn),大家知道詞嵌入的方法,現(xiàn)在把詞向量再進(jìn)一步發(fā)展到句子向量,含有語義信息了。在處理過程中,對(duì)于單語種,比如說詞匯的語義信息,可以把語義相近的靠在一起,不同語種的源語言和目標(biāo)語言的分布式處理辦法,也可以把源語言和目標(biāo)語言語義相近的一起靠。這個(gè)雖然不能說從根本上解決問題,但是減輕了人對(duì)語義分析很大的憂愁。
二、機(jī)器翻譯的難點(diǎn)和重點(diǎn)
語言具有科學(xué)性的一面,也具有藝術(shù)性的一面,所謂藝術(shù)性往往就是突破常規(guī),突破常規(guī)的東西是機(jī)器最難以表現(xiàn)的東西。另外,自然語言具有高度開放性和高度靈活性。在開放性上,如網(wǎng)絡(luò)出現(xiàn)以后,新詞不斷涌現(xiàn),例如粉絲這個(gè)詞匯。在靈活性方面,可以自己隨便去組詞,這些新組成的詞也很讓人頭疼。
語義理解說白了就是對(duì)說話人意圖的理解。意圖理解與上下文有關(guān)系,但是語言本身存在歧義性和多樣性。另外,語言高度依賴知識(shí),大家都知道常識(shí)知識(shí),例如煤球是黑的,元宵是白的,小孩子常說,「地球人都知道」,但是機(jī)器不知道。另外還有領(lǐng)域知識(shí),上下文、語言、環(huán)境等都會(huì)影響對(duì)語義的準(zhǔn)確理解。
人工智能突飛猛進(jìn),解決了很多過去想都不敢想的關(guān)鍵問題,但這只是初步的,它還有好多解決不了的致命問題,比如方才所說的常識(shí)知識(shí),以及思考和邏輯推理的問題,這對(duì)機(jī)器學(xué)習(xí)也是一種制約。我們?nèi)祟愑辛酥R(shí)之后,可以不斷推理和思考,但是人工智能現(xiàn)在還不具備思維和推理能力,特別是不具備前面說的常識(shí)性知識(shí)。
三、機(jī)器翻譯與人工翻譯的關(guān)系
現(xiàn)在的人工智能還只是弱人工智能,不是強(qiáng)人工智能,也不是超強(qiáng)人工智能。現(xiàn)在人工智能的作用,還是用機(jī)器代替簡(jiǎn)單的、重復(fù)的以及危險(xiǎn)性的勞動(dòng),想要解決找不到規(guī)律的問題,人工智能還不能做到,也代替不了人。人要盡量用好機(jī)器這個(gè)助手,自如地運(yùn)用好機(jī)器,這樣既可以提高工作效率,也可以保證質(zhì)量。
最好的翻譯一定是那些對(duì)人工智能系統(tǒng)或者教育機(jī)器深入了解,能運(yùn)用自如的人。把這些作為輔助手段,水平會(huì)越來越高,效果會(huì)越來越好。不是誰淘汰誰的問題,機(jī)器永遠(yuǎn)是人的工具。
翻譯機(jī)永遠(yuǎn)只能是人工翻譯的輔助工具
作者:江蘇翻譯小編(南京翻譯公司)
發(fā)布時(shí)間:2019-01-26 16:29????
瀏覽量: