互聯(lián)網(wǎng)的迅速發(fā)展使得全球化的進程大大加快了。在此過程中,人與人的交往的方式也相應產生了變化,其中之一就是語言?,F(xiàn)代社會語言的一個重要的特征就是簡潔,只要能夠達到交流的目的,語言的目的就達到了。
以前我們總是以很傳統(tǒng)的信達雅來看待翻譯。這個標準在21世紀似乎不重要了。但是翻譯最基本的一條,即忠實原文還是必須的,否則會出現(xiàn)很“危險”的結果。
那么這就需要標準化。標準化能夠保證譯文的準確,尤其是行業(yè)術語的標準化。
回過頭來看句子,在20世紀,人們似乎更偏好復雜的長句子。但是到了21世紀這個趨勢正在減弱。由于生活節(jié)奏的加快,沒有時間和耐心看長句子,大家更傾向于用簡單的表達方式。把意思說清楚就行了。
拿英語來說,早就提倡plain English,要求平白如話,不要在語言上拽文。這讓我想起1917年1月著名學者胡適發(fā)表的《文學改良芻議》,自此拉來開了中國白話詩的新篇章。由于新詩的蓬勃興起,漢語的變革也經(jīng)歷一場暴風驟雨般的變故,走得比較極端的就是漢語的拉丁化。不過這個運動終歸沒有進行下去,可是簡化字的運動卻邁的步子不小,雖然簡化字直到目前依然有人持不同意見。就連兩岸使用的文字都不一樣。
字、詞、句是每種語言的三種最基本的構成要素?!妒ソ?jīng)·創(chuàng)世紀》中提到了人類多種語言的起源。可是人類語言的復雜性,正在成為互聯(lián)網(wǎng)發(fā)展,乃至全球經(jīng)濟發(fā)展的桎梏。根據(jù)民族語言網(wǎng)(Ethnologue)提供的數(shù)據(jù),目前全球正使用的語言多達7100種,但互聯(lián)網(wǎng)網(wǎng)頁上的語言只占其中的約5%。甚至一些國家的官方語言,例如印地語和斯瓦西里語,也很少為互聯(lián)網(wǎng)所包容。
那么如何解決個問題呢?
肯定要靠翻譯,海量的翻譯,自動的翻譯,滾動的翻譯!專門有人做過研究,語言也是個勢利眼的東西。那個國家的文化科技發(fā)達了,其語言就跟著發(fā)達,法語曾獲此殊榮,德語緊跟其后,現(xiàn)在是英語正在風頭。上個世紀曾弄出所謂的“世界語”(Esperanto),靠這種人工語言來達到無障礙的交流??墒?,這一良好的規(guī)劃徹底失敗了,怎么辦呢?
由于技術的發(fā)展,現(xiàn)在有了新的辦法。計算機輔助翻譯(CAT,computer-aided translation)就算一種。CAT目前在各個行業(yè)中大行其道,例如翻譯藥品說明書、文件聯(lián)機幫助和文檔資料以及術語標準化程度高的文本。從事這項翻譯的叫本地化服務,從業(yè)人員逐漸多了起來。
2009年,中國翻譯協(xié)會本地化服務委員會(簡稱“中國譯協(xié)本地化委員會”)成立,這個領域的自此有了自己的專業(yè)組織。北京大學還專門成立全國首家“軟件與微電子學院”,專門培養(yǎng)本地化人才。經(jīng)過10多年的發(fā)展,本地化的工作已經(jīng)走上正軌。需要強調一點的是,翻譯軟件是競爭的,但術語庫卻是排他的,例如某大公司需要做本地化工作,就需要它提供相應的術語庫,經(jīng)過翻譯軟件翻譯,然后再進行人工校對成文。本地化屬外包(outsourcing)的一種形式。我出錢,你出力,最后的成果是我的。
但是,本地化所完成的工作還是不過是冰山一角,遠遠無法滿足需求。為促進不同地區(qū)之間的溝通,使全球各地區(qū)人群都能參與到數(shù)字經(jīng)濟中,翻譯顯得尤為重要。業(yè)內人士估計,目前全球翻譯市場的年規(guī)模達到370億美元。在新聞出版行業(yè),國內外媒體和圖書出版的交流正越來越火爆。在企業(yè)界,對各類報告、技術手冊和合同文書的本地化需求也非常旺盛。因此在過去多年時間里,市場對翻譯,尤其是優(yōu)質翻譯有著強烈的需求,陪同在國家領導人身旁的同聲傳譯更是公眾矚目的焦點。然而與其他行業(yè)類似,翻譯也正在被科技顛覆。
當前,翻譯開始走出另外二條新的道路。
一是走向眾包(Crowdsourcing),它與外包的最大區(qū)別在于眾包的核心包含著與用戶共創(chuàng)價值的理念。眾包的概念是由美國《連線》雜志的記者杰夫·豪(Jeff Howe)在 2006年6月提出的。豪對“眾包”的定義是: “一個公司或機構把過去由員工執(zhí)行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡的做法。眾包的任務通常由個人來承擔,但如果涉及到需要多人協(xié)作完成的任務,也有可能以依靠開源的個體生產的形式出現(xiàn)。”
目前由包括Facebook和Twitter在內的社交媒體,正嘗試通過眾包模式實現(xiàn)網(wǎng)站提供其他語言的內容。而譯言網(wǎng)等翻譯平臺也在利用眾包的力量去提供其他語言的內容。不過,到目前為止,單純的眾包模式還不完全成功。畢竟,眾包有點兒“非物質刺激”的因素在其中。
一是人工智能的發(fā)展推動了機器翻譯的進步。在國外,許多科技巨頭均利用人工智能技術去提供翻譯服務,例如近期引人關注的Skype Translator。在國內,百度、金山、網(wǎng)易有道、科大訊飛也都在開發(fā)類似的技術。人工智能翻譯的發(fā)展尤其值得關注。目前,在谷歌翻譯應用中,只需將攝像頭指向希望翻譯的文字,用戶就可以立即獲得翻譯結果。到今年夏季,谷歌這一服務已支持27種語言的實時語音翻譯,以及37種語言的文字翻譯。谷歌軟件工程師奧塔韋·古德在技術研發(fā)博客上表示,為了實現(xiàn)這一目標,谷歌收購了現(xiàn)實增強翻譯應用Word Lens,并利用機器學習和卷積神經(jīng)網(wǎng)絡技術去加強該應用,而圖像識別是最關鍵的一點。即便是這樣,人工智能不過是許多翻譯技術公司正在嘗試新模式,也就是在翻譯眾包的基礎上加上人工智能。
這或許代表了翻譯的未來發(fā)展趨勢。人工智能首先完成最基本的翻譯。在拿到來自機器的初步翻譯結果后,眾包的普通譯者首先對機器翻譯的差錯進行更正。隨后,高級譯者將對翻譯后文本的文學性和專業(yè)性做進一步修訂。這樣的流水作業(yè)將帶來更高的效率,同時確保質量。
機器學習技術也會參與這一過程。通過機器學習,計算機將基于人工修訂后的結果學到準確的單詞表達,以及人類的語言習慣,從而優(yōu)化未來的翻譯能力。另一方面,計算機也會對人工翻譯的“硬性”部分進行追蹤,幫助譯者避免低級錯誤。在這一過程中,人工智能和人工翻譯將形成良性循環(huán)。
人工智能對人工翻譯的幫助還不僅于此。例如,在眾包譯者工作的同時,人工智能將會了解不同譯者具備的專業(yè)性。通過對這類數(shù)據(jù)的收集和分析,人工智能可以向不同譯者分配他們擅長的翻譯內容。例如,關于計算設備說明書的翻譯將精準分配至電腦專家,而財務報告的翻譯將可以由會計專業(yè)的譯者來擔綱。這種模式正在引起全球投資人的關注。例如,硅谷創(chuàng)業(yè)孵化器Y Combinator在2014年冬季班時孵化了這樣一家公司Unbabel。與傳統(tǒng)人工翻譯相比,人工智能的引入提高了效率,而不同于單純的機器翻譯,人工翻譯使翻譯的表達更準確、更流暢,更適合用于正式場合。
對于尚未被納入互聯(lián)網(wǎng)的少數(shù)族裔語言,這種模式將帶來明顯幫助??梢灶A見,通過統(tǒng)一的人工智能數(shù)據(jù)庫,谷歌、雅虎、Facebook等網(wǎng)站將自動翻譯成非洲、南亞或印第安語言,而當?shù)刂驹刚呖梢栽诖嘶A上高效的完成優(yōu)化。這將消除互聯(lián)網(wǎng)向貧窮國家普及過程中的語言障礙,成為真正連接全世界的“信息高速公路”。