今天一早來到國際會議中心,本以為就是日常做會的一天,沒想到被深深惡心了一把。
剛箱子里坐下,就聽說要直播。我想,哦好吧,反正不是第一次。我們收拾收拾就準備開會了。
第一位教授是位日本教授,英語非常的酸爽。因為要直播嘛,我們肯定比平時更緊繃一些,這時我就注意到兩邊大屏幕下有實時字幕。
然后我又仔細審視了一下字幕
嗯,看來不太聽得懂日本教授的英語,哦應該可以說是胡話連篇了。再看了看左邊
這個完全就是語音識別的我搭檔的輸出啊,不然“就是”這種詞怎么會出現(xiàn)在譯文里呢?這種詞是我們順句驅(qū)動時用于聯(lián)系語句用的。而且當翻譯到說分析“步態(tài)”的時候,上面顯示“不太”,在我翻譯“Davos Forum”的時候,上面顯示“Devils Forum”,完全和源語言內(nèi)容對不上啊,就自然不可能是翻譯了。
到這里我心里就很不爽了。因為從觀眾的角度來看,右邊有英語識別(雖然經(jīng)常不通),左邊有譯文(雖然經(jīng)常跟右邊對不上),加上“訊飛聽見”幾個大字,那肯定是科大訊飛牛逼的AI翻譯啊!而且我甚至能腦補出科大訊飛被戳穿后的辯詞:“我們這次使用的產(chǎn)品是訊飛聽見,識別同傳的翻譯打在屏幕上方便聽眾,并無意冒充AI同傳,對惡意造謠者,我們保留訴諸法律的權(quán)力”之類的,感覺真的無言以對。
但是會議畢竟在進行,我們也只能吃到蒼蠅咽下去默默忍著好好翻譯。其實過程中我也真考慮過得空的時候在話筒里說“本次翻譯由同聲傳譯員王xx提供”之類的,但最終想想還是算了,到時候人家倒打一耙說其實很尊重同傳,我這么一來是給科大訊飛潑臟水,被害妄想,人家根本沒這個意思,那就更惡心了。想到這里我就覺得還是算了,就好好翻完就得了。
然后好戲開始是在下午。我在翻譯一輪換下來之后得知,說這個會在知領有直播,里面有同傳。但是!里面的聲音是機器人,讀的就是翻譯被訊飛識別轉(zhuǎn)化成的文本??!
我看了這個氣得汗毛都立起來了,這就是赤裸裸的欺騙??!明明就是我們輸出的翻譯內(nèi)容,不給我們原音放出去,一定要把語音識別的文本(還各種錯誤)用機器人讀?然后我們同傳農(nóng)藥群的小伙伴發(fā)現(xiàn)了這個:
注:這里的視頻進行了更換,第一段視頻是原來的第一段視頻截取機器語音部分;第二段視頻截取機器語音部分價值不大,我就放上了一段新視頻,依然只有機器語音部分。
這里首先是講者說可以挖掘數(shù)據(jù),放入圖表,翻譯內(nèi)容是"I can mine this data and put it in charts(我可以挖掘數(shù)據(jù)并放入圖表) to represent the status of the machine, we call it initial monitoring(以此表示機器的狀態(tài),我們稱之為初步監(jiān)控)",但訊飛識別成了"minus data(減數(shù)據(jù)?)"和"put it in charge(讓它負責?)"甚至是“college condition monitoring(大學狀態(tài)監(jiān)控??)”,我們看直播流中的同傳毫不猶豫地按照錯誤的識別文本讀了出來。很顯然,mine this讀音接近minus,put it in charts接近put it in charge,然后大概是call it給識別成了college。這些內(nèi)容語音很接近,但是意思完全對不上。如果真是翻譯,那對比下源語言內(nèi)容,minus、in charge和college從何而來?
這段視頻,問題主要是15秒開始,本身譯文應該是"we give the data and try to analyze them and try to figure out the issues within the machine.(我們給予數(shù)據(jù),分析它們,并努力找到機器的問題)"但是是機器識別成了“analyze some(分析一些?)”。這自然也很清楚,them發(fā)音是接近some的,但是把some放在這里是完全語義不通。所以顯然這個機器語音是在朗讀文稿而不是進行翻譯。
收集完了這些證據(jù)我第一時間就開始寫這篇文章,要揭露一下所謂智能翻譯的真相。而且我要鄭重說一下,科大訊飛事前沒有告知有語音識別的字幕,沒有告知直播的同傳是機器朗讀同傳經(jīng)過識別出來的文稿,更沒有征得同意就冒名使用了譯員翻譯成果,這種行為,不知道有沒有哪位懂得法律的朋友告訴我算不算侵犯知識產(chǎn)權(quán)呢。當然我對于我國目前的法制,尤其在知識產(chǎn)權(quán)方面真的不是很自信,應該不會有后續(xù)的追責,但我覺得必須要在各個社交媒體平臺上把這件事亮出來,讓大家看看。這次會議是免費向公眾直播,不存在保密問題,也正好是一個機會讓大家見識一下科大訊飛的實力(當然了,萬一產(chǎn)生了點影響還能見識下科大訊飛的公關能力)。
也許有一天AI真的能做到理解自然語言,也許有一天我們這個職業(yè)會失業(yè),但絕不是現(xiàn)在;真正突破性的技術(shù)也不可能由一個沒有操守的公司研發(fā)出來。技術(shù)是無罪的,但以技術(shù)為名吸引資本的目的會不會導致虛假包裝和營銷呢?呵呵呵呵。