本文約3200字,建議閱讀8分鐘

本文為你介紹一款在線機器翻譯軟件DeepL。


標簽:前沿成果

最近,一款在線機器翻譯軟件在日本大火。


這款翻譯軟件名叫DeepL,大火的原因正是因為它工作太負責了,翻譯得太過準確,在日本引起了熱議。

從日本網(wǎng)友的民間測評來看,不僅日語方言翻譯效果杠杠的,連文言文也被拿下,要知道,這可是連谷歌翻譯都無法做到的事。


但是有多精確呢?作為一個嚴謹?shù)目萍架浖?,當然還是要用數(shù)據(jù)來說話,DeepL官方也公開了日英互譯和中英互譯的盲測結(jié)果,如下圖所示,可以看出,DeepL簡直就是碾壓級的存在嘛:


盲測就是在專業(yè)譯員評審們不知道哪個翻譯版本是由哪個網(wǎng)站翻譯的情況下,對翻譯文本進行評估,這也一直是DeepL的測試方式之一。

DeepL由于極好的準確性,也同樣引爆了Reddit,有網(wǎng)友指出,DeepL不是像谷歌翻譯那樣從字詞上進行翻譯,從Textractor的設(shè)置上可以看到,DeepL還支持用以前的翻譯作為上下文對翻譯結(jié)果進行改善。


也有不少網(wǎng)友直呼“DeepL牛逼”!


3年前,DeepL剛出現(xiàn)在大眾視野的時候就已經(jīng)吸引到了不少目光,DeepL首席執(zhí)行官GereonFrahling曾表示,DeepL的目標不止于翻譯任務,神經(jīng)網(wǎng)絡將從理解文本開始,開啟更多可能。

至于更多可能是如何被開發(fā)出來的,我們做了一次小小的測評,然后再一起來圍觀DeepL的發(fā)家史,小板凳已經(jīng)放好,歡迎就坐~

方言、文言文、學術(shù)論文,機器翻譯神仙打架!

不管是民間測評還是DeepL官方的盲測結(jié)果,都暗示著DeepL可能是目前準確率最高的機器翻譯,到底成色怎樣,還是要親自動手試試才知道。

既然本次更新也包含了簡體中文,抱著一點點的懷疑和一點點的好奇,我們也對DeepL進行了一次簡單的測評,和目前主流的谷歌翻譯、微軟翻譯、百度翻譯、有道翻譯進行了比較。

本次測評分為三輪,第一輪方言,第二輪文言文,第三輪學術(shù)論文。好,現(xiàn)在我們有請五位選手入場。

第一輪,我們來看看方言。

大家都知道,中國方言文化博大精深,要是不能正確譯出方言,那這個準確率還是要打上問號的。

我們選擇了東北話十級題目:“我嘞個去,你長得也太磕磣了”。本題有兩個得分點,一個是“我嘞個去”,一個是“磕磣”。讓我們來看看五位選手的表現(xiàn)。

在第一個得分點上,谷歌翻譯成了“I'llgothere”,微軟和百度認為這是“I'llgo”的意思,有道則給出“Idon'tknow”的答案,DeepL表現(xiàn)很好,正確翻譯成了帶有驚訝語氣的“ohmygod”。

在第二個得分點上,五位選手都給出了不同的答案,谷歌“shy”、微軟“snobful”、百度“shabby”、有道“bad”,DeepL“ugly”。

從得分點上看,百度在第二題表現(xiàn)尚可,有道…勉強過關(guān)吧,谷歌和微軟則全軍覆沒。我們來欣賞一下DeepL的滿分試卷:


這才第一題,不要擔心,還有翻身的機會。接下來我們來看看文言文,既然DeepL都能翻譯古日文,要是不能翻譯古漢語可就不對了。

第二輪,文言文。

文言文部分我們以著名唐代詩人張九齡《望月遠懷》中的名句“海上生明月,天涯共此時”為考題,這句詩的意思是,在遼闊無邊的大海上升起一輪明月,使人想起了遠在天涯海角的親友,他此時此刻也該是望著同一輪明月吧。

本題的得分點是看看各位選手能否用英文把整句詩的意境表達出來。好了,中文版的標準答案已經(jīng)公布,那么五位選手的表現(xiàn)如何呢?

首先從句意上看,谷歌、微軟和百度都直接放棄了后半句的翻譯,有道把后半句譯成“Tianyaatthistime”;在前半句的翻譯上,微軟和百度都用到了born這個詞,但是微軟的譯文是“Theseaisborn”????

我們來看看DeepL,前半句和谷歌的答案一模一樣,但是后半句的翻譯是不是達到了信達雅的水平我們不知道,但是讀上去感覺非常舒服,大家也來品品:


第三題,也是最后一道壓軸題,我們要考察的是各位選手對學術(shù)論文的中英互譯。

學術(shù)論文的關(guān)鍵除了語句通順外,還需要在專業(yè)詞匯上做到準確,這也是本次考察的重點。

中譯英部分,我們選擇的是去年刊登在《國際新聞界》上的一篇文章,研究者調(diào)查的是社交媒體信任對隱私風險感知和自我表露的影響。

原文:實證結(jié)果顯示:1.隱私風險感知與自我表露并無顯著相關(guān)性;2.社交媒體信任負向影響用戶的隱私風險感知,網(wǎng)絡人際信任在其中發(fā)揮中介作用;3.社交媒體信任正向影響用戶的自我表露,網(wǎng)絡人際信任在其中發(fā)揮中介作用。

從翻譯結(jié)果上看,五位選手給出的答案都比較讓人滿意,句型和語法也都沒有問題,只是在一些具體的用詞上各有千秋。比如,“自我表露”,DeepL和微軟用的是“self-expression”,其余三位選手用的是“self-disclosure”;而“網(wǎng)絡人際信任”,有道、百度和微軟譯成“networkinterpersonaltrust”,谷歌給出“onlineinterpersonaltrust”的答案,DeepL則譯為“cyber-interpersonaltrust”。

照例,我們還是來看看DeepL的答案。


在英譯中部分,我們選擇了帝國理工大學論文的導論部分。在用戶體驗上我們要插播一下,從中譯英切換到英譯中的時候,只有百度、有道和DeepL做到了自動識別,谷歌和微軟仍需要手動選擇語言。

原文:TheglobalimpactofCOVID-19hasbeenprofound,andthepublichealththreatitrepresentsisthemost,weassessthepotentialroleofanumberofpublichealthmeasures–so-callednon-pharmaceuticalinterventions(NPIs)–aimedatreducingcont,weapplyapreviouslypublishedmicrosimulationmodeltotwocountries:theUK(GreatBritainspecifically)likelytobelimited,requiringmultipleinterventionstobecombinedtohaveasubstantialimpactontransmission.

從結(jié)果上看,五位選手的學術(shù)造詣都比較高,學術(shù)語言使用的規(guī)范性也都相差不大。但是,細節(jié)見真知,只有有道保留了雙破折號的使用,但這在中文中其實并不常見;除有道外,其他三位選手在“非藥物干預措施(NPI)”的表達上都沒有做到盡善盡美。

仍然,笑到最后的還是DeepL,雖然還存在各種小問題,無法得到滿分,但也是一張妥妥的高分試卷了:


以上就是本次測評全部的考題了,可以看出DeepL不愧是頭號種子選手,不管是方言、文言文還是學術(shù)話語,都有不錯的表現(xiàn),看來DeepL官方還是很誠實的嘛。

從Linguee蛻變,機器學習賦能DeepL

見識到了DeepL的“獨秀”表現(xiàn),接下來,我們就重點介紹一下本次測評表現(xiàn)最佳的頭號種子DeepL。

不知道DeepL?那Linguee應該聽說過吧,就是那個運營十多年的在線外語詞典,DeepL的前身正是Linguee。Linguee是一款出現(xiàn)多年的翻譯工具,盡管使用廣泛,也有一批忠實用戶,但其翻譯質(zhì)量尚無法與谷歌翻譯相提并論,尤其是考慮到后者品牌和地位的巨大優(yōu)勢。

但真正重要的是Linguee的技術(shù)積累,Linguee的聯(lián)合創(chuàng)始人GereonFrahling之前就在谷歌研究院工作,2007年,他選擇開啟新的征程,團隊數(shù)年來一直致力于機器翻譯,直到2016年,他們才開始全力開發(fā)全新的系統(tǒng),建設(shè)新公司,也就是DeepL。

Linguee的核心競爭優(yōu)勢就是爬蟲和機器學習系統(tǒng),前者能夠抓取互聯(lián)網(wǎng)上超過10億句翻譯結(jié)果和查詢的大型數(shù)據(jù)庫,后者在網(wǎng)頁上搜索相似片段的真實翻譯方法并對其評估,兩者結(jié)合使Linguee成為了當時“世界上首個翻譯搜索引擎”。

十年積累下來,Linguee無論在數(shù)據(jù)和對算法的研究上都不可小覷,而這也直接成為DeepL的絕對優(yōu)勢,為團隊訓練新模型打好了堅實的基礎(chǔ)。


DeepL變革性的神經(jīng)架構(gòu)在冰島的一臺超級計算機上運行,該計算機能力為5.1petaFLOPS(每秒5100萬億次操作),不到一秒內(nèi)能翻譯100萬單詞?!氨鶏u可再生能源豐富,因此我們可以在這里用非常低廉的成本訓練我們的神經(jīng)網(wǎng)絡。我們將繼續(xù)專注于高性能硬件”,DeepL的CTOJaroslawKutylowski說。

“我們的神經(jīng)網(wǎng)絡架構(gòu)已經(jīng)實現(xiàn)了多個顯著改善”,GereonFrahling表示,“通過用不同的方式安排神經(jīng)元及其連接,我們的網(wǎng)絡比目前其他神經(jīng)網(wǎng)絡更全面地映射自然語言?!?/p>

大學、研究機構(gòu)和Linguee的競爭對手發(fā)布的研究進展表明,卷積神經(jīng)網(wǎng)絡才是機器翻譯的正確道路,而非DeepL之前使用的循環(huán)神經(jīng)網(wǎng)絡,但現(xiàn)在不是探討二者區(qū)別的時候,對于相關(guān)詞語的長、復雜字符串,只要你能夠控制其弱點,卷積神經(jīng)網(wǎng)絡效果會更好。

例如,CNN一次處理一個單詞,當句末單詞決定句首單詞的形成時,這就成了問題。查找整個句子尋找句首單詞,如果網(wǎng)絡獲取到的第一個單詞是錯誤的,就太浪費了,還得使用該知識重新開始,因此DeepL和機器學習領(lǐng)域的其他機構(gòu)在CNN轉(zhuǎn)向下一個單詞或詞組時,使用能夠監(jiān)控此類潛在問題的“注意力機制”來解決。

DeepL在最新版本增加了對日語和中文(簡體)的支持,包括日語漢字,平假名和片假名以及數(shù)千個漢字。目前,DeepL支持的語言數(shù)量增加到11種,雖然語言支持不如其他翻譯服務廣泛,如GoogleTranslate和BingMicrosoftTranslator均支持一百多種不同的語言,但翻譯精度也是不可忽視的關(guān)鍵點。

掌握多國語言的Techcrunch編輯Frederic曾這么評價DeepL:“谷歌翻譯的風格非常直接,但卻錯過了一些細節(jié)和習語(或者把這些習語翻譯錯了),而DeepL經(jīng)??梢蕴峁└幼匀坏姆g效果,就像訓練有素的人類翻譯一樣?!?/p>


說了這么多,還是那句話,真真假假還是自己試了才知道,有興趣的同學可以親自動手試試,要是遇到什么好玩的翻譯結(jié)果還記得告訴我們噢~

最后,官網(wǎng)鏈接雙手奉上:

校對:林亦霖

—完—