人類已經(jīng)阻止不了蘋果翻譯了
編輯導語:就在前幾天,蘋果發(fā)布會因為低于預期,網(wǎng)友紛紛再次發(fā)出“喬布斯之后,蘋果再無創(chuàng)新”的言論,不少人感嘆這次布會毫無亮點,沒有購買的欲望。然而就在兩天后,蘋果憑借 iOS 14 的翻譯功能更新所帶來的驚喜效果而喜提熱搜,這又是什么情況呢?我們來看本文作者的分析。
萬眾矚目的 iOS14 帶來了全新的內(nèi)置翻譯功能,打開它,第一眼看去平平無奇。
翻譯應用本體非常簡潔,在頂端選好互譯的語言后,用戶可以通過文字或語音輸入需要翻譯的內(nèi)容,翻譯后的文字會以藍色字體顯示在下方。
蘋果翻譯目前支持包括:中文、英語、日語、德語、西語在內(nèi)的 11 種常用語。
不過,當我們仔細“把玩”了一下蘋果的這個翻譯軟件后,發(fā)現(xiàn)事情并不簡單。
一開始我們發(fā)現(xiàn),除了日常用語外,連一些不太常見的說法,它也能輕松解決:比如,輸入“快樂肥宅水”后,蘋果翻譯給出的結果直接是“可樂”。
這勾起了我們的興趣,翻出一些上古老梗試了試,居然也忠實地“還原”了——“藍瘦香菇”這一題蘋果給出的答案是“Sad.gif”。
“藍瘦香菇”是2016年火遍網(wǎng)絡的梗,源自一失戀的南寧小哥拍攝的自拍視頻,他用方言表達“難受,想哭”,被“直譯”為了“藍瘦香菇”。
這實在太神奇了,要知道,谷歌翻譯在這一題的答案還是:
我們又接著試了試更多網(wǎng)絡流行語,發(fā)現(xiàn)蘋果翻譯很有自己的想法。輸入“奧利給”后,蘋果翻譯表示這個詞是“酷”的意思。
成精了!
而且,在面對跨文化交流的微妙場合時,蘋果翻譯也沒有輸?shù)簟?/p>
日文的“月色真美”經(jīng)了它的手就變成了“我愛你”,日本網(wǎng)友紛紛表示對蘋果好感大增。
▲夏目漱石白教了
然而隨著先用上 iOS14 的一批人,像我們一樣不斷“試探”蘋果翻譯,大家很快發(fā)現(xiàn),這個應用開始有點不對勁了。
比如輸入“五五開”,出現(xiàn)的英文是“盧本偉”……
盧本偉是一名前斗魚主播,在一次游戲比賽中被問到和比自己實力強大很多的對手比賽什么感受,他強行回答了“五五開”,自此在游戲圈變成這個詞的代名詞,但在游戲圈外,可能并不是所有人都知道這個梗。
▲它不是準確不準確的問題,它真的是那種……那種很少見的那種
而輸入“滾筒洗衣機”,日語直接顯示“工藤新一”,不由讓人替真的需要在日本購買洗衣機的人捏了一把汗。
因為“工藤新一”的日語發(fā)音,聽起來很像滾筒洗衣機。所以許多中國動漫迷會這么稱呼他,但放在一個“正經(jīng)”的翻譯軟件里,是不是太隨意了?
▲雖然從某種程度來講并沒有翻譯錯
至此,蘋果翻譯給人的感覺已經(jīng)從“能精準翻譯出晦澀中文梗的精髓”變成了“這是不是有點太隨意,要耽誤真正想要翻譯的人的正事?”的疑惑了。
而且,在另一些時候,蘋果翻譯表現(xiàn)得更是好像沉迷于玩爛梗的小鬼。
明明只是普通的一句“一袋米要扛幾樓”,都硬要翻譯成“感受痛苦吧”。因為后者的日文讀音,聽起來就像是中文的一袋米要扛幾樓,諸君可以打開蘋果翻譯一試……
▲也可以輸入“辛辣天塞”試試
類似的翻車時刻越來越多,大家就開始覺得蘋果的“隨心所欲二次元”濃度也未免太高了。
“把玩”至此,我們實在是好奇,是誰“教壞了”蘋果呢?
雖然蘋果一向對自家的技術三緘其口,這次也一樣沒有說明 iOS14 到底用到了什么模型,但我們可以參考蘋果翻譯的老前輩 Google 翻譯。
Google 翻譯用到的是 Seq2Seq (Sequence to Sequence) 模型,Seq2Seq 由兩個循環(huán)神經(jīng)網(wǎng)絡模型協(xié)力組成,一個用于對輸入序列進行編碼,一個用于對輸出序列進行解碼。
當輸入中文“知識就是力量”時,編碼模型把每個字都標上一個矢量,其中每個矢量代表到目前為止已讀取的所有字的含義。在整個句子編碼結束后,解碼器即會開始生成對應的英語句子。
通過分析大量的語料數(shù)據(jù),模型能自動從中學習出相應的語法規(guī)則,也就是說,工程師教給模型什么,模型就學會什么。因此,蘋果的工程師可能為蘋果翻譯 feed 了太多網(wǎng)絡平行語料,導致蘋果翻譯被網(wǎng)絡用語“污染”,而識別不出文本原來的含義。
蘋果翻譯出現(xiàn)失誤的另一個可能性是,蘋果翻譯引入了知識圖譜。
知識圖譜是 Google 于 2012 年提出的概念,本質上是一種基于圖的數(shù)據(jù)結構。在知識圖譜中,每個名詞(又叫實體)都是一個節(jié)點,每個節(jié)點間又有邏輯關系線相連。
通過這種知識圖譜,神經(jīng)網(wǎng)絡能更好地理解上下文之間的關聯(lián)。
▲一種知識圖譜示意圖
也許在蘋果翻譯構建的知識圖譜中,“五五開”被鏈接到“盧本偉”這個實體,而這個實體又可以被翻譯為“Lu Benwei”;同理,“滾筒洗衣機”也可能被鏈接到了“工藤新一”這個實體。
因為網(wǎng)絡平行語料和知識圖譜的存在,翻譯模型在面對獨立的名詞時很容易翻車。比如說“瓜皮”,蘋果直接按方言理解,翻譯成“笨蛋”。
▲ “方言本當上手”
不過,根據(jù)我們對它原理的判斷,想要更準確的翻譯,解決方法之一就是在蘋果翻譯出現(xiàn)錯誤時,我們可以嘗試為文本添加上下文,來幫助模型更好地理解。
比如把“瓜皮”改成“我不吃瓜皮”,把“滾筒洗衣機”改成“滾筒洗衣機多少錢”。
蘋果的這些翻譯確實帶來了很多樂趣,但當人們真的需要用它來完成跨語言溝通時,又不由得捏一把汗。
現(xiàn)在問題來了,這樣的蘋果翻譯你喜歡嗎?
作者:邢逸帆;郵箱:xingyifan@pingwest.com;公眾號:
來源:https://mp.weixin.qq.com/s/0Go9cJIqW2Wtqg88dE-6uw
本文由?@
授權發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉載。題圖來自 Pexels,基于 CC0 協(xié)議
我特別想知道“老五跟老四說老三的老二老大了”蘋果會怎么翻譯……