奇米在线7777在线精品,ā片在线观看免费看无码,亚洲中文无码永久免费

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

人工智能真的可以取代同傳翻譯嗎？

星圖金融研究院

2018-11-05

1 評(píng)論 3226 瀏覽 12 收藏

11 分鐘

前陣子，一位同傳翻譯員聲討科大訊飛“AI同傳造假”，在網(wǎng)上引起了軒然大波，人工智能和同傳翻譯由此成為大家熱議的話題。今天，我們來(lái)談一談“人工智能翻譯是否真的可以取代同傳翻譯員”？

同聲傳譯有多難？

同聲傳譯最早出現(xiàn)在一戰(zhàn)后的巴黎和會(huì)上，英法兩國(guó)代表借助同聲傳譯人員的幫助，完成了緊張的談判。如今，該技術(shù)依然在國(guó)際會(huì)議上扮演著極其重要的角色。據(jù)統(tǒng)計(jì)，95%的國(guó)際會(huì)議都有專業(yè)同聲傳譯人員助力。

同傳翻譯員在臺(tái)上能夠?qū)⑼瑐髂芰\(yùn)用自如，需要平時(shí)大量的艱苦練習(xí)，即使是雙語(yǔ)運(yùn)用自如的專業(yè)人員，在實(shí)戰(zhàn)之前，也要進(jìn)行數(shù)年的鍛煉。他們不僅需要事先學(xué)習(xí)、熟悉會(huì)議資料，還需要隨機(jī)應(yīng)變的能力。同聲傳譯的工作方式也比較特殊，因?yàn)閴毫薮?，一般多人協(xié)同，在一場(chǎng)數(shù)小時(shí)的過(guò)程中，每人輪流翻譯幾十分鐘。

相較之下，普通的口譯工作則要簡(jiǎn)單不少。機(jī)器翻譯如能代替同聲傳譯，無(wú)疑具有巨大的價(jià)值。

人工智能翻譯的水平如何？

那么，人工智能同傳翻譯的能力究竟怎樣？會(huì)不會(huì)搶走同傳翻譯員的飯碗呢？

今年上半年的博鰲亞洲論壇上，首次出現(xiàn)了AI同傳。然而，現(xiàn)場(chǎng)配備的系統(tǒng)卻掉了鏈子，鬧出詞匯翻譯不準(zhǔn)確、重復(fù)等低級(jí)錯(cuò)誤。

客觀來(lái)講，人工智能或機(jī)器翻譯技術(shù)在自然語(yǔ)言處理上，的確有許多突破。這些突破給人希望，讓人暢想未來(lái)，但是，短期內(nèi)的價(jià)值，更多體現(xiàn)在輔助翻譯等領(lǐng)域。

當(dāng)然，目前機(jī)器翻譯已經(jīng)取得非常大的進(jìn)步，在衣食住行等常用生活用語(yǔ)上的中英翻譯可以達(dá)到大學(xué)六級(jí)的水平，能夠幫助人們?cè)谝恍﹫?chǎng)景處理語(yǔ)言交流的問(wèn)題，但距離人工同傳以及高水平翻譯所講究的“信、達(dá)、雅”，還存在很大的差距。

目前的差距是由現(xiàn)有技術(shù)水平的限制決定的，機(jī)器翻譯，又稱為自動(dòng)翻譯，是利用計(jì)算機(jī)將一種語(yǔ)言轉(zhuǎn)換為另一種語(yǔ)言，機(jī)器翻譯技術(shù)的發(fā)展與計(jì)算機(jī)技術(shù)、信息論、語(yǔ)言學(xué)等學(xué)科的發(fā)展緊密相關(guān)。從早期的詞典匹配，到結(jié)合語(yǔ)言學(xué)專家梳理的知識(shí)規(guī)則，再到基于語(yǔ)料庫(kù)的統(tǒng)計(jì)學(xué)方法，隨著計(jì)算能力的提升和多語(yǔ)言信息的積累，機(jī)器翻譯技術(shù)開(kāi)始在一些場(chǎng)景中提供便捷的翻譯服務(wù)。

新世紀(jì)以來(lái)，隨著互聯(lián)網(wǎng)的普及，互聯(lián)網(wǎng)公司紛紛成立機(jī)器翻譯研究組，研發(fā)了基于互聯(lián)網(wǎng)大數(shù)據(jù)的機(jī)器翻譯系統(tǒng)，從而使機(jī)器翻譯真正走向?qū)嵱?，市?chǎng)上開(kāi)始出現(xiàn)比較成熟的自動(dòng)翻譯產(chǎn)品。近年來(lái)，隨著深度學(xué)習(xí)的進(jìn)展，機(jī)器翻譯技術(shù)得到了進(jìn)一步的發(fā)展，促進(jìn)了翻譯質(zhì)量的提升，使得翻譯更加地道、流暢。

機(jī)器翻譯的難點(diǎn)在哪里？

這里，簡(jiǎn)單介紹一下機(jī)器翻譯的難點(diǎn)。整個(gè)機(jī)器翻譯的過(guò)程，可以分為語(yǔ)音識(shí)別轉(zhuǎn)換、自然語(yǔ)言分析、譯文轉(zhuǎn)換和譯文生成等階段。

在此，以比較典型的、基于規(guī)則的機(jī)器同傳翻譯為例（參見(jiàn)下圖），模塊包含了：語(yǔ)音識(shí)別（語(yǔ)音轉(zhuǎn)換為文本）、自然語(yǔ)言處理（語(yǔ)法分析、語(yǔ)義分析）、譯文轉(zhuǎn)換、譯文生成和語(yǔ)音生成等模塊。其中的技術(shù)難點(diǎn)主要是：語(yǔ)音識(shí)別、自然語(yǔ)言處理和譯文轉(zhuǎn)換等步驟。

第一個(gè)技術(shù)難點(diǎn)是語(yǔ)音識(shí)別。

近二十年來(lái)，語(yǔ)音識(shí)別技術(shù)取得了顯著進(jìn)步，開(kāi)始進(jìn)入家電、汽車、醫(yī)療、家庭服務(wù)等各個(gè)領(lǐng)域。常見(jiàn)的應(yīng)用系統(tǒng)有：

語(yǔ)音輸入系統(tǒng)，相對(duì)于鍵盤(pán)輸入方法，它更符合人的日常習(xí)慣，也更自然、更高效；
語(yǔ)音控制系統(tǒng)，即用語(yǔ)音來(lái)控制設(shè)備的運(yùn)行，相對(duì)于手動(dòng)控制來(lái)說(shuō)更加快捷、方便，可以用在諸如工業(yè)控制、語(yǔ)音撥號(hào)系統(tǒng)、智能家電、聲控智能玩具等許多領(lǐng)域；
智能對(duì)話查詢系統(tǒng)，根據(jù)客戶的語(yǔ)音進(jìn)行操作，為用戶提供自然、友好的數(shù)據(jù)庫(kù)檢索服務(wù)，例如家庭服務(wù)、旅行社服務(wù)系統(tǒng)、訂票系統(tǒng)、銀行服務(wù)等。

可以說(shuō)，語(yǔ)音識(shí)別技術(shù)與其他自然語(yǔ)言處理技術(shù)相結(jié)合，可以構(gòu)建出很多復(fù)雜的應(yīng)用。

然而，語(yǔ)音識(shí)別的主要難點(diǎn)就是對(duì)自然語(yǔ)言的識(shí)別和理解。首先必須將連續(xù)的講話分解為詞、音素等單位，其次要建立一個(gè)理解語(yǔ)義的規(guī)則。由于語(yǔ)音信息量大，語(yǔ)音模式不僅對(duì)不同的說(shuō)話人不同，對(duì)不同場(chǎng)景的同一說(shuō)話人也是有差異的。

例如：一個(gè)人在隨意說(shuō)話和認(rèn)真說(shuō)話時(shí)的語(yǔ)音特征是不同的。另外，說(shuō)話者在講話時(shí)，不同的詞可能聽(tīng)起來(lái)是相似的，這也是常見(jiàn)現(xiàn)象。單個(gè)字母或詞、字的語(yǔ)音特性，受上下文的影響，以致改變了重音、音調(diào)、音量和發(fā)音速度等。最后，環(huán)境噪聲和干擾對(duì)語(yǔ)音識(shí)別也有較大影響，致使識(shí)別率低。

第二個(gè)技術(shù)難點(diǎn)是語(yǔ)義解析，這是智能化的機(jī)器翻譯系統(tǒng)的核心部分。

目前，機(jī)器翻譯系統(tǒng)可劃分為基于規(guī)則和基于語(yǔ)料庫(kù)兩大類。前者以詞典和語(yǔ)言知識(shí)規(guī)則庫(kù)為基礎(chǔ)；后者由經(jīng)過(guò)劃分并具有標(biāo)注的語(yǔ)料庫(kù)構(gòu)成知識(shí)源，以統(tǒng)計(jì)學(xué)的算法為主。

機(jī)譯系統(tǒng)是隨著語(yǔ)料庫(kù)語(yǔ)言學(xué)的興起而發(fā)展起來(lái)的。目前，世界上絕大多數(shù)機(jī)譯系統(tǒng)都采用以規(guī)則庫(kù)為基礎(chǔ)的策略，一般分為語(yǔ)法型、語(yǔ)義型、知識(shí)型和智能型。不同類型的機(jī)譯系統(tǒng)，由不同的成分構(gòu)成。

抽象的說(shuō)，所有機(jī)譯系統(tǒng)的處理過(guò)程都包括以下步驟：對(duì)源語(yǔ)言的分析或理解，在語(yǔ)言的語(yǔ)法、語(yǔ)義和語(yǔ)用等平面進(jìn)行轉(zhuǎn)換，按目標(biāo)語(yǔ)言結(jié)構(gòu)規(guī)則生成目標(biāo)語(yǔ)言。

當(dāng)前，Google 的在線翻譯已經(jīng)為人熟知，其第一代的技術(shù)即為基于統(tǒng)計(jì)的機(jī)器翻譯方法，基本原理是通過(guò)收集大量的雙語(yǔ)網(wǎng)頁(yè)作為語(yǔ)料庫(kù)，然后由計(jì)算機(jī)自動(dòng)選取最為常見(jiàn)的詞與詞的對(duì)應(yīng)關(guān)系，最后給出翻譯結(jié)果。

不過(guò)，采用該技術(shù)目前仍無(wú)法達(dá)到令人滿意的效果，經(jīng)常鬧出各種翻譯笑話。因?yàn)?，基于統(tǒng)計(jì)的方法，需要建立大規(guī)模的雙語(yǔ)語(yǔ)料庫(kù)，而翻譯模型、語(yǔ)言模型參數(shù)的準(zhǔn)確性直接依賴于語(yǔ)料的規(guī)模及質(zhì)量，翻譯質(zhì)量直接取決于模型的質(zhì)量和語(yǔ)料庫(kù)的覆蓋面。

除了上述傳統(tǒng)的方式，2013年以來(lái)，隨著深度學(xué)習(xí)的研究取得較大進(jìn)展，基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯逐漸興起。就當(dāng)前而言，廣泛應(yīng)用于機(jī)器翻譯的是長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)。該模型擅長(zhǎng)對(duì)自然語(yǔ)言建模，把任意長(zhǎng)度的句子轉(zhuǎn)化為特定維度的浮點(diǎn)數(shù)向量，同時(shí)“記住”句子中比較重要的單詞，讓“記憶”保存比較長(zhǎng)的會(huì)話時(shí)間。該模型較好地解決了自然語(yǔ)言句子向量化的難題。

其技術(shù)核心是通過(guò)多層神經(jīng)網(wǎng)絡(luò)，自動(dòng)從語(yǔ)料庫(kù)中學(xué)習(xí)知識(shí)。一種語(yǔ)言的句子被向量化之后，在網(wǎng)絡(luò)中層層傳遞，經(jīng)過(guò)多層復(fù)雜的傳導(dǎo)運(yùn)算，生成譯文。這種翻譯方法最大的優(yōu)勢(shì)在于譯文流暢，更加符合語(yǔ)法規(guī)范。相比之前的翻譯技術(shù)，質(zhì)量有較高的提升。

智能同傳翻譯離我們還有多遠(yuǎn)？

需要說(shuō)明的是，很多人對(duì)機(jī)器翻譯有誤解，認(rèn)為機(jī)器翻譯偏差大。其實(shí)，機(jī)器翻譯運(yùn)用語(yǔ)言學(xué)知識(shí)，自動(dòng)識(shí)別語(yǔ)法，模擬語(yǔ)義理解，進(jìn)行對(duì)應(yīng)翻譯，因語(yǔ)法、語(yǔ)義、語(yǔ)用的復(fù)雜性，出現(xiàn)錯(cuò)誤是難免的。就已有的成果來(lái)看，全場(chǎng)景通用的機(jī)器翻譯，其翻譯質(zhì)量離終極目標(biāo)仍相差甚遠(yuǎn)。

隨著全球化網(wǎng)絡(luò)時(shí)代的到來(lái)，語(yǔ)言障礙已經(jīng)成為二十一世紀(jì)社會(huì)發(fā)展的重要瓶頸，實(shí)現(xiàn)任意時(shí)間、任意地點(diǎn)、任意語(yǔ)言的無(wú)障礙自由溝通是人類追求的一個(gè)夢(mèng)想。這僅是全球化背景下的一個(gè)小縮影。在社會(huì)快速發(fā)展的進(jìn)程中，機(jī)器翻譯將扮演越來(lái)越重要的角色。

作者：沈春澤，蘇寧金融研究院金融科技研究中心副主任，公眾號(hào)：蘇寧財(cái)富資訊

本文由 @沈春澤原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自網(wǎng)絡(luò)

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App