你可能錯(cuò)過(guò)了香檳瓶塞和自動(dòng)接收器的淋浴,但最近幾個(gè)月,計(jì)算語(yǔ)言學(xué)家開(kāi)始聲稱,神經(jīng)機(jī)器翻譯現(xiàn)在的表現(xiàn)與人類翻譯相當(dāng)。
為你推薦防止皮膚發(fā)皺的藥物這么火,就算這個(gè)有爭(zhēng)議的想法有投資人。
Theranos正在關(guān)閉。
臉書和推特,而不是谷歌,出現(xiàn)在國(guó)會(huì)面前。
準(zhǔn)備好原子收音機(jī)
委內(nèi)瑞拉的新加密貨幣似乎并不存在。
由于機(jī)器學(xué)習(xí)和人工智能的不斷突破,利用神經(jīng)網(wǎng)絡(luò)將文本從一種語(yǔ)言翻譯成另一種語(yǔ)言的技術(shù)近年來(lái)得到了突飛猛進(jìn)的發(fā)展。所以機(jī)器接近人類的表現(xiàn)也就不足為奇了。事實(shí)上,計(jì)算語(yǔ)言學(xué)家有足夠的證據(jù)支持這一說(shuō)法。
但是今天,蘇黎世大學(xué)的Samuel Laubli和幾個(gè)同事說(shuō)香檳應(yīng)該重新開(kāi)始。他們不會(huì)反對(duì)他們同事的結(jié)果,但他們說(shuō)測(cè)試協(xié)議沒(méi)有考慮到人們閱讀整個(gè)文檔的方式。他們表示,經(jīng)過(guò)評(píng)測(cè),機(jī)器明顯落后于人類。
問(wèn)題是如何評(píng)價(jià)機(jī)器翻譯。目前,這是通過(guò)兩個(gè)衡量標(biāo)準(zhǔn)實(shí)現(xiàn)的:充分性和流暢性。翻譯的充分性是由專業(yè)的人類譯者決定的,他們閱讀原文和譯文以理解它如何表達(dá)源的意思。流利程度是由單語(yǔ)讀者來(lái)評(píng)判的,他們只看翻譯,決定用英語(yǔ)表達(dá)的程度。

計(jì)算語(yǔ)言學(xué)家認(rèn)為這個(gè)系統(tǒng)提供了有用的評(píng)級(jí)。然而,根據(jù)Laubli和co的說(shuō)法,當(dāng)前的協(xié)議只比較句子級(jí)別的翻譯,而人類也在文檔級(jí)別評(píng)估文本。
因此,他們開(kāi)發(fā)了一種新的協(xié)議,在文檔級(jí)別比較機(jī)器和人工翻譯的性能。他們請(qǐng)專業(yè)翻譯對(duì)100多篇中英文撰寫的新聞文章中機(jī)器和人類的表現(xiàn)進(jìn)行評(píng)價(jià)??脊僭u(píng)定每個(gè)翻譯句子水平的充分性和流利性,但關(guān)鍵是整個(gè)文檔的水平。
結(jié)果是有趣的閱讀。首先,Laubli和co發(fā)現(xiàn),專業(yè)翻譯人員對(duì)機(jī)器翻譯和人工翻譯的充分性的評(píng)價(jià)沒(méi)有顯著差異。這樣看來(lái),人類和機(jī)器都是同樣優(yōu)秀的翻譯者,這和之前的研究結(jié)果是一致的。
然而,在評(píng)估整個(gè)文檔時(shí),人工翻譯被評(píng)為比機(jī)器翻譯更充分、更流暢。他們說(shuō):“當(dāng)人們?cè)u(píng)估充分性和流暢性時(shí),當(dāng)評(píng)估文檔時(shí),人們更喜歡機(jī)器翻譯而不是孤立的句子。”
研究人員認(rèn)為他們知道原因。他們說(shuō):“我們假設(shè)文檔級(jí)評(píng)估揭示了錯(cuò)誤,如模糊詞語(yǔ)的誤譯或與文本銜接和連貫有關(guān)的錯(cuò)誤,這些錯(cuò)誤在句子級(jí)評(píng)估中仍然很難或不可能發(fā)現(xiàn)。”
例如,團(tuán)隊(duì)舉了一個(gè)新應(yīng)用的例子,叫做“微信移動(dòng)汽車”,人們不停地把它翻譯成“微信移動(dòng)汽車”,但在同一篇文章中,通常用幾種不同的方式翻譯哪些機(jī)器。機(jī)器把這句話翻譯成“Twitter移動(dòng)汽車”、“微信移動(dòng)”、“微信移動(dòng)”。這種不一致,如Rabli和合作,使文件更難遵循。
這說(shuō)明機(jī)器翻譯的評(píng)價(jià)方法需要從機(jī)器單獨(dú)考慮每一句話的系統(tǒng)發(fā)展起來(lái)。
“隨著機(jī)器翻譯質(zhì)量的提高,翻譯在質(zhì)量方面將難以區(qū)分,可能是時(shí)候轉(zhuǎn)向文檔級(jí)評(píng)估了,這為評(píng)估者提供了更多了解原文及其翻譯的背景,也暴露了翻譯錯(cuò)誤與話語(yǔ)現(xiàn)象有關(guān),在句子級(jí)評(píng)估中仍然是隱形的,”勞布利和何說(shuō)。
這種改變應(yīng)該有助于提高機(jī)器翻譯。這意味著它仍將超過(guò)人工翻譯——目前還不是。