目前機器學習已成為一種非常有用的翻譯工具,但仍存在一些不足之處。其中之一就是逐字翻譯的趨勢,這會導致嚴重的錯誤。Google在其iResearch博客上發(fā)布了一篇有趣的帖子,詳細介紹了問題的本質和解決辦法。
Jakob Uszkoreit,公司的自然語言處理單元,給出了很好的解釋??紤]以下兩句話:我穿過街道到岸邊;我穿過河流到岸邊。顯然,每個句子中的岸邊指的是不同的東西,但是逐字翻譯算法我很可能會選擇錯誤的意思,因為它不知道哪家銀行是正確的,除非它能看到句子的結尾。如果你注意它,你會發(fā)現歧義處處可見。我會改寫這個句子。當然,翻譯系統(tǒng)不會選擇這樣。如果我們對這樣一個簡單的句子修改神經網絡,將會是非常低效的。
Google的解決方案是所謂的注意機制,這意味著在翻譯軟件中內置了一個稱為轉換器的系統(tǒng)。逐個比較句子中的單詞,以確定它們是否以關鍵方式相互作用,例如,看他或她是否在說話,或者像bank這樣的單詞是否以特定方式表達。她的話,如下面的GIF所示。如果這一切聽起來都很熟悉,可能是因為你在本周早些時候讀到一個故事,Google的翻譯競爭對手DeepL也在使用聚焦機制。該公司的聯(lián)合創(chuàng)始人提到了這一點,他們正在努力工作,他甚至提到了articl。e是關于Google的,但是很明顯他們的產品與Google不同,非常有效,甚至比后者更好。
有趣的是,Google的方法讓人們有機會了解系統(tǒng)是如何工作的,因為Transformer給每個單詞打分,說明它與其他單詞的相關性如何,y你可以看到它認為相關的詞,或者潛在的相關:酷,對吧嗯,我想是的。但是還有一種模糊性,因為在英語中,它可以指街道或動物,你必須看到最后一個詞來確定銀行的含義。人腦可以自動計算和區(qū)分,但是機器仍然必須被教導。