最近,我讀了一篇文章,其中Facebook語言技術(shù)團(tuán)隊(duì)工程總監(jiān)Alan Packer談到了他的公司使用神經(jīng)機(jī)器翻譯(MT)。他說的其中一件事是,他們需要建立自己的MT引擎,而不是使用第三方服務(wù),因?yàn)槿藗冊(cè)贔acebook上的說法不同。
它讓我想知道這是否確實(shí)如此,并讓我想起了一些相關(guān)的問題。我們的社交媒體溝通如何影響語言?它如何影響翻譯?
FB的語言?不是真的在這篇文章中,Packer詳細(xì)闡述了不同的含義:它是使用俚語,口語,在旅途中制作的首字母縮略詞,以及在一個(gè)帖子中實(shí)現(xiàn)突然的病毒式傳播,主題標(biāo)簽,有時(shí)甚至超過一種語言。
如果將此與人們?cè)谄渌缃痪W(wǎng)絡(luò)上的通信方式進(jìn)行比較,Packer可能會(huì)有所幫助。例如,人們?cè)贚inkedIn上并不是非正式的,因?yàn)樗麄兛赡軙?huì)意識(shí)到他們的老板,同事和客戶。Twitter也不像Facebook這樣的圍墻花園,所以談話仍然需要破譯。
但是,如果您將Facebook的語言與我們與朋友和家人使用的語言進(jìn)行比較,您認(rèn)為它有多么不同?并不多,除了可能“frie”某人或“不喜歡”某些東西 - Facebook獨(dú)有的術(shù)語。在FB上,我們穿著睡衣,所以我們可以讓警衛(wèi)稍微放松一下,更加非正式地說話。
正是由于這個(gè)原因,F(xiàn)acebook無法使用現(xiàn)成的MT解決方案:這些引擎沒有Facebook必須學(xué)習(xí)的相同語料庫。相反,他們從政府文件和網(wǎng)絡(luò)上具有更多正式語言的其他內(nèi)容中學(xué)到了東西。因此,輸出不會(huì)模仿Facebook用戶期望的非正式性。
我們明白了。盡管如此,人們很難接受人們?cè)贔acebook上的獨(dú)特話語。讓我們退一步吧。如果你和我一樣老,你可能還記得雅虎!Messenger,MSN Messenger或ICQ。(確實(shí)聽起來很久以前,嘆了口氣。)那些日子你也會(huì)知道與陌生人熟悉的對(duì)話啟動(dòng):“ ASL(年齡,性別,地點(diǎn))?“想想看,在那些日子里,我們與互聯(lián)網(wǎng)上的許多陌生人交談過,而不是現(xiàn)在。
關(guān)鍵是我們?cè)贔acebook到達(dá)現(xiàn)場(chǎng)之前很久就開始了BRB-ing和G2G-ing,即使在今天,簡(jiǎn)潔和不敬也不僅限于Facebook。
這不僅僅是英語英語不是人們?cè)谏缃幻襟w上使用不同的唯一語言。人們?cè)谑澜绺鞯氐恼{(diào)整和扭曲他們的語言來傳統(tǒng)主義的恐懼只是這樣他們就可以將他們的手指有點(diǎn)少。
還有一個(gè)更大的問題,即社交媒體和互聯(lián)網(wǎng)是否會(huì)破壞我們的語言,但“經(jīng)濟(jì)學(xué)人”認(rèn)為我們什么都不擔(dān)心,這可能是正確的。為了記錄,所有領(lǐng)先的社交網(wǎng)站(SNS)都非常重視語言。他們?cè)诜g和本地化方面投入巨資,并經(jīng)常以當(dāng)?shù)卣Z言引領(lǐng)市場(chǎng)推廣。在許多擁有新興語言的國(guó)家,互聯(lián)網(wǎng)上的語言內(nèi)容相對(duì)較少,F(xiàn)acebook和Twitter可以實(shí)現(xiàn)不需要英語的對(duì)話。

不太好,你可以猜到。眾所周知,非正式的口語和俚語難以翻譯。它要求你熟練地跨越兩種語言,即使對(duì)于那些了解語言但沒有沉浸在兩種文化中的人來說,這也是一項(xiàng)很高的要求。
現(xiàn)在,由于可擴(kuò)展性和速度的原因,大多數(shù)SNS都將此轉(zhuǎn)換委托給機(jī)器,這是可以理解的問題。沒有人能夠跟上一小時(shí)內(nèi)完成的社交媒體帖子的數(shù)量,在這種情況下,專業(yè)翻譯可能是一種矯枉過正。Gisting通常就足夠了。
但問題是,翻譯不再處于自己的角落。這不僅僅是語言問題。相反,翻譯將是人工智能(AI)能否改變我們生活的關(guān)鍵。越來越多的世界正在變得多語言化。我們自己的商業(yè)和個(gè)人網(wǎng)絡(luò)包括與我們說不同語言的人。因此,機(jī)器翻譯狀態(tài)消息,對(duì)話和主題標(biāo)簽的準(zhǔn)確性可能更重要。錯(cuò)誤不僅僅意味著人們之間的誤解,還會(huì)影響AI本身的可行性。
如何在聲音時(shí)代改變?我們聽說,互聯(lián)網(wǎng)上的所有東西(這幾乎都是世界上的一切)將在不久的將來以語音為導(dǎo)向。社交媒體上的語音現(xiàn)象將如何影響語言?我的意思是,在我去喝咖啡之前,我可以只說“Skype我的老板”,并相信我的老板不認(rèn)為我已經(jīng)離開了嗎?那么使用表情符號(hào)呢,因?yàn)樗鼈冊(cè)诟魈幎紱]有傳達(dá)相同的含義?我的猜測(cè)是,我們會(huì)更恰當(dāng)?shù)卣f話,以便尚未成熟的AI系統(tǒng)能夠更好地理解我們。如果是這樣,對(duì)于即時(shí)翻譯解決方案來說將是個(gè)好消息。
我開始寫這篇文章,詢問Facebook的語言是否真的獨(dú)一無二。事實(shí)并非如此,盡管每一次新的技術(shù)浪潮,包括Facebook所屬的技術(shù),都會(huì)影響語言。語言將繼續(xù)發(fā)展和發(fā)展,技術(shù)將繼續(xù)發(fā)揮作用。并且,事情只會(huì)隨著聲音變得更有趣。