本質(zhì)上,情感分析基本上是大規(guī)模、實時、真實的產(chǎn)品測試,結(jié)果數(shù)據(jù)完全由用戶生成,因此不一致的流程和報告在全球以多種語言呈現(xiàn)。理解這些數(shù)據(jù)需要全球品牌和翻譯。公司他們之間的密切合作,但由此產(chǎn)生的見解幾乎總是值得的。
那么多語言情感分析的主要挑戰(zhàn)是什么呢?
你需要一個系統(tǒng)從全球社交媒體網(wǎng)站上捕捉并跟蹤大量用戶情感數(shù)據(jù)。
這就是大數(shù)據(jù),會經(jīng)過各種渠道和數(shù)據(jù)格式,比如評分、點評、評論。有必要在一定程度上使它們同質(zhì)化,以便對機器翻譯友好。
內(nèi)容將包括跨多種語言環(huán)境和語言的非正式或俚語詞匯。換句話說,數(shù)據(jù)不僅格式不標準,術語也不標準。
如何應對多語言情感分析公司必須與其本地化合作伙伴密切合作,了解他們可用的不同選項,并創(chuàng)建最適合他們需求的解決方案。以下是我們在處理多語言情感分析時通常推薦的六個關鍵步驟:
微調(diào)現(xiàn)有工具或創(chuàng)建專有工具來編譯、翻譯和分析用戶帖子?,F(xiàn)成的工具可能并不總是多語言的。因此,您必須選擇能夠輕松集成定制機器翻譯引擎的設備。
使用機器翻譯來總結(jié)和翻譯帖子。方法是通常把各種語言的帖子都翻譯成英語或者其他任何一種主要語言,然后對翻譯的內(nèi)容進行情感分析。
分析與觀點相關的術語和短語的帖子。這些術語會給你一些線索,讓你知道用戶對你的產(chǎn)品的感受。
根據(jù)正面或負面詞匯的數(shù)量分配情感分數(shù)。
按語言、市場、平臺、產(chǎn)品、日期范圍等報告情感得分。通過儀表板。這會讓你深入了解為什么產(chǎn)品在一個市場表現(xiàn)很好,而在另一個市場表現(xiàn)很差。
對原文和譯文的深入研究。確保您的工具允許您查看原文和譯文,以便將來參考和現(xiàn)場質(zhì)量檢查。
這不僅僅是消費者的問題。這種收集和分析消費者情緒的高級用法可能始于B2C領域,但它正迅速蔓延到其他行業(yè),包括生命科學等受監(jiān)管的行業(yè)。例如,自然語言處理(NLP)的應用進展使得制藥業(yè)公司可以挖掘用戶生成內(nèi)容的在線內(nèi)容和社交媒體,以識別潛在的不良反應(ADR)。
收集ADR不僅是法規(guī)要求,也是藥品。公司完全遵守的要求。但現(xiàn)實情況是,只有一小部分ADR是由患者或衛(wèi)生保健專業(yè)人員通過官方渠道實際報告的。所以,聽聽社交媒體,找找可能性。藥物反應,開辟了識別潛在不良反應的新途徑。在這種情況下,定制工具將分析以多種語言發(fā)布在社交媒體上的用戶評論,并提供一個潛在ADR的簡短列表,可以縮小到實際的不良反應。
因此,如果你還沒有,請考慮應用一些當前的多語社交傾聽方法。這可能是一種與組織其他部分(如營銷)聯(lián)系的新方式。它還提供了一個新的機會來展示語言和翻譯職能對全球收入的切實貢獻,并更好地了解您的國際客戶。