正如我們在上一篇文章中提到的,清理我們最大、最老的客戶之一的翻譯記憶庫(TM)是一項需要使用Xbench和我們導入到Excel電子表格中的結果報告的任務。最后我們選擇Olifant來編輯TM。TM有幾千個細分市場,Xbench報告了超過16000個不一致。這項工作需要很多時間,但我們成功了,我們會告訴你如何。
看到TM顯示在我們的Excel電子表格和Olifant里,是時候統(tǒng)一和不統(tǒng)一了。因為執(zhí)行任務的人足夠了解客戶,大多數(shù)情況下他知道最佳選擇,但是每當有疑問的時候,他可以和負責項目的經(jīng)理協(xié)商,項目經(jīng)理和客戶協(xié)商。。
要輸入內(nèi)存中的更改,只需在Olifant中執(zhí)行“查找和替換”(Ctrl+H),將“非首選”和“首選”版本(只是給它們一個名稱,因為并不總是有不正確的選項),粘貼到相應的框中,進行適當?shù)奶鎿Q即可。雖然你可以選擇取代一切,但在這種情況下,并不是實現(xiàn)改變的方式可以提供巨大的信心。有時,要修改的段落由兩個或三個單詞組成,這些單詞也作為句子的一部分出現(xiàn)在另一個實例中,并且在不分析每個案例的情況下替換所有內(nèi)容可能會導致輸入錯誤。
像幾乎所有的程序一樣,Olifant也提供了匹配大寫字母、匹配整個單詞和使用正則表達式的選項。最后一個選項在查看數(shù)字時非常有用。因為客戶在技術行業(yè)工作,所以他們的許多文本都充滿了數(shù)字:尺寸、數(shù)量、容量等等。
同時,由于格式問題,每個數(shù)字都在標簽之間,很難區(qū)分哪些數(shù)字對應標簽中的數(shù)字。為了糾正這些問題,我們在IT團隊的幫助下使用正則表達式。
因此,由于PM、語言專家、IT部門和客戶的合作,我們設法完成了清理TM的任務,正如我們之前所說,這項任務應該不時完成。避免用過時的片段填充它。
