正如我們在上一篇文章中提到的,清理我們最大和最老的一個客戶機的翻譯內(nèi)存(TM)是一項需要使用Xbench和隨后的報告的任務(wù),我們將其導(dǎo)入到Excel電子表格中,最后選擇Olifant來編輯TM。TM有數(shù)千個片段,Xbench報告了超過16000個不一致。這是一項需要很多小時的工作,但我們成功了,我們會告訴你怎么做。
我們的excel電子表格在眼前,tm顯示在olifant中,是時候統(tǒng)一不一致了。由于執(zhí)行任務(wù)的人對客戶非常了解,在大多數(shù)情況下,他知道什么是最好的選擇,但每當出現(xiàn)疑問時,他就能夠與負責項目的經(jīng)理進行協(xié)商,而經(jīng)理又反過來與客戶進行協(xié)商。
要在翻譯記憶庫內(nèi)存中輸入更改,只需在olifant中執(zhí)行“find and replace”(ctrl+h),在相應(yīng)的框中粘貼“non-preferred”和“preferred”版本(只是給它們命名,因為并不總是有不正確的選項),然后進行適當?shù)姆峙洹8鼡Q。盡管有替代一切的選擇,但在這種情況下,它并不是一種能夠提供很大信心的實現(xiàn)更改的方法。有時,需要修改的部分由兩個或三個單詞組成,這些單詞也作為句子的一部分出現(xiàn)在另一個實例中,如果不分析每個實例而替換所有內(nèi)容,可能會導(dǎo)致輸入錯誤。
與幾乎所有程序一樣,olifant還提供了匹配大寫字母、匹配整個單詞和使用正則表達式的選項。最后一個選項在查看圖表時非常有用。由于客戶在技術(shù)行業(yè)工作,其許多文本都充滿了數(shù)字:尺寸、數(shù)量、容量等。
同時,由于格式問題,每個數(shù)字都位于標記之間是很常見的,這使得很難區(qū)分哪些數(shù)字對應(yīng)于作為標記一部分的數(shù)字。為了解決這些問題,我們在it團隊的幫助下使用正則表達式。
因此,由于項目經(jīng)理、語言學(xué)家、IT部門和客戶之間的合作,我們成功地完成了清理TM的任務(wù),正如我們之前所說的,這項任務(wù)應(yīng)該不時地完成,以避免用過時的片段填充TM。