如何正確替換翻譯記憶庫TM的過期數(shù)據(jù)
正如我們在上一篇文章中提到的,清理我們最大和最老的一個客戶機(jī)的翻譯內(nèi)存(TM)是一項(xiàng)需要使用Xbench和隨后的報告的任務(wù),我們將其導(dǎo)入到Excel電子表格中,最后選擇Olifant來編輯TM。TM有數(shù)千個片段,Xbench報告了超過16000個不一致。這是一項(xiàng)需要很多小時的工作,但我們成功了,我們會告訴你怎么做。
我們的excel電子表格在眼前,tm顯示在olifant中,是時候統(tǒng)一不一致了。由于執(zhí)行任務(wù)的人對客戶非常了解,在大多數(shù)情況下,他知道什么是最好的選擇,但每當(dāng)出現(xiàn)疑問時,他就能夠與負(fù)責(zé)項(xiàng)目的經(jīng)理進(jìn)行協(xié)商,而經(jīng)理又反過來與客戶進(jìn)行協(xié)商。
要在翻譯記憶庫內(nèi)存中輸入更改,只需在olifant中執(zhí)行“find and replace”(ctrl+h),在相應(yīng)的框中粘貼“non-preferred”和“preferred”版本(只是給它們命名,因?yàn)椴⒉豢偸怯胁徽_的選項(xiàng)),然后進(jìn)行適當(dāng)?shù)姆峙?。更換。盡管有替代一切的選擇,但在這種情況下,它并不是一種能夠提供很大信心的實(shí)現(xiàn)更改的方法。有時,需要修改的部分由兩個或三個單詞組成,這些單詞也作為句子的一部分出現(xiàn)在另一個實(shí)例中,如果不分析每個實(shí)例而替換所有內(nèi)容,可能會導(dǎo)致輸入錯誤。
與幾乎所有程序一樣,olifant還提供了匹配大寫字母、匹配整個單詞和使用正則表達(dá)式的選項(xiàng)。最后一個選項(xiàng)在查看圖表時非常有用。由于客戶在技術(shù)行業(yè)工作,其許多文本都充滿了數(shù)字:尺寸、數(shù)量、容量等。
同時,由于格式問題,每個數(shù)字都位于標(biāo)記之間是很常見的,這使得很難區(qū)分哪些數(shù)字對應(yīng)于作為標(biāo)記一部分的數(shù)字。為了解決這些問題,我們在it團(tuán)隊的幫助下使用正則表達(dá)式。
因此,由于項(xiàng)目經(jīng)理、語言學(xué)家、IT部門和客戶之間的合作,我們成功地完成了清理TM的任務(wù),正如我們之前所說的,這項(xiàng)任務(wù)應(yīng)該不時地完成,以避免用過時的片段填充TM。
- 上一篇 >:表情包有助于意思表達(dá)嗎
- 下一篇 >:機(jī)器翻譯的局限性