機(jī)器翻譯(MT)系統(tǒng)是指利用技術(shù)將文本翻譯成其所支持的任何語言的應(yīng)用程序或在線服務(wù)。在采用機(jī)器翻譯之前,翻譯主要是手動進(jìn)行的過程。如今,翻譯人員經(jīng)常借助機(jī)器翻譯工具來顯著提高工作效率。這些技術(shù)改變了翻譯和本地化行業(yè),實現(xiàn)了更高的生產(chǎn)率、更低的成本、更好的一致性和可擴(kuò)展性,并且能夠輕松處理特定領(lǐng)域的術(shù)語。盡管機(jī)器翻譯背后的概念和操作界面相對簡單,但其背后的科學(xué)卻錯綜復(fù)雜,融合了多種前沿技術(shù)。
過去的和現(xiàn)在的機(jī)器翻譯方法
隨著時間的推移,機(jī)器翻譯的方法不斷演變,包括:
- 基于規(guī)則的機(jī)器翻譯:依賴于每種語言的詞典和語法規(guī)則。
- 統(tǒng)計機(jī)器翻譯(SMT):基于雙語文本語料庫的統(tǒng)計分析。
- 神經(jīng)機(jī)器翻譯(NMT):使用統(tǒng)計分析來預(yù)測詞序列的可能性,并依賴神經(jīng)網(wǎng)絡(luò)對整個句子進(jìn)行建模。
當(dāng)前許多最先進(jìn)的翻譯應(yīng)用都基于神經(jīng)機(jī)器翻譯,這是對傳統(tǒng)基于統(tǒng)計機(jī)器翻譯方法的改進(jìn)。神經(jīng)機(jī)器翻譯使用更多維度來表示源文本和目標(biāo)文本的標(biāo)記(如單詞、詞素和標(biāo)點符號)。
機(jī)器翻譯的未來:生成式人工智能
現(xiàn)在,一種新的機(jī)器翻譯方法已經(jīng)扎根:生成式人工智能(GenAI)。生成式人工智能依賴于大型語言模型(LLM),這是一種深度學(xué)習(xí)的人工智能模型,可消費和訓(xùn)練大規(guī)模數(shù)據(jù)集,從而在語言處理任務(wù)(如翻譯)中表現(xiàn)出色。在這些模型完成學(xué)習(xí)過程后,它們會在受到提示時生成統(tǒng)計上可能的輸出。這些模型會根據(jù)其訓(xùn)練數(shù)據(jù)創(chuàng)建模仿自然語言的新文本組合。
大型語言模型的發(fā)展是一個漸進(jìn)的過程。最早的大型語言模型相對較小,只能執(zhí)行簡單的語言任務(wù)。然而,隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,更大、更強(qiáng)大的大型語言模型被創(chuàng)建出來。2020年發(fā)布的生成式預(yù)訓(xùn)練Transformer 3(GPT-3)模型標(biāo)志著大型語言模型發(fā)展的一個重要里程碑。GPT-3展示了生成連貫且聽起來自然的文本的能力。GPT-3及其后續(xù)模型已經(jīng)在多種語言的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,因此可以生成這些語言的輸出。
神經(jīng)機(jī)器翻譯與大型語言模型
大型語言模型有可能在成本、速度和翻譯質(zhì)量方面超越神經(jīng)機(jī)器翻譯,同時支持多語言應(yīng)用程序中自然語言處理功能的開發(fā)。然而,神經(jīng)機(jī)器翻譯和大型語言模型各有優(yōu)缺點。對于某些翻譯任務(wù),神經(jīng)機(jī)器翻譯將是最合適的技術(shù);而對于其他任務(wù),大型語言模型將更有意義。
神經(jīng)機(jī)器翻譯與大型語言模型之間存在相似之處:
- 兩者都使用雙語(或多語)語料庫進(jìn)行預(yù)訓(xùn)練。
- 兩者都可以進(jìn)行訓(xùn)練或微調(diào),以更好地執(zhí)行特定任務(wù)。
然而,也存在重要差異:
- 針對特定領(lǐng)域(如醫(yī)療保健)對神經(jīng)機(jī)器翻譯進(jìn)行微調(diào)更容易且成本更低。
- 大型語言模型通常會產(chǎn)生聽起來更自然的文本,而神經(jīng)機(jī)器翻譯則會產(chǎn)生更準(zhǔn)確的文本。
- 神經(jīng)機(jī)器翻譯通常逐段處理文本,而大型語言模型可以一次處理整個文檔。因此,大型語言模型在明確的上下文中表現(xiàn)更好。
- 與大型語言模型相比,將現(xiàn)有的詞匯表和術(shù)語庫與神經(jīng)機(jī)器翻譯集成可能更容易。
- 目前,神經(jīng)機(jī)器翻譯的執(zhí)行速度比大型語言模型快;然而,新型的大型語言模型比之前的模型性能更好。對于處理大量文本而言,速度可能是一個重要問題。
- 目前,使用大型語言模型處理翻譯比神經(jīng)機(jī)器翻譯更昂貴。對于資源較少的語言尤其如此。
- 神經(jīng)機(jī)器翻譯可以針對語言變體進(jìn)行優(yōu)化。大型語言模型可能在區(qū)分和為不同語言變體(如葡萄牙葡萄牙語和巴西葡萄牙語)生成文本方面遇到困難。
- 神經(jīng)機(jī)器翻譯是專門為翻譯而優(yōu)化的,而大型語言模型可用于各種語言處理任務(wù)。例如,可以使用大型語言模型創(chuàng)建日語商務(wù)電子郵件。
對語言行業(yè)的影響
與機(jī)器翻譯的早期演變一樣,生成式人工智能使翻譯過程比純粹的人工翻譯更快、更便宜。然而,與之前的演變不同的是,生成式人工智能還可以改變翻譯過程的其他方面,如源文審查、術(shù)語提取、上下文提取以及翻譯質(zhì)量評估。
盡管大型語言模型并非專門針對翻譯進(jìn)行訓(xùn)練,但它們在自然語言任務(wù)中的廣泛應(yīng)用意味著它們在翻譯任務(wù)上表現(xiàn)出色,尤其是對于訓(xùn)練了大量數(shù)據(jù)集的語言而言。大型語言模型可以生成聽起來自然的源文本翻譯,甚至在目標(biāo)文本中使用地道的表達(dá)。這些特質(zhì)使大型語言模型有望成為未來幾年翻譯領(lǐng)域的變革性技術(shù)。