過去的和現(xiàn)在的機(jī)器翻譯方法
隨著時(shí)間的推移,機(jī)器翻譯的方法不斷演變,包括:
當(dāng)前許多最先進(jìn)的翻譯應(yīng)用都基于神經(jīng)機(jī)器翻譯,這是對(duì)傳統(tǒng)基于統(tǒng)計(jì)機(jī)器翻譯方法的改進(jìn)。神經(jīng)機(jī)器翻譯使用更多維度來表示源文本和目標(biāo)文本的標(biāo)記(如單詞、詞素和標(biāo)點(diǎn)符號(hào))。
機(jī)器翻譯的未來:生成式人工智能
現(xiàn)在,一種新的機(jī)器翻譯方法已經(jīng)扎根:生成式人工智能(GenAI)。生成式人工智能依賴于大型語(yǔ)言模型(LLM),這是一種深度學(xué)習(xí)的人工智能模型,可消費(fèi)和訓(xùn)練大規(guī)模數(shù)據(jù)集,從而在語(yǔ)言處理任務(wù)(如翻譯)中表現(xiàn)出色。在這些模型完成學(xué)習(xí)過程后,它們會(huì)在受到提示時(shí)生成統(tǒng)計(jì)上可能的輸出。這些模型會(huì)根據(jù)其訓(xùn)練數(shù)據(jù)創(chuàng)建模仿自然語(yǔ)言的新文本組合。
大型語(yǔ)言模型的發(fā)展是一個(gè)漸進(jìn)的過程。最早的大型語(yǔ)言模型相對(duì)較小,只能執(zhí)行簡(jiǎn)單的語(yǔ)言任務(wù)。然而,隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,更大、更強(qiáng)大的大型語(yǔ)言模型被創(chuàng)建出來。2020年發(fā)布的生成式預(yù)訓(xùn)練Transformer 3(GPT-3)模型標(biāo)志著大型語(yǔ)言模型發(fā)展的一個(gè)重要里程碑。GPT-3展示了生成連貫且聽起來自然的文本的能力。GPT-3及其后續(xù)模型已經(jīng)在多種語(yǔ)言的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,因此可以生成這些語(yǔ)言的輸出。
神經(jīng)機(jī)器翻譯與大型語(yǔ)言模型
大型語(yǔ)言模型有可能在成本、速度和翻譯質(zhì)量方面超越神經(jīng)機(jī)器翻譯,同時(shí)支持多語(yǔ)言應(yīng)用程序中自然語(yǔ)言處理功能的開發(fā)。然而,神經(jīng)機(jī)器翻譯和大型語(yǔ)言模型各有優(yōu)缺點(diǎn)。對(duì)于某些翻譯任務(wù),神經(jīng)機(jī)器翻譯將是最合適的技術(shù);而對(duì)于其他任務(wù),大型語(yǔ)言模型將更有意義。
神經(jīng)機(jī)器翻譯與大型語(yǔ)言模型之間存在相似之處:
然而,也存在重要差異:
對(duì)語(yǔ)言行業(yè)的影響
與機(jī)器翻譯的早期演變一樣,生成式人工智能使翻譯過程比純粹的人工翻譯更快、更便宜。然而,與之前的演變不同的是,生成式人工智能還可以改變翻譯過程的其他方面,如源文審查、術(shù)語(yǔ)提取、上下文提取以及翻譯質(zhì)量評(píng)估。
盡管大型語(yǔ)言模型并非專門針對(duì)翻譯進(jìn)行訓(xùn)練,但它們?cè)谧匀徽Z(yǔ)言任務(wù)中的廣泛應(yīng)用意味著它們?cè)?a href="http://m.epga.cn/archives/119.html" data-type="post" data-id="119">翻譯任務(wù)上表現(xiàn)出色,尤其是對(duì)于訓(xùn)練了大量數(shù)據(jù)集的語(yǔ)言而言。大型語(yǔ)言模型可以生成聽起來自然的源文本翻譯,甚至在目標(biāo)文本中使用地道的表達(dá)。這些特質(zhì)使大型語(yǔ)言模型有望成為未來幾年翻譯領(lǐng)域的變革性技術(shù)。
]]>