人工智能自動化如何加速語言質(zhì)量評估
在2024年6月的SlatorCon Remote活動中,Phrase的首席執(zhí)行官Georg Ell博士與首席產(chǎn)品官Simone Bohnenberger-Rich博士共同向與會者深入介紹了在本地化語言質(zhì)量評估(LQA)領域,人工智能自動化所帶來的顯著成果。他們詳細回答了關于如何將人工智能有效集成至各類產(chǎn)品,以及通過自動化能夠?qū)崿F(xiàn)的具體優(yōu)勢等問題。
為了深入探討這一主題,Slator向Ell博士詢問了Phrase在幫助客戶應對內(nèi)容生成和本地化方面,尤其是在大規(guī)模操作中的變化時所采取的策略。
Ell博士解釋說,目前,內(nèi)容生成方式的演變以及人工智能在推動這些變化中所起的作用,已經(jīng)引起了人們的廣泛關注。他特別指出,這些變化包括在互聯(lián)網(wǎng)上實時傳輸?shù)暮A繑?shù)據(jù),以及為每個用戶定制的高度個性化內(nèi)容。據(jù)他估計,大約有20%的本地化客戶已經(jīng)開始采用自動化技術,這是因為他們迫切需要應對不斷增長的內(nèi)容量,并最終實現(xiàn)超自動化。
在談到大規(guī)模內(nèi)容處理時,Bohnenberger-Rich博士提到,當前關于人工智能的炒作正在改變?nèi)藗儗Ρ镜鼗杀镜念A期,使得人們期望能夠以更低的成本完成更多的工作。她警告說:“有時,我們會看到本地化團隊的預算被削減,因為他們錯誤地認為生成式人工智能會自然而然地降低成本。這就是我所說的‘盲目熱情’?!?
她進一步指出,團隊最終會認識到,要實現(xiàn)真正的自動化、降低成本并有效解決實際問題,僅僅依靠生成式人工智能和大型語言模型(LLM)是不夠的。
Phrase的首席產(chǎn)品官闡釋了公司如何“基于工作流組件和高級分析組件的功能,來實施大型語言模型和人工智能,從而創(chuàng)造最大的價值。這將為用戶提供大量關于他們能做什么以及何時進行操作的智能信息?!?
針對本地化過程中質(zhì)量保證(QA)環(huán)節(jié)的復雜性,Bohnenberger-Rich博士還詳細介紹了Phrase在QA方面的關鍵創(chuàng)新,這些創(chuàng)新有助于簡化流程并減少不必要的人工干預。
她強調(diào),要改變決定人工干預QA的方式,就需要從對主題或語言對難度的主觀假設,轉(zhuǎn)變?yōu)閷|(zhì)量水平的自動化和系統(tǒng)化評估。她解釋說,Phrase的質(zhì)量性能評分(Phrase QPS)正是能夠完成這一任務的重要工具之一。
此外,她還談到了確保自動化QA流程在不同規(guī)模上都能保持一致性表現(xiàn)的重要性。她解釋說,自動化這樣一個高度主觀的過程,需要通過嚴格的一致性來消除主觀性。同時,產(chǎn)品還需要透明地展示低質(zhì)量和高質(zhì)量的標準,以便客戶能夠理解人工智能做出特定決策的原因。
在談到語言服務提供商(LSP)的機遇時,Ell博士指出,翻譯公司可以通過實施自動化來增加收入,并幫助客戶實現(xiàn)更多內(nèi)容的本地化。他認為,LSP可以作為技術合作伙伴,因為許多買家在決定人工智能本地化自動化的方向時缺乏必要的知識。
Ell博士強調(diào),需要將語言行業(yè)視為一個生態(tài)系統(tǒng)的一部分,例如Phrase這樣的語言技術公司。在這個生態(tài)系統(tǒng)中,LSP所擁有的數(shù)據(jù)和專家資源可以幫助改進LLM。他認為,“將這兩者結(jié)合在一起是解鎖大型語言模型價值的關鍵,因為你需要將它們定制到特定的用例中?!?
他還補充說,在處理大量數(shù)據(jù)時,某些商業(yè)模式將需要進行調(diào)整,以適應在更短時間內(nèi)完成更多工作的需求,包括確定何時進行人工干預以進行質(zhì)量檢查。同時,他表示,LSP將有多種方式來實現(xiàn)這些變革。
最后,在談到順序QA循環(huán)的終結(jié)時,Bohnenberger-Rich博士解釋了如何在眾多不同的QA循環(huán)中實現(xiàn)多個QA類別的自動化。她提到,在利用高質(zhì)量翻譯記憶庫等資源來訓練和微調(diào)LLM時,人們已經(jīng)認識到,某些QA類別是可以信賴地實現(xiàn)適當自動化的,但這完全取決于具體的用例。
她補充說,在考慮到每個用例的具體需求時,QA過程的部分環(huán)節(jié)將實現(xiàn)不同程度的自動化。她將這一過程描述為從用例出發(fā)——即需要解決的問題——然后反向工作,以在流程中分配自動化步驟。
她總結(jié)道:“客戶可以根據(jù)他們的用例和需求,來決定他們希望在速度、可擴展性和自動化方面取得多大的進展,以及他們更傾向于為哪種類型的資產(chǎn)設置異常循環(huán)。”
在Phrase,團隊已經(jīng)認真考慮了客戶反饋,并對QPS模型進行了微調(diào),Ell博士補充道。在他看來,理想情況下——也許就在不久的將來——一個自動化的QA系統(tǒng)將能夠為客戶提供更多的選擇權(quán),使他們能夠根據(jù)具體的用例和內(nèi)容類型來選擇更加嚴格或更加靈活的QA方式。