
該合作旨在通過收集和構建亞洲低資源語言數(shù)據(jù)集來增強企業(yè)語言模型市場的競爭力。
人工智能數(shù)據(jù)解決方案提供商和集成語言平臺Flitto(首席執(zhí)行官Simon Lee,KOSDAQ 300080)9日宣布,他們已與專門從事大型語言模型的人工智能公司Upstage簽署了一份關于人工智能語言數(shù)據(jù)建設的諒解備忘錄。
這兩家公司將合作收集和構建亞洲低資源語言的數(shù)據(jù)集,如泰國語、日語、老撾語和高棉語,目的是提高大型語言模型(LLM)的性能。
該協(xié)議包含幾個關鍵點。▲合作構建韓國LLM排行榜Ko-LLM的基準數(shù)據(jù)集?!献鬟\營多語言LLM排行榜?!ㄟ^建立和利用低資源語言數(shù)據(jù)實現(xiàn)LLM本地化?!ㄟ^數(shù)據(jù)供應加強合作伙伴關系,以建立業(yè)務集成的小型語言模型(sLLM)。
兩家公司圍繞語言人工智能開發(fā)展開的戰(zhàn)略合作有望在不久的將來取得切實成果。
通過這種合作關系,F(xiàn)litto旨在通過利用其語言數(shù)據(jù)縮放能力和先進的人工智能技術,積極推動語言模型的發(fā)展。他們在語言數(shù)據(jù)構建方面的廣泛專業(yè)知識,包括構建多語言并行語料庫和提供無版權問題的文本、圖像和語音數(shù)據(jù)集,預計將為AI數(shù)據(jù)提供商提供堅實的競爭優(yōu)勢。
Upstage的戰(zhàn)略是確保高質(zhì)量、低資源的語言數(shù)據(jù),并擴大其預培訓LLM Solar的語言支持,以開發(fā)針對各種區(qū)域語言(包括東南亞)的定制模型。Solar目前支持韓語和英語,并計劃在年底前擴展到日語和泰語。
Flitto首席執(zhí)行官Simon Lee表示:“低資源語言培訓已成為大型語言模型性能的關鍵因素?!彼a充道,“通過兩家公司之間的合作,我們旨在展示高質(zhì)量人工智能數(shù)據(jù)和先進技術之間的協(xié)同作用如何積極影響國內(nèi)的生成性人工智能生態(tài)系統(tǒng)?!?/span>
Upstage首席執(zhí)行官Sung Kim強調(diào),“與語言模型驅(qū)動的生成性人工智能繁榮一起,確保高質(zhì)量的語言數(shù)據(jù)安全是一項重要任務,”他補充道,“通過與Flitto的合作,Upstage將努力構建先進的數(shù)據(jù)集,使更廣泛的全球觀眾能夠體驗生成性人工智能技術帶來的創(chuàng)新?!?/span>
照片1。8日,在首爾江南谷的Flitto總部,F(xiàn)litto首席執(zhí)行官Simon Lee(左三)和Upstage執(zhí)行副總裁Soon il Kwon(左四)與兩家公司的員工在AI語言數(shù)據(jù)構建諒解備忘錄簽署儀式上合影留念。
*照片的其他信息:(從左至右)Flitto產(chǎn)品戰(zhàn)略小組負責人Ki-young Shin、Flitto通信小組負責人Chung-won Park、Flitton首席執(zhí)行官Simon Lee、上游執(zhí)行副總裁Soon il Kwon、上游首席研究工程師Chan-jun Park,LLM業(yè)務開發(fā)和銷售主管Min-sung Kim。