該合作旨在通過收集和構(gòu)建亞洲低資源語言數(shù)據(jù)集來增強(qiáng)企業(yè)語言模型市場的競爭力。
人工智能數(shù)據(jù)解決方案提供商和集成語言平臺(tái)Flitto(首席執(zhí)行官Simon Lee,KOSDAQ 300080)9日宣布,他們已與專門從事大型語言模型的人工智能公司Upstage簽署了一份關(guān)于人工智能語言數(shù)據(jù)建設(shè)的諒解備忘錄。
這兩家公司將合作收集和構(gòu)建亞洲低資源語言的數(shù)據(jù)集,如泰國語、日語、老撾語和高棉語,目的是提高大型語言模型(LLM)的性能。
該協(xié)議包含幾個(gè)關(guān)鍵點(diǎn)?!献鳂?gòu)建韓國LLM排行榜Ko-LLM的基準(zhǔn)數(shù)據(jù)集。▲合作運(yùn)營多語言LLM排行榜。▲通過建立和利用低資源語言數(shù)據(jù)實(shí)現(xiàn)LLM本地化?!ㄟ^數(shù)據(jù)供應(yīng)加強(qiáng)合作伙伴關(guān)系,以建立業(yè)務(wù)集成的小型語言模型(sLLM)。
兩家公司圍繞語言人工智能開發(fā)展開的戰(zhàn)略合作有望在不久的將來取得切實(shí)成果。
通過這種合作關(guān)系,F(xiàn)litto旨在通過利用其語言數(shù)據(jù)縮放能力和先進(jìn)的人工智能技術(shù),積極推動(dòng)語言模型的發(fā)展。他們在語言數(shù)據(jù)構(gòu)建方面的廣泛專業(yè)知識(shí),包括構(gòu)建多語言并行語料庫和提供無版權(quán)問題的文本、圖像和語音數(shù)據(jù)集,預(yù)計(jì)將為AI數(shù)據(jù)提供商提供堅(jiān)實(shí)的競爭優(yōu)勢。
Upstage的戰(zhàn)略是確保高質(zhì)量、低資源的語言數(shù)據(jù),并擴(kuò)大其預(yù)培訓(xùn)LLM Solar的語言支持,以開發(fā)針對各種區(qū)域語言(包括東南亞)的定制模型。Solar目前支持韓語和英語,并計(jì)劃在年底前擴(kuò)展到日語和泰語。
Flitto首席執(zhí)行官Simon Lee表示:“低資源語言培訓(xùn)已成為大型語言模型性能的關(guān)鍵因素。”他補(bǔ)充道,“通過兩家公司之間的合作,我們旨在展示高質(zhì)量人工智能數(shù)據(jù)和先進(jìn)技術(shù)之間的協(xié)同作用如何積極影響國內(nèi)的生成性人工智能生態(tài)系統(tǒng)。”
Upstage首席執(zhí)行官Sung Kim強(qiáng)調(diào),“與語言模型驅(qū)動(dòng)的生成性人工智能繁榮一起,確保高質(zhì)量的語言數(shù)據(jù)安全是一項(xiàng)重要任務(wù),”他補(bǔ)充道,“通過與Flitto的合作,Upstage將努力構(gòu)建先進(jìn)的數(shù)據(jù)集,使更廣泛的全球觀眾能夠體驗(yàn)生成性人工智能技術(shù)帶來的創(chuàng)新。”
照片1。8日,在首爾江南谷的Flitto總部,F(xiàn)litto首席執(zhí)行官Simon Lee(左三)和Upstage執(zhí)行副總裁Soon il Kwon(左四)與兩家公司的員工在AI語言數(shù)據(jù)構(gòu)建諒解備忘錄簽署儀式上合影留念。
*照片的其他信息:(從左至右)Flitto產(chǎn)品戰(zhàn)略小組負(fù)責(zé)人Ki-young Shin、Flitto通信小組負(fù)責(zé)人Chung-won Park、Flitton首席執(zhí)行官Simon Lee、上游執(zhí)行副總裁Soon il Kwon、上游首席研究工程師Chan-jun Park,LLM業(yè)務(wù)開發(fā)和銷售主管Min-sung Kim。