德國人工智能研究中心(DFKI)正在支持人類語言項(xiàng)目,這是一項(xiàng)長(zhǎng)期和大規(guī)模的歐洲研究,開發(fā)和創(chuàng)新項(xiàng)目,其雄心勃勃的科學(xué)目標(biāo)是到2030年深度自然語言理解。
預(yù)計(jì)自然語言處理(NLP)的進(jìn)展將能夠解決歐洲多語言設(shè)置的諸多挑戰(zhàn)。因此,該項(xiàng)目旨在成為歐盟旗艦項(xiàng)目,這是一項(xiàng)科學(xué)驅(qū)動(dòng)的研究計(jì)劃,運(yùn)行時(shí)間約為10年,總預(yù)算約為10億歐元。
根據(jù)歐盟網(wǎng)站,未來與新興(FET)旗艦項(xiàng)目匯集了大量研究機(jī)構(gòu),不能由一個(gè)委員會(huì)或單一成員國承擔(dān)。
DFKI高級(jí)研究員Georg Rehm博士鼓勵(lì)歐盟各組織為宣傳提供支持信。
“發(fā)起這種類型和范圍的人類語言項(xiàng)目 – 大規(guī)模和長(zhǎng)期 – 的想法是幾年前在歐洲議會(huì)歐洲多語種和語言平等研討會(huì)上誕生的,”Rehm告訴Slator。
“那時(shí)我們剛剛發(fā)布了META-NET白皮書系列的主要發(fā)現(xiàn),即21種歐洲語言面臨數(shù)字滅絕的危險(xiǎn)。這意味著超過20種歐洲語言,大多數(shù)揚(yáng)聲器數(shù)量較少的語言,無法在線完全使用。并非所有服務(wù)都以這些語言提供,并且并非所有服務(wù)都能夠在內(nèi)部處理這些語言的內(nèi)容,“他解釋說。
不幸的結(jié)局將是我們所謂的“數(shù)字語言滅絕”
這意味著支持的語言遠(yuǎn)遠(yuǎn)少于使用更多發(fā)言者的語言,例如馬耳他語,立陶宛語或冰島語,它們將在線使用更大的語言,英語就是最好的例子。
“不幸的結(jié)局將是我們所謂的’數(shù)字語言滅絕’,”他進(jìn)一步解釋道。
未來證明我們所有的語言
Rehm澄清說,不僅DFKI正在推動(dòng)人類語??言項(xiàng)目,而且還有許多不同的利益相關(guān)者 – 從研究中心到大學(xué),再到受影響語言社區(qū)的成員,翻譯公司以及越來越大的公司。
“所有這些利益相關(guān)者不僅有興趣實(shí)現(xiàn)我們的關(guān)鍵科學(xué)目標(biāo),到2030年深度自然語言理解,尤其是提供平衡的技術(shù)基礎(chǔ),以便我們能夠在未來證明我們所有的語言,并確保我們可以在網(wǎng)上使用它們很多年,“他說。
到目前為止,他表示最近發(fā)布的關(guān)于歐盟項(xiàng)目DFKI的支持信的呼吁得到了前所未有的熱情。
“真的很棒。這些信件一直在涌入!“他說。
一個(gè)項(xiàng)目成為歐盟FET旗艦項(xiàng)目需要什么?雷姆說,需要政治意愿來推動(dòng)這樣一個(gè)大型項(xiàng)目。布魯塞爾的政治家和行政人員需要確信,這種規(guī)模的投資對(duì)歐洲社會(huì),歐洲工業(yè)和歐洲研究都有意義。
“根據(jù)我們于2018年2月20日提交的提案,我們正試圖進(jìn)行預(yù)備項(xiàng)目。該準(zhǔn)備項(xiàng)目的目標(biāo)是與整個(gè)社區(qū)共同開發(fā)歐盟旗艦項(xiàng)目的關(guān)鍵組成部分:研究路線圖,治理結(jié)構(gòu),統(tǒng)一愿景,整體設(shè)置,“他說。
真的很棒。這些信件一直在涌入!
毫無疑問,這是一個(gè)長(zhǎng)期的過程。 Rehm表示,DFKI的職責(zé)是協(xié)調(diào)這個(gè)準(zhǔn)備項(xiàng)目,并確保該聯(lián)盟提供一個(gè)成熟的,經(jīng)過深思熟慮的,可持續(xù)的歐盟旗艦概念,讓整個(gè)社區(qū)贊同并支持。
雄心勃勃的科學(xué)目標(biāo)
Rehm解釋說,通過NLP,研究人員可以識(shí)別命名實(shí)體,匯總文檔,并將用一種語言編寫的文本翻譯成另一種語言。但是,在一天結(jié)束時(shí),它仍然只是簡(jiǎn)單的處理。
“典型的NLP管道或系統(tǒng)缺乏的是對(duì)語言的真實(shí),深刻的理解。這不是一個(gè)新概念,自然語言理解的概念已經(jīng)存在了幾十年。我們相信,我們的領(lǐng)域現(xiàn)在能夠成功地解決下一步,從簡(jiǎn)單的處理到對(duì)人類語言的實(shí)際理解,“他說。
“如果我們能夠?qū)崿F(xiàn)這一突破,那么由此產(chǎn)生的語言技術(shù)將在大幅提高準(zhǔn)確性,覆蓋范圍,穩(wěn)健性和質(zhì)量方面改變游戲規(guī)則。這就是我們想要帶來的,“他強(qiáng)調(diào)說。