我居住在沙漠之中,新墨西哥州的阿爾伯克基市,這座城市被一條河流貫穿,四周環(huán)繞著古老而遼闊的土地。這里不僅是美國最古老的印第安人聚居地,還是土著社區(qū)和美洲土著保留地的所在地,承載著深厚的文化歷史。
盡管這座城市融合了古老建筑與現(xiàn)代建筑的風(fēng)格,從充滿儀式感的基瓦斯島到現(xiàn)代化的水晶賭場,然而土著人民卻日益感受到他們的語言受到忽視。在這個(gè)數(shù)字化媒體和語言工具日益盛行的時(shí)代,祖先的語言往往被邊緣化,鮮有得到應(yīng)有的尊重。
全球范圍內(nèi),數(shù)十億人無法用他們自己的語言獲取數(shù)字內(nèi)容和服務(wù)。其中一些問題源于更大范圍的結(jié)構(gòu)性不平等,比如缺乏數(shù)字基礎(chǔ)設(shè)施,如Wi-Fi接入,以及學(xué)校缺乏母語教學(xué)。然而,另一部分原因則在于對內(nèi)容制作和本地化中不同語言的投資不足和缺乏包容性。
當(dāng)考慮到土著語言的音頻描述時(shí),這種“媒體沙漠”現(xiàn)象顯得尤為突出。音頻描述,即為盲人和低視力觀眾在屏幕上以語言形式描述正在發(fā)生的事情,是一項(xiàng)至關(guān)重要的服務(wù)。盡管英語音頻描述在流媒體、廣播媒體和傳統(tǒng)媒體上日益普及并提升質(zhì)量,但我們?nèi)匀幻媾R著巨大的挑戰(zhàn)。畢竟,為了觸達(dá)語言和文化多元化的受眾,無障礙性遠(yuǎn)遠(yuǎn)超越了英語的范疇。
在許多方面,人工智能或許能夠成為一個(gè)令人振奮的突破口,用于多種語言的音頻描述制作。借助人工智能技術(shù),音頻描述腳本可以以一種語言(如英語)編寫并發(fā)音,然后瞬間轉(zhuǎn)化為另一種語言的發(fā)音。
然而,與此同時(shí),隨著生成性人工智能(GenAI)的崛起,語言獲取方面的差異愈發(fā)凸顯。大型語言模型(LLM)所需的龐大數(shù)據(jù)集往往難以用土著語言提供,這導(dǎo)致一些社區(qū)不得不自力更生,創(chuàng)建自己的數(shù)字語言工具,并與大學(xué)或其他機(jī)構(gòu)合作,手工編織數(shù)字?jǐn)?shù)據(jù)庫,逐詞填補(bǔ)空白。
保護(hù)和數(shù)字化土著語言的工作正在穩(wěn)步推進(jìn),充滿熱情的阿米喬(April Armijo)將其稱為“本土化”。使用那些服務(wù)不足的語言制作音頻描述,不僅可以促進(jìn)這些語言的保護(hù),還能擴(kuò)大其受眾范圍,提高訪問量。