牛津語言,隸屬牛津大學(xué)出版社,榮幸地宣布與知名美國科技公司W(wǎng)ellSaid Labs達(dá)成合作。此次合作旨在利用WellSaid Labs的人工智能技術(shù),精細(xì)管理發(fā)音數(shù)據(jù),從而簡化人工智能語音生成的復(fù)雜性,并為內(nèi)容創(chuàng)作者提供更為靈活的配音控制選項(xiàng)。
WellSaid Labs,一家備受推崇的人工智能語音平臺(tái),通過其文本到語音(TTS)產(chǎn)品,實(shí)現(xiàn)了大規(guī)模的人工智能語音生成。最近,WellSaid Labs推出了一項(xiàng)創(chuàng)新的重述系統(tǒng),該系統(tǒng)允許用戶根據(jù)個(gè)人偏好定制特定單詞的發(fā)音,進(jìn)而將文本轉(zhuǎn)化為更為真實(shí)、人性化的聲音。
這一創(chuàng)新系統(tǒng)的研發(fā),旨在解決當(dāng)前文本到語音翻譯平臺(tái)在用戶體驗(yàn)方面所面臨的挑戰(zhàn)。正如牛津語言的一項(xiàng)案例研究所指出的,文本到語音平臺(tái)的用戶通常需要依賴標(biāo)準(zhǔn)化的發(fā)音指南,如國際音標(biāo)(IPA)。為了提升用戶體驗(yàn),WellSaid Labs開發(fā)出了一套更為直觀、易于操作的發(fā)音系統(tǒng),并將其無縫集成到其深度學(xué)習(xí)的TTS模型中。
為了實(shí)現(xiàn)這一解決方案,我們需要一個(gè)覆蓋廣泛、發(fā)音準(zhǔn)確的英語單詞語言數(shù)據(jù)庫。在這方面,牛津語言的發(fā)音數(shù)據(jù)集為WellSaid Labs的行業(yè)首創(chuàng)Respelling系統(tǒng)提供了強(qiáng)有力的支持。
WellSaid Labs在其博客公告中表示:“我們與全球領(lǐng)先的詞典出版商牛津語言合作,超越了傳統(tǒng)的單詞轉(zhuǎn)錄方式,顯著豐富了我們的訓(xùn)練數(shù)據(jù)語料庫,并為每個(gè)單詞提供了更為豐富的上下文信息。這一合作使我們的人工智能聲音更加接近人類的自然發(fā)聲。通過將WellSaid Labs的尖端技術(shù)與牛津語言的語言專業(yè)知識(shí)相結(jié)合,我們?cè)谌斯ぶ悄苷Z音生成領(lǐng)域取得了突破性的進(jìn)展。”