
牛津語言,隸屬牛津大學出版社,榮幸地宣布與知名美國科技公司WellSaid Labs達成合作。此次合作旨在利用WellSaid Labs的人工智能技術,精細管理發(fā)音數(shù)據,從而簡化人工智能語音生成的復雜性,并為內容創(chuàng)作者提供更為靈活的配音控制選項。
WellSaid Labs,一家備受推崇的人工智能語音平臺,通過其文本到語音(TTS)產品,實現(xiàn)了大規(guī)模的人工智能語音生成。最近,WellSaid Labs推出了一項創(chuàng)新的重述系統(tǒng),該系統(tǒng)允許用戶根據個人偏好定制特定單詞的發(fā)音,進而將文本轉化為更為真實、人性化的聲音。
這一創(chuàng)新系統(tǒng)的研發(fā),旨在解決當前文本到語音翻譯平臺在用戶體驗方面所面臨的挑戰(zhàn)。正如牛津語言的一項案例研究所指出的,文本到語音平臺的用戶通常需要依賴標準化的發(fā)音指南,如國際音標(IPA)。為了提升用戶體驗,WellSaid Labs開發(fā)出了一套更為直觀、易于操作的發(fā)音系統(tǒng),并將其無縫集成到其深度學習的TTS模型中。
為了實現(xiàn)這一解決方案,我們需要一個覆蓋廣泛、發(fā)音準確的英語單詞語言數(shù)據庫。在這方面,牛津語言的發(fā)音數(shù)據集為WellSaid Labs的行業(yè)首創(chuàng)Respelling系統(tǒng)提供了強有力的支持。
WellSaid Labs在其博客公告中表示:“我們與全球領先的詞典出版商牛津語言合作,超越了傳統(tǒng)的單詞轉錄方式,顯著豐富了我們的訓練數(shù)據語料庫,并為每個單詞提供了更為豐富的上下文信息。這一合作使我們的人工智能聲音更加接近人類的自然發(fā)聲。通過將WellSaid Labs的尖端技術與牛津語言的語言專業(yè)知識相結合,我們在人工智能語音生成領域取得了突破性的進展?!?