輝達又出手!新AI模型Fugatto可用文字「客製化聲音」,配音、編曲更輕鬆

2024-11-26 | 中央社

輝達(NVIDIA)美國時間11月25日發表全新人工智慧(AI)研究成果Fugatto, 只要使用文字就能控制音訊輸出,並可以將任何文字提示轉換為音訊, 也能根據文字提示創作音樂片段、從現有歌曲中增減樂器、改變聲音口音或情感。

輝達發布新聞稿說明, Fugatto是Foundational Generative Audio Transformer Opus 1 的縮寫,可使用文字與音訊檔案的任何組合,產生或轉換描述的音樂、語音與聲音。

輝達應用音訊研究部門經理巴耶(Rafael Valle)表示,「我們希望創造一個能夠像人類一樣理解和生成聲音的模型」,Fugatto是邁向未來的第一步。

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

輝達指出,音樂製作人可以使用Fugatto快速製作聲音的原型或編輯歌曲構想,嘗試各種風格、聲音和樂器,也能加入效果並提升現有曲目整體音訊品質。

此外,輝達表示,廣告公司可以運用Fugatto,針對現有廣告內容的配音,套用不同口音和情感。語言學習工具可以變得個人化,例如線上課程能使用家人或朋友的聲音講授。

資料來源: https://www.bnext.com.tw/article/81427/nvidia-fugatto

Related posts