除了將生成式 AI 用在很好理解(這是 Facebook 你懂的)的廣告方面。其實 Meta 對於人工智慧的發展倒也漸漸顯露出了,他們其實是真的依然有環繞在元宇宙發展的野心以及必要性 – 並非許多人猜測的,只是一時趕流行才草草端出的東西。繼續閱讀 Meta Voicebox AI 只需 2 秒聲音樣本即可生成多國語音,還能講出不同風格報導內文。
▲圖片來源:Meta
Meta Voicebox AI 只需 2 秒聲音樣本即可生成多國語音,還能講出不同風格
當 Facebook 與 Instagram 母公司 Meta,宣告要把生成式 AI 推給數十億用戶橫跨所有產品線的消息一出。不少人心中想到的是,難不成 Meta 就要忘掉燒到虧損 40 億美元的元宇宙這回事,甚至還開玩笑說,搞不好還會把公司名稱改成跟 AI 相關的名稱。
不過實際上,除了將生成式 AI 用在很好理解(這是 Facebook 你懂的)的廣告方面。其實 Meta 對於人工智慧的發展倒也漸漸顯露出了,他們其實是真的依然有環繞在元宇宙發展的野心以及必要性 – 可能並非許多人猜測的,只是一時趕流行才草草端出的東西。
近日,Meta 端出了他們的文字轉語音技術 Voicebox。相對於其他服務,它對於語音的「處理」算是非常多元,號稱是個 All-in-one 的語音生成式模型。從基本的輸入文字便可透過 AI 唸出的功能之外,還包括能呈現的風格以及可以直接翻譯成六種包括英文、法文、德文、西班牙文、波蘭文與葡萄牙文不同語言的能耐。
重點是,Meta 還把其他服務可以透過採樣語音片段來學習對方語調的功能,進化到僅需 2 秒的語音樣本即可達成的可怕效率;Meta Voicebox 也能被用在消除語音內容之中所不小心錄到的雜訊或雜音上 – 將可輕鬆幫忙消除錄製過程中可能不小心出現的狗吠聲等。
就官方的說法,就像是語音版的橡皮擦編輯功能一樣好用。
是說,功能這麼強大多樣,我們好像還沒提到跟 Meta 元宇宙發展有什麼關聯吼?
根據 Meta 官方的說法,這些功能將可幫助元宇宙世界中的 NPC 非實際人物的角色,達到更自然的語音對話能力。至於使用者本身,則是可以透過 Meta Voicebox 消弭語言之間的限制。所以別再說 Meta 最近似乎都沒在做與 Metaverse 相關的事情了!
此外,官方也提到這樣的功能非常適合用於打造無障礙功能。而這也算是企業可以透過新科技來幫助社會的不錯方向。不過 Meta 也相當擔心像是 2 秒就能夠模擬聲音的功能如果被惡意偽裝他人的問題。對此,一方面是 Voicebox 還尚未提供大眾使用。Meta 更提到已經正在開發能更簡單辨別假冒聲音的機制。所以「暫時」還不用感到太擔心就是了…