OpenAI 於上個月中推出 Sora 文字生成影片模型後,可說立刻引發大量討論,其擬真程度讓人非常驚艷,不過可惜的是,只有開發給特定用戶使用,意味著絕大多數人都還沒辦法用,也有網友猜測很可能今年看不到,要明年才有機會。近日 OpenAI 終於透露關於 Sora 的推出時程,好消息是,官方表示今年一定會看到。
OpenAI 透露 Sora 文字生成影片會在今年晚些時間正式推出
OpenAI 幾天前接受了華爾街日報的採訪,其首席技術主管 Mira Murati 就明確提到 “Sora 在今年一定會推出”, “可能幾個月內就會看到”,意味著 2024 年一定會看到 Sora 正式推出,並開放給所有人,而且有機會不用等太久,搞不好幾個月後就來了。
這真的是不錯消息,終於快可以玩到這個強大的文字生成影片工具,只不過到時是獨立推出,還是跟 DALL-E 一樣,同捆在 ChatGPT Plus,這就不太確定了。有外媒推測,會綑綁在 ChatGPT Plus,因為在正式推出之前,OpenAI 在嘗試把 Sora 變得效能更強、價格更便宜,目標是生成影片的速度就跟 DALL-E 一樣。
但我是認為不太可能,因為就先前的推測,OpenAI Sora 生成一分鐘影片很可能就要花一個多小時,除了時間久外,也代表需要消耗大量計算效能,成本花費一定比單純生成文字、圖片還高很多,而跟 ChatGPT Plus 綁在一起,除非漲價,要不然全面開放後,上萬個用戶都在使用,成本絕對是非常高。而且別忘了,Sora 文字生成影片所消耗的電力成本一定也非常高。
也有可能 OpenAI 會限制 ChatGPT Plus 的 Sora 能力,如果想要獲得更多,則需要額外加價。
Mira Murati 還透露一個不錯的新功能,就是 OpenAI 也在計劃整合音訊,這會使影片變得更加逼真。另外也考慮加入編輯功能,讓用戶創建完影片之後,可進行修改編輯和創作。
主持人還有問 Sora 是使用哪些數據訓練,Mira Murati 就沒有正面回答,只說到 “我不打算詳細介紹使用的數據,但數據是公開或有許可的”。
另外就目前釋出的影片來看,Sora 還有很多需要改進的地方,尤其是遇到一些特殊情況,如:無法理解的情況下,動物或人可能會突然出現。生成某些動作時,也會發生錯誤,進而導致不自然的畫面。
華爾街日報訪談影片:
無論如何,至少時間已經確定了,想要玩玩看的人可以先期待一下。而微軟的 Copilot,上個月微軟也已經確定會整合 Sora,但沒意外應該僅限 Copilot Pro 會員使用。