就在本週稍早,科技公司 Runway Research 公開了旗下即將推出的生產式 AI 模組「Gen-2」,這套最新的 AI 系統能透過用戶輸入的字串自動生成出一段短影片。
Runway Research 的 Gen-2 影片生產模組式透過一套由「2.4 億張圖片以及 640 萬支短片組成的內部和客製化資料庫」進行訓練。簡單來說,這套 AI 背後擁有著極為龐大的資料庫,雖然目前依然無法確定官方提到的「客製化資料庫」是不是透過蒐集網路上的大量作品整理而成的。因此,如果想要藉由生產出的影片獲利的話,這個平台似乎並非最好的選擇。
即使如此,Runway Research 全面升級後的 Gen-2 工具確實看起來比 Gen-1 的版本還要更加強大,而在這之前,已經有不少人利用 Gen-1 工具來協助繪製分鏡圖以及前製視覺特效,升級版式必能帶來更加廣泛的應用。雖然這項技術與 Meta 旗下的 AI 影片生產技術類似,但 Gen-2 模組似乎帶來了一些更加有趣的模式。
不久之後,用戶們只需要輸入簡單的文字,就能在這套工具上生成影片。不僅如此,Runway Research 團隊還打算為這套影片工具加入一些其他的模式,像是一種能讓這個平台將一支影片的畫面轉換成其他不同風格的演算法,而團隊也在官方網站上詳細揭露了這個全新版本工具的各種應用方式,其中一個最令人讚歎的範例,就是能夠將一支展示幾本放在桌子上的書本的影片轉換成高樓林立的城市夜景,而桌上的那些書通通變成了高樓大廈。雖然成品的寫實程度還有待加強,但這已經是個相當強大的視覺轉換工具。
https://twitter.com/runwayml/status/1637800500459458562
官方網站上公開的研究文件更進一步揭露了更多關於這些步驟的細節。這套工具從概念階段至今經歷了漫長的發展,就從這支預告短片來看,生產的影片成品在寫實度的部分已經達到了一個新高峰,雖然目前距離能夠生產出較長的影片似乎還有一段路要走。
目前的成果也讓 Gen-2 成為了另一套值得關注的 AI 工具,隨著這套工具在技術層面的推進,除了本身的完成度之外,對於整個產業將會造成什麼樣的影響也值得注意。就如同 Runway Research 團隊在官方網站上的說法,他們相信深度學習技術若應用在視聽娛樂上,那勢必將會永遠改變藝術、創作和設計類的工具。
當用戶在 Runway Research 網站上進行登記時,能夠看到許多不同的方案選擇,其中包含了免費以及付費的版本,但 Gen-2 的版本目前似乎還沒有正式對外開放。根據 Runway Research 在官方 Discord 頻道上揭露的資訊,他們可能會以付費公開 Beta 測試的形式推出 Gen-2,但目前已經吸引到了大量用戶的關注。