近日,透過 CBS News 的 60 Minutes 節目探訪 Google 相關技術展示的過程,我們也第一次看到了 Google Phenaki 影片生成功能的實際介面為何。繼續閱讀 Google 實際秀出「AI 影片生成」實驗功能 Phenaki,把想像轉為影片報導內文。
▲圖片來源:CBS News
Google 實際秀出「AI 影片生成」實驗功能 Phenaki,把想像轉為影片
說到 Google 的「文字轉影片(Text to Video)」實驗功能 Phenaki。其實他們在相當早以前就已經端出 – 主要就是為了 Meta 當時的類似功能 Make-A-Video 而來。期間 Google 雖然有初步展示了這套功能可以藉由逐行的文字提示(Prompt)完成影片,但實際這項功能將採用何種介面,或者是能有哪些變化,則都是去年十月的展示中所留下的伏筆。
近日,透過 CBS News 的 60 Minutes 節目探訪 Google 相關技術展示的過程,我們也第一次看到了 Google Phenaki 影片生成功能的實際介面為何。
在這個訪談節目中,其實還有不少重點,像是 Google CEO Sundar Pichai 呼籲政府單位應該要好好規範 AI 的發展等,強調對於這類工具被用於 Deep Fake 等以假亂真用途的疑慮。更因為如此,Google 也多次強調他們所打造的這些系統將不會產生人的影像 – 嗯… 還是因為這樣大家就不想看接下來的介紹了?(誒,不至於吧?對吧?)
▲圖片來源:Google
總之,節目中不僅嘗試了 Google Bard AI 以及圖片生成功能,還有 Google Project Starline 視訊體驗。他們也嘗試了代號為 Phenaki,普遍認為可能是指費納奇鏡(Phenakistiscope)的文字轉影片的 AI 生成功能。
相對於去年 Google 示範的版本,這次的示範則是比較偏向於主打可以生成數秒影片的 Imagen 的感覺 – 也就是先前提過僅能生成數秒影片 AI 模型。從影片中可以看到,Google Phenaki 僅需輸入文字提示,即可產生出四個動態影片內容。
▲圖片來源:CBS News
以官方的示範「Golden retriever puppy with wings walks through a field filled with wild flowers.(有著翅膀黃金獵犬寶寶,穿梭於野花盛開的田野。)」來看,其所產生的影片雖然多少可以看到小狗的臉部似乎有些奇妙的變形,不過相對來說與目前硬用圖片生成服務來一格一格製成影片的結果來說,Google Phenaki 至少在背景方面的呈現算是相對穩定。
就 Google 先前的示範與解說,Phenaki 理論上應該可以生成數分鐘的影片。由目前的介面看來,你將會需要逐步以文字生成數秒的影片,四選一來一段段拼湊完成整支影片。Phenaki 的厲害之處,應該是可以讓這些不斷改變的片段彼此可以更為連貫。至於完整輸出影片的示範,大家可以參考去年 Google 所展示的影片。
1/ From today’s AI@ event: we announced our Imagen text-to-image model is coming soon to AI Test Kitchen. And for the 1st time, we shared an AI-generated super-resolution video using Phenaki to generate long, coherent videos from text prompts and Imagen Video to increase quality. pic.twitter.com/WofU5J5eZV
— Sundar Pichai (@sundarpichai) November 2, 2022
即便目前來講在 AI 聊天機器人甚至是 AI 圖片生成等範疇,Google 目前看起來算是相對被動落後的狀態。但在文字轉影片的這塊,他們應該也算是很理解自己可能有佔到一定程度的先機。所以才不斷地釋出相關的發展吧?不知道後續無論是 OpenAI 等其他 AI 對手會不會很快就端出類似的示範甚至是直接搶先 Google 提供給消費者使用呢?可以期待一下啊。