雖然 OpenAI 近日正式推出了 Sora,但因為他們低估使用量需求,導致伺服器快負荷不了,而為了維護品質,目前就暫緩新用戶註冊,即便已經是 ChatGPT Plus 和 ChatGPT Pro 用戶也一樣,什麼時候會開放還不知道,但我猜應該不會等太久才對。
而對於想試試 Sora 的人,應該都知道它是採用 Credits 的計算方式,每生成一部會扣除固定的 Credits,因此下提示詞(Prompt)就要特別小心,才能避免浪費。如果你還沒有任何生成其他 AI 影片的經驗,這篇就要分享國外 Reddit 網友進行 32 個實驗分析的心得,可以幫助你更了解怎麼下提示詞,才能獲得不錯的影片結果。
圖片來源:OpenAI
Reddit 進行 32 個 Sora 影片生成實驗,這些是結果
稍早 Reddit 網友 CanadianCFO 在 OpenAI 版上分享他實驗 32 部 Sora 影片的心得,他表示在 Sora 上線當天,他協助 Reddit 社群進行一系列實驗,來測試它的各項功能,包括「連續場景」、「人物」、「圖形」、「動物」和「場景地點」。
每個測試結果會分成「滿意」與「不滿意」,判斷標準是根據生成的影片結果,是否符合提示內容。他也有把所有實驗影片都放在 Google 雲端硬碟上,讓大家查看。影片都是 16:9、480p 解析度、和 5 秒的長度。
最終結果是,人物和動物場景表現最好,成功率分別為 83% 和 100%,場景地點也還可以,有 67% 的影片都成功,但連續場景和圖形描述就不太好,成功率皆不到 35%。
32 部影片有 17 部讓人滿意,不滿意則是 15 部,代表說一半一半。
他觀察到下提示詞時,字數建議少於 120 個字,成功率會比較高。內容也最好選擇單一核心主題,或簡單的視覺元素,不要太複雜。
語氣可以用有趣的描述風格,這更契合 Sora 的優勢,多層次或抽象的提示,成功率都偏低。最後是涉及敏感題材或版權的提示,很容易失敗,需要改用更中立的描述方式。
以下是他對 Sora 的簡短評論:
Sora 在簡單明確的創意執行方面表現不錯,特別擅長處理有趣的畫面或故事。然而,它在處理複雜結構或精細描述時表現略顯不足,這可能與其上下文限制有關。簡短的提示更能發揮其效能。
Sora 提示詞的重點指引
圖片來源:OpenAI
CanadianCFO 也有把提示詞的重點給整理出來,之後要嘗試生成 Sora 影片時,可以參考看看。
通用原則
- 簡短為佳: 提示內容最好控制在 120 字內,避免過於冗長或複雜,以確保清晰表達。
- 聚焦重點: 明確設定 1 至 2 個主要視覺或敘事要素,不要一次容納太多想法。
- 營造畫面感: 提供鮮明、富想像力的描述,幫助創造靈感。
- 避免敏感話題: 避開涉及版權、歷史爭議或文化敏感議題的內容。
- 平衡難度: 挑戰大膽創意,但同時保持提示具體可執行。簡單的設計往往更容易成功。
分類創作技巧
-
連續場景設計
- 有效做法: 故事進程清晰,敘述連貫(如「倒帶播放太空人進入太空的過程」)。
- 需避免: 過於抽象或分段混亂的設計(如「探討現實的分形結構」)。
- 範例:「在沙漠星球上,Balrog 與 Paladin Platypus 展開激烈對決。」
-
人物故事場景
- 有效做法: 有趣、貼近日常或富戲劇性的行為(如「啞劇演員衝刺馬拉松終點」)。
- 需避免: 過於概念化或難以具象化的描述。
- 範例:「一名男子冒著暴風雪前行,頭戴一頂由生肉做成的奇特頭盔。」
-
動物情境設計
- 有效做法: 動物作為主角,情境有趣且生動(如「貓咪穿巫師袍施展魔法」)。
- 需避免: 動物動作設計過於複雜或抽象化。
- 範例:「一隻劍齒虎在史前森林裡,沿著發光河流靜靜漫步。」
-
角色圖像設計
- 有效做法: 擁有明確視覺概念的場景(如「風化的機器人在廢墟城市中搜尋物資」)。
- 需避免: 過度堆疊文化參考或角色細節描述。
- 範例:「一個動漫風的動作場景,主角以驚天一拳震裂大地。」
-
環境場景設計
- 有效做法: 使用電影化語言描述,營造強烈的視覺效果(如「日落時,原始人在山頂上的無人機鏡頭畫面」)。
- 需避免: 描述過於細碎或過度複雜。
- 範例:「2078 年新年夜,霓虹燈點亮整座城市,畫面如夢如幻。」