Google 在美國啟動了最新生成式 AI 實驗「Whisk」,可允許你把影像作為指令,而不是像過去必須以冗長的文字精準描述需求才能生成影像,用戶只需要把影像拖曳到使用介面中即可開始。特別的是,混搭出來的作品並非只是簡單地將它們結合在一起,而是將你輸入的影像以更靈活、藝術感的方式呈現。
Google 啟動新 AI 實驗「Whisk」,可將你輸入的圖片重新混搭生成
Whisk 允許用戶輸入主題影像、場景影像與風格影像,然後再將它們重新混合,創造出專屬的獨特作品。Gemini 模型在背景會自動為你的影像編寫詳細的標題,然後將這些描述輸入到 Google 最新的影像生成模型 Imagen 3 中。過程中不是以精準複製為目的,整體環繞著主題的本質,你可以輕鬆地以新方式重新組合你想要的主題、場景與風格。Google 提供幾個範例來供大家參考,每一張生成的影像皆是以三張圖片混搭而成。
由於 Whisk 僅從你的影像中提取一些關鍵特徵,因此生成後的影像可能會與原本的期望不同。例如,產生的物件可能具有與預期不同的身高、體重、髮型或膚色。這些細節對於有些人的專案可能非常重要,所以 Google 允許用戶在 Whisk 中隨時查看和編輯底層提示,除了三張輸入圖片外,還可以輔以文字更精準地描述深入的細節與需求。要是你手邊沒有影像圖片,還可以點選骰子讓 Google 為你自動填入。
根據 Google 實驗室早期對藝術家和創意工作者的測試中發現,人們一直將 Whisk 描述唯一種新型創意工具而非除統的影像編輯器。Google 創建 Whisk 的初衷是為了快速視覺探索,並非完美的像素編輯,它以新穎和具創造性的方式探索想法,用戶可以從數十種選項中盡情嘗試,並且下載自己喜歡的選項。
如果你身在美國,即日起就可以在「labs.google/whisk」上嘗試這項新的 AI 生成工具,一定可以為你帶來許多前所未有的新體驗。