Google 這次更新 Gemini 模型的速度可說快很多,今年 5 月才推出 Gemini 1.5,約半年的時間,Gemini 2.0 模型就登場了,而且是針對 AI 代理所設計的模型,從最近各大 AI 公司的動作來看,明年應該就是 AI 代理開創的一年。
Gemini 2.0 正式推出,針對代理開發的新 AI 模型
Google 稍早在官網宣布推出新一代最強 AI 模型 Gemini 2.0,Google 表示,這是新代理時代設計的下一代模型,透過全新的多模態功能,例如原生影像和音訊輸出,以及內建工具使用能力,Gemini 2.0 將能夠構建新的 AI 代理,進一步實現通用助手的願景。
Gemini 2.0 預計會有多個模型,而目前推出的是 Gemini 2.0 Flash Experimental,這是一款核心應用的高速模型,具有低延遲與效能優化特性,在效能測試中,2.0 Flash 的表現已經能超越 Gemini 1.5 Pro,速度還提升一倍。
除此之外,2.0 Flash 還帶來一系列全新功能,包括能處理影像、影片和音訊等多模態輸入,以及支援多模態輸出,可同時生成文字與原生影像,並具備多語言文字轉語音( TTS )功能。
還能無縫整合 Google Search、程式碼執行以及第三方用戶自定義等功能。
下方是 Google 分享的測試數據。可以看到,2.0 Flash 許多方面都超越了 Gemini 1.5 Pro 002,跟 1.5 Flash 相比,提升幅度更是明顯:
開發者現在已經可以透過 Google AI Studio 和 Vertex AI 的 Gemini API,使用 Gemini 2.0 Flash Experimental,包括多模態輸入和文字輸出功能,而文字轉語音及原生影像生成功能,則只有向早期合作夥伴開放。
正式發布會落在一月份,到時 Google 承諾將提供更多模型尺寸版本。
而對一般用戶,今天起也能在 Gemini 應用程式中使用,從桌面和行動網頁版的模型下拉選單中,即可找到 Gemini 2.0 Flash Experimental 的聊天優化版。至於 App,還需要再等等。
Gemini 2.0 的 AI 代理應用
針對 AI 代理,Google 也分享目前正透過一系列原型來探索,包括
- Project Astra 更新版:這是研究通用 AI 助手未來能力的原型
- Project Mariner:新推出的原型,用於探索人類與代理互動的未來,從瀏覽器開始
- Jules:一個幫助開發者的 AI 驅動編程代理
每一個系列在官網上都有進行詳細介紹,有興趣的人可以閱讀看看。
Google 也有分享應用影片,像是自行操控瀏覽器完成你的要求、玩遊戲時會即時讀取你的畫面並給予建議:
Project Astra 影片:
Project Mariner 影片: