經過約 9 個月的時間,Google 的開源模型 Gemma 系列,終於迎來的新一代 Gemma 3,這次不僅提供超過 35 種語言的即用型支援,還標榜擁有最先進效能,即使是單一 GPU 或 TPU 的裝置,也能輕鬆運行 Gemma 3。
Google 也有提供 Chatbot Arena Elo 分數比較,Gemma 3 27B 就贏過 Deepseek v3 671B、o3-mini、以及 Llama 3 405B,可說相當強悍。下面也會教你怎麼本地或線上嘗試。
Google 新一代 Gemma 3 開源模型正式登場
根據 Google 介紹,Gemma 3 是專為各種開發環境所打造的開源模型,無論是資料中心,還是智慧型手機上,都有適合的模型版本。
Gemma 3 共有四種版本,分別是:
- Gemma 3 1B(輕量級,幾乎任何裝置都能運行)
- Gemma 3 4B
- Gemma 3 12B
- Gemma 3 27B
在較低的精度模式下,最小的 Gemma 3 模型可能只占用不到 1GB 記憶體,但較大的版本模型,即使是 4-bit 量化,可能還是需要 20GB–30GB 記憶體才能運行。我測試過 12GB VRAM 顯卡確實能順暢運行 Gemma 3 12B。
跟過去的 Google 開源 AI 模型相比,有許多心特色,像是上下文從 8,192 個 Token,擴展至 128,000 個 Token,大幅提高能處理的輸入數據量,而且一樣支援多模態處理,能處理文字、圖片影像,甚至是影片。
除此之外,Google 也針對影像安全問題推出 ShieldGemma 2,一款基於 Gemma 3 基礎構建的強大的 4B 影像安全檢查器,可阻擋不適當的影像內容,包括危險內容、色情內容和暴力內容。
下圖是 Google 公布的 Elo 測試數據,Gemma 3 27B 在對話能力上不僅大幅超越上一代 Gemma 2,也領先 Meta Llama 3、OpenAI o3-mini、Deepseek v3 671B 等模型,不過還是小輸 DeepSeek R1 671B 一點:
當然,一切還是要自己測試才知道 Gemma 3 是不是真的有這麼強。
Gemma 3 現在已經可以在 Google AI Studio、Hugging Face 等線上體驗,或是本地部署。
如何嘗試 Gemma 3 開源模型?
如果你想要先在線上玩玩看,Gemma 3 12B 模型可以在 Hugging Face 網站上體驗:
Google AI Studio 則可以體驗到所有模型:
如果要在本地安裝,可以透過 LM Studio 這款免費工具,支援繁體中文,可到設定中調整語系。打開後,按上方的載入模型:
輸入 gemma 並搜尋:
就會找到最新 Gemma 3 模型了,看你要安裝哪一個:
按右下角的 Download 會開始下載:
下載完成後,按 Load Model:
就會跳轉到聊天介面了,可以開始跟 Gemma 3 AI 聊天:
實測 12 VRAM 顯卡運行 12B 相當順暢,輸出很快,回答內容也很長:
不過如果是問一些精準答案,建議還是要檢查一下,像我問 Gemma 2 的推出日期,它給錯誤的答案(2024 年 3 月 13日),正確答案是 2024 年 6 月 27 日: