之前馬斯克就已經預告過 Grok 3 將會非常強的 AI 模型,早些時間終於正式推出,開發團隊也分享許多測試數據,不得不說真的有點強,在多項測試中都贏過 OpenAI 的 GPT-4o,甚至是 o1、o3mini(high)也一樣,目前也有方法可以免費嘗試 Grok 3,下面就一併整理給大家。
Grok 3 正式推出,擁有非常強悍的推理能力
根據介紹,Grok 3 採用 20 萬顆 GPU 進行訓練,運算能力是 Grok 2 的 10 倍以上,代表說擁有更強的推理和自主代理能力,在數學、科學和程式設計領域基準測試中,幾乎擊敗所有競爭對手。
在效能跑分測試中,數學(AIME’24)Grok-3 獲得 52 分,Grok-3 mini 也有 40 分,都贏過其他競爭對手。科學測試(GPQA)、程式設計(LCB Oct0Feb)也一樣,Grok-3、Grok-3 mini 皆領先:
再來是推理與測試運算(Reasoning + Test-Time Compute),Grok-3 系列在所有測試中表現都最棒,其中數學和程式設計方面,Grok 3 mini Reasoning 還領先 Grok-3 Reasoning Beta:
AIME 2025 效能測試 Grok-3 的推理能力表現一樣最優異,尤其是測試版,即便是面對 o3-mini (high) 也領先:
這次也跟上 DeepSearch 的功能,用戶可以開啟 Grok 3 的 DeepSearch 功能,來獲得更全面性的分析,並產生完整報告。就跟其他 AI 服務一樣,也能展開查看 Grok 的思考過程,以及獲得關鍵的內容引用來源:
除此之外,為了提升推理體驗,Grok 3 還提供「Think」與「Big Brain」 兩種互動模式:
- 「Think」:依賴較小的 Grok 3 mini 模型,適用於簡單查詢。
- 「Big Brain」:使用完整的 Grok 3,能處理更複雜的問題。
在影片展示中,xAI 工程師就有展示使用 Big Brain 建立一款融合俄羅斯方塊與寶石方塊元素的遊戲:
不過 Grok 3 只有開放開放給 X Premium+ 訂閱用戶,官方版本沒辦法免費使用,但有預告 Grok 3-mini 未來幾天會讓所有用戶免費使用:
Excited to be a member of the amazing team at @xai , and shipping the best grok3!
Thrilled to lead grok3-mini training, and will ship it to all users for free in the coming days! LFG! pic.twitter.com/EAQqmSCpn3
— Juntang (@archanfel_anoth) February 18, 2025
Grok 3 完整發表會影片:
— xAI (@xai) February 18, 2025
如何免費嘗試 Grok 3?
雖然官方沒有免費提供,但現在還是有一個方法可以嘗試 Grok 3,就是透過「Chatbot Arena」,只不過是 Early-Grok-3 早期模型,相較於 Grok 3 正式版一定有差,但效能也是不錯。
按上方連結進到 Chatbot Arena 後,請打開 Direct Chat,預設就是 early-grok-3 模型: