Meta 新一代 Llama 4 系列開源模型來了!根據官方提供的測試數據,Llama 4 在多方面都贏過競爭對手的 Gemma 3、Mistral、GPT-4o 和 Gemini 2.0 Flash 等。另外跟過往不一樣地方在,這次推出的 3 款版本參數都非常大,其中 Llama 4 Behemoth 更擁有 288B 的參數,多數用戶應該都沒辦法在本地安裝使用,不過沒關係,網路上有免費體驗的地方。
Meta 新一代 Llama 4 系列模型正式登場
這次的 Llama 4 系列模型共有三種版本
- Llama 4 Scout:擁有 17B 活躍參數、109B 總參數、16 位專家的模型,是同類中最強大的多模態模型,對標 Gemma 3、Gemini 2.0 Flash-Lite 以及 Mistral 3.1。
- Llama 4 Maverick:擁有 17B 活躍參數、400 B總參數、128 位專家的模型,也是同類中最佳的多模態模型,對標 GPT-4o 和 Gemini 2.0 Flash。
- Llama 4 Behemoth:擁有 288B 活躍參數、2T 總參數、16 位專家的模型,是 Meta 目前最強大的一款模型,對標 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。
Llama 4 模型採用混合專家(MoE)架構設計,因此各版本才會分成活躍參數、總參數,而這二個差異在,前者是處理特定輸入時,實際被啟用並參與計算的參數數量,後者則是模型中所有參數的總和。
首先來看 Llama 4 Scout,Meta 表示,Llama 4 Scout 是一款通用模型,支援的上下文長度從上一代 Llama 3 的 128K,大幅提升至 1000 萬個 tokens,代表說無論是多文檔摘要、解析大量活動來實現個性化任務,對龐大的程式碼庫進行推理都沒問題。
下方是測試數據,從 LiveCodeBench 分數可以看到,Llama 4 Scout 還是略遜於 Llama 3.3 70B,不過贏過 Llama 3.1 405B、Gemma 3 27B 和 Gemini 2.0 Flash-Lite。而其他部份,圖像推理/理解、推理與知識方面、長上下文理解能力等,就都是 Llama 4 Scout 獲勝:
Llama 4 Maverick 是一個適合用於圖像理解和創意寫作的模型,相較於 Llama 3.3 70B,不僅價格更低,品質還更高,在寫程式、推理、多語言、長上下文和圖像基準測試中,都是同類最佳的多模態模型。
Llama 4 Maverick 幾乎各項測試都超越 GPT-4o 和 Gemini 2.0,其中寫程式和推理上,還比更大規模的 DeepSeek v3.1 相當:
最後是 Llama 4 Behemoth,目前還處於預覽版,Meta 宣稱這是一款在同類模型中最先進智慧的教師模型,在數學、多語言處理和圖像基準測試上,都提供非常棒的表現。
跑分測試顯示,Llama 4 Behemoth 所有成績都贏過 Claude Sonnet 3.7、Gemini 2.0 Pro 和 GPT-4.5:
Llama 4 Maverick 與 Llama 4 Scout 模型都已經在 llama.com 與 Hugging Face 開放下載,對於有 H100 的人,Meta 的 Llama 4 介紹中有寫到,可在單一 NVIDIA H100 GPU 的裝置上運行。
線上部份,Meta AI 網頁版已經有提供 Llama 4,不過目前還沒在台灣和多數國家推出,想玩玩看的人,可以改用 OpenRouter。
如何免費使用 Llama 4 模型?
目前網路上有幾個方法,OpenRouter 是我嘗試過最簡單的方式。
按上方連結進到 OpenRouter 網站後,需要登入你的帳號,沒有的人就免費註冊一下:
支援 GitHub、Google、Email 等多種註冊方式:
註冊好後進到 Chat,按右上方的 Add model 功能:
選單中就能找到 Llama 4 Maverick(free) 與 Llama 4 Scout(free)模型:
輸入你想要聊天的內容,這時會跳出一個錯誤:
按錯誤中的連結:
將 Model Training 選項打開:
再次回到聊天視窗就能正常對談了:
不過要注意是,OpenRouter 的 Llama 4 Maverick(free)是由 Chutes AI 提供,Llama 4 Scout(free)則是 DeepInfra,並不是 Meta 自己提供,因此不確定模型本身有沒有量化。
我還有問 AI 他們是不是 Llama 4 模型,結果回答不是,是 Llama 3,所以這點大家可以自行確認看看。
OpenRouter 的比較表中,Llama 4 Maverick(free)也是 fp8,Tokens 還來到 256K,比付費版的高: