最近非常熱門的 DeepSeek 模型,很多人一定都會想在本地部署,而有在考慮升級/購買顯卡的人,一定會想知道 NVIDIA 和 AMD 的 AI 效能差距真的很大嗎?近日 NVIDIA 官方就分享 RTX 5090、RTX 4090 和 RX 7900 XTX 的 DeepSeek R1 效能測試數據,即便 RX 7900 XTX 是 AMD 上一代最強的顯卡,結果顯示大輸 RTX 4090,RTX 5090 更不用說,差超大一節。
DeepSeek AI 效能測試顯示,RTX 5090 和 RTX 4090 碾壓 RX 7900 XTX
幾天前 NVIDIA 分享一篇關於 DeepSeek 在 RTX 50 系列顯卡 AI PC 上運行的文章,當中就有分享 RTX 5090、RTX 4090 的測試數據。
NVIDIA 表示,在這種新型推理模型中,推理速度(Inference Speed) 是關鍵,而 NVIDIA GeForce RTX 50 系列 GPU 採用第五代的 Tensor 核心,這是基於與數據中心 AI 解決方案相同的 Blackwell GPU 架構,因此可以確保 DeepSeek 在 PC 上獲得最大推理效能。
下方是 NVIDIA 的測試數據:
- DeepSeek R1 Distill Qwen 7b:跟 Radeon 7900 XTX 相比,RTX 4090 領先 46%,RTX 5090 領先 103%
- DeepSeek R1 Distill Llama 8b:跟 Radeon 7900 XTX 相比,RTX 4090 領先 47%,RTX 5090 領先 106%
- DeepSeek R1 Distill Qwen 32b:跟 Radeon 7900 XTX 相比,RTX 4090 領先 47%,RTX 5090 領先 124%
整體來說,運行 DeepSeek-R1 模型時,RTX 4090 至少贏過 7900 XTX 達 46%,RTX 5090 更有 103% 以上的領先幅度,NVIDIA 明顯比 AMD 快很多,因此不用懷疑,首選一定是 NVIDIA 顯示卡。
NVIDIA 也提到, RTX AI 平台提供最廣泛的 AI 工具、SDK 和模型,可充分利用 DeepSeek-R1 模型的能力,用戶可在 Llama.cpp、Ollama、LM Studio、AnythingLLM、Jan.AI、GPT4All、以及 OpenWebUI 輕鬆體驗。
DeepSeek R1 是一款全新的 AI 模型,一推出可說就轟動整個 AI 市場,因為它的效能可以跟目前最強 AI 模型相當,但計算需求卻低 11 倍。對於有興趣本地部署,但不知道怎麼開始的人,可以閱讀我們的 DeepSeek R1 教學。
資料來源:NVIDIA