這一年中國 AI 可說正在快速崛起,不只是模型,硬體方面似乎也慢慢正在趕上 NVIDIA。據外媒報導,中國螞蟻集團宣稱他們已經在用華為 AI 晶片訓練模型,其效能就跟 NVIDIA H800 差不多,更重要是,成本還低 20%,代表說花費更少,就能獲得等同於 H800 的訓練效果,而且不用擔心禁令問題,這對中國 AI 發展來說有著重要的意義。
圖片來源:螞蟻集團官網
中國 AI 晶片不僅成本更低,效能似乎也達到 NVIDIA H800 水準了
根據彭博社的報導,中國金融科技螞蟻集團近日宣布,他們在人工智慧領域獲得重大突破,已經開始使用國產晶片來訓練 AI 模型,也就是來自阿里巴巴和華為的 AI 晶片,詳細是什麼型號還不清楚,但阿里巴巴可能是自研的 AI 晶片,華為則是 Ascend 系列。
他們發現到,國產晶片的效能表現已經跟 NVIDIA H800 同水準,而且還實現約 20% 的成本節省,這對一直在找 NVIDIA 替代方案的中國公司來說,是一項相當重要象徵意義。
NVIDIA H800:
報導也指出,螞蟻集團部分的 AI 開發任務還是使用 NVIDIA 晶片,但已慢慢將主力轉向 AMD 和中國本土的晶片製造商。
如果後續真的成功,那中國科技業在面對美國對高階晶片出口的制裁限制下,已找到替代方案,甚至是建立自主的供應鏈,進而加速中國 AI 發展。
雖然說看起來有點猛的,但有鑑於過去中國出現過太多公司曾放話,但實際上差距並沒有想像中拉近這麼多,我覺得先持保留態度就好,除非真的有像 DeepSeek 那樣實際產品和測試數據出來,才更有說服力。
此外,中國的 AI 晶片是否能長期穩定提升、驅動與軟體生態層面能不能匹敵 NVIDIA 等,也需要去考量。
而 AMD 的 AI 效能現階段很明顯跟 NVIDIA 還有段差距,即便未來追上,一定還是會受到美國禁令影響,所以中國公司依舊要靠國產 AI 晶片。
NVIDIA H800 是 2023 年 3 月專為中國市場設計的高效能 GPU,基於 Hopper 架構,主要作為 H100 的替代品,2022 年美國對中國的半導體出口限制,NVIDIA 無法直接向中國市場提供 H100,所以才開發出 H800。
H800 採用台積電的 4 奈米製程技術,內含約 800 億個電晶體,並配備 14,592 個 CUDA 核心,以及 80GB 的 HBM3 記憶體,記憶體頻寬達到 2.04TB/s。
DeepSeek 曾宣稱使用 2,000 張至 3,000 張的 NVIDIA H800,就訓練出擁有 6,710 億參數的 DeepSeek-V3 模型。
資料來源:Bloomberg 經由 Tom’s Hardware