自從 DeepSeek 亮相之後,AI 模型可說進入白熱化的階段,不僅各家 AI 服務都開始第一時間讓免費用戶就能體驗到最新模型和功能,也讓原本沒打算在開放權重語言模型耕耘的 OpenAI 轉向,承認策略錯誤,先前還曾透露會思考推出新的模型。
而就在近日,OpenAI CEO 搶先在社群平台公布,幾個月內就會推出新的開放權重語言模型,這也是繼 GPT-2 之後再推新的,應該讓非常多 AI 用戶期待。
OpenAI 全新強大的開放權重語言模型即將登場,可在本地安裝運行
OpenAI 執行長 Sam Altman 稍早在 X 社群平台上宣布,將在未來幾個月內釋出一款具備推理能力的開放權重(open-weight)語言模型,還在後半段強調,他們很早就有這想法,但過去因為其他優先事項而延後,現在是時候把它實現了。
「我們很高興能在未來幾個月內推出一款強大的開放權重語言模型,具備良好的推理能力。我們對這款模型寄予厚望,希望它能成為非常、非常出色的模型!」
TL;DR: we are excited to release a powerful new open-weight language model with reasoning in the coming months, and we want to talk to devs about how to make it maximally useful: https://t.co/XKB4XxjREV
we are excited to make this a very, very good model!
__
we are planning to…
— Sam Altman (@sama) March 31, 2025
不得不說,OpenAI 這次動作可說相當快,上次說「站在歷史的錯誤一邊」也只是 2 月初的事情,才過二個月左右時間就已經準備好推新的開放權重語言模型,真的令人期待。
隨著這消息出現,也讓很多 AI 圈的人認為這是 OpenAI 對中國公司 DeepSeek R1 模型所做出的回應,不讓他們專美於前,OpenAI 已經轉向更開放的 AI 模型策略。
雖然還不知道 OpenAI 新的開放權重語言模型會多強大,但從他們最近新更新的 GPT-4o 圖片生成能力、GPT-4o 新版本來看,應該不會讓人失望才對。
沒意外模型應該也會分成不同參數,而且搞不好不需要太強大的硬體就能運行。
Sam Altman 還提到,在正式發佈前,會依據 OpenAI 的「備援框架(Preparedness Framework)」 評估這款模型,就像處理其他模型一樣,也會做額外的安全風險評估與防範措施。
OpenAI 技術團隊成員 Steven Heidel 也轉發 Altman 貼文並補充:「我們今年要推出一款可在你自己硬體上運行的模型。」
跟線上模型不同,開放權重模型可下載、修改和自行部署,意味著成本更低,並且可以根據用戶和任務需求,來調整成合適的應用模型。
OpenAI 今日也同步上線一個 Open model feedback 的頁面,邀請開發者申請早期存取權限。Altman 表示,接下來幾週將會舉辦一系列開發者活動,展示新模型的原型並蒐集回饋:
OpenAI 也加入戰場後,未來開放權重語言模型的競爭勢必會更加激烈。