最近由中國幻方量化創辦的人工智慧初創公司 DeepSeek 近日在推出自家新 V3 模型和深度思考模型 R1 後實用度大幅上升,國外大模型測試相關人員表示 DeepSeek-R1 模型水準與 OpenAI o1 差不多,在推理能力方面更是能夠比肩 OpenAI o1。因此今天就測試看看到底 DeepSeek 究竟有沒有像網傳的一樣這麼厲害!
中國免費 DeepSeek-V3 與 R1 模型實測,號稱比肩 OpenAI o1,真的這磨厲害?
DeepSeek 於 2023 年成立,去年小編就有測試過 DeepSeek 各方面能力,當時測試後認為 DeepSeek 胡言亂語的情況還是偏多,因此沒有跟大家分享 DeepSeek。不過去年 12 月 DeepSeek 將自家模型更新為最新版本的 DeepSeek-V3 模型,今年又推出能夠進行深度思考的DeepSeek-R1 模型,讓 DeepSeek 與之前相比好用很多,DeepSeek 甚至表示自家 DeepSeek-R1 模型能夠直接對標 OpenAI o1 正式版 。所以今天就讓跟大家介紹 DeepSeek-V3 這款智慧助手到底有沒有 DeepSeek 說的這麼厲害。
🚀 Introducing DeepSeek-V3!
Biggest leap forward yet:
⚡ 60 tokens/second (3x faster than V2!)
💪 Enhanced capabilities
🛠 API compatibility intact
🌍 Fully open-source models & papers🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) December 26, 2024
🚀 DeepSeek-R1 is here!
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) January 20, 2025
前往免費體驗智慧助手 DeepSeek-V3
想要體驗 DeepSeek-V3 需要註冊會員,可以使用 Gmail 帳號註冊 DeepSeek-V3 會員。註冊後就可以開始使用 DeepSeek-V3。提醒,DeepSeek-V3 為中國科技初創公司產品,有顧慮的朋友可以斟酌使用。
DeepSeek-V3 現在可以進行連網搜索,有了連網支持讓 DeepSeek-V3 準確度比之前高很多。測試了 DeepSeek-V3 翻譯、統整事件情況以及提供圖片生成 Prompt 等等的功能,發現效果都還不錯。當然還是要注意 AI 產生幻覺的情況,大家可以點擊 DeepSeek-V3 提供的網頁參考來源去查證內容正確性。
- 翻譯
- Stargate 具體計畫
- 統整川普上任後採取的措施
- 提供圖片生成 Prompt
除了一般大模型能做的事情以外,DeepSeek 強調自家在近日推出的 DeepSeek-R1 模型能夠對標 OpenAI o1 正式版進行深度思考。因此小編就使用之前 OpenAI 在介紹 OpenAI o1 邏輯推理能力時所舉的範例來測試 DeepSeek-R1 模型。看看究竟 DeepSeek-R1 有沒有他們自己講的那麼厲害。
首先先對 DeepSeek-R1 測試了「A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess’s age was half the sum of their present age. 」的邏輯提問,請 DeepSeek-R1 回答公主和王子現在各是幾歲? 根據回答大家可以看一下 DeepSeek-R1 的答案。
接下來是詢問草莓(Strawberry)這個單字裡面有幾個 r,經過確認 DeepSeek-R1 回答正確,總共有 3 個 r。
除了邏輯問題以外,也對 DeepSeek-R1 的數學方面知識進行探索,請 DeepSeek-R1 生成一個5×5 的數織(Nonogram)題目,最後的答案要是英文字母『M』。測試後 DeepSeek-R1 一開始回答錯誤,經過提醒之後雖然與 OpenAI o1 回答的不同,但 DeepSeek-R1 的回答還是能看出 M 的圖案。
不知道大家覺得 DeepSeek-V3 和 DeepSeek-R1 模型的表現如何呢?有興趣的朋友可以自行前往 DeepSeek 體驗看看。DeepSeek 回答的答案為 AI 生成,因此大家在使用時還是要驗證,以免出現不必要的麻煩。
若對 OpenAI o1 的邏輯推理與應用案例感興趣的朋友也可以點擊下方連結前往閱讀相關報導: