OpenAI 於稍早的發表會正式推出全新 GPT-4o 模型,整個演示過程可說讓人非常驚艷,這也進步太多,特別是在即時回應這塊。另外 OpenAI 取這名字也蠻讓人意外的,原本以為應該是 GPT-4.5(跟 GPT-3 -> GPT-3.5一樣),結果是之前完全沒傳出的新名字,由此可見 OpenAI 保密做得真的很不錯。
更棒的一點是,這次的新模型 OpenAI 宣布 ChatGPT 免費版也能用,意味著即使你不是 ChatGPT Plus 付費會員,一樣能用到最新 GPT-4o 模型,下面就為大家詳細介紹這新模型的特色。
OpenAI 發表全新 GPT-4o 模型,免費/付費 ChatGPT 用戶皆能使用
OpenAI 全新推出的 GPT-4o 模型,後面這個 o 意思是 omni,代表擁有可處理文本、語音、影像和影片的能力。
相較於之前的模型,各方面都有所提升,尤其是在語音部份,不僅處理速度超快,對談的過程中還能打斷,不用像以前需要等到回覆完後在進行下一論對談,幾乎快要跟現實中與其他人聊天一樣。有了這些改進,ChatGPT 現在也變得更像用戶的隨身助手,用說的就能解決許多生活上的事物。
發表會也演示許多搭載最新 GPT-4o 模型的 ChatGPT 實測效果。
像是大家很需要的即時翻譯,下方這部影片是義大利文和英文的翻譯效果,ChatGPT 不僅很快就能完成翻譯,而且還不是很死的直接翻譯,而是會轉換成當地說法,然後用有情緒的方式表達,真的超強。這翻譯速度比目前絕大多數翻譯 App、翻譯器快超級多:
這一個我也覺得超猛,他只是跟 ChatGPT 問好,結果 ChatGPT 不僅回答我很好,還辨識出他衣服上面的圖示、穿衣風格、背景等等,,彷彿就像是 ChatGPT 有眼睛一樣。不過我猜測這前半部應該是有先下 Prompt,要求 ChatGPT 也一併回答看到什麼東西,沒下 Prmopt 不太可能講這麼細:
這一部最有趣地方在後半段,有一位女生突然闖入畫面中,然後又跑出去,ChatGPT 也完美回答發生這件事情:
隨著 GPT-4o 辨識物體的能力更強,現在 ChatGPT 也能幫助到一些,需要幫助的人,像是變成視障人士的眼睛,回答面前的事物:
GPT-4o 也能生成多種有情感的聲音,甚至連唱歌都沒問題,詳細可以看下方的演示影片:
OpenAI 還提到「未來這模型還能夠允許 ChatGPT 觀看現場運動比賽,然後解釋規則給你聽」。「隨著模型變得日益複雜,我們的目標是讓互動體驗更為自然和容易,使用者不必關注使用介面,而是專心在與 ChatGPT 的合作」。
現在無論是免費、還是付費用戶,都能夠在 ChatGPT 上面使用到 GPT-4o 模型了!當然,聊天次數限制會不一樣,ChatGPT Plus 用戶一定擁有更多的次數。
ChatGPT Plus 打開聊天介面後,就會收到 GPT-4o 可用通知,並沒有提到次數限制:
上方也能切換 GPT-4o、GPT-4 和 GPT-3,5:
ChatGPT 免費版收到的通知中就有特別註明「目前只能有限地使用最新模型。」:
ChatGPT 選單無法切換,但網址會出現 model-got-4o:
而獲得的回答下方最右邊圖示選單,可以查詢是 GPT-4o 回覆、還是 GPT-3.5:
OpenAI 完整發表會影片,有時間的話很推薦看完: