最近國外有網友發現到 ChatGPT 最新推出的 o3 模型,有非常強的查詢照片拍攝位置能力,剛剛我也測試一下,確實真的蠻厲害,特別是有明顯地標或建築物的照片,而且不僅限於知名地標,就算是一般建築物的名字也沒問題,有興趣的人很推薦玩玩看。
不過 o3 模型目前只有 ChatGPT Plus 等付費用戶能用,免費版可以試試看 o4-mini。
如何用 ChatGPT 查出照片的拍攝位置?
ChatGPT 雖然過去的模型就能分析照片可能的拍攝位置,但這次的 o3 和 o4-mini 模型融入圖像思考能力後,會分析每個圖片的區塊,取出有用的資訊並進行推理和思考,過程中還會上網搜尋比對它思考的對不對,這也讓最終查出可能的位置變得更加精準。
使用方式很簡單,就把你想要查的照片丟給 o3 模型,並輸入類似「幫我查詢照片的拍攝位置」提示詞,不用太複雜。但這邊有一個小重點,照片中必須要有比較明顯的建築物或地標,如果沒有,像是一大片森林之類,效果就沒這麼好。
以下圖為例,我丟二張照片給 ChatGPT,要求它找出拍攝位置,其中一張照片的建築物上有 THE QUBE HOTEL 字樣,ChatGPT 就成功查出拍攝位置是在 Chiba Port Square 廣場附近(旁邊那棟大樓正是 Chiba Port Square )。另一張則沒有明顯地標,雖然成功猜出是在日本沖繩,但飯店名稱不對,所以猜錯,但我覺得這樣也已經很厲害了:
展開思考過程可以看到,o3 有抓到圖片上的飯店名稱,不過它一開始思考是高雄,最後竟然可以推理到日本千葉:
思考出可能的答案後,o3 會上網搜尋網頁,比對相關資訊以及圖片,這個步驟它推測 The Qube Hotel 可能在中國:
最終比對多個訂房網之後,才確認是在日本千葉。另一張照片因為沒有任何字或知名地標,因此就只能根據建築物的外觀推測:
再來我測試另一張照片,雖然也沒有任何明顯的建築物名稱,但後面有一根是非常知名的札幌電視塔,因此 o3 幾乎不用思考和比對太久時間,2 秒鐘就成功查出是在大通公園拍的:
室內部分就不準確了,我這張是在中山鼎泰豐拍的,不是復興館:
想玩的人要注意一件事是,o3 有用量限制(除非你是 PRO 用戶才沒有),所以建議一次可以問二張,來省問的次數。
GPT-4o 雖然也能猜測照片拍攝位置,但準確度很低,同一張 o3 成功辨識出是在千葉拍的照片,GPT-4o 就失敗,因為它不會思考圖像和推理:
由此可見,隨著 AI 模型越來越強,可以推測之後 OpenAI 或其他品牌的新模型,在查詢照片拍攝位置上一定會變更厲害,但這相對也帶來隱憂,最近國外就有不少討論,是關於這功能可能會引起犯罪。