現在可說越來越多公司推出適合在手機上運行,但效能也強大的 AI 語言模型,像之前 Google 最新 Gemma 3 1b、3b 就是,也因此很多 iPhone 用戶一定會想嘗試看看,而這篇就要推薦一個支援 Hugging Face 下載模型的免費 PocketPal AI App,代表說只要是有在 Hugging Face 開放下載的 AI 語言模型,你都能透過這 App 裝在 iPhone 上使用。
PocketPal AI 可在 iPhone 本地運行各種 AI 語言模型的免費 App
PocketPal AI 是一款標榜專為與大型語言模型進行安全、私密對話而打造的 App,可將尖端 AI 技術直接帶到 iPhone 上,確保你的聊天內容始終隱私且離線處理,不用上傳到任何伺服器。
不只是預設的 AI 模型,還整合 Hugging Face 資料庫,可將 GGUF 格式檔案的模型加到喜愛書籤,或是下載使用。
打開 PocketPal AI App 後,一開始沒有任何 AI 語言模型可用,按畫面中的 Download Model,再按右下方的 + 符號,會跳出從 Hugging Face 加入,或是本地,如果你已經有模型檔,可以直接從本地加,沒有的話就從 Hugging Face:
接著打開的清單中,會預設顯示幾個熱門、適合在手機上運行的 AI 語言模型,如:Gemma-2-2b、Phi-3.5 mini、Qwen2.5-1.5B 或 3B 等等,如果你要找的沒在清單上,可按下方的搜尋功能,然後輸入該模型關鍵字。像我找 Gemma-3:
我原本有測試 Google 提供的模型檔,但不知為何不能下載,因此我改用另一個開發者提供的 Gemma-3-4b-it,有非常多版本,我選 Q3_M 這個,按旁邊的下載按鈕後,就會開始下載,接著回到模型清單,顯示在 Reday to Use 代表已經下載完成。按 Load 即可開始聊天:
選模型時,建議都先從比較小模型、輕量化開始嘗試,1B 最保險,但如果是 iPhone 16 系列,可以試試 4B,量化部分也推薦從小數字開始,如:Q2 最小、Q3 大一點、Q4 又更好,接著測試看看回應和運行速度如何,如果還不錯,可以改嘗試大一點的。
Gemma-3-4b 支援中文,我用的這個 Q3_M 回應速度雖然慢一點,但還可以接受,回應的長度也相當夠:
使用時還有一點要注意是,因為是在本地運行,耗電量可能會比較大,特別是進行長時間推理,iPhone 搞不好會比較熱,當熱度較為明顯時,建議隔一段時間再繼續使用,會比較保險。