現代任何智慧型手機的大腦都是 SoC,這是一種極其複雜的微型機器。它將 CPU、GPU、音訊和視訊的處理、無線通訊和電源管理功能封裝在一塊指甲大小的晶片上。隨著科技進步,SoC 變得越來越複雜,最近新增一項就是 NPU,它是 AI 功能的助力。如果你的手機是最新型號,很可能裡面就配備有 NPU,即便是中階手機裡面可能也有,但是 NPU 是做什麼的呢?它有什麼差別?讓我們來探索一下。
什麼是 NPU?它如何讓手機變得更智慧?
什麼是 NPU?
NPU 存在的時間比你想像得長。NPU 是神經處理單元,它是智慧型手機 SoC 中的運算模組,類似於 CPU (中央處理單元)和 GPU(圖形處理單元)。最近的 Snapdragon、Exynos、天璣、Apple A 系列 SoC 以及 Intel、AMD 和 Apple 的一些桌上型電腦和行動 PC 處理器都配備了 NPU。
手機 SoC 配備 NPU 已經有段時間。從 2015 年起,高通就在 Snapdragon 820 上就搭載了 AI 引擎(PDF ),這是用於執行 AI 任務的硬體和軟體組合。然而,儘管它們尚未完成,但由於圍繞 AI 及其帶來的功能造勢效果,在今日更加被突顯出來。
為什麼手機需要 NPU?
NPU 的工作是加速與 AI、機器學習應用相關的任務,包括識別影像中的人和物體、文字和影像生成、將語音轉換為文字、即時翻譯已及預測你可能要輸入的下個單字。理論上你不需要 NPU 來執行這些功能,待它會使流程更快、更節能,並且對雲端運算的依賴更少。AI 任務所需的運算非常具體,因此針對這些任務最佳化處理單元是極有意義的。如果你對此好奇,著名 Vsauce 頻道的 Michael Stevens 在下面的 YouTube 影片中展示了一個有效的神經網路,請注意它是如何同時執行基本但繁多的操作才能使整體網路正常運作。
CPU 與 NPU 有什麼不同?
CPU 是一種通用單元,可以快速且高精度地執行一個或數個複雜的運算。然而,AI 工作需要並行運算許多計算,而精度並不那麼重要。由於 GPU 的平行特性,GPU 比 CPU 更適合此任務。儘管如此,正如 IBM 指出的那樣,NPU 仍因其效率而表現出色。NPU 可以在消耗一小部分能量的情況下提供類似的 AI 性能,這使其成為行動電池供電設備的理想選擇。
設備端 AI 有什麼的好處?
SoC 上加入 NPU 的另一個優點是,可以在裝置上而非雲端執行一些 AI 操作,而這項工作在 SoC 上的作業會更慢。這對於語音與文字轉換等較輕的負載是有意義的,當涉及感測器輸入並且期望立即得到結果時,例如在相機應用程式檢測場景中的影像,它也是理想的選擇。 AI 模型是處理你的輸入並儲存在本機的程式碼,Google Pixel Studio 圖像生成器等應用程式使用混合運算,利用本地和雲端 AI 模型。
設備端 AI 非常有利於保護隱私。無論你以語音、文字或影像形式提供的個人資料都不會離開你的手機,這也消除了不良行為者在資料外洩中存取它的機會。
Google Pixel 的 TPU 有何不同?
如果你查看過一直大力以 AI 功能為主打的 Google Pixel 9 系列手機的規格頁面,你不會找到裡面提及任何 NPU,這是因為它使用的是 TPU(張量處理單位)。
與 NPU 一樣,TPU 可以加速 AI 運算。不同的是,TPU 和 TPU 晶片是由 Google 客製化設計,你只能在 Google 硬體和該公司的資料中心中找到它。TPU 針對 TensorFlow 進行了最佳化,TensorFlow 是 Google 開發的開源軟體庫,專為機器學習和 AI 應用而設計。
什麼是 NPU TOPS?
雖然大多數手機都配備 NPU,但有些手機執行 AI 運算的速度更快。TOPS(每秒兆次運算)是 AI 處理器效能常用的衡量標準。高通解釋,有兩個因素決定了 NPU 的 TOPS,分別是運行頻率(時脈速度)和可處理的 MAC 運算單元數量。
最近發表的 Snapdragon 8 Elite 晶片據稱比其前身 Snapdragon 8 Gen 3 的 AI 性能提高了 45 %。這與高階 Nvidia RTX 4090 桌面顯示卡提供的 1,300+ TOPS 相比並不算多。話又說回來,手機不像 Nvidia 的野獸顯卡那樣耗電高達 450W。由於很少提及 AI 任務的 TOPS 要求,因此很難將這些數字放在上下文中,然而,Microsoft 的 Copilot+ AI 聊天機器人至少需要 40TOPS。
NPU 會繼續存在嗎?
鑑於其高度專業化的性質,NPU 無法取代 CPU 或 GPU。相反,它們的目的是透過承擔人工智慧任務來提高行動 SoC 的效率,同時節省電池電量。隨著 AI 融入智慧型手機,未來我們將來會聽到更多有關 NPU 的資訊。