幾天前我們曾報導過 OpenAI 有可能在本週推出 ChatGPT 的殺手級工具 AI 代理「Operator」,稍早果然就真的登場,OpenAI 在直播上發表這項新功能,而且跟想像中不太一樣,目前一切都是在雲端伺服器完成所有操作,而不是本地。
OpenAI 的 AI 代理工具 Operator 正式亮相
就如同大家所期待那樣,OpenAI 的 AI 代理工具 Operator 將能夠完成用戶指定任務,像是訂某間餐廳、買 NBA 門票、訂披薩、購物等等,主要都是一些生活上的事務。對談時直接透過自然語言即可。
Operator 的操作介面跟 ChatGPT 很像,下面有提供一些常見的任務分類和提示詞,包括:活動、外送、當地服務、購物、旅遊等:
整個過程都是透過雲端,不是你的本地電腦,AI 會在某台伺服器上啟用瀏覽器,然後完成用戶的指定任務:
網站部分,目前已經跟部分公司合作,以提供最佳的使用體驗,包括 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber 等,不過根據 OpenAI 說明,不只是這些合作商,只要是透過瀏覽器,Operator 都能夠做到。
執行過程中,如果碰到任何問題,或不符合任務內的要求,AI 會詢問用戶,等到新的指示才會繼續運行。OpenAI 在影片中有展示訂餐廳的案例,他們要求的時間已經沒位子,AI 則尋找最近且有位子的時間,然後問用戶要不要改訂這時候:
為了避免過程中發生任何錯誤,Operator 也有一個很棒的機制,每次進行各項操作時,如:搜尋、按某某功能,都會自動截圖並儲存該會話過程,方便我們能夠隨時查看 AI 做了哪些動作。
用戶也能隨時介入,來控制當前操作,甚至是中途下新的任務、添加任何新東西給 AI。
也支援上傳圖片,像是把手邊紀錄下的生活用品購買清單上傳,要求 AI 幫忙線上購買,且可以提供常用的購物網站,Operator 會先以這個為主:
AI 將所有物品加入到購物車後,會讓用戶確認後才繼續進行:
不過現在還是預覽階段,因此多少都會發生錯誤,直播影片就出現一個小插曲,AI 無法正確打開網站,這時就需要透過人工介入來解決。目前 AI 設定為只能瀏覽 https 的網站,改成 http 就解決這問題:
針對安全性部分,Operator 具有三層保護措施。
首先是第一層,用戶可以「隨時接管操作」,像是需要輸入一些敏感資訊的時候,如付款資料、登入帳密等,當用戶接管後,Operator 就不會收集和截圖用戶進行的任何操作。
進行最終步驟和任何重大操作,如:提交訂單、發送電子郵件等,也需要等到用戶確認才會執行。
Operator 也被訓練為會拒絕敏感任務,如:銀行交易、高風險決策、購買槍枝等。
第二層是關於數據隱私管理,用戶如果關閉 ChatGPT 中的「為所有人改善模型」功能,所有數據都不會被用於培訓 OpenAI 的模型。也能在操作設定中的隱私選項,一鍵刪除所有瀏覽數據、登入資訊、以及對話。
第三層則是確保 Operator 執行任務的安全性,透過專用的監控模型,會隨時檢測是否有可疑行為、進入高風險網站,如果有,可暫停當前任務。自動和手動審核流程,來識別新的威脅,並快速更新防護措施。
不過很可惜是,Operator 目前只有開放給美國的 ChatGPT Pro,其他方案和國家的用戶暫時體驗不到,但 OpenAI 有承諾會擴展到 Plus、Team 和 Enterprise 用戶,時間點就還不知道。
從這邊也能猜測,未來 Operator 會是包含在 ChatGPT 方案裡,但 Plus 等付費方案用戶應該會有次數限制,跟 Sora 一樣。
隨著 ChatGPT 功能越來越豐富,大家也要有心理準備,很可能會調漲訂閱價格。
有興趣深入了解的人可以觀看 OpenAI 直播影片:
以下是官方分享的測試數據,更完整說明可到 OpenAI 官網閱讀: