現在科技技術發達,AI人工智慧進化的速度也是越來越快,現在的人工智慧機器人已經可以做到很多事情,像是寫詩、寫文章、畫畫等。現在甚至出現可以講話的機器人,準確來說是使用ChatGPT來講話的機器狗。在今年四月,在 AI 工程師Santiago Valdarrama和他的團隊的帶領下將波士頓動力公司的機器狗 Spot 和ChatGPT整合,讓Spot能夠簡單的回答一些人類詢問的問題,但是當時只能回答一些簡單的問題,譬如現在電量是多少的問題。但在波士頓動力公司最近發布的影片可以看到 Spot 現在可以回答更困難的問題,甚至可以當導遊。
AI人工智慧技術加持,會講話的機器狗Spot變身多種個性的導遊
根據Spot項目的機器人自主運動首席軟體工程師 Matt Clingan Smith 表示現在AI人工智慧技術有了很多新的進展,特別是生成式AI,現在可以寫詩、畫畫還能跟人對話。Matt 對如何把 ChatGPT 這類技術用於機器人感到好奇,再加上現在出現了圖片描述(Image captioning)、圖片問答模型 (visual question answering models)、語音辨識(voice recognition)與語音建立(voice creation software)軟體等新技術。Matt 和他的團隊思考該如何將這些技術連接在一起,創造出有趣的東西。為此,他們還舉辦了一個小型的黑客松(hackathon),組裝了許多不同的示範模型和實驗。這些實驗的其中一個,就是「機器人導遊」。
機器人導遊Spot
Matt為機器人導遊所做的就是給Spot提供一個非常簡短的腳本、房間的名字並且對於每個房間都會有一個句子說明,例如充電站就會給「這裡是充電站,也式機器人去充電的地方」的腳本。Spot就會把這個劇本與臉上和抓取器上的攝影機影像結合再通過圖片回答模型來獲得更多關於Spot看到什麼的訊息再生成回應。而且你可以為Spot增加性格,每個性格表現出來的介紹方式都不一樣。
Spot介紹充電站的時候是”Fancy Butler(花式管家)”的性格所以說「充電站是Spot機器人休息和重新充電的地方,這是我們的第一個興趣點。」還有你稱讚Spot的口音,Spot還會感謝對方並說「我的語言被精心設計來提供真實的英國體驗。」
第二個地點是岩石堆,Spot介紹這些岩石堆的時候是”Precious Metal Cowgirl(寶貴的金屬女牛仔)”的性格,所以介紹岩石堆的時候還會回答自己當時掏金時的感想「在我淘金的時候,我會仔細檢查每一個,尋找金塊。誰知道裡面可能隱藏著財富等待發現呢?」。叫Precious Metal Cowgirl性格的Spot根據岩石堆的場景想一首俳句,Spot也會根據自己現在的性格想出這麼一段「Levers, valves and wood. Robots grasp as best they could. In this tech-filled hood(槓桿,閥門和木頭。機器人盡其所能地抓取。在這個充滿科技的社區)」
諷刺性格”Josh”的Spot介紹波士頓動力公司的Wildcat「這是我們展示跑得最快的四足機器人的地方,它可以達到每小時19英里的速度。希望你不會跟不上它的速度。」Spot還會反問對方「你之前見過像我們的Wildcat機器人跑那么快的機器人嗎?」
除此之外Spot還有很多不同的性格,像是1920年代的考古學家、莎士比亞的時空旅行者等。
Matt團隊覺得很神奇的是只要添加一句話,譬如你是1920年代的考古學家、你是沙士比亞時代的演員或者你是管家。Spot就會將背景故事融入到他所看到的東西裡,再重新解讀看到的一切。Matt表示這個系統可以開啟機器人進行橫向思維的可能性,準確的說Spot不會思考但是它能夠在英文單字和文化之間建立關聯,這樣你就算對他提出間接詢問的問題,Spot也可以大致上理解你想要什麼。譬如你問Spot「可以給我們看看你的父母嗎?」。Spot居然走到舊的Spot展示區,把Spot V1展示給詢問的人,就像是在說Spot V1是Spot的父母一樣。但其實Matt團隊沒有給Spot輸入任何有關這方面的程式。
對會說話的Spot感興趣的朋友可以觀看以下影片了解更多: