當地時間3月18日,在美國圣何塞舉行的英偉達GTC人工智能大會上,英偉達發布了人形機器人通用基礎模型Project GR00T,這一平臺是對英偉達Isaac 機器人平臺的重大升級。
為了幫助機器人更好地感知所處環境,英偉達還發布了 Isaac Perceptor 軟件開發工具包,該工具包具有最先進的多攝像頭視覺里程計、3D 重建和占用地圖,以及深度感知功能。
▲ 黃仁勛介紹迪士尼的小型機器人,其透露,這兩款機器人正是在Isaac“健身房”中學會了走路。
GR00T驅動的機器人(代表通用機器人00技術)將能夠理解自然語言,并通過觀察人類行為來模仿動作——快速學習協調、靈活性和其它技能,以便導航、適應現實世界并與之互動。在GTC大會的主題演講中,NVIDIA創始人兼首席執行官黃仁勛展示了數臺這樣的機器人是如何完成各種任務的。
黃仁勛表示:“開發通用人形機器人基礎模型是當今AI領域中最令人興奮的課題之一。世界各地的機器人技術領導者正在匯集各種賦能技術,致力于在人工通用機器人領域實現突破。”
同時,為了支持Project GR00T,英偉達還推出了一款用于人形機器人的新型計算平臺 Jetson Thor,它基于英偉達 Thor 系統級芯片,采用了英偉達Blackwell 架構,可提供每秒 800 萬億次8位浮點運算 AI 性能,以運行 GR00T等多模態生成式 AI 模型。
好,到這里,大家可能還是沒看懂這個Project GR00T是干嘛的,那我們來給大家舉個例子。
舉例對象:loona娛樂教育機器人(戳視頻↓)
就拿視頻里的這個loona機器人來說,如大家所見,現在想和它互動是需要下達明確的指令的(可語音對話也可APP直接點擊下達),也就是說,在指令范圍內有的內容就可操作,再進一步說,也就是loona能做什么是由loona“自己決定的”。
而Project GR00T這個平臺要做的是讓機器人“擁有一個更聰明的大腦”。按照英偉達的說法,Project GR00T里會有無數還原現實的虛擬場景,比如家庭住宅、工廠、商場等不同的空間環境,而loona最大的使用場景大概率會出現在家庭住宅。
為了讓loona在實際應用環境中能第一時間匹配不同的住宅戶型,我們可以把loona的3D模型放到平臺里提前學習所有可能會出現的戶型,比如有落地窗和無落地窗,有門檻和無門檻,家里有否嬰兒、有否寵物等各種可能會出現的住家差異。在進行過這一學習過程之后,再將這個學習好的模型植入到loona的芯片也就是腦子里,這樣loona在出廠時就已經具備了適配市面上大多數可能會出現的家庭住宅差異。
這樣做的好處是什么呢?
當你拿到這個經過仿真模擬訓練過程的loona,就會發現,它來到你家里之后,不再需要你再去“教”,它識別到馬桶就知道是浴室,識別到操作臺就知道是廚房,再進一步,如果有剛會走路的小嬰兒向它走來,它也會知道不能停留在小嬰兒腳下,以免被絆倒,簡單來說,它不需要人為設置,便清晰地知道在這個家哪些是它的“行動禁區”。
再舉個具體的例子,還是用loona來看,loona帶有監控功能,在開啟活潑模式的狀態下,它會自己滿屋子溜達,也就是說,如果此時的loona打開監控的話,就會將所有經過的場景拍下。
這時候,如果家里有女士穿裙子或其他人在換衣服、洗浴,隱私安全就不被保證了。
而如果loona在Project GR00T這樣的平臺學習過的話,它在出廠進入家庭后,就能避免出現這樣的情況,因為它已經被提前告知,什么樣的場景下它是需要回避或遠離的。
到這里,大家應該能明白Project GR00T是干嘛的了,那有人可能會疑惑,以上所說的這種“學習”現在不能實現嗎?
可以實現,但非常繁雜且費成本。就比如戶型住宅來說,如果在現實生活中,想讓機器人學習到大部分的戶型,那就意味著,需要不停重復布景,因為不可能帶著機器人實際到各個家庭中去。
這個過程,耗時耗人耗錢,而且布景所使用的物料,不一定是會重復使用的,但是在數字世界里,也就是Project GR00T這樣的平臺里,是不需要考慮的,可以理解為,機器學習想要的訓練場景未來都可以在Project GR00T被滿足。
當然要想實現Project GR00T的未來,也需要擁有足夠龐大的用戶群體去支撐平臺的運營,這可能會是一個漫長的過程,就像以設計智核芯片組為主的英偉達公司用了8年才等到了AI 的爆發。
資料來源 | 紅星新聞、中關村在線、澎湃新聞 ? 未來2%、每日經濟新聞