RoboCat本質上是由AI賦能的軟件程序,可以作為
機器人的“大腦”,由其加持的機器人與傳統(tǒng)機器人不同之處在于,RoboCat機器人更具“通用性”,并可實現(xiàn)自我改進、自我提升。
DeepMind稱,RoboCat是全球第一個可以解決和適應多種任務的機器人AI智能體,并且它可以在各類真實的機器人產品上完成這些任務。
據(jù)DeepMind的介紹,只需要通過100次左右的演示,RoboCat就可以學會操控機械臂來完成各式各樣的任務,然后通過自生成的數(shù)據(jù)來進行迭代改進。
要知道,構建通用機器人之所以進展緩慢,一個重要原因就是收集真實世界的訓練數(shù)據(jù)需要時間,而RoboCat的快速學習能力減少了對人類監(jiān)督訓練的需求,可以說是朝著創(chuàng)建通用機器人邁出了重要一步。
從發(fā)布的視頻中可以看到,RoboCat已經可以通過自主學習操控機械臂,完成“套圈”“搭積木”“抓水果”等任務,這些任務看似簡單,但考驗了機械臂操作的精準度、理解力以及對于形狀匹配難題的解決能力。
最重要的是,不論是它操控的機械臂還是要完成的任務,RoboCat之前從來沒見過,如今,RoboCat完成一項新任務的成功率已經從初期的36%提升至74%。
RoboCat 用到的關鍵技術之一,是一種多模態(tài)模型Gato,而Gato在西班牙語里意為“貓”(cat),這也是“RoboCat”這一命名的由來之一。
Gato模型可以在模擬環(huán)境和物理環(huán)境中處理語言、圖像和動作,研究人員將Gato的架構與一個大型訓練數(shù)據(jù)集進行了結合,這個數(shù)據(jù)集包含100-1000個各種機械臂完成任務的演示。
基于原始數(shù)據(jù)集和新訓練產生的數(shù)據(jù),RoboCat的數(shù)據(jù)集將包含數(shù)百萬次的訓練軌跡數(shù)據(jù),它學習的新任務越多,它就能更好地學習和解決額外的新任務。
此前研究人員已經在機器人大規(guī)模學習多種任務方面進行了探索,并將對語言模型的理解與現(xiàn)實世界的機器人能力相結合,而RoboCat的進步性在于,它是第一個可以解決和適應多種任務的機器人 AI 智能體。
DeepMind的論文顯示,執(zhí)行任務成功率的大幅提升,是由于RoboCat的經驗越來越豐富,就像人們在特定領域加深學習時發(fā)展出更多樣化的技能一樣,并且RoboCat完成現(xiàn)實世界訓練任務的成功率要遠高于傳統(tǒng)基于視覺的模型方案,這也是 DeepMind 研究的重要價值所在。
RoboCat這種“通用性學習能力”對于加快機器人領域的研究有重要意義,DeepMind認為,RoboCat獨立學習技能、快速自我提升的能力,以及對于不同硬件設備的快速適應能力,將對新一代通用機器人AI智能體的發(fā)展起到重要推動作用。
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內容、版權等問題,請與本站聯(lián)系并提供相關證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。