關鍵詞:
智元機器人
EnerVerse架構
1 月 8 日消息,如何讓機器人在任務指引和實時觀測的基礎上規劃未來動作是具身智能領域核心問題,其受“模態對齊”和“數據稀缺”制約。智元機器人團隊提出 EnerVerse 架構,通過自回歸擴散模型(autoregressive diffusion),在生成未來具身空間的同時引導機器人完成復雜任務。
據介紹,不同于現有方法簡單應用視頻生成模型,EnerVerse 深度結合具身任務需求,創新性地引入稀疏記憶機制(Sparse Memory)與自由錨定視角(Free Anchor View, FAV),在提升 4D 生成能力的同時,實現了動作規劃性能的突破。
智元機器人官方稱,實驗結果表明 EnerVerse 不僅具備未來空間生成能力,更在機器人動作規劃任務中實現了當前最優(SOTA)表現。從智元官方獲悉,目前項目主頁與論文《EnerVerse:設想機器人操作的具身未來空間》已上線,模型與相關數據集即將開源。
EnerVerse 主要科研成員來自智元機器人研究院具身算法團隊。論文共同一作黃思淵是上海交通大學與上海人工智能實驗室的聯培博士生,師從 CUHK-MMLab 的李鴻升教授。博士期間的研究課題為基于多模態大模型的具身智能以及高效智能體的研究。在 CoRL、MM、 IROS、ECCV 等頂級會議上,以第一作者或共同第一作者身份發表多篇論文。另一位共同一作陳立梁是智元機器人的具身算法專家,主要負責具身空間智能與世界模型的研究。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。