IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

리얼월드, 5지 로봇 손 전용 AI 모델 공개... 엔비디아 '그루트' 성능 제쳐

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

핵심 아키텍처 'MSAT'로 힘(토크)·촉각·작업 기억까지 단일 모델서 처리

[아이뉴스24 설재윤 기자] 피지컬 인공지능(AI) 기업 리얼월드가 엔비디아의 로봇 AI 모델 '그루트(GR00T)'를 뛰어넘는 성능을 기록한 독자 로봇 AI 모델을 공개하며 글로벌 로보틱스 시장에 도전장을 내밀었다.

이번에 공개된 독자 로보틱스 파운데이션 모델(RFM) 'RLDX-1'은 시각과 언어에 치중했던 기존 VLA 모델과 달리 힘(토크), 촉각, 작업 기억을 단일 모델에서 통합 처리하는 '덱스테리티 퍼스트(Dexterity-First)' 구조를 채택한 것이 특징이다.

피지컬 AI 기업 리얼월드가 7일 독자 로보틱스 파운데이션 모델(RFM) 'RLDX-1'을 공개했다. [사진=리얼월드]
피지컬 AI 기업 리얼월드가 7일 독자 로보틱스 파운데이션 모델(RFM) 'RLDX-1'을 공개했다. [사진=리얼월드]

지능이 먼저 만들어지면 손재주가 따라온다는 업계의 일반적인 관점과 달리, 리얼월드는 손재주가 지능이 물리 세계에서 행동할 때 거치는 필수 경로라는 정반대의 명제를 제시했다. 이를 위해 시각·언어 중심의 기존 범용 VLA 모델과 달리 토크, 촉각, 접촉 시점, 작업 기억까지 단일 모델에서 처리하는 구조적 차별화를 꾀했다.

기술적 핵심은 '멀티-스트림 액션 트랜스포머(MSAT)' 구조에 있다. 각 모달리티에 독립된 스트림을 부여해 정보를 충분히 표현한 뒤 조인트 어텐션으로 통합하며, 물리 신호와 장기 기억을 별도 모듈에서 처리해 로봇이 보고, 느끼고, 기억하고, 적응할 수 있도록 설계했다.

배재경 CTO는 토크 신호로 접촉 순간을 포착하고 시간 축의 동적 변화를 추론하는 능력이 기존 모델들이 다루지 못했던 RLDX-1만의 핵심 경쟁력이라고 설명했다.

성능 평가 결과, RLDX-1은 엔비디아의 '그루트(GR00T)'와 피지컬 인텔리전스의 '파이제로(π0)' 등 기존 최고 성능(SOTA) 모델들을 모두 앞섰다.

'RoboCasa Kitchen'에서 세계 최초로 70점대를 돌파한 VLA 모델이 됐으며, 휴머노이드 알렉스 기반의 '커피 따르기' 과제에서는 기존 모델 대비 2배에 달하는 70.8%의 성공률을 기록했다. 또한 카메라나 조명 등 7개 변수 환경에서도 86.7%의 강건성을 입증했다.

리얼월드는 산업 현장의 실제 작업을 분석해 파지 다양성, 공간·시간·접촉 정밀도, 맥락 인지 등 5대 영역으로 정의한 자체 벤치마크 '덱스벤치(DexBench)'를 함께 공개하며 이를 산업 표준으로 만들겠다는 방침이다.

현재 SK텔레콤, LG전자, CJ대한통운, 롯데 등 한일 주요 대기업으로부터 투자를 유치했으며, 이들과의 PoC 및 로봇 전환(RX) 프로젝트를 통해 기술적 해자를 더욱 단단히 구축해 나갈 계획이다.

/설재윤 기자(jyseol@inews24.com)



주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 리얼월드, 5지 로봇 손 전용 AI 모델 공개... 엔비디아 '그루트' 성능 제쳐

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기


뉴스톡톡 인기 댓글을 확인해보세요.



TIMELINE



포토 F/O/C/U/S