상상을 현실로 바꾸는 창조적인 소프트웨어
가천대학교와 함께하는 SW 프로그램
역대 최다 논문 접수 속 엄정한 심사 거쳐 연구 경쟁력 입증
경량 모델 기반 로봇 지능의 한계 보완, 실제 로봇 환경에서의 적용 가능성 높여
인공지능학과 김태량, 표은섬, 강현준 학부생, 구지연, 조태완 원생(사진 상단 좌측부터), 인공지능학과 최재용 교수(사진 우측)
가천대학교 인공지능학과 최재용 교수 연구팀이 오는 6월 오스트리아 비엔나(Vienna)에서 개최되는 로보틱스·자동화 분야 국제 학술대회 ICRA 2026(IEEE International Conference on Robotics and Automation)에 직접 참가해 연구 성과를 발표할 예정이다. 연구팀의 논문은 ICRA 2026 발표 논문으로 채택됐다. 이번 연구에는 인공지능학과 석사과정 구지연·조태완 원생(공동 제1저자), 학석사과정 강현준·표은섬·김태량 학생, 오태균 학부연구생과 최재용 교수가 참여했다.
ICRA는 IEEE Robotics and Automation Society가 주관하는 대표 학술대회로, 전 세계 연구자와 산업계가 최신 로봇 기술과 연구 성과를 공유하는 로보틱스 분야 최고 권위의 학회 중 하나다. 매년 수천 편의 논문이 접수되며 엄정한 심사를 통해 채택 논문이 선정된다. ICRA 2025에는 총 4,250편의 논문이 제출돼 이 중 1,606편이 채택됐으며, ICRA 2026은 총 5,088편의 논문이 접수돼 역대 최다 제출 기록을 세웠다.
이번에 채택된 논문의 제목은 ‘RetoVLA: Reusing Register Tokens for Spatial Reasoning in Vision-Language-Action Models(RetoVLA: 비전-언어-행동 모델에서 공간 추론을 위한 레지스터 토큰 재활용)’ 으로, 경량 VLA(Vision-Language-Action) 모델의 공간 추론 능력을 강화하는 새로운 아키텍처를 제안한다. 이 논문은 지난해 9월 미국 코넬대학교에서 운영하는 arXiv 플랫폼에 먼저 게재돼 연구 내용을 공개한 바 있으며, 이후 국제 학술대회 심사를 거쳐 ICRA 2026 발표 논문으로 채택됐다.
연구팀은 기존 VLA 모델에서 활용도가 낮았던 레지스터 토큰(register token)을 장면의 전역적 공간 문맥(global spatial context)으로 재활용해 Action Expert에 직접 주입하는 방식을 제안했다. 이를 통해 낮은 연산 비용을 유지하면서도 로봇의 3차원 공간 구조 이해 능력을 향상시켰다.
RetoVLA 연구모식도
제안 기법은 실제 7-자유도(7-DoF) 로봇 실험에서 기존 모델 대비 성공률을 17.1%포인트 향상시켜, 복잡한 다단계 조작(multi-step manipulation) 작업에서의 실용성을 입증했다. 이번 연구는 경량 모델 기반 로봇 지능의 한계를 보완하고 실제 로봇 환경에서의 적용 가능성을 높였다는 점에서 의미가 있다.
최재용 교수는 “경량 VLA 모델이 실제 로봇 조작에서 겪는 공간 추론 한계를 개선하기 위해, 기존에 활용되지 않던 레지스터 토큰을 전역 공간 문맥으로 재활용하는 RetoVLA 아키텍처를 제안했다”며 “낮은 연산 비용을 유지하면서도 복잡한 다단계 로봇 조작 작업에서의 실용성을 확인했다”고 밝혔다. 이어 “향후 범용 로봇 에이전트의 현장 적용과 물리적 AI 기반 자동화 기술 확장에 기여할 것으로 기대된다”고 말했다.
□ 논문 링크: https://arxiv.org/abs/2509.21243