본문 바로가기

IT & Insight

오픈AI 스핀오프, '대화하는' LLM 기반 로봇 모델 구축

(사진=코베리언트)

대형언어모델(LLM) 도입으로 인공지능(AI) 로봇 분야의 급격한 발전이 이뤄지는 가운데, 이번에는 오픈AI 출신들이 이 분야에서 주목받고 있다. 이들은 이미 2017년부터 이 분야 개발을 진행해 온 베테랑이다.

워싱턴포스트는 11일(현지시간) 오픈AI에서 분사한 스타트업 코베리언트가 로봇이 주변을 이해하고 학습해 작업 수행에 반영할 수 있는 로봇용 AI 모델 ‘RFM-1’을 구축하고 있다고 보도했다.

이에 따르면 RFM-1은 로봇이 주변에서 무슨 일이 일어나고 있는지 이해하고 다음에 무엇을 해야 할지 결정하도록 돕는 멀티모달 언어모델(LMM)이다. 여기까지는 구글 등이 개발한 기술과 흡사하다.

그러나 '챗GPT'와 채팅하듯 인간과 소통할 수 있다는 것이 차별점이다.

RFM-1은 80억개의 매개변수를 갖추고 있으며, 창고 로봇이 캡처한 이미지와 비디오를 통해 훈련했다. 또 로봇에 내장된 압력 센서 등의 감각 데이터를 활용했다.

코베리언트는 우선 창고에서 상품을 픽업, 이동 및 분류하기 위한 작업에 초점을 맞췄다.

RFM-1은 기본적으로 자연어 명령을 처리할 수 있다. 로봇에게 간단한 영어 프롬프트로 새로운 작업을 가르칠 수 있다. 예를 들어 작업자는 "선반에서 상품을 집어 근처 컨베이어 벨트에 놓아라"라고 지시할 수 있다.

로봇은 지시를 이해할 뿐만 아니라 요청할 수도 있다. 로봇이 특정 상품을 집는 데 어려움을 겪는 경우, 이를 운영자나 엔지니어에게 알리거나 상품을 집기 어려운 이유도 제시할 수도 있다.

운영자는 로봇에게 더 나은 잡기 지점을 찾을 수 있도록 객체를 움직이거나 넘어뜨리는 등 새로운 동작 전략을 지시할 수 있다.

RFM-1이 생성한 비디오 (사진=코베리언트)

또 RFM-1은 상품 이동과 같은 작업을 수행할 때 어떤 일이 일어날지 예측하는 비디오를 생성할 수도 있다. 이 비디오는 창고에서 실제로 사용되지는 않지만 주변에 무엇이 있는지에 대한 로봇의 이해를 보여준다.

이를 통해 로봇이 새로운 작업을 수행하라는 요청을 받으면 RFM-1을 사용해 작업 수행 방법을 보여주는 비디오를 생성, 이를 보고 최선의 작업 전략을 찾을 수 있다는 설명이다.

코베리언트는 앞으로 몇달 안에 RFM-1을 출시할 예정이다. 장기적으로는 광범위한 작업을 자동화할 수 있는 발전된 AI 모델을 만들 계획이다. 이를 위해 수집하는 훈련 데이터의 양을 크게 늘릴 방침이다.

한편 이 회사의 창립자 3명은 오픈AI 초기부터 로봇과 LLM 결합을 연구한 인원으로, 2017년 분사한 것으로 알려졌다. 이후 오픈AI는 2021년 로봇 개발을 보류한다고 발표한 바 있다.

또 보스턴 다이내믹스와 테슬라, 피규어 AI, 어질리티, 1X 등 AI 로봇 업체들이 최근 부각되며 치열한 경쟁을 예고하고 있다. 

박찬 기자 cpark@aitimes.com

출처 : AI타임스(https://www.aitimes.com)