오픈AI, PC용 AI 에이전트 ‘오퍼레이트’ 출시… 앤트로픽과 유사

챗GPT처럼 지시 사항 입력하면 숙소 예약 등 자동 진행 로그인 등 민감한 작업 시 사용자 개입 요청

2025-01-24     김동원 기자
오픈AI가 23일(현지시각) AI 에이전트 모델 ‘오퍼레이터’를 일부 구독자에게 공개한다고 밝혔다. /오픈AI 유튜브 캡처

오픈AI가 사람처럼 컴퓨터를 다룰 수 있는 PC용 인공지능(AI) 에이전트 ‘오퍼레이트’를 일부 구독자에게 제공하기로 했다. 오픈AI 대항마라 불리는 앤트로픽이 지난해 10월 공개한 ‘컴퓨터 유즈’와 비슷한 기능이다. AI 에이전트 시장에서도 두 회사를 비롯한 AI 기업들의 경쟁이 커질 것으로 전망된다.

23일(현지시간) 오픈AI는 공식 홈페이지를 통해 AI 에이전트 모델 ‘오퍼레이터’를 미국 지역에서 챗GPT 유료 버전인 ‘챗GPT 프로’ 제품을 이용하는 구독자에게 공개한다고 밝혔다. 오퍼레이터는 컴퓨터를 사람처럼 다루는 ‘컴퓨팅 유징 에이전트(Computer-Using Agent, CUA)’ 모델이다. 사용자를 대신해 웹브라우저에서 다양한 작업을 자동으로 수행하는 AI 에이전트라고 볼 수 있다. 사람이 컴퓨터 화면을 보고 인터페이스를 이해한 뒤 마우스와 키보드를 활용해 작업하는 것과 유사하다.

과거 로봇프로세스자동화(RPA) 기업들이 PC에서의 업무 자동화를 진행하기 위해 사용자의 컴퓨터 반복 작업을 녹화한 뒤 이를 RPA가 똑같이 작업할 수 있게 한 것과 비슷한 원리다. 단, RPA는 사용자 작업을 그대로 따라 했다면, AI 에이전트는 이름 그대로 자율적으로 컴퓨팅 작업을 할 수 있다.

오픈AI에 따르면, 오퍼레이터는 GPT-4o 모델의 시각적 이해 능력과 강화 학습을 통한 고급 추론 능력을 결합해 만들었다. 웹 페이지의 버튼, 메뉴, 텍스트 필드 등과 상호 작용하며 업무를 자동화한다. 여행 예약, 쇼핑, 할 일 목록 작성 등 다양한 작업을 수행할 수 있다. 

오퍼레이터로 숙소 예약을 자동화하는 모습. /오픈AI 유튜브 캡처

오픈AI가 공개한 영상에서는 오퍼레이트 작업 예시가 소개됐다. 챗GPT처럼 오퍼레이터를 활성화하고 여기에 필요한 업무를 텍스트로 입력하면 AI가 작업했다. 식당 예약이나 여행 숙박 예약 등을 자동으로 진행했다. 사용자는 오퍼레이트 작업 내용을 모니터링할 수 있고 도중에 제어하는 것이 가능했다.

작업을 수행하며 사용자와 소통도 한다. 중요한 작업의 경우 사용자의 직접적인 개입을 요구한다. 로그인 정보 입력과 같은 민감한 작업할 때 역시 사용자의 개입을 요청한다. 

오픈AI는 오퍼레이터 개발을 위해 우버, 이베이 등 여러 기업과 협력했다고 밝혔다. 이를 통해 웹 브러우저 상 다양한 작업을 자동화해 사용자 편의성을 높이고 생산성을 향상할 수 있다고 설명했다. 지금은 미국 챗GPT 프로 구독자에게 프리뷰 형태로 제공하고 있지만, 더 많은 사용자에게 확대 제공할 계획이라고 했다.

이번 모델은 앤트로픽이 지난해 10월 공개한 ‘컴퓨터 유즈’와 유사하다는 평가가 많다. 앤트로픽은 오픈AI보다 앞서 웹브라우저에서 사용자 인터페이스(UI)를 인식해 버튼을 클릭하고 웹사이트를 탐색하는 컴퓨터 유즈를 선보였다. 함께 공개한 클로드 3.5 소네트의 응용프로그램인터페이스(API)를 통해 서비스할 수 있게 했다.

국내 AI 스타트업 대표는 “오픈AI가 공개한 오퍼레이터는 과거 RPA에서 하던 연구와 유사하다”면서 “과거에서 더 진화한 기술”이라고 평가했다. 이어 “RPA를 비롯한 많은 기업에서 비슷한 기술을 내놓을 것”이라고 전망했다.

신정규 래블업 대표는 “AI 에이전트는 새롭게 등장한 기술이 아닌 머신러닝으로 지속 추구해 온 기술”이라면서 “개발자들은 머신러닝을 활용한 자동화를 지속 추구해 왔고, 지금까지 AI 스피커, AI 어시스턴트, AI 비서, 코파일럿 등 다양한 이름으로 이 자동화를 실천해 왔다”고 말했다. 이어 “과거부터 컴퓨팅 성능이 향상됐고 실패 경험도 많기 때문에 AI 에이전트 등 머신러닝으로 목표했던 것들이 이뤄질 수 있다”면서 “그만큼 경쟁은 더 치열해질 것”이라고 전망했다.