[AI 구기자] “AGI로 가는 길… 월드모델 경쟁 시작됐다”

AI가 세상을 ‘이해하고 행동’하게 만드는 핵심 기술 국내, 월드모델 연구도 관심도 부족

2025-08-07 구아현 기자

[편집자 주] ‘AI 구기자’는 AI 소식을 쉽게 ‘구겨 넣자’는 의미입니다. 마치 종이를 작게 접듯, 가장 뜨거운 인공지능(AI) 이슈를 선별해 꼭 알아야 할 핵심과 생생한 취재 내용을 압축해 전달합니다.

/일러스트=챗GPT 달리

최근 인공지능(AI) 분야에서 새로운 월드모델(World Model)이 등장하고 있습니다. 월드모델은 AI가 단순히 대답하거나 이미지를 생성하는 것을 넘어서 세상의 법칙을 이해하고 예측해 계획까지 수립하는 모델입니다. 대형언어모델(LLM) 기반으로 문서를 많이 학습한 챗GPT와 제미나이 등이 말을 잘하는 AI라면 월드모델은 상황을 이해하고 행동까지 결정하는 AI에 가까운 존재입니다.

월드모델을 개발하는 대표적인 기업은 메타(Meta)입니다. 마크 저커버그는 메타 내부에 슈퍼인텔리저스 연구실을 지난 6월 신설해 월드모델을 개발하게 했습니다. 얀르쿤 메타 AI 최고 과학자 겸 뉴욕대 교수가 이 프로젝트를 리드하고 있죠. 얀르쿤 교수는 언어만으로는 인간 수준의 지능을 구현할 수 없다고 지적하면서 월드모델이 인간 수준의 사고와 추론이 가능한 범용인공지능(AGI)의 핵심 요소가 될 것이라고 봤습니다.

이러한 연구 끝에 메타(Meta)는 지난 6월 ‘V-JEPA 2’라는 새로운 월드모델을 공개했습니다. 이 모델은 방대한 비디오 데이터와 로봇 상호작용 영상을 기반으로 학습해 상황을 보고 다음에 무슨 일이 일어날지 예측하고 그에 맞춰 행동 계획까지 세울 수 있는 능력을 보여주었습니다. 단순히 데이터를 예측하는 것을 넘어서 로봇이 실제로 팔을 뻗고 물건을 옮기는 데에 사용되는 계획을 생산할 수 있습니다.

물리적 세계를 이해하는 피지컬AI 연구 분야에 월드모델이 속합니다. 피지컬AI 모델은 로봇의 두뇌라고 칭하는 AI 파운데이션 모델 전부를 말한다면 월드모델은 AI가 비디오, 로봇 동작 데이터를 반복적으로 학습하면서 이러한 상황에서 이런 행동을 하면 어떤 결과가 나올지를 예측할 수 있는 내부 시뮬레이터를 갖추는 것입니다.

딥러닝 시대를 연 세계적인 석학인 페이페이 리(Fei-Fei Li) 스탠퍼드대 교수도 최근 월드랩(World Labs)이라는 스타트업을 창업했습니다. 이 기업은 AI에게 공간지능을 부여하겠다는 목표 아래 물리적 세계를 인지하고 예측하는 월드모델 플랫폼을 개발 중입니다.

그렇다면 국내는 어떤 상황일까요? 아직까지 월드모델을 본격적으로 연구하거나 대외적으로 공개한 사례는 많지 않습니다. 이는 단지 기술적 관심 부족 때문이라기보다는, 월드모델 자체가 막대한 데이터, 시뮬레이션 환경, 고성능 연산 인프라를 필요로 하는 고난도 연구이기 때문입니다.

장병탁 서울대 AI연구원장 겸 컴퓨터공학과 교수는 THE AI와의 인터뷰에서 “세상을 학습하는 모델을 만든다는 건 상상 이상으로 방대한 작업”이라며 “텍스트만으로 학습한 언어모델과는 비교가 안 될 정도로 실제 물리 세계를 경험하고 이해해야 한다”고 설명했습니다.

김기응 국가AI연구거점센터장 겸 KAIST 교수도 국내 상황에 대해 “물리 환경 데이터를 대규모로 수집하고 처리하는 게 쉽지 않다 보니 국내에선 월드모델을 본격적으로 개발하는 기관이나 기업이 거의 없는 상황입니다”라고 말했습니다

특히 월드모델의 핵심 응용 분야 중 하나가 바로 ‘제조’라는 점은 국내 산업 측면에서 매우 중요합니다. 정밀성과 안전성이 요구되는 제조 현장에서는 AI가 단순히 데이터를 분석하는 수준을 넘어서 복잡한 물리적 환경을 실시간으로 이해하고 예측할 수 있어야 합니다. 월드모델은 이러한 요구를 충족할 수 있는 기술로 AI 기반 스마트 제조 시스템의 두뇌 역할을 할 수 있습니다.

하지만 아직 제조업에서는 AI를 신뢰하지 않은 보수적인 시각이 많이 존재하는데요. 제조 분야 시각 데이터가 많이 없다는 것도 문제입니다. 김기응 교수는 “제조업은 미세하게 물건을 조작해야 하고 사람을 다치게 하면 안 되는 안전성도 확보해야하기 때문에 보수적인 시각이 많다”며 “국내에서 월드모델 기반의 피지컬 AI 연구가 활발하지 못했던 배경 중 하나”라고 설명했습니다.

챗 GPT로 시작된 LLM 중심 경쟁이 어느 정도 정착기에 들어섰다면 그 다음은 ‘현실을 아는 AI’, 즉 월드모델이 경쟁의 중심이 될 가능성이 큽니다. AI가 대화를 넘어 세상을 ‘이해하고’, ‘예측하고’, ‘행동하게’ 되는 시대의 핵심 열쇠가 바로 월드모델에 있습니다. LLM이 말하는 AI의 시대를 열었다면 월드모델은 ‘생각하고 행동하는 AI’의 시대를 열 준비를 하고 있습니다. 기술 패권의 다음 승부처인 AGI 경쟁에서 중심이 될 모델은 바로 월드모델이 될 전망입니다.