최종편집:2025-11-26 07:49 (수)
실시간
UNIST AI대학원, ‘가상 임무’ 스스로 만들어 예습하는 AI 학습법 개발

UNIST AI대학원, ‘가상 임무’ 스스로 만들어 예습하는 AI 학습법 개발

  • 기자명 구아현 기자
  • 입력 2025.08.19 17:54
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다
[연구진사진] 한승열 교수(좌측)와 김정모 연구원(제1저자)
(왼쪽부터) 한승열 UNIST 교수,  김정모 연구원(제1저자). /UNIST

훈련을 받지 않은 상황에 대한 적응력 부족이 피지컬 인공지능(AI) 기술의 한계로 꾸준히 지적돼 온 가운데 이를 해결할 수 있는 새로운 AI 메타 강화학습 기법이 등장했다. AI 스스로 새로운 임무를 상상해 예습하는 기술이다.

UNIST는 한승열 인공지능대학원 교수팀이 학습해본 적 없는 새로운 임무에도 적응할 수 있도록 인공지능을 훈련시키는 기법인 TAVT(Task-Aware Virtual Training)를 개발했다고 19일 밝혔다.

연구팀이 개발한 학습 기법은 AI 스스로 ‘가상의 임무’를 만들어 이를 미리 학습하게 하는 방식이다. 딥러닝 기반의 표현 학습 모듈과 생성 모듈로 구성돼 있다. 표현 학습 모듈이 서로 다른 임무 간의 유사도(거리)를 정량화해 임무 구조를 파악하면 생성 모듈이 이를 조합해 새로운 가상의 임무를 만든다. 생성된 가상 임무는 원래 임무의 특징을 보존할 수 있도록 설계돼 학습한 적 없는 상황에 대한 예습 효과가 있다.

김정모 연구원(제1저자)은 “기존 강화학습은 하나의 임무에서 최적의 정책을 익히도록 설계돼, 새로운 상황에서는 성능이 급격히 떨어진다”며 “다양한 임무를 경험하게 하는 메타강화학습 기법도 있지만, 훈련 범위를 벗어난 상황에서는 여전히 적응이 쉽지 않다”고 설명했다.

연구팀은 이 학습 기법을 치타, 개미, 2족 보행 등 다양한 로봇 시뮬레이션 환경에 적용해본 결과, 훈련하지 않은 임무에 대한 적응력이 향상됐음을 확인했다.

특히 치타 로봇 시뮬레이션 실험에서는 TAVT 기법을 적용한 경우, 경험해 보지 못한 중간 속도(1.25, 1.75 m/s 등)에서도 목표 속도를 빠르게 파악해 안정적으로 주행을 이어갔다. 반면 기존 메타강화학습 기법을 적용한 로봇은 적응이 느리거나 넘어지는 일이 잦았다.

한승열 USNIT 교수는 “이번 기법은 AI 에이전트의 임무 일반화 성능을 높일 수 있는 방식으로, 피지컬 AI 로봇이나 자율주행차·드론 등 다양한 상황에서 유연한 대응이 필수적인 분야에 폭넓게 활용될 수 있을 것”이라고 말했다.

이번 연구 결과는 세계 3대 AI 학회 중 하나인 국제기계학습학회(ICML)에 채택됐다. ICML 2025은 지난 7월 13일부터 19일까지 캐나다 밴쿠버에서 열렸다.

저작권자 © THE AI 무단전재 및 재배포 금지
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전