구글과 오픈AI의 인공지능(AI) 모델이 인간 고등학생을 대상으로 하는 국제수학올림피아드(IMO) 수준의 문제를 풀어내며 ‘금메달’ 수준에 도달했다. 단순 언어처리를 넘어 고난도의 수학적 추론 능력까지 확보한 셈이다. AI가 이론 과학 분야로 진입하는 전환점이라는 평가도 나온다.
현지시간으로 21일 로이터 통신에 따르면 구글 딥마인드와 오픈AI의 최신 AI 모델이 각각 IMO 본선 문제 6개 중 5개를 해결해, 인간 참가자 기준으로 금메달 점수(35점)를 기록했다. 구글은 실제 IMO 대회와 동일한 조건(4.5시간) 아래 문제를 풀었고, 오픈AI는 세 명의 금메달리스트 평가위원에게 해설과 답안을 검증받는 방식으로 수행했다.
IMO는 매년 전 세계 고등학생들이 참여하는 수학 경연 대회로, 정해진 시간 내에 창의적 해법과 논리적 서술을 요구한다. 난이도가 높아 일반적인 언어모델은 물론 대학생도 접근하기 어렵다.
이번에 구글이 활용한 모델은 ‘제미나이 딥씽크(Gemini Deep Think)’로 불리는 에이전트형 AI다. 문제를 구조화해 수만 개의 증명 경로를 탐색한 뒤 자연어로 정답과 해설을 구성하는 방식이다. 오픈AI는 수천 개의 병렬 시도를 통해 고도화된 해법을 찾아가는 ‘테스트타임 컴퓨팅(test-time compute)’ 전략을 사용했다.
일각에서는 이번 성과가 향후 AI를 연구 파트너로 활용하는 시대의 서막이 될 것으로 보고 있다. AI가 단순 정보 처리 단계를 넘어, 수학과 과학이라는 인간 지성의 핵심 영역에서 본격적으로 경쟁력을 갖추기 시작했다는 것으로 풀이된다.
정준혁 미국 브라운대 교수는 “AI가 창의적 추론 능력을 갖추고 수학자들이 최전선에서 해결되지 않은 연구 문제를 해결하는 데 1년도 채 남지 않았음을 시사한다”면서 “자연어로 어려운 추론 문제를 해결할 수 있는 순간 AI는 수학·물리·생물정보학 등 고차원 과학 연구에 실질적으로 기여할 수 있을 것”이라고 말했다.