네이버가 마침내 추론(reasoning) 능력을 핵심으로 한 생성형 인공지능 AI ‘하이퍼클로바 X 씽크(HyperCLOVA X THINK)’를 선보였다. 30일 발표된 이 모델은 기존 AI와 달리 ‘생각하는 힘’을 갖춘 것이 특징이다. 한국 AI 기술이 글로벌 최신 트렌드에 발맞춰 한 단계 도약했음을 보여주는 사례다.
하이퍼클로바 X 씽크의 핵심은 사용자 질의에 대해 혼잣말하듯 길게 생각하며 답변 계획을 수립한다는 점이다. 이 과정에서 AI는 복잡한 문제를 작은 단위로 나누고, 적절한 도구나 함수를 선택하며, 실수를 반추하고 교정하는 능력을 발휘한다. 이러한 단계적 추론 과정을 통해 생성 정보의 정확도와 유용성이 기존 모델 대비 현저히 향상됐다. 최근 트렌드인 AI 에이전트 서비스의 핵심 기술로도 주목받고 있다.
◇ 언어·시각 추론에서 압도적 성과... 수능 문제까지 척척 해결
네이버의 추론 모델은 언어 이해 능력에서 탁월한 성과를 보였다. 서울대 언어학과가 설계한 전문가급 벤치마크 ‘KoBALT-700’에서 유사 규모 국내 추론모델과 글로벌 최고 수준 오픈소스 모델을 모두 압도하는 점수를 기록했다. 이 벤치마크는 AI가 대화의 격률을 적절히 파악하는지, 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 고난도 문항들로 구성돼 있어, 하이퍼클로바 X 씽크의 깊이 있는 한국어 이해 능력을 입증했다. 실제로 평가 결과 네이버 모델은 79.7점을 기록해 실제로 평가 결과 네이버 모델은 79.7점을 기록해 알리바바 큐웬3 32B(63.5점)를 6점 이상 앞섰고, LG AI연구원의 엑사원 딥 32B(53.6점)와는 16점이라는 큰 격차를 보였다.
한국 문화와 역사적 맥락을 다루는 HAERAE 벤치마크에서도 87.8점으로 다른 모델들(Qwen3 32B 75.1점, EXAONE Deep 74.7점)을 10점 이상 앞서는 압도적 성능을 보였다. 문화·언어 지능을 측정하는 CLIcK에서는 80.1점으로 1위를 차지했으며, 특히 EXAONE Deep(62.2점)과는 18점이라는 상당한 격차를 기록했다.
시각 정보를 바탕으로 한 추론 능력까지 확보했다. 하이퍼클로바 X 씽크는 한국 대학수학능력시험 생명과학 문제에서 그림으로 제시된 ‘생태계 천이 과정’과 ‘식물 군집의 총생산량 및 호흡량 그래프’를 인식·분석하고, 이를 양수림, 혼합림, 지의류 등에 대한 지식과 결합해 정답을 찾아내는 모습을 보였다.
유강민 네이버클라우드 유강민 리더는 “이번 추론모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다”며 “향후 보다 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화 해나갈 것”이라고 밝혔다.
◇ 독자 기술로 글로벌 경쟁력 확보... 오픈소스로 생태계 활성화 기대
주목할 점은 하이퍼클로바 X 씽크가 완전한 독자 기술로 개발됐다는 것이다. 모델 설계에 적용된 ‘Peri-LN(Peripheral Layer Normalization)’ 기법은 세계 최고 권위 AI 학회 중 하나인 ‘ICML 2025’에 채택됐으며, 추론모델의 학습 효율을 높이기 위해 자체 개발한 강화학습 방법도 글로벌 학계에 공유됐다. 이는 네이버가 단순히 글로벌 기술을 따라가는 것이 아니라, 독창적 기술로 선도적 역할을 하고 있음을 보여준다.
네이버는 이번 추론모델을 오픈소스로도 공개할 계획이라고 발표했다. 지난 4월 공개한 ‘하이퍼클로바 X SEED’가 한 달여 만에 50만 다운로드를 넘어서며 큰 호응을 얻은 것처럼, 경쟁력 있는 한국어 추론모델을 통해 국내 AI 기술 생태계가 더욱 활성화될 것으로 기대된다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X를 ‘지능의 향상’과 ‘감각의 확장’의 두 축으로 고도화하고 있으며, 이번 하이퍼클로바 X 씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다”면서 “급변하는 AI 흐름 속에서 글로벌 선두권 그룹의 기술을 지속적으로 갖춰가고 있다”고 강조했다.