딥시크(DeepSeek)의 추론 모델 ‘R1’이 세계 인공지능(AI) 시장을 뒤흔든 가운데 중국 내 주요 기업들이 딥시크에 맞서 성능과 속도를 강화한 신모델을 잇달아 출시·예고하며 경쟁이 치열해지고 있다.
27일(현지시간) 로이터통신에 따르면 중국 텐센트는 딥시크 R1보다 빠른 응답 속도를 자랑하는 AI 모델 ‘혼위안 터보 S(Hunyuan Turbo S)’를 출시했다고 밝혔다. 텐센트는 “혼위안 터보 S는 1초 이내에 질문에 답변할 수 있어 딥시크 R1, 기존 혼위안 T1, 그리고 ‘생각하는 시간’이 필요한 느린 모델들과 차별화된다”고 공식 발표했다. 이 모델은 위챗(WeChat) 플랫폼에 통합돼 13억 명 이상 사용자에게 빠르고 저렴한 AI 서비스를 제공할 계획이다.
‘혼위안 터보 S’은 훈위안 T1 업그레이드 버전이다. 텐센트는 지식, 수학, 추론과 같은 분야에서 테스트한 결과 터보 S의 성능이 딥시크 AI 챗봇을 구동하는 딥시크-V3와 동등한 수준임을 확인했다고 전했다. 가격도 이전 모델보다 훨씬 저렴하게 책정됐으나 자세한 성능 벤치마크 정보는 공개되지 않았다. 텐센트 추후 추가 발표에서 이를 공개할 예정이다.
딥시크 추론모델 ‘R1’은 지난 1월 출시 이후 오픈소스와 저비용 전략으로 세계 AI 시장을 뒤흔들었다. 오픈AI 추론 모델 ‘o1’과 비슷한 수준 성능에 약 90% 저렴한 비용으로 개발해 전 세계에 충격을 주면 ‘딥시크 쇼크’를 일으켰다. 출시 후 빠르게 오픈AI 챗GPT 애플리케이션 다운로드 수를 넘어섰다. 이 성공은 전 세계 빅테크 기업들에 충격을 주며 모델 출시 경쟁을 더욱 부추겼다.
알리바바도 역시 딥시크를 뛰어넘을 추론 모델을 준비 중이다. 지난달 알리바바는 지난달 대형언어모델(LLM) ‘큐원 2.5 맥스(Qwen 2.5-Max)’를 출시하며 딥시크-V3를 능가한다고 주장했다. 이후 한 달도 안 된 20일(미국 현지시간) 알리바바는 실적 컨퍼런스콜에서 큐원 2.5 맥스를 기반으로 ‘제2의 딥시크’ 불릴 차세대 AI 추론 모델을 출시할 것이라고 알렸다.
바이두는 올해 하반기 차세대 AI 모델 ‘어니(Ernie) 5.0’을 출시하며 이를 오픈소스로 공개한다고 밝혔다. 업계에서는 이 추론 모델이 딥시크 R1을 넘어설 것으로 전망하고 있다. 멀티모달 기능이 크게 향상될 것이라고 알려졌다. 다만 ‘어니 5.0’ 자세한 성능은 아직 알려지지 않았다.
아울러 바이두는 14일(현지시간) 위챗 공식 계정을 통해 몇 달 내 ‘어니 4.5’ 시리즈를 순차적으로 출시하고, 오는 6월 30일부터 소스 코드를 공식 공개한다고 발표했다. 그동안 AI 개발에서 폐쇄형 전략을 유지해 온 바이두가 오픈소스화로 방향을 전환한 데에는 딥시크의 영향이 큰 것으로 분석된다. 바이두는 지난 2023년 3월 중국 빅테크 기업 중 가장 먼저 챗GPT와 유사한 챗봇 ‘어니봇’을 선보인 바 있다. 당시 오픈AI 챗GPT를 대응한 모델로 주목받았다. 하지만 어니봇은 중국 소비자들로부터 높은 관심을 받지 못했다. 이후 바이두는 오픈AI의 라이벌 자리를 딥시크에 내준 뒤 모델 개발 및 출시에 더욱 속도를 내고 있다.
상하이 소재 AI 스타트업 스테프펀(Stepfun)은 텍스트-비디오 생성과 음성 상호작용을 지원하는 멀티모달 모델을 오픈소스로 공개했다. 3월에는 이미지-비디오 모델 출시를 예고했다. 지앙 다신 스테프펀 CEO는 “추론 능력이 강화된 AI가 멀티모달과 결합하면 AI 에이전트 분야에서 혁신이 일어날 것”이라고 밝혔다.
◇ 美 빅테크도 추론 모델 경쟁 가속
딥시크 등장 이후 추론 모델 경쟁이 더욱 뜨거워지면서 미국 내 경쟁도 치열해졌다. 앤트로픽은 오픈AI보다 먼저 일반 모델과 추로 모델을 결합한 ‘클로드 3.7(Claude 3.7)’을 최근 발표하며, 딥시크 ‘R1’과 오픈AI ‘o1’을 겨냥한 빠른 응답 속도와 복잡한 문제 해결 능력을 강조했다. 오픈AI는 최신 추론 모델 ‘o3-미니’를 무료 사용자에게 개방하며 딥시크에 대응했다.
xAI도 추론 모델 경쟁에 뛰어들었다. 일론 머스크가 이끄는 xAI는 지난 17일(현지시간) 최신 AI 모델 ‘그록 3(Grok 3)’를 출시하면서 추론 능력을 강화한 ‘그록 3 리즈닝(Grok 3 Reasoning)’ 버전도 공개했다. ‘그록 3’는 20만 장의 GPU를 활용해 개발됐으며 수학, 과학, 코딩 등 다양한 벤치마크에서 딥시크 R1과 오픈AI의 주요 모델을 뛰어넘는 성능을 입증했다.
xAI는 공식 계정 X 라이브에서 그록 3의 성능을 구체적인 수치로 공개했다. 추론 중심 모델인 ‘그록 3 리즈닝(Grok 3 Reasoning)’은 AIME 2025(미국수학경시대회)에서 54점을 기록하며 오픈AI의 ‘o1’(51점)과 딥시크의 ‘R1’(50점)을 앞섰고, GPQA(대학원 수준 과학 문항)에서는 78점을 얻어 오픈AI의 ‘o3-mini-high’(75점)와 딥시크-V3(70점)를 넘어서는 성능을 보였다고 xAI 측은 밝혔다.