앤트로픽이 코딩 추론 능력과 에이전트 작업을 대폭 향상한 특화된 대형언어모델(LLM) ‘클로드 오푸스 4.1(Claude Opus 4.1)’을 공개했다. 최근 엔터프라이즈용 LLM 시장과 코딩 관련 LLM 분야에서 오픈AI를 추월한 시장 점유율을 더욱 공고히 할 것으로 전망된다.
6일 앤트로픽 공식블로그에 따르면, 오푸스 4.1 모델은 유료 클로드 사용자가 할용할 수 있다. 클로드 코드 기능을 통해 이용 가능하다. 또 앤트로픽의 자체 응용 프로그램 인터페이스(API)는 물론 아마존 베드록, 구글 클라우드 버텍스 AI 플랫폼을 통해서도 사용할 수 있다. 요금은 기존 모델인 오푸스 4와 동일하다.
오푸스 4.1은 소프트웨어 개발 능력 벤치마크인 SWE-벤치 평가에서 74.5%의 정밀도를 기록했다. 이는 클로드 소넷 3.7(62.3%) 및 오푸스 4(72.5%)보다 향상된 수치다. 해당 모델은 다중 파일 코드 리팩토링, 디버깅, 심층 분석 등에서 탁월한 성능을 보였다.
이번 모델은 단순한 코드 생성 능력에 그치지 않고 에이전틱 검색, 세부 정보 추적, 심층 데이터 분석 등 복잡한 추론 기반의 작업에서도 개선된 성능을 보여준다. TAU-벤치, MMMLU, AIME 등 고난도 벤치마크에서는 최대 64K 토큰의 확장 사고 기능을 활용해 복잡한 문제 해결에 성공했다. 반면 SWE-벤치와 터미널-벤치에서는 확장 사고 없이도 최고 수준의 성능을 기록해 모델의 기본 역량이 크게 향상됐음을 입증했다.
벤치마크 투명성도 강조됐다. SWE-벤치 평가에서 앤트로픽은 기존 소넷 3.7 모델에 포함됐던 계획 도구 없이 오직 배시 도구와 파일 편집 도구만 사용한 간소화된 환경에서 테스트를 진행했다. TAU-bench의 경우 모델의 추론 과정과 도구 사용 흐름을 자세히 서술하도록 유도하는 추가 프롬프트가 포함됐고 문제 해결을 위한 최대 작업 단계도 30단계에서 100단계로 확장했다.
앤트로픽은 이번 오푸스 4.1 공개와 함께 향후 수 주 내에 더욱 강력한 성능을 갖춘 차세대 모델 출시도 예고했다.
한편 이번 모델 출시로 앤트로픽이 기업용 LLM 시장에서 선두자리를 오픈AI를 추월한 기업용 LLM 시장 주도권을 더욱 굳힐 것으로 전망된다. 최근 벤처캐피털 멘로벤처스가 발표한 보고서에 따르면 2025년 기준 앤트로픽은 엔터프라이즈용 LLM 시장에서 32%의 점유율로 오픈AI(25%)를 앞질렀다. 불과 1년 전인 2023년만 해도 오픈AI는 이 시장의 절반을 차지했지만 현재는 절반 수준으로 감소한 반면 앤트로픽은 같은 기간 12%에서 두 배 이상 성장하며 정반대의 흐름을 나타냈다. 코딩 특화 LLM 분야에서도 42%의 점유율을 기록해 20% 미만에 머문 오픈AI의 두 배 이상을 차지했다.