레드햇, 엔터프라이즈 AI 플랫폼 ‘레드햇 AI 3’ 출시
분산 추론 기술 ‘llm-d’ 정식 공개… PoC→프로덕션 전환 지원
레드햇이 엔터프라이즈 AI 플랫폼의 업그레이드 버전인 ‘레드햇 AI 3’를 출시했다고 발표했다. 이번 플랫폼은 레드햇 AI 인퍼런스 서버, 레드햇 엔터프라이즈 리눅스 AI, 레드햇 오픈시프트 AI의 최신 기술을 통합해 대규모 AI 추론의 복잡성을 단순화하고 PoC에서 프로덕션 단계로의 전환을 지원한다.
MIT NANDA 프로젝트의 ‘생성형 AI 격차’ 보고서에 따르면, 약 95%의 조직이 400억달러(약 56조8000억원) 규모의 AI 투자에도 불구하고 측정 가능한 재무적 성과를 얻지 못하고 있다. 레드햇 AI 3는 이러한 과제를 해결하기 위해 하이브리드 및 멀티 벤더 환경에서 AI 워크로드를 신속하게 확장·배포할 수 있도록 설계됐다.
레드햇 오픈시프트 AI 3.0은 쿠버네티스에서 대형언어모델(LLM) 실행 방식을 재정의하는 llm-d를 정식 출시했다. llm-d는 vLLM 및 llm-d 커뮤니티 프로젝트를 기반으로 지능형 분산 추론을 가능하게 하며, 엔비디아 다이나모, 딥EP MoE 등의 오픈소스 기술을 활용해 비용 절감과 응답 시간 개선, 운영 단순성을 제공한다. 엔비디아, AMD 등 다양한 하드웨어 가속기에서 LLM 추론을 배포할 수 있는 크로스 플랫폼 지원도 특징이다.
레드햇 AI 3는 프로덕션 단계에서 사용 가능한 생성형 AI 솔루션 구축을 위한 통합 플랫폼을 제공한다. 주요 기능으로는 IT 팀이 중앙에서 공통 모델을 서빙하는 ‘서비스형 모델(MaaS)’, 기본 AI 자산을 탐색·배포·관리하는 ‘AI 허브’, AI 엔지니어가 모델과 상호작용하고 신속하게 프로토타이핑할 수 있는 ‘생성형 AI 스튜디오’ 등이 있다. 또한 오픈AI의 gpt-oss, 딥시크 R1, 위스퍼, 복스트랄 미니 등 검증 및 최적화된 모델을 포함했다.
AI 에이전트 개발을 위해 레드햇은 라마 스택 기반의 통합 API 레이어를 도입했으며, AI 모델이 외부 도구와 상호작용하는 방식을 간소화하는 모델 컨텍스트 프로토콜(MCP)을 채택했다. 인스트럭트랩 기능을 기반으로 한 모듈식 확장형 툴킷도 새롭게 선보였다. 이 툴킷은 비정형 문서를 AI가 읽을 수 있는 형식으로 변환하는 독클링, 합성 데이터 생성 프레임워크, LLM 미세 조정을 위한 학습 허브를 포함한다.
조 페르난데스 레드햇 AI 사업부 부사장은 “레드햇 AI 3를 통해 기업이 AI를 실험 단계에서 프로덕션 단계로 확장할 때 직면하는 복잡성, 비용, 제어 문제를 해결하는 엔터프라이즈급 오픈소스 플랫폼을 제공한다”고 밝혔다.
릭 빌라스 IDC 월드와이드 리서치 그룹 부사장은 “2026년은 기업들이 AI 투자로부터 측정 가능하고 반복 가능한 비즈니스 성과를 요구하는 전환점이 될 것”이라며 “실제 가치는 모델로부터 파생된 인사이트를 효율적이고 안전하며 비용 효율적인 추론으로 운영화하는 데 있다”고 말했다.