유연함 갖춘 스노우플레이크 인텔리전스 ‘데이터 분석 경계 허문다’
텍스트 투 SQL 3배 속도 향상, 에이전트 GPA로 정확성 확보 정형·비정형 데이터 다루는 콘텍스트 에이전트와 RAG 기반 검색 개발자 친화적 도구와 글로벌 파트너십으로 생태계 확장
데이터는 연료와 같다. AI라는 엔진의 성능을 높이기 위해서는 연료가 깨끗하고 충분해야 한다. 업계는 ‘데이터 드리븐’에서 ‘AI 드리븐’으로 빠르게 전환하는 추세지만, 복잡한 데이터 시스템과 비정형 데이터의 방치는 여전히 걸림돌이다. 스노우플레이크가 공개한 ‘스노우플레이크 인텔리전스’는 단순한 챗봇이 아닌, 기업 데이터를 신뢰할 수 있는 지식으로 바꿔주는 엔터프라이즈 AI 에이전트다.
◇ ‘Easy, Connected, Trusted’ 철학 위의 서비스
스노우플레이크가 20일인 오늘 기자간담회를 열고 엔터프라이즈 AI 에이전트 ‘스노우플레이크 인텔리전스(Snowflake Intelligence)’의 정식 출시를 발표했다. 이날 행사에는 이수현 스노우플레이크 에반젤리스트와 임진식 기술 총괄이 참석해 2024년 하반기에 공개된 100여 가지 신규 기능을 소개했다.
이수현 에반젤리스트는 “데이터 시스템의 복잡성, 데이터 소스 통합의 어려움, 그리고 데이터 거버넌스 부재가 AI 도입의 가장 큰 장벽”이라고 말했다. 그는 “스노우플레이크의 미션은 데이터 라이프사이클 어느 단계에 있던 모든 고객이 AI와 함께 데이터에서 더 많은 가치를 빠르게 창출하도록 돕는 것”이라고 덧붙였다. 스노우플레이크의 조사에 따르면, 비정형 데이터는 전체 기업 데이터의 80%를 차지하지만 활용되지 못하고 있다. 스노우플레이크는 이번 업데이트로 비정형 데이터까지 통합해 AI 경험을 전사적으로 확산시키는 것이 핵심이다.
스노우플레이크는 ‘Easy, Connected, Trusted’라는 세 가지 철학을 바탕으로 AI 데이터 클라우드를 구축해 왔다. 이수현 에반젤리스트는 “우리는 비전문가가 AI를 활용해 손쉽게 데이터를 활용하도록 프로세스를 간소화하고, 데이터 셰어링과 오픈 소스 기반 커넥터로 원하는 데이터를 빠르게 연결하며, 통합 보안과 거버넌스로 신뢰할 수 있는 AI 활용을 지원한다”고 설명했다.
◇ 빠른 의사결정 지원하는 스노우플레이크 인텔리전스
이날 발표에서 가장 주목받은 기능은 정식 출시된 스노우플레이크 인텔리전스였다. 이 서비스는 자연어 질문만으로 정형·비정형 데이터를 통합 분석하고, 멀티스텝 워크플로우를 자동 실행하는 엔터프라이즈급 솔루션이다. 스노우플레이크 AI 리서치팀의 혁신으로 텍스트 투 SQL 쿼리 처리 속도가 최대 3배 빨라졌으며, 새로운 평가 방법인 ‘에이전트 GPA(goal, plan, action)’를 통해 최대 95%의 오류를 탐지해 높은 수준의 정확성을 확보했다.
이수현 에반젤리스트는 “스노우플레이크 인텔리전스의 강점은 사용자가 데이터 팀에 의존하지 않고 독립적으로 인사이트를 얻을 수 있다는 것”이라고 말했다. 현장에서 데모를 시연한 그는 인텔리전스에 6월부터 8월까지 제품 카테고리별 매출 트렌드 분석을 요청했다. 고객 응대에서 보고된 문제점 요약, 특정 제품군의 급성장 이유 분석 등을 자연어 질문만으로 수행했다. 특히 7월 피트니스웨어 매출 급증 원인을 묻자, 인텔리전스는 스스로 마케팅 캠페인 데이터, 소셜미디어 반응, 제품 출시 데이터를 순차적으로 분석하기도 했다.
이수현 에반젤리스트는 “사람이 직접 분석했다면 꼬박 하루가 걸렸을 작업을 인텔리전스는 2분 만에 완료했다. 이후 분석 결과를 이메일로 자동 전송하는 등 엔드투엔드 워크플로우까지 구현한다”고 강조했다. 스노우플레이크 인텔리전스는 출시 이후 시스코, 토요타 등 1000여 개 고객사가 1만5000개 이상의 AI 에이전트를 배포했고, 51만여 건의 질문을 처리했다.
스노우플레이크 인텔리전스의 핵심은 ‘코텍스 에이전트(Cortex Agent)’라는 AI 브레인이다. 이 에이전트는 사용자의 자연어 질문을 받으면 정형 데이터 분석이 필요한지 비정형 데이터 검색이 필요한지 스스로 판단해 적절한 도구를 호출한다. 정형 데이터 분석에는 ‘콘텍스트 애널리스트(Cortex Analyst)’가 SQL을 자동 생성하고 실행하며, 비정형 데이터 검색에는 RAG 기반 서치 서비스가 기업 문서에서 관련 정보를 추출한다.
이수현 에반젤리스트는 “비정형 데이터 검색은 RAG 기반이기에 실제 존재하는 문서에서만 답변을 생성해 할루시네이션을 방지하고, 모든 인사이트의 출처를 사이테이션으로 제공한다”고 설명했다. 또한, AI SQL 기능으로 컴퓨터 비전 전문가가 아니어도 이미지나 영상 데이터를 SQL 함수만으로 분석한다. 정식 출시된 AI SQL은 동적 테이블(Dynamic Tables)과 결합해 간단한 declarative SQL 쿼리만으로 AI 추론 파이프라인을 구축히도록 강화했다.
◇ 기업의 골든타임 지키는 인텔리전스의 기반 기술
스노우플레이크는 에이전틱 AI 개발을 가속화하기 위한 신규 개발자 도구 제품군도 공개했다. 프라이빗 프리뷰로 공개된 AI 어시스턴트 ‘코텍스 코드(Cortex Code)’는 스노우플레이크 UI 내에서 자연어로 실행돼 플랫폼 사용 현황 파악, 복잡한 쿼리 최적화, 결과 미세 조정 등을 통해 비용을 절감한다. 중앙 집중형 개발 환경인 ‘스노우플레이크 워크스페이스’는 다양한 파일 형식을 통합 관리하고 깃(Git) 통합을 통해 버전을 관리하며, VS 코드 통합 기능으로 개발자가 선호하는 IDE에서 직접 코드를 작성한다. ‘스노우플레이크 dbt 프로젝트’를 통해서는 오픈소스 데이터 변환 도구 dbt 프로젝트를 스노우플레이크 내에서 직접 구축, 테스트, 배포, 모니터링하게 됐다.
스노우플레이크 인텔리전스는 내부 데이터뿐 아니라 외부 데이터를 자유롭게 연동해 현명한 의사결정을 지원한다. 이수현 에반젤리스트는 “프라이빗 데이터 셰어링이나 마켓플레이스를 통해 외부 데이터를 버튼 클릭만으로 받아올 수 있고, 커스텀 툴을 만들면 네이버 상품 정보나 후기 같은 외부 데이터도 실시간으로 연동할 수 있다”고 답했다. 임진식 기술총괄은 “커스텀 툴을 이용해 내부 데이터와 외부 데이터를 동시에 소싱해 분석하는 것이 가능하며, 마이크로소프트 팀즈나 슬랙 같은 협업 도구와의 연동, API 호출을 통한 다양한 액션 실행도 지원한다”고 덧붙였다.
주요 AI 엔터프라이즈와의 협업도 눈에 띄었다. 특히 데이터 접근성 강화를 위해 정식 출시된 ‘오픈플로우 커넥터(Openflow Connector)’는 개방형 표준 기반으로 거의 모든 데이터 소스로부터 데이터 통합과 수집 과정을 안전하게 자동화한다. 최근 스노우플레이크는 오라클과의 파트너십으로 오라클 데이터베이스의 정형·비정형 데이터를 CDC 기반 실시간으로 통합하며, 팔란티어와의 협력으로 AI 운영 체제를 결합해 데이터 파이프라인을 간소화했다. SAP와는 ‘SAP 비즈니스 데이터 클라우드(BDC)’와의 제로 카피 양방향 연결을 지원하고, 엔비디아와의 파트너십으로 ‘CUDA-X’ 라이브러리를 탑재해 GPU 가속 머신러닝 워크플로우를 구현하게 됐다.
이수현 에반젤리스트는 여러 기업과의 협업 사례를 예로 들어 성능을 입증했다. 반도체 제조기업인 울프스피드(Wolfspeed)는 스노우플레이크 인텔리전스를 도입해 200개 이상의 데이터베이스에 산재된 정형 데이터와 기술 노트, PDF 같은 비정형 데이터를 통합했다. 공장 다운타임 발생 시 히스토리 데이터 분석 시간을 2시간에서 2분으로 단축해 98%의 생산성 향상을 달성했다. 이수현 에반젤리스트는 “울프스피드는 인텔리전스를 통해 ‘what’을 넘어 ‘why’에 대한 답을 빠르게 얻을 수 있어 비즈니스 골든타임을 확보했다”고 설명했다.
끝으로, 스노우플레이크는 향후 대규모 문서 분석 기능을 프라이빗 프리뷰로 제공하고, 2026년 상반기에는 모바일 앱을 출시해 사용자가 어디서나 데이터 인사이트에 접근하도록 지원할 계획이라고 밝혔다.