中 딥시크 견제하는 美 AI 기업들, 데이터 도용 여부 조사

오픈AI‧MS, 딥시크 데이터 도용 조사 착수 2024년 가을 대량 데이터 빼낸 정황 발견

2025-01-30     유덕규 기자
딥시크 홈페이지

가성비 높은 대형언어모델(LLM)을 만들어 인공지능(AI) 업계에 파장을 놓은 중국 AI 스타트업 ‘딥시크’를 향한 미국 기업들의 견제가 들어갔다. 

29일 블룸버그 등 주요 외신에 따르면, 오픈AI와 마이크로소프트(MS)는 딥시크가 자사 데이터를 도용했는지 여부에 대해 조사를 시작했다. 딥시크는 최근 미국 AI 선두주자보다 95% 저렴한 557만 6000달러(약 78억 8000만원)에 딥시크-V3의 미세조정 버전 R1을 개발했다고 밝혔는데, 여기에 오픈AI가 개발한 AI 모델의 데이터를 도용했다는 주장이 나와서다. 

블룸버그에 따르면, MS의 보안 연구원들은 지난해 가을 오픈AI의 애플리케이션프로그래밍인터페이스(API)에서 대량의 데이터를 빼내는 정황을 발견했다. 이 같은 행보가 딥시크와 관련이 있다고 판단, 조사에 착수했다. 오픈AI는 AI서비스를 개발하는 소프트웨어 개발자들에 API를 판매하고 있는데, 일부 이용자가 제재를 우회하고 정상적으로 사용할 수 있는 데이터의 범위 이상을 빼냈다는 의심이 들어서다. 오픈AI는 중국에서의 자사 API 사용을 금지하고 있다.

딥시크-R1은 엔비디아가 사양을 낮춰 개발한 H800칩으로 개발하며, AI 발전에 꼭 첨단 칩이 필요하지 않다는 것을 증명해 AI 업계를 놀라게 했다. 이 발표 후 엔비디아 주가는 곤두박질쳤다. 딥시크가 개발 경과를 설명한 기술보고서에 따르면, 챗GPT와 비슷한 성능의 딥시크-R1 개발에 투입된 비용은 557만 6000달러였는데, 이는 엔비디아의 저사양 ‘H800 GPU’를 시간당 2달러에 2개월 동안 빌린 비용으로 계산됐다. 오픈AI가 최신 생성형 AI 서비스에 투자한 비용인 1억 달러(약 1438억 원)의 20분의 1 수준이다.

하지만 일각에서는 딥시크의 주장을 믿어서는 안 된다는 얘기가 나오고 있다. 이미 딥시크의 모회사인 하이플라이어(High-Flyer)는 2021년 1월 엔비디아 A100 GPU 1만 장을 확보해 AI 칩 클러스터를 구축했기 때문이다. 실제로 이 기업은 엔비디아 GPU(H100, H20, H800) 5만 개를 보유한 기업으로 알려져 있다.

국내 AI 스타트업 대표는 “딥시크가 한 말을 모두 믿어서는 안 된다”면서 “미국이 규모의 전쟁을 키워가는 상황에서 라이벌인 중국이 미국의 장점을 지우는 마케팅을 한 것으로도 풀이된다”고 말했다.

일론 머스크 테슬라 최고경영자(CEO)는 27일 X에 딥시크가 엔비디아의 고성능 AI칩인 H100을 대량 보유하고 있을 가능성이 있다는 글을 올린 바 있다.