인도, AI 독립 선언… 12억달러 베팅

120개 언어 지원 자국 LLM 개발 본격화 미중 양강체제에 '제3의 축' 형성 나서

2025-08-18     김동원 기자
/일러스트=챗GPT

인도가 인공지능(AI) 분야에서 자립을 위한 계획을 본격 추진하고 있다. 제한된 자금과 복잡한 언어 환경이라는 제약을 극복하고 자국만의 대형언어모델(LLM) 생태계 구축에 나섰다.

인도의 독자적 AI 모델 개발은 미국과 중국이 AI 패권 경쟁을 벌이는 가운데 제3의 축을 형성하려는 움직임으로 풀이된다. 세계 최대 인구 보유국인 인도엔 120개 이상 언어와 1만 9000여개 방언이 있다. 이러한 언어적 다양성을 반영한 AI 모델 개발은 글로벌 AI 생태계에 새로운 변화를 가져올 것으로 전망된다.

◇ 정부 주도 12억 달러 투자로 AI 인프라 구축

최근 MIT테크놀로지 리뷰 보도에 따르면, 인도 정부는 지난해 AI 기술 개발을 위한 포괄적 계획인 ‘인디아AI 미션(IndiaAI Mission)’에 12억 달러(약 1조7000억원) 투자를 승인했다. 미국과 중국에 이어 세계 3위 규모의 정부 주도 AI 투자로 평가된다.

인도 전자정보기술부(MeitY)는 AI 개발에 필요한 컴퓨팅 자원을 확보한 것으로 알려졌다. 엔비디아 고성능 그래픽처리장치(GPU) H100 1만 3000개를 포함해 총 1만 9000개의 GPU를 AI 연구용으로 제공하기로 했다. 올해 1월 중국 딥시크가 딥시크-R1을 출시한 지 불과 10일 만에 파운데이션 모델 개발 제안서를 공모했을 정도로 발빠른 대응을 보였다.

정부는 이런 언어적 복잡성을 해결하기 위해 6개 대규모 모델 개발을 지원하기로 했다. 사르밤 AI는 추론과 음성 기능을 갖춘 700억 파라미터 다국어 모델을 올해 말 출시 예정이다. 소켓 AI 랩스(Soket AI Labs)는 1200억 파라미터, 간.ai(Gan.ai)는 700억 파라미터 모델을 각각 개발 중이다.

이미 성과도 나타나고 있다. 코로버(CoRover.ai)가 개발한 ‘바라트GPT(BharatGPT)’는 12개 언어로 음성 기능을 제공하는 32억 파라미터 규모의 인도 첫 정부 지원 멀티모달 모델로 평가된다. 올해 6월에는 5억 3400만 파라미터의 경량화 버전인 ‘바라트GPT 미니’도 출시했다.

◇ 언어적 다양성과 자금 격차라는 이중 도전

인도가 직면한 가장 큰 도전은 언어의 다양성이다. 22개 공식 언어 외에도 120개 이상의 언어와 1만 9500개의 방언이 존재한다. 칸나다어, 타밀어처럼 단어 사이 구분자 없이 쓰이는 언어들은 토큰화 작업을 더욱 복잡하게 만든다.

AI 스타트업들이 넘어야 할 또 다른 큰 산은 자금 부족이다. 시장조사업체 AIM 리서치에 따르면, 2024년 기준 미국 AI 스타트업들이 970억 달러(약 134조원), 유럽이 510억 달러(약 70조)의 벤처 투자를 유치한 반면, 인도는 7억 8050만 달러(약 1조800억원)에 그쳤다.

연구개발 투자 비율도 현저히 낮다. 국내총생산(GDP) 대비 연구개발 투자는 미국 3.5%, 중국 2.68%, 유럽 2.2%인 반면 인도는 0.65%에 불과하다. 이는 인도가 서비스 중심의 정보기술(IT) 산업 구조를 가지고 있기 때문이다. 인포시스(Infosys), 타타(Tata), HCL 같은 대기업들이 소프트웨어 컨설팅 서비스에 집중해 왔다.

인도 AI 리더들은 중국의 딥시크 모델에서 영감을 얻고 있다고 밝혔다. 딥시크가 국제 경쟁사들보다 훨씬 적은 비용으로 선도적인 LLM을 구축한 것이 인도에게 새로운 가능성을 제시했다는 것이다.

국내 AI 스타트업 대표는 “AI는 국제적 프로젝트이지만, 동시에 각국의 고유성을 반영해야 한다”며 “인도의 시도가 성공할 경우 다른 개발도상국들에게도 중요한 선례가 될 것”이라고 평가했다.