정부가 야심차게 추진하는 ‘독자 AI 파운데이션 모델’ 사업이 출발선에서부터 표류하고 있다. 그래픽처리장치(GPU) 지원 방식과 데이터 처리에 대한 이해 부족으로 초기 단계부터 혼선을 빚고 있어서다. 최종 후보로 선정된 5개 기업은 12월 4개 팀으로 압축되는 서바이벌 평가를 앞두고 있지만, 정작 AI 모델 개발의 핵심인 GPU 자원 활용에서부터 걸림돌이 생긴 상황이다. 일각에선 ‘AI 국가대표’를 뽑는다고 해놓고 정작 정부는 ‘아마추어’처럼 행동하고 있다는 비판이 나오고 있다.
◇ “GPU 단위 1000개 맞아?”… 데이터 보호 이슈도 터져
‘독자 AI 파운데이션 모델’ 사업에 따르면 과학기술정보통신부는 최종 후보로 선정된 5개 팀에 GPU와 데이터, 전문 인력을 지원한다. 초기 1년은 민간에서 임차한 H100과 B100 GPU를 각각 최소 1000장씩 제공하게 돼 있다. 지원하는 민간 기업은 SK텔레콤과 네이버클라우드다.
하지만 문제는 이 숫자 단위에서 시작됐다. 5일 THE AI 취재 결과, 정부 관계자는 사업에 나온 단위 1000장을 그대로 기입해 수량이 맞지 않는 문제가 발생했다. 본래 GPU는 하드웨어 특성상 서버 랙 구성이나 전력·냉각 시설을 고려해 2의 거듭제곱 단위(8개, 16개, 32개 등)로 배치되는 것이 일반적이다. GPU클러스터도 하드웨어 특성상 8개, 16개, 32개 단위로 묶여 서버에 장착되기 때문에 1000개라는 단위와는 맞지 않는다. 실제 데이터센터에서는 1000개가 아닌 1024개(2¹⁰) 또는 896개 같은 숫자로 조정되는 경우가 많다. 하지만 정부 관계자가 이러한 이해도가 없어 지원 단위에서부터 혼란을 겪은 것이다.
또 다른 문제는 데이터 보호였다. 최종 5개 기업은 1년간 민간의 GPU를 사용하게 돼 있다. 선정된 5개 기업(LG AI연구원, 업스테이지, 네이버클라우드, SK텔레콤, NC AI) 중 네이버클라우드와 SK텔레콤을 제외한 3개 기업이 이들의 GPU를 이용하게 되는 구조다. 그런데 이 GPU를 이용하는 과정에서 회사 내부 데이터를 보호할 수 있는 장치가 마련되지 않았다. 이 때문에 일부 기업에서는 데이터가 유출될 수 있다는 지적이 제기됐다. 데이터를 보호하지 않는다면 초기에 약속했던 파운데이션을 모두 오픈하겠다는 공약을 실천하지 않겠다는 기업도 있었던 것으로 알려졌다.
해당 사업에 참여하지 않은 한 AI 기업 관계자는 “데이터 보호 장치나 GPU 단위 등은 정말 기본적인 사항”이라면서 “지금 사업은 서바이벌식으로 진행돼 기업들은 정해진 시간 내 성과를 내야 하는 데 이러한 기본적인 것들이 발목을 잡아 참가 기업들은 난감할 것 같다”고 말했다. 이어 “지금까지 정부 관계자들의 이해도가 낮거나 심사위원 수준이 낮아서 실패하거나 낮게 평가된 사업들이 많았는데, 독자 AI 파운데이션 모델의 경우 관심도가 워낙 큰 사항이다 보니 지금이라도 전반적인 사항을 꼼꼼히 체크할 필요가 있다”고 조언했다.
한편, 이번 사업에 선정된 후보 5개 기업 중 전문 인력을 신청한 기업은 1곳으로 나머지 기업은 GPU와 데이터만 지원받는 것으로 알려졌다.
◇ 심사 위원은 긍정, 하지만 그 안에 잡음 많아
긍정적인 부분은 이번 사업의 심사는 전문성 있게 진행됐다는 점이다. 참여 수행기관으로 참여한 한 기업 대표는 “모든 것을 말할 수는 없지만 심사는 정말 어려웠다”며 “심사위원들이 그동안 기업들이 발표한 오픈 모델을 모두 뜯어보고 나온 느낌”이었다고 말했다.
하지만 본지 취재 결과 심사 과정에서도 어려움이 있었다. 정보통신산업진흥원(NIPA)에서는 사업에 참여하지 않고 큰 연관성이 없지만 전문성을 갖춘 이들로 심사단을 구성했지만, 심사 과정에서 이탈한 심사위원들이 있었다. 본래 심사위원은 국내에서 5명, 해외에서 2명이 하기로 돼 있었다. 그중 국내 심사위원 중 한 명은 중도 이탈했다. 대기업 AI 계열사 대표 출신인 그는 개인적인 사유로 심사위원에서 나와 국내에선 총 4명이 심사한 것으로 알려졌다.
해외에서는 2명이 서류를 검토하는 식으로 심사가 진행됐다. 하지만 여기서도 1명이 이탈했다. 그가 심사를 이탈한 이유는 밝혀지지 않았다.
심사위원 경험이 많은 한 기업 대표는 “정부 심사 과정이 사실 쉽지 않다”며 “종일 시간을 빼야 하는데 들어오는 비용은 적고, 독자AI파운데이션 모델처럼 대기업이 참여하는 경우 미리 심사위원의 정보를 알아 사전에 여러 문의를 받는 경우도 있다”고 지적했다. 이어 “이러한 어려움 속에서 이번 사업 평가가 잘 이뤄졌다는 점은 긍정적”이라면서 “앞으로 정부 사업에서 심사위원 구성을 어떻게 할지는 정말 심각하게 고민할 필요가 있다”고 말했다.