[김동원의 Eye-T] 범용 AI 넘어 ‘전문가 AI’로… LG AI연구원의 선견지명
의료부터 개인 디바이스까지… 산업별로 쏟아지는 특화 AI 엑사원, 화학·제조·의료·교육 전방위 성과로 산업 AI 선도 적은 데이터로 더 강하게… ‘연비 혁신’과 ‘윤리 원칙’ 지킨 엑사원
[편집자 주] ‘김동원의 Eye-T’는 IT 소식을 직접 눈(Eye)으로 보는 것처럼 생생하게 전달하는 것을 목적으로 합니다. 유용한 IT 기술과 솔루션을 쉽고 자세하게 보여드리겠습니다.
인공지능(AI) 업계에 새로운 바람이 불고 있다. 그동안 ‘무엇이든 할 수 있는’ 범용 AI를 만드는 데 집중했던 글로벌 빅테크 기업들이 이제는 특정 분야에 특화된 AI 개발에 본격 나서고 있다.
의료 진단에서 85%의 정확도를 보이는 마이크로소프트의 AI, 방사선 전문의 72%가 인정한 구글의 의료 AI, 개인 디바이스에 특화된 애플의 AI까지 빅테크에서 출시한 산업 특화 AI가 출시되고 있다. 그런데 이러한 글로벌 트렌드를 한국에서 이미 몇 년 전부터 예측하고 실행에 옮긴 곳이 있다. 바로 LG AI연구원이다.
◇ 글로벌이 주목하는 산업 특화 AI 트렌드
AI 기술이 실험실에서 벗어나 실제 산업 현장에서 구체적인 가치를 창출하고 있다. 전문가 수준을 발휘하는 AI가 실제 비즈니스 성장을 견인하고 있다.
의료 분야에선 그 변화 속도가 체감된다. 구글의 의료 특화 AI 모델 ‘메드-제미나이(Med-Gemini)’는 방사선 전문의 72%가 “실제 보고서 수준이거나 그보다 더 뛰어나다”고 평가할 정도로 전문의 수준의 성능을 보여주고 있다.
마이크로소프트의 AI 진단 시스템 ‘MAI-DxO’는 한 걸음 더 나아가 의료 진단에서 85%의 정확도를 기록했는데, 같은 케이스를 분석한 임상의들의 평균 정확도 21.2%와 비교하면 4배가 넘는 성능 차이를 보인다. 오픈AI 역시 262명의 의사와 60개국의 의료 경험, 5000개의 현실적인 의료 대화를 기반으로 한 헬스벤치(HealthBench)를 통해 헬스케어 특화 AI의 새로운 기준을 제시하고 있다.
의료 외에도 다양한 분야에서 특화 AI가 등장하고 있다. 구글은 제조업에서도 반도체 칩 설계에 특화된 AI로 기존에 수개월 걸리던 작업을 6시간 만에 완료하는 혁신을 이뤄냈다. 애플의 애플 인텔리전스(Apple Intelligence)는 또 다른 방향으로 개인용 디바이스 특화라는 새로운 영역을 개척했다. 클라우드 기반 범용 AI와 달리 개인정보 보호를 최우선으로 하면서 사용자 개인의 맥락을 이해하는 온디바이스 AI에 집중하고 있다.
◇ LG AI연구원의 선견지명, 처음부터 전문성에 집중
LG AI연구원이 내세운 초거대 AI ‘엑사원(EXAONE)’이 그 결과물이다. 엑사원의 약자는 ‘Expert AI for EveryONE’으로, 이름 자체에서 ‘모든 사람을 위한 전문가 AI’라는 비전을 담고 있다.
최정규 LG AI연구원 AI에이전트 그룹장은 기자와 인터뷰에서 “우리는 LG그룹 산하 독립적인 연구조직으로, 각 계열사에서 해결하기 어려운 복잡하고 고난도 문제들을 AI로 풀고 있다”며 “‘AI로 이런 문제를 풀 수 있겠느냐’는 요청이 쌓이면서 산업별로 매우 정교한 이해와 대응이 가능한 산업 특화 대형언어모델(LLM)이 발전할 수 있었다”고 밝혔다.
화학·소재 분야에서의 혁신이 대표 사례다. 엑사원 기반 AI 모델 ‘엑사원 디스커버리’는 약 100여종의 화학물질 특성을 학습해 기존 1년 10개월이 소요되던 기능성 화장품 핵심 성분 개발 기간을 단 하루로 단축시켰다. LG AI연구원은 화학 구조식을 읽고 분자를 구성하고 있는 원자와 결합 유형까지 인식해 데이터베이스화하는 자체 기술을 발표했다. 이 기술은 기존 모델 대비 효율성 부분에서 100배 이상의 성능을 내는 것으로 나타났다. 이 성과는 글로벌 AI 학회인 ‘뉴립스(NeurIPS)’에 발표됐다.
제조업 현장에서도 실질적인 변화를 만들어내고 있다. LG디스플레이에서는 엑사원이 이미 핵심 업무에 활용되고 있다. 디스플레이 산업 특성상 대형 OLED부터 차량용까지 다양한 프로토콜과 수많은 기술 문서가 존재하는데, LG디스플레이는 지난 30년간 축적된 방대한 연구개발(R&D) 이슈 해결 문서들을 모두 디지털화해 보관하고 있었다. 엑사원은 이 문서들을 기반으로, 특정 문제에 대한 해결책을 과거 유사 사례에서 찾아 제시하는 검색형 QA 서비스로 상용화됐고, 실제로 20~30분 걸리던 문제 해결 시간이 30초 이내로 단축했다.
의료 분야에서도 차세대 혁신을 준비하고 있다. LG AI연구원이 공개한 ‘엑사원 패스(EXAONE Path) 2.0’은 병리 조직 이미지로 유전자 변이와 발현 형태, 인체 세포와 조직의 미세한 변화 및 구조적 특징을 정밀하게 분석·예측할 수 있는 차세대 정밀 의료 AI 모델이다. 유전자 변이 예측 정확도를 세계 최고 수준인 78.4%까지 높였다. LG AI연구원 측은 “기존 2주 이상의 유전자 검사 시간을 1분 이내로 단축해 암 환자의 치료 골든타임을 확보하는 데 도움을 받을 수 있다”고 설명했다.
교육 분야에서도 인정받고 있다. 엑사원 4.0은 의사 시험을 비롯해 한약사, 치과의사, 손해사정사, 감정평가사, 관세사 등 국가공인 자격증 6개를 취득하며 인간 전문가 수준의 학습 능력을 입증했다. 특히 2024년 수학 수능에서 94.5점으로 1등급을 받아 교육 현장에서의 활용 가능성을 보여줬다. 엑사원의 기술력은 교육 현장에서 실질적인 변화를 만들어내고 있다. 가장 대표적인 사례가 경기도교육청과 LG CNS가 진행 중인 디지털 플랫폼 구축 사업이다. 이 시스템은 경기도 내 280여 개 학교의 학부모와 학생 질문에 대한 소통을 담당하고, 맞춤형 학사 스케줄 및 교육 행정 정보를 제공한다. LG AI연구원은 최근 개발한 엑사원 4.0을 초중고 학생과 대학생을 대상으로 교육용 라이센스 없이 무료로 제공할 예정이다. 또 도서관 협회와 협력한 도서 검색 및 정보 요약 서비스를 하반기에 출시할 계획이다.
◇ LG AI연구원의 또 다른 강점, ‘연비’ 혁신
LG AI연구원만의 차별화된 경쟁력은 바로 ‘AI 연비’다. 적은 매개변수와 학습 데이터로도 글로벌 모델들과 경쟁할 수 있는 성능을 구현했다. AI 활성화의 골칫거리인 비용과 전력 사용량 부담을 줄이면서도 높은 효율성을 유지할 수 있는 기반을 만들었다는 평가를 받고 있다.
가장 대표적인 사례가 엑사원 3.0과 메타 라마3.1의 비교다. 메타 라마3.1이 15조 토큰을 학습에 사용한 반면, 엑사원 3.0은 8조 토큰만 사용했다. 절반 가깝게 적은 양이다. 보통 AI가 더 많은 데이터를 학습할수록 성능이 높아진다는 점을 감안하면 당연히 메타 라마3.1의 성능이 좋아야 하지만 결과는 달랐다. 엑사원 3.0은 벤치마크 점수 순위에서 실제 사용성을 비롯해 코딩과 수학 영역 등에서 라마3.1보다 높은 점수를 기록했다.
가장 최근 공개한 ‘엑사원 4.0’에서 이런 연비 성능이 더욱 극명하게 드러났다. 엑사원 4.0은 매개변수가 320억개(32B)에 불과하지만, 훨씬 큰 딥시크-R1(671B)이나 큐원3-235B에 맞먹는 수준으로 글로벌 톱 수준의 성능을 기록했다. 크기가 딥시크-R1의 4.8%, 큐원3-235B의 13.6%라는 점을 감안하면 효율성 면에서 세계 최고급으로 볼 수 있다. AI 지식 수준과 문제 해결 능력을 평가하는 MMLU-프로에서 81.8점을 기록해 딥시크-R1의 85점과 큐원3-235B의 83점에 비해 크게 떨어지지 않는 수준을 보였다.
온디바이스 모델에서도 놀라운 성과를 보여준다. 경량 모델인 엑사원 딥-7.8B는 32B 모델의 24% 크기임에도 95% 성능을 유지했으며, 온디바이스 모델인 2.4B는 7.5% 규모임에도 성능이 86%에 달했다. 온디바이스 모델의 경우 외부 서버와의 연결 없이 기기 내부에서 안전하게 데이터를 처리해 보안성과 개인정보 보호 측면에서 강점이 있어, 스마트폰과 자동차, 로봇 등 다양한 산업에 확산할 수 있을 것으로 기대된다.
이런 연비 성능 실현을 위해 LG AI연구원은 사전학습부터 사후학습까지 모든 과정에서 세심한 노력을 기울였다고 서명한다. 웹과 책, 논문, 특허, 코드 등 가공되지 않은 말뭉치를 정제하고, 중복된 데이터를 제거하는 데 집중했다. 중복된 데이터가 많으면 AI 모델이 중복된 부분을 강조해 편향 문제가 발생할 수 있고, 불필요한 전력을 사용해 효율성이 떨어질 수 있기 때문이다.
그렇다고 성능 향상을 위해 비윤리적인 개발을 한 것도 아니다. 데이터 활용 등에서 철저하게 윤리 사항을 준수했다. 이진식 LG AI연구원 랩장은 지난해 8월 열린 ‘THE AI KOREA’에서 “AI 모델을 만들 때 성능을 크게 높일 수 있는 데이터들이 있는데, 이러한 데이터들은 저작권, 라이센스 등의 이슈가 있을 가능성이 있다”면서 “안전한 AI 환경을 실현하기 위해 ‘LG AI 윤리 원칙’에 따라 이러한 데이터들은 사용하지 않고 모델을 개발했다”고 말했다. LG AI 윤리원칙은 인간 존중, 공정성, 안전성, 책임성, 투명성 등 5가지 핵심 가치를 담은 원칙이다.
글로벌 경쟁력도 입증했다. 엑사원 시리즈는 2024년 8월부터 오픈소스로 공개돼 현재까지 전 세계 350만 회의 다운로드를 기록했다. 미국 스탠포드대 HAI(Human-Centered AI Institute)에서 발표하는 전 세계 주목할 만한 AI 모델에 국내에서 유일하게 포함되기도 했다. 엑사원 4.0은 복합적인 사고 능력이 요구되는 추론 영역에서 동급 글로벌 모델 중 가장 높은 성능을 기록했으며, 세계 지식, 코딩, 과학, 수학 등 다양한 분야에서 글로벌 모델들을 압도하는 성과를 보여주고 있다.
글로벌 AI 시장의 패러다임이 범용에서 특화로 변화하고 있는 지금, LG AI연구원의 엑사원은 한국이 나아갈 방향을 제시하는 이정표로 평가된다. LG AI연구원은 바로 내일인 22일 2년 만에 ‘LG AI 토크 콘서트’를 열며 새로운 혁신을 발표할 예정이다. 중요한 건 LG는 글로벌 트렌드에서 팔로워가 아닌 ‘퍼스트 무버’ 역할을 하고 있다는 점이다.