“서버에 안 올려도 지브리풍으로”... 사생활 침해 막는 AI 모델 개발
유재준 UNIST 교수팀, 초경량 연합학습 AI 개발
국내 연구진이 민감 데이터를 서버로 직접 보내지 않고도 고품질 이미지 생성을 돕는 초경량 인공지능(AI) 모델을 개발했다. 환자 자기공명영상(MRI), 컴퓨터단층촬영(CT) 등 개인 정보 보호가 중요한 분야에서도 환자 정보 등을 보호할 때 적용할 수 있을 것으로 기대하고 있다.
UNIST(울산과학기술원) 인공지능대학원 유재준 교수팀은 연합학습 AI 모델인 프리즘(PRISM, PRivacy-preserving Improved Stochastic Masking)을 개발했다고 9일 밝혔다.
연합 학습은 민감 정보가 포함된 데이터를 직접 서버에 올리지 않고, 각 장치의 로컬AI가 학습을 수행한 뒤 그 결과만을 모아 하나의 ‘글로벌 AI’를 만드는 기술이다.
프리즘은 연합학습 과정에서 로컬 AI와 글로벌 AI를 연결하는 학습 중재자 역할의 AI 모델이다. 이 모델은 기존 모델보다 통신 비용을 평균 38% 줄이고, 그 크기는 48% 감소한 1-bit 수준의 초경량형이다. 스마트폰, 태블릿 PC 같은 소형 장비의 중앙처리장치(CPU)나 메모리에 부담 없이 작동한다.
로컬 AI마다 가진 데이터와 성능의 편차가 큰 상황에서도 어떤 로컬 AI의 정보를 더 믿고 반영할지를 정확하게 판단해 조율하기 때문에 최종 생성물의 품질이 높다.
‘셀카’를 지브리풍으로 바꿀 때 기존에는 사진을 서버에 올려야 해 개인정보 침해 우려가 있었다면, 프리즘을 이용하면 모든 처리가 스마트폰 안에서 이뤄져 사생활 침해를 막고 결과도 빠르게 받아볼 수 있는 것이다. 단, 스마트폰에서 이미지를 직접 생성하는 로컬 AI 모델 개발은 별도로 필요하다.
실제 AI 성능 검증에 쓰이는 데이터셋인 MNIST, FMNIST, CelebA, CIFAR10로 실험한 결과, 기존 방식보다 통신량은 적으면서도 이미지 생성 품질은 더 높게 나타났다. 특히 MNIST 데이터셋을 이용한 추가 실험에서 지브리풍 이미지를 생성하는 데 주로 쓰는 디퓨전 모델과의 호환성도 확인했다.
연구팀은 모든 정보를 공유하는 대용량 파라미터 방식 대신, 중요 정보만 선별해 공유하는 이진 마스크 방식을 적용해 통신 효율을 높였다. 또 생성 품질을 정밀하게 평가하는 손실 함수(MMD)와 각 로컬 AI의 기여도를 다르게 집계하는 전략(MADA)으로 데이터 편차와 학습 불안정성을 해소했다.
유재준 UNIST 교수는 “이미지뿐만 아니라, 텍스트 생성, 데이터 시뮬레이션, 자동 문서화 등 다양한 생성 AI 분야에 적용할 수 있다”며 “의료, 금융 등 민감 정보를 다루는 분야에서 효과적이고 안전한 솔루션이 될 것”이라고 말했다.