“서버에 안 올려도 지브리풍으로”... 사생활 침해 막는 AI 모델 개발

유재준 UNIST 교수팀, 초경량 연합학습 AI 개발

2025-04-09 구아현 기자

서경국 UNIST 연구원(제1저자), 유재준 UNIST 교수. /UNIST

국내 연구진이 민감 데이터를 서버로 직접 보내지 않고도 고품질 이미지 생성을 돕는 초경량 인공지능(AI) 모델을 개발했다. 환자 자기공명영상(MRI), 컴퓨터단층촬영(CT) 등 개인 정보 보호가 중요한 분야에서도 환자 정보 등을 보호할 때 적용할 수 있을 것으로 기대하고 있다.

UNIST(울산과학기술원) 인공지능대학원 유재준 교수팀은 연합학습 AI 모델인 프리즘(PRISM, PRivacy-preserving Improved Stochastic Masking)을 개발했다고 9일 밝혔다.

연합 학습은 민감 정보가 포함된 데이터를 직접 서버에 올리지 않고, 각 장치의 로컬AI가 학습을 수행한 뒤 그 결과만을 모아 하나의 ‘글로벌 AI’를 만드는 기술이다.

프리즘은 연합학습 과정에서 로컬 AI와 글로벌 AI를 연결하는 학습 중재자 역할의 AI 모델이다. 이 모델은 기존 모델보다 통신 비용을 평균 38% 줄이고, 그 크기는 48% 감소한 1-bit 수준의 초경량형이다. 스마트폰, 태블릿 PC 같은 소형 장비의 중앙처리장치(CPU)나 메모리에 부담 없이 작동한다.

로컬 AI마다 가진 데이터와 성능의 편차가 큰 상황에서도 어떤 로컬 AI의 정보를 더 믿고 반영할지를 정확하게 판단해 조율하기 때문에 최종 생성물의 품질이 높다.

‘셀카’를 지브리풍으로 바꿀 때 기존에는 사진을 서버에 올려야 해 개인정보 침해 우려가 있었다면, 프리즘을 이용하면 모든 처리가 스마트폰 안에서 이뤄져 사생활 침해를 막고 결과도 빠르게 받아볼 수 있는 것이다. 단, 스마트폰에서 이미지를 직접 생성하는 로컬 AI 모델 개발은 별도로 필요하다.

실제 AI 성능 검증에 쓰이는 데이터셋인 MNIST, FMNIST, CelebA, CIFAR10로 실험한 결과, 기존 방식보다 통신량은 적으면서도 이미지 생성 품질은 더 높게 나타났다. 특히 MNIST 데이터셋을 이용한 추가 실험에서 지브리풍 이미지를 생성하는 데 주로 쓰는 디퓨전 모델과의 호환성도 확인했다.

연구팀은 모든 정보를 공유하는 대용량 파라미터 방식 대신, 중요 정보만 선별해 공유하는 이진 마스크 방식을 적용해 통신 효율을 높였다. 또 생성 품질을 정밀하게 평가하는 손실 함수(MMD)와 각 로컬 AI의 기여도를 다르게 집계하는 전략(MADA)으로 데이터 편차와 학습 불안정성을 해소했다.

유재준 UNIST 교수는 “이미지뿐만 아니라, 텍스트 생성, 데이터 시뮬레이션, 자동 문서화 등 다양한 생성 AI 분야에 적용할 수 있다”며 “의료, 금융 등 민감 정보를 다루는 분야에서 효과적이고 안전한 솔루션이 될 것”이라고 말했다.