최종편집:2025-11-26 07:49 (수)
실시간
[단독] 韓 AI 안전연구소 첫 안전성 검증 해외 모델은 ‘챗GPT’

[단독] 韓 AI 안전연구소 첫 안전성 검증 해외 모델은 ‘챗GPT’

  • 기자명 구아현 기자
  • 입력 2025.02.19 15:37
  • 수정 2025.02.19 23:13
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

파리 AI 정상회의서 오픈AI ·영국 AI 보안연구소와 협력 논의
오픈AI 최초 법적 구속력 있는 평가 받게 돼
英 연구소, 평가 노하우, 인력 교류 업무 협약 합의

김명주 AI 안전연구소장(왼쪽에서 두 번째)과 AI안전연구소 실무진들이 오픈AI 법무 및 기술평가팀과 프랑스 파리에서 열린 AI 행동 정상회의에서  만나 AI 모델 안전성 평가에 대한 논의를 하고 기념 사진을 찍고 있다. /AI 안전연구소
김명주 AI 안전연구소장(왼쪽에서 두 번째)과 AI안전연구소 실무진들이 오픈AI 법무 및 기술평가팀과 프랑스 파리에서 열린 AI 행동 정상회의에서  만나 AI 모델 안전성 평가에 대한 논의를 하고 기념 사진을 찍고 있다. /AI 안전연구소

국내 AI 안전연구소가 ‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안(AI 기본법)’을 근거로 실시하는 첫 안전성 검증 모델이 오픈AI의 챗GPT가 될 예정이다. 이번 검증은 유럽연합(EU) AI법(AI Act)보다 먼저 내년 1월 포괄적으로 시행되는 AI 기본법에 따른 것으로 오픈AI가 최초로 법적 구속력이 있는 평가를 받게 된다는 점에서 의미가 크다.

19일 THE AI 취재 결과 최근 프랑스에서 열린 AI 행동 정상회의에서 국내 AI 안전연구소 실무진들과 오픈AI 실무진이 만나 ‘AI 기본법’을 바탕으로 평가받는 안전성 테스트를 위한 협력에 대해 논의한 것으로 파악됐다. 오픈AI 측은 “한국의 평가 기준이 국제표준으로 자리 잡을 수 있도록 적극 협력하겠다”는 견해를 밝혔다.

연구소는 오픈AI 모델 검증을 해본 영국 AI 보안연구소(전 AI 안전연구소)와도 이번 검증을 위해 협력한다. 영국은 미국의 AI 안전연구소와 협력해 오픈AI와 앤트로픽의 AI 최신 모델을 검증한 경험이 있다. 영국 AI 보안연구소는 이러한 검증 경험과 비결을 한국 AI 안전연구소와 공유하고 인력 교환 등을 통해 협력하기로 했다. 한·영 연구소는 파리 AI 정상회의에서 챗GPT 안전성 테스트를 위한 업무협약을 즉각 추진하기로 합의했다.

김명주 AI안전연구소장은 THE AI와의 통화에서 “현재 오픈AI와 협력을 논의 중이며, 국내 기업 1곳과 해외 기업 1곳을 선정해 평가를 시작할 예정”이라며 “모델 내부 구조를 면밀히 검토해야 하기 때문에 기업과 협력이 필수적”이라고 말했다. 이어 “이번 파리 AI 정상회의에서 오픈AI 실무진들과 협력에 대해 긍적적인 합의를 했다”며 “앞서 평가를 해본 영국 AI 보안 연구소와 먼저 MOU를 체결해 협력을 하기로 했다”고 덧붙였다.

AI 안전연구소는 국내 기업들과도 유사한 협력 체계를 구축할 예정이다. LG AI 연구원 또는 네이버가 개발한 최신 AI 모델 중 한 모델을 검증할 것으로 계획하고 있다.

다만 현재 AI 기본법 하위 법령이 마련되지 않은 상태다. 하위 법령은 구체적인 평가 가이드라인을 제시하는 역할을 하기 때문에 연구소는 하위 법령 제정에 따른 글로벌 스탠다드에 부합하는 평가 체계 구축을 동시에 진행할 방침이다. 김명주 소장은 “하위 법령이 마련되는 대로 구체적인 평가 가이드라인인 ‘실행 규범(Code Practice)’을 마련하고 이를 바탕으로 본격적인 평가 작업에 착수할 계획”이라고 설명했다.

AI 안전연구소는 영국과 미국에서 개발한 AI 검증 도구를 활용할 계획이다. 대표적으로 영국AI 보안 연구소에서 개발한 인스펙트(Inspect)와 미국 AI 안전연구소에서 개발한 디오프트라(Dioptra)가 있다. 김 소장은 “AI 기본법에 따른 첫 평가인 만큼 글로벌 스탠다드를 고려한 객관적이고 신뢰성 있는 평가가 이뤄질 수 있도록 최선을 다하겠다”고 말했다.

저작권자 © THE AI 무단전재 및 재배포 금지
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전