최종편집:2025-11-26 07:49 (수)
실시간
다시 불거진 생성형 AI 개발 저작권 문제

다시 불거진 생성형 AI 개발 저작권 문제

  • 기자명 구아현 기자
  • 입력 2023.12.29 12:49
  • 수정 2023.12.29 14:35
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

NYT, MS·오픈 AI 상대 수십억 저작권 침해 소송
국내 AI 업계, 기관별 가이드라인…"어떤 장단에 맞춰야 하나”

미국 일간 뉴욕타임스(이하 NYT)가 27일(현지시각) 마이크로소프트(MS)와 오픈AI를 상대로 저작권 침해 소송을 제기하면서 AI 개발에서 발생하는 저작권 문제가 다시 화두로 올랐다. /픽사베이
미국 일간 뉴욕타임스(이하 NYT)가 27일(현지시각) 마이크로소프트(MS)와 오픈AI를 상대로 저작권 침해 소송을 제기하면서 AI 개발에서 발생하는 저작권 문제가 다시 화두로 올랐다. /픽사베이

생성형 인공지능(AI) 개발에서 저작권 문제가 불거지면서 언론사와 AI 기업들의 싸움이 시작됐다. 언론사는 자사의 뉴스 콘텐츠가 생성형 AI 학습에 무단으로 사용되면 웹 트래픽 감소를 가져와 광고에서 엄청난 손해를 보고 있다고 비난한다. 반면 생성형 AI 개발 업체는 인터넷을 통해 접근할 수 있는 출판물에 대한 ‘공정이용’ 조항을 내세우며 저작물을 AI 훈련에 사용할 수 있다고 주장하고 있다.

◇ NYT, MS·오픈 AI 상대 수십억 저작권 침해 소송

미국 일간 뉴욕타임스(이하 NYT)가 마이크로소프트(MS)와 오픈AI를 상대로 저작권 침해 소송을 제기하면서 AI 개발에서 발생하는 저작권 문제가 다시 화두로 올랐다. 27일(현지시각) 월스트리트저널(WSJ)·로이터통신 등 주요 외신에 따르면 NYT는 두 회사가 AI 챗봇 훈련 과정에서 자사의 뉴스 콘텐츠를 무단으로 사용해 저작권을 침해했다고 밝혔다.

NYT는 뉴욕 남부연방지방법원에 제출한 소장에서 “자사의 수백만 건의 기사가 챗GPT, ‘코파일럿’ 등 AI 챗봇 훈련에 무단으로 사용돼 수십억 달러를 손해 봤다”고 밝혔다. 이어 모든 훈련 데이터를 폐기하고 불법 사용과 복제에 관해 수십억 달러의 손해배상과 보상을 요구했다.

그러면서 지난 4월 MS와 오픈AI에 이러한 문제점을 제기하고 생성형 AI 제품에 관해 원만한 해결을 모색했지만 이를 해결하지 못했다고 밝혔다. 또 NYT의 독자나 트래픽뿐만 아니라 광고와 구독 수익도 빼앗아 갔다고 했다. 사용자가 챗봇에 응답에 만족해 광고와 수익으로 이어질 수 있는 NYT 웹사이트 방문이 줄어들 수 있다는 것이다.

또 그동안 AI 개발사가 주장해 온 ‘공정이용’ 조항은 AI챗봇이 자사의 뉴스 기사를 그대로 옮겨 제공할 수 있으므로 적용되지 않는다고 반박했다. 또 생성형 AI가 잘못된 정보를 제공하는 등 문제점으로 꼽히는 할루시네이션(환각)도 언론사 이미지를 실추시킬 수 있다고 지적했다.

◇ 저작권 소송과 협상 이슈

AI 훈련과정에서 생기는 저작권 문제에 대비하기 위해 언론사와 협력하는 사례도 늘고 있다. 오픈 AI는 지난 7월 AP 통신과 라이선스 계약을 체결했고, 지역 언론을 지원하는 아메리칸 저널리즘 프로젝트와 500만 달러 계약을 체결했다. 또 이달 독일 기반 다국적 미디어 그룹인 악셀슈프링어와 뉴스 사용료 지급 계약도 맺었다.

애플도 AI에 뉴스 콘텐츠를 활용하기 위해 지난 22일(현지시각) 언론·출판사들과 협상에 나섰다. 뉴스 이용을 위해 5000만 달러(한화 약 651억원)의 이용료를 제시하고 다년간 계약을 논의한 바 있다. 아직 해당 협상에 대한 최종 상황이 공개되진 않았다. 이번 NYT 소송은 미국 주요 언론사가 AI 개발사를 고소한 첫 사례가 됐다.

저작권 이슈는 오픈 AI 등 생성형 AI 공급사가 LLM 학습에 대한 데이터를 공개하지 않으면서 불거진 바 있다. 지난 7월 구글 바드는 AI 훈련을 위해 사용자 수억 명의 데이터를 동의 없이 수집해 소송을 당했다. 또 지난 7월 배우 사라 실버맨은 자신의 회고록을 AI 개발에 무단 활용했다며 메타(Meta)와 OpenAI를 소송했다. 조나단 프랜즌, 존 그리샴, 테일러 브랜치 등 주요 작가들도 오픈 AI 등을 상대로 소송을 진행하고 있다.

◇ 생성형 AI 정부 저작권 가이드라인 내놔…산업계 “현실 맞지 않아” “기관별 내놓는 가이드라인…어떤 장단에 맞춰야 하나” 혼란

국내도 저작권 문제에 대한 논란에 생성형 AI 학습에 대한 정부의 가이드라인이 처음 발표됐다. 문화체육관광부는 27일 저작권 정책 비전과 과제를 담은 ‘저작권 강국 실현, 4대 전략’ 발표를 통해 이런 내용이 담긴 ‘생성형 AI 저작권 안내서’를 공개했다. AI 학습에 대한 적절한 보상을 해야 한다는 게 골자다.

이 가이드라인에 따르면 AI가 만든 창작물은 저작권으로 인정하지 않기로 했다. AI 사업자는 적법한 이용권한을 확보할 필요가 있고 서비스 제공 시 기존 저작물과 동일하거나 유사한 AI 결과물이 도출되지 않도록 노력해야 한다고 명시돼 있다. AI 산출물에서 텍스트, 이미지, 음성 등 저작권 침해 요소가 없도록 유의해야 한다고 했다. 또 학습용 데이터로 복제된 데이터를 보관하거나 다른 목적으로 이용할 경우 이용 목적과 범위 기간 등을 명시하도록 했다.

반면 AI업계는 이에 대해 반발했다. 한국소프트웨어산업협회(KOSA) 산하의 초거대AI추진협의회는 이번 가이드라인에 대해 “학습 데이터에 대해 적법한 권한을 확보할 것을 권고한다”는 문구를 삭제해야 한다고 지적했다. 이는 AI 개발에 따른 방대한 데이터의 이용 목적과 기간, 대가 등 건건이 협의하고 계약해야 한다는 의미로 풀이될 수 있다는 게 협의회의 설명이다. 글로벌 빅테크 기업의 기술 경쟁에서 국내 기업이 뒤처질 수 밖에 없다는 입장이다.

더불어 비슷한 골자로 기관마다 따로 발표하는 AI 개발 가이드라인에 업계는 혼란스러워하고 있다. 문화체육관광부(생성형AI 가이드라인), 과학기술정보통신부(AI 학습용 데이터 품질관리가이드라인), 개인정보보호위원회(AI 개인정보 가이드라인), 방송통신위원회(AI윤리가이드북), 국가정보원(챗GTP 가이드라인) 등 각각 AI 개발에 대한 윤리를 담고 있는 가이드라인을 내놓고 있다. 방송통신위원회는 한국지능정보사회진흥원(NIA)도 AI 윤리 가이드북을 발간했다고 28일 밝혔다.

업계 관계자는 “기관에서 AI 윤리 가이드라인, 생성형 AI 가이드라인 등을 연이어 각각 내놓고 있다”며 “기업들은 어느 장단에 맞춰야 할지 모르겠다”고 혼란스러워했다. 이어 “기관들이 각각 가이드라인을 내놓는 상황에서 비슷한 지침이 너무 많다”며 “협의해 하나의 가이드라인을 구축해야 혼란을 막을 수 있을 것”이라고 제언했다.

저작권자 © THE AI 무단전재 및 재배포 금지
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전