챗GPT 그림 실력 폭풍 성장한 이유는? > 정책소식 | 정보모아
 
정책소식

챗GPT 그림 실력 폭풍 성장한 이유는?

작성자 정보

  • 공감 작성
  • 작성일

컨텐츠 정보

본문

btn_textview.gif



2024년까지만 해도 챗GPT는 ‘글로 대화하는 인공지능(AI)’이었다. 이제 ‘그림도 그리는 AI’로 진화했다. 최근 업데이트된 챗GPT(GPT-4o)의 이미지 생성기는 텍스트 기반의 명령어만으로도 실제와 구별하기 어려운 이미지를 만들어낼 뿐만 아니라 명령어를 잘 표현한다. ‘지브리풍’으로 알려진 그림이 온라인을 뒤덮고 있는 상황이 이를 잘 보여준다.
지브리풍은 일본의 유명 애니메이션 제작사 ‘스튜디오 지브리’의 독특한 화풍과 스타일을 모방한 것을 의미한다. 이러한 스타일은 스튜디오 지브리의 대표작인 ‘센과 치히로의 행방불명’, ‘이웃집 토토로’ 등에서 볼 수 있다.
인스타그램, X(옛 트위터), 카카오톡 등에는 AI가 만든 지브리 스타일의 프로필 사진이 넘쳐난다. 생성형 AI는 어떻게 그림을 그리고 최근 그림 실력이 급격히 좋아진 이유는 무엇일까? 이에 따른 저작권 논란은 어떤 방향으로 진행되고 있을까?

디퓨전 방식 넘어 자기회귀 방식 채택
사람이 그림을 그릴 때는 머릿속 상상을 종이에 선과 색으로 옮긴다. 반면 AI는 수학적 패턴을 사용한다. 먼저 AI는 수많은 이미지 데이터를 보면서 픽셀 배열을 학습한다. 픽셀은 0과 1로 이뤄진 만큼 이를 통해 특정한 ‘규칙’을 배운 뒤 사용자가 입력한 프롬프트를 픽셀로 전환, 그림으로 만들어준다. AI가 그린 사람의 손가락이 여섯 개이거나 혹은 오른손·왼손의 위치가 바뀌어서 기괴한 경우가 많았는데 이는 AI가 시각적 패턴만을 학습했기 때문이다. 하지만 최근 AI가 달라졌다. 학습 데이터가 많아졌을 뿐 아니라 ‘주석’이 포함된 데이터도 학습이 가능해졌다. 즉 ‘사람 손에는 다섯 개의 손가락이 있다’와 같은 개념까지 학습해 그리기에 적용할 수 있게 된 것이다.
그 위에 ‘디퓨전 모델’이 적용된다. 이는 잡음이 가득한 이미지에서 시작해 단계별로 노이즈를 제거하며 점차 형태와 색을 잡아가는 방식이다. AI에 이미지를 그리라고 명령하면 흐릿한 이미지로 시작해 점점 구체적으로 변하는 모습을 볼 수 있는데 디퓨전 모델이 작동하고 있음을 보여준다.
GPT-4o의 경우 기존의 확산(디퓨전) 방식에서 더 나아가 ‘자기회귀 방식(Autoregressive)’을 채택했다. 이는 글을 쓸 때처럼 그림을 한 부분씩 순차적으로 그려가는 방식이다. 시간은 오래 걸리지만 사용자의 지시를 놓치지 않고 세밀하게 반영할 수 있다는 장점이 있다. 무엇보다 이미지 생성기가 챗GPT 내부에 직접 통합됐다는 점도 주목할 만하다. 기존에는 그림을 그리는 AI와 대화하는 AI가 따로 있었지만 이제는 하나의 AI가 둘을 모두 해낸다. 이로 인해 사용자와 대화를 나누며 더 자연스럽고 정교한 그림을 그릴 수 있게 됐다.

실사에 가까워질수록 커지는 저작권 논란
AI가 만들어내는 이미지가 실사에 가까워질수록 법적·윤리적 논란도 커지고 있다. 특히 최근 유행 중인 지브리풍 그림은 상업적 활용 가능성과 함께 저작권 문제를 불러일으키고 있다. 일반적으로 화풍이나 스타일 자체는 저작권으로 보호받기 어렵다. 저작권은 구체적인 ‘창작물’을 보호하는 만큼 어떤 작가의 스타일을 모방했다 하더라도 그 결과물이 완전히 새로운 작품이라면 저작권 침해로 보기 힘들다. 스튜디오 지브리가 일반인들의 사진을 ‘지브리풍’으로 바꿔주는 별도의 사업을 하고 있지 않았던 만큼 챗GPT를 대상으로 “너희들의 기술로 내가 피해를 봤다”는 주장이 성립하기도 어렵다.
다만 저작권으로는 인정받지 못할 수 있지만 특정 화풍이 널리 알려져 있고 소비자가 이를 브랜드처럼 인식한다면 트레이드 드레스로 보호받을 가능성도 있다. 트레이드 드레스는 상품의 전체적인 ‘외관’이나 ‘느낌’을 의미한다. 애플 제품의 디자인이나 스타벅스의 인테리어처럼 소비자가 특정 브랜드와 연결 짓는 고유한 외형이 이에 해당한다. 어떤 작가의 화풍이 독자적이고 널리 알려져 있다면 이를 트레이드 드레스로 주장할 여지가 있을 수 있다.
전문가들은 이 같은 ‘모호한 영역’이 향후 법정에서 어떻게 해석되는가에 따라 AI 이미지 산업의 방향도 달라질 수 있다고 이야기한다.
이미 글로벌 AI 기업을 상대로 한 저작권 관련 소송도 여럿 진행 중이다. 작가 안데르센은 2023년 이미지 생성 AI 기업 ‘스테빌리티 AI’를 상대로 소송을 제기했다. 자신의 이름만으로도 화풍이 재현됐다는 이유에서다. 게티이미지는 자사 워터마크가 포함된 이미지가 AI 생성물에서 발견되자 스테빌리티 AI를 상대로 17억 달러 규모의 손해배상 소송을 제기하기도 했다. 소송은 현재 진행 중이다.
AI 이미지가 원작과 ‘실질적 유사성’을 갖는 경우에만 저작권 침해로 인정되는데 수백만 장의 이미지가 무단으로 학습됐는지 확인하기란 쉽지 않다. 이에 따라 ‘AI 학습의 투명성 확보’가 향후 핵심 쟁점으로 떠오를 전망이다.
챗GPT의 이미지 생성 기술은 ‘누구나 사용할 수 있는 시대’를 앞당겼다. 누구나 휴대전화에서 AI에 그림을 그려달라고 명령하는 시대가 됐다. 그러나 기술의 발전은 새로운 책임도 동반한다. 누구의 작품을 어디까지 따라 할 수 있을까? AI 시대의 창작과 표절의 경계는 여전히 흐릿하다.

원호섭
과학이 좋아 마블 영화를 챙겨보는 공대 졸업한 기자. ‘과학 그거 어디에 써먹나요’, ‘10대가 알아야 할 미래기술10’ 등을 썼다.


[자료제공 :icon_logo.gif(www.korea.kr)]

관련자료

댓글 0
등록된 댓글이 없습니다.
YouTube Video Preview

최근글


  • 글이 없습니다.

새댓글


  • 댓글이 없습니다.
알림 0