비결은 ‘학습’과 ‘확률’ 인간 데이터 학습 높은 확률순으로 단어 나열 > 정책소식 | 정보모아
 
정책소식

비결은 ‘학습’과 ‘확률’ 인간 데이터 학습 높은 확률순으로 단어 나열

작성자 정보

  • 공감 작성
  • 작성일

컨텐츠 정보

본문

btn_textview.gif



챗GPT는 어떻게 똑똑해질까?
2022년 11월 30일 미국 샌프란시스코의 한 스타트업이 웹사이트를 열었다. 이름은 ‘챗GPT’. 불과 5일 만에 사용자는 100만 명을 넘어섰고 2개월 뒤에는 전 세계에서 1억 명이 사용하는 플랫폼으로 성장했다. 페이스북(메타), 트위터(X)를 비롯해 그 어떤 플랫폼도 이보다 빠른 사용자를 확보한 적은 없었다. 말 그대로 세계 신기록. 누구도 예상치 못했던 일이었다. 챗GPT를 개발한 스타트업 오픈AI는 단숨에 전 세계에서 가장 영향력 있는 기업으로 떠올랐고 오픈AI에 수십조 원의 천문학적인 돈을 투자하며 ‘함께 가자’를 외친 마이크로소프트(MS) 역시 빌 게이츠 없이 제2의 전성기를 누리는 중이다.
생성형 인공지능(AI)이란 데이터를 학습해 새로운 콘텐츠를 만드는 AI를 의미한다. 챗GPT와 같은 생성형 AI는 마치 챗봇처럼 사용자가 ‘텍스트’로 질문을 넣으면 이에 ‘텍스트’로 답을 하는 방식으로 서비스를 제공한다. 현재 생성형 AI는 텍스트는 물론 음성 대화도 가능할 뿐 아니라 그림, 동영상, 음악 등 다양한 콘텐츠를 생성해내는 수준으로 발전했다. 방대한 자료를 요약해주기도 하고 코드를 짜고 번역을 하는 등 사람이 해야만 했던 다양한 일을 몇 초 만에 해내는 능력을 보여주면서 여러 기업이 이를 실제 업무에 적용하고 있다. 심지어 자료를 넣으면 기사도 써준다.
AI가 특정 분야에서만 쓰이던 도구에서 모두를 위한 수단으로 탈바꿈하면서 챗GPT는 인류 사회에 ‘AI혁명’, ‘AI쇼크’는 물론 ‘디지털 코페르니쿠스적 전환’과 같은 변화를 일으켰다. 2016년 ‘알파고’가 이세돌 9단을 이기면서 불어닥쳤던 ‘AI쇼크’가 채 1년을 넘기지 못했던 것과 대조적으로 2년 넘게 AI혁명이 이어지고 있는 이유이기도 하다.

무한히 발전하는 생성형 AI
생성형 AI가 가진 막강한 능력 때문에 챗GPT가 등장하고 불과 반년 만에 여러 기업이 생성형 AI 기반의 비슷한 서비스를 내놓기 시작했다. 오픈AI 개발자들이 설립한 앤스로픽은 2023년 3월 ‘클로드’라는 서비스를 출시했으며 4월에는 메타가 ‘라마3’를 선보이며 생성형 AI 경쟁에 뛰어들었다. 이어 구글의 ‘바드(현 제미나이)’와 네이버의 ‘하이퍼클로바’를 비롯해 일론 머스크 테슬라 최고경영자(CEO)가 만든 AI기업, xAI의 ‘그록’이 잇따라 출시됐다.
생성형 AI가 이처럼 막강한 힘을 발휘할 수 있는 원인으로 2017년 구글 개발자들이 발표한 논문 ‘Attention Is All You Need(어텐션이면 다 해결된다)’를 꼽을 수 있다. 이전까지 인간의 언어를 처리하는 AI의 한계는 명확했다. 인간이 만든 방대한 데이터를 일일이 읽고 분석하는 데 많은 자원이 소모됐다는 점이다. 이 논문은 이를 ‘확률’로 해결하는 법을 제시한다. 즉 문장 내에서 중요한 단어나 구절에 더 많은 ‘집중(Attention)’을 통해 AI 능력을 극대화한 것이다.
이 과정에서 필요한 것은 바로 학습 ‘데이터’이다. AI는 데이터를 분석해 패턴과 규칙을 찾아내고 이 규칙 안에서 사용자가 하는 질문에 대한 답을 만들어낸다. 그리고 이 규칙은 ‘확률’을 기반으로 한다. 예를 들어 “백설공주가 먹은 사과는 어떤 사과야?”라는 질문을 생성형 AI에게 하면 AI는 자신이 학습한 데이터 중에서 ‘백설공주’, ‘사과’를 찾아내고 이와 함께 확률적으로 ‘독 사과’가 많이 발견된다는 사실을 파악한다. 이를 근거로 사용자에게 “백설공주가 먹은 사과는 독 사과입니다”라는 답을 만들어줄 수 있다. 즉 AI가 얼마나 많은 데이터를 학습했느냐에 따라 내놓는 답의 수준이 달라지는 만큼 생성형 AI 서비스를 내놓은 기업들은 어떻게든 많은 학습 데이터를 확보하기 위해 애쓰고 있다.
텍스트를 생성할 때 AI는 각 단어가 다음 단어와 어떤 관계가 있는지를 계산하는데 이 계산은 수백 만에서 수십 억 번 반복된다. 이러한 엄청난 연산에 쓰이는 ‘하드웨어’가 바로 엔비디아가 만든 그래픽처리장치(GPU)다. 단순 계산으로 그래픽을 자연스럽게 만들어주던 GPU는 어느덧 AI 서비스에서 빠질 수 없는 장비로 부상했고 빅테크 기업들은 더 나은 서비스를 제공하기 위해 GPU 확보에 열을 올리고 있다. 생성형 AI가 주목받은 뒤 엔비디아가 ‘갓비디아’라는 별명을 얻게 된 이유기도 하다.

AI와 조화롭게 공존하려면
물론 생성형 AI가 ‘만능’은 아니다. 나아졌다고는 하지만 여전히 잘못된 정보를 만들어내는 ‘환각(Hallucination)’ 증상은 쉽게 찾을 수 있고 창의성을 발휘해 답을 내놓아야 하는 ‘수학’ 문제에서도 인간 수준의 지적능력을 보여주고 있지 않다. 인간이 만든 데이터가 편향돼 있을 수밖에 없는 만큼 이를 학습한 AI 역시 이를 그대로 보여준다. AI가 학습 과정에서 윤리적 판단을 내릴 수 없기 때문이다. 생성형 AI 기술 발달과 함께 불거진 가짜뉴스, 페이크 이미지(동영상) 확산에 따른 사회적 문제도 해결해야 하는 과제로 남아있다.
생성형 AI는 기계가 인간의 언어를 이해하고 생성하는 능력이 얼마나 발전했는지를 보여주는 이정표로 자리 잡았다. 개인, 기업 할 것 없이 이러한 AI를 도입하고 있는 만큼 단점은 최소화하고 장점은 극대화하면서 어떻게 인류 발전에 이바지할 수 있는지 찾아나가는 지혜가 필요하다. AI는 결국 인간이 만든 도구인 만큼 마블 영화의 든든한 조력자 ‘자비스’가 될지, 위협적인 존재인 ‘울트론’이 될지 전적으로 우리의 선택에 달려 있다.

원호섭
과학이 좋아 마블 영화를 챙겨보는 공대 졸업한 기자. ‘과학 그거 어디에 써먹나요’, ‘10대가 알아야 할 미래기술10’ 등을 썼다.


[자료제공 :icon_logo.gif(www.korea.kr)]

관련자료

댓글 0
등록된 댓글이 없습니다.

최근글


  • 글이 없습니다.

새댓글


  • 댓글이 없습니다.
알림 0