“AI 강국으로 가는 길 핵심 키워드는 슈퍼컴퓨터 확보” > 정책소식 | 정보모아
 
정책소식

“AI 강국으로 가는 길 핵심 키워드는 슈퍼컴퓨터 확보”

작성자 정보

  • 공감 작성
  • 작성일

컨텐츠 정보

본문

btn_textview.gif



한국과학기술정보연구원
홍태영 슈퍼컴퓨팅인프라센터장
인공지능(AI) 3대 강국을 달성하기 위해 선행돼야 하는 것은 핵심 인프라인 그래픽처리장치(GPU)를 확보하는 일이다. 컴퓨터의 그래픽을 향상시킬 목적으로 개발된 GPU는 병렬 연산이 가능해 한 번에 수많은 데이터를 처리할 수 있다는 점에서 AI 연산을 할 때 중앙처리장치(CPU) 대신 쓰인다.
문제는 GPU를 확보하는 일이 점점 더 어려워지고 있다는 점이다. 최근 각광 받는 GPU는 GPU를 독점하다시피 제작하고 있는 엔비디아가 2022년 AI 및 고성능 컴퓨팅용으로 개발한 ‘H100’이다. 소프트웨어정책연구소(SPRi)가 진행한 2023년 인공지능산업실태조사 결과를 보면 2023년 말을 기준으로 국내에 확보된 H100은 1961장이다. 현재도 이 같은 수치가 크게 변하지 않은 것으로 알려져 있다. 그런데 일반적으로 글로벌 AI 기업들이 AI 모델을 개발하는 데 H100을 1만 6000장 이상 사용하는 것으로 추측된다. 국내에 확보된 2000여 장의 GPU는 AI 모델 하나 개발하기에도 부족한 수치다.
그래서 정부는 GPU 확보를 AI 시대 개막의 핵심 키워드로 꼽고 있다. 이재명 대통령은 취임 후 첫 지방 공식 일정으로 6월 20일 울산 AI 데이터센터 출범식에 참석해 AI 인프라 확충의 의지를 나타냈다. 류제명 과학기술정보통신부 2차관은 6월 30일 취임사를 통해 “AI 고속도로의 핵심인 GPU를 확충하겠다”고 밝히기도 했다.
지난 2월 20일 정부가 발표한 ‘AI컴퓨팅 인프라 확충을 통한 국가AI역량 강화방안’에 따르면 정부는 2026년 상반기까지 GPU 1만 8000장을 확보할 것으로 예상하고 있다. 2025년 내로 민·관 협력을 통해 1만 장의 GPU를 확보하고 나머지 8000장은 슈퍼컴 6호기를 통해 확보한다는 계획이다.
이와 관련해 과기정통부는 5월 13일 브리핑을 열고 국가 슈퍼컴 6호기가 2026년 상반기에 구축될 것이라고 발표했다. 5월 12일 한국과학기술정보연구원(KISTI)과 휴렛팩커드(HPE) 간 5년간 유지·보수를 포함한 계약을 체결한 것이다. HPE는 세계 1위 슈퍼컴퓨터인 ‘엘 캐피탄’을 비롯해 106개의 슈퍼컴퓨터를 운용하는 글로벌 정보기술(IT) 기업이다.
이전까지 슈퍼컴퓨터가 CPU를 주로 탑재하고 있던 것과 달리 이번 슈퍼컴 6호기는 약 8500장의 최신 GPU를 탑재할 예정이다. 도입되면 세계 10위권 슈퍼컴퓨터에 등재될 것으로 보이는데 인프라 부족 현상을 겪고 있던 AI 산업계에 숨통이 틔일 것이라는 평가다. 특히 확보될 GPU 상당수가 민간 부문에서 활용될 것으로 보여 공공 부문에서 활약할 슈퍼컴 6호기의 도입에 이목이 집중되고 있다.
국가 슈퍼컴퓨터를 운영하는 곳은 대전에 있는 KISTI다. 이곳에서 홍태영 슈퍼컴퓨팅인프라센터장이 슈퍼컴퓨터 구축과 운영 업무를 담당하고 있다. 홍 센터장을 찾아 슈퍼컴 6호기는 어떤 성능을 갖추게 되며 어떻게 활용될 것으로 전망하는지 이야기를 들었다.



슈퍼컴퓨터는 무엇이며 왜 필요한가?
슈퍼컴퓨터란 보통 연산처리 속도가 세계 500위 이내에 드는 컴퓨터를 말한다. 연산 속도가 매우 빠르고 자료를 오래 처리할 수 있다는 장점이 있다. 거대 계산이 필요한 연구개발(R&D) 등에서는 필수적인 인프라다.

슈퍼컴 6호기는 왜 도입되는가?
현재 공공 부문에서 공동 활용이 가능한 GPU가 많이 부족하다. 2017년 슈퍼컴 5호기 ‘누리온’ 도입 때 CPU 기반의 시스템이 선정됐다. 당시 GPU 생태계가 충분히 갖춰지지 않았고 CPU 대비 가격 경쟁력도 떨어지는 편이었기 때문이다. 그래서 누리온은 CPU 중심으로 구축됐고 2019년에 이를 보완해 중소형 GPU 시스템 ‘뉴론’을 구축했다.
그런데 그 사이 AI 생태계가 기하급수적으로 확장했고 GPU 수요도 급증했다. 예를 들어 요즘 과학기술 R&D 분야에서는 AI 기반 연구가 큰 폭으로 늘고 있다. 거기다 GPU는 AI와 시뮬레이션, 데이터 분석을 동시에 할 수 있다. CPU 대비 공간과 전력, 가격 대비 성능 효율성도 훨씬 뛰어나기 때문에 GPU 기반 슈퍼컴퓨터가 필요해진 것이다.

슈퍼컴 6호기는 어떤 성능을 갖추게 될까?
컴퓨터의 성능은 플롭스(Flops)라는 단위로 나타내는데 1페타플롭스(PF)는 1초당 1000조 번 연산할 수 있는 성능을 가리킨다. 슈퍼컴 6호기는 600페타플롭스급 연산 능력을 갖추게 된다. 최신 노트북의 10억 배 이상 성능이다. 또 200페타바이트(PB) 이상의 저장 공간, 400Gbps 이상의 초고속 연결망 성능을 갖출 예정이다. GPU는 엔비디아의 GH200 8336장과 H200 160장이 탑재된다.

국내 AI 생태계에 어떤 영향을 끼칠까?
무엇보다 부족한 GPU 인프라를 구축한다는 의미가 크다. AI 연구가 본격화되면서 CPU만으로는 부족했다. 앞으로는 기초과학 분야뿐 아니라 생성형 AI나 자율주행, 기후변화 예측 모델과 같은 분야에서 성능 좋은 슈퍼컴퓨터가 큰 역할을 할 것이라 생각한다.

이런 구성을 통해 어떤 효과를 낼 수 있나?
슈퍼컴 6호기는 AI 시대에 적합한 슈퍼컴퓨터다. AI 학습·추론과 과학·공학 시뮬레이션 작업에 효율적으로 설계됐다고 볼 수 있다. 거대 AI 모델 연구를 비롯한 대규모 계산에 효과적으로 활용할 수 있다.

연구자들이 많이 사용할 것 같은데?
현재 슈퍼컴 5호기도 대학 및 연구기관에서 많이 사용한다. 슈퍼컴퓨터 서비스 현황판을 보자. 슈퍼컴퓨터 단위는 노드인데 노드마다 하나 또는 두 개의 고성능 CPU가 장착돼 있다. 슈퍼컴 5호기의 8400개 노드 사용률은 6월 25일 현재 93% 정도 된다. 대학에서 3800개 정도의 노드를 사용하고 있고 정부출연연구소를 포함한 연구소에서 3600개 정도 쓰고 있다. 이 숫자는 상황에 따라 매일 바뀌는데 지난 6년 동안 평균 사용률은 80%다.

사용자들은 슈퍼컴을 무료로 사용하는 것인가?
국가 슈퍼컴퓨터이기 때문에 가능한 일인데 상당수의 사용자들은 무료로 이용한다. 무료로 이용하기 위해서는 연구계획서를 제출해야 하고 연구성과도 공개하는 것이 원칙이다. 다만 비공개 연구를 수행하는 산업체 연구자 등은 원가 수준으로 책정된 요금을 내고 사용할 수 있다. 국내 모든 연구자와 개발자가 사용할 수 있지만 연구계획서를 검토하고 자원 상황을 감안해서 배분한다. 현재는 1000개 정도의 사용자가 계산 작업을 하고 있고 5000개 정도의 작업이 대기 중이라고 나온다.

대기가 꽤 많다. KISTI 외에도 슈퍼컴퓨터를 운용하는 곳은 여러 곳이지 않나?
기업에서 운용하는 슈퍼컴퓨터는 아무래도 기업 내 목적에 맞게 사용될 것이다. 국내 대학에서 슈퍼컴퓨터를 운용하는 곳도 여럿 있는데 그 규모가 크지 않다. 그러다보니 공공 부문에서 KISTI 슈퍼컴퓨터와 같이 무상으로 자원을 제공하는 곳이 필요하다. 외국에서도 손꼽히는 슈퍼컴퓨터는 공공기관에서 운용하고 있다. 세계 1, 2위인 슈퍼컴퓨터 엘 캐피탄과 프런티어는 미국 로렌스 리버모어 국립연구소와 오크리지 국립연구소에서 운용하고 있고 독일, 일본, 프랑스, 스위스, 핀란드 등도 국립 연구소에서 세계적 슈퍼컴퓨터를 운용하고 있다.

슈퍼컴퓨터 확보는 국가 간 경쟁력 문제인 것 같다.
그렇다. 기존 슈퍼컴퓨터를 업그레이드해 6호기를 구축하려는 이유도 과학기술 분야의 국가경쟁력과 관련이 있다. AI를 활용하려는 개별 연구자들이 한 장에 4000만 원이 넘는 GPU를 구매하는 것은 너무 부담이 크다. 곳곳에서 AI가 활용되고 있는데 인프라가 제한되면 연구의 범위와 질적 수준도 제한된다. 하지만 공공재로 제공되는 최신 국가 슈퍼컴퓨터를 활용할 수 있다면 제한도 줄어들 것이다. 슈퍼컴 6호기는 세계 10위권의 성능을 가질 것으로 예측되는데 세계적인 수준의 연구결과가 많이 나올 수 있도록 적극 지원할 것이다.

슈퍼컴퓨터 구축에 어려운 점은 없나?
국가슈퍼컴퓨팅센터는 1988년부터 슈퍼컴퓨터를 운용해왔기 때문에 오랜 기간 축적된 노하우를 가지고 있다. 슈퍼컴퓨터를 구성하는 주요 요소를 보면 수백, 수천의 컴퓨팅 노드와 고속 네트워크, 그리고 고대역폭의 병렬 파일시스템이다. 전체 시스템이 하나의 머신처럼 동작하기 위해서는 수천, 수만 개로 이뤄진 고성능 CPU·GPU, 메모리, 네트워크 카드·스위치·케이블, 스토리지 디스크·컨트롤러 등이 모두 최적의 성능 상태를 일정하게 유지해야 한다. 이를 위해서는 주요 부품의 발열이나 고장, 일시적인 성능 저하 등을 사전에 방지할 수 있는 노하우가 필수적이다. 이런 운용 노하우가 쌓여 있기 때문에 슈퍼컴 6호기도 원활하게 운용할 수 있을 것으로 자신한다.

김효정 기자

‘인공지능+과학기술’ 활성화 방안
AI 기술이 신약 등 인류 난제 해결할 수 있게!
정부는 3월 12일 ‘인공지능+과학기술 활성화 방안’을 통해 전 세계적인 인공지능(AI) 중심 연구개발(R&D) 체계 전환에 대응해 국내 과학기술 전반에도 AI 활용을 확산하겠다고 밝혔다. 특히 차세대 신소재, 혁신 신약, 초미세 반도체 등 8개 분야에서 8대 특화 AI 모형을 개발하고 새로운 과학기술 지식 창출에 최적화된 AI 기반 기술 확보를 추진하는 ‘인공지능+과학기술(S&T) 혁신 가속화’ 전략을 세웠다.
그러나 최근 수요가 높아진 것에 비해 국내에서 공동 활용이 가능한 고성능 그래픽처리장치(GPU) 인프라가 매우 부족한 상황이다. 이 때문에 연구자들은 AI 모형을 개발하거나 AI를 활용해 연구할 때 필요한 GPU를 개별로 구매하거나 인터넷 기반 자원공유(클라우드) 서비스를 이용하고 있어 연구 데이터 유출이 우려되는 실정이다.
이에 정부는 슈퍼컴 6호기 구축이 완료되는 즉시 초거대 계산과학, 데이터 분석, ‘인공지능+과학기술’ 활성화 R&D 수요를 비롯해 50~200개의 GPU를 활용해 3개월 내 완료 가능한 중규모 이상의 AI 개발 등 다양한 수요를 신속히 지원할 계획이다. 그간 누적됐던 연구·산업 현장의 GPU 활용 수요가 한꺼번에 해소되기 어려운 점을 고려해 맞춤형 ‘인공지능+과학기술 공공기반’ 구축 방안도 재정 당국과 협의 중이다. 이 방안에 따르면 AI 기반 화합물 합성 등의 신약 연구와 같은 전문연구 분야별로 정부출연연구소 등에서 GPU 장치 수요를 공동 활용할 수 있게 되는 것이다. 과학기술정보통신부 관계자는 “슈퍼컴 6호기 도입 계약이 적기에 성사돼 연구·산업 현장에서 기존 방식으로 풀지 못했던 난제들이 해결되고 혁신적인 연구성과들이 창출되기를 기대한다”고 밝혔다.


[자료제공 :icon_logo.gif(www.korea.kr)]

관련자료

댓글 0
등록된 댓글이 없습니다.

최근글


  • 글이 없습니다.

새댓글


  • 댓글이 없습니다.
알림 0