엔비디아, 전 세계 80여 개 신규 과학 시스템에 AI 가속화 지원
- SC25서 지난 1년간 엔비디아 가속 플랫폼 성과 발표… 전 세계 총 4,500 엑사플롭스 AI 성능 기여
- 호라이즌.솔스티스 등 차세대 AI 슈퍼컴퓨터, 질병 연구부터 우주 모델링까지 과학 혁신 가속
AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr)가 16일부터 21일까지(현지시간) 미국 세인트루이스에서 개최되는 ‘슈퍼컴퓨팅 2025(Supercomputing 2025, SC25)’ 콘퍼런스에서 지난 1년간 엔비디아 가속 컴퓨팅 플랫폼으로 구동되는 80개 이상의 새로운 과학 시스템이 전 세계에 공개됐으며, 총 4,500 엑사플롭스의 AI 성능에 기여했다고 발표했다.
그 중 가장 최근 선보인 것은 미국 최대 규모의 학술용 슈퍼컴퓨터인 텍사스 첨단 컴퓨팅 센터(Texas Advanced Computing Center, TACC)의 300 페타플롭스급 호라이즌(Horizon) 시스템이다.
호라이즌은 엔비디아 GB200 NVL4와 엔비디아 베라(Vera) CPU 서버로 구동되며, 엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 네트워킹으로 상호 연결될 예정이다. 호라이즌은 2026년 가동 시 과학, 공학 분야의 획기적인 발전을 가속화할 것으로 기대된다. 이 시스템은 미국 연구 커뮤니티에 발견과 혁신을 위한 전례 없는 컴퓨팅 역량을 제공할 전망이다.
이 시스템은 엔비디아 가속 슈퍼컴퓨터의 최신 사례로, 의료, 기상, 기후 모델링, 로보틱스, 제조, 양자 컴퓨팅 연구, 재료 과학 등 다양한 분야에서 국가와 민간 기업의 글로벌 연구를 촉진한다.
엔비디아의 풀스택 가속 컴퓨팅 플랫폼은 GPU, CPU, DPU, NIC, 스케일아웃 스위치, 쿠다-X(CUDA-X) 라이브러리, 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어를 포괄한다. 이로써 시스템이 과학을 지속 가능하고 전례 없는 속도로 발전시키는 데 필요한 통합 아키텍처, 확장성, 효율성을 제공한다.
● TACC를 위한 호라이즌의 과학적 혁신
4,000개의 엔비디아 블랙웰(Blackwell) GPU를 탑재한 호라이즌 슈퍼컴퓨터는 FP4 정밀도에서 최대 80 엑사플롭의 AI 컴퓨팅 성능을 지원한다. 이 시스템은 아래와 같은 특정 과학적 모델링과 시뮬레이션 애플리케이션을 지원하도록 설계됐다:
• 질병의 역학 시뮬레이션: 연구자들은 분자 역학 소프트웨어와 AI 강화 시뮬레이션을 활용해 바이러스를 연구할 계획이다.
• 우주 전역의 별과 은하 모델링: 천체물리학자들은 별과 은하의 형성 과정을 탐구하고, 제임스 웹 우주 망원경(James Webb Space Telescope)의 최근 발견으로 밝혀진 먼 은하들을 시뮬레이션할 예정이다.
• 원자 규모 신소재 연구: 과학자들은 난류, 복잡한 결정 구조를 가진 고체 물질, 양자 물질의 전도성을 연구할 계획이다.
• 지진 대비를 위한 지진파 매핑: 연구자들은 지진 위험 지도를 개선하고, 지진 발생 시 단층이 어떻게 파열되는지 시뮬레이션할 계획이다.
TACC의 고성능 컴퓨팅 디렉터인 존 케이즈(John Cazes)는 “호라이즌은 우리 과학자들이 전례 없는 규모로 야심찬 과학 연구를 수행할 수 있게 할 것이다. 이 새로운 시스템은 연구 커뮤니티가 바이러스 감염의 분자 역학을 해독하고, 먼 은하계의 데이터를 탐구하며, 수십 년 후의 지진 활동을 시뮬레이션하는 등 AI 기반 연구를 추진하는 방식을 혁신할 것”이라고 말했다.
● 아르곤 국립연구소와 로스앨러모스 국립연구소, 신규 AI 슈퍼컴퓨터 구축
미국 에너지부(Department of Energy, DOE)는 최근 일리노이주 아르곤 국립연구소(Argonne National Laboratory, ANL)와 뉴멕시코주 로스앨러모스 국립연구소(Los Alamos National Laboratory, LANL)에 7대의 신규 AI 슈퍼컴퓨터를 구축하기 위해 엔비디아와 협력 관계를 체결했다고 발표했다.
ANL에서는 엔비디아 블랙웰 GPU와 엔비디아 네트워킹을 탑재한 두 대의 AI 슈퍼컴퓨팅 시스템을 DOE의 과학 기기데이터 자산 네트워크와 연결할 예정이다. 이로써 연구진이 과학과 에너지 응용 분야를 위한 강력한 AI 모델을 개발할 수 있도록 지원한다.
연구소 단지 내 최대 규모 시스템인 솔스티스(Solstice)는 10만 개의 엔비디아 블랙웰 GPU를 탑재할 예정이다. 엔비디아 GB200 NVL72 시스템을 탑재한 솔스티스는 훈련 시 무려 1,000 엑사플롭스에 달하는 AI 훈련 컴퓨팅 성능을 낼 수 있다. 이는 2025년 6월 기준 TOP500 전체 목록의 AI 훈련 컴퓨팅 성능 합계인 약 650 엑사플롭스보다 50% 이상 높은 수치다.
또 다른 ANL 시스템인 ‘이퀴녹스(Equinox)'는 1만 개의 엔비디아 블랙웰 GPU로 구동될 예정이다. 연구소의 엔비디아 가속 시스템인 '미네르바(Minerva)’, ‘야누스(Janus)’, '타라(Tara)'는 AI 추론과 인력 개발을 지원할 것이다.
LANL에서 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE)가 구축, 공급할 미션(Mission)과 비전(Vision) 시스템은 엔비디아 베라 루빈(Vera Rubin) 플랫폼과 엔비디아 퀀텀-X800 인피니밴드 네트워킹 플랫폼으로 구동될 예정이다. 미션 시스템은 미국 국가핵안보실(National Nuclear Security Administration, NNSA)의 기밀 애플리케이션을 운영하며, 비전 시스템은 파운데이션 모델과 에이전트형 AI를 포함한 오픈 과학 연구를 지원할 것이다.
두 시스템 모두 2027년 가동될 것으로 예상된다.
이 일곱 개의 DOE 시스템은 과학적 발견을 위한 슈퍼컴퓨터인 '다우드나(Doudna)'에 이은 올해의 발표다. 다우드나는 로렌스 버클리 국립연구소(Lawrence Berkeley National Laboratory)와 함께 발표한 슈퍼컴퓨터로, 2026년 가동 예정이다. 엔비디아 베라 루빈 아키텍처와 엔비디아 퀀텀-X800 인피니밴드로 구동되는 다우드나는 핵융합 에너지, 재료 과학, 신약 개발, 천문학 분야의 11,000명 이상 연구자들의 작업을 지원할 예정이다.
● 유럽 율리히 슈퍼컴퓨터, 린팩(Linpack) 벤치마크에서 엑사플롭 성능 돌파
유럽에서는 스위스 국립 슈퍼컴퓨팅 센터와 이탈리아 시네카(CINECA) 슈퍼컴퓨팅 센터의 시스템을 포함한 엔비디아 가속 슈퍼컴퓨터들이 유럽 전역의 과학 연구를 주도하고 있다.
독일 율리히(Jülich) 슈퍼컴퓨팅 센터의 주피터(JUPITER) 시스템은 이중 정밀도(FP64) 컴퓨팅 성능을 측정하는 HPL 벤치마크에서 초당 1경(10의 18승) 부동소수점 컴퓨팅을 수행하는 엑사플롭 성능을 달성했다.
주피터 랙 내부의 컴퓨트 블레이드(compute blade)
올 9월에 가동을 시작한 주피터는 유럽 최초의 엑사스케일 컴퓨터로, 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand)로 상호 연결된 24,000개의 엔비디아 GH200 그레이스 호퍼 슈퍼칩(Grace Hopper Superchips)을 탑재하고 있다. 이는 고해상도 세계 기후 시뮬레이션을 비롯한 다양한 응용 분야에 활용되고 있다.
율리히 슈퍼컴퓨팅 센터 책임자인 크리스텔 미힐센(Kristel Michielsen)은 “주피터의 1 엑사플롭 이상의 컴퓨팅 성능을 통해 이제 킬로미터 단위 해상도로 세계 규모 시뮬레이션을 실행할 수 있게 됐다. 이러한 컴퓨팅 능력의 도약으로 유럽 연구진은 과학 분야 전반에 걸쳐 복잡성, 규모, 범위 측면에서 새로운 차원의 AI 모델과 시뮬레이션을 수행할 수 있게 됐다”고 말했다.
지난 1년간 공개된 유럽의 주요 슈퍼컴퓨터는 다음과 같다.
• 블루 라이온(Blue Lion) : 독일 라이프니츠 슈퍼컴퓨팅 센터(Leibniz Supercomputing Centre)의 시스템으로, 2027년 초 가동을 목표로 한다. 엔비디아 베라 루빈 플랫폼으로 구동돼 기후, 난류, 물리학, 머신러닝 연구를 지원하는 역할을 할 예정이다.
• 게피온(Gefion) : 덴마크 최초의 AI 슈퍼컴퓨터로, 덴마크 AI 혁신 센터(Danish Center for AI Innovation, DCAI)에서 운영하며 엔비디아 DGX SuperPOD 시스템을 기반으로 한다. 양자 컴퓨팅, 청정 에너지, 생명공학 등 분야의 연구 발전을 위해 덴마크 혁신가들에게 소버린 AI 역량을 제공한다.
• 이삼바드-AI(Isambard-AI) : 영국 브리스톨 대학에 위치한 영국 최고 성능의 AI 슈퍼컴퓨터다. 영국 국가보건서비스(National Health Service, NHS) 데이터로 훈련된 멀티모달 기초 모델인 나이팅게일(Nightingale) AI와 웨일스어, 기타 영국 언어에 대한 고품질 AI 추론을 가능하게 하는 UK-LLM 프로젝트 등에 활용되고 있다.
게피온은 덴마크 최초의 AI 슈퍼컴퓨터로, 엔비디아 DGX SuperPOD와 엔비디아 퀀텀-2 인피니밴드 네트워킹으로 구성된다.
● 한국.일본.대만 슈퍼컴퓨터, 산업 전반 연구 촉진
소버린 AI 투자와 민간 부문 이니셔티브를 통해, 엔비디아 가속 AI 인프라는 한국, 일본, 대만의 과학 연구를 지원하고 있다.
한국 정부는 소버린 클라우드와 AI 팩토리에 5만 대 이상의 엔비디아 GPU를 배치할 계획이다. 삼성(Samsung), SK그룹(SK Group), 현대자동차그룹(Hyundai Motor Group) 등 업계 선도 기업들도 엔비디아 블랙웰 GPU를 활용한 AI 팩토리를 구축해 연구와 생산 가속화를 추진 중이다.
일본 최고 연구 기관인 리켄(RIKEN, 이화학연구소)은 SC25에서 과학 연구용 AI를 위한 1,600-GPU급 시스템과 양자 컴퓨팅을 위한 540-GPU급 시스템에 중점을 둔 두 대의 신규 슈퍼컴퓨터에 엔비디아 GB200 NVL4 시스템을 통합한다고 발표했다.
리켄은 일본에서 구축 중인 두 개의 신규 슈퍼컴퓨터에 엔비디아 블랙웰을 도입 중이다. 하나는 과학 연구용 AI, 다른 하나는 양자컴퓨팅을 위해 설계된 시스템이다.
리켄은 후지쯔(Fujitsu), 엔비디아와 협력해 글로벌 시스템 모델링, 신약 개발 연구, 첨단 제조 애플리케이션을 구동할 슈퍼컴퓨터 '후가쿠NEXT(FugakuNEXT, 개발 코드명)'를 공동 설계 중이다. 이 시스템은 NV링크 퓨전(NVLink Fusion)을 통해 엔비디아 기술과 연동 가능한 후지쯔 모나카-X(FUJITSU-MONAKA-X) CPU를 탑재할 예정이다.
도쿄 공과대학(Tokyo University of Technology)은 100개 미만의 GPU로 2 엑사플롭스의 FP4 이론적 컴퓨팅 성능을 달성할 수 있는 엔비디아 DGX B200 시스템 기반 AI 슈퍼컴퓨터를 구축했다. 이 시스템은 대규모 언어 모델 개발과 디지털 트윈 구축에 활용돼, 차세대 AI 인재 양성을 위한 핵심 인프라 역할을 할 예정이다.
일본 산업기술종합연구소(National Institute of Advanced Industrial Science and Technology, AIST)는 최근 2,000개 이상의 엔비디아 H100 GPU를 탑재한 세계 최대 규모의 양자컴퓨팅 연구용 슈퍼컴퓨터 ABCI-Q를 공개했다.
엔비디아는 세계 최대 규모의 양자컴퓨팅 연구용 슈퍼컴퓨터 ABCI-Q를 지원한다.
대만에서는 엔비디아가 폭스콘 혼하이 테크놀로지(Foxconn Hon Hai Technology) 그룹과 협력해 1만 개의 엔비디아 블랙웰 GPU를 탑재한 AI 팩토리 슈퍼컴퓨터를 구축 중이다. 이 슈퍼컴퓨터는 연구자, 스타트업, 산업 전반에 걸친 혁신을 촉진할 예정이다.
여기에서 엔비디아 가속 슈퍼컴퓨팅에 대해 자세히 알아볼 수 있다.
여기에서 엔비디아 하이퍼스케일과 고성능 컴퓨팅 부문 부사장 이안 벅(Ian Buck)의 SC25 파이어사이드 챗을 시청할 수 있다.
| 유동식 기자 press@ruliweb.com |





