엔비디아, 생성형 AI 통해 HPC 연구 가속화
- 코드 생성, 기상, 유전학, 재료 과학 등 다양한 분야에서 HPC 작업 지원
- 스파이어와 메테오매틱스, 정교한 기후 연구 위해 엔비디아와 협력
- 유전자 염기서열 생성하는 GenSLM 모델, A100 텐서 코어 기반 슈퍼컴퓨터로 학습
AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr)가 생성형 AI를 통해 HPC(고성능 컴퓨팅) 작업을 가속화하며 코드 생성, 기상, 유전학, 재료 과학 분야의 연구를 지원하고 있다고 밝혔다.
생성형 AI는 국가와 기업 연구소에서 비즈니스와 과학을 위한 HPC을 가속화하며 기반을 다지고 있다.
샌디아 국립 연구소(Sandia National Laboratories)는 세계 최대 규모의 슈퍼컴퓨터에서 사용하도록 설계된 병렬 프로그래밍 언어인 코코스(Kokkos)로 코드를 자동으로 생성하는 야심찬 시도를 하고 있다. 여러 국립 연구소의 연구진들이 개발한 이 특수 언어는 수만 대의 프로세서에서 작업을 수행하는 데 필요한 미묘한 부분까지도 처리할 수 있다.
샌디아 국립 연구소의 연구진들은 검색 증강 생성(retrieval-augmented generation, RAG)을 사용해 코코스 데이터베이스를 생성하고 AI 모델과 연결하고 있다. 이들은 다양한 RAG 접근 방식을 실험하면서 초기 테스트에서 긍정적인 결과를 보여주고 있다.
과학자들이 평가하게 될 RAG 옵션 중에는 네모 리트리버(NeMo Retriever)와 같은 클라우드 기반 서비스도 있다.
샌디아 국립 연구소의 익스트림 스케일 컴퓨팅(extreme scale computing) 수석 매니저인 로버트 훅스트라(Robert Hoekstra)는 “엔비디아는 HPC 소프트웨어 개발자의 작업을 획기적으로 가속화하는 데 필요한 다양한 툴 세트를 제공한다”고 말했다.
이러한 모델 조정과 RAG를 통한 코파일럿 구축은 시작에 불과하다. 연구진들은 궁극적으로 기후, 생물학, 재료 과학과 같은 분야의 과학 데이터로 훈련된 파운데이션 모델의 활용을 목표로 하고 있다.
- 기후 변화에 대한 선제적 대응
일기 예보 분야의 연구원과 기업들은 기상, 기후 연구를 위한 서비스와 소프트웨어 세트인 엔비디아 어스-2(Earth-2)의 생성형 AI 모델인 코디프(CorrDiff)를 채택하고 있다.
코디프는 기존 대기 모델의 25km 해상도를 2km까지 조정할 수 있다. 또한, 결합할 수 있는 예측 수를 100배 이상 확장해 예측 신뢰도를 향상시킬 수 있다.
미국 버지니아주 비엔나에 위치한 스파이어(Spire)는 자체 소형 위성 네트워크에서 데이터를 수집하는 기업이다. 스파이어의 머신러닝과 모델링 책임자인 톰 고완(Tom Gowan)은 “이는 유망한 혁신이다. 우리는 이러한 모델을 글로벌과 지역 AI 예보에 활용해 더욱 풍부한 인사이트를 제공할 계획이다”라고 말했다.
톰 고완은 최근 인터뷰에서 생성형 AI를 통해 더 빠르고 정확한 예보가 가능해지고 있다고 말했다. 그는 “기상학 분야에서 정말 큰 도약이 이루어진 것 같다. 이제 엔비디아와의 파트너십을 통해 우리는 훈련과 추론 모두에서 가장 안정적이고 빠르며 효율적인 세계 최고의 GPU를 이용할 수 있게 됐다”고 말했다.
스파이어 AI 기상 예측
스위스에 본사를 둔 메테오매틱스(Meteomatics)는 최근 자사의 일기 예보 사업에도 엔비디아의 생성형 AI 플랫폼을 사용할 계획이라고 발표했다.
메테오매틱스의 창립자 겸 CEO인 마틴 펜글러(Martin Fengler)는 “엔비디아와의 협력은 에너지 기업들이 날씨 변동에 대한 빠르고 정확한 인사이트를 통해 재생 에너지 운영을 극대화하고 수익성을 높이는 데 도움이 될 것”이라고 말했다.
- 의료 서비스 개선을 위한 유전자 생성
아르곤 국립 연구소(Argonne National Laboratory)의 과학자들은 이 기술을 사용해 코로나19의 원인이 되는 바이러스를 더 잘 이해하도록 돕는 유전자 염기서열을 생성하고 있다. 수상 이력까지 있는 GenSLM 모델은 실제 SARS-CoV-2 변종과 매우 유사한 시뮬레이션을 생성했다.
아르곤 국립 연구소의 수석 연구원인 아르빈드 라마나단(Arvind Ramanathan)은 블로그에서 “게놈의 여러 부분이 어떻게 공진화하는지 이해하면 바이러스가 새로운 취약성이나 새로운 형태의 저항성을 개발할 수 있는 단서를 얻을 수 있다”고 전했다.
GenSLM은 엔비디아 A100 텐서 코어(Tensor Core) GPU 기반 슈퍼컴퓨터를 통해 1억 1천만 개 이상의 게놈 서열을 훈련했다. 이러한 슈퍼컴퓨터에는 아르곤 국립 연구소의 폴라리스 시스템(Polaris system), 미국 에너지부(U.S. Department of Energy)의 펄머터(Perlmutter), 엔비디아의 셀레네(Selene) 등이 있다.
- 신소재를 제안하는 마이크로소프트(Microsoft)
마이크로소프트 연구는 생성형 AI가 재료 과학 분야의 작업을 가속화하는 방법을 보여준다.
마이크로소프트의 매터젠(MatterGen) 모델은 원하는 특성을 나타내는 새롭고 안정적인 물질을 생성한다. 이 접근 방식을 통해 화학, 자기, 전자, 기계 등의 기타 원하는 특성을 지정할 수 있다.
마이크로소프트 연구팀은 엔비디아 A100 GPU를 사용해 애저(Azure) AI 인프라에서 매터젠을 훈련했다. 그들은 “우리는 매터젠이 재료 설계를 위한 AI의 중요한 진전이라고 생각한다”고 말했다.
카본3D(Carbon3D)와 같은 기업들은 이미 상업용 3D 프린팅 작업에서 재료 과학에 생성형 AI를 적용하며 기회를 찾고 있다.
이는 연구자들이 생성형 AI를 통해 HPC와 과학 분야에서 할 수 있는 일의 시작에 불과하다. 현재 사용 가능한 엔비디아 H200 텐서 코어 GPU와 곧 출시될 엔비디아 블랙웰(Blackwell) 아키텍처 GPU는 새로운 차원의 작업을 실현시킬 것으로 기대된다.
여기에서 물리 법칙을 따르는 AI 모델 구축을 위한 어스-2 플랫폼의 핵심 구성 요소인 엔비디아 모듈러스(Modulus)에 대해 알아볼 수 있다. 또한 여기에서 거대 언어 모델(LLM)을 조정하고 훈련하는 네모 라이브러리인 엔비디아 메가트론-코어(Megatron-Core)와 같은 도구에 대해 자세히 알아볼 수 있다.
유동식 기자 press@ruliweb.com |