엔비디아, 분산 네트워크 추론 위한 'AI 그리드' 인프라 제공
- AT&T, T-모바일, 컴캐스트, 스펙트럼, GTC 2026서 AI 그리드 구축 계획 공개
- 퍼스널 AI, 링커 비전, 서브 로보틱스, 데카르트, 그리드 전역에 실시간 AI 애플리케이션 배포
AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr)가 미국 새너제이에서 열린 세계 최대 AI·가속 컴퓨팅 콘퍼런스인 ‘엔비디아(NVIDIA) GTC 2026’에서 미국과 아시아 주요 통신사들이 엔비디아 AI 인프라 기반 ‘AI 그리드’를 구축 중이라고 밝혔다.
AI 네이티브 애플리케이션이 더 많은 사용자와 AI 에이전트, 기기로 확장됨에 따라, 통신 네트워크가 AI 배포의 새로운 프런티어로 부상하고 있다.
엔비디아 GTC 2026에 참여한 주요 통신사들은 이 같은 변화가 이미 시작되었음을 시사하며, AI 그리드 구축 계획을 공개했다. 지리적으로 분산된 상호 연결 AI 인프라를 뜻하는 AI 그리드는 통신사들의 방대한 네트워크 거점을 활용해 분산된 엣지 전역에서 신규 AI 서비스를 구동하고 수익 모델을 창출하는 기반이 되고 있다.
사업자별로 접근 방식은 다양하다. 상당수 업체는 즉각적인 수익 창출을 위해 기존의 유선 엣지 거점을 AI 그리드로 활성화하는 작업부터 착수했다. 반면, 일부는 동일한 그리드상에서 AI를 무선 접속망에 완전히 통합하는 AI-RAN 기술을 채택해 이를 워크로드 처리와 엣지 추론 플랫폼으로 활용하고 있다.
통신사와 분산형 클라우드 제공업체들은 세계에서 가장 방대한 규모의 인프라를 운영 중이다. 이들은 지역 허브, 모바일 교환국, 중앙국에 이르기까지 전 세계적으로 약 10만 개의 분산 네트워크 데이터 센터를 확보하고 있다. 또한, 향후 100기가와트(GW) 이상의 신규 AI 용량을 수용할 수 있는 충분한 예비 전력까지 갖추고 있다.
AI 그리드는 기존의 유휴 부지와 전력시설, 그리고 네트워크 연결성을 지리적으로 분산된 컴퓨팅 플랫폼으로 전환한다. 이를 통해 응답 속도와 토큰당 비용이 최적의 균형을 이루는 지점, 즉 사용자, 기기, 데이터와 인접한 곳에서 AI 추론을 직접 수행하게 된다. 이는 단순한 인프라 고도화를 넘어 AI 서비스 전달 방식의 근본적인 구조 변화를 의미하며, 통신 네트워크를 단순한 데이터 운반체에서 AI 확장의 핵심 엔진으로 격상시키고 있다.
● 글로벌 통신사들, 분산 네트워크를 AI 그리드로 전환
글로벌 6대 주요 통신사를 중심으로 AI 그리드는 단순한 기술 담론을 넘어 실체로 부상하고 있다.
수천 종의 기기에서 1억 개 이상의 연결을 확보한 IoT 선도 통신사 AT&T는 엔비디아, 시스코(Cisco)와 협력해 IoT용 AI 그리드를 구축 중이다. 전용 IoT 코어에서 AI를 구동하고, AI 추론을 데이터 생성 지점으로 전진 배치함으로써, AT&T는 링커 비전(Linker Vision)과 같은 공공 안전 분야의 미션 크리티컬 실시간 애플리케이션을 지원할 수 있게 됐다. 이를 통해 사고 탐지, 경보, 대응 속도는 획기적으로 높이는 동시에, 민감한 정보가 네트워크 엣지에서 고객의 통제 하에 안전하게 보호되도록 했다.
AT&T 비즈니스 제품 담당 수석부사장 숀 하클(Shawn Hakl)은 "기업과 개발자가 고도로 보안이 유지되면서도 접근성이 뛰어난 AI 서비스를 확장하는 것은 우리 IoT 연결 전략의 핵심이다. 우리는 AT&T의 비즈니스급 연결성, 현지화된 AI 컴퓨팅, 제로 트러스트 보안을 한데 결합한다. 이와 동시에, 엔비디아 인셉션(Inception) 프로그램 회원사와의 협력은 물론, 엔비디아 인프라와 시스코 모빌리티 서비스 플랫폼(Cisco Mobility Services Platform) 기반의 시스코 AI 그리드를 적극 활용하고 있다. 또한 이를 통해 실시간 AI 추론을 데이터 발생 위치에 더욱 가깝게 배치해 디지털 전환을 가속화하고 새로운 비즈니스 기회를 창출할 것"이라고 밝혔다.
컴캐스트(Comcast)는 미국 전역에 구축된 최대 규모의 저지연 광대역 인프라를 실시간 초개인화 경험을 위한 AI 그리드로 전환시키고 있다. 컴캐스트는 엔비디아, 데카르트(Decart), 퍼스널 AI(Personal AI), HPE 등과 협업 중이다. 이를 통해 자사의 AI 그리드가 수요 급증 시에도 대화형 에이전트와 인터랙티브 미디어, 엔비디아 지포스 나우(GeForce NOW) 클라우드 게임 등의 즉각적인 응답성을 보장하는 한편, 높은 처리량과 낮은 토큰당 비용으로 경제성까지 입증하는 데 성공했다.
스펙트럼(Spectrum)은 1,000개 이상의 엣지 데이터 센터와 5억 대의 기기에서 10ms 이내에 수백 메가와트(MW)의 용량을 제공하는 AI 그리드를 지원할 수 있는 인프라를 갖추고 있다. 현재 초기 배포단계에서는 자사의 저지연 광네트워크 전반에 배치된 원격 GPU를 활용해 미디어 제작용 고해상도 그래픽을 렌더링하는 데 주력하고 있다.
아카마이(Akamai)는 전 세계에 분산된 AI 그리드를 구축해 수천 개의 엔비디아 RTX PRO 6000 블랙웰 서버 에디션(RTX PRO 6000 Blackwell Server Edition) GPU로 4,400개 이상의 엣지에 아카마이 인퍼런스 클라우드(Akamai Inference Cloud)를 확장하고 있다. 아카마이의 AI 그리드 오케스트레이션 플랫폼은 개별 요청을 최적의 컴퓨팅 계층에 매칭함으로써 추론의 토큰 경제성을 극대화하는 동시에 게임, 미디어, 금융 서비스, 유통 등 다양한 산업군에 저지연 실시간 AI 경험을 제공하고 있다.
인도삿 오레두 허치슨(Indosat Ooredoo Hutchison)은 인도네시아 전역에 분산된 엣지와 AI-RAN 사이트를 자사의 소버린 AI 팩토리와 연결해 지역 혁신을 위한 AI 그리드를 구축 중이다. 특히 인도네시아 국경 내 그리드 망에서 인도네시아어 특화 플랫폼인 사하밧-AI(Sahabat-AI)를 구동함으로써, 수천 개의 섬에 흩어진 수억 명의 국민에게 현지화된 AI 서비스를 밀착 제공 중이다. 이를 통해 현지 개발자와 스타트업들은 빠른 속도와 문화적 적합성, 그리고 설계 단계부터 보안 규정을 준수하는 소버린 플랫폼 위에서 AI 애플리케이션을 개발할 수 있게 됐다.
T-모바일(T-Mobile)은 엔비디아와 협력해 엔비디아 RTX PRO 6000 블랙웰 서버 에디션 GPU를 활용한 엣지 AI 애플리케이션의 상용화를 가속화하고 있다. 특히 전국에 분산된 자사의 네트워크 거점을 활용해 차세대 AI-RAN과 엣지 추론 분야의 다양한 실무 적용 모델을 효과적으로 지원할 수 있음을 입증하고 있다. 링커 비전, 레바타스(Levatas), 바이디오(Vaidio), 아키타입 AI(Archetype AI), 서브 로보틱스(Serve Robotics) 등 주요 개발사들은 이미 그리드상에서 스마트 시티, 산업 현장, 유통 분야의 애플리케이션을 시범 운영 중이다. 또한, 카메라와 배달 로봇, 도시 규모의 지능형 에이전트들을 네트워크 엣지의 실시간 지능 시스템에 연결하고 있다. 이는 기지국과 모바일 교환국이 고도화된 5G 연결성을 제공하는 역할은 물론, 분산된 엣지 AI 워크로드를 지원하는 인프라로 나아가고 있음을 보여준다.
● 신규 AI 네이티브 서비스, 통신 AI 그리드 실전 배치
AI 그리드는 실시간 반응성, 초개인화된 경험, 동시성, 방대한 토큰 소모를 특징으로 하는 새로운 유형의 AI 네이티브 애플리케이션을 위한 기반이 되고 있다.
퍼스널 AI는 엔비디아 리바(Riva)를 활용해 AI 그리드상에서 인간 수준의 대화형 에이전트를 구현한다. 소형 언어 모델(small language model, SLM)을 사용자 근접 거점에서 구동하는 방식을 통해 엔드투엔드 지연시간을 500ms 미만으로 단축하고 토큰당 비용을 50% 이상 절감했다. 이를 통해 대규모 서비스 확장 시에도 경제성을 유지하는 동시에, 자연스러운 음성 경험을 제공하고 있다.
링커 비전은 AI 그리드상에서 실시간 비전 AI를 구동하며 도시 운영의 패러다임을 혁신하고 있다. 분산된 엣지 사이트에서 수천 개의 카메라 피드를 동시에 처리함으로써, 실시간 탐지와 즉각적인 경보 발령에 필수적인 예측 가능한 지연 시간을 확보했다. 이를 통해 교통사고 탐지 속도는 최대 10배, 재난 대응 속도는 15배 향상됐으며, 위험한 군중 밀집 행위를 1분 이내에 감지해 경보를 울리는 등 더 안전하고 스마트한 도시 구현을 주도하고 있다.
데카르트는 AI 그리드에 실시간 영상 생성 기술을 접목해 초개인화된 분산 미디어의 패러다임을 전환하고 있다. 데카르트는 자체 루시(Lucy) 모델을 네트워크 엣지에서 직접 구동해 네트워크 지연 시간을 12ms 미만으로 단축했으며, 시청자의 반응이나 환경에 실시간으로 대응하는 인터랙티브 영상 스트림과 오버레이를 구현해 시청자가 급증하는 상황에서도 최적화된 몰입형 라이브 경험을 제공한다.
● AI 그리드, 레퍼런스 디자인과 생태계 확장
엔비디아 AI 그리드 레퍼런스 디자인(AI Grid Reference Design)은 분산된 사이트 전역에 AI를 배포하고 오케스트레이션하기 위해, 엔비디아 가속 컴퓨팅, 네트워킹, 소프트웨어 플랫폼 포함한 핵심 구성요소를 정의한다.
시스코와 같은 풀스택 파트너와 HPE와 같은 인프라 전문 기업들이 주도하는 생태계가 엔비디아 RTX PRO 6000 블랙웰 서버 에디션 기반 시스템을 통해 AI 그리드 솔루션을 시장에 선보이고 있다. 특히 아르마다(Armada), 라파이(Rafay), 스펙트로 클라우드(Spectro Cloud) 등의 주요 파트너들은 분산형 AI 인프라 전반에서 워크로드를 원활하게 오케스트레이션하기 위해 AI 그리드 제어 평면(control plane)을 구축하는 데 박차를 가한다.
시스코 수석 부사장 겸 프로바이더 모빌리티 부문 총괄 매니저 마숨 미르(Masum Mir)는 "피지컬 AI는 기존의 중앙 집중형 지능을 넘어, 네트워크 엣지 기반의 분산형 의사결정 체제로 전환을 가속화하고 있다. 엔비디아와의 파트너십은 엔비디아 GPU에서 시스코의 네트워킹과 모빌리티 역량에 이르는 풀스택의 결합을 의미한다. 이번 협력을 통해 통신사업자들이 미션 크리티컬 애플리케이션을 안전하게 구동하고 실시간 추론 서비스를 제공함으로써 AI 가치 사슬(Value Chain)에 본격적으로 참여할 수 있게 됐다"고 밝혔다.
이러한 생태계 협력을 통해 통신사와 분산형 클라우드 제공업체들은 네트워크 엣지를 AI 워크로드의 실행, 확장이 가능한 수익형, 지능 플랫폼으로 재구축하면서 AI 가치 사슬 내에서 스스로의 역할을 재정의하고 있다.
여기에서 AI 그리드에 대해 더 자세히 알아볼 수 있다.
| 유동식 기자 press@ruliweb.com |
