북미 시간 6월 10일, AMD 는 E3 2019 타이밍에 맞추어 회장에서 가까운 이벤트 홀에서 "AMD Next Horizon Gaming" 이라는 신제품 발표 행사를 개최했다. 이 행사에 앞서, AMD는 미디어 관계자용 사전 설명회를 개최했다. 사전 설명회의 CPU 에 관한 이야기는 별도의 기사에서 소개하고 있으므로, 이번 기사에선 AMD 의 차세대 GPU "Navi" (개발 코드 네임) 에 대해 리포트 해볼까 한다.
[드디어 스펙이 공개된 Radeon RX 5700, 연산 성능 자체는 Vega 64 에 미치지 못해]
Navi 에 대해서 AMD 는 2019년 1월에 열린 CES 2019 때부터 정보를 내놓았으나 새 아키텍처라는 정보 외엔 구체적인 이야기가 없었기에 "RDNA"(Radeon DNA) 에 대해서 많은 궁금함을 가지고 있었다. 또, 2019년 4월 Sony InteractiveEntertainment (이하, SIE) 에서 PS4 의 리드 시스템 아키텍쳐를 맡았던 마크 써니 씨가, 차세대 PlayStation 애 Navi 세대 GPU 을 도입하며 실시간 레이 트레이싱 기술에도 대응하겠다고 발표하기도 했기에, "PC용 GPU 인 Navi 도, 레이 트레이싱을 지원할 것인가" 궁금해하던 사람도 있을 것이다.
그런 Navi 의 전모가, 이번 드디어 공개되었다. 이들에 대해서, 가능한 범위로 설명해 보도록 하겠다.
Navi 를 채용한 제품의 명칭이 "Radeon RX 5000"시리즈가 되는 것은 COMPUTEXTAIPEI 2019 (이하,COMPUTEX2019) AMD 기조 연설에서 드러났는데, 이번엔 Radeon RX 5000 시리즈의 라인업 구성이 드러났다.
Radeon RX 5000 시리즈의 상위 모델은 "Radeon RX 5700 XT" (이하, RX 5700 XT) 이며, 하위 모델은 "Radeon RX 5700" (이하, RX 5700) 이다."XT" 는, Radeon 패밀리에서는 친숙한 모델 그레이드 기호로, 보통 XT 가 붙은 제품이 상위 모델이란 의미로 쓰인다.
또한 이번에 공개된 몇몇 자료에서 "Navi 10" 이라는 구절이 존재하는데, AMD 내부에서는, 이번 세대의 Navi 를 Navi 10 이라고 부르는 것으로 보인다.
참고로, GCN 아키텍처로 된 이후의 AMD제 GPU 는 Compute Unit (이하,CU) 로 불리는 연산 클러스터를 1개의 단위로서 GPU 코어를 형성하는 것이 룰이다. RX 5700 시리즈의 경우, RX 5700 XT 는 40CU, RX 5700 이 36CU 이다. RX 5700 시리즈에서는, GPU 의 코어 아키텍처가 새로운 RDNA 로 구성되어 있다고 AMD 는 어필했는데, 1기의 CU 당, 64기의 범용 쉐이더 프로세서 (이하,SP) 을 내포하는 구성은 GCN 때와 달라진 게 없다. 그래서 총 SP 는 다음과 같은 계산으로 산출할 수 있다.
- RX 5700 XT : 64SP× 40CU = 2560SP
- RX 5700 : 64SP× 36CU = 2304SP
현행 세대 GPU인 "Vega 10" 의 "Radeon RX Vega 64" 는 총 SP수가 4096기인 걸 감안하면 RX 5700 시리즈의 SP 는 꽤 적은 셈이다.
RX 5700 XT 의 이론 성능치는 9.75TFLOPS 라고 명시되어 있는데 이는,
- 2560SP × 2FLOPS × 1905MHz = 9.75TFLOPS
이렇게 계산할 수 있다. 덧붙여서 "×2FLOPS" 을 하고 있는 것은 AMD제 GPU 에서는 1SP 가 1클럭으로 1개의 부동소수점 연산을 할 수 있기 때문이다.
RX 5700 시리즈의 경우, RX 5700 의 부스터 최대 클럭이 1725MHz 로 동작 클럭이 높기 때문에, SP수가 적어도, 이론적인 성능 값은 높아진다. 그래도 Radeon RX Vega 64 의 12.66TFLOPS (4096SP × 2SP × 1546MHz) 보다는 많이 낮다. 이는 RX 5700 시리즈가 울트라 고급 지향 클래스의 GPU 가 아니라 하이 미들에서 하이엔드 클래스를 겨냥한 제품이기 때문일 것이다. 이는 COMPUTEX 2019 에서, RX 5700 시리즈의 비교 대상이 NVIDIA 의 "GeForce RTX 2070" 이 된 것으로도 짐작할 수 있는 부분이다.
그래픽 메모리로 HBM (High Bandwidth Memory) 계가 아니라 GDDR6 를 채용하고 있는 것도, RX 5700 시리즈가 울트라 하이엔드급은 아니라는 얘기다. RX 5700 시리즈 GDDR6 메모리의 데이터 속도 (그래픽 메모리 클럭) 은 14GHz 로, 메모리 인터페이스가 256bit 임을 밝히고 있기 때문에, 메모리 버스 대역폭은 다음과 같이 계산할 수 있다.
- 256bit × 1.75GHz × 8배속 (GDDR6) = 448GB/s
그런데, RX 5700 XT 와 RX 5700 의 스펙을 나타낸 슬라이드에, "Game Clock" 이라는 신경 쓰이는 키워드가 있었다는 것을 보셨는지 ? AMD 에 따르면 Game Clock 은 "게임 애플리케이션을 구동하는 데 적합한 동작 클럭". 즉 Game Clock 은, 기준 클럭과 부스터 클럭 사이에 위치한 2단 기어 같은 걸로 생각하면 될 것 같다.
[RDNA 아키텍처의 이점은 ?]
그럼 이제부터 본격적으로 가장 궁금해했던 키워드 "RDNA" 에 대해서 이야기 해볼까 한다, 아래의 슬라이드는, Navi 10 의 RDNA 아키텍처 블록 다이어그램이다.
GCN 아키텍처를 잘 아는 사람이라면, 아무것도 변하지 않은 것처럼 보일지도 모르겠는데 실제로도 아키텍처의 혁신이라고 할 정도의 큰 변화는 이뤄지지 않고 있다. 결론부터 말하면, GCN 아키텍처의 빅 마이너 체인지란 느낌이다. 굳이 말한다면, 최신의 실시간 그래픽(≒ 게임 그래픽)이 요구하는 것에 맞춘 특수 커스텀칩 같은 인상 ?
전술한 것처럼, 1기의 CU 가 64SP 를 내포하는 구성은 변하지 않았는데, RDNA 에서는, 2기의 CU 가 서로 캐시 메모리 같은 자원을 공유하는, 1개의 CU 로 동작할 수 있게 됐다.이를 AMD 는 "Work Group Processor" 라고 부른다. 경쟁사인 NVIDIA 는 GPU 세대가 바뀔 때마다,"SM" 즉 "Streaming Multiprocessor" 의 구성을 바꾸었는데, 그것에 해당하는 조치를 취한 것으로 이해해도 좋을 것이다.
한편, 레지스터 파일 크기와 텍스처 유닛수 등은 GCN 아키텍처에서 변경되지 않았다.
여기서 주목해야 할 포인트는 몇가지 있다.
GCN 아키텍처에서는, GPU 에 집어넣는 데이터 스레드 "Wave" 의 사이즈가 64요소로 고정되어 있었다. GCN 의 CU 연산 실행 유닛은, SIMD16 이었고 1사이클(클럭)에서 처리할 수 있는 데이터 스레드는 16개. 즉, 64요소로 되는 데이터 쓰레드 (Wave64) 처리에는, 64 ÷ SIMD16 = 4사이클이란 실행 시간이 필요했다.
RDNA 에서도, 호환성 유지를 위해서 이 동작 모드는 계승한다고 하지만, 다른 동작 모드로서, 32요소로 이루어진 Wave (Wave32) 을 허용하기로 한 것이다. 이는, NVIDIA 의 CUDA 아키텍처와 같은 크기이다. 그리고 RDNA 의 경우, 32요소의 동작 모드에서는, CU 가 SIMD16 동작에서 SIMD32 동작으로 바뀐다는 것이다. 구체적으로는 2개의 SIMD16 이 1개의 SIMD32 로서 동작할 수 있게 되는 것이다. 즉, Wave32 로 이뤄진 데이터 스레드 처리는, 32 ÷ SIMD32 = 1사이클이 되므로, 처리 효율이 올라간다는 것이다. 그래픽의 경우, 처리 요소를 잘게 나누는 편의 효율이 좋기 때문에, 이러한 아키텍처로 전환을 했다는 것이다.
RDNA 의 데이터 입력의 세분화에 따라, 스칼라 연산 유닛은 1기에서 2개로 늘어났고, 늘어난 스칼라 연산 유닛에 대응하는 캐시 메모리나 레지스터 파일도 증설됐다. Wave64 베이스에 의한 GPGPU 활용시의 호환성은 유지하고 있으므로, RDNA 을 그래픽 특화 아키텍처로 간주하는 건 잘못된 것이다. AMD 가 RDNA 을 "GCN과 공존한다" 고 언급하고 있는 것은, "GPGPU용도의 GPU (=GCN 베이스의 GPU)는 Wave32 를 지원하지 않는다" 라는 것을 의미하는 것이다.
RDNA 가 그래픽 용도를 위한 최적화된 아키텍처라는 건, 캐쉬 메모리 계층 구조의 변화를 보면 바로 알 수 있다.
GCN 의 경우, 연산 결과로 얻어진 픽셀 단위의 데이터를 실제로 그래픽 메모리로 출력하는 "Render Back-Ends" 는, L2 캐시와 연계되어 있었다. 그러나, RDNA 에서는, Render Back-Ends 가 L1 캐시와 연계되게 되었다. L1 캐시는 용량이 작지만, L2 캐시보다 지연이 적다.
이와 함께 RDNA 에서는, 그래픽 메모리로 내보낼 픽셀 데이터를 무손실 압축하고 내보내는 "Lossless Delta Color Compression" (이하 LDCC) 의 구조가, Render Back-Ends 와 L1 캐시 뿐만이 아니라, 모든 캐시 메모리 사이에서도 이뤄질 수 있게 되어, 엄청난 메모리 대역폭 절감을 실현하고 있다. LDCC 는 픽셀의 색 정보에 대하여 압축과 전개를 실시하는 구조이다. 인접하는 픽셀들은 색 정보가 가깝기 때문에, 데이터로 표현할 때에는 적은 비트수로 표현한다는 구조이다.
이 구조의 구현은 Wave32 모드와 관계가 깊다.
즉 RDNA 에서는, 자잘하게 쪼개진 Wave32 구성 데이터가 LDCC 에 의해 다시 한번 데이터 양이 줄어들기 때문에 작은 L1 캐시에도 실릴 수 있게 된다, 연산 처리 대상 데이터 액세스가 L1 캐시 내에서 이뤄지는 것이다. 알기 쉽게 말하자면, 가능한 GDDR6 메모리에는 접근하지 않고, 가능한 L1 캐시 내에서 처리하고, 만약 어렵다면 L2 캐시 내에서 처리할 수 있는 처리 방향으로 개선했다는 것이다.
이 구조가 무엇을 가져올 것인가. 이를테면 Z버퍼에 대한 읽고 쓰기가 고속화 될 것이다. 또, 여러 렌더링 해상도로 중간 매개 변수를 저장해 두었다가, 파라미터를 참조하면서 라이팅과 쉐이딩을 하는 "Deferred Shading" 등을 활용할 때도 그래픽 메모리를 가능한 낭비하지 않게 할 수 있게 된다.
약간은 비약한 추측일 수도 있으나, RDNA 구조는 모바일 단말 전용 GPU 에도 꽤 적합한 모델이기에, AMD 와 Samsung Electronics 의 협업이 RDNA 기반의 그래픽 IP 를 대상으로 하는 것으로 이어질지도 모른다.
[Navi 는 실시간 레이 트레이싱을 지원하지 않는다]
마지막으로 "AMD 의 하드웨어 레이 트레이싱 (실시간 레이 트레이싱) 에 관한 대처" 를 이야기하면서 이번 기사를 마무리할까 한다.
Radeon Technologies Group 을 담당하는 David Wang 씨는, Navi 10 이 하드웨어 레이 트레이싱을 지원하지 않음을 분명히 했다.
Navi 10, 즉 초대 RDNA 아키텍처에서는, 기존의 GCN 아키텍처와 마찬가지로 GPGPU적인 접근에서 소프트웨어 레이 트레이싱 밖에 대응하지 않는다는 것. AMD 에서는 "Radeon ProRender" 라는 OpenCL 기반의 레이 트레이싱 엔진이 있어서, Navi 10 에서는 OpenCL 기반의 Radeon ProRender 로 레이 트레이싱을 대응한다는 의견이다.
그럼,"차세대 PlayStation 차세대 Xbox (Project Scarlett) 에서는, Navi 기반의 GPU을 채용하고 실시간 레이 트레이싱을 실현" 이라는 말은 무엇일까.
답은, "다음 세대 RDNA 를 채용한다" 는 것이다. Vega 세대 GPU 도 Radeon RX Vega (Vega 10) 시리즈와 "Radeon VII" (Vega 20) 가 있듯이, 아마도 "Navi 20" 로 예상되는 차세대 Navi 에서 대응할 것이다. RDNA 의 Wave32 모드나, LDCC 과 새로운 캐시 구조는, 레이 트레이싱과의 궁합이 좋을 것이다.
RDNA 아키텍처는 정말 재미있게도 "아키텍처에 대한 특별 조치" 임에도, 정작 게이머들이 얻을 수 있는 그래픽 체험으로서는, Vega 세대와 아무것도 변한 것이 없는 제품이 되었다. 이 점은 AMD 도 인지하고 있는 것 같아 이번 발표회에서도 그래픽 이외의 Navi 만의 새로운 기능이나, Radeon 패밀리만의 그래픽 기능(※Navi 가 아니라도 가능한 기능)을 선보이고 있었다. 이 부분에 대해서도 자세한 것은 차후에 이야기하도록 하겠다.
(IP보기클릭)182.212.***.***
아..그렇군요..
(IP보기클릭)220.119.***.***
RDNA는 GCN의 커스텀으로 보는게 맞을듯... 그나저나 라데온 글카 제대로 살려면 또 존버해야겠네 아놔 ㅠㅜ
(IP보기클릭)112.149.***.***
가격도 예상외로 비싸니 황회장이 슈퍼카드 잠깐 꺼냈다가 다시 넣었구나..
(IP보기클릭)183.109.***.***
갓사수 왤케 멋있지
(IP보기클릭)175.223.***.***
(IP보기클릭)112.149.***.***
가격도 예상외로 비싸니 황회장이 슈퍼카드 잠깐 꺼냈다가 다시 넣었구나..
(IP보기클릭)183.109.***.***
갓사수 왤케 멋있지
(IP보기클릭)112.149.***.***
(IP보기클릭)220.119.***.***
RDNA는 GCN의 커스텀으로 보는게 맞을듯... 그나저나 라데온 글카 제대로 살려면 또 존버해야겠네 아놔 ㅠㅜ
(IP보기클릭)182.212.***.***
아..그렇군요..
(IP보기클릭)112.147.***.***
(IP보기클릭)114.204.***.***
(IP보기클릭)116.120.***.***
(IP보기클릭)210.99.***.***