AMD는 지난 2년간 조용히 자금을 지원하여 ROCm 스택에서 NVIDIA CUDA 애플리케이션의 바이너리 호환성을 구현하기 위해 노력해 왔습니다. 이를 통해 소스 코드를 변경하지 않고도 CUDA 소프트웨어를 AMD Radeon GPU에서 실행할 수 있습니다.
이를 담당하는 프로젝트는 처음에 인텔 그래픽에서 CUDA 지원을 제공하기 위해 개발된 ZLUDA입니다. ZLUDA의 개발자인 안제이 야닉은 2022년 AMD와 계약을 맺고 자신의 프로젝트를 HIP/ROCm이 탑재된 Radeon GPU에서 사용할 수 있도록 개조하는 작업을 맡았습니다. 그는 2년 동안 AMD 플랫폼에 기능적인 CUDA 지원을 도입하여 많은 실제 CUDA 워크로드를 수정 없이 실행할 수 있도록 했습니다. AMD는 알 수 없는 이유로 이 노력을 제품화하지 않기로 결정했지만, 계약에 따라 자금 지원이 종료되자 이를 오픈소스로 공개했습니다. 포로닉스에서는 다양한 벤치마크를 통해 AMD의 ZLUDA 구현을 테스트하는 여러 벤치마크가 있었습니다.
벤치마크 결과, 독점 CUDA 렌더러와 소프트웨어가 드롭인 ZLUDA 라이브러리 대체를 통해 Radeon GPU에서 즉시 작동하는 것으로 나타났습니다. 이제 CUDA에 최적화된 Blender 4.0 렌더링이 네이티브 ROCm/HIP 포트보다 AMD Radeon GPU에서 더 빠르게 실행되어 장면에 따라 렌더링 시간이 약 10~20% 단축됩니다. 단일 개발자 프로젝트임을 감안하면 구현이 놀라울 정도로 강력합니다. 하지만 몇 가지 제한 사항이 있습니다. OptiX 및 PTX 어셈블리 코드를 완벽하게 지원해야 한다는 점입니다.
하지만 전반적으로 테스트 결과 매우 유망한 결과를 보여주었습니다. Geekbench의 일반 OpenCL 런타임에 비해 CUDA에 최적화된 바이너리는 최대 75% 더 나은 결과를 생성합니다. API 변환을 처리하는 ZLUDA 라이브러리를 통해 이제 수정되지 않은 CUDA 바이너리를 ROCm 및 Radeon GPU 위에서 바로 실행할 수 있습니다.
이상하게도 ZLUDA 포트는 최신 6.x 버전이 아닌 AMD ROCm 5.7을 대상으로 합니다. AMD가 CUDA 소프트웨어의 포팅을 간소화하기 위해 이 접근 방식에 계속 투자할지는 시간이 지나야 알 수 있습니다. 하지만 이제 오픈 소스 프로젝트를 통해 누구나 기여하고 호환성 개선에 도움을 줄 수 있습니다. 전체 리뷰는 포로닉스 테스트에서 확인하세요.
https://www.phoronix.com/review/radeon-cuda-zluda
(IP보기클릭)121.143.***.***
링크 리뷰의 3페이지 보면 블랜더로 벤치마크를 했는데 블렌더 사용자도 고민할만 성능이 나옵니다. 이정도 성능차로 좁혀지면 저가모델 암드 16기가 가격대는 엔당 8기가뿐인게 제일 크게 다가오겠죠
(IP보기클릭)14.32.***.***
아무래도 [개인프로젝트] 라고 하지만.. 저 2년동안의 공백기간동안 AMD에서 엄청 지원해주지 않았을까.. 라는 생각이 드는구먼 ㅋㅋ
(IP보기클릭)112.154.***.***
엔비디아의 배째라가 좀 바뀔 수 있으려나
(IP보기클릭)211.202.***.***
인공지능 쪽에서 난리 나겠구만요
(IP보기클릭)221.141.***.***
이거 솔직히 잘되었으면 하는 바램이 있긴해요 라데온이 그리 좋지는 않지만...가격이 가끔 상대적으로 싸게 풀릴때가있는데 CUDA 강제되는 프로그램 때문에 결국에는 엔당을 써야되는 상황이 있다보니...
(IP보기클릭)121.143.***.***
(IP보기클릭)125.136.***.***
(IP보기클릭)223.39.***.***
(IP보기클릭)14.32.***.***
아무래도 [개인프로젝트] 라고 하지만.. 저 2년동안의 공백기간동안 AMD에서 엄청 지원해주지 않았을까.. 라는 생각이 드는구먼 ㅋㅋ | 24.02.13 11:29 | | |
(IP보기클릭)211.202.***.***
인공지능 쪽에서 난리 나겠구만요
(IP보기클릭)121.143.***.***
Simbian
링크 리뷰의 3페이지 보면 블랜더로 벤치마크를 했는데 블렌더 사용자도 고민할만 성능이 나옵니다. 이정도 성능차로 좁혀지면 저가모델 암드 16기가 가격대는 엔당 8기가뿐인게 제일 크게 다가오겠죠 | 24.02.13 12:37 | | |
(IP보기클릭)123.111.***.***
(IP보기클릭)175.210.***.***
(IP보기클릭)118.235.***.***
...? 현시점에 쿠다보다 성능 범용성 호환성을 한번에 잡고 있는 놈이 뭐가 있음? | 24.02.13 15:09 | | |
(IP보기클릭)175.223.***.***
근데 어디서 주워들은거긴한데 현 쿠다가 굳이 따지자면 다렉x9같은 느낌이라고는 하더라구요. 오래되서 그런가 약간 누더기 골렘같은..... 범용호환성은 애초에 opencl이나 sycl말곤 다들 논외고(다들 지들회사 제품아니면 안되니....) 구조적으로 딴애들이 최신이라 그런가 쿠다대비 더 낫다곤 하는데 나온지얼마안되서 최적화가 덜되서 긍가 성능은 아직 구린게 문제 | 24.02.13 22:24 | | |
(IP보기클릭)112.154.***.***
엔비디아의 배째라가 좀 바뀔 수 있으려나
(IP보기클릭)221.141.***.***
이거 솔직히 잘되었으면 하는 바램이 있긴해요 라데온이 그리 좋지는 않지만...가격이 가끔 상대적으로 싸게 풀릴때가있는데 CUDA 강제되는 프로그램 때문에 결국에는 엔당을 써야되는 상황이 있다보니...
(IP보기클릭)61.75.***.***
(IP보기클릭)61.74.***.***