콘솔에서 fp32 연산 이야기를 하며 플롭스로 성능 비교를 한지는 제법 되긴 했습니다.
단순하게 성능비교를 하기에 편하긴 하지만, fp32 플롭스 성능만으로 비교하기에는 무리인 점이 너무 많습니다.
동일한 아키텍쳐라도 vram의 대역폭이 다르고, 세부 스펙이 다르고 아키텍쳐가 다르면 플롭스 비교만으로는
성능의 단순 비교 우위를 점하기는 너무 힘이듭니다. ipc 클럭당 성능의 수치 자체도 다르기도 하지만 '편의성'으로
콘솔 게이머 에게는 흔한 비교 수단으로 사용되긴 했습니다.
일단 fp32의 플롭스 계산은 sp,cu(스트림 프로세서 갯수,쿠다코어 갯수)*작동 클럭*2(1hz당 2번 계산가능)으로이루어 집니다.
기존 스펙시트에서 보여지는 CU와는 다르며, 이는 컴퓨트 유닛이며 이를 엔비이다는 cu(쿠다코어), amd sp(스트림 프로세서)라 부릅니다.
처음 sp,cu에서부터 걸리게 됩니다.
아키텍쳐마다 sp,cu 1개당 효율이 다르므로 다른 아키텍쳐의 비교는 신뢰도가 많이 떨어집니다.
작동 클럭<- 이부분도 amd와 엔비디아 제품의 부스트 클럭 개념이 달라서 단순 대입으로는 또 다른 결과가 나옵니다.
amd는 최대작동 '가능'클럭이고, 엔비디아는 최소동작 '보증'클럭 이기에, 차이점이 있습니다.
이해를 돕기 위해 몇가지 제품으로 예를 들어보겠습니다.
스펙상 플롭스 깡패 베가 64(수냉)
4096*1677*2=13,737,984플롭스 13.7테라플롭스
rx5700xt
2560*1905*2=9,753,6000 9.7테라플롭스
2080ti
4352*1635(A칩)*2=14,231,040 14.2테라플롭스
2070s
2560*1770*2=9,062,400 9테라플롭스
1080ti
3584*1584*2=11,354,112 11.3테라플롭스
몇가지 제품의 게이밍 성능에 중요한 fp32 연산능력 플롭스를 적어 보았습니다.
실제 성능을 단순 플롭스 수치로 비교하기에는 무리가 있다는걸 바로 아시리라 봅니다.
세부 스펙이 거의 유사한 카드의 경우 어느정도 유추는 가능하지만, 단순 플롭스가 절대적인 성능수치는 아닙니다.
위의 계산에 사용된 '클럭'은 양사에서 주장하는 부스트 클럭 기준이지만 이또한 다른것이, 엔비디아는 최소동작 '보증'클럭이고
amd는 최대작동 '가능' 클럭이기에 amd의 베이스 클럭은 엔비디아의 낮은 기준으로 보면 베이스 클럭이나 다름이 없습니다.
이걸 토대로 다시 계산을 하면
베가 64(수냉)
4096*1406*2=11,517,952 11.5테라플롭스
베가 64(공냉)
4096*1247*2= 10,215,424 10.2테라플롭스
rx5700xt
2560*1605*2 8,217,600 8.2테라플롭스
이처럼 amd 그래픽 카드의 경우 플롭스 성능은 상당히 낮아지게 됩니다.
이런 뻥 플롭스만 표기를 하면 욕을 먹고, 그렇다고 엔비디아의 부스트 클럭에 맞추면 성능이 떨어져 보이니
rx5700xt의 경우 게임클럭이라는 AAA게임 20종 테스트로 평균을 내서 값을 측정한 값이 있습니다.
엔비디아의 최소동작 보증 클럭보다는 못하지만, 기존 뻥 부스트 클럭보다는 솔직한 실제 클럭도 있기에
게임클럭으로도 계산을 해보면
5700xt는 2560*1755*2=8,985,600 9테라플롭스가 됩니다.
이것처럼 기준을 어디에 두느냐에 따라, 플롭스 성능은 제법 '많이' 변동을 하고, 엔비디아와 부스트 클럭의 개념도 다르기에 엔비디아
기준으로 보면 amd 그래픽 카드는 뻥 플롭스라고 욕도 많이 먹었구요.
ps5와 엑시엑의 플롭스 성능비교는 같은 아키텍쳐이기에 대략적으로 예측은 가능합니다.
다만 rdna2 아키텍쳐라 rdna1대비해서 어느정도 성능 향상이 있는지 오피셜 뜨기 전까지 정확한 확인은 불가능하고
엑시엑은 고정이지만, ps5는 가변으로 어느정도 클럭 출렁임이 있는지에 따라 성능 차이가 갈리므로 누구도 확언은 힘듭니다.
다만 마크써니가 최대 10%저하 수준에서 ps5의 성능 저하는 그칠 것이다라고 말을 했는데,
성능이 10% 떨어지는것은, 단순 gpu 클럭이 10%떨어져서 가능한 성능 하락 수치가 아니며, gpu클럭은 10%이상 하락을 해야
종합 성능이 10% 하락이 되므로, 최대 부스트클럭에서 10%이상 저하하는것을 돌려 말한 것임을 ps팬분이라도 보고 가셔야 할 대목입니다.
다만 콘솔의 경우 pc처럼 동일한 cpu, vram, ssd를 달고 그래픽 카드만 다르게 해서 테스트가 가능하지는 않기에
여전히 성능관련 논란이 생길 수 밖에 없는 부분이고, 결국 이 부분으로 인해서 논쟁은 끊이지 않을 겁니다.
amd가 엔비디아 대비 절대 성능이 떨어지다보니 플롭스 수치를 강조 하긴 했는데
5700 시리즈 나비 출시로 뻥플롭스를 어느정도 해소하고, 실제 성능도 따라오다보니
암페어 즉 3000시리즈에서는 오히려 엔비디아가 뻥플롭스를 내세우고 있습니다.
3080의 경우 30테라 플롭스이고, 2080s의 11.1테라 플롭스의 3배에 가깝지만 실제 성능 향상은 1.7배 입니다.
이처럼 플롭스는 같은 제작사라고 하더라도, 아키텍쳐에 따라 천차 만별인 점은 있으므로,
단순 플롭스로 비교한 성능 비교는 큰 의미가 없습니다.
(IP보기클릭)175.117.***.***
마크서니가 그렇게 말 안했습니다 성능이 10%가 아니라 성능이 2% 떨어질때 전력이 10%나 떨어진다는 겁니다 이말은 cpu gpu 가 양쪽 다 최대 클럭일때 (이런 경우도 거의 없지만) 성능이 2%만 떨어져도 전력이 10% 떨어지니 상대적으로 많이 떨어지는 전력 덕분에 성능적으로 손실의 거의 없다는 이야기입니다
(IP보기클릭)180.231.***.***
굉장히 유식해 보이시네요 (비꼬는거 아닙니다)
(IP보기클릭)125.179.***.***
성능하락부분은 제가 이해했던 내용과는 약간 다르네요. 최대 10퍼센트까지 떨어진다가 아니라 gpu의 최대전력량에서 최대 클럭을 유지하는데 cpu가 전력량을 올려 클럭을 올렸을 경우 gpu의 전력량이 최대량 대비 10퍼센트 떨어졌을때 2~3퍼센트의 클럭 하락이 있다고 이해했거든요.
(IP보기클릭)112.151.***.***
설마 엑시엑과 PS5 얘기하시는 건가요? 같은기기에서 오버클럭으로 올린 계산법으로 나오는 테라플롭스는 실제 성능에서 힘을 발휘하지 못한다는 얘기입니다 ;; cu하고 스트림 프로세서 메모리 대역폭부터 달라서 달라진 테라플롭스 얘기가 아닙니다.
(IP보기클릭)122.44.***.***
많이 헷갈린 부분인데 이제 좀 개념이 잡히는 거 같네요 장문의 설명글 감사합니다
(IP보기클릭)180.231.***.***
굉장히 유식해 보이시네요 (비꼬는거 아닙니다)
(IP보기클릭)122.44.***.***
많이 헷갈린 부분인데 이제 좀 개념이 잡히는 거 같네요 장문의 설명글 감사합니다
(IP보기클릭)175.117.***.***
마크서니가 그렇게 말 안했습니다 성능이 10%가 아니라 성능이 2% 떨어질때 전력이 10%나 떨어진다는 겁니다 이말은 cpu gpu 가 양쪽 다 최대 클럭일때 (이런 경우도 거의 없지만) 성능이 2%만 떨어져도 전력이 10% 떨어지니 상대적으로 많이 떨어지는 전력 덕분에 성능적으로 손실의 거의 없다는 이야기입니다
(IP보기클릭)112.151.***.***
사실 그말도 딱히 좋은말은 아닙니다 rdna1처럼 오버시 효율이 떨어진다는 뜻이라. 이미 rdna1 오버클럭 벤치에서 증명되었듯 클럭을 18% 오버해도 게임프레임은 고작 6% 상승하고 소비전력은 40%나 더 먹었습니다. | 20.10.16 09:07 | |
(IP보기클릭)175.117.***.***
님 말씀대로면 플롭스 수치로 10 과 12의 차이에도 실게임 프레임 차이는 6% 정도 차이라는거네요 좋은뜻 같습니다 | 20.10.16 09:43 | |
(IP보기클릭)112.151.***.***
루리웹-9218915292
설마 엑시엑과 PS5 얘기하시는 건가요? 같은기기에서 오버클럭으로 올린 계산법으로 나오는 테라플롭스는 실제 성능에서 힘을 발휘하지 못한다는 얘기입니다 ;; cu하고 스트림 프로세서 메모리 대역폭부터 달라서 달라진 테라플롭스 얘기가 아닙니다. | 20.10.16 09:51 | |
(IP보기클릭)121.140.***.***
님은 어떻게 생각하세요~? 엑시엑이랑 플5랑 성능 6% 내외가 날거 같나요~? | 20.10.16 10:17 | |
(IP보기클릭)118.235.***.***
말 거꾸로 쓰신 듯. 클럭 오버를 해서 나온 결과치가 10.3입니다. 전력을 얼마 썼든 클럭을 얼마 먹였던 실차이가 20% 정도 나는 겁니당. 윗분 말씀은 18% 오버클럭한게 결과물 (테라플롭) 이 18% 올라간게 아니라 6% 올라갔다는 얘기구요. | 20.10.16 20:43 | |
(IP보기클릭)112.154.***.***
(IP보기클릭)125.179.***.***
성능하락부분은 제가 이해했던 내용과는 약간 다르네요. 최대 10퍼센트까지 떨어진다가 아니라 gpu의 최대전력량에서 최대 클럭을 유지하는데 cpu가 전력량을 올려 클럭을 올렸을 경우 gpu의 전력량이 최대량 대비 10퍼센트 떨어졌을때 2~3퍼센트의 클럭 하락이 있다고 이해했거든요.
(IP보기클릭)118.235.***.***
클럭 유지 관점에서 18% 차이가 기본인데 일부 클럭 저하 및 테라플롭스 처리 능력 (나온게 없어서 단정은 못허지만 cu 설계 차이에서 30~40%)을 감안한 대략적인 예상인 것 같네요. | 20.10.16 20:45 | |