전체 글 28

튜닝 이후의 계열이 성능을 향상한 이유는?

파스칼이 공정 이전하고 나서 유닛 수 증가를 낮추고 이전 세대보다 향상된 클럭과 컬러 압축 효율 개선으로 인해서 성능을 극적으로 향상시켰죠. 그 이후에 RTX 등장으로 레이트레이싱이 추가되고 텐서 코어가 추가되었는데, 여기서 정수 유닛이 추가되었습니다. 그런데 파스칼은 모든 정수 성능이 상당히 낮게 나오는 반면, 라데온은 INT24 성능이 FP32와 동일하게 동작하지만 INT32 성능이 떨어지는 경향이 있죠. 바로 여기서 튜닝 아키텍쳐의 정수가 INT64를 제외한 FP32와 동일하게 동작한다는점 입니다. 위의 그림을 보니까 Nvidia의 발표에 의하면 경우에 따라서 정수 유닛으로 인한 실게임에 추가적인 향상이 있고, 이것이 SP 유닛수와의 상관 관계가 멀다는 점입니다. 그러나 문제는 바로 SP 가동률이고..