파스칼이 공정 이전하고 나서 유닛 수 증가를 낮추고 이전 세대보다 향상된 클럭과 컬러 압축 효율 개선으로 인해서 성능을 극적으로 향상시켰죠. 그 이후에 RTX 등장으로 레이트레이싱이 추가되고 텐서 코어가 추가되었는데, 여기서 정수 유닛이 추가되었습니다. 그런데 파스칼은 모든 정수 성능이 상당히 낮게 나오는 반면, 라데온은 INT24 성능이 FP32와 동일하게 동작하지만 INT32 성능이 떨어지는 경향이 있죠. 바로 여기서 튜닝 아키텍쳐의 정수가 INT64를 제외한 FP32와 동일하게 동작한다는점 입니다.

위의 그림을 보니까 Nvidia의 발표에 의하면 경우에 따라서 정수 유닛으로 인한 실게임에 추가적인 향상이 있고, 이것이 SP 유닛수와의 상관 관계가 멀다는 점입니다. 그러나 문제는 바로 SP 가동률이고, 게임에 따라서 정수 유닛의 가동률이 달라진다점이 있어서 결국 유닛 수가 낭비되어 효율이 떨어진다는 점이 있습니다.
어쨌든 간에 튜닝은 래스터 성능의 비중을 그대로 두고 정수 성능과 연산 성능 향상에 촛점을 맞춰졌으니, 이로 인한 실게임 성능 향상으로 이어졌습니다. 1660Ti가 실게임에서 1070과 대등하게 나온 것도 래스터 성능이 비슷하면서(정수 사용 비중이 낮거나 필레이트 위주에서는 약간 떨어지는 경향이 있음) 정수 성능 향상 덕분에 그런 것으로 추측됩니다.

그 이후에 암페어가 등장하고 SM 쪽에 다시 손을 봐서 정수 성능 비중을 절반으로 줄이면서 SP 가동률을 높이기 위해서 FP32와 INT32를 하나로 공유하는 형태로 전환하였습니다. 그렇게 설계하는 이유가 게임에서 정수 사용 비중이 적다고 판단했기 때문입니다. 그러므로 INT32를 절반으로 줄이면서 FP32와 하나로 합쳐서 정수 유닛의 가동률에 따라서 FP32 성능이 향상되어서 효율이 향상되었다는 점입니다. 암페어의 핵심은 SP 가동률을 높여서 유닛의 확장으로 연산 성능을 향상시켰다는 점입니다.
3060과 1080Ti의 성능 비교가 여기서 극명하게 드러나는데, 래스터와 필레이트 처리 능력에서는 1080Ti가 우위인데 이는 일부 실게임과 파스에서 확연히 차이가 나는 이유가 있죠. 그런데 연산 비중이 높은 게임은 대등하게 나오거나 살짝 떨어지거나 약간 앞서는 경우가 있다는 점인데, 여기서는 정수 성능에서 1080Ti가 떨어져서 실제 연산 성능은 3060이 우위지만 래스터와 필레이트 성능에 발목잡아서 패널티가 생긴다는 점이 있습니다.
앞으로 나올 에이다 러브레이스는 정수 유닛이 추가될 예정이지만, 대신 효율을 위해 비중을 줄여서 나올 것으로 예상됩니다.
'컴퓨터 관련 글' 카테고리의 다른 글
메인보드를 케이스에 장착할 때 주의해야할 점 (0) | 2015.11.05 |
---|---|
R9 퓨리의 문제점에 대한 고찰 (0) | 2015.07.04 |
필레이트에 대해서 (0) | 2013.05.22 |
라데온 HD4850 으로 돌린 고전게임들, 1996~2003년(DOS 게임 제외) (0) | 2012.12.29 |
메인보드에 있는 규격의 관련 용어들의 사용기기들 (0) | 2011.02.17 |