메뉴 건너뛰기

close

지금이 게이밍 컴퓨터 맞추기 좋은 시대, 알고 보면 더 재미있다.

가볍게 알아보는 그래픽 카드이야기
20.11.20 20:18l

검토 완료

이 글은 생나무글(정식기사로 채택되지 않은 글)입니다. 생나무글에 대한 모든 책임은 글쓴이에게 있습니다.
게임을 잘하는 나라인 만큼 게임을 취미로 즐기는 사람들이 많다. 특히 코로나 시대에서는 집에서 할 수 있는 여가활동들이 늘어났고 그 중 하나가 바로 굳이 만나지 않아도 다른 사람들과 즐길 수 있는 온라인게임이다. 게임을 하기 위해서는 당연히도 콘솔이나 컴퓨터가 필요한데, 대부분의 사람들은 PC게임을 즐기고는 한다. 게임을 하는 데 있어서 화려한 그래픽과 다양한 효과, 고품질의 해상도를 상당히 중요하게 여긴다. 이러한 것들은 대부분 그래픽카드(Graphics Processing Unit,GPU)라는 컴퓨터 부품에서 담당한다. 그만큼 게임을 즐기는 데 있어서 그래픽카드가 중요하다는 이야기이다.
 
RTX30 시리즈 이번년도 하반기 엔비디아가 선보인 RTX30 리스즈의 그래픽카드 ⓒ 2020 NVIDIA Corporation

컴퓨터나 게임에 관심이 있는 사람들에게는 엔비디아의 RTX30시리즈는 상당히 기대했던 부분일 것이다. 이전의 RTX20시리즈에서 실제 빛과 유사하게 보여질 수 있도록 하는 레이트레이싱 기술이 상당한 기대와 관심을 끌었다. 하지만 그 이전의 GTX10 시리즈에 비교해서 RTX20 시리즈의 성능향상 폭에 비해 가격 향상 폭이 너무 컸기 때문에 많은 비난을 받았다. 이후 가성비 모델인 RTX20 SUPER 시리즈를 출시하기도 하였다. 이번 RTX30시리즈 발표전에도 많은 사람들은 역시 높은 가격을 예상하였다. 한국시각 9월 2일 오전 1시에 엔비디아에서 RTX30시리즈에 대한 정식발표가 있었고 사람들을 모두 환호하였다. 그 이유는 바로 RTX30시리즈의 최하위 모델인 RTX3070의 출고 가격이 499$(한화로 약 56만 원)로 책정되었고 성능은 이전 RTX20시리즈의 최상위 모델인 RTX 2080 Ti 의 성능보다 더 좋게 나왔기 때문이다. RTX 2080Ti의 출고가가 999$(한화로 약 112만 원)이었던 것을 생각하면 게이머들에게는 큰 축복이다. 게다가 우리나라로 제품이 들어오게 되면 대부분 물량에 유통 마진이 심하게 높게 붙어 원가의 최대 40%까지 가격이 높아졌지만 RTX30시리즈는 유통사에서 바로 쿠팡,11번가등의 인터넷 쇼핑몰을 이용하게 되면서 높았던 중간 마진이 사라지게 되어 원가에 근접하게 구매할 수 있게 되었다. 따라서 RTX3080 판매 당일 순시 간에 매진이 되었다. 지금은 3070의 물량이 많이 남아있어 온라인 쇼핑물 사이트에서 쉽게 구매할 수 있다.
 
가격이 싸고 성능 좋은 그래픽카드가 출시되었고 쉽게 구할 수 있다는 것은 알았다. 하지만 이것이 어떻게 가능하였을까? 근본적으로는 아키텍처(설계)의 변화가 크다. RTX20시리즈에서는 Turing 아키텍처를 사용하였지만 RTX30시리즈에서는 ampere 아키텍처로 바뀌었다. 두 아키텍처의 가장 큰 변화는 바로 12나노 공정에서 8나노 공정으로 바뀌어 트랜지스터 하나의 크기가 줄어들었다는 것이다. 제작하는 비용은 비싸기는 하지만 트랜지스터의 크기가 줄어들게 되면 소모되는 전력량이 줄어들게 되어 발열이 줄어들고 더 작은 영역에 훨씬 더 많은 트랜지스터를 넣을 수 있어 성능을 높일 수 있다. RTX2080Ti의 트랜지스터 개수가 18억 6 천만 개인 것에 비해 RTX3080이상의 모델에서는 은 28억 6천만 개가 들어간 것을 알 수 있다. 트랜지스터들을 모아 정수계산, 부동소수점(실수)계산, 행렬, 벡터 연산 등을 하는 유닛들을 만들 수 있다. 이러한 유닛들이 모여 하나의 Scalar Processor(SP)를 만들고 이것이 모여 Streaming Multiprocessor(SM)를 만들어 병렬 처리를 가능토록 한다. 결국, SM이 모여 GPU가 완성되는 것이다.
 
Turing 아키텍쳐의 SM(좌) Ampere 아키텍쳐의 SM(우) INT32, 정수연산만 가능하던 유닛을 INT32정수연산 또는 FP32부동소수점 연산을 할 수 있도록 바뀌었다. 뿐만아니라 L1캐시의 용량또한 2배로 늘어날것을 알 수 있다. ⓒ NVIDIA Corporation
 
기존에는 SP에 정수계산 또는 부동소수점계산을 하는 유닛, 부동소수점 계산만을 하는 유닛, 행렬 백터연산을 하는 2세대 텐서코어로 구성이 되었다. 실제 게임구동에서 정수 계산 또는 부동소수점계산을 하는 유닛이 비효율적이라는 것을 알고 이것을 정수계산만, 부동소수점 계산 만 하는 유닛으로 분리하였고 결과적으로 한 개의 SM 당 부동소수점연산을 하는 유닛의 수가 2배로 만들어 성능을 개선시켰다. 그뿐만 아니라 2세대 텐서코어를 정수, 부동소수점, 텐서 계산의 정밀도를 높인 3세대 텐서코어로 교체하면서 머신러닝의 효율이 올라갔다. 유닛의 수 또한 증가하였기 때문에 각각의 코어가 계산한 결과들을 임시 저장하는 L1캐시의 용량도 두 배로 증가하였다. 각각의 성능을 개선하였을 뿐만 아니라 이것을 전부 포함하는 SM의 개수 또한 증가하여 가격대비 큰 성능 향상을 이룰 수 있었던 것이다.

 
DLSS기술 적용 전 후 DLSS기술을 적용하였을때 프레임 뿐만아니라 해상도 또한 증가 했음을 알 수 있다. ⓒ 2020 NVIDIA Corporation
 

엔비디아가 요즘 밀고 나가는 레이트레이싱 기술을 보완하기 위해 SM과 함께 동작하는 RT코어 또한 기존에 수행하기 어려웠던 모션블러에 대한 레이트레이싱을 더 빠르게 할 수 있도록 기존 RT코어에 추가 구성요소를 넣은 2세대 RT코어를 사용하였다. 전작대비 뛰어난 머신러닝 성능을 갖춘 RTX30시리즈의 스펙에 맞춰 엔비디아는 부족한 프레임을 채우고 게임 이미지를 더 또렷하게 해주는 AI 기반의 DLSS 기술을 이용하여 8K 해상도에서 60프레임을 유지할 수 있도록 해준다. RTX30시리즈 출시와 함께 DLSS와 레이트레이싱을 많은 게임들이 지원하기 시작했다. RTX20때에는 할 수 있어도 사용하지 못했던것과는 달리 이 두 기술을 이용한 콘텐츠들을 마음껏 맛 볼 수 있는 것이다.  엔비디아는 인공지능의 선도기업답게 게이밍 이외에도 RTX 그래픽카드에서 머신러닝을 적용한 것을 볼 수 있는데 그것은 바로 엔비디아가 RTX30시리즈와 함께 출시한 엔비디아 브로드캐스트이다. 개인인터넷방송, 재택근무, 화상회의 등이 대중화된 이 시대에서 마이크의 품질과 카메라에 비춰지는 지저분한 배경을 가리는 것은 매우 중요하다. 엔비디아 브로드캐스트는 RTX 그래픽카드의 머신러닝 성능을 이용하여 주변 소리나 잡음을 제거하고 목소리를 더욱 강조하거나 웹캠의 영상으로만 사람의 윤곽선을 인식하여 배경을 바꾸거나 지워주는 기능을 제공한다. 필자도 직접 사용해본 결과 꽤 괜찮은 음질과 배경제거 성능을 보여주었다.
이처럼 머신러닝 기술의 보편화와 함께 값싸고 성능이 좋은 그래픽카드를 쉽게 구할 수 있어진 이 시기야말로 고성능 컴퓨터를 맞추고 최신기술들을 누릴 수 있는 최적의 타이밍이다.
앞으로도 컴퓨터공학의 최신기술들이 쏟아져 나오면서 점차 우리에게 다가올 것이다.
 

  • 이 기사는 생나무글입니다
  • 생나무글이란 시민기자가 송고한 글 중에서 정식기사로 채택되지 않은 글입니다.
  • 생나무글에 대한 모든 책임은 글쓴이에게 있습니다.