멀티-프리시전 텐서코어 GPU로 다양한 워크로드 가능

[테크월드=정환용 기자] 엔비디아(Nvidia)는 새로운 T4 GPU가 서버 GPU 중 가장 빠른 채택률을 보이고 있다고 밝혔다.

지난 9월 출시된 엔비디아 T4 GPU는 컴퓨터 제조업체가 제공하는 57가지 서버 설계에 적용됐다. T4 GPU는 이제 클라우드에서도 사용할 수 있게 됐고, 구글 클라우드 플랫폼 고객을 위한 T4도 최초 공개됐다. 소셜 미디어, 온라인 쇼핑몰 등의 기업들은 조기에 T4를 채택해 사용하고 있으며, 가장 큰 규모의 최종사용자 기반을 보유하고 있다. 델 EMC, IBM, 레노버, 슈퍼마이크로 등의 기업도 T4를 채택해 서버를 제작하고 있다.

T4는 고성능컴퓨팅(HPC), 딥 러닝 교육과 추론, 머신 러닝, 데이터 분석, 그래픽 등 다양한 클라우드 워크로드를 가속화한다. 새로운 엔비디아 튜링(Turing) 아키텍처 기반의 이 제품은 다중 정밀 튜링 텐서(Tensor) 코어와 새로운 RT 코어를 특징으로 하며, 가속화된 컨테이너형 소프트웨어 스택과 결합해 높은 성능을 제공한다.

T4가 가진 다중정밀 기능은 4가지 정밀 수준에서 다양한 AI 워크로드를 위한 AI 성능을 제공한다. 이를 통해, FP32에서 8.1Tflops, FP16에서 65Tflops, INT8에서 130TOPS(초당 테라 연산), INT4에서 260TOPS의 성능을 구현한다. AI 추론 워크로드의 경우 T4 GPU 2개를 탑재한 서버로 CPU 전용 서버 54개를 대체할 수 있다. 또한, AI 훈련을 위해서는 T4 GPU 2개를 탑재한 서버로 이중 소켓 CPU 전용 서버 9개를 대체할 수 있다.

다미온 헤레디아(Damion Heredia) 구글 클라우드 제품 관리 담당 수석 디렉터는 “실시간 시각화와 온라인 추론 워크로드를 최종 사용자에 제공하려면 지연시간이 낮아야 한다. 엔비디아와 협력해 구글 클라우드 고객에 T4 GPU를 지원하게 돼 기쁘게 생각한다”며, “구글 클라우드용 엔비디아 T4 GPU는 우리의 머신 러닝, 시각화 고객들에게 확장성과 비용효율성이 뛰어나면서도 지연시간이 낮은 플랫폼을 제공한다. 고객들은 구글 클라우드의 네트워크 역량과 T4의 기능을 결합해 새로운 방식으로 혁신할 수 있으며, 애플리케이션 속도는 높이는 동시에 비용은 낮출 수 있다”고 말했다.

이안 벅(Ian Buck) 엔비디아 엑셀레이티드 컴퓨팅 담당 부사장 겸 총괄은 “지금까지 데이터센터 프로세서가 이렇게 빠른 채택률을 보인 적이 없었다”며, “T4는 출시 60일 만에 클라우드에서도 사용할 수 있게 됐고, 전 세계 서버 제조업체 네트워크를 통해 지원된다. T4는 오늘날 퍼블릭∙프라이빗 클라우드가 컴퓨팅 집약적인 워크로드를 처리하는데 요구되는 성능과 효율성을 제공한다”고 설명했다.

이 기사를 공유합니다
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지