AI를 위한 NVIDIA의 슈퍼컴퓨터 DGX 소개 및 기술 제안
4차 산업혁명의 핵심 분야인 인공지능(AI) 시대는 딥러닝 플랫폼 서버 및 GPU 선택이 무엇보다 중요합니다. NVIDIA® DGX™ 시스템은 딥러닝과 AI 분석 가속화를 위한 목적으로 세계 최초로 개발된 GPU기반 슈퍼컴퓨터이며, 하드웨어, 딥 러닝 소프트웨어 및 개발 도구가 완벽하게 통합 제공되는 Appliance 장비로써 누구든 딥 러닝을 보다 신속하고 간단하게 실행할 수 있는 강력한 GPU 가속 컴퓨팅 성능을 제공하는 것이 특징입니다.
또한 NVIDIA® DGX™ 시스템은 사용자가 즉시 데이터 처리 시간을 단축하고, 더 많은 데이터를 시각화하며, 딥 러닝 프레임 워크를 가속하고, 정교한 신경망을 쉽게 구축할 수 있습니다. 현재 NVIDIA® DGX™ 시스템은 볼타 아키텍처 기반의 DGX-Station과 최근에 암페어 아키텍처 기반의 DGX A100 이 있습니다.
본 Webinar에서는 NVIDIA® DGX™ 시스템의 성능과 사용된 기술 그리고, 최근 출시된 DGX A100에 적용된, 보다 향상된 기술에 대해 소개를 드리고자 합니다.
DGX A100 특징
- 8개의 NVIDIA A100 텐서코어 GPU 구성으로, 총 320GB GPU 메모리 통해 5 페타플롭스의 AI 성능 구현
- 6개의 3세대 NVIDIA NVSWITCH로 양방향 대역폭 4.8TB/s 지원하며, 이전 세대보다 대역폭이 2배 더 증가
- 200Gb 속도를 제공하는 Mellanox ConnectX-6 VPI HDR InfiniBand/200GB 이더넷 9개로 클러스터 및 네트워크 구성
- 듀얼 64코어 AMD CPU 및 1TB 시스템 메모리 구성으로, 이전 세대보다 3.2배 더 많은 코어로 가장 집약적인 AI 작업 처리 가능
- 4세대 NVME SSD(15TB)구성으로, 3세대 NVME SSD보다 2배 빠른 속도 지원
- Multi-Instance GPU (MIG) 기능 추가로, 최대 56개의 GPU 인스턴스 생성, 물리적으로 격리된 자원으로 56명이 동시 작업 가능
DGX STATION 특징
- 4개의 NVIDIA V100 GPU, 총 128GB GPU 메모리 통해 500 TFLOPS(Mixed precision) 성능 구현
- Intel Xeon E5-2698 v4 20코어, 시스템메모리 256GB 지원
- NVIDIA NVLink 기술로 GPU당 200GB의 고속 상호 연결 지원
- 4K 모니터 해상도 완벽하게 지원
- 수랭식 쿨링 시스템 적용으로 35dB이하의 최소화된 소음
- 최첨단 AI 개발을 위한 세계 최초의 개인용 슈퍼컴퓨터