서버전문업체 아이티마야
HPC서버
HPC서버

High-Performance Computing
고급 연산을 위한 슈퍼컴퓨터
연산 클러스터 시스템
- Worker Node
  
  611C
- Storage Node
  
  621C
  
  641E
- Single Node (Tower)
  
  751A-I
GPU서버
GPU서버

NVIDIA Miutl GPU System
다수의 GPU 사용에 최적화
- 4GPU Server
  
  ESC4000-E11 (5th INTEL)
  
  ESC4000A-E12 (4th AMD)
- 8GPU Server
  
  ESC8000-E12 (6th INTEL)
  
  ESC8000A-E13 (5th AMD)
  
  ESC8000-E11 (5th INTEL)
  
  ESC8000A-E12 (4th AMD)
- HGX Server
  
  421GU-TNXR (HGX H200)
  
  821GE-TNHR (HGX H200)
- 2GPU Workstation
  
  531A-I
- 4GPU Workstation
  
  741GE-TNRT
  
  ET900A-X9
- 나라장터 등록제품
  
  Tensor-T22
  
  Tensor-T42
  
  Tensor-R42
  
  Tensor-R82
- Compact AI
  
  ASUS Ascent GX10
- 10GPU Server
  
  421GE-TNRT
BigData서버
BigData서버

Hadoop EcoSystem
BigData 환경에 최적화
- Name Node
  
  611C
- Data Node
  
  621C
가상화/HCI
가상화/HCI

서버 가상화 및 데스크탑 가상화
하이퍼컨버지드 인프라(HCI) 최적화
- 가상화
  
  611C
- HCI
  
  H262
  
  621C
스토리지/파일서버
스토리지/파일서버

NAS/SAN/FileServer
다량의 데이터를 안전하게 보관
고효율/고성능 스토리지 시스템
- Network Storage
  
  AS6504RD
  
  AS6512RD
  
  AS7112RDX
  
  AS7116RDX
- Data Server
  
  621C
  
  641E
- NVMe over Fabrics
- SAN Storage
  
  R3600
- 나라장터 등록제품
  
  MAYASTOR NAS
WEB/WAS/DB
WEB/WAS/DB

작은 리소스의 WEB서버
Application에 최적화된 WAS서버
높은 연산 및 IO 처리가 가능한 DB서버
- WEB Server
  
  RS300
  
  611C
- WAS Server
  
  611C
- 고성능 DB
  
  611C
- 타워형서버
  
  751A-I
- 나라장터 등록제품
  
  Tensor-H12
  
  Tensor-H22
워크스테이션
워크스테이션

높은 성능 및 안정적인 작업환경 제공
CPU 연산 / 높은 IO 제공
- 1CPU Workstation
  
  531A-I
- 2CPU Workstation
  
  741GE
- 나라장터 등록제품
  
  Tensor-T22
  
  Tensor-T42
MLOps/SW지원/유지보수
MLOps/SW지원/유지보수

MLOps 솔루션 구성 지원
오픈소스 설치 및 기술지원
AWS Cloud 마이그레이션 지원
- Cloud
  
  AWS
- Open Source
  
  Kubernetes
  
  Hadoop
- NVIDIA
  
  GPU Direct
- HCI
  
  Nutanix
- Backup
  
  Unitrend
- MLOps
  
  Uyuni MLOps
- HW/SW 유지보수

테크니컬 스토리

아이티마야의 새로운 기술 뉴스를 만나보세요.

무거운 작업일수록 NVLink를 사용하는 이유

등록일

2022.10.06

첨부파일

딥러닝 환경에서 왜 NVLink를 선호할까?

무거운 작업일수록 NVLink를 사용하는 이유

NVLink

이전에는 CPU만으로 연산을 할 수 있었지만, 지금은 CPU만으로는 버겁기 때문에 GPU는 선택이 아닌 필수가 되었습니다. GPU 서버 또는 워크스테이션을 사용하는 사용자들은 내가 사용하는 GPU가 좀 더 유연하고 많은 퍼포먼스를 보여줬으면 좋겠다고 생각을 할 것입니다. GPU를 상위 GPU로 바꾸고 싶어도 비용이 문제가 되기 때문에 이런 고민을 덜어줄 건 NVLink라고 생각합니다.

NVLink 가 뭔가요?

NVLink는 다중 GPU 시스템에 사용되는 기존의 PCI-E 기반 솔루션보다 더욱 유연한 퍼포먼스를 제공하는 고속 GPU 상호 연결 장치입니다. NVLink를 사용할 경우 GPU사이에 통신 대역폭을 높여 양방향으로 통신할 수 있기 때문에 NVLink 없이 단일 GPU를 사용했을 때 보다 더 나은 성능을 기대할 수 있습니다. ex) A6000 GPU 2개에 NVLink를 연결해주면 ‘최대’ 112GB/s의 대역폭 및 결합된 96GB 메모리를 제공하여 가장 메모리 집약적인 워크로드를 처리할 수 있습니다.

<출처 : NVIDIA A6000 설명 페이지>

NVLink는 모든 GPU에 호환이 되나요?

NVLink라고 모든 GPU에 호환이 되는 건 아닙니다. 좌측 사진 2장처럼 (NVLink 2세대) 제품들은 쿼드로 제품(RTX5000 등)에 장착이 가능하고 3세대 NVLink(우측 사진 2장)는 A 시리즈 (A100, A5000, A6000 . . . )에 장착이 가능합니다.

NVLink는 하나밖에 장착을 못하나요?

다른 GPU들은 GPU에 1개의 NVLink 슬롯이 있는 반면 A100 GPU의 경우 3개의 NVLink를 장착할 수 있습니다. 그러므로 총 12개의 NVLink를 장착할 수 있는데 12개 모두 장착한다면 총 600GB/s 대역대를 구현할 수 있는 장점이 있습니다. *앞으로 출시될 H100 GPU도 A100과 같은 1 GPU 3 NVLink 방향으로 출시될 방향으로 예상합니다.

최근 딥러닝 환경에서 많이 이용하는 GPU별 대역폭 자료

아래 자료는 Idel 상태의 GPU에 NVLink를 장착했을 때 보이는 대역폭 참고자료입니다.

[GPU 외 다른 하드웨어 스펙]
System : ESC8000A-E11
CPU : AMD EPYC 3rd 7413 x 2
Memory : 64GB x 8
M.2 NVMe : SK Hynix Platinum P41 M.2 NVMe 2TB x 1

( RTX 3090 GPU x 2 + 3세대 NVLink 1 ) x
( A5000 GPU x 2 + 3세대 NVLink 1) x
( A6000 GPU x 4 + 3세대 NVLink 1 )
[0번 1번 GPU에 NVLink 장착, 2번 3번 GPU는 장착안함]

위와 같은 참고 사례를 보아도 GPU를 단순하게 사용하는 것보다 NVLink를 사용해서 더욱 유연한 퍼포먼스를 기대하는 게 더 나은 방향이라고 생각합니다.

LIST

회사소개 오시는길

(주)아이티마야대표 안두영
서울시 영등포구 양평로21길26, IS비즈타워 2203호
사업자 등록번호: 106-86-67282통신판매업 신고: 2017-서울영등포-0649
전화: 02) 713 - 1256팩스: 02) 713 - 1254help@itmaya.co.kr

PLEASE WAIT WHILE LOADING...