본문 바로가기 대메뉴 바로가기

테크니컬 스토리

아이티마야의 새로운 기술 뉴스를 만나보세요.
분산 스토리지 클러스터 선택의 이유
등록일
2023.05.03
첨부파일
가성비 MLOps 스토리지
분산 스토리지 클러스터 선택의 이유

최근 MLOps 환경에서 가장 중요한 이슈는 단연 GPU와 스토리지입니다.
GPU는 가격과 성능에 대한 테이블이 존재하지만, 스토리지는 여러 업체가 많은 이슈를 겪고 있습니다.

  • SAN Storage

기존 전통적인 대용량 스토리지를 사용하자니 IOPS로 인한 전체 MLOps의 학습 속도 저하가 발생하고,
전통적인 스토리지에서 개선된 All Flash 스토리지를 사용하자니 용량 대비 가격이 만만치 않습니다.

SAN 스토리지 구성은 정형 데이터 활용에서 많이 사용합니다. 스토리지는 2000 IOPS 정도의 성능으로 구성되며, 서버당 필요 IOPS는 1000을 넘지 않습니다. 많은 IOPS를 필요로 한다면 All Flash 스토리지로 구성하며, All Flash 스토리지는 1,000,000 IOPS 수준의 성능으로 구성되지만, 용량 대비 비용이 높습니다.

  • 분산 스토리지 클러스터

MLOps 분야에서 가장 많이 선택하고 있는 분야는 소프트웨어 정의 스토리지입니다.
대표적인 오픈소스로 Ceph, GlusterFS, Hadoop 등이 있고, 여러 대의 파일서버를 하나의 스토리지 클러스터로 묶어 데이터를 분산처리하여 성능 및 안정성을 확보할 수 있습니다.

MLOps 환경에서는 각각 GPU의 IOPS 요구량이 매우 많습니다.
학습 이미지 크기가 작다면(100k 미만) GPU마다 수천 번의 IOPS가 필요하며, 이미지 크기가 비교적 큰 편 (10m 미만)이라면 수백 번의 IOPS가 필요합니다.
MLOps 환경에서는 스토리지의 성능이 전체 학습 성능에 큰 영향을 줍니다.
만약 연결 인터페이스를 InfiniBand로 구성한다면 NVIDIA GPU Direct를 사용할 수도 있습니다.

  • 스토리지 스케일 아웃

분산 스토리지는 노드를 추가하여 추후 용량 증설 및 성능 향상이 용이합니다.
최근 여러 고객사는 예상치 않은 분야에서 많은 데이터를 획득합니다.
MLOps에서도 초기 학습 데이터양을 정해두지만, 예상치 않은 데이터를 획득하고 이를 활용하여 새로운 학습모델과 시장을 발견하기도 합니다.
데이터 분석 및 AI 고객은 데이터를 삭제보다는 아카이빙에 초점을 두고, 스토리지의 용량 및 성능을 지속적으로 늘릴 수 있는 스토리지가 필요합니다.

스토리지의 용량 및 성능 스케일아웃은 MLOps 시장에서는 필수적인 요소입니다.
분산 스토리지 클러스터는 MLOps 환경에서 가장 적합한 스토리지 선택입니다.

PLEASE WAIT WHILE LOADING...