ToDown
제품문의
ToDown
Hamburger Icon
[아스트라고]
Kubernetes 기반의
AI 표준 플랫폼
머신러닝을 위한 GPU 인프라를
가장 효율적이고 가장 쉽게 운영할 수 있게
만들어주는 Kubernetes 기반 솔루션
astrago-title
Overview
잡스케줄러와 자원최적화 기술로 GPU 서버
활용률 극대화
동종 솔루션 중 유일한 학습시간 예측 기능으로
편의성 향상
실시간 모니터링 및 리포트로 인프라
관리효율 향상
overview-img
1 of 2
주요기능
머신러닝 프레임워크 및 라이브러리
jupyter
tensor
pytorch
머신러닝 지원 시스템, 인프라 관리 및 오케스트레이션
머신러닝 지원 시스템
모델 허브
커스텀 이미지
빌트인 이미지
학습시간 예측
ML
엔지니어
인프라 관리 및 오케스트레이션
잡스테줄러
리소스 최적화
모니터링
리포트
관리자
Kubernetes
astrago-kubernetest-logo
H/W 인프라
GPU
CPU
네트워크
RAM
머신러닝 지원 시스템
사용자의 수준에 맞춰 Model Hub, Built-in
Image, Custom 3가지 방식으로 학습을
지원합니다. 또한 업계 유일의 학습시간
예측으로 연구자 및 프로젝트의 시간 운용에
기여합니다.
빌트인 이미지
GPU별 최적화된 프레임워크 라이브러리를
탑재한 이미지를 활용하여 개발환경 구성 시간 절감
학습시간 예측
모델 업로드 시 예상 완료 시간을 제공하고, 학습 중에는 Bar 형태 UI로 진행 경과 제공
모델허브
SOTA 모델을 GUI환경에서 파라미터
조정만으로 학습. 학생/초급자의 교육목적에 적합
커스텀 이미지
사용자가 원하는 프레임워크와 라이브러리가 구성된 이미지를 업로드하여 사용 가능
인프라 오케스트레이션 및 관리
관리자는 잡스케쥴러와 리소스 최적화를 통해
인프라 전체의 효율성을 높이고, 모니터링과
리포트로 이를 점검해볼 수 있습니다.
리소스 최적화
리소스를 제대로 활용하지 못하는
워크로드를 검증하고 회수하여 리소스 낭비 예방
리포트
분석된 통계와 데이터를 바탕으로 현재
상황을 진단하여 인사이트 보고서 제공
잡 스케줄러
작업에 필요한 최적의 GPU 자원을 자동으로 배치
모니터링
GPU, CPU 메모리 등 리소스 사용 현황을
클러스터/노드/워크스페이스별로 제공
vidigo-h-0vidigo-h-1vidigo-h-2vidigo-h-3 procon-img
특장점 & 차별점
특장점. I
목적에 맞는 인프라 운용을
지원하는 잡스케줄러
효율성, 분산학습 등 사용자가 설정한 목적에 맞는
3가지 잡스케줄러 지원
효율성 중심 잡스케줄러 : 가용 자원이 적은 node부터
작업을 배정하여 전체 GPU 활용률 향상
분산학습 잡스케줄러 : 분산학습의 프로세스를 동일
node나 네트워크 거리가 가까운 gpu에
배정하여 속도 향상
특장점. II
차별점. III
차별점. IV