ToDown
Support
ToDown
Hamburger Icon
[아스트라고]
Kubernetes 기반의 AI 표준 플랫폼
머신러닝을 위한 GPU 인프라를 가장 효율적으로, 가장 쉽게 운영할 수 있게 만들어주는 Kubernetes 기반 솔루션
Overview
잡스케줄러와 자원최적화 기술로 GPU 서버 활용률 극대화 동종 솔루션 중 유일한 학습시간 예측 기능으로 편의성 향상 실시간 모니터링 및 리포트로 인프라 관리효율 향상
1 of 2
주요기능
Astrago의 주요 기능은
① ML엔지니어를 위한 머신러닝 지원 시스템과,
② 관리자를 위한 인프라 관리 및 오케스트레이션 2가지로 구분됩니다.
머신러닝 프레임워크 및 라이브러리
머신러닝 지원 시스템,
인프라 관리 및 오케스트레이션
Kubernetes
H/W 인프라
머신러닝 지원 시스템
모델 허브
커스텀 이미지
빌트인 이미지
학습시간 예측
ML
엔지니어
인프라 관리 및 오케스트레이션
잡스케줄러
리소스 최적화
모니터링
리포트
관리자
GPU
CPU
네트워크
RAM
머신러닝 지원 시스템
사용자의 수준에 맞춰 Model Hub, Built-in Image, Custom 3가지 방식으로 학습을 지원합니다. 또한 업계 유일의 학습시간 예측으로 연구자 및 프로젝트의 시간 운용에 기여합니다.
빌트인 이미지
GPU별 최적화된 프레임워크 라이브러리를
탑재한 이미지를 활용하여 개발환경 구성 시간 절감
학습시간 예측
모델 업로드 시 예상 완료 시간을 제공하고, 학습 중에는 Bar 형태 UI로 진행 경과 제공
모델허브
SOTA 모델을 GUI환경에서 파라미터
조정만으로 학습. 학생/초급자의 교육목적에 적합
커스텀 이미지
사용자가 원하는 프레임워크와 라이브러리가 구성된 이미지를 업로드하여 사용 가능
인프라 오케스트레이션 및 관리
관리자는 잡스케쥴러와 리소스 최적화를 통해 인프라 전체의 효율성을 높이고, 모니터링과 리포트로 이를 점검해볼 수 있습니다.
리소스 최적화
리소스를 제대로 활용하지 못하는 워크로드를 검증하고 회수하여 리소스 낭비 예방
리포트
분석된 통계와 데이터를 바탕으로 현재 상황을 진단하여 인사이트 보고서 제공
잡 스케줄러
작업에 필요한 최적의 GPU 자원을 자동으로 배치
모니터링
GPU, CPU 메모리 등 리소스 사용 현황을 클러스터/노드/워크스페이스별로 제공
vidigo-h-0vidigo-h-1vidigo-h-2vidigo-h-3
특장점 & 차별점
특장점. 01 목적에 맞는 인프라 운용을 지원하는 잡스케줄러
특장점. 02 실시간 모니터링 및 리포트로 인프라 관리 효율 향상
특장점. 03 동종 솔루션 중 유일하게 학습 완료시간에 대한 예측값을 제공하여 사용자 편의성 향상
특장점. 04 Model hub 부터 custom까지 사용자의 수준과 목적에 맞는 3가지 방식의 학습 방식 제공