ToDown
サポート
ToDown
Hamburger Icon
[アストゥラゴ]
Kubernetesベースの
AI標準プラットフォーム
機械学習のためのGPUインフラ環境を最も
効率的に、簡単に運用できるKubernetes
ベースのソリューション
astrago-title
Overview
ジョブスケジューラ(ジョブ管理システム)
とリソース最適化技術でGPUサーバーの
活用率を最大化
同種のソリューションの中で、唯一の
ML学習時間予測機能を持ち、ユーザーの
利便性を向上
リアルタイムモニタリング・レポートで
インフラ管理改善
overview-img
1 of 2
主な機能
機械学習フレームワーク・IDE(統合開発環境)
jupyter
tensor
pytorch
機械学習支援システム、
インフラ管理・オーケストレーション
機械学習サポートシステム
モデルハブ
カスタムイメージ
ビルトインイメージ
ML学習時間予測
ML
エンジニア
インフラ管理とオーケストレー
ション
ジョブスケジューラ
リソース最適化
モニタリング
レポート
管理者
Kubernetes
astrago-kubernetest-logo
H/W インフラ
GPU
CPU
ネットワーク
RAM
機械学習サポート
システム
Astragoはユーザーのレベルに合わせて、
Model Hub、Built-in Image、
Customの3つの方法で学習をサポート
します。
また、同種のサービスで唯一の学習時間
予測により、研究者やプロジェクトの
時間運用の最適化に貢献します。
Built-in image
ビルトインイメージ
GPUごとに最適化されたフレームワーク
ライブラリを搭載したコンテナイメージを
活用し、開発環境を構成し、時間を短縮
ML Time Prediction
ML学習時間予測
モデルアップロード時に予想完了時間を推定し、
学習中はバー形式のUIで進行状況を表示
Model Hub
モデルハブ
SOTAモデルをGUI環境でパラメータチューニ
ングだけで学習
学生/初級者の教育目的で活用可能
Custom Image
カスタムイメージ
ユーザーが希望するフレームワークと
ライブラリが構成されたイメージ画像をアップ
ロードして使用可能
インフラストラクチ
ャー管理とオーケス
トレーション
管理者は、ジョブスケジューラ(ジョブ
管理システム)とリソースの最適化
を通じてインフラ全体の効率を高め、
さらに、モニタリングとレポートでこれを
確認することができます。
リソースの最適化
リソースを適切に活用できていないワーク
ロードを検証・改修し、リソースの無駄を防止
レポート
解析された統計とデータをもとに現状を診断
できるインサイトレポートを提供
ジョブスケジューラ
(ジョブ管理システム)
作業に必要な最適なGPUリソースを自動的に配置
モニタリング
GPU、CPUメモリなど、クラスター/ノード/
ワークスペースごとのリソース使用状況を提供
vidigo-h-0vidigo-h-1vidigo-h-2vidigo-h-3 procon-img
特徴&差別化ポイント
特徴. I
ユーザー定義の目標に合わせたインフラ
運用をサポートするジョブスケジューラ
効率性中心のジョブスケジューラ :
利用可能なリソースが少ないノードにタスクを
最初に割り当てることで、GPU全体の利用率向上
より効果的なスケジューラ運営のため、MIGなど
多様なGPU分割技術をサポート。
特徴. II
差別化. III
差別化. IV